1.新加坡国立大学照片2020

新加坡国立大学和Lowart AI发布OmniPSD。

图像分层生成:新加坡国立大学和Lowart AI实现了图像可编辑的PSD文件输出(插图

2.新加坡国立大学图标

利用Diffusion Transformer架构解决了分层图像生成与拆解的难题,实现了真正可编辑的PSD文件输出这是AI从生成图片向生成资产跨越OmniPSD能通过文本生成带有透明通道的分层PSD文件,还能将单张平面图像逆向拆解为可编辑的图层结构,解决了AI生成图像难以二次编辑的痛点。

3.新加坡国立大学gis

平面图像生成的局限与分层结构的刚需以Stable Diffusion和Midjourney为代表的生成式模型彻底改变了图像创作的门槛,只需一段文字,精美的画面便跃然屏上这些模型生成的图像在本质上是一张死图——即扁平化的光栅图像(Raster Image)。

4.新加坡国立大学图片风景真实照片

对于专业设计师而言,这种格式虽然美观,却缺乏实际应用中最关键的属性:结构化在现代数字内容创作(DCC)的工作流中,Adobe Photoshop的PSD格式之所以成为行业标准,是因为它保留了图层(Layers)、透明度(Alpha Channel)和合成关系。

5.新加坡国立大学壁纸

设计师需要独立的背景层、前景主体层和可编辑的文本层,以便进行移动、缩放、替换或二次排版目前的生成模型产出的JPEG或PNG图像,一旦生成,像素便粘在了一起,想要修改其中一个元素,往往需要借助复杂的掩膜(Masking)或重绘(Inpainting)手段,且效果难以保证完美。

6.新加坡国立大学数据分析

为了填补这一鸿沟,新加坡国立大学与Lovart AI的研究团队推出了OmniPSD这是一个建立在Flux生态系统之上的统一框架,它在一个模型架构内同时实现了两个核心功能:Text-to-PSD(文本到PSD生成)和Image-to-PSD(图像到PSD拆解)。

7.新加坡国立大学cap

这不仅仅是图像分割,而是生成具有透明通道、边缘清晰、且保留了设计语义的独立图层在分层生成任务中,最棘手的技术挑战之一是如何处理透明度标准的图像生成模型通常在RGB色彩空间中工作,而忽略了Alpha通道(透明度信息)。

8.新加坡国立大学插画专业

传统的变分自编码器(VAE)在压缩和解压图像时,往往无法准确保留半透明区域(如玻璃、烟雾、头发边缘)的细节,导致解压后的图层边缘出现锯齿或白边OmniPSD的核心组件是一个经过重新训练的RGBA-VAE。

图像分层生成:新加坡国立大学和Lowart AI实现了图像可编辑的PSD文件输出(插图1

9.新加坡国立大学地图中文版

研究团队并没有直接使用Flux模型自带的VAE,因为原版VAE是在自然图像上训练的,对透明背景的理解有限团队构建了一个包含大量具有透明背景的合成数据和真实设计素材的数据集,专门用于训练这个能够感知Alpha通道的编码器。

10.新加坡国立大学 图片

这个RGBA-VAE的设计目标是将带有透明度的图像压缩到一个潜在空间(Latent Space)中,同时不丢失结构信息为了实现这一点,训练过程引入了多种损失函数:像素级的L1损失用于保证色彩还原,Patch级的特征损失用于保持局部结构,感知损失(Perceptual Loss)用于维持语义一致性,以及KL散度用于规范化潜在空间的分布。

通过这种方式,RGBA-VAE成为了连接像素空间与潜在空间的桥梁无论是生成的图层,还是从原图中拆解出的图层,都能通过这个模块获得高质量的透明通道信息这使得生成的图层不再是简单的抠图,而是包含了半透明过渡、光影投射等丰富细节的完整资产。

图像分层生成:新加坡国立大学和Lowart AI实现了图像可编辑的PSD文件输出(插图2

在上图中可以看到,相比于LayerDiffuse

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。