1.小红书智能程序

当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能然而,现有布局到图像生成方法在复杂场景下表现仍不理想:一方面,如何精确对齐给定布局并同时保持高画质是巨大挑战;另一方面,在扩散生成的逐步去噪过程中确保每个目标的位置与语义属性不偏离也极为困难。

2.小红书创意工坊

此外,布局控制往往需要支持多模态条件(如文本、参考图等信息),这进一步增加了技术复杂度现有方案各有不足:无训练方法虽然无需改动基础模型,但在复杂布局下效果显著下降,且对超参数敏感、推理速度慢;有训练方法通过额外模块注入布局信息,但往往引入海量参数,训练代价高昂。

3.小红书ip打造

评估方面,传统指标也存在偏差,难以准确衡量布局对齐程度这些挑战和不足表明,实现稳健且高效的布局可控图像生成亟需新的算法创新为此,小红书智能创作 AIGC 团队提出了 InstanceAssemble 框架,从架构和评测上全面应对上述难题,实现了在复杂布局条件下的精确图像生成。

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble(插图NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble(插图1

4.小红书 模块

论文链接:https://arxiv.org/abs/2509.16691项目主页:https://github.com/FireRedTeam/InstanceAssemble方法

NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble(插图2

5.小红书机制算法

InstanceAssemble 方法在架构上引入了级联结构,将全局文本提示与实例级布局条件分阶段处理具体而言,模型先利用原有 DiT 获取全局图像背景和整体语境,再通过新设计的实例组装注意力模块(Assemble-Attn)逐个整合各布局实例信息,实现局部精细控制。

6.小红书ugc

这样的级联架构确保了全局质量与局部对齐两方面的兼顾,避免了同时处理所有实例可能产生的冲突在实例组装注意力中,每个目标实例的注意力计算仅在其对应图像区域内进行,避免不同实例间互相干扰这种独立注意力机制使模型能够有效处理重叠或小物体等复杂布局情形,同时通过权重融合各实例特征,保持画面整体协调。

7.小红书 人工智能

此外,InstanceAssemble 使用

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。