1.谷歌学术香港

「Photoshop is dead」,已经成为最近 AI 创作者圈中讨论最热的话题之一随着图像编辑与生成模型进入到了又一个集中爆发期,这个专业创意软件长久以来的王座地位受到了前所未有的冲击尤其是引领这波多模态生图技术升级潮流的谷歌 Nano Banana 以及字节 Seedream4.0、阿里 Qwen-Image-Edit-2509,它们涌现出了更多新的能力与玩法,比如 OOTD 穿搭、文字渲染、生成电影分镜。

2.google引擎香港

在无需掌握深度修图技能的前提下,这些模型使得创作者开始更多地关注「如何让生图结果更可控、更有创意、更具产品化价值」

谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了(插图谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了(插图1

3.谷歌科研

从技术路线来看,以 Nano Banana 为代表的模型通过多模态指令,将语言理解、视觉识别与生成控制等不同的能力融合在一起,实现更自然的创作体验不过,随着使用场景的不断拓展,这类指令驱动的编辑与生成在实际操作中也逐渐暴露出了一些不容忽视的局限。

4.scholar google com hk

比如编辑任务中通常依赖的语言指令有时会描述不清,需要结合参考图像以及额外的文本说明;生成任务对于具体物体表现良好,但处理起抽象概念(发型、妆容、纹理、打光、风格等)来往往力不从心这些问题需要更优的技术解决方案。

5.香港谷歌引擎入口谷粉

两周前,港科大讲座教授、冯诺依曼研究院院长贾佳亚团队开源了他们的最新成果 DreamOmni2,专门针对当前多模态指令编辑与生成两大方向的短板进行了系统性优化与升级该系统基于 FLUX-Kontext 训练,保留原有的指令编辑与文生图能力,并拓展出多参考图的生成编辑能力,给予了创作者更高的灵活性与可玩性。

6.advanced google analytics

根据团队的说法,不论是具体物体还是抽象概念的编辑与生成,DreamOmni2 都可以取得显著优于当前 SOTA 开源模型的表现,在一些方面甚至比 Nano Banana 效果都要好。我们来一睹效果:

谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了(插图2

7.谷歌colaboratory

基于指令的多模态编辑:让第一张图像(源图像)中女子的帽子拥有与第二张图像(参考图像)中毛衣相同的配色方案。

谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了(插图3

8.谷歌 高科技

基于指令的图像生成:图 1 被挂在卧室的墙上,图 3 中的杯子变成与图 2 中盘子相同的材质,并被放置在桌子上DreamOmni2

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。