1.预训练模型

近期,RAE(Diffusion Transformers with Representation Autoencoders)提出以「 冻结的预训练视觉表征」直接作为潜空间,以显著提升扩散模型的生成性能。

2.预训练模型bert

无独有偶,同期西安交通大学与微软亚洲研究院提出了「VFM-VAE」二者均基于冻结的预训练视觉模型构建语义潜空间,而 VFM-VAE

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。