ICCV 2025 | 港科、牛津大学发布AlignGuard，文图生成模型可规模化安全对齐框架-源码库

本文共一作者为刘润涛和陈奕杰，香港科技大学计算机科学方向博士生，主要研究方向为多模态生成模型和偏好优化1. 背景介绍随着文图生成模型的广泛应用，模型本身有限的安全防护机制使得用户有机会无意或故意生成有害的图片内容，并且该内容有可能会被恶意使用。

2.香港牛津大学出版社官网

现有的安全措施主要依赖文本过滤或概念移除的策略，只能从文图生成模型的生成能力中移除少数几个概念在 ICCV 2025，AlignGuard 推出了一个通过直接偏好优化训练文图生成模型，并以此实现安全对齐的训练框架。

3.牛津大学出版社香港中文站

通过生成有害和安全的图像 – 文本对数据集 CoProV2，AlignGuard 使 DPO 技术能够可规模化的应用于文图生成模型的安全目的AlignGuard 的安全对齐框架可以针对不同的有害概念引入各自的安全专家，会对于每个概念训练低秩适应（LoRA）矩阵用以引导文图模型减少生成特定的有害概念。

ICCV 2025 | 港科、牛津大学发布AlignGuard，文图生成模型可规模化安全对齐框架插图

4.香港牛津研发有限公司

Paper: AlignGuard: Scalable Safety Alignment for Text-to-Image GenerationPaper Link: https://www.arxiv.org/abs/2412.10493

5.牛津大学和香港大学哪个好

Github: https://github.com/Visualignment/SafetyDPOProject page：https://alignguard.github.io/2. AlignGuard 安全对齐框架

6.牛津大学csc

AlignGuard 这项工作的核心是提出一个面相扩散模型（Diffusion model）可规模化的安全对齐方法通过生成针对安全内容的文图数据集，AlignGuard 的训练框架能在保有原本的生图内容的同时去除图片中的有害内容，并保持模型的高质量生图品质。

7.牛津大学vsp项目

2.1 CoProv2 数据集构建AlignGuard 首先围绕多种有害概念，构建了包含安全和不安全的图像文本对数据集 CoProV2CoProV2 针对不同的有害概念，用 LLM 生成了一系列具有相似语义的有害与安全提示词对，并对每个提示词生成了对应的图片。

ICCV 2025 | 港科、牛津大学发布AlignGuard，文图生成模型可规模化安全对齐框架插图2

8.牛津大学论坛

相较于已有的人造数据集如 UD 和

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

ICCV 2025 | 港科、牛津大学发布AlignGuard，文图生成模型可规模化安全对齐框架

目录：

1.香港牛津大学

2.香港牛津大学出版社官网

3.牛津大学出版社香港中文站

4.香港牛津研发有限公司

5.牛津大学和香港大学哪个好

6.牛津大学csc

7.牛津大学vsp项目

8.牛津大学论坛

9.香港牛津大学出版社地址

10.牛津大学中国论坛

1.香港牛津大学

2.香港牛津大学出版社官网

3.牛津大学出版社香港中文站

4.香港牛津研发有限公司

5.牛津大学和香港大学哪个好

6.牛津大学csc

7.牛津大学vsp项目

8.牛津大学论坛

评论(0)

提示：请文明发言取消回复

推荐资源

户外广告公司网站源码营销型户外岗亭网站PbootCms模板

小程序电商软件开发公司pbootcms模板[pc+wap]

注册记账财务会计公司注册类网站源码pbootcms模板

蓝色大气化工滤料石材磨料生产厂家pbootcms模板

绿色生态农业企业网站pbootcms模板

大型农业机械设备类网站pbootcms模板

袜子生产定制针织袜业网站源码pbootcms模板

响应式文化传媒公司娱乐主播直播培训类网站源码pbootcms模板

ICCV 2025 | 港科、牛津大学发布AlignGuard，文图生成模型可规模化安全对齐框架

目录：

1.香港牛津大学

2.香港牛津大学出版社官网

3.牛津大学出版社香港中文站

4.香港牛津研发有限公司

5.牛津大学和香港大学哪个好

6.牛津大学csc

7.牛津大学vsp项目

8.牛津大学论坛

评论(0)

提示：请文明发言 取消回复

相关文章

推荐资源

分类目录

提示：请文明发言取消回复