3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B-源码库

邢龙和董潇逸为本篇文章共同第一作者邢龙是中国科学技术大学博士生，师从林达华教授和吴枫教授，研究兴趣主要集中在 multi-modal LLMs 和 efficient AI董潇逸是香港中文大学 MMLab 的博士后研究员，同时在上海人工智能实验室担任兼职顾问研究员，已在顶级会议和期刊（如 CVPR、ICCV、ECCV 等）上发表了 50 余篇论文，Google Scholar 上获得超过 10000 次引用。

2.小钢炮模型

今天推荐一个 Dense Image Captioning 的最新技术 —— CapRL (Captioning Reinforcement Learning)CapRL 首次成功将 DeepSeek-R1 的强化学习方法应用到 image captioning 这种开放视觉任务，创新的以实用性重新定义 image captioning 的 reward。

3.3.0小钢炮

训练得到的 CapRL-3B 模型，可以成功达到与 Qwen2.5-VL-72B 相当的 captioning 水平！这是 image captioning 领域的一大进展，更是为 GRPO 策略应用于开放任务提供了重要思路！。

4.小钢炮321

目前 Huggingface model

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B

目录：

1.小钢炮 samba

2.小钢炮模型

3.3.0小钢炮

4.小钢炮321

5.小钢炮三代评测

6.小钢炮模型图片

7.小钢炮 smb

1.小钢炮 samba

2.小钢炮模型

3.3.0小钢炮

4.小钢炮321

推荐资源

蓝色大气化工滤料石材磨料生产厂家pbootcms模板

户外广告公司网站源码营销型户外岗亭网站PbootCms模板

小程序电商软件开发公司pbootcms模板[pc+wap]

注册记账财务会计公司注册类网站源码pbootcms模板

绿色生态农业企业网站pbootcms模板

大型农业机械设备类网站pbootcms模板

袜子生产定制针织袜业网站源码pbootcms模板

响应式文化传媒公司娱乐主播直播培训类网站源码pbootcms模板

3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B

目录：

1.小钢炮 samba

2.小钢炮模型

3.3.0小钢炮

4.小钢炮321

相关文章

推荐资源

分类目录