1.neurips2020

深邃的海洋覆盖地球表面的70%以上,其在资源勘探、环境保护和国家安全等领域的重要性,使自动化水下探索技术备受关注然而,想要像《海底两万里》中的「鹦鹉螺号(NAUTILUS)」那样自由地认知和探索水下世界,我们仍面临严峻的技术挑战。

2.neurips2021 rebuttal

光线在水中的严重散射和吸收导致图像质量显著下降,这极大地削弱了通用大模型的性能,阻碍了水下场景理解的研究进展

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务(插图

3.neurips怎么样

现有的水下视觉方法又大多为单一任务设计,缺乏多粒度的综合感知能力。大规模、多任务指令微调数据集的长期缺失,进一步制约了该领域的研究进展。

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务(插图1

4.nes-25-12

针对以上挑战,华中科技大学白翔教授团队提出了首个能够支持八项水下场景理解任务的水下多模态大模型NAUTILUS,旨在通过统一的框架实现对水下场景从图像、区域到物体的多粒度、多任务的全面理解。

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务(插图2

5.neusilin us2

论文地址:https://arxiv.org/abs/2510.27481项目地址:https://h-embodvis.github.io/NAUTILUS代码地址:https://github.com/H-EmbodVis/NAUTILUS

6.neurips workshop

数据集地址:https://github.com/H-EmbodVis/NAUTILUS/tree/dataset同时,团队还构建并开源了首个大规模水下多任务指令微调数据集NautData该工作的主要贡献如下:。

7.nespio

水下多任务指令跟随数据集:构建了包含145万个图文对的NautData数据集,覆盖八种主流水下理解任务,为水下大模型的发展和评测奠定了坚实基础;多任务统一理解:NAUTILUS是首个能够同时处理粗粒度与细粒度目标分类、计数、视觉问答(VQA)、检测、指代定位、区域描述和图像描述八项任务的水下大模型,实现了对场景信息的层级化、综合性理解;

8.nes pro

性能优异且鲁棒:通过创新的「视觉特征增强」(VFE)模块,NAUTILUS能够有效克服水下图像降质问题,在多个基准测试中稳定超越包括LLaVA-1.5和Qwen2.5-VL在内的先进模型,尤其在低光、浑浊等恶劣条件下表现出色。

9.neurlps

水下多任务指令跟随数据集NautData

NeurIPS 25开新坑:145万个图文对,覆盖八种主流水下理解任务(插图3

10.neuriva plus

该工作围绕八项任务进行数据构建,并为每项任务设计了定制化的数据生成流程整个流程通过三种模式构建数据,分别为基于规则的生成 (Rule-based generation),组合生成

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。