SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃-源码库

与此同时，3DGS 已成为各种视觉任务中 3D 场景表达的重要标准之一然而，有效地将语义理解以可泛化的方式集成到 3DGS 中仍然是一个难题为了突破这些瓶颈，我们引入了 SceneSplat，第一个在 3DGS 上原生运行的端到端大规模 3D 室内场景理解方法。

3.3d视觉算法

此外，我们提出了一种自监督学习方案，可以从未标记场景中解锁丰富的 3D 特征学习为了支持所提出的方法，我们采集了首个针对室内场景的大规模 3DGS 数据集 SceneSplat-7K，包含 7916 个场景，这些场景源自七个现有数据集，例如 ScanNet 和 Matterport3D。

4.3d视觉解决方案

生成 SceneSplat-7K 所需的计算资源相当于在 L4 GPU 上运行 150 天我们在 SceneSplat-7K 上进行了开放词汇和语义分割的测试，均达到了 state-of-the-art 的效果。

SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃插图

5.3d position sensor

文章链接：https://arxiv.org/abs/2503.18052项目主页：https://unique1i.github.io/SceneSplat_webpage/数据集：https://huggingface.co/datasets/GaussianWorld/scene_splat_7k

SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃插图1

图 1: SceneSplat-7K 从 7 个不同的公开数据集采集了了 7916 个完整 3DGS 场景，并且做了语义标注；基于这一高质量数据集，我们大规模训练了 SceneSplat 模型，这是首个能够在单次前向传播中预测数百万个 3D 高斯分布的开放词汇语言特征的模型。

SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃插图2

视频：SceneSplatSceneSplat 数据集大规模 3DGS 重建为支撑在 3D 高斯点（3DGS）上的原生语义学习，我们构建并发布 SceneSplat-7K数据来源覆盖 7 个权威室内数据集：ARKitScenes、Replica、ScanNet、ScanNet （含 v2）、Hypersim、3RScan、Matterport3D，统一转化为 3DGS 表示，形成跨真实与合成场景的多样化数据集。

SceneSplat-7K 包含

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃

目录：

1.3d视觉应用场景

2.osg三维视景仿真

3.3d视觉算法

4.3d视觉解决方案

5.3d position sensor

1.3d视觉应用场景

2.osg三维视景仿真

3.3d视觉算法

4.3d视觉解决方案

5.3d position sensor

评论(0)

提示：请文明发言取消回复

推荐资源

蓝色大气化工滤料石材磨料生产厂家pbootcms模板

户外广告公司网站源码营销型户外岗亭网站PbootCms模板

小程序电商软件开发公司pbootcms模板[pc+wap]

注册记账财务会计公司注册类网站源码pbootcms模板

绿色生态农业企业网站pbootcms模板

大型农业机械设备类网站pbootcms模板

袜子生产定制针织袜业网站源码pbootcms模板

响应式文化传媒公司娱乐主播直播培训类网站源码pbootcms模板

SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃

目录：

1.3d视觉应用场景

2.osg三维视景仿真

3.3d视觉算法

4.3d视觉解决方案

5.3d position sensor

评论(0)

提示：请文明发言 取消回复

相关文章

推荐资源

分类目录

提示：请文明发言取消回复