1.李飞画饼是什么意思

在通往AGI的狂欢中,图灵奖得主Yann LeCun却一直像个执着的「反叛者」他不止一次给大语言模型(LLM)泼冷水,直言靠预测下一个字符的概率游戏,永远无法触及真正的智能他眼中的未来,属于「世界模型」。

2.imagenet 李飞飞

直到李飞飞团队World Labs发布的Marble,当大家亲眼看到那个可以生成、互动且符合逻辑的3D虚拟世界时,LeCun描绘的图景才终于具象化了为什么实现AGI需要世界模型为什么我们如此迫切地需要世界模型?。

3.李飞的画画

因为基于大语言模型的AI在物理世界里,是个严重的「偏科生」现实数据的采集太苦、太慢了!教会机器人认识一件红衣服,换成绿色的它可能就「懵」了;更别提那些极端场景——我们总不能为了训练自动驾驶,真去撞毁一千辆车吧?(还有更多低概率的corner case)。

当LeCun还在「画饼」,中国AI大牛领先李飞飞一步把世界模型开源了(插图

4.李飞画家

于是,一场围绕物理世界的「数字重构」悄然打响,并分化出三大战场:游戏VR虚拟世界生成:以李飞飞的Marble为代表;自动驾驶:以特斯拉FSD为代表;具身智能:这是当下最火的方向,也是下个十年的AI的重心。

5.李飞怎么画

而第三个战场——具身智能,则是目前最难啃的「硬骨头」。这个领域正撞上一堵看似不可逾越的「数据墙」。长期以来,行业被迫依赖「遥操作」——让人类穿戴设备手把手教机器人。

当LeCun还在「画饼」,中国AI大牛领先李飞飞一步把世界模型开源了(插图1

6.李飞飞水平

这种方式不仅效率低、成本高,更致命的是泛化性极差而在尝试用AI生成数据时,又会掉进另一个深坑:物理因果一致性以往的模型生成的视频,往往只是「看起来像」但在机器人眼里,杯子凭空悬浮、水流违背重力,这些缺乏物理常识的画面不仅无用,甚至是毒药。

如何让AI生成的世界既逼真又符合物理定律?这成了阻挡AGI降临现实的最大路障而一家刚刚成立的公司大晓机器人,率先突围,交出了一份颠覆性的答卷——开悟世界模型3.0开悟3.0是一种全新范式的确立:多模态理解-生成-预测一体化。

与传统大模型「看图说话」的浅层逻辑不同,开悟3.0拥有极强的物理感知力它不仅能输入文字、图片、视频,更能直接输入力学信息与3D轨迹大晓的破局我们有幸直接采访到了商汤联合创始人、执行董事,大晓机器人董事长王晓刚先生。

他毕业于中科大少年班,接着取得香港中文大学的硕士学位和MIT的计算机博士学位。

当LeCun还在「画饼」,中国AI大牛领先李飞飞一步把世界模型开源了(插图2

大晓机器人董事长 王晓刚他的论文被引数已超过14万,也是中国的AI学术领军人物之一。

当LeCun还在「画饼」,中国AI大牛领先李飞飞一步把世界模型开源了(插图3

能力越大,责任越大目前,王晓刚同时担任香港中文大学教授、商汤科技联合创始人、执行董事,以及最新也是最重要的身份:大晓机器人董事长具身智能不能依赖「遥操作」在我们与王晓刚的深度对谈中,他抛出了一个令行业深思的观点:。

如果具身智能继续依赖「遥操作」,那我们实际上是倒退回了AI

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。