1.李飞画饼是什么意思
在通往AGI的狂欢中,图灵奖得主Yann LeCun却一直像个执着的「反叛者」他不止一次给大语言模型(LLM)泼冷水,直言靠预测下一个字符的概率游戏,永远无法触及真正的智能他眼中的未来,属于「世界模型」。
2.imagenet 李飞飞
直到李飞飞团队World Labs发布的Marble,当大家亲眼看到那个可以生成、互动且符合逻辑的3D虚拟世界时,LeCun描绘的图景才终于具象化了为什么实现AGI需要世界模型为什么我们如此迫切地需要世界模型?。
3.李飞的画画
因为基于大语言模型的AI在物理世界里,是个严重的「偏科生」现实数据的采集太苦、太慢了!教会机器人认识一件红衣服,换成绿色的它可能就「懵」了;更别提那些极端场景——我们总不能为了训练自动驾驶,真去撞毁一千辆车吧?(还有更多低概率的corner case)。

4.李飞画家
于是,一场围绕物理世界的「数字重构」悄然打响,并分化出三大战场:游戏VR虚拟世界生成:以李飞飞的Marble为代表;自动驾驶:以特斯拉FSD为代表;具身智能:这是当下最火的方向,也是下个十年的AI的重心。
5.李飞怎么画
而第三个战场——具身智能,则是目前最难啃的「硬骨头」。这个领域正撞上一堵看似不可逾越的「数据墙」。长期以来,行业被迫依赖「遥操作」——让人类穿戴设备手把手教机器人。

6.李飞飞水平
这种方式不仅效率低、成本高,更致命的是泛化性极差而在尝试用AI生成数据时,又会掉进另一个深坑:物理因果一致性以往的模型生成的视频,往往只是「看起来像」但在机器人眼里,杯子凭空悬浮、水流违背重力,这些缺乏物理常识的画面不仅无用,甚至是毒药。
如何让AI生成的世界既逼真又符合物理定律?这成了阻挡AGI降临现实的最大路障而一家刚刚成立的公司大晓机器人,率先突围,交出了一份颠覆性的答卷——开悟世界模型3.0开悟3.0是一种全新范式的确立:多模态理解-生成-预测一体化。
与传统大模型「看图说话」的浅层逻辑不同,开悟3.0拥有极强的物理感知力它不仅能输入文字、图片、视频,更能直接输入力学信息与3D轨迹大晓的破局我们有幸直接采访到了商汤联合创始人、执行董事,大晓机器人董事长王晓刚先生。
他毕业于中科大少年班,接着取得香港中文大学的硕士学位和MIT的计算机博士学位。

大晓机器人董事长 王晓刚他的论文被引数已超过14万,也是中国的AI学术领军人物之一。

能力越大,责任越大目前,王晓刚同时担任香港中文大学教授、商汤科技联合创始人、执行董事,以及最新也是最重要的身份:大晓机器人董事长具身智能不能依赖「遥操作」在我们与王晓刚的深度对谈中,他抛出了一个令行业深思的观点:。
如果具身智能继续依赖「遥操作」,那我们实际上是倒退回了AI


评论(0)