Meta 前首席 AI 科学家、图灵奖得主杨立昆,在达沃斯论坛上表示,当前的人形机器人的表现惊艳,但是不够聪明。
直接给行业泼了一盆冷水。近期波士顿动力宣布向现代和谷歌交付人形机器人。马斯克把擎天柱当成是特斯拉的未来,国内厂商更是喊出2.99 万买人形机器人的口号。研究机构集邦咨预测,2026年全球的出货量将会暴涨700%。
为什么杨立昆的观点会与企业有如此大的差距?
一、行业认为2026年是爆发之年特斯拉计划2026年生产5~10万台擎天柱机器人。优必选 Walker S2 在2025年交付500台,2026年计划量产1万台。
价格将会更加亲民,宇树科技推出 2.99 万元的小型人形机器,松延动力更是推出不到万元的产品,刷新人们对于机器人价格的认知。
人形机器人开始在福田康明斯工厂开始执行搬运货物的工作,在富临精工的3条装配线开始工作,还能够跨区作业。波士顿动力的 Atlas 宣称,除了能自主更换电池、抬起50公斤重的物体,还要颠覆整个工业生产。
集邦咨询认为2026年是人形机器人商业化的关键之年。新华网更是将其定义为商业化的元年。国内专家预测国产人形机器人的产量将会突破10万台。
二、杨立昆认为,这些进步,全没命中要点杨立昆尖锐地指出,所谓的行业突破,都只停留在量产的数量和场景应用,最为核心的智能问题,却没有任何进展。
机器人在工厂可以通过特定训练完成任务,但是泛化能力差,一遇到未经训练的场景,此前的努力立即失效。
特斯拉工厂的擎天柱机器人,只能做某些物料的搬运工,如果换一种货物,就不知道该干啥。
本质上讲,这些应用都需要在封闭的环境下,通过编程才能够完成任务。这与近几十年来使用的机械臂没有什么区别。
他认为真正商用的人形机器人,必须具备对动态环境的适应能力,可以在杂乱的仓库里,自主分拣不同的包裹。当发生故障时,可以自主调整动作,而不是依赖工程师预先编好的程序。
尽管波士顿动力宣称 Atlas 具备自主学习的能力,特斯拉表示擎天柱机器人集成了 Grok 大模型,但杨立昆认为他们依然缺乏最基础的物理常识。
因为这些机器人的核心大脑,不知道杯子装进水以后,重心会发生变化,有可能会发生倾倒。因为不懂惯性原理,快速移动时,身体很容易失衡。
不具备分层规划的能力,因此无法完成给杯子倒完水后,再递给老人这种多步骤的任务。
杨立昆指出,猫有28亿个神经元,能感知三维空间,判断稳定性。现在最先进的人形机器人,神经元的规模是猫的几十倍,却连杯子到了,水会流出来,都理解不了。
杨立昆认为当前的企业都在努力增加产量,而非先提升机器人的通用智能,让其对物理世界更清晰的认知,这种方向错了。
三、杨立昆指出世界模型才是关键杨立昆认为必须突破现有的 AI 技术,构建一个能够理解并预测物理世界的世界模型,才是发展人形机器人的关键。
他认为单纯依赖大语言模型和强化学习的路线走不通。通过海量标准数据训练出来的模型,机器人无法学会常识。而世界模型可以通过模拟物理世界的规律,来完成这个任务。
这样机器人可以不需要编程,就可以对未见过的场景做出判断,例如经过少量样本的训练,就能够折叠不同款式的衣服。
杨立昆认为现在的人形机器人能力有限,换个应用环境就失灵。厂家普遍追求量产和降价,但是不能满足市场的真正需求。要想人形机器人有发展前途,必须等到世界模型的技术成熟以后才行。因为商业化的本质是价值交付,而规模交付。
图片来源:波士顿动力