还记得理想i8发布会上,那段让人听不太懂的VLA司机大模型介绍吗?其实,

郭淮谈汽车 2025-11-03 16:05:40

还记得理想 i8 发布会上,那段让人听不太懂的 VLA 司机大模型介绍吗?其实,那已经是最浅显的版本了。

因为在刚结束的 ICCV 2025 上,理想拿出了更多技术分享。理想这次发表8 篇论文,其中 5 篇来自自动驾驶团队。理想还发表了题为《世界模型:让我们从数据闭环走向训练闭环》的主题演讲。对普通人来说,听起来更晦涩,但意义更大,也展示了更多细节。

就比如说其中一页细节,在我们已经熟悉的 VLA大模型基础上,这次更详细地阐述了理想i8发布会上首次出现的 RL 和 WM。RL 是强化学习,最近行业里也很火,Momenta 就一直在强调强化学习。

RL 包含多个分支,比如基于人类反馈的 RLHF、基于可验证奖励的 RLVR、以及结合 AI 反馈的 RLAIF——通过这些范式,能够让模型自己进行持续的训练、总结和改进。

WM 则是 World Model,也就是世界模型。它是让模型理解环境、生成场景、在虚拟世界里反复训练的“大脑”。把这些要素结合起来,才是理想辅助驾驶系统的完整架构。

如果你细心地话,就会发现李想在AI Talk中已经提到了强化学习和世界模型,而这次学术会议上理想则是进一步阐述。

怎么理解它们的关系?

如果说 VLA 是车端的“司机”,那世界模型就是“教练”。它能生成道路、交通、甚至突发事件,让模型在虚拟环境中完成自我训练。之前受限于自然场景,很难采集到足够的数据进行研究,但在世界模型里可以通过不断生成环境和反复训练收集数据,并根据数据进行环境的迭代,最终达到目标。强化学习让它更聪明,世界模型让它更完整。

那问题来了——一个造车企业,为什么要发论文?

因为自动驾驶的技术进化太快。不发,就容易闭门造车、错过方向;发出去,同行能评审、能质疑,也是一种倒逼进步。代码开源、数据共享,也能潜移默化地影响行业。

这和理想当年开放操作系统是同样的逻辑——开源出去,让学生用,让同行用。大家用得多了,也形成惯性。先不说引领路线的作用,至少未来招人,也更容易找到“熟练工”。

你可能会说,这些离用户太远。天天发论文,是不是有点脱离体验了?但过去一年,理想的辅助驾驶进步已经能看见。理论和体验不是两件事,但理想二者都没落下。

VLA司机大模型ICCV2025

0 阅读:1

猜你喜欢

郭淮谈汽车

郭淮谈汽车

感谢大家的关注