蔚来任少卿这篇采访提到强化学习。给出了旗帜鲜明的观点。自动驾驶的强化学习没有被业

都懂一电电 2025-10-10 03:00:03

蔚来任少卿这篇采访提到强化学习。

给出了旗帜鲜明的观点。

自动驾驶的强化学习没有被业内完全接受。

问题在哪里?因为确实没有一个很好的示范。

到底怎么做才能得到比较好的结果?

蔚来的强化学习路线到底是基于真实驾驶数据的离线强化学习,还是依靠虚拟环境中的在线强化学习?

这两种路线其实代表了完全不同的技术取舍——前者更贴近真实分布,但缺乏探索空间,丢失了一部分强化学习的特点。

后者能充分试错,却依赖高保真仿真环境,这难度并不比自动驾驶本身小。

更关键的是,如何平衡奖励与惩罚,让智能体既能探索新策略,又能保持安全与稳定?这在强化学习落地中几乎是最难的问题。

可惜这篇采访只提到了“理想化的强化学习能带来长时序决策能力”,并没有展示蔚来在真实系统中的实践路径。

看来,只能期待年底的新版本能给出更具体的答案了。

蔚来新能源大牛说

0 阅读:5
都懂一电电

都懂一电电

感谢大家的关注