智能驾驶前几年卷的都是落地量产和泛化,基于BEV、occ等技术把功能做上车,再泛化到全国可用。
今年开始,各家在技术路线上出现了纷争,理想、小鹏、元戎落地基于 VLA 大模型的功能,蔚来、华为更加强调世界模型。
但这些技术也都是端到端,特斯拉最近两年已经不怎么公布技术路径了,但其实特斯拉 FSD 是最早落地一段式端到端。
除了特斯拉,另一个就是地平线的HSD,这两家的表现,大家应该都看了评测,正儿八经的一段式端到端,把基础体验拉到了很高的水准。
一段式端到端有两个很大的特质,首先第一个低时延。
一段式端到端指的是传感器信号直接输入,控制信号直接输出,链路变得更加简洁,整体时延会更低,就像我们人类开车,在大部分场景下,看到信息后,直接控制车辆。
非一段式端到端,会有很有比较抽象的现象。比如横向控制和纵向控制打架,横向控制给了个绕行轨迹,还没做好路线规划,纵向直接加速了,这时候就会有安全风险。在一段式端到端技术下,这些现象是不会发生的。
还有一个是控制平顺性更好,非一段式端到端的模块比较多,决策迟滞就会带来重刹、反应慢的情况。一段式端到端是纯模仿人类行为,整体响应时延低就能让车辆的控制更加线性、舒适,在体验上就更拟人。
一段式端到端能够把基础体验做得很好,但是对语义变化的鲁棒性差,如果场景中出现训练数据未覆盖的语义变异(比如特殊形状的交通标志、临时交通管制的手势),模型可能因无法解读新语义而失效。这里还是需要借助一些「外挂」来实现,或者海量的高质量数据进行学习。
一段式端到端听不懂的汽车黑话