VLA真的是目前自动驾驶技术路线的最优解吗?
最近,备受瞩目的2025世界人工智能大会(WAIC)刚刚结束,在会议期间,博世智能驾控中国区总裁吴永桥提出了一个反共识的观点,他认为:VLA短期内难以落地,仍需攻克多维难题。
其实2024年就有企业提到过VLA的相关概念,2025年以来,VLA开始被行业大肆宣传,被描绘得无所不能。这个原本在具身智能机器人领域广泛讨论的技术被移植到了自动驾驶。整个行业对VLA技术过于痴迷和急于求成。
现在VLA技术仍旧存在诸多的问题
- 多模态大模型的特征对齐很难实现(视觉、语言、动作)
- 多模态的数据获取和训练也十分困难
- VLA模型要部署在智驾芯片上,模型规模必须要做到7B-10B左右。但目前市面上几乎所有的三方智驾芯片都不是专为大模型的计算而设计的
会后,吴永桥给出了一个结论,可能要在3-5年之后,有了真正能跑大模型的芯片,才能支持VLA落地。当下一段式端到端更有意义。只有将一段式端到端打磨到极致的性能,才能带来高度拟人化、丝滑的智驾产品。
大家觉得VLA是否会是智能驾驶技术路线的终局呢?

如果有打算投递自动驾驶感知或者端到端算法的同学们,推荐一下我这半年以来精心制作的《智驾算法一站式求职专栏》,目前共有47篇文章,2.5w人学习,110+订阅,后续也会不断更新和完善,早订阅早学习,赢在秋招的起跑线上!
《智驾算法一站式求职专栏》涵盖了互联网大厂从简历制作 -> 在线笔试准备 -> 感知/端到端算法面经 -> 论文成果、科研项目、实习工作包装话术->面试高频手撕代码各个环节,真正意义上做到了一站式求职,同时文章质量也是杠杠有保证!
📚 专栏订阅链接:https://www.nowcoder.com/creation/manager/columnDetail/Mgbxvn
《智驾算法一站式求职专栏》大纲一览⭐⭐⭐
专栏订阅链接:https://www.nowcoder.com/creation/manager/columnDetail/Mgbxvn