理想汽车是国内最成功、最早实现盈利的造车新势力,2025年以来销量依旧保持快速增长。不过理想汽车的成功,主要来自于增程式电动系统的成功运用、精准的高端定位、宽敞的内部空间等方面,智能化方面表现出来的领先优势并不多。


现在,理想汽车准备补上这个短板。近日理想汽车提交了一枚名为“理想VLA”的商标申请,揭示了理想的一个大动作。业内人士认为,这是理想汽车正在豪赌下一代的智能驾驶的第一步。那么,理想VLA到底是什么呢?

理想VLA到底是什么?

按照理想汽车的说法,理想VLA的目标是在今年下半年突破VLA智驾大模型的落地难关。值得一提的是,目前智驾领域的主流模式是端到端,而且只在部分高端车型上才能实现,并没有真正普及。那么,理想的理想VLA模型,是要另起炉灶吗?


实际上,VLA这个词在智能化应用领域并不陌生,它的三个字母分别对应视觉-语言-动作。而在决定研发VLA模型之前,理想汽车已经在2024年10月底推送了端到端+VLM大模型,不过在理想汽车看来,这套大模型仍然不足以称为完美。


目前流行的端到端大模型,实际上是人工智能的一种最新应用。常规的智驾系统,一般是由工程师先写好规则,然后将感知到的实际路况与这些规则进行匹配;而端到端智驾则是用人工智能模型来取代感知、规划、控制三个模块,让智驾系统对于车辆的操作更接近人的水准。

但端到端模型目前仍然无法完全理解一些极端路况,在这种情况下,部分厂商便希望通过打“补丁”的方式来完善自身的端到端模型。而理想汽车的VLM模型就是这样一个“强劲的“补丁”,其自身是一个多模态的视觉语言模型,对图像和场景的理解能力更强,从而能够提升智驾的精准度。

可以这么说,VLM模型针对的就是少量端到端智驾无法理解的复杂场景。


但这样一来,端到端智驾与VLM就又成了两个独立的模型,这势必会影响整个智驾系统的性能。

除此之外,多一个模型就会多占用一部分芯片,这在算力紧张的情况下并不是一个好的选择。而理想的VLA模型,就是希望将端到端、VLM两个模型合二为一。


根据目前已经公布的信息,理想VLA智驾在复杂路口的决策准确率已经达到了98.7%,在行业内具有明显的领先优势。

在部分机构做的200类罕见物体的抓取测试中,理想VLA的准备率也接近90%,同样在行业内遥遥领先。

除了理想 还有谁在做?

理想积极研发的VLA模型,属于比端到端更前沿的技术,但中国新能源汽车市场的技术竞争非常激烈,VLA模型虽然上处于前期的起步阶段,但已经有不少厂商在做了。


比较典型的就是吉利汽车,2025年3月初,吉利汽车对旗下的智驾方案进行整合,发布了统一的千里浩瀚智驾系统,这套智驾系统从低端到高端分为五个版本,其中高阶智驾方案就准备落地VLA模型。


同时,独立的智能驾驶解决方案供应商元戎启行,也计划在今年推出VLA智驾方案,这个全新领域的竞争正在逐步加码。

此外,华为、小鹏等品牌推动的端到端智驾也在快速普及,整个智驾领域的竞争越来越激烈,这会给理想汽车带来不小的压力。

理想VLA将会面临哪些挑战?

从理论上来说,理想VLA的技术前景还是比较诱人的,因此被部分业内人士称为最终版的智驾解决方案。但需要注意的是,理论是一回事儿,能否商业化又是另外一回事儿。理想VLA模型在推进过程中,会遇到各种各样的问题。


首先,理想VLA模型是准备将端到端和VLM两个模型的数据进行深度交融,这对理想开发团队的技术水平提出了极高的要求,同时也意味着更高的研发成本,而且短期内不太可能有什么收益。

其次,理想VLA模型是一种比端到端更复杂的智驾模型,这也意味着它需要更强的算力去支撑其运行,目前主流高端新能源汽车搭载两颗英伟达智驾芯片,算力达到508TOPS,就已经是很不错的了,而从理论上来讲,VLA模型可能需要1000TOPS的算力,这在现有条件上很难实现。


除此之外,这样的大模型也意味着它对高端芯片的需求更大,而芯片则是目前国内新能源汽车行业仅剩的几个容易被断供、卡脖子的领域。短期来看,国产厂商对英伟达等国外芯片厂商的依赖难以摆脱,这样的因素,也会带来技术上的风险,尤其是在商业化落地环节。

从总体上看,理想VLA路线的确提供了一种不错的技术路线,并且已经得到了吉利、长城等厂商的认可。但从客观角度来说,在端到端智驾尚未普及的情况下,VLA模型更像是一种前瞻性研究,距离落地还有比较远的距离。但无论怎么样,这样的技术尝试,对行业和消费者来说都是一件好事儿。

ad1 webp
ad2 webp
ad1 webp
ad2 webp