3月18日,理想汽车在NVIDIA GTC大会上发布下一代自动驾驶架构MindVLA,还放话要像当年iPhone 4重新定义手机那样,重新定义自动驾驶。这不禁令人好奇,理想凭啥这么有底气?它又会给整个行业带来哪些改变呢?咱们一起探讨一下。



从按部就班到自主思考

话说以前的自动驾驶,基本需要高精地图与提前设好的规则来运行,就像个跟着剧本走的“演员”,灵活性差。但MindVLA的不同之处,在于它会给自己打造一套类似人类认知逻辑的“大脑”,采用“端到端+VLM双系统架构”。

简单来讲,一个“快思考”系统,也就是端到端大模型,能像我们的直觉一样,对驾驶场景快速做出判断与反应,马上给出行驶轨迹;而另一个“慢思考”系统,并不是想的慢的意思,而是视觉语言大模型,专门负责处理较复杂的逻辑问题,比如判断公交车道的动态标记、车道信号灯等复杂情况。

有个实际例子,在测试视频里,车没预设导航路线,通过一句“帮我找个星巴克”,自己就找到路边门店并稳稳停下来。若遇到死胡同,还能自动倒车,重新寻找车位,关键全程还不依赖地图数据,这出色的表现,得益于3D高斯中间表征技术,通过大量数据自我学习,让车对复杂情况理解更加到位,这有点像偏科生的味道,专注并理解透这门学科,与专科生不同,因为它更加全面。



让用户体验升级,从机械式到更懂你

MindVLA的目标很明确,就是让车变成听懂你话的好司机。它在三个场景表现尤为突出。首先是语音交互,当你开车时,可以随时给车下新指令,比如“开慢点”、“向左转”等,车能马上照做,这比以前车机只能关关空调、打开车窗要高级得多。

其次是视觉通识,你可以理解为给发张周围环境的照片,它就能知道你在哪,然后自动过来接你,这功能相当于省了个“专门司机”了,它之所以能做到,是因为MindVLA能理解招牌、地标等视觉信息,甚至连施工围挡后面的临时路都能识别。

最后则是自动空间的探索,在停车场或园区里,车能自己到处找停车位,不用依赖导航,可能大家会说,其他车型也能自动找车位泊车,但你要注意的是,其他车型的泊车功能基本局限在熟悉的停车场。按理想董事长李想的话,你跟人司机咋交流,就能跟MindVLA咋交流,以后停车也不发愁。对比特斯拉FSD频出误判路标路线,MindVLA通过本地化训练和逻辑推理,就能解决这些麻烦事。



颠覆传统还是步子太大?

MindVLA一发布,相当于给传统自动驾驶技术路线来了个大挑战。它打破对高精地图的依赖,通过自研的模型,车能模拟环境自己学习,也不用花大价钱去依赖地图数据。

更关键是它似乎重新定义了人和车的关系,以前的智驾系统是听你指令干活,但MindVLA能和你互动,你说应该走右边这条路,它不仅做,还能记住你的驾驶习惯,慢慢成为你生活中伙伴。

而且该技术还能向外扩展的潜力,能应用到机器人等智能领域,这确实能为行业带来一定性的启发。不过,虽然能通过技术优化不少问题,但城市里复杂路况的极端情况,还得时间去验证。



汽车网评:

总的来说,MindVLA确实给自动驾驶带来新的思路,要是真量产成功,那自动驾驶说不定就能实现质的飞跃。但理想步子迈的那么大,能否成功还得看接下来实际表现如何。

ad1 webp
ad2 webp
ad1 webp
ad2 webp