对不起，真正的智驾距离我们还很遥远

文｜万湑龙

昨天晚上，迪王放了蛇年的第一个“大招”。在比亚迪智能化战略发布会上，董事长王传福正式公布了比亚迪天神之眼技术矩阵。将高阶智驾的门槛拉到十万级车型，今年比亚迪的新车，将会有60%搭载高速NOA功能。无独有偶，就在之前一天，长安汽车董事长朱华荣宣布长安汽车智能化战略“北斗天枢”开启2.0时代。在他背后的大屏幕上，奇瑞尹同跃、吉利李书福、长城魏建军、比亚迪王传福等10余家中国主流车企的核心领导共同发声，宣布将在智驾层面开放合作，携手打造中国智驾新名片。

无论是比亚迪、长安这样的大厂，官宣将高阶智驾普惠更多消费者，还是众多车企宣布接入Deepseek。似乎如很多业内人士之前预测的那样，2025年将会是智驾拐点，越来越多的消费者将会以更加低廉的价格享受到智能化更高的出行体验。那遥不可及的自动驾驶社会，好像离我们的距离变得触手可及。

但我老万，还是想先泼一盆冷水。

约莫十几年前，我刚入车媒这一行的时候，去听过一场沃尔沃关于安全的技术讲解会。其中提到一个点至今印象清晰——谈及终极安全，当时沃尔沃内部有个认知，就是全社会自动驾驶实现之时，所有交通参与者都由车辆自主决策，避免了“人”这个偶然性因素，就会真正做到零交通事故。甚至到了那个时候，车辆的一切被动安全配置都会变得多余。

二十多岁的我，在台下听得瞠目结舌。要知道，当时沃尔沃最先进的主动安全系统，还是那一年刚刚上线的第二代城市安全系统，也就是能做到在车速差在每小时4~15公里以下时，可以避免碰撞。而当年在给我们展示的PPT中，赫然写着到“2020年，不会有人因为驾乘沃尔沃汽车而导致严重伤亡。”作为一个激进派，都觉得本应该保守的沃尔沃提的目标有点过于激进了。

其实到了2016年，沃尔沃就已经发觉自动驾驶技术的发展，完全没有达到自己的预期。于是在这一年哥德堡举办的一次活动中，对于2020零死亡率的计划进行了澄清，称“愿景2020”是集团的一种发展思路。这也就意味着，虽然沃尔沃能够在制造每一辆汽车时都严格把关，但无法确保2020年后所生产的所有车辆都能万无一失，不会有人在驾驶中丧生。

最终的归因就是：“人类活动具有不可预知性，并不是每次意外都能幸免于难。”

自动驾驶的“阶梯论”

其实自动驾驶，并非是这几年才涌现出来的新鲜事。

1995年，一辆具备自动驾驶能力的奔驰S级（参数丨图片）轿车从德国慕尼黑几乎全程自动驾驶到丹麦哥本哈根，全程共行驶1678公里，最高时速达到185公里。而在这个过程中最为重要的是，行驶全程几乎没有人为干预。

而这辆车使用的智驾系统的原理，和我们现在所见到的大部分智驾系统差不多。当时的奔驰用了纯视觉自动驾驶解决方案，用摄像头以及动态3D算法，分析和感知路况并进行车辆控制。

而业内更加公认的智驾技术的爆发起源，是2004年到2007年共举办了3届DARPA无人驾驶挑战赛。那些年散落在莫哈维沙漠的汽车零件，见证了一堆刚开始尝试自动驾驶的汽车笨拙的姿态。但是那些在戈壁滩上满头大汗调试无人驾驶原型车的工程师们，都已经成了这场汽车革命始祖级的中流砥柱。

即便当年还年轻的先贤们，如今已白头或者秃头，自动驾驶依然还没进化到突破我们想象力的程度，或者可以不客气地说，实现真正自动驾驶的时间表一直在延期。甚至于随着自动驾驶的逐步普及，我们对于这项技术在实用层面的定义被更加清晰地约束为“辅助驾驶”。交通的责任主体和真正的掌控者，仅从书面上的两字之差就能读出天壤之别。也就是在目力所及的时间里，驾驶的主体，依然无可辩驳的是：人。

春节前在地平线智驾的媒体沟通会上，创始人兼CEO余凯对于智驾的发言，带出了不少金句。比方说“2025年智驾迎来真拐点”、“智驾产业3年实现脱手开，10年实现随心开”。但相信有不少人看到这些的时候会有和我同款的疑惑：“什么？还要等10年才能实现真正的智能驾驶？”

就这个问题，我觉得地平线副总裁兼首席架构师苏箐所讲可能会更加清晰一点。他认为自动驾驶技术的比较对象，并非友商。而是人类本身。它的价值是一个拐点式的价值——他比不过人的时候，其实就是高科技的玩具；当有一天比人好的时候，价值立刻就会跳上去，也就是两段式的价值。

“很不幸的是，到目前为止还没有一个系统真正达到了这一拐点，我们只是看到了这个希望。”

这种对于自动驾驶能力的阶梯论，并非是苏箐个人的论调。就在前段时间李想的Ai Talk中，他也说到了L3级别的自动驾驶，是AI在人指挥下完成一些任务，但是需要人负责兜底。而下一个阶段，是不需要人负责，可以自主根据要求完成任务。

所以，如果更简单一些理解这个问题的话，就需要把自动驾驶的发展进程拆成两部分，初级阶段可以被称为“模仿人类”，而更高级的阶段，则是“超越人类”。

很可惜的是，即便有天量的资金、技术、算力和人的投入，我们目前的自动驾驶，依然处于无限接近模仿人类的阶段。而超越人类，则是另一个阶梯之上的需求。

无论当下如何营销辅助驾驶对于事故的处理能力，从数据层面上来说，现在的辅助驾驶跟人类相比还是有着巨大的能力差距。在上个月，高盛出了一份对于特斯拉FSD的最新研报，给出的结论是：即使是最新的V13版本FSD能够体现出技术的不断进步，但其表现还未能达到超越人类驾驶的安全水平。根据测试体验、众包数据以及第三方评价，FSD V13的关键干预距离达到了400到450英里之间，97%的驾驶过程中无需发生干预。而Waymo的历史数据显示，其车辆在加州的城市环境下每8.5万英里才会发生一次关键干预。

关于这个数据，类比到人是这样的结果：根据美国政府的交通安全数据，普通车辆每60到70万英里可能发生一次事故。也就是说，自动驾驶和人类驾驶的差距截止目前还是数量级的差距。

悲观一点说，即便付出如此多的努力，自动驾驶仍然还处在一个“高科技玩具”的阶段。

自动驾驶什么时候才能开始“下半场”

当然，往好的方向看，至少在过去的2024年，自动驾驶所取得的发展程度，是多年来未见的。

从技术角度来说，自动驾驶的三大要素：算法、算力和数据，三个方面在2024年都斩获了不少的闪光点。在算力上，几百TOPS的芯片已经量产上车，小鹏、理想和小米三家的辅助驾驶算力都超过了500TOPS，蔚来的4颗英伟达Orin-X芯片算力已经破千TOPS。在数据上，成百上千万辆智驾车辆整跑在路上，每时每刻都在为智驾能力的提升提供数据支撑。

最大的突破，可能来自于算法方面。端到端、VLM、VLA等等大模型在过去这一年成为了最炙手可热的流行词，而这方面的爆发趋势，追根溯源还是AI在过去两年内产生了革命性的突破。2023年3月，支持多模态输入的GPT-4横空出世，秀出了其在图形理解能力方面的肌肉。它所引发的反应，便是视觉-语言模型（VLMs）相关研究工作大跨步的增长。

我们如何通俗的理解这场变革呢？如李想所说，自动驾驶的模型会与大语言模型相融合去理解真实世界，像真正的大脑一样，而非当前端到端模型所采用的压缩记忆方案。正因为此，李想给理想提出的要求是，确保基座模型进入AI行业前三，空间智能做到中国第一，而不只是与其他车企竞争。

看上去似乎前景很光明，对不？但实际上技术提升的过程更像苏箐所描述的那样：“一个新的方法起来以后，第一天你会觉得它很美好，能解决所有的问题；第二天又会对它引起怀疑；第三天你会发现边界就在那里。”

比方说端到端模型，它的弊端就是放大了神经网络黑盒不可解释的问题。不可解释、不可控的性质会导致系统虽然能够处理复杂场景，但是简单场景很可能会出现犯“弱智”错误的情景。另一方面，模型能力的提升是有瓶颈的。当模型能力已经达到每10万公里的行驶数据中只有1公里的数据能够训练模型进行改进时，想要让整个模型的能力进一步升级，那需要的基础数据量和算力都会是一个惊人的规模。这就像是前几年ETH挖矿，越挖，难度越是指数级的上升。

再换个更加通俗易懂的形容，这种感觉就跟拼多多砍一刀似的，最后的1%所付出的努力，可能需要比前面99%还要多。

这种问题，特斯拉的FSD也会遇到。就在今年特斯拉股东大会上，马斯克承认了当前FSD所面临的挑战，主要是测试AI模型的效率以及判断新模型是否更优秀的水平能力。当AI模型在数千英里的行驶过程中仅出现一次需要人工干预的情况时，如何迅速而准确地评估新模型的优劣就变得更加困难。

安全的长尾问题，就是自动驾驶无限趋近于人类驾驶所需要解决的技术问题，需要大量的时间对于AI进行针对性的测试、训练。甚至当你感觉到已经距离成功很接近时，会突然发现也许自己所使用的模型并不是最优解，想要达到目标需要换条道路从头来过。这种挫败感，恐怕是萦绕在每个自动驾驶的科学家脑海中挥之不去的梦魇。

但更恐怖的事情是，很可能我们现在所坚持的大方向，只适用于让自动驾驶更像人。而截止目前，关于让自动驾驶超越人，可能需要换一套截然不同的发展模式。

比方说小马智行CTO楼天城，就认为依靠L2的端到端永远无法实现L4的自动驾驶。这个观点就是从马斯克所奉行的“第一性原理”出发，L2的目标，都是让自动驾驶更像人，而L4的要求则必须要超越人，它的目的是替代人，安全性就必须高于人类安全10倍以上。

更简单一点说，当下的自动驾驶，是需要“知难而退”的，就是遇到自己解决不了的情况时，让驾驶员去接管车辆。而L4级别的自动驾驶需要“迎难而上”，系统拥有唯一的决定权。

楼天成的这套路线，其实是将Robotaxi的模式不断精进，最终在进行泛化，以此来达到最终的L4级别自动驾驶。而以李想为代表的一类人则认为，“端到端+VLM”架构就能够在短时间内实现L3级别的自动驾驶，而L4就是L3的延续。以现在的技术发展水平，我们还很难判断这两种思路的对错。但无疑，选错路的那一方可能需要承受的结果，是一家企业丧失了定义未来的主动权。对于这些科技先行的汽车公司来说，下场远比押宝了氢能源的日本车企惨多了。

所以，世面上也不乏像Momenta这样两条腿走路，同时在L4和L2领域做研发的企业。但双保险就一定能成功么？其实就像是L4级别自动驾驶的终极目标是让系统超越人一样。当技术真的拥有超过人的实力，那么最终极的挑战，将会是人的信任。而这是比技术上所经历的难点，都更加难以逾越的高山。

就像是Momenta的曹旭东所说，人类司机开出租车，1000台车一年可能就有一起重大或者死亡的事故。但如果Robotaxi的公司1000台车一年有一起重大或者死亡事故的话，可能公司就要关门了。

当技术叩开了未来的大门，人类的不信任总是会试图先将门关上。很容易忘记了是我们自己开发这项技术，目的就是为了开门。所以我们再回看余凯对于自动驾驶的十年之期，坦率的说，我觉得这还是需要建立在未来几年内依然能够出现类似当下AI跨越式发展的技术进步的基础上。而人什么时候能够接受比自己更聪明、更有能力接管出行主导权的技术？那似乎就更加遥遥无期了。