将在4月举办上海车展发布R-UniAD端到端自动驾驶方案并完成实车部署。

作者:苏打

编辑:tuya

“春节前后,行业领域的两件事情带来很大影响力。一是以比亚迪、长安为代表的车企最新自动驾驶战略公布。随着自动驾驶下沉到10万元以下车型,市场迎来爆发期;二是DeepSeek通过算法和基础设施上一系列突破,带来了新的研究范式”。

2月21日-2月23日,以“模塑全球 无限可能”为主题的2025GDC全球开发者先锋大会于在上海徐汇举办,商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚在2月22日的商汤大模型生产力论坛上,重磅发布行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”。

在DeepSeek范式获得广泛认可和推崇的当下,这一模型某种程度上是“智驾版DeepSeek”的一种表现形式——通过构建世界模型生成在线交互的仿真环境,以此进行端到端模型的强化学习训练,这一路径与DeepSeek的创新思路基本吻合,即从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。

“模型能力的天花板被打开了”。王晓刚表示,随着强化学习等算法引入到大模型训练的思路得到验证,强化学习的技术创新也同样可以迁移到端到端自动驾驶领域,“新的尺度定律正在开启,数据价值被进一步深入挖掘。”

绝影透露,将在4月举办上海车展发布R-UniAD端到端自动驾驶方案并完成实车部署,以期快速推进创新技术的应用落地和商业化进程。

截至2024年底,商汤绝影已与本田、比亚迪、长城、广汽、红旗、极氪、奇瑞、蔚来等超过30家国内外车企达成合作,覆盖超100款车型,累计交付总量超350万辆。此外,绝影还已在中国(上海、北京、深圳、广州)、德国、日本等地设立研发中心,计划以中国为起点,布局全球业务

端到端智驾体验有望从「类人」到「超越人类表现」

2022年8月,特斯拉CEO马斯克直播试驾FSD V12,即端到端自动驾驶技术,越来越多的车企和科技公司开始跟进端到端的技术路线。

年底,商汤绝影便提出行业首个感知决策一体化自动驾驶通用模型UniAD,并在2023年获国际计算机视觉与模式识别会议(CVPR)最佳论文。而今,数据驱动的端到端自动驾驶解决方案已成为行业共识。

“端到端自动驾驶的本质是通过海量的高质量人类驾驶数据,来实现最佳‘模仿’驾驶效果。然而,基于模仿学习的技术范式可以做到接近人类但难以突破人类能力上限。同时,受限于高质量场景数据的稀缺性和驾驶数据质量的参差不齐,端到端智驾方案要达到人类驾驶能力的天花板并不容易,动辄千万Clips的高质量数据回流形成了规模门槛”。

王晓刚坦言,在模仿学习为主的方式中,端到端的技术面临两个挑战,一是海量数据门槛;二是模仿学习难以突破人类驾驶行为的天花板

例如,特斯拉目前有约700万台量产车辆,可以源源不断产生数据回流,但国内任何一个自动驾驶公司或者车厂拥有的车辆远远小于这个规模。且不同车型的传感器也不一致,各种数据标准不一样,难以形成合力;同时,由于人类驾驶质量参差不齐,即便能够拥有大规模量产车,依旧很难获得高质量、高难度场景的驾驶数据。

叠加2024年开始出现的尺度定律(Scaling law)逐渐“失效”状态,互联网上数据的价值似乎被榨干,即便进一步扩大网络规模增加算力得到的收益也比较小。

“非常幸运,这个时候我们看到DeepSeek又在算法上取得新一轮突破,甚至带来新的研究范式。它能够证明纯强化学习产生的长思维链涌现可以打破数据瓶颈。”王晓刚指出, DeepSeek通过强化学习的框架生成多条思维链,针对每一个问题能够产生更多解法,从而大幅降低数据门槛,使得尺度定律得以继续延续。”

表现在自动驾驶方面,由于强化学习有希望突破人类表现的极限,自动驾驶领域也瞬间被激发出新启示,“此前,端到端大模型输出的就是人类驾驶行为的轨迹,而有了强化学习的驾驶,我们就可以用能够生成仿真环境的世界模型与端到端自动驾驶的模型进行协同交互,产生新的技术路线”。

从性能上限来看,纯强化学习训练让端到端智驾模型有望通过在提升性能的同时,充分探索多元场景和驾驶风格。未来,端到端智驾体验的上限不再是“类人”,而是可以拥有超越人类的驾驶表现。

绝影透露,据测算小样本多阶段学习的技术路线能让端到端自动驾驶的数据需求降低一个数量级,让车企合作伙伴有望换道超车特斯拉FSD。因为从数据规模看,R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练。

这种多阶段强化学习的训练方法能大幅降低端到端自动驾驶数据规模门槛——也是R-UniAD之所以被类比为“智驾版DeepSeek”的一个核心原因。

预计4月份于上海车展展示实车部署

基于更小数量级的数据,R-UniAD加持下的应用有望超越特斯拉依靠百万台量产车数据回流的自动驾驶方案,加速智能汽车驶入AGI。

早在2024年11月“绝影实力AI DAY”发布会上,王晓刚就曾表示,智驾高端局的竞争不止是车端模型的比拼,端到端的决战,战场在云端。现场,绝影全新升级并发布“开悟”世界模型。

由于端到端智驾模型是一个多模态具身模型,其中最关键的是要与依靠世界模型生成的仿真环境进行在线交互,并获得闭环奖励反馈,从而实现强化学习,使得端到端模型的训练能够充分探索各种可能性。

这意味着,能够生成高保真的场景数据、保证长时推演一致性、并支持在线交互的强大世界模型是R-UniAD的基石而世界模型是最基础、最核心的能力也是生成高质量视频数据。

“开悟的优势是真实度高、准确性好、可控性强、泛化性广。目前,开悟世界模型已拥有1024类不同的场景类,能够生成千万级别的场景库。有了开悟模型的支持,才能与生成模拟仿真,与端到端的模型有一个实时的互动”。王晓刚在现场进一步强调。

据悉,开悟世界模型下,1个GPU产生的仿真数据相当于500台量产车的数据采集效果。以绝影量产智驾方案和开悟世界模型为核心,实车采集的真实数据和云端生成的仿真数据在“车云一体”的新范式下进行闭环流转,使得端到端智驾系统的训练更加全面、高效,大幅缩短了研发周期,降低了成本。

如今,“开悟”世界模型的能力进一步提升,将支持实现端到端算法与世界模型仿真环境实时交互。

作为最专注汽车行业的AI公司之一,商汤绝影一直在探索和落地以AI的方式解决智驾问题,并持续探索技术的商业化路径。

2024年北京车展,商汤绝影展示了UniAD的实车上路成果。据绝影现场透露,量产端到端智驾方案预计将在年底交付,“开悟”世界模型也正式用于数据生产。在今年4月的上海车展中,绝影将会展示“与世界模型协同交互的端到端自动驾驶方案”的实车部署

ad1 webp
ad2 webp
ad1 webp
ad2 webp