车东西(公众号:chedongxi)
作者 | Janson
编辑 | 志豪

车东西2月22日消息,今天下午,商汤大模型生产力论坛正式举办,商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚发布了行业首个「与世界模型协同交互的端到端自动驾驶路线R-UniAD」。

该方案通过构建在线交互的仿真环境进行端到端模型的强化学习训练,旨在推动自动驾驶技术的进步。

这一技术思路与春节期间受到市场关注的DeepSeek技术创新相似,强调从模仿学习向强化学习的转变,以实现超越人类驾驶表现的目标。


▲商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚

王晓刚指出,算法、算力和数据三者共同推动人工智能技术的进步。随着强化学习等算法在大模型训练中的应用,数据价值得到了进一步挖掘,模型能力的提升也随之加速。他表示,强化学习的创新同样可以应用于端到端自动驾驶领域。

商汤绝影的R-UniAD方案结合了UniAD端到端自动驾驶方案和「开悟」世界模型,计划在即将到来的上海车展上发布,并进行实车部署,继续引领端到端智驾技术的发展。

一、强化学习成新方向 全新端到端自动驾驶技术路线关键

在2022年底,商汤绝影提出了行业首个感知决策一体化自动驾驶通用模型UniAD,并在2023年国际计算机视觉与模式识别会议(CVPR)上获得最佳论文奖。

随着特斯拉等公司在端到端自动驾驶技术上的推进,数据驱动的解决方案已成为行业共识。


▲以模仿学习为主的端到端技术发展面临的挑战

端到端自动驾驶技术旨在通过大量高质量的驾驶数据实现最佳的模仿效果,但基于模仿学习的技术在突破人类能力上限方面面临挑战。此外,高质量场景数据的稀缺性使得实现人类驾驶能力的目标变得困难。

特斯拉通过大规模的高阶智驾量产车和强大的算力基础设施,成功克服了这一挑战。人工智能技术的发展也经历了类似的历程,随着数据红利的消退,性能提升愈发依赖于算力规模的扩大和模型参数的增加。

在春节期间,基于纯强化学习的DeepSeek-R1技术引起了广泛关注。该技术通过少量高质量数据的冷启动,进行多阶段的强化学习训练,有效降低了大模型训练的数据规模门槛,并为模型的进一步发展铺平了道路。王晓刚表示,这一技术路线同样适用于端到端自动驾驶算法的研发。

二、AI方式解决智驾问题 强调“多阶段强化学习”

在UniAD荣获CVPR最佳论文之后,2024年北京车展,商汤绝影展示了UniAD的实车上路成果,量产端到端智驾方案则预计会在今年年底交付落地。

2月22日,商汤绝影发布「与世界模型协同交互的端到端自动驾驶技术路线R-UniAD」,成为行业率先将基于世界模型的强化学习引入端到端智驾的研发与训练的AI公司。


▲商汤绝影R-UniAD:「多阶段强化学习」端到端自动驾驶技术路线

商汤绝影的R-UniAD采用多阶段强化学习方法,首先通过冷启动数据进行模仿学习训练,再通过强化学习与世界模型协同交互,最终实现高性能端到端自动驾驶小模型的部署。

这一方法显著降低了数据需求,并有望提升模型在多元场景和驾驶风格下的性能。

商汤绝影的量产端到端智驾方案预计将在年底交付,基于「开悟」世界模型的能力,数据生产和模型训练的效率将得到显著提升。

预计在4月的上海车展上,商汤绝影将展示与世界模型协同交互的端到端自动驾驶方案的实车部署。

通过强大的云端基础设施,商汤绝影将助力车企合作伙伴在自动驾驶技术上取得更大突破。

结语:商汤持续突破智驾难题

在自动驾驶技术迈向通用人工智能的浪潮中,商汤绝影以「世界模型 + 强化学习」的创新路径,为端到端智驾技术开辟了新路径。

随着上海车展即将亮相的实车演示,这一技术将加速从实验室走向量产,我们不妨期待商汤在智驾上会给市场带来什么新的方案。

ad1 webp
ad2 webp
ad1 webp
ad2 webp