严选好车163的第1161次推送


2025年的中国智驾技术市场,速度在变快,方向却不算清晰。

一边是量产车型不断增加,高阶辅助驾驶开始普及到十万元以内的入门车型;另一边,关于安全、责任和监管的讨论也从未停下。技术公司和车企在交付、用户教育和系统稳定性之间反复拉扯,一些旧有路径正在失效,一些新方法开始被试探。

就在这样的背景下,商汤绝影选择把生成式AI引入车上。它尝试用世界模型和强化学习来重新训练一辆车的驾驶策略,也开始在座舱层重写操作系统逻辑,从AI内核到交互框架都自己构建。


“我们希望打造智能辅助驾驶的通用大脑。”商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚表述他们的目标。

这听上去有些激进。但在通用模型的技术机会和辅助驾驶尚未收敛的节点上,或许也不是一种过早的设想。

一、进入深水区:辅助驾驶的机会与挑战

2024年下半年,辅助驾驶系统正快速下沉到更多车型与价格区间。数据显示,中国市场搭载L2级辅助驾驶的车型数量持续走高,甚至出现在十万元级别的家用轿车上。技术在普及的同时,系统能力、安全争议、监管标准等问题也被一并放大。

王晓刚对这个阶段的判断是“市场爆发”,他认为,用户对于智驾系统的感知和理解还远未成熟,这一轮普及更像是一个教育过程。“很多人其实不知道怎么去用智驾。”在他看来,这种信息差带来的风险并非个案,如果在这个阶段不进行正确引导和认知,出现大量事故,整个行业会受到很大的打击。

辅助驾驶不是新事物,但从过去强调“能不能跑起来”,到如今关注“跑得稳不稳”,行业的核心衡量标准发生了变化。王晓刚认为,评判一个智驾方案的水平,主要看两点:安全性和场景覆盖度。尤其在城市复杂交通环境下,连续性的决策能力成了分水岭。

从技术路径来看,行业过去几年热衷端到端模型训练,但如今正在逐步暴露出训练数据依赖重、泛化能力弱的瓶颈。“哪怕是百万级数据,也很难遇到真正的极端情况。”王晓刚提到,“端到端模型很大程度是在模仿人类驾驶,但它对没有见过的场景,处理就会很不确定。”这也意味着,在能力上,端到端方案往往难以超越人类司机的决策极限。

与此同时,监管态度也发生了变化。近期,工信部提出对智能驾驶系统实施更加审慎的监管策略。这在技术圈被看作是对行业节奏的一次“勒马”。但王晓刚并不认为这是坏事,“我们正好可以用这个窗口期,加强测试和系统的安全策略建设。”

对供应商而言,这轮行业进入深水区不仅是交付压力,也是技术价值的检验期。没有什么比“车端上的表现”更具说服力。接下来的问题是:如何做得更好?以及,是否还有机会做得不同?

二、世界模型的作用不只是“仿真”

2025年,商汤绝影将生成式AI引入辅助驾驶系统,推出端到端技术方案R-UniAD,目标是突破目前技术路线的瓶颈,重建一套能够动态学习、自我进化的智能驾驶系统。

核心思路在于“世界模型+强化学习”的组合。传统的端到端系统依赖真实路况数据进行训练,但极端场景的数据本身极为稀缺,哪怕是百万辆车的运行日志,其中真正能用于训练高风险应对的片段不到1%。世界模型的引入,试图重构这个限制。

在商汤定义中,“世界模型”不仅是仿真环境,更是一个具备动态重构、可控生成能力的数据生产系统。通过“绝影开悟2.0”世界模型,工程师可以将路测视频解耦、建模、重建,构建出带有空间结构与物理逻辑的4D场景。接着,再以强化学习算法训练AI驾驶模型在这些场景中反复试错,逐步形成“高反馈-高优化”的闭环。


R- UniAD架构也做了层级分段。首先通过模仿学习完成冷启动训练,其次是世界模型中的仿真环境训练强化学习模型,最后将云端大模型蒸馏为可部署在车端的小模型。这意味着算法在安全边界内可以充分训练、打磨,然后被移植到资源受限的硬件上,完成最终落地。


在上海车展上,绝影团队展示了“施工占道刹停”这样一个典型难场景的演练流程。在传统的端到端方案中,这类复杂场景由于缺乏真实数据,很难被有效覆盖。“这些特殊场景往往是数据训练的难点,我们通过真实采集也很难遇到,更别说反复验证了。”王晓刚表示。R-UniAD不仅能完成几何场景重建,还能模拟车辆轨迹,并通过评分机制反复优化驾驶策略。“我们能让模型在这个场景里跑几千遍,通过反馈系统找出最优的应对策略。”王晓刚说。

相比传统方案的工程耗时,R-UniAD的优势是效率和场景控制力。“我们可以在几小时内完成一个场景的训练流程,而且这些训练可以是结构化的、有方向的。”

在行业对“确定性安全”的呼声越来越高的当下,这种方式的出现,意味着安全不再只是依赖经验和测试样本的累积,而可以主动生成与泛化。

三、AIOS不是助手,而是操作系统

与生成式智驾并行推进的,是商汤绝影在车载AI操作系统上的探索。

在商汤看来,过去的智能座舱仍是“指令-响应”的交互范式,本质是把语音助手嵌入车机UI,没有系统性重构。而所谓AIOS,应该是一套以AI为内核,从感知到记忆、从决策到交互都能自我进化的智能体系统。

2024年11月,商汤发布车载AIOS内核“绝影千机”,结合MOE多模态模型、类人记忆架构与原生智能体框架,构建了AI操作系统的底层逻辑。它不仅重写了操作系统的数据流路径,也提出了开发层级的统一接口标准,支持智能体开发者进行快速适配。


“我们把车当成一个智能体系统来看待,它有自己的感知、记忆、规划和动作。”王晓刚说。类人记忆模块将用户的偏好、交互、环境等信息在“瞬时-情境-长期”中进行分类沉淀,为智能体的行为提供上下文。这种系统也强调隐私性,私密数据在端侧封闭运行。

在交互界面上,New Member则是“绝影千机”最直观的产品体现。在多个演示场景中,它不再是被动问答的助手,而能够识别场景中的用户状态、语义暗示、甚至情绪波动。例如,在车主讨论雨崩徒步路线时,它能自动插话提醒羽绒服;在情侣争执出行方式时,它尝试缓解情绪、提供选择。


此外,New Member首次实现免唤醒的多人多轮交互,在座舱多人环境中自动感知对话并参与。“我们不是在做一个更智能的语音助手,而是在搭建一个面向未来的AI中台。”商汤绝影团队成员表示。

对车企来说,“重写操作系统”意味着系统主导权、数据闭环能力与生态控制力的变化。在合作层面,商汤正在将“绝影千机”与车企现有的OS进行适配整合,试图打造统一的AIOS生态。

四、向量产驶去:数据闭环之外的落地问题

技术之外,量产是更严峻的考题。

截至2025年第一季度,商汤绝影的辅助驾驶方案已合作超30家车企,覆盖130余款车型,累计交付超360万辆。年初与广汽合作的基于地平线征程®6M平台的辅助驾驶系统正式上市;与奇瑞合作的地平线征程®6E平台方案、与东风合作基于英伟达Thor平台的一段式端到端方案也计划在今年完成交付。


与绝影的高端Thor平台方案并行推进的,还有中低端市场的J6E/J6M平台。这些多层次的产品线背后,是对车企多样化成本结构和需求的回应。

但交付规模并不意味着风险结束。目前行业内尚未形成统一的安全评估标准,大模型在车端的更新机制和责任归属依然模糊。

此外,智能驾驶系统的成本压缩空间已相当有限。王晓刚在采访中坦言,“车的价格战已经是极限状态,价格继续压缩并不利于行业发展。最终我们还是要做到可盈利,才是可持续的。”

在被问到中国产智驾能否追上特斯拉时,他给出的回答是,“特斯拉靠的是700万辆车的数据闭环。我们需要靠生成式AI和世界模型去缩短这个差距。”他进一步解释说:“你很难在真实世界中采集足够多的极端场景,不仅成本高,而且存在风险。世界模型让我们可以用仿真来还原这些场景,强化学习则是通过数千次的试错,让系统学会如何应对,而不是单纯模仿人类驾驶。”

智能驾驶的未来充满不确定性,但对于商汤绝影而言,重构能力边界与工程交付能力,两者缺一不可。眼下,他们正试图在这场比拼中同时发力。

走的人多了 也便成了路

绝影的系统,已经出现在了几百万辆车上。但这并不意味着挑战结束,可能恰恰是刚刚开始。

技术上,它还在和传统端到端方法拉开差异,需要靠世界模型和强化学习真正跑通训练闭环;工程上,它要面对不同平台、不同成本预期下的交付要求;系统上,它还要证明自己不是一个“语音助手Plus”,而是一套可以运行的智能体系。

在中国智驾产业进入深水区的当口,每家公司都在寻找自己的稳定支点。有的选择沿用既有方案,在成本和效率中博弈;也有的像商汤绝影这样,从底层逻辑重做,希望把大模型带来的能力变成新的系统能力。

没人能确认下一阶段会是谁主导,但至少现在,这条路径是清晰的:

如果智能驾驶真要走到“超越人类”的阶段,它首先要自己知道在看什么、怎么想、该不该动。

ad1 webp
ad2 webp
ad1 webp
ad2 webp