随着3A游戏大作开始“上车”,宝马等一众外资品牌在2025上海车展凭借“巨幕影院”和3D投影技术重新定义座舱体验,智能汽车竞争的焦点已从硬件参数转向认知能力,行业正处于“软件定义汽车”向“认知重塑出行”跃迁的临界点。

“未来的智能座舱不是冰冷的机器,而是能‘察言观色’的家庭成员。”商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚在接受《每日经济新闻》记者(以下简称NBD)独家采访时,借此形容当前智能座舱的发展方向。在他看来,智能座舱的进化分为三个阶段:早期的“问答工具”、大模型赋能的“全能助手”,以及具备记忆与共情能力的“家庭成员”。

工信部数据显示,2025年第一季度中国L2级辅助驾驶新车渗透率已达65%,但智能驾驶供应商正面临严峻挑战:价格战愈演愈烈,车企自研趋势日益明显,同时智能驾驶事故频发引发公众对激光雷达等传感器的广泛讨论。在这一背景下,商汤绝影如何在没有激光雷达的情况下保障安全性?规模化上车如何实现盈利?

对此,王晓刚认为,车辆搭载激光雷达只是阶段性的技术选择,随着模型算法的演进、数据迭代和整体安全性的提高,激光雷达是可以被替代的。商汤绝影选择通过“世界模型+强化学习”的技术组合,突破现实数据不足的瓶颈,在降低硬件依赖的同时确保系统安全。


商汤绝影CEO王晓刚 图片来源:企业供图

谈及与主机厂的关系时,王晓刚用“太极”比喻新时代的合作模式。在车企纷纷加强自研的背景下,商汤绝影定位为AI(人工智能)基础设施与云端服务提供商,与车企在数据和研发体系上深度耦合。王晓刚认为,这种模式既保留车企的核心自研能力,也能发挥科技公司的技术优势。

现阶段汽车是人工智能最好的载体

NBD:商汤绝影现在打出口号叫“专注于汽车行业的AI公司”。为什么这么说?目前在做的主要重点是什么?

王晓刚:商汤是1+X的战略,1就是大模型,X就是各个行业的板块,绝影是其中的X之一,聚焦汽车行业。今天我们说商汤绝影是“最专注在汽车行业的AI公司”,其实离不开商汤这个平台型的公司。它在不同的阶段其实是有不同的行业作为驱动力,今天这个时间点的话,智能汽车是人工智能发展最强劲的驱动力。

辅助驾驶从过去十几年发展到今天,已经到了大规模进行落地推广的阶段。另外,尤其是多模态大模型和世界模型,在汽车领域的作用和能力实际上是体现得最充分的。因为在汽车这个空间,有声音、有图像,还有激光雷达、车机的各种信号,各种传感器是非常丰富的。相比其他行业,比如手机、互联网输入比较单一,而汽车是一个非常好的应用场景,去体现多模态大模型人机交互的能力。

而且,今天很多智能汽车里面用到的这些技术和未来智能机器人,也是大家一致看好的方向。这些技术是高度重合的,但是你看机器人数量(目前)是非常少的,(而)汽车进行大规模量产,(有)大量的数据回流。所以,我们今天聚焦智能汽车,实际上能够产生巨大的用户价值。另外,这些技术也是为将来人工智能向通用人工智能演进打下了非常好的基础。

NBD:之前理想汽车CEO李想说过一句话,他认为汽车是人工智能最好的载体。

王晓刚:对,至少是目前这个阶段。时代还在发展,当今这个阶段它就是一个最好的载体。

NBD:商汤绝影提出智能座舱需要“叛逆”进化,这是否意味着它必须具备更强的主动交互能力?

王晓刚:我们其实对智能座舱有一个思考,它的发展有几个阶段:第一个阶段是工具,就是早期你提问题它回答,完成一个特定的任务。进入大模型的第二阶段后,智能座舱跃升至“助手阶段”,不仅能理解复杂指令,还能跨场景协同完成任务。第三个阶段就是家庭成员,它不仅能帮你做事,还有情感上的连接,就像家里的宠物。假如有一天宠物离开了,情感上大家是非常难以割舍的。

过去几个月,我们的智能座舱开发了一系列新功能。我们的产品经理经常与它互动,慢慢就产生共情。这一阶段的智能座舱,不仅加强了人跟车之间的粘性和依赖,实际上也是对于人机交互的一个革命性改变。

NBD:感觉这是一个大概念,可以扩展到不只是汽车,甚至汽车以外都是可以的。

王晓刚:确实,情感化交互的逻辑具备普适性,但不同载体的实现条件差异显著。以手机为例,它本质上是被动响应的设备,用户需要主动唤醒、输入指令后设备才会提供服务,既无法持续感知用户状态,也难以建立深度陪伴感。相比之下,汽车是更理想的情感载体。

当用户进入车内,座舱系统天然处于全时待命状态,摄像头、麦克风、座椅传感器等设备持续运行,能够实时捕捉乘客的表情、动作、声音甚至生理信号(如疲劳度),从而构建动态的情感反馈循环。这种“无感却无处不在”的交互模式是手机等难以实现的。

端到端是“必赢之战”,激光雷达属于阶段性需求

NBD:您曾提到“端到端是必赢之战,没有B计划”。与华为、特斯拉等的端到端方案相比,商汤绝影在模型或训练方式上有哪些独特壁垒?

王晓刚:端到端的技术路径差异取决于数据规模与实现方式,一种是两段式端到端,就是把感知与规控拆分为两个独立模块,规控部分采用小模型替代传统规则。这种模式适用于数据量有限的场景,但能力上限受数据规模制约。另一种就是以特斯拉为代表的一段式端到端,全系统整合为单一模型,依赖超大规模真实数据训练。特斯拉凭借700万辆车的海量数据回流,目前是唯一能规模化应用此模式的企业。国内其他车厂都干不了,我们也干不了。

在这种情况下,商汤绝影的选择是“世界模型+仿真强化学习”。我们通过构建高精度虚拟环境,在仿真中生成海量驾驶场景(如极端路况、复杂交互),使自动驾驶系统在模拟世界中反复试错、自我进化。这与AlphaGo(一款围棋人工智能程序)的演进逻辑相似,早期AlphaGo依赖人类棋谱训练,而AlphaZero(一种通用强化学习算法)通过自我博弈生成新策略,最终超越人类水平。

不过,围棋的棋盘规则固定,状态变化可精准预测;现实驾驶中,车辆下一时刻的状态受无数变量影响,自动驾驶的难点在于物理世界状态演进的复杂性。

NBD:依靠地图不行吗?地图方案在未来是否仍然可行,还是已经逐渐失去作用?

王晓刚:以往,业界普遍采用高精度地图,后来逐渐向轻量化地图转变,如今正逐步降低对地图的依赖性。回到智驾层面,地图方案存在局限性,因为智能座舱感知环境主要依赖摄像头。我们拥有11个摄像头,能够实时捕捉车辆周围的视频信息。但真正的挑战在于预测,基于当前摄像头捕获的画面状态,如何准确预测下一时刻摄像头中出现的场景?这就需要世界模型的能力。

目前,我们的世界模型可以模拟未来的场景变化。例如,当车辆行驶至施工路段需要避让时,世界模型能够模拟避让过程中的各种可能性,包括模拟碰撞后的情形。

NBD:我们看到商汤绝影有方案是没有激光雷达的,现在大家都在说安全冗余,会不会担心(没有激光雷达)这个事儿?模型如何在保证安全的前提下实现好用?

王晓刚:我觉得不加激光雷达属于一个阶段性的问题,可能现阶段大家对(智驾)安全有顾虑,所以搭载激光雷达。现在,在高速路段场景下,即使不搭载激光雷达车辆也能够正常行驶;但在城区复杂场景中,行驶难度会有所增加。不过,加激光雷达也不能解决所有问题,因为它本身也会受各种条件和天气干扰,激光雷达也会老化,信号也会出现各种各样的问题。

从我们的角度来看,将来随着模型算法的演进、数据迭代,整体安全性的提高,这个(激光雷达)是可以被替代掉的。提高智驾安全性其实有很多方式,模拟仿真就是一种。


图片来源:企业供图

过去,在复杂场景下,若自动驾驶出现失败,由于场景不可重复,只能采集类似场景进行训练,但这种方法不能保证解决问题。而模拟仿真技术的出现,使得记录失败场景并对其进行重构成为可能。在仿真环境中,(我们)可以反复测试直至成功,并生成类似场景以确保模型的泛化性。这使得自动驾驶的技术边界更加明确,能够清晰地知晓在何种场景下系统有效、何种场景下可能失效,从而提高安全性。

NBD:现在有的车企会配置两套系统,一套搭载激光雷达,另一套采用端到端系统,两套系统互相兜底。您觉得这是一个好的方式吗?或者说这是一个过渡阶段的解决方案吗?

王晓刚:目前来说,这是一个合理的方式。主要是端到端系统存在不确定性,而规则具有确定性,当遇到无法处理的情况时,系统会让车辆停下来。端到端系统基于类人学习,其应对未见过场景的能力有限,因此需要其他方式兜底。不过,随着未来世界模型的出现和仿真技术的发展,当能够仿真出各种场景并明确技术边界时,行业将更具确定性。知道系统在何种场景下有效或失效,大家有确定性就知道边界在哪儿,可能就会减少对这种双系统配置的依赖。

与车企合作模式:“太极式共生”

NBD:产品现在的上车情况是怎样的?大概有多少个品牌在用?

王晓刚:目前,我们的产品已经上车7款车型。在智能驾驶方面,今年3月份刚刚实现了首批地平线J6M方案的量产。接下来,今年我们还将推出价格更为亲民的地平线J6E方案,并将在奇瑞品牌实现量产。此外,基于英伟达Thor平台开发的系统,以及包括世界模型和强化学习等端到端技术,会应用到东风的量产车型中。

NBD:如今主机厂和供应商的关系似乎与过去有所不同,尤其是许多科技公司也成为了主机厂的供应商。如何看待新时代下我们与汽车主机厂的合作模式?商汤绝影是供应商还是与主机厂的合作关系已经发生了变化?

王晓刚:这里可以用“鸳鸯锅”和“太极”来形象地描述两种不同的合作模式。“鸳鸯锅”中红汤和白汤的界限非常清晰,合作的焦点往往集中在边界上。在这种模式下,主机厂如果发展自研能力,目的可能是为了替代供应商。而“太极”则体现了中国人独特的智慧,双方相互呼应、相互依存。

在人工智能领域,主机厂需要具备一定的自研能力,以便更好地理解和把握技术,这不仅涉及自动驾驶,还包括智能座舱以及利用人工智能改造生产线和供应链等众多方面。然而,人工智能技术发展迅速且投入巨大,如果主机厂在这一领域独自投入巨资建设超算中心等基础设施,不仅成本高昂,而且在汽车价格不断下降的市场环境下很难实现高性价比。

我们与主机厂的合作是一种内外结合、紧密共生的关系。主机厂的自研团队与我们的AI技术相互补充,缺一不可。主机厂需要保留一定的自研能力,而我们的AI技术则为其提供支持。没有主机厂的数据支持,我们的AI技术难以发挥作用;而没有我们的AI技术,主机厂也难以在这一领域实现高效发展。简单说,双方就是一个非常紧密的共生关系。

NBD:过去主机厂多强调全栈自研,如今则更倾向于全栈可控,且这种可控存在多种模式,比如通过股权合作将供应商与自身绑定。商汤绝影是否会与主机厂开展此类股权合作呢?

王晓刚:股权合作只是其中一种形式,虽然能在特定时间节点保障资源投入,但主机厂当下亟待解决的核心问题并非资源,而是双方研发体系的对齐。这包括工具链、数据格式以及各种管线等方面的适配。若主机厂与供应商的两套体系无法对接,双方的基础设施与能力便难以实现协同。

在现实情况下,主机厂也不可能构建多套研发体系,通常只会采用一套。因此,关键在于推动研发体系与基础设施的企业应用,这并非单纯的股权投入所能解决。即便主机厂对多家车企进行投资,也不可能为其分别建立独立的研发体系。


图片来源:企业供图

NBD:与车企合作肯定会涉及数据,您以前也强调过谁更接近数据,谁就占据主动权。那么,如何平衡数据隐私和训练的效率?

王晓刚:我们今天跟车企合作,车厂依然是数据的拥有者。关于隐私保护,所有车辆采集的数据都需要进行脱敏处理,例如去除人脸和车牌信息。此外,国家对此也有明确的规范和要求,商汤绝影自身也具备数据脱敏技术,能够为车企提供数据脱敏服务。

自动驾驶研发重心转向:从车载到云端

NBD:您之前提到智能驾驶距离盈利还有三年左右,随着未来智能驾驶的大规模产业化,如何通过上车来降低成本并增强盈利能力呢?

王晓刚:首先它的量得起来,目前市场上的量产爆发是一个积极的趋势。另外,为了推动行业发展,标准化和平台化至关重要。我们今天看到这样一个趋势,当前摄像头配置逐渐趋于一致,车企在采集摄像头数据时也尽量采用相同类型的摄像头,并且尽可能复用调试工作,这样可以避免额外的数据采集,提高效率实现平台化。

NBD:如果在汽车行业,您觉得商汤绝影以后会成为自动驾驶的安卓还是苹果的iOS?

王晓刚:首先我们要拥有自动驾驶的这些全量方案,可能后面会更多地提供云服务、大模型和基础设施。自动驾驶未来的研发,在车端的研发会变得越来越轻,而在云端的基础设施投入会越来越重,因为都被模型替代了。强化学习、世界模型都是在训练阶段、在云端发生的,最后出来的端侧的东西相对来说比较简单。所以我们自己要提供云服务,给客户这些基础设施的支撑。

NBD:展望未来3年到5年,商汤绝影有什么规划?您希望达到什么样的目标?

王晓刚:我觉得从三个层面来看,在通用人工智能高速发展的浪潮里,希望绝影始终能够站在前列,给消费终端客户带来优秀且新的体验。从公司自身来说,未来3年到5年,(希望)能够有更好地发展,进入下一个阶段。商汤绝影希望通过3年至5年在汽车行业深耕,能够极大地去推动商汤AI平台化的发展。毕竟,商汤再先进的技术也需要找到合适的应用和落地场景,以便获取反馈,形成正向循环。

ad1 webp
ad2 webp
ad1 webp
ad2 webp