经济观察报 周信/文 在“软件定义汽车”的浪潮中,汽车的智能座舱、智能驾驶如何更好地与大模型相结合,是当前行业关注的重点。
日前,商汤绝影CEO王晓刚在接受经济观察报采访时表示:“当前车企对国产大模型的应用大多还停留在‘原始模型接入’阶段,在汽车产品体验层面的深度结合存在明显差距,实际用户体验未达预期。”
王晓刚以智能座舱为例指出,大模型在汽车上实现真正的产品化,需要模型在多模态交互、情感支持等维度取得突破,不能仅依靠文本推理能力的提升。在智能驾驶领域同理,端到端自动驾驶依赖海量真实驾驶数据,但中国车企难以像特斯拉那样拥有百万级车队的数据回流能力。
在此背景下,商汤绝影提出“R-UniAd”技术路线,借助多阶段强化学习降低数据需求。王晓刚介绍,传统端到端模型在复杂场景中,90%的人类驾驶行为数据可能是无效的,而强化学习能通过仿真反复试错,找到最优解决方案。目前商汤已将20%的仿真数据用于模型训练,未来目标是提升至70%以上。
在硬件路线的选择上,激光雷达仍是区分智驾等级的重要标志,但汤绝影坚持纯视觉方案。王晓刚表示,激光雷达在极端天气下可能失效,且成本较高,难以满足“智驾平权”的需求。随着视觉算法与仿真数据的迭代,纯视觉方案的上限更高。
今年3月,商汤与广汽、奇瑞等车企合作的J6E、J6M平台量产,主打10万元级车型的智驾普及,通过云端大模型蒸馏和工程优化,在低算力芯片上实现高阶智驾功能。
面对特斯拉FSD入华的潜在冲击,王晓刚并不担心。他表示:“特斯拉FSD端到端的技术路线在中国会面临自动驾驶场景数据积累受限的问题,因为数据不能够跨境,特斯拉不大可能用它在美国的数据。”
王晓刚表示,技术演进远未结束,端到端不是终点,未来需要云端基础设施、数据管线与车企深度绑定。商汤已与多家车企共建数据中台,争取在强化学习时代掌握场景定义的主动权。
对于行业热议的“VLM(视觉语言模型)能否成为端到端标配”,王晓刚认为,所有技术路线都应回归数据本质。没有一种模型能解决所有问题,拥有覆盖复杂场景数据的企业,才能定义下一代智驾标准。
在算法、算力与数据的激烈竞争中,中国汽车企业的智能化竞争已进入关键阶段。如何将大模型的技术优势转化为实际的用户体验,将成为竞争中的决胜关键。
周信经济观察报记者
行业产业报道部记者
关注汽车产业发展,对新能源、储能及动力电池关注较多,擅长深入报道及行业分析。
联系邮箱:zhouxin@eeo.com.cn
微信号:zx13552437427