小鹏汽车启动720亿参数自驾基模研发推动自动驾驶走向L3、L4

来源：环球网

【环球网科技综合报道】4月15日消息，小鹏汽车在AI分享会上首次对外披露正在研发720亿参数的超大规模自动驾驶大模型，即“小鹏世界基座模型”。未来，小鹏将通过云端蒸馏小模型的方式将基模部署到车端，给“AI汽车”配备全新的大脑。这款模型同时也将赋能小鹏的AI机器人、飞行汽车等。

小鹏汽车自动驾驶负责人李力耘介绍，小鹏基模是一个以大语言模型为骨干网络，使用海量优质驾驶数据训练的多模态大模型，具备视觉理解能力、链式推理能力和动作生成能力。通过强大的强化学习训练，基座模型不断自我进化，将逐步发展出媲美甚至超越人类的自动驾驶技术。

李力耘透露，为了研发基模，小鹏汽车早在去年就开始布局AI基础设施，现已建成国内汽车行业首个万卡智算集群，用以支持基座模型的预训练、后训练、模型蒸馏、车端模型训练等任务，小鹏汽车将这套从云到端的生产流程称之为“云端模型工厂”。目前，小鹏“云端模型工厂”拥有10 EFLOPS的算力，集群运行效率常年保持在90%以上，从云到端的全链路迭代周期可达平均5天一次。

早在2024年下半年，小鹏汽车已开始面向L4级别的自动驾驶研发全新的“AI大脑”，即小鹏世界基座模型。

小鹏研发团队利用优质自动驾驶训练数据，先后开发了多个尺寸的基座模型，目前已经着手推进72B（72 Billion，即720亿）超大规模参数世界基座模型的研发，参数量是主流 VLA 模型的35 倍左右。

小鹏世界基座模型的一大优势是具备链式推理能力（CoT），在充分理解现实世界的基础上，能够像人类一样进行复杂的常识推理，并将推理结果转化为行动，例如输出方向盘、刹车等控制信号，实现和物理世界的交互。

从设计之初，小鹏汽车就将基模定位为一个可以泛化到多种具身终端的基座模型。李力耘表示：“小鹏世界基座模型是小鹏自动驾驶真正走向L3、L4的基础，也会是未来小鹏所有物理AI终端的通用模型。”后续，小鹏世界基座模型将全面赋能小鹏AI体系全图谱，应用到小鹏汽车的AI汽车、AI机器人、飞行汽车上。

为了开发小鹏世界基座模型，小鹏汽车打造了一座“云端模型工厂”，工厂“车间”涵盖基座模型预训练和后训练（强化学习训练）、模型蒸馏、车端模型预训练到部署上车的完整生产链路。“云端模型工厂”采用强化学习、模型蒸馏的技术路线，能够高效生产“小身材、大智商”的端侧模型，甚至为不同需求的汽车定制不同的“大脑”，让“千人千面”的模型研发成为可能。

小鹏世界基座模型负责人刘博士介绍，多模态模型训练的主要瓶颈不仅是 GPU，也需要解决数据访问的效率问题。小鹏汽车自主开发了底层的数据基础设施（Data Infra），使数据上传规模提升22倍、训练中的数据带宽提升15倍；通过联合优化 GPU / CPU 以及网络 I/O，最终使模型训练速度提升了 5 倍。目前，小鹏汽车用于训练基座模型的视频数据量高达2000万clips，这一数字今年将增加到2亿clips。

小鹏团队首次验证了规模法则在自动驾驶领域持续生效，刘博士表示：“过去一年，我们做了大量实验，在10亿、30亿、70亿、720亿参数的模型上都看到了明显的规模法则效应：参数规模越大，模型的能力越强。同样的模型大小，训练数据量越大，模型的能力也会越强。”

同时，小鹏汽车已经着手开发世界模型(World Model），作为“云端模型工厂”的重要一环，支持基座模型的性能优化。刘博士介绍，小鹏的世界模型是一种实时建模和反馈系统，能够基于动作信号模拟出真实环境状态，渲染场景，并生成场景内其他智能体（也即交通参与者）的响应，从而构建一个闭环的反馈网络，帮助基座模型不断进化，逐渐突破过去“模仿学习”的天花板。

据了解，关于小鹏世界基座模型研发和训练成果更多的细节，今年6月小鹏汽车将会在计算机视觉国际顶会CVPR上进一步分享。（青山）