百度文心大模型重磅更新,刚刚如期而至。
并且一来就是俩:文心大模型4.5和文心大模型X1同步官网上线,免费向用户开放。
其中,文心大模型4.5主打原生多模态。
而文心大模型X1是百度版深度思考模型,具备更强的理解、规划、反思、进化能力,同样支持多模态。
百度表示,这是“首个自主运用工具的深度思考模型”。
目前,文心大模型4.5已经同步上线百度智能云千帆大模型平台,企业用户和开发者现在就能调用API。文心大模型X1也即将上线——API调用价格约为DeepSeek R1的一半。
文心大模型4.5:原生多模态基础大模型
文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,语言能力、理解、生成、逻辑、记忆能力得到全面提升。
梗图什么的,主打一个稳稳拿捏:
从具体测评结果来看,多模态能力方面,文心大模型4.5跟GPT-4o的对比如下:
文本能力方面,也追赶上了DeepSeek-V3和GPT-4.5,平均分79.6,高于GPT-4.5的79.14。
百度也透露了文心大模型4.5背后的关键技术:
- FlashMask动态注意力掩码:加速大模型灵活注意力掩码计算,有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现;
- 多模态异构专家扩展技术:根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力;
- 时空维度表征压缩技术:在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力;
- 基于知识点的大规模数据构建技术:基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉;
- 基于自反馈的Post-training技术:融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。
文心大模型X1:百度版深度思考模型
作为能力更全面的深度思考模型,文心大模型X1强化了在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面的能力。
值得关注的是,文心大模型X1能“自主运用工具”,已支持高级搜索、文档问答、图片理解、AI绘图、代码解释器、网页链接读取、TreeMind树图、百度学术检索、商业信息查询、加盟信息查询等多款工具。
例如,让文心大模型X1使用中国各朝代历史人物典故,替换《寒窑赋》原文中的事例,它能展现出清晰的思维链:
找到和原文相似的人物典故→注意文风和句式→检查人物典故的适配度→行文保持结构流畅,最后生成了和原文立意、文风句式都基本一致的文本。
文心大模型X1背后的关键技术包括:
- 递进式强化学习训练方法:创新性地应用递进式强化学习方法,在创作、搜索、工具调用、推理等场景全面提升模型的综合应用能力;
- 基于思维链和行动链的端到端训练:针对深度搜索、工具调用等场景,根据结果反馈进行端到端的模型训练,显著提升训练效果;
- 多元统一的奖励系统:建立了统一的奖励系统,融合多种类型的奖励机制,为模型训练提供更加鲁棒的反馈。
价格比DeepSeek R1砍一半
两款全新文心大模型,API调用价格也已出炉:
文心大模型4.5 API,输入价格0.004元/千tokens,输出价格0.016元/千tokens;
文心大模型X1 API,输入价格0.002元/千tokens,输出价格0.008元/千tokens。
X1与DeepSeek R1标准时段价格(缓存未命中)相比,价格便宜了一半。
属于是又给推理模型价格砍了一大刀(doge)。
以及,开源方面,依据此前预告,百度将在6月30日正式开源文心大模型,并预计在下半年发布文心大模型5.0。
One More Thing,量子位已经第一时间开启了深度评测,欢迎来蹲后续稿件~
文心一言官网:https://yiyan.baidu.com