近日,中国一家名为DeepSeek的AI企业迅速崛起,该公司自主研发的大模型DeepSeek-R1在多项国际评测中表现优异,其基准测试已经升至全类别大模型第三,备受国内外市场青睐。

这家成立仅三年的公司于1月20日发布了名为DeepSeek-R1的新型AI模型。

1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一。而其竞技场得分达到1357分,略超 OpenAI o1的1352分。

DeepSeek公众号此前发布消息称:“DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。”

业内人士指出,DeepSeek在本土对冲基金支持下取得的成功是建立在开源知识的基础上的。相比之下,美国竞争对手OpenAI最近则转向了闭源运营模式。(这意味着,DeepSeek和Meta等公司向任何人——研究人员和业余爱好者公开其知识,而OpenAI现在则将其信息作为专有信息)。

DeepSeek凭借高性能和低成本迅速崛起,其自研大模型R1通过强化学习技术在低标注数据环境下显著提升推理能力,训练成本仅为OpenAI的十分之一,运行成本低至三十分之一,被业界称为“AI界的拼多多”。其开源模式推动AI技术普及,为医疗、金融、物流等领域提供了更广阔的应用前景。业内普遍认为,DeepSeek的成功标志着中国大模型技术迈入了新高度。


ad1 webp
ad2 webp
ad1 webp
ad2 webp