首席执行官奥特曼罕见“认错”，考虑OpenAI开源策略！啥情况？

当所有人还在惊叹DeepSeek的惊人实力时，OpenAI终于坐不住了。当地时间1月31日，OpenAI正式推出了全新推理模型o3-mini，并首次向免费用户开放推理模型。这是OpenAI推理系列中最新、成本效益最高的模型，现在已经在ChatGPT和API中上线。

OpenAI正式推出了全新推理模型o3-mini 图片来源：OpenAI

OpenAI可能考虑开源、公开完整思维链。在o3mini正式推出之时，OpenAI的首席执行官‌‌Sam Altman（奥特曼）携一众高管在reddit回答网友问题，其间罕见承认OpenAI过去在开源方面一直站在“历史错误的一边”。Altman表示：“需要想出一个不同的开源策略”。

OpenAI的首席执行官‌‌Sam Altman（奥特曼）携一众高管在reddit回答网友问题

在谈及DeepSeek时，Altman表示它是“一个很好的模型”，并表示“我们将生产更好的模型，但与往年相比，领先优势更少”。

在谈及DeepSeek时，Altman表示它是“一个很好的模型”

Altman还进一步表示，得益于DeepSeek，OpenAI可能更多地揭示其所谓的推理模型（如O3-Mini）如何展示其“思考过程”。目前，OpenAI的模型隐藏了它们的推理过程，防止竞争对手为自己的模型获取训练数据。相比之下，DeepSeek的R1模型则对用户开放思维链输出。

网友问我们可以看到所有的思考令牌吗？

OpenAI首席产品官Kevin Weil也补充表示：

“我们正在努力展示比今天更多的内容，这将很快实现。待定，展示所有的思维链（CoT）的确会导致竞争性蒸馏，但我们也知道人们（至少是高级用户）想要它，所以我们会找到合适的方法来平衡它。”

OpenAI首席产品官Kevin Weil补充回应

在当地时间1月31日的新闻稿中，OpenAI披露，在2024年美国数学邀请赛（AIME 2024）的测试中，低推理努力的o3-mini准确率（60%）与o1-mini差不多，但速率更快；而在中等努力下，o3-mini准确率能够提升到79.6%，与o1模型相当。在最高努力水平时，o3-mini的准确率则能进一步提升至87.3%。

横向对比，DeepSeek-R1模型在AIME 2024测试中的准确率为79.8%，而在GPQA Diamond测试中的准确率为71.5%。

有专家在社交媒体表示：受DeepSeek影响，OpenAl现在也显示推理模型的思维过程了。

OpenAl现在也显示推理模型的思维过程了

此外，对于付费用户，o3-mini将在模型选择器中替代o1-mini。作为升级的一部分，每月花费20美元左右的ChatGPT Plus和Team用户，速率限制也从o1-mini的每天50条，提升到o3-mini的150条。每月支付200美元的ChatGPT Pro用户，能无限制地访问o3-mini。

每日经济新闻综合公开资料