当所有人还在惊叹DeepSeek的惊人实力时,OpenAI终于坐不住了。当地时间1月31日,OpenAI正式推出了全新推理模型o3-mini,并首次向免费用户开放推理模型。这是OpenAI推理系列中最新、成本效益最高的模型,现在已经在ChatGPT和API中上线。


OpenAI正式推出了全新推理模型o3-mini 图片来源:OpenAI

OpenAI可能考虑开源、公开完整思维链。在o3mini正式推出之时,OpenAI的首席执行官‌‌Sam Altman(奥特曼)携一众高管在reddit回答网友问题,其间罕见承认OpenAI过去在开源方面一直站在“历史错误的一边”。Altman表示:“需要想出一个不同的开源策略”。


OpenAI的首席执行官‌‌Sam Altman(奥特曼)携一众高管在reddit回答网友问题

在谈及DeepSeek时,Altman表示它是“一个很好的模型”,并表示“我们将生产更好的模型,但与往年相比,领先优势更少”。


在谈及DeepSeek时,Altman表示它是“一个很好的模型”

Altman还进一步表示,得益于DeepSeek,OpenAI可能更多地揭示其所谓的推理模型(如O3-Mini)如何展示其“思考过程”。目前,OpenAI的模型隐藏了它们的推理过程,防止竞争对手为自己的模型获取训练数据。相比之下,DeepSeek的R1模型则对用户开放思维链输出。


网友问我们可以看到所有的思考令牌吗?

OpenAI首席产品官Kevin Weil也补充表示:

“我们正在努力展示比今天更多的内容,这将很快实现。待定,展示所有的思维链(CoT)的确会导致竞争性蒸馏,但我们也知道人们(至少是高级用户)想要它,所以我们会找到合适的方法来平衡它。”


OpenAI首席产品官Kevin Weil补充回应

在当地时间1月31日的新闻稿中,OpenAI披露,在2024年美国数学邀请赛(AIME 2024)的测试中,低推理努力的o3-mini准确率(60%)与o1-mini差不多,但速率更快;而在中等努力下,o3-mini准确率能够提升到79.6%,与o1模型相当。在最高努力水平时,o3-mini的准确率则能进一步提升至87.3%。

横向对比,DeepSeek-R1模型在AIME 2024测试中的准确率为79.8%,而在GPQA Diamond测试中的准确率为71.5%。

有专家在社交媒体表示:受DeepSeek影响,OpenAl现在也显示推理模型的思维过程了


OpenAl现在也显示推理模型的思维过程了

此外,对于付费用户,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,每月花费20美元左右的ChatGPT Plus和Team用户,速率限制也从o1-mini的每天50条,提升到o3-mini的150条。每月支付200美元的ChatGPT Pro用户,能无限制地访问o3-mini。

每日经济新闻综合公开资料

延伸阅读

专家:"职业打手"下场 DeepSeek遭攻击烈度暴增百倍

1月30日凌晨,即农历大年初二,奇安信XLab实验室监测发现,针对DeepSeek(深度求索)线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。XLab实验室观察到,至少有2个僵尸网络参与攻击,共发起了两波次攻击。



DeepSeek线上服务受到大规模恶意攻击

两个变种僵尸网络加入攻击

指令激增100多倍

XLab实验室通过对DeepSeek持续近1个月的监测发现:攻击模式从最初的易被清洗的放大攻击,升级至1月28日的HTTP代理攻击(应用层攻击,防御难度提升),现阶段已演变为以僵尸网络为主。攻击者使用多种攻击技术和手段,持续攻击DeepSeek。

1月30日凌晨,XLab观察到2个Mirai变种僵尸网络参与攻击,此次攻击共涉及16个C2服务器的118个C2端口,分为2个波次,分别为凌晨1点和凌晨2点。

“僵尸网络的加入,标志着职业打手已经开始下场,这说明DeepSeek面对的攻击方式一直在持续进化和复杂化,防御难度不断增加,网络安全形势愈发复杂严峻。”奇安信XLab实验室安全专家表示。

僵尸网络是由攻击者通过恶意软件感染并控制的设备网络,这些设备被称为“僵尸”或“机器人”。攻击者通过命令与控制(C&C)服务器向这些设备发送指令,执行各种任务,例如向目标服务器同时发起DDoS攻击,持续增加攻击规模和强度,耗尽目标服务器的网络带宽和系统资源,使其无法响应正常业务,最终瘫痪或服务中断。

本次采用的两个僵尸网络分别是HailBot和RapperBot,这两个Botnet常年活跃,攻击目标遍布全球,专业为他人提供DDoS服务。

其中,RapperBot平均每天攻击上百个目标,高峰时期指令上千条,攻击目标分布在巴西、白俄罗斯、俄罗斯、中国、瑞典等地区。



苹果APP Store美国区免费榜

树大招风?

中国明星企业易被攻击者“眷顾”

DeepSeek推出R1模型后不久,就凭借其性价比、开源及推理能力的提升等方面获得了广泛关注。除夕当天,DeepSeek还推出了新模型,其中Janus-Pro-7B在基准测试中击败了OpenAI,在外网被不少人称为“神秘的东方力量”。

DeepSeek的成功不仅引发了硅谷的震动,更让华尔街感到紧张。就在1月28日,美国芯片巨头英伟达一夜市值蒸发5900亿美元,合4.3万亿人民币,纳斯达克综合指数跌3.07%,台积电、博通公司、超微半导体等科技股也遭遇集体暴跌。美国总统特朗普表示, DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利”。

每次中国优秀的明星产品或企业崛起之时,总会遭到一些境外不法势力的暗中阻击。上一次是《黑神话:悟空》全球上线后,遭遇了海外60个僵尸网络大规模攻击,而这次DeepSeek上线以来,也遭遇了包括僵尸网络在内的多轮攻击,攻击方式一直在进化和复杂化。

网络安全专家分析,从它们所遭遇的攻击可以看出,随着我国在科技领域的不断崛起,国外黑客的恶意攻击也日益增多。这些攻击不仅可能导致服务中断、数据泄露等严重后果,还可能对我国的科技形象和国际竞争力造成负面影响。因此对于所有企业而言,亟须加强网络安全防护。

ad1 webp
ad2 webp
ad1 webp
ad2 webp