(图片来源:unsplash)

2月13日消息,钛媒体AGI获悉,OpenAI首席执行官奥尔特曼(Sam Altman)今晨公布关于GPT-4.5和GPT-5的路线图消息。

奥尔特曼表示,OpenAI将很快(几周/月内)发布代号为“Orion”(猎户座)的 GPT-4.5,也是最后一个非思维链模型,并且会整合GPT和o系列,即将(数月内)推出具备多项新功能的GPT-5

奥尔特曼强调,此前公布的推理模型o3将不会以独立模型形式发布。最重要的是,免费版ChatGPT能在标准智能设置下无限制地使用GPT-5基础班进行对话,不过会有防止滥用,而Plus/Pro付费用户将以更高的智能水平使用GPT-5。

而这也意味着,GPT 4o、OpenAI o3-mini或成为“绝唱”,GPT-5也将成为该公司第一个世界模型。


同时,OpenAI发布一个全新的模型规范(Model Spec),更新后的模型规范特别强调知识自由,即 AI 应该允许人们自由探索、讨论和创作,而不受不必要的限制;此外,OpenAI还宣布深度搜索(Deep Research)权限下放,每月20美元的Plus用户每月十次,免费用户每月两次使用Deep Research,以及o1和o3-mini现支持ChatGPT文件和图像上传,Plus用户的 o3-mini-high限额每天最多可达到50次。

消息一出,全网刷屏。有意思的是,网友问:“但问题摆在这儿,它能超过中国的DeepSeek不”,也有网友称,,这不就是降级,Orion 现已降级至 4.5,也没有o3,“它甚至很难在几个月内击败 DeepSeek。”

对于OpenAI路线图转变,2月13日上午,一位 AI 领域技术专家对钛媒体AGI表示,“(OpenAI)模型智力、能力提高不了了,用‘大杂烩’系统提供解决方案”。在他看来,其实OpenAI一直没训练出GPT-5,但现在是被DeepSeek刺激到,提前把新模型拿出来,但模型发展已经处于停滞,技术进步可能不是特别大。

很显然,DeepSeek引发的热潮以及马斯克的最新动态,似乎促使OpenAI在技术发展方向上有所转变。

OpenAI不再“挤牙膏”,GPT-5或将在今年退出

万万想不到,短短216个单词的推文,奥尔特曼竟然让全网刷屏看到GPT-5消息。

“We want AI to “just work” for you; we realize how complicated our model and product offerings have gotten.”

在推文中,奥尔特曼首先承认,OpenAI 已经意识到自家的模型和产品供应已经变得非常复杂,需要简化产品供应。

对此,OpenAI公布一系列措施,包括在几周/月内发布GPT-4.5、统一o系列模型和GPT系列模型,然后以GPT-5为始发布新系列模型们,以及直接给用户一个规模最大、最先进的模型技术系统。

“我们和您一样讨厌模型选择,并希望回到魔法般的统一智能。我们的首要目标是通过创建可以使用我们所有工具、知道何时需要长时间思考、并且通常可用于非常广泛的任务的系统来统一 o 系列模型和 GPT 系列模型。”奥尔特曼表示。

事实上,从GPT-1到即将发布的GPT-4.5,经历了6年之久。

  • 2018年6月,OpenAI发布GPT-1,这是OpenAI第一个大规模预训练的语言模型,基于Transformer架构,通过无监督学习从互联网文本数据中预训练,不过泛化能力相对有限,主要是一个语言理解工具。
  • 2019年:OpenAI发布GPT-2,模型规模扩大10倍,拥有 1.5 亿个参数,在生成文本方面展现出强大能力,但因潜在滥用风险,OpenAI以内测形式使用。
  • 2020年5月,OpenAI推出GPT-3,拥有1750亿个参数,在自然语言处理任务上表现惊人,能完成生成文本、回答问题、翻译等多种任务,OpenAI 没有公开发布模型本身,仅通过 API 向部分用户提供访问权限。
  • 2022年:GPT-3.5发布,OpenAI 利用人工标注数据和强化学习提升了模型性能;同年11月30日,基于GPT-3.5的 AI 聊天机器人产品ChatGPT发布,风靡全球。
  • 2023年:3月14日,OpenAI发布GPT-4,语言理解能力更强大,能处理图像内容,对月订阅费20美元的Plus用户开放使用。11月7日,OpenAI在首届开发者大会上宣布GPT-4升级为GPT-4 Turbo。
  • 2024年5月,OpenAI 推出可免费使用的 GPT-4o,支持文本、视觉、音频多模态;7月18日,OpenAI推出GPT-4o mini;9 月 12 日,OpenAI 正式对外发布 o1 模型的预览版,同时发布了o1-mini。12月5日,OpenAI发布了正式版OpenAI o1模型,随后在今年还公布了o3-mini系列,性能和性价比都超越o1模型。

如今,在开源AI模型DeepSeek V3/R1,以及马斯克的竞购动作影响下,一夜之间,OpenAI终于不再“挤牙膏”,全面加速,最快今年发布GPT-5模型。

奥尔特曼表示,ChatGPT免费版将在标准智能设置下获得对GPT-5的无限制聊天访问;每月20美元的Plus订阅付费用户将能够以更高的智能水平运行GPT-5;每月200美元的Pro订阅者将能够以更高的智能水平运行GPT-5。这些模型将融合语音、画布、搜索、深度研究等。

而目前,ChatGPT Plus订阅界面如同一张技术菜单:主打通用场景的GPT-4o标注着“适合大多数问题”,需手动开启的“定时任务版”允许延迟响应;专注于数学与逻辑的o1和o3-mini分别强调“高级推理”与“编码能力”;GPT-4仍以“经典模型”名义保留。

根据此前报道,GPT-4.5(猎户座)是超越GPT-4的下一代大模型,核心优势在于处理文本、图像和视频等多模态数据的能力,目标是实现指数级的改进、达到比GPT-4强100倍的能力,将成为大模型在语言处理和多模态功能上实现巨大飞跃的重要里程碑。

OpenAI高管Shaun Ralston在X平台上发文表示,按照计划目标,猎户座的算力将达到GPT-4的100倍,其推出将标志着AI能力的新时代。


不过需要指出的是,数月前就有报道指出,草莓(o系列)和猎户座(GPT-4.5)代表了OpenAI对人工智能未来的愿景。草莓将重新定义推理能力,而猎户座则承诺前所未有的性能改进——二者将共同作为下一代旗舰模型GPT-5的构建块。因此,很难说奥尔特曼是提前就有规划,现在外部环境复杂下拿出思考已久的路线图。

对此,OpenAI员工Ian Silber感慨:“很高兴能够大大简化我们的产品,让更多人都能用上AI、多用AI。”

Google AI studio高级产品经理Logan Kilpatrick表示,“这一直是我们对Gemini的计划,确保推理能力是基本模型的一部分,而不是支线任务。(这也是为什么我们发布了2.0 Flash Thinking)”。


斯坦福NLP团队则转发了相关推文,并配文字称,“最后承认OpenAI、Anthropic等在2023年战略()简单地扩大模型大小、数据、计算和花费的资金将使我们达到 AGI/ASI)不再有效。”

OpenAI更新模型规范但不开源,谷歌、字节则持续加速模型迭代

与此同时,OpenAI官方发布了一条题为“分享最新的模型规范”的文章,谈及OpenAI塑造所需模型行为的方法,核心是在推进 AI 发展与确保安全之间寻求平衡。

首先在模型规范更新层面,OpenAI强化对可定制性、透明度和知识自由的承诺,基于去年 5 月的基础,结合应用经验进行更新。通过明确命令链和附加原则平衡创建实用安全模型、防止严重伤害、维护运营许可等有时冲突的目标。

其中,在命令链层,将明确模型处理平台、开发者和用户指令的顺序优先级,用户和开发者可在平台规则内自定义模型行为;同时,模型需平衡避免引导用户与探索各主题,了解用户目标并适时提供批评性反馈;定能力基本标准,涵盖事实准确性、创造力和程序化使用;说明模型平衡用户自主权与预防伤害或滥用的方式,新版本全面涵盖拒绝请求原因;提供格式和交付的默认指导,确保清晰可用。

最重要的是,OpenAI明确鼓励思想自由,只要不造成重大伤害,模型应能探讨各类话题,避免宣传特定议程。而通过收集对模型规范更新,初步结果表明,与去年5月的最佳系统相比,到今天,OpenAI模型对模型规范的依从性有了显著提高,OpenAI认为这主要归因于一致性增强,但仍有改进空间。

对于开源规范层面,OpenAI将新版本模型规范基于Creative Commons CC0 许可发布到公共领域,开发人员和研究人员可自由使用、改编和构建。同时开源评估提示,计划未来发布更多规范评估和协调的代码、工件及工具,在 Github 存储库定期发布新规范版本。

这意味着,OpenAI希望让更多人使用开源的OpenAI技术。

早前DeepSeek发布以后,奥尔特曼承认,OpenAI过去在开源方面一直站在“历史错误的一边”,需要想出一个不同的开源策略。

2025年1月31日,OpenAI宣布,免费向用户开放推理模型o3-Mini,但其核心技术还是封闭的,仍然强调开源“不是我们当前的最高优先事项”。这表明,OpenAI短期内不会在开源方面有实质性的转变。

下一步,OpenAI计划持续扩大挑战范围,纳入实际使用中发现的案例。同时,随着 AI 系统进步,持续迭代原则,邀请社区反馈并公开进展。不再为每次更新发布博客文章。目标是在研究和创新指导下,安全启用新用例,不断学习改进,鼓励公众参与 AI 技术发展当中。

不过与此同时,谷歌、字节等多个 AI 科技龙头正在加速闭源模型迭代速度。

面对DeepSeek所掀起的低价高效风潮,2月初,谷歌正式推出了旗舰AI 模型Gemini 2.0 Pro Experimental,并同时发布Gemini 2.0 Flash Thinking 模型,被视为谷歌在AI 领域积极应对竞争,巩固其市场地位的重要举措。

最新Gemini 2.0 Pro 甚至可以调用谷歌搜索等工具,并代表用户执行代码。同时,Gemini 2.0 Pro 的上下文窗口达到了200万tokens,这意味着它可以一次处理约150万个英文词汇,此容量足以让它在单个提示中读取《哈利波特》系列的所有七本书,并且还剩下约40万个单词的空间。


2月5日,谷歌CEO桑达尔·皮查伊(Sundar Pichai)在业绩电话会议上赞扬DeepSeek,认为降低AI成本将对科技巨擘及整体AI需求产生积极影响。皮查伊称,随着AI推理成本持续下降,更多的AI应用将变得可行,认为谷歌的Gemini 2.0 Flash模型及2.0 Flash Thinking模型在效率上可与DeepSeek R1模型媲美。

而2月12日,字节跳动旗下“豆包大模型”Foundation团队公布,其提出一种全新的稀疏模型架构“UltraMem”,该架构在保证模型效果的前提下,推理速度较传统的MoE(专家混合模型)架构提升2到6倍,推理成本最高可降低83%。这项创新成果已被机器学习和AI领域的顶级会议ICLR 2025接收,为解决大模型推理效率和扩展能力问题提供了全新思路。

更早之前,豆包大模型团队与北京交通大学、中国科学技术大学联合提出视频生成实验模型“VideoWorld”,能达到了专业 5 段 9x9 围棋水平,并能够在多种环境中,执行机器人任务,目前,该项目代码与模型已开源。

GPT-5的消息也正值OpenAI的关键时刻。本周,马斯克牵头的财团出价974亿美元寻求控制OpenAI,交易达成后马斯克会将OpenAI与旗下的xAI合并,但这一收购请求被奥尔特曼秒拒,称“OpenAI是非卖品,马斯克的收购提议更多是他为减缓竞争对手步伐的策略性举动。我并不认为马斯克的收购提议值得特别认真对待。”

根据规划,OpenAI近期还将完成总额400亿美元的融资计划,投后估值高达3000亿美元。同时,OpenAI还将完全重组为一家营利性企业,有望加快公司商业化进程。

(本文首发于钛媒体App,作者|林志佳)

ad1 webp
ad2 webp
ad1 webp
ad2 webp