比o1 mini性能更强,价格更低,性价比新王o3-mini再次引爆AI圈热议。

在官方截图中,中等o3-mini的性能和o1 mini差不多,价格却只有后者的一半,整体延迟也和GPT-4o相当。



最主要的,这表明了OpenAI可以在降低成本的同时提高性能。



与此同时,o3-mini背后团队也曝光了,其中华人更是占据了绝对焦点。



而且我们还发现了一件有意思的事:

包括o3-mini在内,有3位华人(任鸿宇、赵盛佳、Kevin Lu)几乎结成了固定搭子,还一起负责过之前的GPT-4o mini/o1 mini



华人成o3-mini团队支柱

这第1位,就是曾在OpenAI最后一天直播中现身的北大校友任泓宇,当时由他来展示o3-mini的编程能力。

任泓宇去年刚加入OpenAI担任研究科学家,主要负责语言模型训练,是GPT-4o的核心开发者、GPT-Next项目组成员。

他博士毕业于斯坦福大学。加入OpenAI之前,在Apple、Google、NVIDIA和Microsoft均有大量研究实习经历。



然后是赵盛佳(Shengjia Zhao),OpenAI研究科学家,方向为ChatGPT的训练和对齐。

他于2022年加入OpenAI,博士毕业于斯坦福大学计算机科学系,本科毕业于清华大学



第3位是Kevin Lu,大概今年7月加入OpenAI。

他2021年毕业于加州大学伯克利分校,就读期间受伯克利人工智能研究所(BAIR)联合主任Pieter Abbeel和谷歌DeepMind研究科学家Igor Mordatch指导,方向为强化学习和序列建模。



除了上面这几位mini搭子,经任泓宇透露,o3-mini还有下面这几位成员:



Max Schwarzer,去年11月加入OpenAI,主要负责提高ML系统的能力。

加入OpenAI之前,曾在谷歌Brain和DeepMind实习,还在Mila人工智能研究所(由深度学习图灵奖得主Yoshua Bengio领导)研究强化学习和自监督学习。



Eric Anthony Mitchell,在OpenAI主要负责o系列模型研究。

本科毕业于普林斯顿大学,博士毕业于斯坦福大学计算机科学系(方向为语言模型)。

他在DeepMind有过一段4个月的暑期实习,更早前是三星AI中心(Base纽约)的一名研究工程师。



Brian (Qiang) Zhang,南开校友,今年3月加入OpenAI负责模型API研究。

他硕士毕业于加州大学洛杉矶分校。加入OpenAI之前,在支付公司Stripe(目前是Chatgpt支付服务商)工作了近7年。



Ted Sanders,拥有OpenAI 3年工龄的老员工,主要负责GPT后训练。

博士毕业于斯坦福大学。加入OpenAI之前,在Netflix研究推荐算法,更早之前在两家咨询公司供职。



性价比新王o3-mini

在OpenAI下一代模型o3系列发布后,CEO奥特曼曾表示:

在许多编码任务中,o3-mini将比o1大幅降低成本。



官方介绍中,o3-mini支持低中高三种思考程度设置。

在代码能力中,低设置下o3-mini和o1-mini差不多,中高设置已经超过了o1正式版。



目前o3-mini仅提供有限测试申请,预计明年1月底左右推出,完整o3还要更久。

不过如果等不及了,也可以自己去加速加速进程(doge)。

这不,o3-mini团队成员赵盛佳就放出了一则招聘消息,邀请共商预训练前沿模型/成本与性能兼具模型的大计。



ad1 webp
ad2 webp
ad1 webp
ad2 webp