我认为 DeepSeek 确实是个很棒的团队,也做出了很优秀的模型,但他们真正走红的原因,并不完全是模型本身的能力。 这对我们来说是一个教训,那就是当我们隐藏一个功能时(思维链),我们给其他人留下了获得病毒式传播的机会。这是一个很好的警醒。它也让我重新思考我们在免费层中提供的内容, GPT-5 将可以免费使用 。
硅谷知名分析师 Ben Thompson 最近与 OpenAI CEO Sam Altman 进行了一场深度对谈,Altman 聊了很多内容,包括开源模型、GPT-5 的进展、和 DeepSeek 的竞争,透露了 OpenAI 未来的发展方向,对 AGI 的观察……
在这个访谈中,也再次让人感受到 DeepSeek 等开源模型对 OpenAI 的影响,最近两个月 OpenAI 的产品发布节奏,也开始跟随着思维链和 Agent 等在中国出圈的模型和产品。
Sam Altman 提到 OpenAI 的崛起是「一次疯狂的机会」。ChatGPT 的成功,让这家公司「被迫」成为了一家消费者科技公司。
现在,这也成为了 OpenAI 当下最大的挑战、
APPSO 整理这篇访的关键点:
1. DeepSeek 的出现是一个「警醒」,促使 OpenAI 重新考虑免费层策略。
2.暗示 GPT-5 即将推出,而且免费用户也可以体验 GPT-5。
3.OpenAI 希望打造一系列个数十亿用户规模的产品。
4.Sam Altman 认为 10 亿日活用户比最先进的模型更具价值。
5.OpenAI 未来的定位,三足鼎立:
·构建大型互联网公司。
·构建推理的基础设施。
·做最好的研究以及最好的模型。
6.幻觉有其价值,是创造力的体现。关键在于控制幻觉,使其在用户需要时出现。
7.ChatGPT 的意外成功迫使 OpenAI 转型,从研究实验室转型为消费科技公司。
8.Sam Altman 承认这并非最初的计划,原本希望专注于 AGI 研究。
9. AGI 是一个模糊的概念,没有统一的定义,倾向于将能够自主完成一系列任务的代理定义为 AGI。
以下是访谈实录,略经 APPSO 编辑和精选:
GPT-5 将可以免费使用
主持人: 从我的角度来看,当你谈到服务数十亿用户,成为一家消费者科技公司时,这意味着广告。你不同意吗?
SA: 我希望不是。我并不反对。如果有充分的理由去做,我不会固执己见。但是,我们有一个很好的业务模式,那就是销售订阅服务。
主持人: 距离盈利和收回所有投资,还有很长的路要走。而且,广告的好处在于,它扩大了你的潜在市场范围,也增加了深度,因为你可以提高每个用户的收入,而广告商会为此买单。你不会遇到任何价格弹性问题,人们只会更多地使用它。
SA: 目前,我更感兴趣的是弄清楚如何为一个真正出色的自动化软件工程师,或者其他类型的代理,向人们收取高额费用,而不是通过基于广告的模式来赚取一些小钱。
主持人: 我知道,但大多数人并不理性。他们不会为生产力软件付费。
SA: 让我们拭目以待。
主持人: 我为 ChatGPT Pro 付费,我不是合适的讨论对象。但我只是——
SA: 你觉得你从中获得了很好的价值吗?
主持人: 当然,我觉得。我认为——
SA: 太好了。
主持人: ——尤其是 Deep Research,它太棒了。但是,我可能更怀疑人们是否愿意主动为某些东西付费,即使数学计算结果很明显,即使它能让他们提高很多效率。同时,我看到你们在谈论构建记忆。让谷歌广告模式如此出色的部分原因在于,他们实际上并不需要非常了解用户,因为人们会在搜索框中输入他们想要查找的内容。人们在你们的聊天机器人中输入了大量的信息。
即使你们投放最「愚蠢」的广告,在很多方面,即使你们无法追踪转化,你们的定向能力也将是超凡的。而且,顺便说一句,你们没有现有的商业模式需要担心被削弱。我的感觉是,这与 OpenAI 的每个人最初的设想完全背道而驰,这是最大的障碍。但对我来说,从商业分析师的角度来看,这似乎非常明显,而且你们已经晚了。
SA: 比起传统的广告,我更感兴趣的是尝试其他方式。比如,很多人使用 Deep Research 来进行电子商务。我们是否可以提出某种新的模式,我们永远不会为了改变商品位置或其他任何东西而收钱,但是,如果你通过 Deep Research 购买了你找到的商品,我们会收取 2% 的联盟佣金,或者类似的东西。那会很酷,我对此没有任何意见。也许,我们可以找到一种体面的方式来做广告,但我不知道。我其实不太喜欢广告。
主持人: 这始终是一个障碍。马克·扎克伯格也不太喜欢广告,但他还是找人做了,而且「别告诉我细节」,让钱神奇地出现。
SA: 是的。再次强调,我喜欢我们目前的商业模式。我不会说我们将来一定会做什么,或者一定不会做什么,因为我不知道。但是,我认为,有很多有趣的方式,在我们当前的变现策略清单上,它们的优先级比广告更高。
主持人: 你有没有觉得,当 DeepSeek 出现并迅速走红,人们开始使用并看到了它的推理能力时,一部分原因是,使用过 ChatGPT 的人没有那么印象深刻,因为他们使用过 o1 模型,他们知道它的潜力。
SA: 是的。
主持人: 但免费用户,或者只是偶尔使用过一次的人,并没有这种感觉。这实际上是不是一个例子,说明你们的沉默寡言,可能让其他产品看起来更令人印象深刻?
SA: 完全是。我认为 DeepSeek——他们有一个很棒的团队,他们开发了一个很棒的模型。但是,我认为,模型的能力并不是真正让他们获得病毒式传播的关键。
这对我们来说是一个教训,那就是当我们隐藏一个功能时(我们隐藏了「思维链」),我们有充分的理由这样做,但这确实意味着,我们给其他人留下了获得病毒式传播的机会。我认为,从这个角度来说,这是一个很好的警醒。而且,它也让我重新思考我们在免费层中提供的内容, GPT-5 将可以免费使用 ,这很酷。
主持人: 哇,GPT-5 的暗示。好吧,我稍后会问你更多关于这方面的问题。
主持人: 当你考虑你的商业模式时,我一直认为,你的商业模式非常适合那些「高主动性」的人,也就是那些会主动使用 ChatGPT,并且愿意为之付费的人,因为他们看到了它的价值。但是,有多少人是「高主动性」的呢?而且,「高主动性」的人会尝试所有其他的模型,所以你们必须保持在一个相当高的水平上。相比之下,如果我有一个好用的模型,它就在那里,而且我不需要付费,它还会不断改进,人们会通过我赚更多的钱,但我不知道,因为我对广告没有意见,就像大多数互联网用户一样。
SA: 再次强调,我们对任何需要做的事情都持开放态度。但是,相比于传统的广告,我对刚才提到的那种电商模式更感兴趣。
和 DeepSeek 及其他公司的竞争
主持人: 关于 DeepSeek,你有没有想过,为什么人们不为美国公司欢呼?你有没有觉得,DeepSeek 的走红,也带有一些「反 OpenAI」的情绪?
SA: 我没有。也许有吧,但我肯定没有感觉到。我认为有两件事。第一,他们把一个前沿模型放在了免费层。第二,他们展示了「思维链」,这很吸引人。
主持人: 大家会觉得,「哦,它好可爱。AI 正在努力帮助我」。
SA: 是的。我认为主要是这两件事。
主持人: 在你们最近提出的「AI 行动计划」中,OpenAI 表达了对公司基于 DeepSeek 模型进行开发的担忧,这些模型是「免费可用」的。如果这真的是一个问题,那么解决方案难道不是让你们的模型也免费可用吗?
SA: 是的,我认为我们应该这样做。
主持人: 那么,什么时候——
SA: 我现在还不能宣布发布日期,但从方向上来说,我认为我们应该这样做。
主持人: 你之前说过,拥有 10 亿用户网站比模型更有价值。那么,这是否应该贯穿到你们的发布策略,以及你们对开源的看法中?
SA: 敬请期待。
主持人: 好的,我会期待的。没问题。
SA: 我不是在提前透露什么,但敬请期待。
主持人: 我想,接下来的问题是,这是不是一个机会,让你们回归最初的使命?如果你回顾一下最初的声明,DeepSeek 和 Llama……
SA: Ben,我正在努力给你尽可能多的暗示,但又不能直接说出来。拜托。
主持人: (好吧,没问题。公平,公平。有没有一种感觉,这让人感到解放?对吧?你回想一下那个 GPT-2 的公告,以及关于安全性和其他可能的问题。此时看起来有些老套。是否有一种感觉,秘密已经泄露?在这种情况下,对这些发布保持某种珍贵的态度有什么意义?
SA: 我仍然认为未来可能会有很大的风险。我认为我们过去太保守了是公平的。我也认为,在你不清楚情况的时候,稍微保守一点,这个原则并没有错。我还认为,在目前这个阶段,这项技术会扩散到各个领域,无论是我们的模型做了坏事,还是其他人的模型做了坏事,这又有什么区别呢?但怎么说呢,我还是希望我们能尽可能地做一个负责任的参与者。
主持人: 另一个最近的竞争对手是 Grok。从我的角度来说,在过去一年左右的时间里,我对于 AI 有过两次,我认为很有趣的心理体验。一次是在我的 Mac 上运行本地模型。出于某种原因,我很清楚地意识到它就在我的 Mac 上,没有在其他任何地方运行,这实际上是一种非常棒的感觉。另一次是使用 Grok,我不会觉得有什么“道德警察”会在某个时刻跳出来指责我。我认为,必须承认,ChatGPT 在这方面已经有了很大的改进。但是,Grok 是否让你觉得,实际上,我们可以在这方面走得更远,让用户像成年人一样(自由使用)?
SA: 事实上,我认为我们已经做得更好了。我认为我们之前在这方面确实做得不好,但在过去的六到九个月里,我认为我们已经有了很大的改进。
主持人: 我同意。它确实已经变得更好了。
SA: 这曾经是我对我们产品最关心的问题之一。但现在,怎么说呢,作为用户,我不会觉得困扰了,我认为我们已经做得不错了。所以,我过去经常思考这个问题,但在过去的六到九个月里,我没有再想过了。
成为一家消费科技公司是意外
主持人: 谈一下非营利组织的问题——有一种说法,你提到了那个「神话」。说你们成立非营利组织,是为了出于利他主义的原因,同时也是为了与谷歌竞争人才。仅仅是这样吗?
SA: 你是问,为什么选择成为非营利组织?
主持人: 为什么选择成为非营利组织,以及随之而来的所有问题?
SA: 因为我们当时认为我们只是一个研究实验室。我们根本没有想过我们会成为一家公司。我们当时的计划就是发表研究论文。没有产品,没有产品计划,没有收入,没有商业模式,也没有这些方面的计划。在生活中一直对我有帮助的一件事,就是在黑暗中摸索,直到找到光明。我们在黑暗中摸索了很长时间,然后找到了有效的方法。
主持人: 没错。但这个非营利组织的身份,现在是不是有点像套在公司脖子上的磨盘?如果可以重来,你会采取不同的做法吗?
SA: 当然。如果我能预知后来发生的一切,我们肯定会采用不同的组织结构。但我们当时并不知道,我认为走在创新前沿的代价,就是你会犯很多愚蠢的错误,因为你深陷战争迷雾之中。
主持人: 关于 ChatGPT,以及没有人预料到你们会成为一家消费者科技公司,我有一些更多的理论想和你探讨。这一直是我的观点:你们原本是一个研究实验室,当然,我们会发布一个 API,也许能赚点钱。但你提到了那六个月的扩张期,必须抓住这个从天而降的机会。科技界有很多关于员工流失的讨论,一些知名人士离开了,等等。
在我看来,似乎没有人是冲着成为一家消费产品公司而来的。如果他们想在 Facebook 工作,他们完全可以去 Facebook。这也是另一个核心的矛盾点:你们有了这个机会,不管你们想不想要,它就在那里。这意味着,这里的情况和最初已经大不相同了。
SA: 这么说吧,我没什么可抱怨的,对吧?我得到了科技行业最好的工作。如果我开始抱怨这不是我想要的,那对我是多么不幸等等,那就太不近人情了。我想要的是管理一个 AGI 研究实验室,弄清楚如何构建 AGI。
我真的没想过要经营一家大型的消费者互联网公司。我从之前的工作中就知道(那份工作在当时也是我认为科技行业最好的工作,所以我觉得自己非常、非常幸运,两次都得到了最好的工作),经营一家大型消费者公司需要投入多少精力,以及在某些方面有多么困难。
但我也知道该怎么做,因为我之前指导过很多人,也观察了很多。当我们发布 ChatGPT 的时候,每天都会有用户激增,导致我们的服务器崩溃。然后到了晚上,用户数量下降,大家都觉得,「这下完了,这只是一个短暂的病毒式传播」。然后第二天,峰值又升高了,然后又下降,「这下完了」。到了第五天,我就觉得,「哦,天哪,我知道接下来会发生什么了,我见过这种情形很多次了」。
主持人: 不过,你真的见过这种情形很多次吗?因为整个游戏的关键在于客户获取。对于很多初创公司来说,这就是最大的挑战。真正通过自然增长、病毒式传播来解决客户获取问题的公司,其实非常少。我认为,在这个领域,真正走在 OpenAI 前面的公司是 Facebook,那还是在 2000 年代中期。我觉得你可能高估了你之前见过这种情形的次数。
SA: 好吧,在这个规模上,确实,我们可能是最大的。我想,我们可能是自 Facebook 以来成立的规模最大的公司了。
主持人: 这种规模的消费者科技公司实际上非常罕见,这种情况并不经常发生。
SA: 是的。但我之前见过 Reddit、Airbnb、Dropbox、Stripe,还有很多其他的公司,它们都实现了这种惊人的产品市场契合,以及爆发式的增长。所以,也许我没有见过这种规模的。在当时,你并不知道它会发展到什么程度,但我之前见过这种早期模式。
主持人: 你有没有告诉过大家这将会发生?还是说,那是你根本无法传达的事情?
SA: 我确实告诉过大家。我把公司的人召集起来,说:「这将是非常疯狂的,我们有很多工作要做,而且必须尽快完成。但这是一个从天而降的绝佳机会,我们要抓住它,接下来会是这样……」。
主持人: 有没有人理解你或者相信你?
SA: 我记得有一天晚上我回家,双手抱头,感觉很沮丧。我说:「天哪,Oli [ Oliver Mulherin ],这太糟糕了」。他说:「我不明白,这看起来很棒啊」。我说:「这真的很糟糕,对你来说也很糟糕,你只是还不知道,但接下来会发生这些……」。但是,我想没有人真正理解。这是我之前经历的一个特殊之处,我能够很早就意识到这一点,但没有人能感受到最初几周会变得多么疯狂。
主持人: 五年后,什么会更有价值?一个拥有 10 亿日活跃用户网站,不需要进行客户获取,还是最先进的模型?
SA: 我觉得是 10 亿用户的网站。
主持人: 无论如何都是这样吗?还是说,因为至少在 GPT-4 这个水平上(我不知道你今天有没有看到,LG 刚刚发布了一个新模型),未来会有很多,我不知道,我不评论它的好坏,但未来会有很多最先进的模型。
SA: 我最喜欢的历史类比是晶体管,AGI 将会像晶体管一样。未来会有很多 AGI,它会渗透到各个领域,会变得很便宜。它是物理学的一个新兴属性,它本身并不能成为一个差异化因素。
主持人: 那什么会成为差异化因素?
SA: 我认为存在战略优势的地方,在于打造一家巨型的互联网公司。我认为这应该包含几个不同的关键服务。可能会有三四个像 ChatGPT 这样的产品,你会希望购买一个包含所有这些产品的捆绑订阅。你希望能够使用你的个人 AI 登录,它已经在你的生活中逐渐了解你,并且可以在其他服务中使用它。
我认为,未来会出现一些令人惊叹的新型设备,它们是针对你使用 AGI 的方式进行优化的。会有新型的网络浏览器,会有整个生态系统。总之,会有人围绕 AI 打造出有价值的产品。这是其中一个方面。
另一个方面是推理堆栈,也就是如何实现最便宜、最丰富的推理。芯片、数据中心、能源,会有一些有趣的金融工程要做,所有这些都包括在内。
然后,第三个方面是真正做出最好的研究,开发出最好的模型。我认为这是价值的「三驾马车」。但是,除了最前沿的模型,我认为大多数模型会很快商品化。
主持人: 所以,当 Satya Nadella 说模型正在商品化,OpenAI 是一家产品公司时,这仍然是一种友好的表态,你们仍然在同一条战线上,对吧?
SA: 是的,我不知道对大多数听众来说,这听起来像不像赞美,但我想他是想赞美我们。
主持人: 我是这么理解的。你问我对你们战略的解释,我在 ChatGPT 发布后不久就写过,这是一个「意外的消费者科技公司」。
SA: 我记得你写过那篇文章。
主持人: 这是最——就像我说的,这是科技行业最罕见的机会。我想,我在战略分析方面从 Facebook 身上获益良多,因为它是一个如此罕见的实体,我当时就认定了,「不,你们根本不知道这将走向何方」。但我直到 2013 年才开始,我错过了开端。我已经做了 12 年的 Stratechery,我觉得这是我第一次能够从一开始就报道的公司,而且是这种规模的。
SA: 这种情况并不经常发生。
主持人: 确实不经常。但是,说到这里,你们刚刚发布了一个重要的 API 更新,包括可以访问与 Operator(GPT Pro 的一个卖点)底层相同的「计算使用」模型。你们还发布了 Responses API。我认为 Responses API 最有趣的地方在于,你们说:「我们认为这比 Chat Completions API 好得多,但当然,我们会继续维护它,因为很多人已经基于它进行开发了」。它已经成为行业标准,大家都复制了你们的 API。什么时候,这些 API 相关的工作,以及维护旧版本、将新功能推送到新版本,会变成一种干扰和资源浪费?毕竟,你们面前有一个 Facebook 级别的机会。
SA: 我真的相信我刚才说的「产品套件」的策略。我认为,如果我们执行得非常出色,五年后,我们将会拥有一系列(少数几个)数十亿用户的产品。然后,我们有这样一个想法:你可以使用你的 OpenAI 账户登录到任何其他想要集成我们 API 的地方,你可以带着你的积分、你的定制模型,以及其他任何东西,去任何你想去的地方。我认为,这是我们真正成为一个伟大平台的关键。
主持人: 但是,这是 Facebook 遇到的难题。很难同时成为一个平台和一个聚合器(用我的术语来说)。我认为,移动设备对 Facebook 来说是件好事,因为它迫使他们放弃了成为平台的幻想。你不可能成为一个平台,你必须接受自己是一个带有广告的内容网络。广告只是更多的内容。这实际上迫使他们进入了一个更好的战略位置。
SA: 我不认为我们会成为像操作系统那样的平台。但是,我认为,就像谷歌并不真正是一个平台,但人们使用谷歌账户登录,人们把他们的谷歌内容带到网络的各个角落,这是谷歌体验的一部分。我认为,我们会以这种方式成为一个平台。
主持人: 携带登录信息,就是携带你的记忆、你的身份、你的偏好,以及所有这些东西。
SA: 是的。
主持人: 所以,你们只是凌驾于所有人之上。他们可以选择多个登录方式,而 OpenAI 的登录方式会更好,因为它包含了你的记忆?还是说,如果你想使用我们的 API,就必须使用我们的登录方式?
SA: 不,不,不。当然是可选的。
主持人: 你不认为,当你们面前有这样一个巨大的机会时,这会分散注意力,或者导致资源的分散吗?
SA: 我们确实需要同时做很多事情,这是困难的部分。我认为,在很多方面,是的,我觉得 OpenAI 最令人生畏的挑战之一,就是我们需要在很多事情上都做得非常好。
主持人: 嗯,这是「选择的悖论」。你们可以做的事情太多了。
SA: 我们并没有做很多,我们对几乎所有事情都说「不」。但是,如果你只考虑我们认为必须做的核心部分,我认为我们确实需要做很多,我不认为我们只做一件事就能成功。
「幻觉」也有意义
主持人: 有没有一种可能,「幻觉」其实是有益的?你发布了一个写作模型的示例,它在某种程度上印证了我长期以来的一个观点,那就是大家都在努力让这些概率模型表现得像确定性计算一样,几乎忽略了它们的魔力,也就是它们实际上是在「编造」内容。这其实是非常了不起的。
SA: 完全同意。如果你想要确定性的东西,你应该使用数据库。这里的亮点在于,它可以具有创造性,虽然有时它创造出的东西并不是你想要的。但这没关系,你可以再试一次。
主持人: 这是 AI 实验室的问题,是他们在试图这样做吗?还是说,这是用户期望的问题?我们如何才能让每个人都喜欢「幻觉」呢?
SA: 嗯,你希望它在你想要的时候产生「幻觉」,在你不想要的时候不产生「幻觉」。如果你问,「告诉我这个科学事实」,你希望那不是「幻觉」。如果你说,「给我写一个有创意的故事」,你希望有一些「幻觉」。我认为,真正的问题,或者说有趣的问题是,如何让模型只在对用户有利的时候才产生「幻觉」?
主持人: 你如何看待这个问题:当这些提示词被泄露出来时,它们会说诸如「不要透露这个」或「不要说这个」或「不要做 X、Y、Z」之类的话。如果我们担心安全性和对齐问题,那么教 AI 撒谎是不是一个非常严重的问题?
SA: 是的。我记得 xAI 曾经因为在系统提示中说了一些关于不要说 Elon Musk 的坏话之类的话而被狠狠地嘲笑。这对他们来说很尴尬,但我有点替他们感到难过,因为,模型只是在努力遵循给它的指示。
主持人: 对。它非常认真。
SA: 非常认真。是的。所以,没错,这样做很愚蠢,当然也很尴尬,但我不认为这是像大家所说的那种「崩溃」。
主持人: 包括我在内的一些怀疑论者,认为你呼吁监管的某些方面,是在试图阻碍潜在的竞争对手。我想问一个包含两部分的问题。第一,这样说公平吗?第二,如果「AI 行动计划」除了禁止州一级的 AI 限制,并宣布训练版权材料属于合理使用之外,没有做其他任何事情,这是否足够?
SA: 首先,我们一直以来呼吁的大部分监管,都只是针对最前沿的模型,也就是世界上最领先的模型,对这些模型进行一些安全测试的标准。现在,我认为这是一个好政策,但我越来越觉得,世界上大多数人并不认为这是一个好政策,我担心出现「监管俘获」。
所以,很显然,我有我自己的信念,但看起来,我们不太可能在全球范围内实现这一政策。我觉得这有点可怕,但希望我们能尽最大努力找到出路,也许一切都会好起来的。毕竟,没有多少人想要毁灭世界。
但可以肯定的是,你不会想给整个科技行业增加监管负担。我们呼吁的监管措施,只会影响到我们、谷歌,以及其他少数几家公司。再说一次,我不认为世界会朝着这个方向发展,我们会在现有的规则下竞争。但是,是的,我认为,如果能明确合理使用就是合理使用,并且各州不会有各种各样复杂且不同的法规,那将是非常、非常有益的。
主持人: OpenAI 能做些什么吗?比如说,如果 Intel 有一位新的 CEO,准备重新专注于 AI,你会承诺购买 Intel 生产的芯片吗?OpenAI 能在这方面提供帮助吗?
SA: 我认真思考过我们能为基础设施层和整个供应链做些什么。我目前还没有一个很好的想法。如果你有任何建议,我洗耳恭听。但我的确想做点什么。
主持人: 好的,当然。Intel 需要一个客户。这是他们最需要的,一个不是 Intel 的客户。让 OpenAI 成为 Gaudi 架构的主要客户,承诺购买大量的芯片,这将帮助他们。这将推动他们前进。这就是你的答案。
SA: 如果我们与一个合作伙伴合作开发芯片,这个合作伙伴与 Intel 合作,并且采用兼容的工艺,而且我们对他们的交付能力有足够高的信心,我们可以这样做。再次强调,我想做点什么。所以,我不是在回避问题。
主持人: 不,我也有些不公平,因为我刚刚告诉你,你需要专注于发展你的消费者业务,并切断 API。现在又让你关注维持美国的芯片生产,这确实不太公平。
SA: 不,不,不,我不认为这不公平。我认为,如果我们能做些什么来提供帮助,我们就有义务去做。但我们正在努力弄清楚具体要做什么。
AGI 没有统一标准,要能自主完成很多工作
主持人: Dario 和 Kevin Weil,我想,他们都曾以不同的方式说过,到今年年底,99% 的代码编写工作将实现自动化,这是一个非常快的时间表。你认为目前这个比例是多少?你认为我们什么时候会超过 50%?或者我们已经超过了?
SA: 我认为,在许多公司,现在可能已经超过 50% 了。但我认为,真正的突破将来自于自主编程代理,而目前还没有人真正做到这一点。
主持人: 障碍是什么?
SA: 哦,我们只是需要更多的时间。
主持人: 这是产品问题还是模型问题?
SA: 模型问题。
主持人: 你们还应该继续招聘软件工程师吗?我看到你们有很多职位空缺。
SA: 我的基本假设是,在一段时间内,每个软件工程师所能完成的工作量将会大大增加。然后,在某个时刻,是的,也许我们确实需要更少的软件工程师。
主持人: 顺便说一句,我认为你们应该招聘更多的软件工程师。我认为这是我的观点的一部分,我认为你们需要更快地行动。但是,你提到了 GPT-5。我不知道它在哪里,我们已经期待很久了。
SA: 我们两周前才发布了 4.5。
主持人: 我知道,但我们很贪心。
SA: 没关系。你不必等太久。新版本不会很久的。
主持人: 什么是 AGI?你有很多定义。OpenAI 也有很多定义。你目前,或者说最先进的 AGI 定义是什么?
SA: 我认为你刚才说的就是关键,AGI 是一个模糊的边界,包含了很多东西,而且这个术语,我认为,已经几乎完全贬值了。根据许多人的定义,我们可能已经实现了 AGI,特别是如果你能把一个人从 2020 年带到 2025 年,向他们展示我们所拥有的。
主持人: 嗯,很多年来,AI 一直都是这样。AI 总是指我们无法做到的事情。一旦我们能做到了,它就变成了机器学习。一旦你没有注意到它,它就变成了一个算法。
SA: 对。我认为,对很多人来说,AGI 指的是经济价值的一部分。对很多人来说,它指的是一种通用的东西。我认为它们可以很好地完成很多事情。对一些人来说,它指的是不会犯任何愚蠢错误的东西。对一些人来说,它指的是能够自我改进的东西,等等。只是没有一个很好的统一标准。
主持人: 那么代理呢?什么是代理?
SA: 能够自主运行,为你完成一大块工作的东西。
主持人: 对我来说,这就是 AGI。这是员工替代的水平。
SA: 但是,如果它只擅长某类任务,而不能做其他的呢?我的意思是,有些员工也是这样的。
主持人: 是的,我正在思考这个问题,因为这是一个彻底的重新定义。AGI 曾经被认为是无所不能的,但现在我们有了 ASI。ASI,超级智能。对我来说,这是一个术语问题。ASI,是的,可以做我们交给它的任何工作。如果我得到一个 AI,它能完成一项特定的工作,比如编程,或者其他任何工作,并且它能始终如一地完成,我可以给它一个目标,它能通过找出中间步骤来实现这个目标。对我来说,这是一个明显的范式转变,与我们目前的状态不同,我们现在仍然需要在很大程度上指导它。
SA: 如果我们有一个出色的自主编程代理,你会说,「OpenAI 做到了,他们实现了 AGI」吗?
主持人: 是的。这就是我现在对它的定义。我同意,这几乎是对 AGI 过去含义的一种弱化。但我只是用 ASI 来代替 AGI。
SA: 我们是不是可以得到一个 Ben Thompson 的小金星,贴在我们的墙上?
主持人: (笑)当然,给你。我会把我的电路笔给你。
SA: 太好了。
主持人: 你和这些实验室的同事们谈论你们所看到的东西,以及没有人准备好,还有各种各样的推文在流传,让人们兴奋不已,你在这个播客中也透露了一些暗示。非常令人兴奋。但是,你已经谈论这个问题很久了。你看看这个世界,在某些方面,它看起来还是一样的。是你们的发布没有达到你的预期,还是你对人类吸收变化的能力感到惊讶?
SA: 更多的是后者。我认为,有几次,我们做了一些事情,真的让世界震惊,大家会说,「这……这太疯狂了」。然后,两周后,大家又会问,「下一个版本在哪里?」
主持人: 嗯,我的意思是,你们的最初策略也是如此,因为 ChatGPT 让大家大吃一惊。然后,ChatGPT-4 在不久之后发布,大家又会说,「哦,天哪。我们的发展速度有多快啊?」
SA: 我认为我们已经发布了一些令人难以置信的东西,我认为人们能够适应,并且只是想要更多、更好、更快、更便宜的东西,这实际上是人类的一个伟大特质。所以,我认为我们已经超额交付了,而人们只是更新了他们的认知。
主持人: 鉴于此,这让你更乐观,还是更悲观?你是否看到了我认为将会出现的这种分化,也就是在「能动性」的人(这是「能动性」的另一种含义,但看看我们要往哪里走。我们需要发明更多的词。我们可以让 ChatGPT 为我们「幻觉」出一个)和那些会去使用 API 的人之间的分化?
整个微软 Copilot 的理念是,你有一个助手陪伴你,有很多高谈阔论,「哦,它不会取代工作,它会让人们更有效率」。我同意,对于一些主动使用它的人来说,情况会是这样。但是,你回顾一下,比如说,PC 的历史。第一波 PC 的使用者是那些真正想要使用 PC 的人。很多人并不想用 PC。他们在桌上放了一台 PC,他们必须使用它来完成特定的任务。实际上,你需要一代人的转变,才能让人们默认使用 PC。AI,这是真正的限制因素吗?
SA: 也许吧,但这没关系。就像你提到的,这对于其他的技术变革来说是很常见的。
主持人: 但是,你回到 PC 的例子,实际上,IT 的第一波浪潮是大型机,消灭了整个后台部门。因为实际上,事实证明,第一波浪潮是工作替代的浪潮,因为自上而下的实施更容易。
SA: 我的直觉是,这一次的情况不会完全一样。但我认为,预测总是非常困难的。
主持人: 你的直觉是什么?
SA: 它会慢慢渗透到经济中,主要是逐渐地蚕食一些东西,然后速度越来越快。
主持人: 你经常提到科学突破是投资 AI 的一个理由。Dwarkesh Patel 最近提出了一个观点,那就是目前还没有任何科学突破。为什么没有?AI 能否真正创造或发现新事物?还是说,我们是否过于依赖那些实际上并不那么优秀的模型,这才是真正的问题?
SA: 是的,我认为模型还不够智能。我不知道。你听到人们使用 Deep Research 时说,「好吧,模型并没有独立发现新的科学,但它确实帮助我更快地发现新的科学」。对我来说,这几乎一样好。
主持人: 你认为基于 Transformer 的架构能否真正创造新事物,还是说它只是在输出互联网上的中等水平的内容?
SA: 是的。
主持人: 嗯,那突破点会在哪里?
SA: 我的意思是,我认为我们正在前进的道路上。我认为我们只需要继续做我们正在做的事情。我认为我们就在这条路上。
主持人: 我的意思是,这是对上帝的终极考验吗?
SA: 怎么说?
主持人: 人类是否具有与生俱来的创造力,还是说创造力只是以不同的方式重新组合知识?
SA: 我最喜欢的书之一是 David Deutsch 的《The Beginning of Infinity》。在那本书的开头,有几页非常精彩地描述了创造力就是把你之前看到的东西稍微修改一下。然后,如果从中产生了好的结果,其他人会再稍微修改一下,其他人还会再稍微修改一下。我有点相信这种说法。如果是这样的话,那么 AI 擅长稍微修改东西。
主持人: 在多大程度上,你能够相信这种观点的基础,是你长期以来的信念,而不是你观察到的东西?因为我认为这是一个非常有趣的——我不想讨论太高深的形而上学,或者,就像我说的,几乎是神学的问题——但似乎确实存在这样一种情况,一个人的基本假设会影响他对 AI 可能性的假设。然后,大多数硅谷人都是唯物主义者、无神论者,或者你怎么称呼他们。所以,当然,我们会弄清楚的,这只是一个生物功能,我们可以在计算机中重现它。如果事实证明,我们从未真正创造出新事物,而是增强了人类创造新事物,这会改变你的核心信念体系吗?
SA: 这绝对是我以前的核心信念体系的一部分。这些都不是什么新鲜事。但是,不,我会假设我们只是还没有找到正确的 AI 架构,在未来的某个时候,我们会找到的。
AI 时代,给年轻人的职业建议
主持人: 最后一个问题是代表我女儿问的,她今年高中毕业。对于高中毕业生,你有什么职业建议?
SA: 最明显的、具体的建议就是,熟练掌握 AI 工具。就像我高中毕业的时候,最明显的、具体的建议是熟练掌握编程。这是新版本的建议。
更广泛的建议是,我认为人们可以培养韧性和适应能力,以及弄清楚别人想要什么,以及如何对他人有用的能力。我会去实践这些。比如,无论你学习什么,具体的细节可能并不那么重要。
也许它们从来都不重要。我在学校学到的最有价值的东西是学习的「元能力」,而不是我学到的任何具体的东西。所以,无论你要学习什么具体的东西,都要学习这些看起来在世界经历这场转型时会很重要的通用技能。