智东西
编译 陈骏达
编辑 Panken
智东西12月20日消息,近日,微软CEO萨提亚·纳德拉(Satya Nadella)接受了播客BG2近90分钟的深度专访,采访文字实录超2万字,从微软的兴衰成败,聊到AI圈热门风口,又从企业文化变革,聊到投资OpenAI等重大决策背后的考量,堪称他近年来最深入、最全面的几场访谈之一。
今年是纳德拉加入微软的第32年,也是他成为该公司CEO的第10年。2014年时的微软正处于失势状态,已陆续错过搜索引擎、移动互联网等重要机遇,逐渐成为一家“无关紧要”的公司。纳德拉意识到微软因“傲慢”而衰败,于是引入成长型思维,凭借内部人身份掀起自我革命,带领Azure杀入当时由AWS主导的云计算市场,又成功押中AI这一趋势。
在此次访谈中,纳德拉非常敢说,不管是反省微软昔日重大失误、自述与OpenAI CEO Sam Altman分歧,还是预测接下来的AI关于基础设施建设、消费级业务、渠道分发、企业级API业务、Agent(智能体)、算力投资、最大模型训练竞赛等方面的发展趋势,而且全程频频爆出金句:
“从古希腊到现代硅谷,只有一件事会导致文明、国家和公司的衰落,那就是傲慢。”
“谷歌在Windows上赚的钱比整个微软还多。”
“有时失去反而是好事,因为你可以重新赢回一切。”
“这一个时代最具代表性的公司已经诞生了,那就是OpenAI。”
“我们和OpenAI有整整两年的先发优势,······,再也不会有其他企业能获得这样的优势了。”
“不要站在Scaling Law的对立面。”
“预训练还没有终结,······,推理时计算本质上是另一种形式的Scaling Law。”
“(OpenAI o1)是一个能创造巨大经济价值的商业模式。”
“不要去做单纯的(算力)供给侧建设。”
“AI智能体时代,传统商业应用的存在形式可能会发生根本性的改变。”
除此之外,纳德拉还透露,谨慎是微软AI Infra投资的关键词,他们不会轻举妄动、大肆采买,除非新款GPU能带来极为显著的效益提升。这也是他与OpenAI CEO Sam Altman的一个分歧点。
谈及智能体这一风口,他认为记忆、工具使用、权限管理这三大要素或将成为智能体未来发展的关键动能,目前此项技术已在B端的客服、编程等业务上展现出强大的生产力,但落地开放式的C端场景仍需1-2年。
目前微软与OpenAI既是投资方与被投资方,也是合作伙伴,还处于竞合的关系,上述关系让微软无论如何都能从OpenAI的成功中分一杯羹。纳德拉称微软不会干涉OpenAI营利化转型、上市等决定,稳定的合作对双方都有益处。
以下是对纳德拉本次访谈的完整编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改):
一、出于嫉妒心做事不可取,把握自身定位与优势很关键
Brad Gerstner:
很高兴能和你见面。你担任CEO的这段历程真是让人惊叹不已。1992年你加入微软,2007年你接管了在线业务,2009年你推出必应搜索。2011年,你接管服务器业务并推出了Azure。2014年你成为CEO,就在那之前,一篇现在广为人知的文章《微软的无关性》刚刚发表。
从那时起,你把Azure的年化收入从10亿美元提升到了660亿美元,公司总收入增长了2.5倍,总利润增长超过3倍,股价上涨了近10倍。你为微软股东创造了近3万亿美元市值的神话。
回顾过去十年的历程,你认为当时你能做出的最关键的一个改变是什么?是什么样的决策让微软实现了如此巨大的转变,取得了这样非凡的成功?
Satya Nadella:
虽然说2014年我担任CEO是个重要的转折点,但我也一直认为,从92年到现在是一个持续不断的过程。
我的做法其实很简单,就是总结分析我们成功和失败的经验、规律,然后多做那些成功的事,少做那些失败的事。这听起来很简单,因为我亲身经历了整个过程——我1992年加入微软时,正好是Windows 3.1刚刚发布不久。
不久之后,互联网时代来临,我们成功实现了转型,在很多方面都做出了正确的决策。我们很早就意识到了浏览器的战略价值。通过不断竞争,我们最终在浏览器领域取得了成功。
我们错过了搜索引擎这个机会。当时我们觉得浏览器才是最重要的,没有意识到一个新的品类正在兴起。搜索引擎才是互联网的组织层。我们在移动领域也有所尝试,但没能把握住机会,iPhone的出现改变了一切。不过我们在云计算上做对了选择。回顾这些历程,可以说现在我们正面临第四波浪潮——AI。
在所有这些案例中,我认为不能因为别人成功了就盲目跟随。有时快速跟进策略是可行的,但决不能出于嫉妒心理去行动。
这是我们学到的最宝贵的经验之一。做一件事,是因为你有这个资格,而且你能做得更好。正如Jeffrey Moore曾对我说的那句话:“为什么不去做你的客户期望你做的事呢?”
我很认同这个观点。云计算就是一个很好的例子。我记得当我刚开始负责Azure时,很多人都告诉我说:“这是一个赢家通吃的市场,亚马逊已经全部占据了。”
但我从不相信这种说法,因为我曾在服务器领域与甲骨文和IBM竞争。我始终认为,基础设施领域永远不会是赢家通吃的市场。你需要做的就是带着独特的价值主张参与竞争。
对我而言,这些转型的关键在于准确认识自己的市场定位。你要深入理解在哪些领域你获得了合作伙伴和客户的支持与信任,然后从那些显而易见的机会开始着手。
你可以说这就是战略的基本要素,但我认为这确实是最关键的。还有一些需要培养的东西,包括使命感、目标感、企业文化等。这些要素都至关重要,是获得成功的必要条件。但说到底,通过准确把握自身定位和优势来制定正确的战略,这可能是我做得比较成功的地方。
二、因“自以为是”而衰败,成长型思维助力微软重生
Bill Gurley:
世界各地每天都有新的CEO上任,但很多都以失败告终。就拿英特尔来说,他们现在就正在进行第二轮重组。你上任时有人认为微软的黄金时代已经结束了,那么你做了什么来改变这点呢?你会建议其它公司新上任的CEO如何重启公司文化,让它朝不同的方向发展?
Satya Nadella:
是的,我认为我的一个优势在于我是一个彻头彻尾的“内部人”,我几乎整个职业生涯都在微软度过。所以从某种意义上说,我要批评公司文化,也等于是在批评我自己。
这让我获得了一个突破点——我的批评不像是一个外部人对内部员工的指责,而更像是对自己的反思,因为我本身就是这种文化的一部分。
我不能评论任何与我无关的事情。我清楚地记得,当微软第一次成为市值最高的公司时,我在园区里走动时看到我们所有人,包括我自己在内,都趾高气扬地走来走去,仿佛我们是人类最伟大的发明,好像市值终于体现了我们的才华横溢。
这种情景一直萦绕在我脑海中,让我意识到这正是我们要避免的文化。因为就像我常说的,从古希腊到现代硅谷,只有一件事会导致文明、国家和公司的衰落,那就是傲慢。
我获得的另一个重要突破是,在我成为CEO前几年,我妻子向我推荐了Carol Dweck写的一本关于成长型思维的书。当时我读这本书主要是为了孩子的教育和育儿等方面的参考。
我当时就想,天哪,这真是太棒了。我们总是在谈论学习和学习文化,而这个理念恰恰是我们能选择的最好的文化基因。我认为我们在文化方面的很多成功都要归功于这个理念。
这个理念还有一个好处,它既不是微软的商标,也不是CEO提出的什么新教条。它是一个关于工作和生活的普世价值。它能帮助你成为更好的父母、更好的伴侣、更好的朋友、邻居、管理者和领导者。
所以我们选择了这个理念。我总是用一句简单的话来概括它,从“自以为是”转变为“永远学习”。这是一个永远无法到达的目标,因为从定义上来说,当你说“我已经有成长型思维了”的那一刻,就意味着你已经失去了成长型思维。
这对我们帮助很大。就像所有的文化变革一样,你必须给它时间、空间和生长的土壤。它需要自上而下和自下而上的共同推动。它会在组织中间层形成共识。我和公司开会,甚至是和高管团队开会,每次都会从使命文化开始。
这是两个基本支柱。另外,我对自己的框架保持着高度的纪律性。在过去将近11年的时间里,我们整体的发展轨迹基本保持不变。
三、微软AI错失大幅投入机遇,放走辛顿、李开复团队
Brad Gerstner:
你提到了我们经历的技术变革浪潮。我听说过你的观点——作为一家大型平台公司,在技术变革初期的三四年内确立市场地位至关重要,这段时间往往决定了公司能够获取的大部分价值。
你的观点是,微软错失了搜索市场,也基本错过了移动时代,好在赶上了云计算的末班车。当你开始思考下一个重大技术变革时,你和团队成员(包括Kevin Scott,微软CTO)似乎很早就察觉到,由于有DeepMind的存在,谷歌在AI领域可能已经领先了。
你最终决定投资OpenAI。是什么让你确信这个方向是对的?特别是考虑到微软当时已经有了内部的AI研究项目。
Satya Nadella:
这是一个很好的观点,这个考量背后涉及几个方面。首先,我们在AI领域已经深耕多年。显然,当盖茨在1995年创建微软研究院(MSR)时,他就一直对自然用户界面充满热情。
我记得第一个研究小组是语音组。Rick Rashid(微软研究院创始人之一)加入了我们。李开复也曾在这里工作。我们投入了大量精力,致力于突破自然用户界面。语言一直是我们关注的重点。甚至连Geoffrey Hinton也曾在这里工作。
他在MSR做访问学者期间完成了一些深度神经网络(DNN)的早期研究工作,后来谷歌把他招走了。不得不说,在2010年代初期,当谷歌加大AI投入并收购DeepMind时,我们错失了一些本可以大幅投入的机会。
这确实让我感到很惋惜。我一直想的还是要保持专注,比如说,Skype翻译就是我最早关注的项目之一,因为它真的很酷。那是我们第一次看到迁移学习发挥作用,对不对?
你可以用一对语言来训练它,它在另一种语言上的表现就会变得更好。那是我们第一次能够说,哇,机器翻译也可以和DNS结合。
从那时起,我就和凯文就一起对语言产生了浓厚的兴趣。说到第一次接触,其实是Elon和Sam在寻找Azure积分之类的资源时主动找了我们。
我们给了他们一些Azure积分。那时他们主要在研究强化学习和Dota 2这类项目。这些项目很有意思,但后来我们暂停了合作,具体原因我现在也记不太清了。之后他们找到我,谈起他们在语言方面的构想。
那是一个关键时刻,他们开始谈论Transformer模型和自然语言处理。我一直认为这就是我们的核心业务所在。这也体现了我的思维方式——我们需要思考自己的结构性定位是什么。
盖茨经常强调,数字世界其实只有一个核心范畴,就是所谓的信息管理。在他看来,我们需要对世界建立模式化的理解——将人、地点、事物都纳入一个统一的模式体系。
我们尝试了很多方法,其中包括微软一个臭名昭著的项目WinFS,其目标就是要将所有事物都模式化,从而理解所有信息。
但这个目标实际上是不可能实现的,因此我们需要寻求突破。如果模型能在架构方面实现非线性突破,就能展现出一些前所未有的特性。
我们认为,也许实现这一目标的方法在于如何进行模式化。毕竟,人类大脑就是通过语言、内部对话和推理来实现这一点的。
正是基于这些考虑,再加上Sam、Brockman(时任OpenAI CTO)及其团队展现出的雄心,我选择了与OpenAI合作。
还有一个重要因素是Scaling Law。有趣的是,我读到的第一份关于Scaling Law的备忘录,是由当时还在OpenAI的Dario(原OpenAI高级研究副总裁,现Anthropic CEO)和Ilya(原OpenAI首席科学家,现独立创业)撰写的。
我那时候就说了,我们在这个方向上下注吧。如果这项技术真的能带来指数级的性能提升,为什么不全力以赴,给它一个真正的机会呢?后来,当我们看到它在GitHub(代码托管平台,已被微软收购)、Copilot(微软AI助手)等项目上的实际效果时,加大投入的决定就变得水到渠成了。这就是我的直觉判断。
四、超大规模计算不会赢家通吃,但需密切关注增量价值新玩家
Bill Gurley:
我认为在之前的技术变革中,一个普遍现象是一些在位者没有及时跟上变革的步伐。你也提到过微软可能错失了移动和搜索等机遇。作为一个见证了多次技术变革的行业老兵,我认为这一次所有人都高度警觉。
这是各方最为警觉的一次。整个局面都被精心布局,几乎所有玩家都同时站在了起跑线上。我很好奇你是否同意这个观点,以及你如何看待这场竞赛中的主要参与者——谷歌、亚马逊、拥有Llama的Meta,以及新加入的马斯克。
Satya Nadella:
是的,这确实很有趣。关于你说的这点,我一直在思考。如果回顾90年代末,当时是微软一家独大,其他公司都望尘莫及。有趣的是,现在人们谈论的是科技七巨头。
实际上,现在意识到AI重要性的公司远不止这些。这些公司都拥有雄厚的财务实力。我想说的是,如果把OpenAI也算上,可能应该叫科技八巨头,因为从某种意义上说,这一个时代最具代表性的公司已经诞生了,那就是OpenAI。
它就像这个时代的谷歌、微软或Meta。基于这些情况,我认为竞争会非常激烈。同时,我也不认为这会是一个赢家通吃的局面。
因为虽然某些细分领域可能会出现赢家通吃的情况,但在超大规模计算绝对不会赢家通吃。即使不考虑中国市场,世界也需要多个分布在各地的供应商。
事实上,我认为微软最大的结构性优势之一就在于Azure的独特架构。我们针对企业工作负载的特点构建了Azure,在数据驻留方面做了大量工作,建立了超过60个区域云数据中心,比其他公司都多。
我们不是为了某个大型应用而建云,而是为众多异构的企业工作负载构建云平台。从长远来看,我认为所有与数据、应用服务器相关的推理需求都将集中在这里。
因此,我认为在基础设施层面会有多个赢家,在模型层面也是如此,每个超大规模提供商都会拥有一系列模型,周围会有应用服务器。就像今天的每个应用,包括Copilot在内,都是一个多模型应用。
实际上,这催生了一种全新的应用服务器。就像之前有移动应用服务器、Web应用服务器一样,现在我们有了AI应用服务器。对我们来说,这就是Foundry(指微软的Azure AI Foundry开发平台),我们正在构建它,其他公司也会构建自己的版本。这样的服务器会有很多。
在应用层面,我认为网络效应会更加明显,这种效应一直都存在于软件层。在消费者领域、企业领域等不同场景中会形成不同的网络效应。
回到你的核心观点,我认为需要按层次进行结构性分析。在技术栈的不同层面,我们这7-10家公司之间会展开激烈竞争。我经常对团队说,要密切关注那些能带来增量价值的新玩家。
这就是我们所处的竞争环境,我们总是在寻找可能突然崭露头角的新创业者。至少可以说,OpenAI就是这样一家公司,现在已经达到了突破性的发展速度。
五、我们过去输得太惨,反而成为增长机遇
Brad Gerstner:
让我们先谈谈应用层面,从消费者AI说起。Bing(必应搜索)是一个规模很大的业务。我们都讨论过“十个蓝色链接”(代指搜索)可能是资本主义历史上最好的商业模式,但它已经发生了巨大的转变。
在这个重视答案的时代,Bing需要做什么,或者说Mustafa(微软AI CEO)领导下的消费者业务需要做什么,才能与ChatGPT竞争?从消费者角度来看,ChatGPT似乎已经取得了突破性进展。
Satya Nadella:
我认为首先要说的就是你最后提到的,聊天与答案的结合。这就是ChatGPT,而且它正在变得“有状态”。传统搜索是一个无状态的产品,虽然传统搜索也有搜索历史,但我认为这些AI智能体会变得更有情景感知能力。这也是为什么我如此兴奋的原因。
我花了将近10年时间试图与苹果达成搜索协议。所以当Sam最终与Tim(Tim Cook,苹果CEO)达成协议时,我是最兴奋的人,因为让ChatGPT获得这个协议比其他任何公司都好,毕竟我们与OpenAI有商业和投资关系。
说到这一点,我的看法是,分发渠道非常重要。这正是谷歌具有巨大优势的地方——他们在苹果设备上是默认搜索引擎,在Android上也是默认选择。
他们触及了如此广泛的用户群,而且用户习惯也不会轻易改变。想想看,你打开浏览器时会直接在地址栏输入搜索内容的次数有多少?
如果要比较Bing和Copilot,情况很有趣。一些导航类的需求,我会用Bing,但几乎所有其他需求,我都会用Copilot。我认为这种转变正在全球范围内发生。我们可能还需要一两个专门用于购物或旅行的AI智能体,就能处理一些商业店铺的查询之类的工作。
我认为,当商业也开始向聊天迁移时,传统搜索的转折点就会到来。目前,传统搜索业务之所以能够维持,是因为商业意图还没有迁移。一旦商业意图开始迁移,变化就会突然发生。
我认为,这确实是一个根本性的转变。在Mustafa负责的领域,我们有三个产品,Bing、MSN(微软门户网站)和Copilot。事实上,他对这三个产品都有清晰的定位。
它们都属于同一个生态系统。一个是信息流,一个是传统意义上的搜索,另一个是这个新的AI智能体界面。它们都与内容提供商有某种社会契约——我们需要流量,可能需要付费墙,我们需要有广告支持的商业模式等等。这就是我们试图实现的目标。
我们有自己的分发渠道,Windows仍然是我们的一大优势。我们有机会重新争取。我们失去了浏览器市场——Chrome成为主导浏览器确实是一个遗憾,因为我们战胜了Netscape(网景浏览器),却输给了谷歌。
现在我们正通过Edge和Copilot,以一种有趣的方式夺回失地。你猜怎么着?现在就连Gemini也必须努力争取用户。Windows的好处在于它是一个开放的系统,这意味着ChatGPT有机会。
Gemini也有机会。不需要打电话给微软,你可以尽最大努力做到最好,但这也意味着我们同样有机会。有时失去反而是好事,因为你可以重新赢回一切。
即使是Windows分发渠道也还有很大的增长空间。我常说谷歌在Windows上赚的钱比整个微软还多,真的是这样。
这对微软的股东来说反而是个好消息——我们输得如此惨,现在反而有机会重新竞争并赢回一些市场份额。
六、担忧智能体安全风险,客户应保有最终决定权
Bill Gurley:
现在每个人都在谈论AI智能体。如果你稍微展望一下未来,就能想象到各种参与者都希望在系统上操控其他应用和数据。
微软处在一个很特殊的位置,因为你们掌控着Windows生态系统,但同时也在iPhone和Android生态系统上有应用。
从服务条款和合作伙伴关系的角度来看,你是如何看待这个问题的?苹果会允许微软控制iOS上的其他应用吗?微软会让ChatGPT在Windows系统上启动应用并获取应用数据吗?当你开始思考搜索和商务时,这个问题就变得更加复杂了。
Satya Nadella:
这个问题目前还没有明确的答案。我们可以用一种比较传统的思维方式来看待这个问题。回想一下,各种商业应用是如何实现互操作性的——它们是通过连接器来实现的,用户需要获得连接器许可。
这就形成了一种商业模式。SAP(企业管理解决方案软件)就是一个最典型的例子——只要你有连接器,就可以访问SAP的数据。所以我觉得,当智能体之间需要交互时,可能会出现类似的模式。
在消费者领域,情况就不那么明朗了。因为消费者领域的价值交换主要依赖广告和流量等因素。在智能体主导的世界里,这些因素中的一些可能会消失。所以对我来说,消费者端的商业模式还不太清晰。
但在企业领域,我认为未来的发展方向是这样的,每个参与者都会说:“要想在我的行动空间内执行操作,或者从我的数据架构中获取数据,你需要获得我的智能体接口的授权。”
这就是为什么,比如说现在,当我使用微软的Copilot时,我可以连接到Adobe、我的SAP实例,当然还有我们的CRM(客户关系管理)系统Dynamics。
想想看,我们上一次真正使用商业应用是什么时候?我们购买了这么多SaaS应用的许可,却很少使用它们。组织里可能只有某些人在往里面输入数据。但在AI时代,使用强度会提高,因为所有数据都变得容易获取了。
你可以随意查询。我可以直接说:“嘿,我要和某某人开会,给我说说所有相关的公司和基准数据。”系统会把网络上的信息、CRM数据库里的内容都整合在一起,给我一份简报。
所以在某种程度上,我认为这些功能都可以被我们和这些连接器提供商做成商业化的产品。
Bill Gurley:
你会允许ChatGPT在Windows操作系统上随意打开应用程序吗?
Satya Nadella:
这是一个很有意思的问题,对吧?那么这种超级用户级别的使用权限,谁来授权呢?是用户还是操作系统?就拿Windows来说,说实话,除了设置一些安全防护措施外,我们也没有太多办法来限制。
我最担心的就是安全风险。如果恶意软件被下载并开始执行各种操作,那才是真正危险的。我认为这些是我们需要在操作系统层面解决的问题,也就是对这类计算机使用行为设置更严格的访问权限和特权控制。
但归根结底,在Windows这样的开放平台上,用户才是最终的掌控者。我相信苹果和谷歌会采取更严格的控制措施,他们不会允许这种情况发生。从某种意义上说,这可以算是他们的一个优势,不过这也要取决于反垄断法规如何规定。总之,这是一个值得关注的话题。
Bill Gurley:
我们可以换个角度思考这个问题。你会允许Android操作系统,或者说Android AI、iOS AI通过智能手机上的微软客户端来读取邮件吗?
Satya Nadella:
这个问题很有意思。我经常在思考一个问题,我们将Outlook的同步功能授权给苹果的Mail应用,这到底是价值流失还是帮助了我们?
这是一个很有趣的案例。虽然可能确实流失了不少价值,但这也是我们能够保住Exchange(微软电子邮件服务组件)的重要原因之一。如果当时没有这样做,我们可能会面临更大的问题。
说到这一点,Bill,如果我们要构建这样的系统,关键是我们必须围绕着Microsoft 365(基于Office套件的办公软件解决方案)建立一个信任体系。我们不能随便让AI智能体进来为所欲为,因为说到底,这些数据并不属于我们。这些都是客户的数据。
因此,需要客户的许可,需要客户IT部门的许可。这不是我能简单通过设置一个开关就能解决的。另外,还必须要有明确的信任边界。
我认为我们会采取一种很有趣的方式,有点类似于Apple Intelligence现在的做法。你可以理解为我们会在Microsoft 365的框架下来实现这一点。
七、三大要素助力智能体腾飞,消费者场景落地仍需时日
Brad Gerstner:
说到这个,Mustafa说2025年将是无限记忆的元年。从今年年初开始,我俩就一直在讨论,我们认为ChatGPT的下一个革命性突破就是将持久记忆与代表用户执行操作的能力结合起来。你好像也同意这个观点。
我们已经看到记忆功能的雏形,我也很确信到2025年,这个问题应该能得到很好的解决。但说到执行操作这个问题,我什么时候才能对ChatGPT说:“帮我订下周二西雅图四季酒店最便宜的房间”?
看上去AI使用计算机是最早的测试场景。你怎么看?从现在的角度来看,这对你来说是个难题吗?
Satya Nadella:
是的,完全开放的操作空间仍然是个难题。但就像你说的,除了我们肯定会讨论的模型扩展规律和基础模型能力之外,还有两到三件非常令人兴奋的事情。
第一是记忆。第二是工具使用,也就是行动能力。第三个我要说的是权限管理。比如说,你能做什么,你有什么权限?这也是为什么Purview(微软的数据治理工具,用于管理AI系统的数据访问权限与合规性)成为了微软内部最有趣的产品之一。
智能体可以获取什么?如何确保它们能够安全地访问各种资源?需要有人对此进行管理和监督。如果把上述三个要素结合起来,AI助手就会更容易管理,而且在执行操作时是可验证的。我认为这就能开启一个全新的自主工作时代。
我一直很喜欢将Copilot作为AI的用户界面,因为即使在一个完全自主的世界里,AI助手也会不时地遇到异常情况,需要请求许可和调用权限等。因此,这个用户界面层将成为组织层。这也是为什么我们将Copilot视为工作、工作内容和工作流程的组织层。
回到你的核心观点,即使是4o模型(更不用说o1了)在函数调用方面已经相当不错。在企业环境中你可以做的事情比消费者环境多得多,因为消费者网络的函数调用很复杂。
在开放的网络环境中,最多只能对少数几个网站实现这种功能。一旦你提出“帮我订张票”这样开放性的要求,如果后端架构发生变化,系统就可能会出错。当然,这些都是可以教会它的。如果是在Rails上使用可验证、可自动评分的流程,我认为o1模型在这方面还能做得更好。
我们可能还需要1-2年的时间才能实现更多功能。但至少从企业角度来看,已经可以部署销售助手、营销助手、供应链助手等,让它们执行更多自主任务。
我们在Dynamics中已经内置了10到15个这样的助手。它们可以查看和自动处理供应商沟通、更新数据库、管理库存等。我认为这些都是现在就可以实现的功能。
Bill Gurley:
Mustafa提到了近乎无限的记忆这个概念,我相信你在内部也听说过。你能对此做些澄清吗?还是说这方面还有更多内容要展开?
Satya Nadella:
关键在于拥有一个记忆的类型系统,而不是每次开始时都要重新组织一遍。
Bill Gurley:
我理解这个概念。不过听Mustafa的说法,好像你们在这方面已经有了内部技术突破。
Satya Nadella:
是的,我们甚至有一个开源项目。我记不太清了,好像是之前做TypeScript的那群人在负责这个项目。我们想要做的是把记忆系统模式化,让它变得可用。
比如说,当我输入一个新的提示时,系统能够根据我之前所有的操作,通过类型匹配等方式进行聚类。这是构建记忆系统的一个很好的方法。
八、微软AI拥有两年先发优势,将始终保持谨慎
Brad Gerstner:
那我们来谈谈企业AI吧。据报道,微软的AI业务规模已经达到了100亿美元。你提到这些都来自于推理计算,而不是把原始GPU租给其他人用于训练,因为你们自己的推理需求就已经很高了。
关于这一点,我觉得外界对AI的主要工作负载是否真的在变化还存在很多质疑。我很想听听你的看法,目前人们使用的主要创收产品有哪些?它们是如何推动你们的推理收入的?这与亚马逊或谷歌相比有什么异同?
Satya Nadella:
这个问题问得好。对我们来说,我们与OpenAI的大部分训练工作更多是一种投资逻辑。这部分不会体现在我们的季度业绩中,而是会计入基于投资的其他收入项目。
Brad Gerstner:
这意味着在财报上只会显示为其他收入或损失项,对吧?
Satya Nadella:
是的,目前就是这样显示的。我们的收入基本都来自API业务。就像你说的,ChatGPT的推理成本也在其中,这是另外一块。
这个时代最成功的应用是什么?ChatGPT、Copilot、GitHub Copilot,以及OpenAI和Azure OpenAI的API。从某种意义上说,如果要列出10个最成功的AI应用,这些可能就占了其中的4-5个。这就是最大的增长动力。
我们和OpenAI有整整两年的先发优势,基本上没有遇到任何竞争。现在每个人都醒悟过来了,我觉得可能再也不会有其他企业能获得这样的优势了。
不过谁知道呢?或许你刚这么说,可能就有人突然发布了一些Demo,就做到了。话说回来,我认为用某个基础模型建立这种领先优势的可能性不大。我们确实抓住了之前的这个机遇,这就是我们与OpenAI合作带来的巨大优势。
OpenAI确实通过ChatGPT实现了这种突破性的发展。而在API方面,我们最大的收获是获得了像Shopify、Stripe或Spotify这样的客户。这些公司原本都不是Azure的客户,他们都是GCP或AWS的客户。我们突然获得了更多所谓的数字原生公司,他们开始以各种方式使用Azure。这是一个方面。
至于传统企业市场,我认为正在逐步扩大。一方面人们在使用Copilot,另一方面又在用Foundry构建AI智能体。这些都是在设计和项目层面上取得的成功,虽然进展缓慢,但正在逐步扩大规模。再强调一下,我们在这方面有两年的先发优势,这让我对这项业务更有信心。
大量科技创业公司都在寻求小批量的H100配额,这也是目前业内逆向选择问题的原因之一。想到太阳微系统在互联网泡沫时期的遭遇,我一直对此心存顾虑,我们不能盲目地追逐每家想要构建模型的企业。
事实上,即使在投资者这边,我也看到观念正在发生变化。现在人们更倾向于轻资产运营,选择在他人的模型基础上进行开发。如果情况确实如此,那些原本想要H100的人可能就没有需求了。这就是我们一直保持谨慎选择的原因。
Brad Gerstner:
你的感觉是,对于其他公司来说,模型训练和模型集群在他们的AI收入中占比要远高于微软?
Satya Nadella:
这个我不太清楚,因为我不好评价其他公司的业绩。我只能说,还有什么其他热门应用呢?我也不太了解。他们运行什么模型?在哪里运行?当然,谷歌有Gemini。
从数据来看,主流的AI产品就是ChatGPT,然后是Gemini。Gemini的数据让我很惊讶。不过考虑到它天然的分发优势,我认为它肯定会增长。
有趣的是,主流产品其实并不多。虽然我们经常谈论AI的规模,但真正的热门应用却寥寥无几。就是ChatGPT、GitHub Copilot、Copilot和Gemini这四个。这就是我所知道的主要应用。你还能想到其他的吗?
Brad Gerstner:
我觉得现在有很多创业公司的应用场景开始获得关注,它们都是从基层逐渐发展起来的。其中很多都是基于Llama模型开发的。
Satya Nadella:
对,那是Meta的产品。但想想有哪些应用的收入能超过500万美元呢?
Brad Gerstner:
扎克伯格肯定会说Meta AI还有更多产品。不过说到独立的第三方应用,我觉得你说得对,主要就是你提到的那些。
Satya Nadella:
而且扎克的所有产品都是在他们自己的云平台上运行的,他们没有使用公共云服务。确实如此。
九、智能体革新商业应用,AI或将承载系统底层逻辑
Bill Gurley:
说到企业市场,编程领域的竞争非常激烈,你们表现出色。同时,这一领域有很多风投支持的公司参与其中。关于生产力应用,我想问问Copilot这种方式。我注意到Salesforce的Mark Benioff一直在这方面发表尖锐批评,把它贬低为“Clippy 2.0”之类的(Clippy是微软在Windows 97-03等产品中内置的智能UI界面)。
你会不会担心,如果有人从第一性原理开始重新思考AI产品,那么一些基础设施可能就显得多余了?比如说,如果你开发一个以AI为先的产品,是否还需要了解Excel电子表格的底层架构?同样的道理也适用于CRM系统。对用户来说,可能有许多字段和任务都可以被简化或隐藏起来。
Satya Nadella:
是的,这确实是一个非常重要的问题。我认为在这个AI智能体时代,传统商业应用的存在形式可能会发生根本性的改变。
因为如果你仔细想想,这些应用本质上就是带有一堆业务逻辑的CRUD(增加、读取、更新和删除)数据库,而这些业务逻辑将全部转移到AI智能体中。这些智能体将能够操作多个仓库的CRUD操作,不会区分后端系统的差异。
它们将同时更新多个数据库,所有的逻辑都将存在于AI层面。一旦AI层成为所有逻辑的承载者,人们就会开始替换后端系统。事实上,这个趋势已经很明显了。
我们看到Dynamics后端和AI智能体的应用正在取得很高的成功率。我们将积极推进这种整合,无论是在客户服务领域还是其他方面。
另外还有一点很有意思。令人惊喜的是,不仅仅是CRM系统,就连我们所说的财务和运营系统也在发生变化,因为人们希望使用更多AI原生的商业应用。这意味着逻辑层可以由AI和AI智能体来统筹协调。换句话说,从Copilot到AI智能体再到商业应用之间的过渡应该是完全无缝衔接的。
现在,同样的道理,你可能会问:“为什么我还需要Excel?”有趣的是,对我来说最令人兴奋的事情之一就是支持Python的Excel,它就像带有Copilot的GitHub,不再仅仅是帮你理解数字,它会为你制定完整的分析计划,就像有一个数据分析师在使用Excel的行列格式作为可视化分析的草稿本。
Copilot将Excel作为一个工具来使用,因为它可以生成内容并且有Python解释器,这为它提供了广阔的操作空间。这实际上是重新定义Excel的绝佳方式。某种程度上说,你甚至可以让它生成整个Excel文件。
这确实是可能的。它有代码解释器,理论上可以生成任何东西,我认为这将带来颠覆性的变革。就我们处理M365的方式而言,首先是将Copilot构建为组织层,作为AI的用户界面,整合所有智能体,包括我们自己的智能体。
你可以说Excel是Copilot的一个智能体,Word也是一个智能体。它们是专门的工作画布,比如说你在处理一份法律文档,你可以先把它放到Pages,然后转到Word,让Copilot全程协助你。进入Excel时也是如此,让Copilot陪伴你完成工作。这是一种全新的工作方式和工作流程思维。
十、智能体撬动更高生产力,客服与开发成两大应用场景
Brad Gerstner:
现在我听到很多人都在为一个问题焦虑不已,那就是投资回报率。大家都在进行AI投资,而你们微软有超过22.5万名员工。那么你们是否正在利用AI来提升自身业务的生产力、降低成本、增加收入呢?
如果是的话,能否举几个最显著的例子?还有一点,我记得之前采访黄仁勋时,我问他如果营收增长两到三倍,他预计只需增加25%的员工,他解释说会有10万个AI智能体来协助工作。那么对于Azure来说,当收入增长两到三倍时,你是否也期望在人员配置上实现类似的杠杆效应?
Satya Nadella:
是的,这是微软和我们的客户都最关心的问题。我一直在研究精益生产对工业企业带来了什么影响,这个过程让我学到了很多,这些企业的增长率都超过了GDP。
令人难以置信的是,那些优秀的工业企业能够很明确地说,仅仅通过精益生产就能带来2-3个百分点的增长优势,其核心就是提高价值、减少浪费。这就是他们的实践经验。
我认为AI对知识工作的意义,就相当于精益生产对工业生产的意义。我们正在认真学习这一点,这让我想起90年代的业务流程重组运动。
我认为这种理念又回来了,但是以一种全新的方式。那些能够端到端思考流程的人会问:如何提高流程效率?什么可以被自动化?什么可以变得更高效?
客户服务就是一个最明显的例子。我们在这方面的支出大约有40亿美元,包括从Xbox(微软游戏机及相关业务)支持到Azure支持的所有内容。今年特别重要,因为前端的分流率显著提高。
最大的收益是服务人员效率的提升。服务人员更开心,客户更满意,我们的成本也在下降。这是最明显的应用场景,我们的联络中心应用在这方面表现非常出色。
另一个显著的例子是GitHub Copilot。特别是在GitHub Copilot工作区中,我们首次看到了AI智能体的应用。它可以帮助你从问题出发,制定计划或规范,然后进行多文件编辑。
这完全改变了开发团队的工作流程。正如我所说,Office 365则是一个全能型工具。M365 Copilot的作用非常广泛,让我用我自己的经历举个例子。
CEO办公室的准备工作流程自1990年以来基本没有变化。我经常这样思考:想想在PC出现前后,预测工作是如何进行的?
以前是传真、办公室备忘录,后来有了PC,人们开始通过电子邮件传递Excel表格,大家输入数字来做预测。
现在在AI时代,类似的变革正在各个领域发生。当我准备客户会议时,我只需要在Copilot中询问关于这个客户的所有信息。它会整合CRM、邮件、团队会议记录和网络信息。
它会整理这些信息,我把它放到文档中,实时与客户团队分享。想想看,过去那种“为CEO准备简报”的层级工作方式已经消失了,现在只需要一个查询就够了。
我发起查询,如果团队需要做注释就分享页面。这就是新的工作方式:我与AI互动,同时与同事协作。这种变革正在各个领域发生。
有人给我举了一个供应链的例子。他说,供应链就像交易台,只是缺少实时信息。过去的情况是,等到季度结束,CFO才会来指出你犯的所有错误。
但如果财务分析师能够实时为你提供建议呢?比如当你在某个地区为数据中心签订合同时,它会提醒你需要考虑的条款。这种实时智能正在改变工作流程和工作方式。类似的应用案例比比皆是。
回到你的核心问题,我们的目标是通过AI创造运营杠杆效应。我认为人员配置会发生变化,我是这样看的:我们的总人力成本会下降,但人均成本会上升,每个研究人员配备的GPU也会增加。这就是我的观点。
十一、云计算不能搞纯粹供给侧建设,产品结构多元化可实现高溢价
Brad Gerstner:
这说得通。让我们转向你之前提到的话题,就是关于模型扩展和整体资本支出的情况。我听你谈过微软的资本支出。我想在2014年你刚接手时,根本无法预见今天的情况。
你在资本支出上获得了相当稳定的回报。从数据来看,你们的资本支出和收入之间确实存在很强的相关性。有些人担心这种相关性可能会被打破。就连你自己也说过,在某个时候,可能需要提前进行资本投入,而不是等到收入实现后再投入。
可能会出现一个过渡期。我们必须为提升系统韧性而投入。你对目前的资本支出水平有什么看法?从增长率来看,你觉得什么时候会开始放缓?
Satya Nadella:
首先,我们作为一个超大规模云服务提供商,在结构上具有很大优势,因为从某种意义上说,我们在这方面已经有很长时间的实践经验了。比如说,数据中心有20年的生命周期,电力费用是按使用量付费的,设备使用期限是6年。我们知道如何提高利用率。
好消息是,这个领域虽然资本密集,但同时也是软件密集型的。有人会问,超大规模服务提供商如何盈利?传统主机托管商和新型超大规模服务提供商的区别在哪里?关键就在于软件。我认为这个原则同样适用于GPU基础设施,就是说,
你需要先建设基础设施。事实上,现在我们还处在追赶阶段。我们在过去15年里建立了云计算基础设施,但突然间,云计算中出现了一个新的计量单位,叫做AI加速器。
现在每个应用都需要三样东西:数据库、Kubernetes(管理云平台中多个主机上的容器化的应用)集群,以及在AI加速器上运行的模型。所以当你意识到需要这三个组件时,你就必须快速建设这些AI加速器,以满足所有应用的需求。
这种状况最终会趋于正常。首先是基础设施建设阶段,然后工作负载会逐渐稳定,之后就会像云计算一样持续增长。这是其中一个方面。
关键是要避免一些不好的选择,不要去做单纯的供给侧建设。不要盲目建设、期待需求自然到来,而是要确保在全球各地、各个细分市场都有真实的多样化需求。我认为这才是管理投资回报率的正确方式。
另外,不同业务的利润率会有所不同。出租原始GPU的利润率与GPU+Fabric平台或GPU+代工服务或应用的利润率是不同的。比如说聊天功能或GitHub Copilot作为M365的附加服务,它们都会有不同的利润率。拥有多元化的产品组合很重要。
看看微软,为什么微软现在在云计算领域能够获得溢价?我们的规模比亚马逊大,增长速度比亚马逊快,利润率比亚马逊好,这是因为我们拥有多层次的产品结构。这就是我们在AI时代也想实现的目标。
十二、不要站在Scaling Law的对立面,o1是一个优秀的商业模式
Bill Gurley:
关于模型规模化的讨论很多。显然,过去人们就谈论过要将集群规模扩大10倍,而且这种扩展可能会反复进行,不是一次两次就结束。xAI目前也仍然支持这一观点。
但也有人认为,我们可以直接转向推理,这样成本更低,也不需要投入那么多资本支出。我很好奇,你对大语言模型的规模化、训练成本以及未来发展方向有什么看法?
Satya Nadella:
首先我要说,我非常相信Scaling Law。事实上,我们在2019年下的赌注就是押在Scaling laws上,我现在依然坚持这个观点,换句话说,不要站在Scaling laws的对立面。同时,我们也要在几个方面保持理性。
随着集群规模增大,Scaling Law的指数增长会变得更加困难。具体来看,我指的是进行大规模训练的分布式计算问题会变得更具挑战性。这是其中一个方面。
但我还是要说,得让OpenAI的人来谈他们在做什么,他们仍在继续研究,我认为预训练还没有终结。令人兴奋的是,OpenAI用o1做的这种带有自动评分的思维链方法非常出色。实际上,测试时计算或推理时计算本质上是另一种形式的Scaling Law。
先进行预训练,然后进行测试时采样,生成的token可以反馈到预训练中,从而创建更强大的模型用于推理。我认为这是提升模型能力的绝佳方式。
测试时或推理时计算的好处在于,运行o1模型涉及两个不同的方面。当你用它为预训练生成token时,采样过程类似于训练。同时,当客户使用o1时,他们会消耗更多的计算资源。而且这些计算资源都能带来收入。
这不仅仅是技术问题,更是一个能创造巨大经济价值的商业模式。这就是为什么我如此看好这种方式。事实上,这也是我说在全球拥有60多个数据中心给了我们很好的结构性优势的原因——我们可以从中获得更多的商业回报。
十三、算力投资需谨慎,我与Sam有分歧
Satya Nadella:
回到Brad提到的投资回报率问题,我认为在这方面我们必须建立一个稳定的状态。
每次我和黄仁勋交谈时,我都觉得他说得很对。他的观点是,你需要每年都购置一些设备。想想看,当你要在6年内折旧一项资产时,最好的方式就是每年购买一些,让它们逐步老化,我们也是这么做的。
我们让设备逐步老化,用最新的节点做训练,第二年就转为推理用途。这将让我们的机群最终达到稳定状态,无论是使用率还是投资回报率,最终都能实现供需平衡。
大家都在问,指数级增长是否停止了?这个问题的另一个现实因素是经济因素。最终,每个人都会思考什么才是经济上最合理的做法。就算我每年都能让计算能力翻倍,但如果卖不出去,这些库存又有什么用呢?
还有一个问题是所谓的“赢家诅咒”。你甚至不需要发表论文,其他人只要看到你的模型能力就可以进行模型蒸馏。这就像盗版一样,根本无法阻止。你可以制定各种使用条款,但无法控制模型蒸馏。这是第一点。
第二点是,你甚至不需要做任何事情,只需要对这种能力进行逆向工程就行了。而且你可以用更高效的计算方式来实现。考虑到这些因素,我认为会有一个自然的限制来制约模型之间的竞争。
现在,大家都想争当第一。这种竞争精神很好,但最终每个人都要面对经济现实。网络效应是在应用层面产生的。如果网络效应都在应用层,为什么还要在模型能力上投入巨资呢?
Brad Gerstner:
据我所知,马斯克说他要建一个百万GPU规模的集群。我记得Meta也宣布了类似的计划。
Bill Gurley:
我记得他说的是20万,然后开玩笑说要做到百万,还说要做到十亿。
Brad Gerstner:
与年初相比,根据你在预训练和规模化方面的观察,微软有没有调整相关的基础设施规划?
Satya Nadella:
我们正朝着10倍增长的目标前进。具体需要多长时间还可以讨论——是2年、3年还是4年?这背后是有一个经济模型的。
我们需要用严谨的方式来思考如何有效利用现有设备。同时也要考虑设备的使用寿命,不能一味地购买新设备。除非GPU的性能和成本能带来显著改善,让利润率达到或超过大型云服务商的水平,否则我们不会轻举妄动。
这很简单,这就是我的策略。我会继续专注于如何提升推理需求,同时不断提高我们的能力并保持高效运营。
当然,Sam可能有他自己的目标,他也一直很坦诚。他会说:“我这么做是因为我对AGI的愿景很有信心。”这也无可厚非,但这就是我们之间存在一些分歧的地方。
十四、微软不会“重复造轮子”
Bill Gurley:
我想请你澄清一点,我在一个播客里听到Mustafa说,微软不会参与当前正在进行的最大模型训练竞赛。这种说法准确吗?
Satya Nadella:
我们不会重复做同样的事情。毕竟我们已经拥有知识产权,考虑到与OpenAI的合作关系,如果微软现在去做重复的工作是很不明智的。我们不会去创建重复的训练集。
Bill Gurley:
确实如此。
Satya Nadella:
是的。这就是为什么我们要协同合作。这也是我们一直坚持的战略原则。我经常对Sam说,我们把所有赌注都押在了OpenAI身上,我们会集中我们的计算资源。我们这样做是因为我们拥有所有的知识产权。
这就是其中的利弊关系。我们对此非常满意。而Mustafa说的基本意思是,我们也会参与,但我们这边更关注训练之后的工作,包括验证等方面,这是一个重要方向。我们会将大量计算资源集中在提升模型能力上。
十五、微软与OpenAI是竞合关系,希望长期稳定合作
Brad Gerstner:
我们已经谈了很多关于OpenAI的事。你需要在对OpenAI的巨额投资和自身发展之间寻求平衡。在Ignition大会上,你展示了Azure OpenAI和OpenAI Enterprise之间的差异。其中很多是关于你们提供的企业级功能。
那么面对这种竞争关系,你是否认为ChatGPT可能会成为消费者市场的赢家?你们会采取分而治之的策略吗?你如何看待与他们的竞争?
Satya Nadella:
OpenAI现在已经是一家规模很大的公司,是一家非常成功的企业,有多条业务线和不同的业务部门。
所以我会像对待其他大型合作伙伴一样,用原则性的方式来处理这个关系。作为投资者,我会考虑如何平衡双方的利益。
我把他们看作知识产权合作伙伴。我们提供系统知识产权,他们提供模型知识产权。我们都非常关注彼此的成功。我也把他们当作重要客户,我希望像服务其他大客户一样服务他们。
最后是竞合关系,无论是消费者领域的Copilot,还是与M365的Copilot等,我们都在寻找合作机会。我认为这些业务难免会有重叠,但在这种情况下,他们与苹果的合作对微软股东来说也是有价值的。至于API的差异,客户可以自由选择。
如果你是Azure客户并想使用Azure的其他服务,那么使用Azure是最方便的。但如果你在AWS上,只想简单地使用API,那么直接用OpenAI也很好。有趣的是,这两种分发方式对微软来说都是有益的。
Bill Gurley:
硅谷甚至整个商业界都对微软和OpenAI的关系非常感兴趣。上周我在Dealbook时,Andrew Sorkin在这个问题上对Sam施加了很大压力。
我知道有很多事情你可能不便透露,但有什么可以分享的吗?据说有重组计划,要转向盈利。马斯克也参与其中。你能告诉我们些什么?
Satya Nadella:
这些显然都是由OpenAI董事会,他们的CEO、CTO、COO等管理团队来决定。作为投资者,我们会给予支持。
我们最关心的是OpenAI能继续保持成功的势头。这符合我们的利益。我也认为它是这个平台变革的时代中的标志性公司。OpenAI的成功对整个世界都有好处。
这是我们的基本立场。至于你提到的紧张关系,就像所有合作关系一样,有竞争带来的压力。Sam是一位有远见和抱负的杰出企业家。想要快速发展。我们需要平衡各方面的需求,我要适应他的发展需要,他也需要理解我们这边的约束条件。
我相信我们能找到解决方案。好消息是我们已经合作了很久,这五年对双方都很有收获。至少就我而言,我会继续坚持这个方向。我希望这种合作关系能持续下去。建立长期稳定的合作关系对我们都有利。
Brad Gerstner:
关于独立融资和两家公司的问题,你们是否想尽快推进?他们下一步如果能上市的话,会是最好的发展路径。这是一家标志性的企业,是AI领域的早期领导者。这是你认为他们应该走的路吗?还是你觉得应该保持现在这种关系?
Satya Nadella:
在这一点上,我要注意别越界。因为我们不在董事会,我们只是像你一样的投资者。这最终还是他们董事会和管理层的决定。我会遵循他们的意愿。换句话说,我会支持他们做出的任何决定。对我来说,作为投资者,最重要的还是商业和知识产权合作关系。
我们要确保在这个过程中保护我们的利益,并在未来加强合作。OpenAI的CEO、CFO、COO都是聪明人,我们会支持任何有助于他们实现使命、目标的决定。