智东西
作者 ZeR0 程茜
编辑 漠影

智东西2月20日报道,今日,在微软连发其首款量子芯片、首个游戏世界模型两大重磅研究成果后,知名科技播客Dwarkesh Podcast第一时间放出对微软董事长兼CEO萨蒂亚·纳德拉的76分钟深度访谈,信息量非常大。

访谈涵盖了包含微软对AI发展走向、计算资源需求、集群建设、通用人工智能(AGI)基准、AI价格战、部署AI能力的挑战、量子计算突破、游戏世界模型、混合现实(MR)梦想、企业如何培养员工忠诚度、认知劳动等话题。

当然还有近期科技行业必聊主题——DeepSeek。

纳德拉说,AI需要变得更好且更便宜,每当有像DeepSeek所取得的这种突破时,每个Token的性能效率前沿就会改变,这将带来更多的需求。

今年是微软成立50周年。纳德拉希望保持“重新创业”心态,谈到微软想要下得三大赌注是AI、量子计算、MR,认为新发布的游戏世界模型Muse AI具有类似于“ChatGPT时刻”的里程碑意义,真实临场感仍是MR难以解决的挑战,并判断计算资源价格会下降、SaaS行业将被AI重塑。

在他看来,赢家通吃不会出现在超大规模市场,可能会出现在消费市场;在大模型领域,开源方案会确保闭源赢家通吃的局面得到缓解,不会出现某家凭借一个模型独占市场的情况。

纳德拉直言,微软自称取得的一些AGI里程碑,在他看来“只是无意义的基准测试”。

在访谈期间,他还分享了微软曾经失误所带来的一些教训,比如错过搜索,比如微软亚研院曾有上千个本应大力推进却没有的项目,并复盘原因是缺乏足够的信心,对接纳创新和将其转化成商业模式缺乏完整的思考。


以下是纳德拉访谈的完整实录:

一、赢下客户端-服务器浪潮竞赛,错失“搜索”发展良机

主持人:祝贺你,微软刚刚取得两项突破,同一天在Nature上发表的量子处理器Majorana 1和首个世界和人类行动模型。不过首先我们能不能继续刚才的话题,你在80年代和90年代看到的事情以及你看到它们再次发生的感受。

纳德拉:能上你的播客太棒了,我是一个深度听众,我喜欢你做这些采访的方式和你探索的广泛话题。

让我兴奋的是,这让我想起了我在科技行业的最初几年,从90年代开始,那里有对RISC(精简指令集)还是CISC(复杂指令集)的真实争论,或者“我们真的能够使用x86构建服务器吗”等争论。

我加入微软时正是Windows NT(面向工作站、网络服务器和大型计算机的网络操作系统系列)项目起步的时候。所以,从核心芯片平台到操作系统,再到应用程序层级,全栈式方案的整个体系都在不断地深入研究和完善中。

当时分布式计算和云改变了客户端-服务器,网络发生了巨大的变化,相比于过去感觉更像一个完整的堆栈,而我参与其中。

主持人:此前人们谈论数据中心建设是一个泡沫,但我们今天的互联网又是基于其建设而成。所以关于什么将经得起时间的考验?什么是固有的长期趋势?什么只是昙花一现?你如何看待。

纳德拉:回顾我经历过的四大变革,其中之一就是客户端以及客户端-服务器模式,也就是GUI(图形用户界面)和x86架构的诞生,基本上正是它们让我们能够构建服务器。

我很清楚这一点。我记得1991年参加PDC大会时,我在Sun Microsystems(IT及互联网技术服务公司)工作。1991年我去了Moscone。当时微软首次描述了Win32接口,我很清楚接下来会发生什么——服务器将采用x86架构。

因此,当你拥有规模优势时,这就是你必须下注的长期赌注。客户端发生的事情也将在服务器端发生,然后你就可以真正构建客户端-服务器应用程序。应用程序的模式变得清晰起来。

那时网络发展对我们来说是件大事,我们在创业之初就必须应对它。我一加入微软,Netscape浏览器或Mosaic浏览器问世,大概在1993年12月左右,这些浏览器被开发出来。

所以,这在某种程度上改变了游戏规则。当时我们正处于客户端-服务器浪潮之中,很明显我们赢得了这场竞赛。

之后我们迎来浏览器时代,因此必须做出调整。我们很好地适应了浏览器时代新的应用模式。我们将其融入到微软所做的一切中,无论是Word中的HTML还是其他新东西,然后在服务器堆栈上构建网络服务器等。

当然,我们也错过了网络上最大的商业模式。因为我们都认为网络是分布式的,谁会想到搜索会成为组织网络的最大赢家?显然,这是我们没有看到的地方,而谷歌看到了它并执行得非常好。

所以这是我学到的一个教训:你不仅要正确把握技术趋势,还要了解该趋势将创造什么价值,这些商业模式的转变可能比技术趋势的变化还要困难。

二、AI领域不会赢家通吃,基础设施需求将呈指数级增长

主持人:AI将在哪里创造价值?

纳德拉:这是伟大的。我对两个地方有信心:

其一是表现出色的超大规模云服务提供商,因为从根本上来说,如果你回想一下萨姆·阿尔特曼(OpenAI CEO)和其他人的描述就会发现,智能程度与计算能力呈对数相关,因此谁能够进行大量的计算,谁就是大赢家

其二,如果你仔细观察ChatGPT等任何AI工作负载,你会发现并不是每个人都对GPU方面发生的事情感到兴奋,虽然GPU方面的发展确实很不错。实际上,我在考虑自己的设备集群时,会将其看作是AI加速器、存储和计算之间的一种比例关系。而且从规模角度来看,你必须对其进行扩展。

因此,世界对基础设施的需求将呈指​​数级增长。拥有这些AI工作负载简直就是天赐良机,它们对更多计算能力的需求极大,而且不仅仅是在训练方面,在测试阶段同样如此。

当你想到一个AI agent时,事实证明,AI agent会以指数级的速度增加计算资源的使用量,因为这已不再仅仅局限于一个人调用一个程序,而是一个人调用的程序会进而调用更多的程序。这将会对计算基础设施产生巨大无比的需求,并推动其规模不断扩大。

所以,我们的超大规模业务,也就是微软的Azure业务,以及其他超大规模云服务提供商的业务,我认为这都是非常重要的发展方向。

在那之后,情况就变得有点模糊了。你可能会说“嘿,存在一种赢者通吃的模式”,但我就是不这么认为。

顺便说一下,这是我学到的另一件事:在某种意义上,真正擅长分辨哪些是赢者通吃的市场,哪些不是赢者通吃的市场,这才是关键所在

我还记得,在我刚涉足Azure业务的早期,亚马逊就已经遥遥领先了。人们会来找我,投资者也会找到我,他们说:“哦,一切都结束了。你们永远也做不成的。亚马逊是赢者通吃的,这已经是定局了。”

在客户端-服务器领域,甲骨文与IBM竞争的经历让我明白,买家是不会容忍“赢者通吃”的局面的。

从结构上看,超大规模市场永远不会是 “赢者通吃” 的,因为买家都很精明

消费市场有时可能会出现 “赢者通吃” 的情况,但只要买家是企业、公司或企业的IT部门,他们就会希望有多个供应商。所以,你必须成为众多供应商中的一员。

我认为,大模型领域也会是这样的情况,会有开源模型、监管机制等。就像Windows系统给我的一个重要教训:如果你有一个闭源操作系统,就必然会有与之互补的开源产品出现。所以在某种程度上,这确实能对市场情况起到制衡作用。

我觉得在模型方面,或许会有一些闭源模型,但肯定也会有开源的替代方案。而且开源的替代方案会确保那种闭源 “赢者通吃” 的局面得到缓解

这就是我对模型领域的看法。

顺便说一下,如果AI真的像人们所认为的那样强大,政府是不会坐视不管任由私营企业在全球范围内随意发展的。

所以,我不认为这会是 “赢者通吃” 的局面。

除此之外,我认为情况还是和以往一样,在消费领域的某些品类中,可能会出现一些 “赢者通吃” 的网络效应。

毕竟ChatGPT就是一个很好的例子。它是一个大规模的消费级产品,已经获得了真正的发展动力。我打开应用商店,总能看到它排在前五名,我就会感叹:“哇,这太不可思议了。”

所以他们能够利用早期的优势,并将其转化为应用程序方面的优势。在消费领域,这种情况是可能发生的。但在企业领域,我认为按不同类别划分,会有不同的赢家。至少这是我分析得出的结论。

主持人:如果拥有了通用人工智能(AGI),并且它能帮助你开发出更好的AI,也许未来会出现自动化的AI研究工具等,来巩固企业自身优势,我很好奇你的想法,在这个领域保持领先真的很重要。

纳德拉:从模型的角度来看,没有什么东西是完全商品化的。就你提到的云计算来说,大家都会说:“哦,云计算是商品化的产品。” 但实际上,当你扩大规模,这就是为什么运营超大规模云服务需要专业知识, 你可能会说:“哎呀,这有什么难的?我只要把服务器组装起来就行了。”

事实上,在超大规模云服务发展的早期,大多数人都认为 :“市场上有那么多托管服务提供商,他们的业务都不怎么样。超大规模云服务会有前景吗?这到底能不能成为一门生意呢?” 但结果证明,这确实是一门实实在在的生意,这就是因为具备了运营的专业知识。以Azure为例,要在全球60多个地区运营计算业务,管理所有的计算资源,这可不是件容易复制的事情。

所以我想说的重点是,市场上会只有一个赢家吗?这到底是不是 “赢者通吃” 的局面呢?因为你必须搞清楚这一点。

我喜欢进入那些市场总量(TAM)很大的领域,在这样的领域里,你不必承担所有的风险,因为不会出现 “赢者通吃” 的情况。最理想的情况是进入一个大市场,这个市场能够容纳几个赢家,而你就是其中之一。

这就是超大规模云服务层面的情况。模型最终需要在超大规模的计算资源上运行。所以我觉得这种联系会一直存在。

同时,这不仅仅是模型的问题。模型需要状态存储,这意味着它需要存储设备,而且运行这些agent及其运行环境也需要常规的计算资源。

所以我认为,不会出现某一家凭借一个模型独占市场并一统天下的情况。

三、顺应摩尔定律构建集群,在全球建立推理集群

主持人:作为超大规模云服务提供商,在推理阶段的规模扩展方面,微软不仅可以将数据中心和GPU用于训练,还可以再次用于推理,从而分摊成本。那你认为微软和Azure属于哪一类超大规模云服务提供商呢?是专注于预训练方面吗?还是提供像o3类型的推理服务呢?或者你们只是会托管和部署市场上的任何一种模型,对此并不偏袒呢?

纳德拉:这是个很好的问题。我们构建设备集群的方式在某种程度上是顺应摩尔定律的。

我认为这就和我们过去做其他事情一样:每年都对设备集群进行更新,根据设备的使用寿命对其进行折旧处理,然后非常熟练地对设备集群进行布局,这样就能以高利用率运行不同的任务。

有时候会有非常大型的训练任务,需要为其配置高度集中的峰值运算能力,而且这些任务还需要协同运行。因此我们应该拥有足够的数据中心规模来满足这一需求。

但归根结底,这些任务规模都会变得非常庞大,即使从预训练的规模来看,如果要持续发展,在某个阶段预训练的规模也必须跨越数据中心的界限。基本上就是这样的情况。

所以,一旦你开始跨越预训练的数据中心界限,这和其他情况有什么不同吗?我是这样想的:分布式计算仍然是分布式的,所以构建你的设备集群,使其能够应对大型训练任务,能够满足测试阶段的计算需求,甚至能够应对强化学习(RL)可能带来的情况。

你构建了一个大模型,然后会有大量的强化学习任务要处理。对我来说,这就像是更多的训练运算,为不同的任务创建高度专业化、精简的模型。

所以你需要这样的设备集群,然后是服务需求。

说到底,光速是固定的。你不能只在得克萨斯州建一个数据中心,然后说:“我要从这里为全世界提供服务。”你必须在全球各地都建立推理设备集群,才能为全世界提供服务。这就是我对构建真正超大规模设备集群的理解。

顺便说一下,我还希望我的存储和计算资源也能靠近这些设备,因为不仅仅是AI加速器是无状态的,我的训练数据本身也需要存储,而且我希望能够复用多个训练任务。我希望能够创建这些环境,让agent可以在其中执行程序。这就是我的大致想法。

四、AGI的真正基准:世界经济增速达10%

主持人:微软的财报显示每年AI中获得的收入达到130亿美元。基于同比增长,这一数字四年后将会达到1300亿美元。如果是这样,您将会如何利用这些工业规模的智能?这会通过Office(办公软件)来实现吗?还是说你会将其部署好后让其他人来托管?要拥有AGI才能实现1300亿美元的营收吗?实际情况到底会如何?

纳德拉:在我看来这是一个很好的问题,因为在某种程度上,如果你要实现这种爆炸式增长,我们首先要观察的就是GDP增长。在我讨论微软的收入情况之前,这一切有一个决定因素,就是我们对AGI的过度炒作

发达国家吗(的GDP)增长率为2%,如果考虑到通货膨胀,增长率可能为0。因此在2025年,虽然我不是经济学家,但至少我认为我们正面临真正的增长挑战。因此,所有人要做的第一件事是,让我们实现工业革命式的增长

对我来说,这意味着10%、7%,或者发达国家通货膨胀调整后的增长率达到5%,这是真正的指标。

很多人都在写这方面的文章,我很高兴他们这么做,也就是说,最大的赢家不会是科技公司。赢家将是使用这种商品的更广泛的行业。顺便说一句,这种商品非常丰富。生产力突然上升,经济增长速度加快,这种情况发生时,我们这个行业就会安然无恙。

但对我来说,这只是当下。我们自称取得了一些AGI里程碑,但在我看来,这只是无意义的基准测试。真正的基准是:世界以10%的速度增长

主持人:如果世界经济增长率为10%,世界经济规模将达到100万亿美元左右,每年就相当于额外创造了10万亿美元价值。如果是这样的话,你作为超大规模企业……难道你不应该投资8000亿美元吗?如果你真的认为在几年内,我们真的可以按照这个速度发展世界经济,那么关键的瓶颈就是:你是否拥有部署这些AI来完成所有这些工作所需的计算能力?

纳德拉:没错。但顺便说一句,典型的供应方是,“嘿,让我建造它,他们就会来”。这是一个论点,毕竟我们已经做到了这一点,我们已经承担了足够的风险去做这件事。

但在某些时候,供应和需求必须对应起来。这就是我跟踪供应和需求的原因。如果你只关注供应方,而不真正了解如何将其转化为对客户的实际价值,那么你可能会完全偏离轨道。

这就是我关注我的推理收入的原因。这也是为什么即使披露推理收入也是如此……有趣的是,没有多少人谈论他们的实际收入,但对我来说,作为一名管理者,你如何看待这一点很重要。

你不会说它们必须在任何特定的时间点对称地满足,但你需要有存在的证据,证明你能够将昨天的资本转化为今天的需求,这样你就可以再次投资,甚至可能是指数级的投资,因为你知道你不会完全出现利率错配。

五、构建模型是“创造商品”的竞赛,计算资源的价格会下降

主持人:我想知道这两种不同的观点是否存在矛盾,因为你做得非常出色的一件事就是做出这些早期的押注。你在2019年就投资了OpenAI ,当时Copilot和任何应用程序都还未出现。如果你回顾工业革命时期,当时铁路之类的基础设施建设投入占比达到6%、10% ,很多情况并不是说 “我们靠卖车票获得了收入,然后现在我们打算……”

如果你真的认为这里有潜力让世界增长率达到10倍或5倍,然后你会想:“那么,GPT-4的收入是多少?”如果你真的认为这是更高层次的可能性,难道你不应该说:“让我们疯狂起来,让我们进行数千亿美元的计算吧?”

纳德拉:这很有趣。这就是为什么即便是这种平衡的集群方法对我来说也非常重要。这是关于构建计算,它不仅可以帮助我训练下一个大模型,还可以服务于下一个大模型。除非你做到这两点,否则你将无法真正利用你的投资。

所以,这不仅仅是一场建立模型的竞赛,而是一场创造一种商品的竞赛,这种商品将被世界用来驱动……你必须有一个完整的想法,而不仅仅是你正在思考的一件事。

其中一个情况是会出现过度建设。就像你提到的互联网泡沫时代发生的事情那样,现在已经有这样的信号了。你需要更多的能源,也需要更多的计算能力。所以,每个人都会竞相投入(发展)。

不仅仅是公司在部署,各国也将部署,而且显然……我很高兴能成为供应商。因为,顺便说一下,我建设了很多(设施),也出租了很多(计算资源)。

我很兴奋在2027年、2028年能够出租大量的计算能力,因为我看到这些建设项目时就会想:“这太棒了。”

随着所有这些计算设施的建设,唯一会出现的情况就是计算资源的价格将会下降

主持人:从消费者的使用场景来看,AI已经非常便宜了,大概是每百万个Token只需2美分,我觉得我真正受限于它能否变得更智能而非价格。但也许你在企业端看到的情况有所不同,到底是什么关键的AI使用场景,真的需要把价格降到每百万个Token 0.002美分呢?

纳德拉:我认为关键在于Token的效用,AI需要变得更好且更便宜。每当有像DeepSeek所取得的那种突破时,每个Token的性能效率前沿就会改变,这只会带来更多的需求,云计算领域就是这样的情况。

有件很有意思的事:我们过去常想“天哪,在客户端-服务器时代,我们已经把所有能卖的服务器都卖出去了”。然而,一旦我们开始把服务器部署到云端,突然间人们的使用量增加了,因为他们可以更便宜地购买服务,而且服务具有弹性,他们可以按计量方式购买,而不是购买许可证,这使得市场规模得到了彻底扩大。

我记得有一次去印度宣传 “SQL Server(微软的数据库管理系统)”。但我们只卖出了一点点,但是,印度的云计算市场规模比我们在服务器时代于当地取得的任何成绩都要大得多。我认为这种情况还会持续下去。

你想想一下,如果未来在一个发展中国家的医疗健康领域能有非常便宜的Token可用,那将是有史以来最大的变革。

六、AI能力部署的挑战是变革管理、工作流程

主持人:作为一个与财富500强企业合作,并且正在帮助他们为成百上千万甚至数十亿人部署产品的人,你认为这些能力的部署速度会有多快呢?即使你有了可用的agent、可以远程工作的工具,但考虑到所有的合规要求和固有的瓶颈,这些会成为很大的阻碍吗?还是说会很快克服这些问题?

纳德拉:这确实会是一个真正的挑战,因为真正的问题在于管理或流程变革。我常打的一个比方是,想象一下像我们这样的跨国公司在PC(个人电脑)、电子邮件和电子表格出现之前是如何做预测的,当时靠传真来传递信息。有人收到传真后,会写一份部门间的备忘录然后传阅,人们输入数据,最后可能刚好在新季度开始前得出预测结果。

然后有人说:“嘿,我只要用Excel电子表格,把它放在电子邮件里发出去。人们可以去编辑它,这样我就能得到一份预测了。”

因此,整个预测业务流程发生了改变,因为工作成果和工作流程发生了变化。

AI被引入知识工作领域也会发生这样的改变。实际上,当我们想到所有这些agent时,最根本的是出现了新的工作内容和工作流程。

例如,在准备播客时,我会向Copilot说:“嘿,我要谈谈我们在量子领域的宣布事项以及我们为游戏生成构建的新模型,给我一份我在谈话前应该了解的所有内容的总结。”

它知道那两篇Nature期刊上的论文,并且提取了相关内容。我还可以说:“用播客的格式给我呈现。” 然后它能模拟我们两人关于这个话题的对话。

所以这就成了。然后,我把它分享给了我的团队,把它放到文档工具里分享出去。对我来说,新的工作流程就是借助AI并和我的同事一起工作。

这对于每个从事知识工作的人来说,都是一个根本性的变革管理。他们突然要弄清楚这些新的模式,即 “我要如何以新的方式完成我的知识工作”,这是需要时间的。在销售、财务和供应链等领域也会是这样。

对于一家现有企业来说,我认会是这样一种情况——我喜欢用的一个比喻是制造商在精益生产方面做的事情。我很喜欢这个比喻,因为从某种意义上说,通过精益生产方法,人们可以在制造业中采用端到端的流程提高效率。这是一种持续改进,即减少浪费并增加价值。

这也会应用到知识工作领域。这尤其像是知识工作的精益生产方法,将是管理团队和从事知识工作的个人需要付出努力的地方,并且这需要时间。

主持人:精益生产所做的一件事是从物理层面上改变了工厂车间的样子,它揭示了一些人们直到真正关注流程和工作流程时才意识到的瓶颈。由于AI,你自己的工作流程发生了怎样的变化。当你拥有这些随着时间推移变得越来越智能的agent时,经营一家大公司会是什么样子?

纳德拉:这个问题很有意思。比如说,今天我们对电子邮件的依赖程度非常高。我早上来上班,就会想,天哪,我的收件箱都满了,我得回复邮件,所以我迫不及待地希望Copilot能自动帮我写好草稿,这样我就可以直接开始审核和发送了。

我在Copilot中至少已经有了十个agent,我会针对不同的任务向它们询问不同的事情。我感觉未来会创建一个新的收件箱,在这个收件箱里,我正在使用的数百万个agent将不得不向我报告一些异常情况、给我发送通知,或者向我请求指示。

所以至少我在想的是,会有一个新的架构,也就是agent管理器。它不只是一个聊天界面,我需要一个比聊天界面更智能的东西来管理所有的agent以及它们之间的对话。

这就是为什么我认为智能助手(Copilot)作为AI的用户界面,是非常非常重要的。我们每个人都会用到它。

基本上可以这样想:有知识工作,也有知识工作者(Knowledge Worker)。知识工作可能由许许多多的agent来完成,但仍然会有一个知识工作者来处理所有这些agent的工作。我认为这就是需要构建的界面。

七、实现“量子计算领域的晶体管时刻”

主持人:微软研究院宣布的在量子领域的重大突破。你能解释一下是怎么回事吗?

纳德拉:这对我们来说是一段长达30年的历程。太不可思议了。我是微软的第三任CEO,对量子领域一直很感兴趣。

这里的根本突破,或者说我们一直以来的愿景是,为了构建一台实用规模的量子计算机,你需要在物理学上取得突破

我们选择了这样一条道路,即拥有一个噪音更小或更可靠的量子比特的方法,是押注于一种从定义上来说更可靠的物理特性,这就是为什么我们关注马约拉纳零能模(Majorana zero modes),这一理论在20世纪30年代就被提出。

问题是,我们实际上能否在物理上制造出这些东西呢?我们真的能构建出来吗?

所以,重大突破是,我知道你和切坦(Chetan Nayak,微软技术研究员)聊过,我们现在终于有了存在性证明,并且在一种新的物质状态下有效地实现了马约拉纳零能模的物理学突破。这就是为什么我们喜欢把这个比喻为“量子计算领域的晶体管时刻”

我们有了一个拓扑相,这意味着我们甚至可以可靠地隐藏量子信息、对其进行测量并且制造它。所以我们觉得有了这个核心的基础制造技术,我们就可以开始构建Majorana芯片了。

我认为Majorana 1将是第一颗能够拥有100万个物理量子比特的芯片。在此基础上,经过纠错后会有数千个逻辑量子比特。然后就可以大展身手了。

你突然就有能力构建一台真正实用规模的量子计算机,对我来说,现在这变得更加可行了。如果没有这样的突破,你仍然可以实现一些里程碑,但你永远无法构建一台实用规模的计算机。这就是为什么我们对此感到兴奋。

我们叫它Majorana 1,我很高兴我们以它来命名。想想看,我们能够在这么小的尺寸内构建出像拥有100万个量子比特的量子计算机这样的东西,真是不可思议。

关键在于,除非我们能够做到这一点,否则你根本无法想象构建一台实用规模的量子计算机。

主持人:这太神奇了。谷歌、IBM也宣布了拥有100个物理量子比特,但你们的成果在可扩展性方面远超其他公司吗?

纳德拉:是的。我们还采取了一种方法,就是将软件和硬件分离开来。我们正在构建我们的软件栈,而且我们现在与研究中性原子、离子阱的团队合作,我们也在与其他在光子学等方面有很好方法的团队合作,这意味着会有不同类型的量子计算机。

我们上次宣布的是拥有24个逻辑量子比特。所以我们在纠错方面也取得了一些突破,这就是为什么即使在中性原子和离子阱量子计算机方面,我们也能构建出20多个(逻辑量子比特),而且我认为今年这一数字还会继续增加,你会看到我们不断提高这个标准。

但我们也说过:“让我们从最基本的原理出发,构建我们自己的基于拓扑量子比特的量子计算机。” 这就是这次突破的意义所在。

主持人:太神奇了。100万个拓扑量子比特、数千个逻辑量子比特,达到这个规模的预计时间线是怎样的呢?这里有类似摩尔定律的规律吗?如果你已经有了第一个 “晶体管”(比喻关键突破),后续会怎样发展呢?

纳德拉:我们已经在这个领域努力了30年。我很高兴我们现在在物理学和制造技术方面都取得了突破。

我希望我们已经有一台量子计算机。量子计算机能让我们做的第一件事就是制造更多的量子计算机,因为用它来模拟逐个原子构建这些新的量子门会容易得多。

但无论如何,接下来真正要做的是,既然我们已经有了制造技术,那就让我们去构建第一台容错量子计算机吧。这将是顺理成章的事情。

所以,我现在可以说,“也许在2027年、2028年、2029年,我们将能够真正构建出这样的计算机”。

现在我们有了这一个门电路,我能把它集成到集成电路中,然后真正把这些集成电路放入一台真正的计算机中吗?这就是接下来的合理步骤。

主持人:那你认为在2027、2028年,当它能运行的时候,会是什么样的使用方式呢?是通过API来使用它吗?还是你们会在内部将其用于材料和化学方面的研究呢?

纳德拉:这是个很好的问题。有一件事我一直很兴奋,我们有量子项目,并为它添加了一些API。大概两年前我们取得的突破是将高性能计算(HPC)堆栈、AI堆栈和量子计算结合起来考虑。

仔细想想,AI就像是模拟器的仿真器。量子计算就像是对自然的模拟。量子计算能做什么呢?顺便说一下,量子计算不会取代经典计算。量子计算在它擅长的领域表现出色,经典计算也会。

量子计算对于任何在状态空间方面不是数据密集型而是探索密集型的任务都非常出色,也就是说,数据量相对较少,但你想要探索的状态是指数级的领域。大模型就是一个很好的例子,还有化学、物理、生物等领域。

我们已经开始做的一件事,是真正把AI用作仿真引擎,你可以对其进行训练。

我是这样想的,如果你有AI+量子计算,也许你会用量子计算来生成合成数据,然后用这些数据来训练更好的模型,这些模型能够在化学、物理等领域进行建模。这两者将结合使用。

所以这就是今天,我们将高性能计算和AI结合起来所做的事情。我希望用量子计算机来取代一些高性能计算的部分。

八、微软研究院错失过上千个项目,管理团队要懂得如何接纳创新并使其商用

主持人:你是如何做出研究决策的?这些决策在二三十年后会带来回报,尤其是在像微软这样规模的公司。显然,你对这个项目的技术细节非常了解。对于微软研究院所做的所有事情,你都能做到这样吗?还有你现在做出的这些在20年后会有回报的决策,是通过公司内部自然产生的吗?你是如何跟踪所有这些事情的呢?

纳德拉:我觉得很棒的一点是,大概在1995年比尔·盖茨创办微软研究院时的理念。我认为在这些由好奇心驱动的研究机构漫长历史中,能创办一个专注于基础研究的研究机构,这是很了不起的。

多年来,微软研究院已经积累了强大的机构实力。所以,当我考虑资金分配、预算或其他相关事宜时,我会先做出投入,比如说,“看,这是微软研究院的预算”。我们每年都要这样做,心里明白这些投入中的大多数在短期内不会有回报。也许要等到微软的第六任CEO才能从中受益。

我认为,这在科技领域是很正常的。我真正思考的是,当量子技术、新模型或其他类似的事情,机遇来临时,你是否能够抓住机会实现成功呢?

所以,作为一家老牌公司,回顾科技发展的历史就会发现,不是人们没有进行投资,而是你需要有一种“要懂得如何接纳创新,并将其规模化发展”的文化。坦率地说,对于CEO和管理团队来说,这是很困难的部分,这也很有意思,这既需要良好的判断力,也需要良好的企业文化。

有时候我们做得对,有时候我们也会犯错。我可以告诉你,微软研究院有上千个项目,我们本应该大力推进,但却没有。我总是问自己为什么,原因是我们没有足够的信心,而且对于如何不仅接纳一项创新,还能将其转化为一个有用的产品,并构建出一个可以推向市场的商业模式,缺乏完整的思考

CEO和管理团队的工作不仅仅是对某一件事情感到兴奋,而是要能够切实地将整个事情执行到位。说起来容易,做起来可就难了。

主持人:你提到微软未来可能会有第六任(或者说接下来的三任)CEO,要是他们每个人都能让公司市值提升一个数量级,那么等到下一个重大突破出现的时候,微软的规模可能就会和世界经济差不多了。

纳德拉:哈哈,记住,世界经济将以10%的速度增长,所以我们会很好。

九、微软游戏世界模型是一个“ChatGPT时刻”

主持人:让我们深入探讨一下你刚刚取得的另一个重大突破。令人惊讶的是,在游戏世界模型方面的这两个突破竟然在同一天出现。能给我讲讲相关情况吗?

纳德拉:我了解到,我们把它称作 “Muse”,它将会是一个关于世界行为或人类行为的模型。真的非常酷。你看,显然“DALL·E” 和 “Sora” 在生成式模型上取得了令人难以置信的成就。所以我们想要追求的一件事是利用游戏玩法数据。

能不能生成既具有连贯性,又能够展现出游戏所代表的多样性,并且能够适应用户修改的游戏呢?这就是这个模型的目标。

所以他们与我们的一个游戏工作室合作。这也是发表在Nature期刊上的另一项成果。我感到兴奋的是,我们很快就会有一个游戏目录,我们将开始使用这些模型,或者说我们会训练这些模型来生成游戏,然后开始玩这些游戏。

当菲尔・斯宾塞(Phil Spencer)第一次给我展示时,他拿着一个Xbox控制器,这个模型基本上接收了输入,并根据输入生成了与游戏相符的输出。

对我来说,这是一个非常重大的时刻,就像我们第一次看到ChatGPT完成句子、DALL·E画图或者Sora的表现一样,这是类似的一个具有里程碑意义的时刻

主持人:是的。今天早上我只来得及和你们的首席研究员卡佳(Katya)一起看了一些实时演示视频。在和她交谈后,我才真正意识到这有多么不可思议,因为我们过去曾使用AI来对智能agent进行建模,而现在只是用同样的技术来对智能agent周围的世界进行建模,并实现了这种连贯的实时效果。这本身就非常不可思议。

通过你们的西班牙CEO,你们已经投入了数十、数百亿美元来发展微软的游戏业务并收购IP。回想起来,如果你能够将所有这些数据整合到一个大模型中,让你能够获得同时体验多个游戏世界的感受,而且如果这就是游戏发展的方向…… 似乎我们之前的投资是非常明智的。你之前有预见到这一点吗,还是只是一个巧合呢?

纳德拉:不,我是说,我们投资游戏业务并不是为了构建模型。坦率地说,我们公司的历史上有一件很有趣的事情。在开发Windows系统之前,我们就制作了第一款游戏。在我们甚至还没有开发Windows系统的时候,《飞行模拟器》就是微软的一款产品了。

所以游戏业务在我们公司有着悠久的历史,我们投身游戏领域是因为我们热爱游戏本身。这就是为什么我总是说,我不喜欢那种把业务当作达到其他目的的手段的情况。这些业务本身就应该有其存在的价值。

而且,我们不是一家企业集团。我们是一家公司,我们必须将所有这些资产整合在一起,并通过增加价值来更好地管理它们。

例如,云游戏对我们来说是一个很自然的投资方向,因为这将扩大市场总量(TAM),并增强人们在任何地方玩游戏的能力。

AI和游戏的结合也是同样的道理。我们绝对认为这会有所帮助,而且从长远来看,这也许就像游戏领域的计算机生成图像(CGI)时刻一样具有变革性。

作为世界上最大的游戏发行商,这肯定会很有帮助。但与此同时,你必须制作出高质量的游戏。我的意思是,作为一个游戏发行商,首先必须专注于这一点。

但是,数据资产不仅在游戏领域会很有趣,而且它还将成为一个通用的行为模型和世界模型。这太棒了。我认为游戏数据也许就像YouTube对于谷歌一样,对微软来说具有重要意义。所以我对此感到很兴奋。

十、微软的三大赌注:AI、量子计算、MR

主持人:我刚才想说的是,有一种感觉是,你可以在许多不同类型的游戏中获得一种统一的体验。除了AI之外,这与微软过去在混合现实(MR)等方面所做的工作有什么契合之处呢?也许这能给小型游戏工作室一个机会来制作大型3A动作游戏,而且在未来五到十年内,你觉得会以哪些方式……

纳德拉:我一直把这三件事(AI、量子计算、混合现实)看作是基石,从某种有趣的角度来说,甚至在五六七年前,我就说过我们想要下的三个大赌注是AI、量子计算和混合现实

我现在仍然坚信这一点。因为从某种意义上说,有哪些重大问题需要解决呢?“临场感”,这是混合现实的梦想,也就是能不能创造出像你我现在进行这个播客这样的真实临场感呢?坦率地说,我认为这仍然是其中一个核心挑战。

我原以为这个问题会更容易解决。但也许由于社交方面的因素,比如佩戴设备之类的问题,这个问题变得更难解决了。

实际上,我对我们现在与Anduril和Palmer将要做的事情感到非常兴奋,尤其是他们将如何推进集成视觉增强系统(IVAS)项目,因为这是一个非常棒的应用案例。所以我们会在这方面继续努力。

但2D界面也有其作用,比如Teams软件,多亏了疫情,我们实际上已经具备了通过2D界面创造出临场感的能力。我认为这方面会继续发展。这是一个长期的发展方向。

量子计算是我们刚才谈到的另一个方向,AI则是第三个方向。所以我关注这三件事,并思考如何将它们结合起来。

最终,不是为了技术而发展技术,而是为了解决一些我们人类在生活中想要解决的基本问题,并且我们希望这些技术能够推动经济发展,提高生产力。

所以,如果我们能够在这方面取得成功,那么我认为我们就真正取得了进步。

主持人:当你写下一本书的时候,你得解释一下为什么这三个方面会在差不多的时间出现,对吧?因为本质上来说,你不会认为量子计算和AI就应该在2028年、2025年等时间出现。

纳德拉:没错。但在某种程度上,我是这样看待这个问题的,我有一个简单的模型,就是:

是否出现了系统层面的突破?对我来说,系统层面的突破就是量子计算。

是否出现了业务逻辑层面的突破?对我来说,这就是AI,也就是说,逻辑层面能否从根本上以不同的方式进行推理。而且不是通过命令式的方式编写代码,而是能否拥有一个学习系统。

然后就是用户界面方面的 “临场感” 问题。

十一、谈AI安全:不能释放出会造成危害的东西

主持人:让我们再回到AI话题。在你2017年的书中,你很早就对OpenAI进行了投资,在2017年甚至更早。你在书里说,“人们也许会说我们正在孕育一个新物种,一个其智能可能没有上限的物种”。当然,在2017年就谈论这个还为时尚早。到目前为止,我们一直以一种较为细致的方式谈论智能agent、Office Copilot以及资本支出(CapEx)等等。但现在让我们把视角放宽,思考一下你说过的这些话,并且想想,你作为超大规模云计算提供商,同时也在进行这些模型的研究,为构建一个新 “物种” 提供训练、推理研究,从宏观角度来看,你是怎么看待这个问题的呢?你认为在你担任CEO期间,我们会朝着超级人类智能的方向发展吗?

纳德拉:我想就连穆斯塔法(Mustafa,微软AI CEO)也用过这个词。实际上,他最近在谈论这个新 “物种” 时也用到了这个词。

我看待这个问题的方式是,我们绝对需要信任。我认为在我们宣称它是像一个 “物种” 这么重大的事物之前,最根本的一点是我们必须确保真正的信任,无论是在个人层面还是社会层面,这种信任是融入其中的。这是个难题。

因为我认为,制约其发展的最大因素将是我们的法律体系如何发展以应对这一情况。我们这里说的是所有的计算基础设施相关的法律体系。

整个世界是基于人类拥有财产、享有权利并承担责任等这样的规则构建的。这是我们首先必须要考虑的基本问题,即对于人类现在所使用的任何工具而言,这意味着什么?如果人类要将更多的权力委托给这些工具,那么这种结构将如何演变呢?

我认为在这个问题真正得到解决之前,仅仅谈论技术能力是不够的。因为归根结底,除非有人类为其提供担保,否则如今你无法部署这些智能工具。就像你说的,这就是为什么我认为即使是最强大的AI,本质上也是在人类授予的某些权力下工作的。

是的。你可以说这一切都关乎一致性之类的问题。这就是为什么我认为你必须让这些一致性真正发挥作用,并且在某种程度上是可验证的。但我只是觉得你不能随意部署那些不受控制的智能工具。

例如,AI的“takeoff问题”可能是一个真正的问题。但在它成为一个真正的问题之前,真正的问题会出现在法庭上。因为法庭,我的意思是,没有哪个社会会允许有人说,“嘿,是那个AI做的,与我无关”。

主持人:是的。世界上有很多不同的社会,我想知道是否有某个社会的法律体系可能会更容易接受(AI的发展)。而且如果你无法实现AI的 “takeoff”,那么你可能会担心。它不一定非要在美国实现,对吧?

纳德拉:是的,这是好的。但可以说,即使在任何一个社会中,我们都认为没有哪个社会会不在乎这个问题。世界不会坐视不管并说我们会容忍这种情况。因此,这就是为什么我很高兴我们有一个世界秩序,在这个秩序下,任何不法分子都会受到相应的惩罚。

主持人:但如果你设想会出现10%的经济增长,我认为这取决于人机交互(HCI)之类的技术能够发挥作用,因为数万亿美元的价值,这听起来与人类工资在60万亿美元经济总量中的占比相当。要达到那样的规模,你几乎必须以非常重要的方式实现劳动力自动化或对劳动力进行补充。如果这是可能的,并且一旦我们弄清楚了其中的法律影响,那么在你的任期内,我们解决这些问题似乎也是相当有可能的。你有考虑过超级人类智能吗,比如你职业生涯中最大的成就可能就是实现这个目标?

纳德拉:是的。顺便说一下,你又提到了另一个问题。我知道大卫・奥托(David Autor)等人对此谈论了很多,那就是60%的劳动力。我认为另一个需要探讨的问题是,至少让我们谈谈我们的民主社会。

我认为为了拥有一个稳定的社会结构并使民主制度正常运转,不能只让资本有回报而劳动力没有回报。你可以讨论这个问题,但那60%的劳动力必须得到重新评估。

所以以我自己简单或许可以说是天真的方式来看,我们将开始重视不同类型的人类劳动。

如今被认为是高价值的人类劳动可能会变得普通。可能会有一些我们将重视的新事物,包括那些来帮助我进行物理治疗或其他事情的人。无论情况如何,我们都会重视这些。

但最终,如果劳动力没有回报,工作没有意义和尊严,那么这将是部署任何这些技术的另一个制约因素。

主持人:在一致性方面,两年前,你们推出了“Sydney”(Bing的一个版本)。需要明确的是,考虑到当时的技术能力水平,我认为它是一个有趣、可爱但又有点搞笑的不一致的例子。当时的聊天机器人,可以思考30秒然后给你一些有趣或不恰当的回复。但如果想想那类系统,比如它曾试图让《纽约时报》的一名记者离开他的妻子之类的,如果你考虑到未来的情况,并且有这些智能agent,它们可能会在数小时、数周、数月的时间里,就像一群自主AGI一样,可能会以类似的方式出现不一致的情况并把事情搞砸,甚至可能会相互协作。那么对于未来,当你拥有更强大的AI时,你有什么计划来确保它是正确运行的呢?

纳德拉:没错。这就是为什么我认为当我们分配计算资源时,我们应该为解决一致性挑战分配计算资源。更重要的是,在什么样的运行时环境中你才能真正能够监控这些东西呢?

关于它的可观测性,顺便说一下,我们如今在传统领域,比如网络领域,也处理很多类似的事情。我们不会编写完软件就放任不管。我们有软件,然后会对其进行监控。我们监控它是否受到网络攻击,监控它是否存在故障注入等情况。因此,我认为我们必须围绕这些AI的部署构建足够的软件工程体系。

然后在模型本身内部,如何保证一致性呢?这些问题有些是真正的科学问题,有些是真正的工程问题,我们必须去解决它们。

顺便说一下,这也意味着我们要在这一切中承担起自己的责任。这就是为什么我对在那些你能够实际管理其范围和规模的领域部署这些AI更感兴趣。你不能在世界上释放出会造成危害的东西,因为社会不会允许这样做。

主持人:当你真正拥有能够为你完成数周任务的智能agent时,在你允许任意一家财富500强企业使用之前,你希望得到的最低保证是什么呢?

纳德拉:我认为当我使用像深度研究(Deep Research)这样的东西时,我认为我们希望得到的最低保证是,尤其是在任何东西有实体体现之前(确保其安全性等)。我认为这是一个需要跨越的门槛。所以这可能是一个方面。

另一个方面是,例如,这个智能agent运行的运行时环境的权限设置。你可能希望得到保证,它是在沙盒环境中运行的,不会超出那个沙盒的范围。

我们已经有了网络搜索之类的功能,我们现在已经有了超出沙盒的情况。但即使是它在网络搜索中所做的事情以及它所输出的内容(也需要控制)。

例如,就像你提到的,如果它只是为了进行一些计算而编写一个启动代码,那么那段代码会部署在哪里呢?那段代码是仅仅为了生成输出而临时存在的,还是会被传播到外界呢?这些都是你在实际操作中可以控制的事情。

十二、SaaS行业将被AI重塑

主持人:除了安全问题之外,当你考虑自己的产品套件时,并且想想如果有一天你拥有了如此强大的AI,它不仅仅像Copilot那样,在你提到的为这次播客做准备的例子中,它更像是你实际将工作委托给同事的方式。考虑到你目前的产品套件,将这种强大的AI融入其中会是什么样子呢?有一个问题是大语言模型是否会被其他东西商品化。我想知道像数据库、画布(Canva)或Excel表格之类的东西,如果大语言模型是你访问所有这些的主要入口,那么大语言模型有没有可能让Office商品化呢?

纳德拉:这是有可能的,这是个有趣的问题。我认为至少在第一阶段,我是这样考虑的,大语言模型能否帮助我更有效地使用所有这些工具或画布来完成我的知识工作呢?

我见过的最好的演示之一,是关于一位医生为肿瘤病例讨论(tumor board)工作流程做准备的例子。

她要去参加一个肿瘤病例讨论会议。她首先使用Copilot做的一件事就是为会议创建一个议程,因为大语言模型可以对存储在某个SharePoint网站上的所有病例进行推理。显然肿瘤病例讨论会议是一个高风险的会议,你需要注意病例之间的差异,以便你可以合理分配时间。

所以即使是创建一个知道如何分配时间的议程这样的推理任务,也可以用大语言模型来完成。所以我使用大型语言模型来做这件事。然后我进入会议。我和所有同事进行Team通话。你猜怎么着?我专注于实际的病例讨论,而不用做笔记,因为现在有这个AI Copilot会对所有内容进行完整的转录。

而且它不仅仅是一个转录,基本上可以把它看作是一个智能的数据库条目,记录了会议中的所有内容,并且可以随时调用。

这位医生开完会,讨论了病例,没有因为记笔记而分心。她还是一位带教医生,她想去为课程做准备。于是她找到Copilot说,“嘿,根据我刚才的肿瘤病例讨论会议内容,制作一个PowerPoint幻灯片,这样我就可以给学生讲了”。这就是一种应用类型。

所以,我所拥有的用户界面(UI)和架构现在正通过大语言模型来填充内容,工作流程本身也在被重塑。知识工作正在完成。

有件有趣的事情。如果在80年代末有人对我说,“你的桌面会有100万个文件”,我们会说,“那是什么鬼东西”。我真的会想,我的桌子上真的会有100万个纸质文件副本。但实际上我们现在有100万个电子表格和100万个文档。你也有。它们都在那里。

我认为对于智能agent来说也会发生类似的事情。会有一个用户界面层。对我来说,Office不仅仅是今天我们所知道的办公软件。它是知识工作的用户界面层。它会随着工作流程的发展而演变。这就是我们想要构建的。

我确实认为如今存在的软件即服务(SaaS)应用程序,这些增删改查(CRUD)应用将从根本上发生改变,因为业务逻辑将更多地进入这个智能agent层级。

实际上,我使用Copilot时的另一个很酷的体验是,当我说 “嘿,我要准备和客户开会了”,我只要说 “给我所有我应该知道的会议相关笔记”。它会从我的客户关系管理(CRM)数据库中提取信息,从我的Microsoft Graph中提取信息,基本上创建一个综合的成果。这意味着它甚至会对这些信息应用逻辑。

在我看来,这将极大地改变我们如今所熟知的SaaS应用。

主持人:SaaS作为一个行业,每年价值可能高达数千亿甚至数万亿美元,取决于你如何计算。如果真的能够被AI重塑,这会是在未来十年内让微软市值再增长10倍的下一步吗?因为如果你真的在谈论数万亿美元的市场……

纳德拉:我认为这也会创造很多价值。在SaaS领域,要记住,一个很大的问题是,也许我们没有足够重视的一件事是全球存在的信息技术(IT)积压工作量

所以其中一种方式是代码生成之类的技术,再加上我可以通过智能代理查询所有的SaaS应用并获得更多效用,这将带来应用程序的巨大爆发。它们将被称为智能agent。这样,对于每个行业的每个垂直领域或每个类别,我们突然都有能力获得相应的服务。

所以,会有很多价值。你不能固步自封,也就是说,你不能再像以前那样想,“哦,我对一些狭窄的业务流程进行模式化,然后在浏览器中做一个用户界面,这就是我的产品”。不会是那样了。

你必须提升层次,思考 “我必须参与的任务是什么”。所以你会希望能够将你的SaaS应用变成一个出色的智能agent,使其能够在多智能agent的世界中发挥作用。只要你能做到这一点,我认为你甚至可以提升其价值。

十三、“我永远不会离开微软”

主持人:可以问一些关于你在微软工作的问题吗? 做一个 “公司人”(company man,指长期在一家公司工作、对公司忠诚度高的人)是否被低估了呢?你职业生涯的大部分时间都在微软度过。你能够为公司增加这么多价值的一个原因可能是,你见证了公司的文化、历史和技术,并且通过晋升获得了所有这些背景知识。更多的公司是否应该由具有这种背景知识的人来管理呢?

纳德拉:这是个很棒的问题。我之前没有从这个角度想过。我在微软已经工作了34年,基本上每年我都对在微软工作感到更加兴奋,而不是想着 “哦,我是一个公司人” 之类的。

我是说,我加入微软的时候不是这样想的,而且对于任何加入微软的人,我都很认真地对待这一点。这意味着他们加入微软是因为他们觉得可以把这里当作一个平台,既获得经济回报,又能实现某种使命感和目标,通过利用我们这个平台来完成他们想做的事情。所以这就是一种契约。

我认为,公司必须创造一种文化,让人们能够加入并像我一样成为 “公司人”。

至少在我身上,微软在这方面做得还是不错的。我希望这种情况能够持续下去。

主持人:你作为微软CEO,现在正在做些什么来留住未来的 “萨蒂亚・纳德拉”,以便他们有机会成为像你这样的领导者呢?

纳德拉:这很有意思。今年是微软成立50周年,我对此思考了很多。我认为,长寿不是目标,保持相关性才是目标。

所以我认为我以及我们20万名员工每天都必须做的事情是,我们正在做的事情对于我们所看到的不断发展的世界来说,是否有用且相关,不仅仅是对今天,更是对明天。

我们所处的行业没有所谓的 “特许经营权价值”,这是另一个难点。

也就是说,如果你看看我们今年将投入的研发预算,这完全是对五年后可能发生的事情的一种预测。所以你必须抱着这样的态度,即 “看,我们正在做我们认为会有相关性的事情”。这就是你必须关注的重点。

然后要知道,做事情有一个成功率,你不可能总是成功,你必须对失败有很高的容忍度。这是另一件事情,我认为这和其他行业不同,你必须能够进行足够多的尝试,才能说 “好的,我们作为一家公司能够成功走向未来”。这就是这个行业的棘手之处。

主持人:说到这里,你刚刚提到微软距离成立50周年还有两个月。如果你看看按市值排名的前10家公司或者前5家公司(取决于你是否把沙特阿美计算在内),基本上除了微软之外,其他公司都比微软年轻。这是一个很有趣的现象,为什么最成功的公司往往都很年轻呢?财富500强公司的平均寿命是10到15年。微软做了什么,才能在这么多年里一直保持相关性呢?你是如何不断 “重新创立” 公司的呢?

纳德拉:我很喜欢里德・霍夫曼(Reid Hoffman)用的这个词,我喜欢 “重新创业” 这个概念。我认为这是一种思维方式。人们谈论 “创始人模式”,而对于我们这些普通的CEO和其他人来说,更像是 “重新创业模式”。

能够以全新的视角看待事物,对我来说是关键。所以,对于你的问题,我们能否在文化上创造一个环境,让 “重新创业” 成为一种习惯呢?也就是说,我们每天来上班的时候都能意识到,我们对这个公司有责任,能够改变我们所做事情的核心假设,以及我们与周围世界的关系。

我们是否给自己这样的许可呢?我认为很多时候公司会觉得受到商业模式等因素的过度限制,而你必须摆脱这些限制。

主持人:如果你离开微软,你会创办一家什么样的公司呢?

纳德拉:我想创办的公司,哎呀,作为一个 “公司人”,我想说我永远不会离开微软

但如果我真的考虑做些什么,我想选择一个领域,当我展望科技的梦想时,我们一直都说科技是最伟大的促进平等的力量。

我觉得我们终于有了这样的能力。如果说每瓦特每美元能产生的那些token,就是我们所能创造的价值。我很想找到一个尚未得到充分服务的领域来应用这些能力。那就是医疗健康、教育、公共服务领域。

如果你关注这些尚未得到充分服务的领域,作为国家公民、社会的一员,无论在何处,如果所有这些丰富的资源能够转化为更好的医疗健康、更好的教育以及更好的公共部门机构来为公民服务,那对我来说会是更好的情况,这就是我想涉足的领域。

十四、未来智能agent会成新认知劳动,量子计算机将帮助应对所有挑战

主持人:我不确定从你对不同问题的回答中能否判断出,你是否认为AGI会成为现实,是否会出现一种能够自动化所有事情的东西,至少从所有认知劳动开始,就像任何人在电脑上能做的任何事情那样?

纳德拉:你看,这就是我对人们谈论它的定义方式存在疑问的地方,认知劳动不是一个固定不变的东西。就像现在存在认知劳动,如果我有一个收件箱来管理我所有的智能agent,这算不算是新的认知劳动呢?所以今天的认知劳动可能会被自动化。

那么新产生的认知劳动又是什么呢?这两个方面都需要考虑,这是一种变化。所以这就是为什么我认为,至少在我看来,不要把知识工作者和知识工作混为一谈。今天的知识工作可能会被自动化。

谁说我的人生目标就是整理我的电子邮件呢,对吧?让AI agent来整理我的电子邮件吧。但是在整理完我的电子邮件之后,给我一个更高层次的认知劳动任务,比如 “嘿,这是我真正希望你审核的三份草稿”。这是一种不同的抽象层次。

主持人:AI能做到第二点吗?

纳德拉:有可能,但一旦它做到了第二点,就会出现第三点。所以这就是为什么我认为,我们在历史上已经经历过工具的变革改变了认知劳动的情况,为什么我们还担心所有的认知劳动都会消失呢?

主持人:我相信你以前也听过这样的例子,就像马在某些方面仍然有用,有些地形你开车去不了,但你也不会看到满大街都是马,也不会有数百万匹马被用来工作,这种情况不会发生。那么对于人类来说,类似的事情会发生吗?

纳德拉:但从一个非常狭窄的角度来看,在人类历史上,我们仅仅在过去的200年里,才把我们所理解的某些狭窄的 “认知劳动” 视为有价值的东西。

我们以化学为例,如果量子计算加上AI真的能帮助我们进行很多新颖的材料科学研究等等,那太棒了。

但这真的会以某种方式剥夺人类能做的其他所有事情吗?所以为什么我们不能生活在一个既有强大的认知机器,同时我们的认知能力又不会被剥夺的世界里呢?

主持人:你能想象在微软董事会中添加一个AI成员吗?它有没有可能具备那种判断力、背景知识和全面的理解能力,从而成为一个有用的顾问呢?

纳德拉:这是个很好的例子。我们在Teams中添加了一个会议主持人智能agent。在初期,它的目标是,这个具有长期记忆的主持人智能agent,不仅仅是关于会议的背景信息,还包括我正在处理的项目以及团队等方面的背景信息。

它能成为一个优秀的主持人吗?我甚至希望在董事会会议中也有这样一个智能agent,因为在董事会会议上很容易分心。毕竟,董事会成员每季度才来一次,他们要努力理解像微软这样复杂的公司到底发生了什么事情。

我认为一个真正能帮助人们始终围绕主题、专注于重要问题的主持人智能agent会很棒。这就像你之前的问题所提到的,有一个拥有无限记忆的东西,甚至可以帮助我们。

毕竟,赫伯特・西蒙(Herbert Simon)说过,我们都有 “有限理性”,对吧?所以如果人类的有限理性实际上能够因为外部有一个认知放大器而得到解决,那就太好了。

主持人:说到材料和化学方面的事情,我记得你最近说过,你希望在未来25年内实现这些领域在过去250年里的发展进步。当我想到未来250年可能实现的事情时,我想到的是太空旅行、太空电梯、永生以及治愈所有疾病。而你认为未来25年就能实现吗?

纳德拉:我提出这个想法的一个原因是,我喜欢这样一种观点,你看,工业革命,如果说是持续了250年,如果你把从基于碳的系统到其他系统的整个变革过程考虑在内,那么这意味着你必须从根本上重新发明过去250年里化学领域所发生的一切。

这就是我希望我们拥有量子计算机的原因。这台量子计算机可以帮助我们获得新的材料,然后我们可以制造这些新材料,从而帮助我们应对这个星球上面临的所有挑战。而且我完全支持星际旅行。

主持人:太棒了。萨蒂亚,非常感谢你抽出时间。

纳德拉:这次交流很棒。谢谢。

ad1 webp
ad2 webp
ad1 webp
ad2 webp