英伟达CEO黄仁勋称市场对DeepSeek带来的影响存在误解。


黄仁勋接受采访

在近日播出的一档采访节目中,黄仁勋在与英伟达合作伙伴、数据中心解决方案提供商DataDirect Networks的CEO亚历克斯・布扎里(Alex Bouzari)进行交谈时,称中国AI(人工智能)初创公司深度求索(DeepSeek)的开源推理模型R1“令人兴奋不已”,而市场对于R1的反应中存在一些误解,R1的发布本质上利好AI市场。

黄仁勋表示:“我认为市场对R1的反应是,‘天哪,AI已经完了’。你知道,就像是R1从天而降,我们不再需要进行任何计算。但事实恰恰相反。”

黄仁勋认为,R1的发布本质上利好AI市场,能够加速AI被采用,也就意味着市场仍然需要计算资源:“这让每个人都注意到,模型的效率远超我们的想象。因此,它正在不断扩大,并加速AI的普及。”

黄仁勋还指出,虽然DeepSeek在AI模型的预训练方面取得了进步,但作为模型“学习解决问题”的关键环节,后训练(post-training)仍然很重要,需要大量的资源,并且推理本身就是“计算密集型的部分”。黄仁勋表示:“从投资者的角度来看,他们有一种思维模式,认为只要先进行预训练,然后进行推理,而推理就是向AI提问并立即得到答案。显然,这种观念是错误的。”

2月21日,英伟达(Nasdaq:NVDA)跌4.05%收于每股134.43美元,总市值3.29万亿美元。公司将于当地时间2月26日公布其2024财年第四财季业绩。

此前,1月20日,DeepSeek推出高性能的开源大模型DeepSeek-R1,随后在国际市场上引发轰动。1月24日,英伟达股价收于每股142.62美元,在下一个工作日(1月27日)大幅下跌收于每股118.52美元,导致英伟达市值在短短三天内蒸发6000亿美元。

当地时间1月27日,英伟达发言人表示:“DeepSeek是AI领域的一项卓越进步,也是测试时间缩放(Test Time Scaling)技术的完美范例。DeepSeek的工作展示了如何利用这种技术、广泛可用的模型以及完全符合出口管制的计算资源来创建新型号。推理过程需要大量英伟达GPU和高性能网络支持。我们现在掌握三种扩展规律:持续进行的预训练与后训练,以及新的测试时间缩放技术。”

1月30日,英伟达官方网站宣布,DeepSeek-R1模型正式上线英伟达NIM平台。而现在,英伟达股价基本恢复到了这波大跌前的水平。

1月末至2月初,科技巨头微软、Meta、谷歌母公司Alphabet、亚马逊先后发布2024年最后一个季度的业绩报告,四家巨头在2025年的资本支出不约而同地持续上涨,意味着AI竞赛将愈发激烈。DeepSeek也成为了几乎每位科技巨头CEO在财报后电话会上都会被问到的话题,总体来看,巨头们认为AI成本下降是未来趋势,也会带来发展机遇,让AI被更多企业采用并创造新的营收渠道。

当地时间2月4日美股盘后,被视为英伟达竞争对手的芯片巨头超威半导体公司(AMD)公布了截至2024年12月31日的2024年第四季度业绩。公司CEO苏姿丰强调,最近在AI领域出现了一些新突破,例如DeepSeek开发R1大模型和美国宣布成立5000亿美元“星际之门”项目,而这些正是公司“希望看到的那种进步”:“所有这些举措都需要大量的新的计算,为AMD在整个业务中创造了前所未有的增长机会。”

延伸阅读

DeepSeek关键工程师曾在英伟达实习 美前官员发出感叹

中国人工智能(AI)初创企业DeepSeek的“异军突起”,不仅给硅谷带来技术路线的冲击,震动了华尔街资本市场,也引发了美国对于AI人才流动的反思。

英伟达高级研究科学家禹之鼎日前在社交媒体透露,DeepSeek旗下一名关键工程师曾在这家美国AI芯片巨头实习且有望转正,但最终选择回国加入当时仍名不见经传的DeepSeek。这让美国知名国际政治学者、前助理国防部长格雷厄姆·艾利森感叹,美国未能真正吸引、留住人才,应为华盛顿敲响警钟。

“印象深刻”的决定

这名受到艾利森关注的DeepSeek研究员名为潘梓正。潘梓正在GitHub上公开的简历显示,他本科毕业于哈尔滨工业大学,硕士毕业于澳大利亚阿德莱德大学。2021年至2024年,他在莫纳什大学攻读计算机科学博士,2023年夏季曾在英伟达实习。



潘梓正(右)及他在DeepSeek-VL2多模态模型论文中的署名 GitHub

1月27日,DeepSeek登顶苹果美区应用商店免费App下载排行榜,潘梓正在社交平台X(原推特)上发帖庆祝,曾是他在英伟达实习期间导师的禹之鼎随即转发,同时披露了潘梓正加入DeepSeek前的故事。

禹之鼎回忆,英伟达当时原本正考虑给潘梓正全职工作机会,但他“毫不犹豫”选择回国加入DeepSeek,当时这家初创公司的多模态团队还只有3人。禹之鼎说,潘梓正后来在DeepSeek的多个重要项目中发挥了“关键作用”,包括DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1。

“我至今仍然对梓正当时的决定印象深刻……我个人非常为他的决定和取得的巨大成就感到高兴。”禹之鼎写道,“梓正的案例是近年来我所见到的一个非常典型的例子。我们许多最优秀的人才都来自中国,而这些人才并不一定只能在美国公司取得成功。相反,我们也从他们身上学到了很多。”



潘梓正发文庆祝DeepSeek超越ChatGPT下载量登顶的“现象级时刻”,禹之鼎转发祝贺 X截图

“不是第一位,也不会是最后一位”

此后不到两年,DeepSeek就凭借开源模型-V3和推理模型R1在海内外一举成名。

V3的正式训练成本仅为557.6万美元,约为美国OpenAI GPT-4预算的1/20;R1性能比肩OpenAl o1,但将每百万token(自然语言处理和机器学习分割语言的基本处理单元,AI模型通过token对文本进行理解和处理)的价格从o1的60美元降至2.19美元,差价近30倍。

“R1证明了,突破性的AI进展不一定依赖于更大的计算集群和更庞大的数据集。”《麻省理工科技评论》评价道,“这些发现正在颠覆‘更大即更好’的传统认知,为那些计算资源有限的机构和企业带来了新的可能。”DeepSeek最新模型发布后,英伟达市值单日蒸发近6000亿美元,美国上市科技企业总市值单日缩水约1万亿美元。

这让美国知名国际政治学者、哈佛大学肯尼迪政府学院创始院长、美国前助理国防部长格雷厄姆·艾利森(Graham Allison)不禁发问:“是谁错失了DeepSeek?”



艾利森 英国《新政治家》杂志网站

艾利森2月1日发文,形容DeepSeek对美国AI公司的颠覆堪比《圣经》中大卫杀死巨人哥利亚。“它也生动地提醒我们,美国必须严肃对待吸引和留住人才这件事,尤其是来自中国的人才。”

“为什么潘梓正——在开发DeepSeek的R1模型中发挥主导作用的工程师——会选择把自己的才能投入到中国,而不是美国,来创造这一非凡的技术突破?”艾利森说,“答案:因为他为之开发算法的硅谷公司没有为他提供机会,让他能在美国继续做这项工作。”

他就此提到同样从美国归国的中国“两弹一星”元勋钱学森——1950年代,钱学森受到美国麦卡锡主义风潮波及,被控同情共产主义,被“驱逐回国”——并断言潘梓正“不是美国失去的第一位超级人才,也不会是最后一位”。



艾利森认为,潘梓正“不是美国失去的第一位超级人才,也不会是最后一位” X截图

艾利森引述美国《华尔街日报》一篇专栏文章强调,中国的工程师总数是美国的9倍,STEM(科学、技术、工程、数学)毕业生数量更是美国的15倍。“在当前世界里,像钱学森、(英伟达CEO)黄仁勋或(特斯拉CEO)马斯克这样百万分之一的超级天才可以用脚投票,把他们的才华用在他们选择的任何地方。”

回国发展成趋势

事实上,总部位于美国的科技媒体Rest of World(下称“RoW”)最近与多名中国科技行业人士对话后发现,放弃硅谷工作、选择在国内发展已经成为中国顶尖AI人才内部的一种趋势。

据一名在美国知名科技公司工作的的中国AI研究员向RoW透露,美国公司会聘请工程或数据处理能力强的中国实习生,以远程或在硅谷办公室的方式参与AI项目,且这些中国学生的工作往往“非常扎实”。

不过,该研究员表示,这些中国学生即使拿到转正机会,许多人还是选择回国。“让我感到惊讶的是,许多中国学生对在美国从事全职工作并不那么感兴趣。”

关于其背后原因,有业内人士向RoW指出,优秀毕业生在国内就业不仅生活成本更低、离家人更近,还利于个人发展,在职业生涯起步阶段就有机会负责关键工作。

此外,报道分析,也有部分原因在于美国近来移民政策对于华人并不友好,以及随着中国国内AI产业的蓬勃发展,相关领域毕业生在国内就业的选择变得更多,既有阿里巴巴这样的科技巨头,也有阶跃星辰、Minimax和零一万物为代表的初创公司。

中国AI人才库储备充足

根据美国保尔森基金会旗下的麦克罗波洛智库(Macro Polo)去年3月发布的一项研究,从本科院校来看,中国高校几乎培养了全球一半的顶尖AI研究人员;相比之下,仅有约18%研究人员来自美国大学。

研究还称,尽管美国在生成式AI领域率先取得了突破性进展,但其中很大一部分工作是由在中国接受教育的研究人员完成的。据悉,美国顶尖AI研究人员中,来自中国的研究人员占38%,美国人占37%。

在美国南加州大学研究中国科技法规的法学教授张湖月看来,DeepSeek的成功正“凸显了中国AI人才库的实力”。“大量能力强、技术娴熟的软件工程师为DeepSeek提供了支持。”张湖月说,“我相信,这种人才优势为中国下一阶段的AI发展奠定了坚实的基础。”

RoW称,借由国内高校、实验室以及美国科技巨头在华的研究机构(如总部设在北京的微软亚洲研究院),中国培养了一大批本土AI研究人员,DeepSeek更是从中优中选优。

报道举例说,DeepSeek-R1模型的核心贡献者宋俊潇,学生时代就已在同龄人中崭露头角。宋俊潇在香港科技大学攻读电子与计算机工程期间的博士生导师丹尼尔·帕洛马尔(Daniel Palomar)说,宋学习刻苦,“不知怎的,(DeepSeek)设法找到了精英中的精英”。

ad1 webp
ad2 webp
ad1 webp
ad2 webp