经济观察网 记者 沈怡然 2月13日,一位英伟达代理商告诉经济观察网记者,春节后第一周,两家中国科技企业为支撑开源大模型DeepSeek的推理服务,紧急向他们公司采购了L20 GPU算力设备。“去年,客户下单总要反复考虑和比价,现在连库存的禁售型号都抢空了”。

DeepSeek的出现颠覆了市场将高性能GPU视为AI赛道核心的传统认知,导致作为高性能GPU垄断者的英伟达率先被市场看空。

然而,更多产业人士发现,近期,无论是高性能的H系列GPU,还是RTX 40系列的高端显卡,英伟达的GPU重新变得供不应求。

算力需求爆发

前述英伟达代理商目前正加紧为客户调配英伟达的产品。他发现,英伟达芯片在中国市场全线紧缺,一些已经禁售的H800系列存货一卡难求。

此时,接入DeepSeek的中外企业已达数百家,国内云服务、互联网、手机、芯片、金融、医疗、汽车等行业都在上线和部署DeepSeek。

迅速增长的用户量为上述企业带来“泼天富贵”:云服务借此兜售算力、芯片企业借此推广产品、车企以更低成本升级自己的软件、上市公司借此推升市值。

一家IT厂商对经济观察网记者称,其调用DeepSeek的平台在上线首日增加了上万个用户,服务器几乎崩溃,现有算力已经跟不上用户的需求。团队为缓解压力,不得不紧急调配更多英伟达GPU。许多上线DeepSeek的平台显示服务器繁忙,实际上是平台提供的算力跟不上飞速增长的用户需求。

向金融、科研、航空航天等企业提供超算云服务的并行科技(839493.BJ)董事长陈健称,模型的生命周期通常是先训练,然后部署为服务,最后进行推理。目前是企业在DeepSeek模型推理过程中爆发了大量算力需求。

据经济观察网记者统计,英伟达在中国合法销售的型号包括:H20、L20,T4;游戏显卡涵盖RTX 40系列(除RTX 4090外)和RTX 30系列及更早型号,还有新推出的RTX 5090限制版5090D。

目前市面上有十几款国产GPU品牌,但普遍在性能、稳定性和生态上与英伟达存在一定差距,英伟达卡仍是企业们的最优选择。

DeepSeek的R1模型发布后,英伟达股价遭遇过去一年来最大跌幅17%,但自2月3日开始出现反弹,目前回升了13%。

国内某模型厂商一位人士对经济观察网记者称,DeepSeek的出现让业界反思算力泡沫,AI训练是否可以不再依赖大规模的高端GPU集群,但是随着提供模型和使用模型的个人和企业都在爆发式增长,大量的模型推理再一次推升了对英伟达卡的需求。

陈健认为,DeepSeek带给产业界的震动是AIGC大模型训练、推理算力消耗大幅降低。相比模型推理,模型训练的需求并没有在短期内出现爆发式增长。

算力需求可持续吗?

DeepSeek展现出强大的推理能力与优秀的文采,但是提供DeepSeek服务的代价也很大。

上述国内模型厂商人士表示,目前DeepSeek满血版对硬件配置要求非常高,至少需要两台H800卡才能运行起来,而国内大多数基础模型只需要一台4090卡就能运行。

通常来说,模型能力与参数量和精度密切相关,参数量影响AI的知识量,精度影响AI的准确性和推理能力,这也是为什么很多平台上线的DeepSeek看起来“智商”不足,因为背后的算力不足以支持模型在参数量和精度上达到最佳状态。

不过,上述国内模型厂商人士认为,这种急迫的算力需求未必持续很久。在实际应用中,开发者通常会将超过600B参数量的模型进行蒸馏,压缩到更低参数规模,再用于商业化。而DeepSeek发展得太快以至于团队还没来得及完成蒸馏,可能后续几个月蒸馏好后,那些上线DeepSeek的企业可以节约一些推理算力。


沈怡然经济观察报记者

大科创新闻部记者
关注硬科技领域,包括机器人及人工智能、无人机、虚拟现实(VR/AR)、智能穿戴,以及新材料领域。擅长企业深度报道及上市公司分析报道。发现前沿技术、发展趋势投资价值。

ad1 webp
ad2 webp
ad1 webp
ad2 webp