DeepSeek爆火，巨头开始反击

这个春节，几乎所有人都被“国产之光”DeepSeek的魔力征服了。

用高超的算法、开源技术路线、极低的成本，DeepSeek打破了科技巨头用算力构建起的高墙，也让AI平民化成为现实。

此刻，DeepSeek的冲击波效应还在继续。上线仅25天，DeepSeek便狂揽4000万次下载，超越了ChatGPT的首月下载量。到1月最后一周，DeepSeek在短短7天内便新增了1亿用户，累计用户达1.25亿（含Web、App，未去重）。

对于DeepSeek 而言，要如何承接住这波天量用户，已经成为甜蜜的烦恼。而对海内外“春节无休”的AI行业来说，DeepSeek引发的无处不在的资产重估，更在深层扩散。

01、紧急加入DeepSeek“朋友圈”

“苦命”的科技行业，已经连续三年没能过好春节了。

2023年春节，ChatGPT火爆出圈，掀起的AI巨浪席卷至今。2024年大年初五，OpenAI文生视频应用Sora上线了一段60秒视频，更一时让国内AI从业者惊惶、沮丧的论调成为主流。

2025年春节，“震惊体”的剧本相似，只是攻守易形。美国知名播客主持人莱克斯·弗里德曼用“DeepSeek时刻”来描述其火爆，“我认为5年后，它仍将作为科技史上的关键事件被人们铭记”。

面对“横空出世”的DeepSeek，国内外同行在春节火力全开、加班加点。

前百度高级研发工程师程伟对《财经天下》表示，“我身边不管是产业的、研发的，包括做投资的，大家都基本没有休息，盯着DeepSeek论文翻来覆去地读”。

2022年，程伟在大模型浪潮彻底爆发前，转行到了某大厂专供大模型算法架构。春节假期，他不断研究如何微调DeepSeek-R1模型，利用其开源框架和推理能力，重构自家产品的业务接口，提升用户端体验和信赖程度。

程伟表示，R1模型是目前唯一同时具备强推理能力和联网搜索的产品，可以对许多复杂信息进行回答。“比较遗憾的是还没有多模态，希望尽早推出。但R1写文章和代码，体验上要比OpenAI更顺手。”

媒体报道称，DeepSeek以3%的成本做出了接近ChatGPT o1水平的模型。低成本便可调校出足够好的AI模型，也让技术闭源的OpenAI，和用昂贵算力及CUDA生态拉高壁垒的英伟达神话不攻自破。

1月27日，英伟达股价跳水16.86%，单日市值蒸发5890亿美元，创全球单日市值下滑纪录。同日，美股芯片股集体崩盘，台积电下跌13.33%，博通下跌17.40%，ARM下跌10.19%。

给海外资本市场带来的剧烈扰动，也让对DeepSeek的“国运级别的科技成果”“摧毁英伟达的算力神话”“给硅谷带来了至暗时刻”溢美之词纷至沓来。

但在喧嚣逐渐沉淀后，AI业内也不断发出提醒：DeepSeek并没有那么神秘——它最大的意义在于，将ChatGPT等顶级模型的“秘方”用开源形式公之于众，从而缩短了全行业与科技巨头的差距和追赶时间。

拾象科技创始人李广密近日表示：严格意义上说，DeepSeek没有发明新范式。但它的重要意义在于帮助RL（强化学习）和test-time scaling(模型推理阶段规模化)这个新训练范式真正出圈。

“如果说OpenAI最初发布的o1是给行业出了一个谜语，DeepSeek就是第一个公开解谜的人。发布R1和 R1-zero之前，行业只有少部分人在实践RL和推理模型，DeepSeek给大家指明了路线图。”

技术创新的同时，DeepSeek快速“出圈”的影响力，也让海外云厂商纷纷打开接口，让其迅速获得了一张全球通行证。

1月29日，微软率先宣布将DeepSeek-R1上线其模型库，并表示会将R1优化版本引入其端侧AI助手。此后数天内，亚⻢逊云、谷歌云也先后在其平台上线了DeepSeek R1。

几乎同期，英伟达、AMD等芯片公司上线了基于旗下芯片的DeepSeek模型部署指南，下场争夺用户。

国产芯片、软硬件公司、云厂商更快速赶上，接入DeepSeek“朋友圈”，以形成软硬件协同，提升竞争力。

据《财经天下》不完全统计，目前，华为昇腾、沐曦科技、摩尔线程、壁仞科技等10多家国产AI芯片企业，都表示适配了DeepSeek原版或“蒸馏”后的小尺寸版本。

曾清一色围绕自家大模型展开服务的云厂商，也在DeepSeek的开源冲击下，拆掉了围墙。各家纷纷推出超低价格方案，试图吸引更多用户。

2月3日，百度智能云千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型，并推出超低价格方案及限时免费服务。当日，阿里云也在春节期间率先开工，“大年初六，我们进入正题”，并宣布其支持云上一键部署DeepSeek-V3、DeepSeek-R1模型。

据《财经天下》不完全统计，短短六天内，腾讯云、阿里云、华为云、百度智能云、火山引擎等数十家云计算服务龙头，其中不少都推出限时优惠、包年包月等选项。

对此，一位大模型从业人员对《财经天下》表示，“各大云厂商纷纷接入DeepSeek，本质上是希望让用户有交付成本更低的模型来做选择，给到更多权益。”

中国三大运营商云也紧随其后。联通云在2月3日宣布上线DeepSeek-R1系列多尺寸模型；移动云在2月5日宣布上线全版本、全尺寸的V3、R1及其他DeepSeek模型；中国电信天翼云则在2月6日宣布，基于华为昇腾芯片适配上线了V3、R1模型的全尺寸版本。

软件公司，也都抓紧来“蹭”DeepSeek的热度。用友网络、金蝶、万兴科技、360、奇安信、亚信安全等国内软件公司相继宣称，在部分产品中接入DeepSeek模型，从而增强软件产品的能力。

2月8日后，更有吉利汽车、岚图汽车、东风汽车等多家车企，纷纷宣布完成了与DeepSeek模型的深度融合。

02、AI投资人忙起来了

科技巨头们积极拥抱更低成本、更高流量的DeepSeek，也带来了AI应用的机会空前爆发，让在2024年显得有些“沉寂”的创投圈，重新变得暗流涌动。

虽然在投资圈，从业者们对DeepSeek的关注比C端要早得多。“2023年，DeepSeek已经是行业内很受关注的一股力量了。不过它们和资方距离比较远，与业内交流不太多。”曾经接触过DeepSeek内部人员的投资人陈静对《财经天下》说。

陈静表示，DeepSeek更贴合一家量化基金的公司气质。“最近大家都在说他们只要名校毕业生，但这在量化圈中并不罕见，其他量化公司也是这种招人风格。”

但DeepSeek与一般量化公司不同的是，“早在2022年web3十分火热的时期，幻方作为一家量化公司，就配有了VC部门，这是比较少见的。我当时就觉得，这是一个对新技术和创新特别敏锐的团队。”陈静说。

而当下，DeepSeek的爆发在一级和二级市场上，也为各行各业打开了全新的故事。

▲幻方量化创始人梁文锋

据《财经天下》不完全统计，春节期间有36家券商发布了超过92份DeepSeek研报。

节后，二级市场更因DeepSeek概念而活跃炽热。2月6日开盘，A股市场近20家科技公司股票强势涨停，青云科技、每日互动、优刻得，杭钢股份、美格智能涨停，宝兰德、三六零、天娱数科等细分赛道公司跟涨。

对于上述形势，未可知人工智能研究院院长、前红杉资本中国基金投资副总裁杜雨对《财经天下》表示：“现在大家对AI的评估不再是单赛道的评估，而变成了一种横向的评估。相当于所有的细分赛道公司，都可以拥有一个接近于免费的AI部门了。”

在杜雨看来，过去两年业内曾十分看重创业者的AI相关背景，现在大家也没有那么强调了。

“因为已经有个开源的、低成本的DeepSeek，招个工程师就能接入。对创始人AI背景的要求，会更多转向对过去所属细分行业的能力要求。”

比如2月6日，前追觅中国区总裁郭人杰成立的乐享科技，成功融到了2亿元天使投资，杜雨便认为与DeepSeek的影响不无关系。

“创始人是97年的年轻人，他们就是要做AI硬件。一级市场接下来也是一样，能够嫁接AI能力的传统公司，将会获得更多青睐。DeepSeek就像当年的微信生态，或者5G的存在，它赋予了很多普通人一个新的创业机会。”

在DeepSeek催生出的科技信心之下，也有投资人发现，同行们开始拉长投资周期，对于资金的耐心度变高了。

“已经看到一些大的人民币基金，开始投短期盈利没有那么清晰的公司了”，一位管理规模超百亿的科创基金的投资负责人陈佳亭对《财经天下》表示。

陈佳亭以往的投资方向正集中在AI领域。“去年上半年，投资圈对AI公司看机会的多，真正下手的不多。特别是美元基金又没那么活跃。”

但现在，无论是从AI应用端的激发，以及C端普通用户的体感变化，都对VC基金们形成了一股助推，投资人开始把关注点更多放到了AI应用及端侧AI上。

这些变化背后，正是DeepSeek通过开源和低价的模式，将过去动辄几千万、上亿美元的训练成本打了下来。AI公司实现目标的技术路径变了，新创企业们也获得了更普惠的选择。

近期，李广密对媒体表示：DeepSeek 虽然没有发明新范式，但推进整个行业进入了新范式。DeepSeek之后，原本计划不再发新模型的 OpenAI接连发出o3 mini，还在考虑开源模型。Anthropic和Google也会加快RL的研究，进一步帮助AI应用的智能体落地。

一场围绕着DeepSeek的浪潮，让所有从业者重新审视自己的科技资产，特别是基础模型研发的从业者，更要重新思考定价策略和未来的模型训练方向。

03、算力进入新一轮“烧钱”战

短期来看，DeepSeek在春节期间书写了一篇酣畅淋漓的“爽文”，戳破了英伟达和海外科技巨头的光环。The Information报道，Meta为此成立了4个 “作战室”，对DeepSeek模型进行逆向研发，从而改善自身模型。

DeepSeek的成功，也让硅谷高管对算力不计成本的投入，一度集体遭到了投资者的质疑。

1月21日，美国公布了“Stargate”(星际之⻔)计划，该计划由软银集团、甲⻣文、OpenAI三方成立合资公司，初步投资1000亿美元，用于在美国建设AI基础设施，未来4年内该投资将扩大至5000亿美元——而作为OpenAI的最大股东，微软被发现没有出现在“星际之⻔”的重要股东名单中。

▲1月21日，美国宣布了“Stargate”（星际之门）的高昂AI基础设施投资计划

但在国人为DeepSeek骄傲和兴奋的同时，也需看到，DeepSeek只是短期缩小了与OpenAI等巨头的距离，在性能上还远未达到赶超的程度。

不久前，一则关于“AI教母”李飞飞团队以不到50美元成本，训练出一个名为S1的人工智能推理模型的消息在网上发酵。

后来根据研究论文显示，S1模型并非从零开始训练，而是用“蒸馏”技术，以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座，使用1000个问题及推理，在16块H100 GPU上进行了26分钟的监督微调（STF）得来的。

简而言之，DeepSeek和“蒸馏”技术会大幅降低模型训练成本，但无法创造出全新、更强大的推理模型。

这也让硅谷巨头们在短期的“恍惚”中，又在近期重新打响了新一轮的AI融资“烧钱”大战。

最近几天，媒体曝出OpenAI前首席科学家Ilya Sutskever的新初创公司SSI已获得新一轮融资，估值将超200亿美元。OpenAI一笔400亿美元的新融资也即将收尾，投后估值将达到3000亿美元。Anthropic，超20亿美元新融资已认购，估值将超600亿美元。

在最新财报季中，微软、谷歌、Meta、亚马逊等巨头也相继宣布，今年会大增AI资本支出，合计投入将超过3150亿美元。近日，英伟达股价在暴跌后反弹，市值也重新站上万亿美元关口。

对于巨头的新一轮投入，李广密表示：DeepSeek的冲击从短期看，作为领头羊的 OpenAI 属于最“吃亏”的那个，“之前想捂着技术不开源，半遮半掩，希望多赚技术溢价的美梦无法实现了。”

但中长期看，DeepSeek开源把大家水平拉齐，全新探索又需要10倍甚至更大量级的GPU投入。这仍会让GPU资源充裕的公司受益。例如，第二梯队的Meta反而会是最大受益方，可以快速跟进新方法，让训练更有效率。

“从第一性原理来讲，无论是发展智能还是应用智能，AI产业从物理本质上就必然要消耗海量算力。这是基础定律决定的，不是技术优化能完全规避的。”

而DeepSeek在爆火了一整个春节后，要承接海量用户的服务，对推理、算力的需求也仍旧极为庞大。最近常用DeepSeek的用户会发现，“服务器繁忙”成了最常跳出的答案。

国际机构SemiAnalysis报告指出，考虑到服务器资本支出、运营成本等因素，DeepSeek的总拥有成本（TCO）在4年内可能达到25.73亿美元。

未来，随着模型的普及和应用场景的扩展，对大模型的推理需求必将持续指数级增长，这也将推动中美AI竞赛出现新的变迁和焦点。

近日媒体报道，华为、天数智芯等芯片制造商们，都在积极布局大模型训练推理及AI算力产品，推出推理模型。而在春节期间被DeepSeek“弯道超车”的大模型公司们，面对竞争也需要亮出新招。

陈佳亭透露：“国内某些大模型公司后续预计也会发布与DeepSeek技术路线相似的模型。但从用户量级和实际效果的角度，会不会像 DeepSeek提升得这么快，上线后表现如何，还要拭目以待。”

“每一条技术路线都会有瓶颈。大家也都处于探索期，这个竞赛还远没到真正分出胜负的阶段。”杜雨说。

（程伟、陈静为化名）

作者 |豆蔻

编辑 |李不清

图片来源 |视觉中国

CBA

未开始

新疆

04-29

广州

CBA

未开始

浙江

04-29

上海

CBA

未开始

广东

04-28

广厦

CBA

未开始

辽宁

04-28

深圳

CBA

未开始

上海

04-26

浙江

CBA

未开始

广州

04-26

新疆

CBA

未开始

深圳

04-25

辽宁

CBA

未开始

广厦

04-25

广东

CBA

未开始

广州

04-24

新疆

CBA

未开始

上海

04-24

浙江

CBA

未开始

深圳

04-23

辽宁

CBA

未开始

广厦

04-23

广东

西甲第32轮

未开始

皇马

04-22

巴萨

法甲第30轮

未开始

大巴黎

04-22

里昂

西甲第32轮

未开始

阿拉维斯

04-22

马竞

英超第34轮

未开始

富勒姆

04-21

利物浦