这个春节,几乎所有人都被“国产之光”DeepSeek的魔力征服了。
用高超的算法、开源技术路线、极低的成本,DeepSeek打破了科技巨头用算力构建起的高墙,也让AI平民化成为现实。
此刻,DeepSeek的冲击波效应还在继续。上线仅25天,DeepSeek便狂揽4000万次下载,超越了ChatGPT的首月下载量。到1月最后一周,DeepSeek在短短7天内便新增了1亿用户,累计用户达1.25亿(含Web、App,未去重)。
对于DeepSeek 而言,要如何承接住这波天量用户,已经成为甜蜜的烦恼。而对海内外“春节无休”的AI行业来说,DeepSeek引发的无处不在的资产重估,更在深层扩散。
01、紧急加入DeepSeek“朋友圈”
“苦命”的科技行业,已经连续三年没能过好春节了。
2023年春节,ChatGPT火爆出圈,掀起的AI巨浪席卷至今。2024年大年初五,OpenAI文生视频应用Sora上线了一段60秒视频,更一时让国内AI从业者惊惶、沮丧的论调成为主流。
2025年春节,“震惊体”的剧本相似,只是攻守易形。美国知名播客主持人莱克斯·弗里德曼用“DeepSeek时刻”来描述其火爆,“我认为5年后,它仍将作为科技史上的关键事件被人们铭记”。
面对“横空出世”的DeepSeek,国内外同行在春节火力全开、加班加点。
前百度高级研发工程师程伟对《财经天下》表示,“我身边不管是产业的、研发的,包括做投资的,大家都基本没有休息,盯着DeepSeek论文翻来覆去地读”。
2022年,程伟在大模型浪潮彻底爆发前,转行到了某大厂专供大模型算法架构。春节假期,他不断研究如何微调DeepSeek-R1模型,利用其开源框架和推理能力,重构自家产品的业务接口,提升用户端体验和信赖程度。
程伟表示,R1模型是目前唯一同时具备强推理能力和联网搜索的产品,可以对许多复杂信息进行回答。“比较遗憾的是还没有多模态,希望尽早推出。但R1写文章和代码,体验上要比OpenAI更顺手。”
媒体报道称,DeepSeek以3%的成本做出了接近ChatGPT o1水平的模型。低成本便可调校出足够好的AI模型,也让技术闭源的OpenAI,和用昂贵算力及CUDA生态拉高壁垒的英伟达神话不攻自破。
1月27日,英伟达股价跳水16.86%,单日市值蒸发5890亿美元,创全球单日市值下滑纪录。同日,美股芯片股集体崩盘,台积电下跌13.33%,博通下跌17.40%,ARM下跌10.19%。
给海外资本市场带来的剧烈扰动,也让对DeepSeek的“国运级别的科技成果”“摧毁英伟达的算力神话”“给硅谷带来了至暗时刻”溢美之词纷至沓来。
但在喧嚣逐渐沉淀后,AI业内也不断发出提醒:DeepSeek并没有那么神秘——它最大的意义在于,将ChatGPT等顶级模型的“秘方”用开源形式公之于众,从而缩短了全行业与科技巨头的差距和追赶时间。
拾象科技创始人李广密近日表示:严格意义上说,DeepSeek没有发明新范式。但它的重要意义在于帮助RL(强化学习)和test-time scaling(模型推理阶段规模化)这个新训练范式真正出圈。
“如果说OpenAI最初发布的o1是给行业出了一个谜语,DeepSeek就是第一个公开解谜的人。发布R1和 R1-zero之前,行业只有少部分人在实践RL和推理模型,DeepSeek给大家指明了路线图。”
技术创新的同时,DeepSeek快速“出圈”的影响力,也让海外云厂商纷纷打开接口,让其迅速获得了一张全球通行证。
1月29日,微软率先宣布将DeepSeek-R1上线其模型库,并表示会将R1优化版本引入其端侧AI助手。此后数天内,亚⻢逊云、谷歌云也先后在其平台上线了DeepSeek R1。
几乎同期,英伟达、AMD等芯片公司上线了基于旗下芯片的DeepSeek模型部署指南,下场争夺用户。
国产芯片、软硬件公司、云厂商更快速赶上,接入DeepSeek“朋友圈”,以形成软硬件协同,提升竞争力。
据《财经天下》不完全统计,目前,华为昇腾、沐曦科技、摩尔线程、壁仞科技等10多家国产AI芯片企业,都表示适配了DeepSeek原版或“蒸馏”后的小尺寸版本。
曾清一色围绕自家大模型展开服务的云厂商,也在DeepSeek的开源冲击下,拆掉了围墙。各家纷纷推出超低价格方案,试图吸引更多用户。
2月3日,百度智能云千帆平台正式上架DeepSeek-R1和DeepSeek-V3模型,并推出超低价格方案及限时免费服务。当日,阿里云也在春节期间率先开工,“大年初六,我们进入正题”,并宣布其支持云上一键部署DeepSeek-V3、DeepSeek-R1模型。
据《财经天下》不完全统计,短短六天内,腾讯云、阿里云、华为云、百度智能云、火山引擎等数十家云计算服务龙头,其中不少都推出限时优惠、包年包月等选项。
对此,一位大模型从业人员对《财经天下》表示,“各大云厂商纷纷接入DeepSeek,本质上是希望让用户有交付成本更低的模型来做选择,给到更多权益。”
中国三大运营商云也紧随其后。联通云在2月3日宣布上线DeepSeek-R1系列多尺寸模型;移动云在2月5日宣布上线全版本、全尺寸的V3、R1及其他DeepSeek模型;中国电信天翼云则在2月6日宣布,基于华为昇腾芯片适配上线了V3、R1模型的全尺寸版本。
软件公司,也都抓紧来“蹭”DeepSeek的热度。用友网络、金蝶、万兴科技、360、奇安信、亚信安全等国内软件公司相继宣称,在部分产品中接入DeepSeek模型,从而增强软件产品的能力。
2月8日后,更有吉利汽车、岚图汽车、东风汽车等多家车企,纷纷宣布完成了与DeepSeek模型的深度融合。
02、AI投资人忙起来了
科技巨头们积极拥抱更低成本、更高流量的DeepSeek,也带来了AI应用的机会空前爆发,让在2024年显得有些“沉寂”的创投圈,重新变得暗流涌动。
虽然在投资圈,从业者们对DeepSeek的关注比C端要早得多。“2023年,DeepSeek已经是行业内很受关注的一股力量了。不过它们和资方距离比较远,与业内交流不太多。”曾经接触过DeepSeek内部人员的投资人陈静对《财经天下》说。
陈静表示,DeepSeek更贴合一家量化基金的公司气质。“最近大家都在说他们只要名校毕业生,但这在量化圈中并不罕见,其他量化公司也是这种招人风格。”
但DeepSeek与一般量化公司不同的是,“早在2022年web3十分火热的时期,幻方作为一家量化公司,就配有了VC部门,这是比较少见的。我当时就觉得,这是一个对新技术和创新特别敏锐的团队。”陈静说。
而当下,DeepSeek的爆发在一级和二级市场上,也为各行各业打开了全新的故事。
▲幻方量化创始人梁文锋
据《财经天下》不完全统计,春节期间有36家券商发布了超过92份DeepSeek研报。
节后,二级市场更因DeepSeek概念而活跃炽热。2月6日开盘,A股市场近20家科技公司股票强势涨停,青云科技、每日互动、优刻得,杭钢股份、美格智能涨停,宝兰德、三六零、天娱数科等细分赛道公司跟涨。
对于上述形势,未可知人工智能研究院院长、前红杉资本中国基金投资副总裁杜雨对《财经天下》表示:“现在大家对AI的评估不再是单赛道的评估,而变成了一种横向的评估。相当于所有的细分赛道公司,都可以拥有一个接近于免费的AI部门了。”
在杜雨看来,过去两年业内曾十分看重创业者的AI相关背景,现在大家也没有那么强调了。
“因为已经有个开源的、低成本的DeepSeek,招个工程师就能接入。对创始人AI背景的要求,会更多转向对过去所属细分行业的能力要求。”
比如2月6日,前追觅中国区总裁郭人杰成立的乐享科技,成功融到了2亿元天使投资,杜雨便认为与DeepSeek的影响不无关系。
“创始人是97年的年轻人,他们就是要做AI硬件。一级市场接下来也是一样,能够嫁接AI能力的传统公司,将会获得更多青睐。DeepSeek就像当年的微信生态,或者5G的存在,它赋予了很多普通人一个新的创业机会。”
在DeepSeek催生出的科技信心之下,也有投资人发现,同行们开始拉长投资周期,对于资金的耐心度变高了。
“已经看到一些大的人民币基金,开始投短期盈利没有那么清晰的公司了”,一位管理规模超百亿的科创基金的投资负责人陈佳亭对《财经天下》表示。
陈佳亭以往的投资方向正集中在AI领域。“去年上半年,投资圈对AI公司看机会的多,真正下手的不多。特别是美元基金又没那么活跃。”
但现在,无论是从AI应用端的激发,以及C端普通用户的体感变化,都对VC基金们形成了一股助推,投资人开始把关注点更多放到了AI应用及端侧AI上。
这些变化背后,正是DeepSeek通过开源和低价的模式,将过去动辄几千万、上亿美元的训练成本打了下来。AI公司实现目标的技术路径变了,新创企业们也获得了更普惠的选择。
近期,李广密对媒体表示:DeepSeek 虽然没有发明新范式,但推进整个行业进入了新范式。DeepSeek之后,原本计划不再发新模型的 OpenAI接连发出o3 mini,还在考虑开源模型。Anthropic和Google也会加快RL的研究,进一步帮助AI应用的智能体落地。
一场围绕着DeepSeek的浪潮,让所有从业者重新审视自己的科技资产,特别是基础模型研发的从业者,更要重新思考定价策略和未来的模型训练方向。
03、算力进入新一轮“烧钱”战
短期来看,DeepSeek在春节期间书写了一篇酣畅淋漓的“爽文”,戳破了英伟达和海外科技巨头的光环。The Information报道,Meta为此成立了4个 “作战室”,对DeepSeek模型进行逆向研发,从而改善自身模型。
DeepSeek的成功,也让硅谷高管对算力不计成本的投入,一度集体遭到了投资者的质疑。
1月21日,美国公布了“Stargate”(星际之⻔)计划,该计划由软银集团、甲⻣文、OpenAI三方成立合资公司,初步投资1000亿美元,用于在美国建设AI基础设施,未来4年内该投资将扩大至5000亿美元——而作为OpenAI的最大股东,微软被发现没有出现在“星际之⻔”的重要股东名单中。
▲1月21日,美国宣布了“Stargate”(星际之门)的高昂AI基础设施投资计划
但在国人为DeepSeek骄傲和兴奋的同时,也需看到,DeepSeek只是短期缩小了与OpenAI等巨头的距离,在性能上还远未达到赶超的程度。
不久前,一则关于“AI教母”李飞飞团队以不到50美元成本,训练出一个名为S1的人工智能推理模型的消息在网上发酵。
后来根据研究论文显示,S1模型并非从零开始训练,而是用“蒸馏”技术,以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,使用1000个问题及推理,在16块H100 GPU上进行了26分钟的监督微调(STF)得来的。
简而言之,DeepSeek和“蒸馏”技术会大幅降低模型训练成本,但无法创造出全新、更强大的推理模型。
这也让硅谷巨头们在短期的“恍惚”中,又在近期重新打响了新一轮的AI融资“烧钱”大战。
最近几天,媒体曝出OpenAI前首席科学家Ilya Sutskever的新初创公司SSI已获得新一轮融资,估值将超200亿美元。OpenAI一笔400亿美元的新融资也即将收尾,投后估值将达到3000亿美元。Anthropic,超20亿美元新融资已认购,估值将超600亿美元。
在最新财报季中,微软、谷歌、Meta、亚马逊等巨头也相继宣布,今年会大增AI资本支出,合计投入将超过3150亿美元。近日,英伟达股价在暴跌后反弹,市值也重新站上万亿美元关口。
对于巨头的新一轮投入,李广密表示:DeepSeek的冲击从短期看,作为领头羊的 OpenAI 属于最“吃亏”的那个,“之前想捂着技术不开源,半遮半掩,希望多赚技术溢价的美梦无法实现了。”
但中长期看,DeepSeek开源把大家水平拉齐,全新探索又需要10倍甚至更大量级的GPU投入。这仍会让GPU资源充裕的公司受益。例如,第二梯队的Meta反而会是最大受益方,可以快速跟进新方法,让训练更有效率。
“从第一性原理来讲,无论是发展智能还是应用智能,AI产业从物理本质上就必然要消耗海量算力。这是基础定律决定的,不是技术优化能完全规避的。”
而DeepSeek在爆火了一整个春节后,要承接海量用户的服务,对推理、算力的需求也仍旧极为庞大。最近常用DeepSeek的用户会发现,“服务器繁忙”成了最常跳出的答案。
国际机构SemiAnalysis报告指出,考虑到服务器资本支出、运营成本等因素,DeepSeek的总拥有成本(TCO)在4年内可能达到25.73亿美元。
未来,随着模型的普及和应用场景的扩展,对大模型的推理需求必将持续指数级增长,这也将推动中美AI竞赛出现新的变迁和焦点。
近日媒体报道,华为、天数智芯等芯片制造商们,都在积极布局大模型训练推理及AI算力产品,推出推理模型。而在春节期间被DeepSeek“弯道超车”的大模型公司们,面对竞争也需要亮出新招。
陈佳亭透露:“国内某些大模型公司后续预计也会发布与DeepSeek技术路线相似的模型。但从用户量级和实际效果的角度,会不会像 DeepSeek提升得这么快,上线后表现如何,还要拭目以待。”
“每一条技术路线都会有瓶颈。大家也都处于探索期,这个竞赛还远没到真正分出胜负的阶段。”杜雨说。
(程伟、陈静为化名)
作者 |豆蔻
编辑 |李不清
图片来源 |视觉中国