文 | 号外工作室,作者 | 林书,编辑 | 白帝

随着近期腾讯、百度等互联网巨头先后接入DeepSeek,DeepSeek不仅占据了微信、百度搜索两大超级入口,而且正在全面嵌入腾讯和百度的生态系统,其影响力覆盖了数亿用户。

互联网巨头火热接入DeepSeek的背后,一方面折射出传统互联网巨头被迫接入第三方的无奈与被动,DeepSeek在性能、成本、易用性上的优势,确实让自研模型相形见绌,巨头不得不通过接入维持竞争力

另一方面,也显示出巨头们力图利用现有生态快速整合先进技术,以巩固市场地位的战略选择,巨头试图通过生态整合和组织变革,将DeepSeek转化为自身护城河。

本质上,这是一场AI时代崛起的新星与传统巨头旧势力的竞合与博弈,也是传统巨头在AI时代重构竞争优势的必经之路。

AI时代的生态重组

自生成式AI问世以来,一个重要的问题一直困扰着各个AI企业和大模型的用户们——在功能集成方面,之前的AI大模型大都难以做到深度场景化的应用。

这是因为要实现真正的场景化AI应用,需要打通大量的数据孤岛和应用场景。然而,这些数据和场景往往被不同的互联网平台所分割。

据IDC报告,中国互联网行业数据存储量中,73%的数据集中在腾讯、阿里、字节等TOP10平台中,但跨平台数据调用成功率不足5%

例如,淘宝、京东等电商平台的用户行为数据如浏览记录、购买历史等,与抖音、微博等社交平台的兴趣标签数据相互独立。用户在美团订餐、在抖音看视频、在支付宝理财的行为数据分散在不同平台,AI无法构建完整用户画像。

具体到搜索,虽然现有的各大头部模型例如Kimi、智谱等,虽然都具备了联网搜索功能,但目前几乎所有能联网的AI,能抓到的都是公域信息,而无法抓取例如像公众号平台这样的私域内容,只有腾讯自己的元宝能做到。

这种私有流量池的存在,本质上将大量用户和读者的阅读兴趣、浏览记录等数据,牢牢地掌控在了手里。


图源:腾讯元宝

同样地,作为全球最大的中文搜索引擎,百度APP目前有7亿用户,在应用场景上,集合了搜索、地图、贴吧、网盘、文库、知道、健康等20多项功能。

这意味着,当用户在百度搜索框键入文字时,需求也许不仅仅是单纯的“信息查阅”,而可能是上述多种功能和场景的交互结果。

这种跨场景的连接能力,以及背后蕴藏的数据关联,是第三方AI难以通过“外挂加载”来实现的

然而,在相当一段时间里,掌握这些庞大数据与应用场景的巨头,其AI模型的能力往往表现平平,难以满足用户更复杂的要求。


司南大模型榜单显示:文心一言与混元明显落后于DeepSeek-R1

于是便形成了传统互联网巨头“有入口但模型拉胯”,AI企业“模型强却无入口”的割裂局面

这就造成了一个悖论:在技术上,当前的大模型在推理、数学与编程方面,已经十分强大,像OpenAI的o1、DeepSeek-R1已经能在测试中甚至达到了“博士级别”的水准,但因为缺乏场景化的数据,它们依然不够有“人性”,不够懂用户,难以走进大众的生活。

此前,最成功的AI应用往往出现在封闭、孤立的场景中,而跨场景的智能应用却迟迟难以突破,因为后者涉及到的多方协调难度要大得多

而这一切,自从DeepSeek-R1问世后,却发生了彻底的改变。如今,凭借强大的性能,低廉的成本,DeepSeek的“生态朋友圈”已经遍布智能硬件、汽车、传媒、互联网、半导体等各个行业。


图源:动点科技

在这样的大势下,各大巨头或许已经认清:市面上的大模型虽然很多,但将来真正“一统天下”的,很可能只是一两个像DeepSeek-R1这样在性能/成本方面兼具的“超级模型”。

因此,这种通过“用别人的技术养自己的鱼塘”策略,实则是将开源模型当作脚手架,在AI时代守住自身庞大的生态——就像当年安卓系统虽开源,但谷歌通过GMS,即Google Play商店、Gmail、Google Maps、YouTube等核心服务,依然掌控着海外的安卓生态。

毕竟,技术的同质化有可能加剧,但场景创新与生态协同仍将决定巨头能否持续领跑。但问题是,这样的策略到了AI时代,是否依然有效?

平台与AI的暗战

倘若借助第三方模型的性能,依然能保持流量优势,是否会让腾讯、百度等大厂放弃自研模型?

答案是不会

2月17日,就在接入DeepSeek后不久,腾讯元宝就更新了其APP,混元的推理模型T1灰测上线。

据腾讯介绍,T1是更强更快的推理模型,适合处理复杂任务,结合微信公众号等优质信息源让回答更具时效性和权威性。


图源:腾讯元宝

腾讯保留混元模型与DeepSeek并行,这显示出巨头并未放弃自研,而是通过外部技术补足自身短板,试图在技术依赖与自主可控之间寻求平衡。

倘若一味地用第三方模型,最终不仅会壮大潜在的竞争对手,甚至还会失去AI时代的技术制高点——这相当于当年将搜索引擎外包给谷歌,而自身则逐渐没落的雅虎。

既然自研是一条必走的路,那么在与DeepSeek-R1的竞争中,巨头们是否能轻易赶上?

既然DeepSeek-R1是开源的,那就应该很好复现,后继者就很容易达到类似的水准吗?

但实际上,这种看法忽略了模型训练的复杂性。

从技术上来说,DeepSeek-R1的MoE架构包含6710亿总参数,但每次推理仅激活37亿参数(占总量的5.5%),意味着它虽然整体很大,但实际干活时只动用一小部分力量。

这样既能高效完成任务,又不用把全部“工具”都拿出来,省时省力。

DeepSeek之所以能做到这点,都要归功于一种高效的任务分配方式——“多头潜在注意力”(MLA)机制。

这样的机制,简而言之,就是当模型面对很多岔路(选择)时,会同时看多个方向,然后挑出效果最好的那条路走。这样就不用每条路都试一遍,效率高还省资源。

然而,即使DeepSeek公开了模型的权重参数,竞争对手也很难完全复现这种选择逻辑,因为它需要大量的测试数据和强化学习优化的实战经验作为支撑。

换言之,这不仅仅是一个算法调整,而是需要深入理解语言模型的内在机制

开源代码可以提供框架,但无法完全展示这些经验性的知识。说白了,在表面上开源的背后,DeepSeek-R1凝结的是高深的工程学经验,这使其成为一种实质上易学难精的技术。

因此,这场针对DeepSeek的技术追赶,注定是一场比拼AI人才,尤其是顶尖AI人才的较量

而在人才方面,科技行业的一个普遍规律是:要想吸引到最顶尖的人才,除了高薪,更重要的是企业文化、组织架构等一系列非物质的“软性”因素。

在这方面,创始人梁文锋在采访中透露,与许多中国科技企业不同,DeepSeek不鼓励内部竞争和加班,并给了员工极大的自由度,可以自行选择任务并使用算力

也正因如此,DeepSeek才吸引了一批具有海外经验的顶尖AI人才加入。例如,DeepSeek团队中的潘梓正、Junxiao Song等核心人才都有海外背景。潘梓正曾在英伟达实习,并拿到转正offer,但他毫不犹豫的选择了加入当时还名不见经传的DeepSeek,并成为DeepSeek-VL2、DeepSeek-R1和DeepSeek-R1的核心贡献者。

这种组织架构的扁平、灵活性,是百度、腾讯等大厂目前暂不具备的一种组织架构上的优势

目前,BAT中综合实力较弱的百度已成“前车之鉴”,在2月18日百度发布2024年全年财报后,公司股价当日收跌7.51%。股价下跌的背后,也反映出市场对这家老牌搜索巨头在AI转型上的疑虑。

未来属于谁?

在AI时代,“大模型需要更多数据、操作权限”与“各平台独立、割裂的场景生态”已经构成了一对愈发显著的矛盾

当然,这背后既有技术能力的瓶颈,更有商业逻辑的深层制约,例如数据共享涉及利益重构,但现有商业模式难以平衡各方诉求。

那么,未来的互联网生态,趋势是“平台为主”,还是“AI优先”?

从当前中国AI竞争格局来看,传统互联网巨头的各种超级APP形成的“数据+场景”护城河难以撼动。

未来的破局点,或许在于“数据流动性×场景适配性×商业可行性”的多元平衡,而非单一维度的突破

从短期的1-2年来看,传统互联网巨头与第三方AI企业,或将通过合作实现共赢:巨头利用第三方的前沿技术优化自身服务,第三方则借助巨头的用户基础和场景加速技术落地。

这种模式可能模糊传统生态的边界,催生更多跨界协作,而不是单纯的竞争或依附关系。

但从长期的3-5年来看,若出现颠覆性技术,第三方可能逆袭,例如,随着AI带来的认知效率的极大提升,其在细分领域远超人类的决策能力、运作效率,将会倒逼巨头进一步开放接口。

在可预见的未来,在技术突破、政策与商业模式的动态博弈下,传统巨头的护城河并非绝对不可撼动,AI优先的趋势可能将在特定领域逐步显现

ad1 webp
ad2 webp
ad1 webp
ad2 webp