文 | 未来学人,作者 | 从林

1957年10月,自认为在导弹和航天领域处于领先的美国开始陷入恐惧和焦虑,苏联抢先成功发射斯普特尼克1号人造卫星,成为冷战的重要转折点和太空竞赛的起点。

68年后的今天,人工智能领域再次出现“斯普特尼克时刻”。在美国政府多年芯片限制、硅谷科技公司筹备通过大规模投资和基建垄断AI大模型市场时,来自中国的DeepSeek打破了硅谷对AI的假设,包括开发成本、技术路线和美国的领先优势。

DeepSeek带来的冲击波,开始迅速产生影响。美国芯片巨头、能源公司、数据中心供应商们股价暴跌,市值蒸发超过1万亿美元。AI服务平台、开发者迅速部署,将DeepSeek作为新的首选模型选项,DeepSeek的移动应用也迅速增长,成为苹果、谷歌应用商店最受欢迎的免费应用之一。

在TikTok、SHEIN、Temu之后,中国科技公司似乎又赢得一次全球性胜利。但在政治经贸关系日益复杂的环境下,事情不会那么简单。短暂的冲击波后,质疑、反对的声音已经出现。特朗普第二任期刚刚形成的美国“政治科技”力量正在筹划对神秘的中国初创公司发起反击。

挑战不仅来自外界,商业模式与扩张战略也是DeepSeek即将面临的问题。可以说,DeepSeek的异军突起,得益于成熟的全球AI开源生态。作为一款开源模型,它的确可以大杀四方,但如果作为一款手机应用,那它似乎还要把TikTok们出海的故事再经历一遍

开源:冲击、拥趸与质疑

去年9月,OpenAI发布了全球首个“推理模型”o1,该模型运用“思维链”方法解答科学和数学难题:它将问题分解成多个步骤,在后台测试不同解决方案,最后向用户呈现结论。o1的成功迅速引发了技术竞争:12月,谷歌推出了“Gemini Flash Thinking”推理模型,而OpenAI随后发布了o1的升级版o3。

然而,令OpenAI和谷歌没想到的是,正是推理模型,让中国在AI技术上极大缩短了与美国的差距。在o1发布后不到三个月,阿里推出了具备推理能力的QwQ,而DeepSeek紧随其后,推出了R1推理模型预览版。《经济学人》称,这两款模型,将中国公司”与美国同行的技术差距缩短到了短短几周”。

技术能力之外,开源模式为中国AI建立了优势。阿里和DeepSeek均采用开源许可方式提供模型,任何人都能免费下载模型并基于它们开发程序,详细的技术论文也会被公开发布。与OpenAI、Claude等闭源模型相比,开源模型虽然不能为通过收取使用费来获得稳定营收,却可以快速推广,获取大量的用户,并使中小企业和个人开发者能够以较低的成本快速进入AI领域。

DeepSeek之所以带来如此大的冲击,是因为其模型以很少的成本提供媲美o1的性能。这为各种AI服务平台、企业和开发者提供了低成本、高性能的平替选项。AI搜索引擎Perplexity已经将R1模型在服务器托管,为Pro用户提供服务,并取消了内容审核。Databricks公司CEO则表示,R1发布仅一小时后,就收到了首个来自客户的使用请求,此后需求持续攀升。而在各视频平台上,有无数的开发者都在分享自己如何用几分钟就将R1模型本地化部署,或者嵌入到编程软件等工具中使用。


如此强劲的开源平替,让硅谷各模型厂商陷入了恐慌。他们试图理解“DeepSeek是如何做到这一点的,并试图验证这家初创公司是否真的用那么低的成本实现了这一突破”。

OpenAI日前确认,正在调查DeepSeek是否使用“蒸馏”技术来训练模型,因为根据服务条款,客户被明确禁止使用其模型的输出来开发具有竞争性的模型;Meta已成立内部团队,专门分析DeepSeek的构建方式和功能;Anthropic的CEO日前也发布报告,提出对华芯片出口管制政策的必要性和紧迫性。DeepSeek官网页面提示,其线上服务近期受到大规模恶意攻击。奇安信安全专家则表示,这次受到的网络攻击,IP地址都在美国。

过去几年,TikTok通过提供免费、沉浸式体验的短视频应用,斩获了数亿海外用户。Temu也通过低价、免费配送等策略成为最受欢迎的购物应用。如今,借助开源,DeepSeek正在用免费高性能模型再次取得成功。

虽然有质疑,但DeepSeek在开源上的成功似乎让美国人感到无奈。不过,对于应用的限制,欧美各国却已经掌握了一套成熟的方法。

应用:数据、隐私与监管

对于DeepSeek应用的限制,意大利开了第一枪。当地时间1月28日,意大利隐私监管机构Garante表示,正要求DeepSeek提供关于个人数据使用问题的解释。该机构称,希望能了解 DeepSeek“收集了哪些个人数据、从哪些来源收集、用于什么目的、基于什么法律依据,以及是否存储在中国”。

尽管欧美其他国家还未提出类似要求,但是,根据《连线》杂志的调查,DeepSeek应用美国数据直传中国,如果政府认为DeepSeek的威胁加大,很有可能会提出监管限制和要求。

《连线》此次的调查主要涉及DeepSeek如何收集用户美国数据和如何使用这些数据。调查结果主要有以下几个结论:

  • 数据传输至中国:DeepSeek明确表示用户数据会被发送到位于中国的服务器,这意味着用户的聊天记录、问题和生成的答案都会传输到中国。

  • 数据收集广泛:DeepSeek收集的数据种类繁多,包括用户主动输入的信息(文本、音频、文件等)、自动收集的信息(设备信息、IP地址、击键模式等)以及从其他来源获取的信息(如谷歌或苹果账号信息、广告商信息等)。

  • 数据使用目的:DeepSeek主要使用数据来维持服务运营、改进服务质量以及开发新模型。

  • 与TikTok的对比:DeepSeek可能向中国传输比TikTok更多的数据,考虑到TikTok已经将数据迁移至美国云服务,DeepSeek的数据传输行为更令人担忧。

从《连线》的结论不难看出,DeepSeek应用受到监管的可能性很高,并且在欧洲受到监管的可能性或许更大,这些问题TikTok、SHEIN和Temu等其它应用都经历过。

今年1月下旬,欧盟数据保护组织noyb对包括TikTok、SHEIN和Temu在内的中国公司提起GDPR投诉。这些公司因向中国传输欧洲用户数据、未能妥善回应数据访问请求而受到质疑。根据欧盟法律,只有在目的地国家能确保同等数据保护水平的情况下,才允许跨境数据传输。欧盟担心,这些公司难以证明用户数据不会被政府访问。

出海:跨境、监管与策略

开源的商业模式与应用的商业模式并不一样。将开源模型共享到开源社区,让人人都可以免费使用,这种开放很难去做限制,因为这并不涉及到数据和隐私等问题。而为用户提供一款免费、高性能的AI聊天应用,本质上是一件好事,但对于西方世界来说,这款应用的问题是来自中国。

当一种商业模式涉及到数据,问题就变得复杂了,难以避免“出海”这套流程。而即便出海成功,也很有可能像TikTok那样,再次受到封禁或者出售等强制要求。

不过,DeepSeek既然已经推出了应用,就应该做好这种准备。TikTok的经历可以为它提供前车之鉴。为应对欧美数据合规要求,TikTok采取了全面的技术和管理措施。

在欧洲,该公司推出了增强版数据移植工具,建立了超过1000人的合规团队,并实施了零信任安全架构和军事级加密保护。为加强与欧盟的沟通与合作,TikTok建立了常态化的监管对话机制。公司每季度向欧盟委员会提交合规进展报告,并在布鲁塞尔设立专项办公室,配备多语种法律团队实时响应监管问询。在技术架构方面,TikTok也进行了深度改造。公司开发了区域化数据中心网络,实现欧盟用户数据本地化存储,部署AI驱动的实时内容审核系统,并推出针对青少年的特殊数据保护模式

在美国市场,TikTok投入巨资确保数据安全。公司投资5亿美元建设“德州数据管理”项目,将用户数据存储于甲骨文云服务器,同时引入第三方审计机构定期验证数据隔离措施,并公开推荐算法源代码供监管部门审查。

此外,在东南亚等其他地区,TikTok还针对不同地区制定了差异化的运营策略。在东南亚设立独立法人实体采用本地化管理,为印度市场开发精简版应用,并在巴西测试去中心化内容分发网络。

合规成本已占TikTok年营收的12%。这是一家大型互联网平台为出海必须付出的代价,也为新的中国公司出海提供了宝贵经验。相对于短视频应用,AI聊天应用的交互深度更深,用户提交的信息更多,可以预见,DeepSeek受到的监管,将比TikTok更严格。

结语

凭借推荐算法,张一鸣用TikTok征服短视频世界。凭借极低的价格、极高的效率,黄铮用Temu攻占被亚马逊统治的世界。如今,梁文锋又要凭借量化投资的模式、极致的成本压缩、挥舞开源的大旗,用DeepSeek来颠覆被硅谷定义的AI。

白马银枪、所向披靡的故事值得称颂,但运筹帷幄、决胜千里的胜利更让人向往。摆在梁文锋和DeepSeek面前的挑战远比当下能看到的更大。

ad1 webp
ad2 webp
ad1 webp
ad2 webp