中国人工智能初创公司DeepSeek(深度求索)的崛起,成为了各方关注的焦点。当地时间1月27日,美国总统特朗普称DeepSeek是积极的技术成果。然而,一天后的1月28日,美国多名官员却表示,DeepSeek是“偷窃”,正对其影响开展国家安全调查。DeepSeek到底动了谁的奶酪?DeepSeek的魔力到底在哪里?针对这些问题,上游新闻(报料邮箱:baoliaosy@163.com)记者进行了调查。
美国政界如何看待DeepSeek?
据央视新闻援引“玉渊谭天”的消息称,当地时间1月28日,美国多名官员回应DeepSeek对美国的影响时表示,DeepSeek是“偷窃”,正对其影响开展国家安全调查。#美国正对DeepSeek开展国家安全调查#很快冲上热搜,截至晚20时许,阅读量已经达到约4000万。
#美国正对DeepSeek开展国家安全调查#冲上热搜 微博截图
然而就在前一天,美国总统特朗普还称DeepSeek是很积极的技术成果。据美国《国会山报》、英国《卫报》等媒体报道,美国总统特朗普当地时间27日在佛罗里达州迈阿密举行的共和党会议上表示,中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响“警钟”,美国公司“需要专注于竞争以赢得胜利”。虽然DeepSeek的崛起导致周一(27日)部分美国科技公司股价下跌,但特朗普认为这家新兴公司也可能传递了一种积极信号。“当你听说有人提出了某些新东西,我们总是有想法。”特朗普称:“所以,我认为这是积极的。这可能是非常积极的发展。因此,与其投入数十亿资金,不如花费更少的(资源),但愿能得出同样的解决方案。”
美军方如何对待DeepSeek?
据报道,美国消费者新闻与商业频道(CNBC)28日报道称,美国海军发送警告信,要求其工作人员不得使用DeepSeek模型。
据悉,美国海军这份警告信发布于当地时间24日,也就是推理大模型DeepSeek-R1推出的4天后。看过这份邮件的CNBC记者称,美国海军要求部队官兵、工作人员不能以任何方式使用DeepSeek模型,包括用该模型处理工作或个人日常事务,也不得在该平台上传、下载或传输任何信息。
报道提到,美国海军发言人证实了这封警告信的真实性,并表示禁令是按照美国海军有关“生成式人工智能”的使用政策制定的,但并未具体说明颁布禁令的原因。
谁在恶意攻击DeepSeek?
1月28日,DeepSeek发布公告称:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制+86手机号以外的注册方式,已注册用户可以正常登录,感谢理解和支持。
当日上午,上游新闻记者曾登录DeepSeek官方网站,两次尝试均告失败。1月29日晚7时许,上游新闻记者再次登录DeepSeek官方网站,仍没有成功。这意味着,受到大规模恶意攻击的DeepSeek,目前还没有解除危机。
央视新闻1月29日援引“玉渊谭天”的报道称,DeepSeek这次受到的网络攻击,IP地址都在美国。
周鸿祎表示,360愿意提供网络安全支持 微博截图
针对DeepSeek受到大规模恶意攻击的问题,1月28日,360集团创始人、董事长周鸿祎发布微博表示:“如果DeepSeek有需要,360愿意提供网络安全方面的全力支持。 另外,我们已经开设了专用的防DDOS攻击的机房和高速线路,直连在我们的纳米AI搜索app里面,速度很快,能力也很强。”
周鸿祎在微博中称:“谁在攻击DeepSeek,为什么攻击DeepSeek?你把这些事联系到一起,答案不言而喻。”
DeepSeek动了谁的奶酪?
据央视新闻报道,DeepSeek可谓是用最少的钱,干了最多的事。其推出的模型,在性能上和世界目前顶尖的GPT-4o等大模型不相上下。但在成本上,OpenAI训练ChatGPT-4花费的成本高达7800万美元,甚至可能达到1亿美元。而DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。
DeepSeek大幅度降低了大模型行业的入局门槛 视觉中国图
在模型推理层面,DeepSeek新推出的DeepSeek-R1,价格为2.2美元/百万词元,而同性能OpenAI-o1的价格为60美元/百万词元,DeepSeek的费用大概是OpenAI的三十分之一。这种低成本标志着推理大模型调用进入平价时代,显著改善了大模型的应用成本,对大模型在科研、企业等智力密集型产业中的应用具有重大的价值。因此,无论是从基础研究角度还是从商业层面上看,在训练和推理方面,对此前美国一些大模型公司的既有模式冲击比较大。
DeepSeek的开发成本与美国企业的大模型相比大幅降低,在于应用了不同的模型训练模式,打破了美国堆砌算力的“豪气”方式。在喂养学习数据这一大模型重要环节上,OpenAI选择了“人海战术”,堆砌算卡、将资源集中在算力,用海量数据投喂实现能力的提升。而DeepSeek选择了另外一种方式:利用算法把数据进行总结和分类,经过选择性处理之后再输送给大模型,最大优化算力,实现了成本的降低和模型性能提升。目前看Meta(脸书母公司)耗费了大量资金训练自己的人工智能模型Llama,但在效果上却没有成本极低的DeepSeek效果好。Meta高层已经在思考其员工是否在浪费公司资金,而这也引发了不少技术人员的恐慌,他们担心自己的技术能力和创新性被质疑,从而失去工作。
跟ChatGPT相比DeepSeek有何特点?
与此前大火的ChatGPT相比,DeepSeek有何特点?
据新华网报道,DeepSeek创始人梁文锋曾多次强调,DeepSeek致力于开辟差异化技术路线,而非复制Open AI的模式。
《纽约时报》指出,“DeepSeek可以被视为满足特定需求的专用工具,ChatGPT则是一个多功能助手。”
还有外媒解释称,该应用程序与ChatGPT等其他AI聊天机器人的区别在于,在对提示做出响应之前,它会清晰地表达自己的推理。
上游新闻记者 杨四海 部分内容综合央视新闻、中新网、财联社、环球网