(图片来源:钛媒体AGI编辑林志佳拍摄)

钛媒体AGI 2月7日消息,市场传闻DeepSeek考虑以估值100亿美元进行新一轮融资,阿里有计划投资10亿美元认购DeepSeek股权,目前双方团队正在沟通具体执行细节,阿里云将作为第一推理算力选择。

受消息影响,阿里美股(NYSE: BABA)大涨6%以上。

截至发稿前,阿里、DeepSeek双方均未对传闻做出回应,而两家企业都位于杭州。


钛媒体AGI从消息人士处进一步了解到,其实DeepSeek公司估值目前只在数十亿美金左右。消息最初是在投资圈和量化群里进行传播,有多家投资机构人士对此非常感兴趣。

据腾讯科技,金沙江创投主管合伙人朱啸虎早前表示,一旦DeepSeek开放融资,他肯定会投资。“我肯定会投啊!我肯定会投!这个价格已经不太重要了,关键是参与在这里面。真的见证人类AGI产生,见证人类AI意识产生,这些东西都很有意义。”

朱啸虎强调,他认为DeepSeek还是应该开放融资的,因为再往前走是需要烧钱的,当前主要资源需求还是算力卡。

据悉,DeepSeek(深度求索,全称杭州深度求索人工智能基础技术研究有限公司)成立于2023年,总部位于杭州,由中资对冲基金幻方量化创立,DeepSeek创始人、CEO为梁文锋。

2023年10月28日,DeepSeek发表深度求索的第一个大模型DeepSeek-Coder,11月29日发布DeepSeek-LLM。到2024年12月13日,DeepSeek发布用于高级多模态理解的专家混合视觉语言模型——DeepSeek-VL2。同月26日,DeepSeek发布并开源了DeepSeek-V3,引发关注。

DeepSeek表示,该大模型的训练系基于2048块英伟达GPU集群上运行55天完成,训练耗资557.6万美元,而DeepSeek-V3的评测成绩超越LLaMA 3.1-405B(Meta自研大模型)等开源模型,能与GPT-4o等闭源模型相抗衡。

2025年1月20日, DeepSeek发布并开源了推理模型DeepSeek-R1模型,成本低于预期,但该模型在数学、代码、自然语言推理等任务上,性能与OpenAI o1正式版相当。到今年1月27日,DeepSeek智能助手在美区苹果App Store下载榜上超越ChatGPT,并登顶App Store免费应用榜榜首。

据报道,DeepSeek的员工规模不到140人。梁文锋曾表示,留住年轻人才的方法主要是“高薪”和“算力管够”两条路。

“我们看到的是中国 AI 不可能永远处在跟随的位置。我们经常说中国 AI 和美国有一两年差距,但真实的 gap 是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”梁文锋称。

(本文首发于钛媒体App,作者|林志佳)

ad1 webp
ad2 webp
ad1 webp
ad2 webp