当ChatGPT掀起全球AI狂欢时,一家中国公司正悄悄织就一张硬核科技大网——从芯片到算力,从模型到云服务,DeepSeek的生态盟友名单里,藏着AI未来的终极答案。
这些科技巨头们如何“暗通款曲”,把中国AI推向新高度!
今天带你扒一扒,极速适配DeepSeek哪家强?还有谁没入局?
01
国内外芯片天团硬核应援
一开年,DeepSeek概念股掀起“涨停潮”,DeepSeek应用上线仅5天,日活跃用户数便超越ChatGPT同期水平;上线20天,日活突破2000万,成为全球增速最快的AI应用。
凭借超高的“性价比”,DeepSeek赢得了国内外企业的认可,尤其是在“拿来主义”盛行的当下,能够走出一条真正创新的路子,着实不易。短短一周,国内外AI芯片企业相继宣布适配或上架DeepSeek模型服务,争相给AI造“最强大脑”。
海外如英伟达、AMD、英特尔,国内如华为昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯、寒武纪、龙芯等,纷纷宣布支持DeepSeek模型部署、推理服务。
华为昇腾:当“鲲鹏+昇腾”遇上DeepSeek,国产全栈式AI方案直接上演“科幻成真”。
2月1日,华为昇腾打响国产AI芯片支持DeepSeek系列模型的第一枪。宣布与硅基流动联合首发并上线基于华为云昇腾云服务的DeepSeek R1/V3推理服务。得益于自研推理加速引擎加持,该服务支持部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。2月4日,DeepSeek R1、V3、V2、Janus-Pro模型正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,推理快速部署。
寒武纪:用“思元”系列AI芯片为DeepSeek定制“超高速脑回路”,堪称国产CP典范。
2月6日,南京智算中心宣布联合国产芯片厂商寒武纪,用全国产设备运行国产大模型DeepSeek,为苏宁易购提供全国产化模型推理服务,成为南京首例全国产算力版DeepSeek案例。这意味着寒武纪的自研芯片也将支持DeepSeek模型部署、推理服务。
燧原科技:联手打造“算力火锅”——邃思芯片+DeepSeek模型,让AI训练像涮毛肚一样爽快。
2月6日,燧原科技宣布完成了对DeepSeek全量模型的高效适配,包括DeepSeek R1/V3 671B原生模型和蒸馏模型。目前,DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署。这一成果标志着燧原科技在国内率先实现了DeepSeek全量模型的部署和落地。
沐曦:沐曦MXN系列GPU给DeepSeek堆出“12层HBM显存蛋糕”,训练大模型像吃拿破仑酥——层层爆浆,卡路里(算力)直接超标!
2月2日,Gitee AI宣布上线1.5B、7B、14B、32B四个尺寸的DeepSeek R1模型并均部署在国产沐曦曦云GPU上。2月5日,联想与国内AI芯片厂商沐曦联合发布基于DeepSeek 大模型的一体机解决方案。该方案以“联想服务器/工作站+沐曦训推一体GPU+自主算法”为核心架构,主要产品包括面向DeepSeek智能体部署的一体机、DeepSeek模型训推理练一体机。
天数智芯:火速适配DeepSeek,让AI从原子到比特全链贯通。
2月4日,天数智芯与Gitee AI联合发布消息,在双方的高效协作下,仅用时一天,便成功完成了与 DeepSeek R1 的适配工作,并且已正式上线多款大模型服务,其中包括DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等。
天数智芯还在联合并行科技、算力互联等多家伙伴,全力开展DeepSeek多款模型的适配与上线。此前,DeepSeek V3 671B刚一发布,天数智芯便迅速响应,完成了与该模型的适配工作。经测试与验证,适配后的模型精度高度对标论文精度,展现出出色的稳定性与可靠性,可快速投入应用场景。
摩尔线程:摩尔线程用4096个MUSA核在DeepSeek模型上绣出苏绣级精度,1针(线程)穿7线(数据流),黄仁勋看了都想来偷师。
2月4日,摩尔线程宣布实现了对DeepSeek蒸馏模型推理服务部署。DeepSeek开源模型(如 V3、R1 系列)在多语言理解与复杂推理任务中展现了卓越性能。通过DeepSeek提供的蒸馏模型,能够将大规模模型的能力迁移至更小、更高效的版本,在国产 GPU 上实现高性能推理。
同时,为推进国产AI生态发展,摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek V3、R1模型及新一代蒸馏模型的分布式部署。夸娥集群集成先进推理技术与分布式计算框架,将确保大规模模型的高效稳定运行,助力开发者快速实现业务落地。
海光信息:海光深算DCU给DeepSeek整了个双架构火锅——x86/GPGPU随便涮,兼容性比火锅调料台还离谱。
2月4日~5日,海光信息宣布其技术团队近日成功完成DeepSeek V3模型、R1模型、Janus-Pro多模态大模型与海光DCU的适配优化,并正式上线。DCU(深度计算单元)是海光信息推出的高性能GPGPU架构AI加速卡,DeepSeek模型可直接在DCU上运行,并不需要大量适配工作,技术团队的主要工作是进行精度验证和持续的性能优化。
壁仞科技:壁仞BR100用7nm工艺给DeepSeek造了个洪荒之力发动机,跑分榜直接杀疯。
2月5日,壁仞科技宣布自主研发的壁砺TM系列产品完成对DeepSeek-R1全系列蒸馏模型的支持,涵盖了从1.5B到70B各等级参数版本,包括LLaMA蒸馏模型和千问蒸馏模型,为开发者提供高性能、低成本的大模型部署与开发解决方案。
同时,云服务商优刻得宣布基于壁仞科技国产芯片的内存架构、多模型适配能力,开展包括R1在内的DeepSeek全系列模型适配工作,仅用数小时即完成了对DeepSeek R1全系列蒸馏模型的支持。
龙芯中科:龙芯3号CPU给DeepSeek装上曲率引擎,LLM推理速度突破三维空间限制,竞争对手还在加载进度条时,DeepSeek已给出答案+泡好咖啡。
2月7日,龙芯中科宣布,搭载龙芯3号CPU的设备成功启动运行DeepSeek R1 7B模型,实现本地化部署,性能卓越,成本优异,可为用户提供更快、更强、更省的训推体验。此前,龙芯联合太初元碁等产业伙伴,仅用2个小时,就在太初T100加速卡上完成了DeepSeek-R1系列模型的适配工作,并快速上线了DeepSeek-R1-Distill-Qwen-7B等多款大模型服务。
目前,龙芯正积极携手太初元碁、寒武纪、天数智芯、算能科技、openEuler等合作伙伴,全力打造DeepSeek系列模型的多形态推理平台,助力企业用户实现智能化转型。
云天励飞:云天励飞给DeepSeek加载了城市级推理技能,10亿参数模型在芯片上跑得比柯南破案还快。
2月5日,云天励飞宣布其芯片团队完成DeepEdge10芯片平台与DeepSeek R1(1.5B、7B、8B)大模型的适配,可以交付客户使用。DeepSeek R1(32B、70B)以及V3/R1 671B MoE大模型也在有序适配中。适配完成后,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。
昆仑芯:昆仑芯XPU给DeepSeek上了少林易筋经——模型压缩率高达10倍,性能却不降反升,同行直呼“这波在大气层”。
2月6日,昆仑芯宣布已完成Deepseek R1、V3系列模型训练推理全版本适配,包括MoE模型及其蒸馏小模型,且性能卓越、成本效率极致,一键部署。据介绍,P800显存规格优于同类主流GPU 20%-50%,对MoE架构更加友好,且率先支持8bit推理,单机8卡即可运行671B模型,可轻松完成DeepSeek-V3/R1全版本推理任务;并能支撑Deepseek系列MoE模型大规模训练任务,仅需32台即可支持模型全参训练,高效完成模型持续训练和微调。
除了国内芯片企业的硬核应援,国际芯片霸主也在为DeepSeek“暗送秋波”。
英伟达:虽然H100限售,但悄悄给DeepSeek开了CUDA优化绿色通道,老黄这波操作很灵性。
AMD:拿着MI300X芯片找DeepSeek“试婚”,要在AI赛道上演“王子复仇记”。
英特尔:用Gaudi2加速器给DeepSeek当“涡轮增压”,誓要打破英伟达霸权。
02
云巨头、智算企业换个视角
玩转DeepSeek
除了AI芯片厂商,不少云计算巨头、智算企业也纷纷入围DeepSeek“朋友圈”。国外的AWS、谷歌云、Oracle Cloud,以及国内的华为云、腾讯云、阿里云、百度云、京东云、联通云、移动云、天翼云、浪潮云、火山引擎、优刻得、青云科技、金山云、云轴科技等17家云厂商,以及北京超算、并行科技、商汤科技、百川智能、智谱AI等智算企业也纷纷宣布支持部署DeepSeek模型。
AWS:推出DeepSeek专属EC2实例,中国AI首次享受“亚马逊Prime会员”待遇。
Google Cloud:把TPU+DeepSeek组合包装成“AI瑞士军刀”,硅谷初创公司抢到服务器冒烟。
Oracle Cloud:用数据库+DeepSeek玩出“企业AI管家”,传统企业数字化转型速度直接开挂。
华为云:当昇腾AI云服务撞上DeepSeek,就像给宇宙飞船装上曲率引擎——从芯片到模型全栈贯通,企业用户直呼“三体人来了也得买票参观”!
腾讯云:TI-ONE平台搭载DeepSeek后,开发大模型比搭乐高还上头——拖拽式操作+预置魔改工具包,产品经理都能客串AI工程师。
阿里云:飞天智算+DeepSeek=九转金丹Pro Max版,千亿参数模型炼制时间从七七四十九天压缩到49分钟,电费账单少得能让雷公电母下岗。
百度云:百度智能云把DeepSeek塞进Apollo平台,现在自动驾驶训练像玩《跑跑卡丁车》——漂移过弯数据自动生成,科目二秒变“有手就行”。
京东云:京东云×DeepSeek造出“欲望显微镜”,用户浏览记录刚加载完,购物车已经塞满“你真正想要”的东西,比男朋友更懂七夕该送什么。
天翼云:天翼云给DeepSeek套上“国资云盔甲”,让传统企业数字化转型秒变科技大片——上午还在手工填报表,下午AI自动生成元宇宙年报。
移动云:移动云为DeepSeek铺设算力轨道,全国20+省级节点组成“八纵八横”AI专列,模型训练速度比复兴号还稳,永不晚点!
联通云:星罗平台 + DeepSeek-R1 模型,恰似打造 “AI 万能钥匙”,不管是私有化保险箱还是公有化百宝箱,统统轻松打开,全方位保障服务,到手即能用,开启 AI 便捷新体验。
浪潮云:浪潮云政务版DeepSeek化身24小时公务员,能写红头文件会审申报材料,群众咨询时自动切换方言模式,比居委会大妈还贴心。
火山引擎:搞出“抖音同款特效”——用DeepSeek给视频自动加字幕,百万剪辑师集体失业预警。
优刻得(UCloud):UCloud给DeepSeek加上“丰俭由人”Buff——1张显卡也能玩大模型,小公司用拼团价享受BAT同款AI能力,老板们笑着吃下“科技平权”定心丸。
青云科技:青云QingCloud把DeepSeek装进混合云魔盒,公有云+私有云+边缘计算自由穿梭,AI服务像哆啦A梦掏道具——要啥有啥,哪里需要点哪里。
金山云:在公有云、国资云 / 政务云场景融合 DeepSeek-R1/V3,恰似打造 “智能政务中枢”,推动政务数字化高效转型,审批流程一键加速,服务效能直线飙升,解锁智慧云服务新玩法。
云轴科技(ZStack):ZStack为DeepSeek打造信创版机甲,从ARM到x86随心变形,国产化替代方案稳到能让WindowsXP再战十年。
北京超算:以超算集群 + DeepSeek 打造 “科研火箭推进器”,科研人员科研效率直线飙升。
并行科技:凭借分布式计算能力 + DeepSeek 塑造 “并行加速引擎”,各行各业的计算难题迎刃而解。
商汤科技:用SenseCoreAI大装置给DeepSeek当“健身房”,模型肌肉练得梆硬。
智谱AI:把GLM大模型和DeepSeek组“学霸CP”,在中文理解考试中狂甩GPT-4十条街。
百川智能:玩起“模型叠叠乐”——把DeepSeek当底层积木,堆出金融、法律垂直领域AI专家。
03
为什么他们都选DeepSeek?
为啥中国企业都抢着接入 DeepSeek?在小编看来,DeepSeek 是真正将“降本增效”玩出了新高度。它就像个 “万能小助手”,不管你是科研大佬搞研究,还是企业做客服、搞营销,甚至是个人整些创意内容,它都能完美适配,主打一个 “有求必应”。
更绝的是,它还是个 “省钱小能手”,在性能拉满的同时,还能帮企业省下不少训练和运行成本,妥妥的 “性价比之王”。用DeepSeek自己的话来说,有以下四大特点。
极致性价比:单卡训练千亿模型,电费账单砍半,老板们笑着数钱
中文超能力:成语接龙+网络热梗+方言十级,这才是最懂中国人的AI
垂直领域开挂:从写诗作画到芯片设计,没有它不敢接的活儿
开源生态凶猛:开发者社区每天新增100+魔改版本,GitHub霸榜已成日常
当芯片大厂、算力巨头、模型高手们在DeepSeek生态里疯狂“排列组合”,我们突然发现:中国AI不再单打独斗,而是织就了一张覆盖全球的智能网络。这场静悄悄的科技革命,或许正在改写下一个十年的规则。
免责声明:以上锐评均为AI生成,如有雷同,纯属巧合!
DeepSeek是否真正的“deep”到人心
成功“牵手”三大运营商,DeepSeek让国产AI产业更“deep seek”
通信世界全媒体携ICT产业伙伴给您拜年啦!
作者:梅雅鑫
责编/版式:王禹蓉
审校:王 涛 梅雅鑫
监制:刘启诚
【通信世界新媒体矩阵】
央视频 | 微软MSN | 视频号 | 微博 | 今日头条 | 百家号 | 网易号 | 搜狐 | 腾讯新闻
新浪看点 | 雪球号 | 抖音 | 快手 | 爱奇艺 | 知乎 | 哔哩哔哩 | 咪咕视频 | CSDN | 36氪
【新媒体团队】
监制|刘启诚
审校|王涛 梅雅鑫
编辑|王禹蓉
视频制作|盖贝贝 黄杨洋 卢瑞旭 蒋雅丽
运营|林嵩