2022年2月17日,国家发展改革委高技术司负责同志接受媒体采访时表示,8个国家算力枢纽节点和10个国家数据中心集群完成批复,全国一体化大数据中心体系完成总体布局设计,“东数西算”工程正式全面启动。
如今,距离“东数西算”已经过去三年,8大节点,10大集群的发展却各不相同。
西部算力崛起
过去的三年时间里,8个算力节点的发展快速。尤其是成渝、贵州、内蒙古、甘肃、宁夏等位于西部的节点。以位于宁夏节点的中卫集群为例,中卫市数据局的数据显示,截至2024年6月底,中卫数据中心集群新增标准机架1.7万架,累计标准机架达8.4万架,新增GPU算力卡1.58万张;电信业务总量7.9亿元,同比增长25.2%,拥有大型、超大型数据中心16个,上架率超过77%,为国内4000余家企事业单位提供算力服务。
与此同时,与前几年相比,IDC机房的上架率也有着大幅度的提升,据了解,早在东数西算工程伊始,西部地区的数据中心机房上架率不足30%,大多数项目建成后并没有业务,也为经济破局造成了困难。
不过这种现象在2024年有了很大的改善。随着大模型应用的兴起,西部地区步入了算力发展的黄金期,宁夏誉成云创数据投资有限公司总经理曲鸣此前向钛媒体APP透露,目前美利云中卫数据中心总体投入运营3栋数据中心机房,截至2023年底总体平均上架率为88%,截至2024年6月底总体平均上架率为92%。主要用户以大定制的大中型互联网企业为主。
另一方面,中卫市算力产业的发展并不是个例,其余西部地区也都吃上了大模型带来的这一波算力红利。甘肃省第十四届人民代表大会第三次会议上,相关领导汇报时指出,全国一体化算力网络国家枢纽节点(甘肃)庆阳数据中心集群算力规模达到5.1万P,已建成投用的机架达3.1万架。
值得注意的是,庆阳还接住了DeepSeek带来的“泼天富贵”,据了解,目前,DeepSeek的全量模型已在庆阳智算中心完成数万卡快速部署,支持DeepSeek 671B模型的全量部署。庆阳智算中心是亿算智能于2024年12月20日在甘肃庆阳点亮的全国首个国产万卡推理集群,该集群全部搭载了燧原科技最新一代算力卡,供给超过2500P的算力服务。
西部地区算力产业发展成功,很重要的一个因素就是算力成本,国家数据局局长刘烈宏曾在2024中国国际大数据产业博览会上表示,截至2024年6月底,“东数西算”八大国家枢纽节点直接投资超过435亿元,拉动投资超过2000亿元,机架总规模超过195万架,整体上架率达63%左右。“东数西算”工程正式启动以来,东西部枢纽节点间网络时延已基本满足20毫秒要求,新建数据中心PUE(电能利用效率)最低降至1.04,东部算力需求有序向西部迁移,算力集聚效应初步显现。
网络未足
虽然近年来,在政策,以及算力需求的市场的引导下,西部地区的算力产业逐渐完善,为当地贡献了可观的经济来源,但网络的建设仍有待完善。
AI时代,虽然新建的数据中心已经足以具备满足企业算力需求的能力,且单从数据中心建设上看,各个集群的数据中心规模差距并不是很大。
而AI算力的发展,除了离不开数据中心的支撑外,算力的调度,以及如何实现算网融合也很重要。可以说,网络架构的建设已经接下来几个“东数西算”集群,尤其是地处西部的几个集群能否继续快速发展的关键。
算力网络作为数字化时代的重要基础设施,其建设和发展对于推动各行业的创新和发展具有至关重要的意义。算力网络正在往AI化、分布化方向演进。在浪潮网络看来,多节点、多模式、广分布的算力网络将是未来算力网络发展的终极形态。在这种算力模式下,不同的计算存储资源池承担不同的计算任务并相互协同,极大提升算力网络的性能。
浪潮网络相关负责人此前曾告诉钛媒体APP,当前随着AI技术的发展,传统的算力网络已经发展成为AI算力网络。而算力网络随着建设进度与使用条件的演进,逐渐发展成为三种算力网络:单集群算力网络、多链路互联多集群算力网络、分布式广域多集群算力网络。单集群算力网络当前已经有诸多成功建设案例,并且已经是诸多基础设施供应商的大部分算力网络。
然而,随着AI等技术需求的发展,单集群的算力网络已经无法满足AI训练的算力网络需求,分布式算力网络开始逐渐引起重视。分布式多集群算力网络分为两个阶段,其一是Meta提出的基于多链路互联适合于同园区建设的分布式多链路互联多集群算力网络,其二是当前诸多厂商提出的跨广域网的多集群算力网络。在这种发展模式下,RoCE网络(RDMA over Converged Ethernet,一种基于以太网的高性能通信网络)、UEC(超以太网联盟Universal Ethernet Consortium技术)等已经成为必不可少的技术需求。
虽然网络的建设仍有待优化,但好消息是,当前的西部几个节点,已经具备了提供非高延时要求业务负载的能力,以中卫为例,数据显示,宁夏将“双中心”城市中卫提升为骨干传输核心节点,开通至北京、上海、广州等26个重要城市的直连网络,出口总带宽达18T,与全国90%以上地区光纤直连传输时延控制在8—20毫秒以内,“多链路”保障更加高效,可满足全国95%以上算力需求。与此同时,这个时延空间也让实时交易、4K视频,以及数据热备份等业务入驻西部地区提供了可能。(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)