通信世界网消息(CWW)5月17日,2025世界电信和信息社会日主题活动在江西南昌隆重召开,中国信息通信研究院副院长王志勤出席会议并发表主题演讲。她表示,人工智能发展的关键是三要素螺旋式迭代,形成“飞轮效应”,即模型方面推动基础理论和技术路径突破;算力方面加强软硬件协同和自主生态建设;数据方面提供高质量供给,并在此基础上,逐步构建开源生态,以广泛业务应用的形成和技术产业螺旋的迭代,推动AI产业高质量发展。
大模型进入2.0时代,紧抓“三要素”
人工智能发展经历了逻辑推理期、专家系统期、机器学习期、大模型期。其中,大模型时期,神经网络规模不断扩大,从海量数据中学习,产生智能涌现现象,通用性显著增强。现阶段的大模型2.0时期实现了强化学习,在很多领域超越了人类。例如2024年大模型在多任务语言理解、竞赛级数学、博士级科学问题等之前具有挑战性的基准测试中超越了人类的表现。
王志勤指出,促进大模型爆发的主要原因是“三要素”算法、数据和算力的突破。在算法方面,过去一年,以DeepSeek为代表的多个国内大模型能力迅速提升,基础能力与OpenAI模型“比肩并跑”。与此同时,头部大模型训练成本达到新高度,但增速有所放缓;整体算力需求结构正在从训练侧向推理侧倾斜,预计到2027年推理负载将达到70%。
在算力方面,我国AI软硬件仍面临算子对前沿算法支持度不足、软件栈技术路线不收敛、系统整体性能有待提升等问题。产业应通过模型适配统一接口、算子库功能统一构建、异构算力统一训练,“三个统一”推动软硬件协同生态。
在数据方面,高质量数据集是未来模型性能提升的关键因素。如何获得这些高质量数据集?王志勤认为,在全球遭遇大模型训练“数据墙”的背景下,“数据标注”和“合成数据”是重要破题路径。数据标注通过对数据进行筛选、清洗、分类等加工处理,显著提升数据质量,而自动化标注和AI辅助标注等手段也不断提升标注效率、质量和安全性。合成数据有助于节省时间成本和经济成本、获得极端情况下的训练数据、最大限度地减少隐私问题。Gartner预测,2024年AI训练中用到的数据有60%将是合成数据,到2030年绝大部分训练数据将由人工智能合成。
“人工智能+”破局,打造“样板间”
在人工智能技术迅速发展的同时,我国积极推进“人工智能+”行动。王志勤指出,“人工智能+”不仅是人工智能在不同行业落地应用,更是人工智能技术与经济社会的双向深度融合。它将进一步释放数据要素价值驱动创新、突破人类生产生活认知边界,赋能创新、生产、治理全面升级,形成全新智能发展范式,助力新质生产力发展。
但王志勤也提醒到,“人工智能+”发展是一个循序渐进的过程,目前制造业、医疗、交通、金融等AI应用较多的领域,均是对生产效率和准确性具有较高要求,具备明确的需求和良好的收益模式,且已经积累大量行业数据和丰富的业务场景的行业,“人工智能+”整体发展仍面临成本、能力、安全等方面的多重挑战。“需要面向重点行业,制订人工智能落地路线图,选取重点场景、重点问题,形成大模型落地实践指南、落地途径、样板间、基准测试体系等。”
以工业为例,目前行业应用呈现“两端快,中间慢”的发展态势。研发环节和服务环节AI应用较多,中间制造环节应用较少。但随着AI发展进入快车道,将驱动工业智能化从弱人工智能走向广泛应用并向强人工智能迈进的新阶段。在“人工智能+产品”方面,新一代智能终端快速发展。AI终端是大模型和各类软件接口以及硬件工具的结合体,在各类电子产品、大型制造设备、具身智能等领域均有广泛应用。
此外,谈及AI对网络的影响。王志勤指出,AI将驱动信息通信网络从“运营管理智能”向“网元智能”发展变革,由外至内深入赋能、梯次落地、全面提升通信网络和设备的数据感知、分析、优化、决策能力,实现运营支撑少人化、网络管理精准化、通信性能极致化。信息通信网络架构也将从烟囱式、外挂式智能向网络智能内生方向发展,形成支持AI全流程管控的原生AI网络协议,实现“人-机-智能体交互”的全新服务模式。“网络AI内生已成共识,具体实施路径尚未清晰,6G将率先从架构、协议、服务三个层面全方位探索AI内生。”王志勤讲道。