全球顶尖人工智能科学家，加盟阿里巴巴！阿里还有大动作

据上海证券报，2月6日，记者从多方确认，全球顶尖人工智能科学家许主洪教授（Steven Hoi）正式加入阿里巴巴，出任阿里集团副总裁，负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。

另据了解，阿里AI To C业务正在组建顶级AI算法研究和工程团队，吸引大量业内优秀人才加盟。

图片来源：每日经济新闻资料图

公开资料显示，许主洪教授在人工智能工业界和学术界拥有超20年经验，曾在新加坡南洋理工大学、新加坡管理大学担任教授。他发表的300余篇人工智能顶级学术论文，引用量超过五万次。他的多篇“多模态预训练”主题论文影响力很大，论文引用数位列当年全球前五，其提出的预训练策略有效降低成本，深刻影响了全球大模型研发。

作为全球多模态大模型领域的领军人物，他曾担任全球最大企业软件厂商Salesforce集团副总裁、亚洲研究院创始院长，从0到1搭建了Salesforce亚洲人工智能研究体系，主导多个开创行业先河的人工智能研究项目和应用产品。2023年，许主洪创立人工智能初创公司，开发出先进的多模态大语言模型，推出了前沿的图像和视频生成模型及产品。

据内部人士透露，许主洪将专注于AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案，大幅提升阿里巴巴AI应用C端产品在模型结合应用的端对端闭环能力。有业内人士分析，2025年初，世界级顶尖科学家的加盟，可以视为阿里AI To C加码人才与资源投入的重要信号。未来，大模型顶级人才团队将支撑起阿里AI To C在多模态Agents等方向的深入探索，也为下一阶段构建面向用户的AI应用平台打开了想象空间。

1月29日，阿里云通义千问旗舰版模型Qwen2.5-Max正式升级发布。

据微信公众号“阿里云”消息，Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果，预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能，在多项公开主流模型评测基准上录得高分，全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。目前，开发者可在Qwen Chat平台免费体验模型，企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

官方资料表示，由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型，通义团队将Qwen2.5-Max与目前领先的开源MoE模型DeepSeek V3、最大的开源稠密模型Llama-3.1-405B，以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中，Qwen2.5-Max全部超越了对比模型。

图片来源：微信公众号阿里云

据中国基金报，阿里通义千问团队表示，Qwen2.5-Max采用超大规模MoE（混合专家）架构，基于超过20万亿token的预训练数据及精心设计的后训练方案进行训练。

据介绍，Qwen2.5-Max在知识、编程、全面评估综合能力以及人类偏好对齐等主流权威基准测试上，展现出全球领先的模型性能。指令模型是所有人可直接对话体验到的模型版本，在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

值得注意的是，除了发布Qwen2.5-Max以外，1月28日，阿里还开源了全新的视觉理解模型Qwen2.5-VL，推出了3B、7B、72B三个尺寸版本。其中，旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军，全面超越GPT-4o与Claude3.5。

截至2月6日发稿，阿里巴巴-W（HK9988）报97.95港元，涨幅0.41%，市值1.9万亿港元。