据上海证券报,2月6日,记者从多方确认,全球顶尖人工智能科学家许主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。
另据了解,阿里AI To C业务正在组建顶级AI算法研究和工程团队,吸引大量业内优秀人才加盟。
图片来源:每日经济新闻 资料图
公开资料显示,许主洪教授在人工智能工业界和学术界拥有超20年经验,曾在新加坡南洋理工大学、新加坡管理大学担任教授。他发表的300余篇人工智能顶级学术论文,引用量超过五万次。他的多篇“多模态预训练”主题论文影响力很大,论文引用数位列当年全球前五,其提出的预训练策略有效降低成本,深刻影响了全球大模型研发。
作为全球多模态大模型领域的领军人物,他曾担任全球最大企业软件厂商Salesforce集团副总裁、亚洲研究院创始院长,从0到1搭建了Salesforce亚洲人工智能研究体系,主导多个开创行业先河的人工智能研究项目和应用产品。2023年,许主洪创立人工智能初创公司,开发出先进的多模态大语言模型,推出了前沿的图像和视频生成模型及产品。
据内部人士透露,许主洪将专注于AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案,大幅提升阿里巴巴AI应用C端产品在模型结合应用的端对端闭环能力。有业内人士分析,2025年初,世界级顶尖科学家的加盟,可以视为阿里AI To C加码人才与资源投入的重要信号。未来,大模型顶级人才团队将支撑起阿里AI To C在多模态Agents等方向的深入探索,也为下一阶段构建面向用户的AI应用平台打开了想象空间。
1月29日,阿里云通义千问旗舰版模型Qwen2.5-Max正式升级发布。
据微信公众号“阿里云”消息,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。目前,开发者可在Qwen Chat平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。
官方资料表示,由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型,通义团队将Qwen2.5-Max与目前领先的开源MoE模型DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。
图片来源:微信公众号阿里云
据中国基金报,阿里通义千问团队表示,Qwen2.5-Max采用超大规模MoE(混合专家)架构,基于超过20万亿token的预训练数据及精心设计的后训练方案进行训练。
据介绍,Qwen2.5-Max在知识、编程、全面评估综合能力以及人类偏好对齐等主流权威基准测试上,展现出全球领先的模型性能。指令模型是所有人可直接对话体验到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
值得注意的是,除了发布Qwen2.5-Max以外,1月28日,阿里还开源了全新的视觉理解模型Qwen2.5-VL,推出了3B、7B、72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,全面超越GPT-4o与Claude3.5。
截至2月6日发稿,阿里巴巴-W(HK9988)报97.95港元,涨幅0.41%,市值1.9万亿港元。
每日经济新闻综合上海证券报、中国基金报、公开资料
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。