(图片来源:钛媒体AGI编辑林志佳拍摄)
2025开年,行业领先的 AI 科学家加入阿里巴巴。
2月6日消息,钛媒体AGI获悉,全球顶尖人工智能科学家许主洪教授(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。
另有消息称,内部系统显示,许主洪目前的身份是管理层,base在新加坡,根据汇报线关系,他的职级应该是 P10 或者 P11。
公开信息显示,许主洪在 AI 工业界和学术界拥有超20年经验,2002年清华大学本科毕业后,许主洪分别在 2004 年和 2006 年获得香港中文大学计算机科学与工程系的硕士学位和博士学位。
许主洪曾在新加坡南洋理工大学、新加坡管理大学担任教授,也曾担任全球最大企业CRM软件厂商Salesforce集团副总裁、亚洲研究院创始院长,目前是新加坡管理大学(SMU)信息系统学院的终身教职。他发表的300余篇 AI 顶级学术论文,引用量超过5万余次。其发表的多篇“多模态预训练”主题论文影响力很大,论文引用数位列当年全球前五,其提出的预训练策略有效降低成本,深刻影响了全球大模型研发。
2019年,许主洪当选代表全球科学与工程技术领域顶尖成就的IEEE Fellow(电气和电子工程师协会会士),并被斯坦福大学评选为“全球前1%的人工智能科学家”。
2023年,许主洪创立 AI 初创公司HyperGAI,开发出先进的多模态端侧大语言模型,推出了前沿的图像和视频生成模型及产品,最新的用于边缘和移动设备的开源轻量级多模态模型HPT 1.5 Edge,其性能超越了微软 Phi-3-Vision (4B) 模型,并在多个基准测试中达到 GPT-4V 性能。目前暂不清楚HyperGAI是否已经被阿里收购。
针对近期DeepSeek热潮,许主洪发文表示,DeepSeek-R1 非常热门,但 LLM+RL(大语言模型+强化学习)框架的想法并不完全新颖。
“2022 年,我的 Salesforce AI 团队是提出 LLM + RL 联合训练和推理框架的先驱之一,这比 OpenAI O1 和 DeepSeek-R1 的工作早了几年。我们发表了一篇名为 CodeRL的 NeurIPS 论文,该论文在代码生成方面实现了开源 SOTA,使用不到 1B 代码的 LLM 模型(击败了 10 倍大的模型)。我们的想法是应用与 AlphaGo/AlphaZero 类似的原理和方法,以自学的方式训练和改进 LLM,但基础 LLM 模型的大小和性能不够强(ChatGPT 尚未发布)。”许主洪称。
实际上,近期,阿里巴巴AI To C业务大动作频频,业务布局消息不断,引入世界级顶尖人才,组建顶级AI算法研究和工程团队。
目前,阿里巴巴“少壮派”高管吴嘉担任阿里巴巴智能信息事业群总裁,淘天用户平台事业部与阿里妈妈事业部负责人,兼任淘天集团淘宝直播及内容事业部负责人。同时,阿里旗下AI应用“通义”并入阿里智能信息事业群,天猫精灵团队与夸克产品团队融合工作,探索AI眼镜等新硬件方向。
许主洪的加入,大大提升阿里巴巴AI应用C端产品在模型结合应用的端对端闭环能力上的跃迁。同时,阿里AI To C业务正在组建顶级AI算法研究和工程团队,吸引大量业内优秀人才加盟。
钛媒体AGI了解到,目前已经有多位微软亚洲研究院的 AI 科学家正在与阿里接触,有望近日对外公布加入信息。
当前在DeepSeek和字节的猛攻下,阿里正在对AI To C加码人才与资源投入,而且正在全面整合阿里内部 AI 资源,对阿里AI To C在多模态Agents以及商业化等方向进行深入探索,也为下一阶段构建面向用户的AI应用平台打开了想象空间。
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)