2月25日晚间,阿里云官方公众号发文称,刚刚,阿里云视频生成大模型万相2.1(Wan)重磅开源,此次开源采用Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace、魔搭社区下载体验。
此次开源的两个参数版本模型:
14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出,在权威评测集Vbench中,万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型,稳居榜首位置。
1.3B版本万相模型不仅超过了更大尺寸的开源模型,甚至还和一些闭源的模型结果接近,同时能在消费级显卡运行,仅需8.2GB显存就可以生成480P视频,适用于二次模型开发和学术研究。
从2023年开始,阿里云就坚定大模型开源路线。
自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态,多次登上国内外权威榜单,已成为全球开源社区最重要的模型系列。阿里云千问(Qwen)衍生模型数量已超过10万个,是全球最大的AI模型家族。
随着万相的开源,阿里云实现了全模态、全尺寸大模型的开源。
值得一提的是,自2025年1月DeepSeek火爆出圈至今,开源正在成为国内外众多大模型的“必选项”。今年2月,字节豆包、昆仑万维、百度文心、阿里通义千问等均推出开源模型。
每日经济新闻综合公开消息
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。