智东西
编辑 Panken

智东西1月15日报道,今日,生数科技发布视频大模型Vidu 2.0,将视频大模型的价格进一步打下来。

Vidu 2.0的核心升级包括:速度上,视频生成速度跑进10秒;​价格上,生成单秒视频仅需4分钱,同时上线“错峰模式”,支持闲时不限量生成,不卡积分、不卡条数;​模型效果首尾帧流畅,风格和多主体保持更稳定,镜头运动表现出色。

//oss.zhidx.com/uploads/2025/01/6787d799e28f6_6787d799d6bfb_6787d799d6bc0_视频2Vidu1.0和Vidu2.0对比.mp4

▲国外用户生成的Vidu不同版本对比视频

此外,Vidu研发团队也罕见公布了运营数据:自2024年7月底全球上线以来,20天用户数突破百万,上线100天用户数突破千万。截至目前,来自全球200个国家和地区的用户在Vidu平台上共计生产了上亿条视频。

根据已公开的数据,Vidu是目前全球增速最快的AI视频模型产品。​

一、生成时长最快不到10秒,速度提升3倍

生成速度是视频大模型的一大瓶颈。Vidu团队一直在方面精进,去年7月底全球上线1.0版本时,单片段的实测推理速度就已跑进了30秒内,实现全球最快,此次2.0在生成速度上更是突破到秒级。

不管是图生视频、首尾帧生视频,生成4秒512P单片段视频不到10秒,速度比前代版本提升了3倍


▲Vidu 2.0 512-4s图生视频生成速度实时测评​

而提升生成速度对广告制作、影视动画等专业内容创作的效率提升很有帮助。

比如广告商业片,以前传统广告制作中,光拍摄周期可能在3-5天,后期制作更是耗时耗力,从5-15天不等,总体上一条1分钟广告片的交付周期在1个月左右。​

而使用Vidu 2.0,理想状态下,仅需花5分钟就能跑出足够1分钟时长的视频素材,等于是既节约拍摄时间,又节省后期制作成本。 ​

二、加量还降价!单秒视频仅需“4分钱”,百元就能产出1分钟商业片​

目前市场上的视频模型采用的是订阅制,订阅费不菲,每月还会有积分的限制。

Sora刚上线时,就有海外用户吐槽Sora价格“太贵了”,生成一个5秒480P视频成本为0.5美元,折合人民币3.63元,生成一段1080p视频成本更是高达27元。​

再比如Runway,产出一条素材需要花费25积分,每月625积分只能产出25条5秒左右的素材片段。而做1分钟的广告片,至少需要可能5分钟甚至更多的素材,每月625积分是远远不够用的。若生成质量不高,还需要不断地提升会员权益,不断买积分。​

此次Vidu 2.0推出了全新的收费套餐,直接将每秒单价成本降至最低4分钱,让人人都能用得起。​

横向与同类模型产品对比,以各家720P每秒单价计算,Vidu 2.0为0.258元/秒,行业平均价格约为0.6元/秒。

大致算下来的话,Vidu 2.0 720P的收费仅为行业平均的43%,也就是连现在业内平均价格的一半都不到。Runway虽然效果不错,但每秒单价超过了0.5元。​


价格便宜了,意味着能生成更多的视频素材。

以720P为例,目前市面上的视频模型,10元钱平均只能生成20秒的视频,而Vidu 2.0能生成38秒的视频,接近行业平均水平的2倍。

也就是说,可能用不到百元的成本,就能完成一支短片的制作。

粗略算笔账,通常传统广告片制作需要经过平面、动效、剪辑等流程,需要雇佣剪辑师、画师、特效师等等,即使是一个4-5人的小团队,按照普通出品水准,制作1分钟广告片的行业平均成本至少也在3000-5000元左右。

而采用Vidu 2.0生成1分钟商业广告片素材的成本在3-5元左右,即便考虑素材的有效率和后期剪辑配音等成本,1分钟广告片的成本也大约为100元左右,相比传统制作广告,成本下降到1/50~1/30

据爆款AI短剧创作者闲人一坤分享,以前做类似规模的动画项目,团队规模通常需要40-50人,现在整个项目组不到10个人就能高效运转,人力需求直接降低到了原来的四分之一以下。成本上,传统的影视拍摄需要投入大量资金购买专业设备和软件,动辄几十万甚至上百万的投入。而使用Vidu,整体的软件使用成本降到了一个完全不同的数量级,可以说是大大降低了创作的门槛和成本。

Vidu还悄悄上线了省钱妙招——“错峰模式”。

该模式有点类似于饭店闲时特价,用户申请的任务将排队等待流量低峰时执行,错峰生成不仅不扣用户现有积分,而且生成素材无限量,想生成多少次就生成多少次。

有率先体验Vidu 2.0内测的用户在社交平台评价:“目前vidu,生成很快,再配合无限生成,很爽。”

三、风格、主体、动作稳定性更高

除了增速降价,Vidu 2.0的效果质量也进一步升级。

首先是风格一致性保持更稳,画面细节、主体更加稳定,镜头运动理解更强,图生视频能够完整理解风格元素、始终保持整体画面风格一致。

比如一张卷发男子在花丛中的油画图片,风格偏印象派,Vidu 2.0生成的视频能保持男生手中的花与画面背景的花是一致的,油画风格贯穿始终。其他模型生成的视频则有不同程度的崩坏。


再比如水墨风格的视频生成,下图老虎在慢慢靠近,Vidu 2.0没有出现风格突然变换的问题,Pika 2.0生成的视频则在最后几秒突然变彩色,Runway的画风也逐渐跑偏。


生数还展示了一个将商品海报图用Vidu 2.0参考生视频变成动态视频的示例,比如做一个猫粮的视频宣传,让猫咪伸出爪子吃猫粮。

//oss.zhidx.com/uploads/2025/01/6787d12169a13_6787d121553a1_6787d12155372_视频5猫粮广告海报.mp4

这种动态表现更能引发猫主子们的购买欲。不过可以看到画面在还原物理特性上仍有进步空间,爪子碰到猫粮后不是自然地扒拉下猫粮,而是有点穿过猫粮的既视感。

Vidu 2.0的镜头运动表现也更自然流畅,对镜头运动指令的理解更加到位。据生数分享,电影中常见的上下左右推拉旋转镜头运动方面,Vidu 2.0在同类视频生成模型中表现更佳。

以下图动漫人物为例,输入提示词“镜头顺时针旋转”,Vidu 2.0理解得更到位。


首尾帧画面切换同样更加自然。继2024年10月Vidu首次上线首尾帧功能后,Vidu 2.0将首尾帧的性能进一步提升,中间过渡更丝滑流畅,画面稳定性更强,同时在首尾帧中间的场景切换、镜头切换更具有想象力,实现了想象力和稳定性更好的平衡。

例如下面的视频,从两个古人在秋天围炉喝茶的画面一下穿越到大雪纷飞的古城街头,Vidu 2.0生成的视频更让人有种瞬时穿越感。

//oss.zhidx.com/uploads/2025/01/6787d62661cc6_6787d626570e2_6787d626570ba_视频7古人饮酒首尾帧丝滑对比.mp4

相比之下,Sora生成的视频的切换,就有点像切PPT了。

Vidu 2.0还大幅提升了参考生视频的性能。在不同风格的主体和背景的稳定性上,Vidu 2.0不仅相较Vidu 1.5提升较大,而且相比Pika 2.0,在稳定性上拉开了明显差距。

在三维动画风格中,Pika 2.0的视频中出现了崩坏的情况,相对而言Vidu 2.0在多主体情况下仍然保持了画面主体和背景的一致。

//oss.zhidx.com/uploads/2025/01/6787d93bd0d7d_6787d93bc5889_6787d93bc5861_视频8参考生更稳更像.mp4

Vidu 2.0的主体相似度保持得更好,生成的视频的主体、背景都与参考图更像,即使在打架这种大幅度动作中也能保持主角的一致。相比之下,Pika 2.0生成的视频中,白衣男生与参考图完全判若两人,眼睛都变成绿色了,很难将参考角色与视频联系起来。

//oss.zhidx.com/uploads/2025/01/6787d95debe70_6787d95de5bf9_6787d95de5bd1_视频9参考生相似度对比.mp4

四、用户数20天破百万,百天破千万,全球增速第一

Vidu首次对外公布了运营数据:自7月底全球上线以来,Vidu仅用了20天用户数就突破百万,上线100天用户数就突破千万。

截至目前,Vidu平台累计生成的视频数突破亿条,其中“参考生视频”功能仅上线三个月,用户利用该功能生成的视频数就已达到千万级别。

虽然Vidu未公开最新用户数,但相比市面上已知的竞品情况,爱诗科技于11月18日公布用户数超1200万,讨论度较高的可灵于12月10日公布的用户数超600万。相比之下,Vidu在10月底就实现了千万用户数,用户规模远超可灵。

从用户覆盖地区看,Vidu已服务了全球超过200个国家和地区,用户规模位列全球第一梯队。

之前有一位美国60岁老奶奶MamaFish用Vidu把她创作的儿童故事变成视频形式,在短短20分钟内创建50多个场景,而且成本非常便宜。MamaFish的视频在YouTube上广受欢迎,还因此获得了更多收益。


▲MamaFish利用Vidu创作的儿童动画短片《如果我是一头牛(If I Were A Cow)》的截图

在日本,@8co28 是Vidu第一批早期用户,是一位二次元爱好者,曾尝试过kling、gen3、hailuo、pika、luma等产品来创作二次元动画。最终,他选择了用Vidu,认为Vidu在参考生视频方面要比其他平台有更强大的优势,同时对于大动作大动态的处理也十分突出。因为所制作AI视频的出色效果,@8co28 吸引了更多人的关注,粉丝数已经超过35万。


▲@8co28 用Vidu生成的AI动画截图

Vidu的产品力也获得了许多企业的认可。Evoke是一家面向海外用户的AI图生视频应用,也是Vidu早期的Maas客户。自从接入Vidu的API后,据Evoke内部数据,在“拥抱”、“亲吻”等场景上,相较于同类视频生成平台,Vidu在模型准确率提升了超60%,在视频生成时间上从270秒缩短到35秒,时间相对下降了近九成。用户满意度也有显著提升,用户取消视频生成的概率降低了10%。这些用户体验帮助Evoke在海外获得了更多注册用户和付费用户。

结语:视频大模型普惠第一步,拔高性价比

Vidu 2.0的发布,推动视频生成进入“秒级时代”,再加上更亲民的价格,标志着视频生成领域迈向“人人可用”阶段,从小众走向大众。

随着生成时间的快速提升,长期来看,视频生成逐步走向实时生成,未来有望诞生全新的内容互动形式,创造类似互动短剧、互动游戏等全新用户体验。​

ad1 webp
ad2 webp
ad1 webp
ad2 webp