阿里再开源,全球首个MoE视频生成模型登场,电影级美学效果一触即达
创始人
2025-07-30 06:01:26
0

机器之心报道

机器之心编辑部

继上周开源三连发之后,阿里昨晚又放出了新模型。

这次是全球首个开源的 MoE 架构的视频生成模型 Wan2.2,最大的亮点是具备了电影级美学控制能力

该模型遵循 Apache 2.0 开源协议。

  • 官网地址:https://wan.video/welcome
  • Hugging Face 地址:https://huggingface.co/Wan-AI
  • ModelScope 地址:https://modelscope.cn/organization/Wan-AI

我们先来看两个示例:

提示词:A purely visual and atmospheric video piece focusing on the interplay of light and shadow, with a corn train as the central motif. Imagine a stage bathed in dramatic, warm spotlights, where a corn train, rendered as a stark silhouette, moves slowly across the space. The video explores the dynamic interplay of light and shadow cast by the train, creating abstract patterns, shapes, and illusions that dance across the stage. The soundtrack should be ambient and minimalist, enhancing the atmospheric and abstract nature of the piece.

提示词:A man on the run, darting through the rain-soaked back alleys of a neon-lit city night, steam rising from the wet pavement. He's clad in a drenched trench coat, his face etched with panic as he sprints down the alley, constantly looking over his shoulder. A chase sequence shot from behind, immersing the viewer deeply, as if the pursuers are right behind the camera lens.

对于 Wan2.2 的开源,评论区的网友也是称赞有加。

而实现这样的效果,Wan2.2 主要得益于以下几大技术创新:

一是,MoE 架构创新

Wan2.2 首次在视频扩散模型中引入了 Mixture-of-Experts(MoE)专家混合架构。

通过在时间步之间引入多个专门的强大专家模型来分担去噪过程,Wan2.2 实现了在不增加计算成本的前提下,大幅扩展了模型整体容量。

二是,数据规模跃升

相比 Wan2.1,Wan2.2 的训练数据量大幅提升:图像数据增加 65.6%,视频数据增加 83.2%。

数据量的扩展显著增强了模型在运动表达、语义理解和美学表现等多维度的泛化能力,在所有开源与闭源视频模型中的表现均属顶尖。

三是,电影级美学控制能力

Wan2.2 融入了特别筛选的美学数据集,并标注了光影、构图、色彩等细粒度属性,使得模型在生成时能够更精准地控制电影感风格,支持用户按需定制审美偏好。

四是,高效高清 Hybrid TI2V 架构

Wan2.2 同步开源了一款 50 亿参数模型,采用自研的 Wan2.2-VAE 编码器,压缩率达到 16×16×4。该模型支持文本生成视频和图像生成视频两种模式,生成分辨率高达 720P、24fps,并可在消费级显卡(如 4090)上流畅运行。

该模型是当前市场上最快速的 720P、24fps 生成模型之一,可同时服务工业界与学术界的多种需求。

目前,用户可在 Hugging Face 和阿里魔搭(ModelScope)社区下载使用。

相关内容

热门资讯

效率跃升新标杆:利红数字化系统... 来源:天舜企业AI智能协同机器人 在数字化转型加速的当下,企业如何通过技术手段突破效率瓶颈?近日,记...
数十项成果亮相中关村人工智能与... 中新网北京7月30日电 2025中关村论坛系列活动——中关村人工智能与未来城市论坛29日在中关村国家...
中手游反腐通报:原满天星工作室... 来源:游戏葡萄 7月30日,中手游发布了一份内部反腐通告。通告显示,中手游旗下满天星工作室原总经理姜...
南极光:公司与任天堂的合作以S... 证券日报网讯 南极光7月30日在互动平台回答投资者提问时表示,公司与任天堂的合作以Switch2背光...
打造全球科技创新策源地 香港理... 7月29日,香港理工大学(理大)与蚂蚁数科在港签署战略合作协议,共建“香港理大—蚂蚁数科AI+Web...
原神 5.8上半卡池开启:新角... 原神 5.8 上半卡池包含伊涅芙、茜特菈莉两位五星角色以及赛索斯、菲谢尔、行秋三位四星陪跑角色。以下...
船舶界“六边形战士”,如何重塑... “未来”号 (受访单位供图) □ 本报记者 张宣 杨频萍 近日,由深海技术科学太湖实验室历时六年科研...
入住率狂飙31.5%!雷神电竞... 导语 当第四届无畏契约全国大赛的紫色霓虹点亮青岛海岸线,雷神电竞酒店的运营后台正刷新着令人瞩目的数据...
效率提升12倍!“星汉AI”在... 21世纪经济报道记者吴文汐 武汉报道 近日,一款首次将机器视觉与人工智能技术相结合的高精密度光伏电池...
2025云手机流畅度大比拼:从... 随着云计算技术的飞速发展,云手机已经从技术验证阶段跃升为高效生产力工具。如今,无论是游戏爱好者、多账...
虎牙三角洲DDC钻石冠军赛圆满... 日前,由虎牙直播主办的三角洲DDC钻石冠军赛于上海虹桥国际新媒体中心圆满收官。作为一场汇聚国内顶尖电...
九号电动车助力AG超玩会勇夺E... 7月27日,在沙特举办的2025年“EWC电竞世界杯”决赛现场,成都AG超玩会战队以4:3的比分战胜...
DNF夏日版本死灵毕业附魔推荐 1. 柔滑: 因为死灵术士无敌技能十分匮乏,所以柔滑尤为重要,即取消大技能和普攻暗击拳的后摇,一段...
14秒梦碎!澳大利亚首枚自主火... 据新京报消息,7月29日,澳大利亚一家新兴航空航天公司从昆士兰发射其首枚“Eris”火箭失败。火箭在...
原创 诸... 诸葛亮新皮肤“天机白泽”已经正式公布,目前可以确定这款皮肤是一款无双限定皮肤在设计方面是非常高级的。...
《宝可梦TCG Pocket》... 《宝可梦TCG Pocket》在公开新A4扩展包“天与海的指引”中卡牌时,其中“凤王ex(★3)”的...
原创 《... “《GTA6》即将发售”这件事都快成了游戏圈里的狼来了,其原定于今年秋季发售,但又跳票到明年5月26...
北邮王立新:中国移动把“承诺”... 通信世界网消息(CWW)随着通信行业迈入深度存量竞争时代,服务正在成为品牌价值重塑的关键变量。近日,...
三角洲行动2025年7月30日... 在三角洲行动中,每日各地图的密码门都会刷新不同的摩斯密码。玩家需在战局中找到密码门,并正确输入密码解...