阿里再开源,全球首个MoE视频生成模型登场,电影级美学效果一触即达
创始人
2025-07-30 06:01:26
0

机器之心报道

机器之心编辑部

继上周开源三连发之后,阿里昨晚又放出了新模型。

这次是全球首个开源的 MoE 架构的视频生成模型 Wan2.2,最大的亮点是具备了电影级美学控制能力

该模型遵循 Apache 2.0 开源协议。

  • 官网地址:https://wan.video/welcome
  • Hugging Face 地址:https://huggingface.co/Wan-AI
  • ModelScope 地址:https://modelscope.cn/organization/Wan-AI

我们先来看两个示例:

提示词:A purely visual and atmospheric video piece focusing on the interplay of light and shadow, with a corn train as the central motif. Imagine a stage bathed in dramatic, warm spotlights, where a corn train, rendered as a stark silhouette, moves slowly across the space. The video explores the dynamic interplay of light and shadow cast by the train, creating abstract patterns, shapes, and illusions that dance across the stage. The soundtrack should be ambient and minimalist, enhancing the atmospheric and abstract nature of the piece.

提示词:A man on the run, darting through the rain-soaked back alleys of a neon-lit city night, steam rising from the wet pavement. He's clad in a drenched trench coat, his face etched with panic as he sprints down the alley, constantly looking over his shoulder. A chase sequence shot from behind, immersing the viewer deeply, as if the pursuers are right behind the camera lens.

对于 Wan2.2 的开源,评论区的网友也是称赞有加。

而实现这样的效果,Wan2.2 主要得益于以下几大技术创新:

一是,MoE 架构创新

Wan2.2 首次在视频扩散模型中引入了 Mixture-of-Experts(MoE)专家混合架构。

通过在时间步之间引入多个专门的强大专家模型来分担去噪过程,Wan2.2 实现了在不增加计算成本的前提下,大幅扩展了模型整体容量。

二是,数据规模跃升

相比 Wan2.1,Wan2.2 的训练数据量大幅提升:图像数据增加 65.6%,视频数据增加 83.2%。

数据量的扩展显著增强了模型在运动表达、语义理解和美学表现等多维度的泛化能力,在所有开源与闭源视频模型中的表现均属顶尖。

三是,电影级美学控制能力

Wan2.2 融入了特别筛选的美学数据集,并标注了光影、构图、色彩等细粒度属性,使得模型在生成时能够更精准地控制电影感风格,支持用户按需定制审美偏好。

四是,高效高清 Hybrid TI2V 架构

Wan2.2 同步开源了一款 50 亿参数模型,采用自研的 Wan2.2-VAE 编码器,压缩率达到 16×16×4。该模型支持文本生成视频和图像生成视频两种模式,生成分辨率高达 720P、24fps,并可在消费级显卡(如 4090)上流畅运行。

该模型是当前市场上最快速的 720P、24fps 生成模型之一,可同时服务工业界与学术界的多种需求。

目前,用户可在 Hugging Face 和阿里魔搭(ModelScope)社区下载使用。

相关内容

热门资讯

智赋荆楚,灵启新程!华为坤灵中... 智能化浪潮席卷荆楚大地,在长江经济带与中部崛起战略的双重驱动下,湖北中小企业作为区域经济的“活力引擎...
贯彻中央部署,重要委员会成立!... 撰文 | 李岩 中国工信新闻网27日消息,26日,工业和信息化部人形机器人与具身智能标准化技术委员...
上海克林技术取得绕线系统专利,... 国家知识产权局信息显示,上海克林技术开发有限公司取得一项名为“一种绕线系统”的专利,授权公告号CN2...
超值预警!这免费官网竟能精准狙... 当免费成为主流,究竟哪款AIGC检测官网才能真正帮你识别和优化AI生成内容的网络可见度? 优采云AI...
2025全球智能手表出货量预计... 12月27号消息,根据Counterpoint Research最新发布的报告显示,全球智能手表出货...
数翊科技华中研发总部项目签约落... 近日,数翊科技与光谷光电子信息产业园签约,将在光谷建设华中研发总部,开发以分布式数据库软件为核心的A...
赛维斯照明取得筒灯结构专利,提... 国家知识产权局信息显示,中山市赛维斯照明有限公司取得一项名为“一种筒灯结构”的专利,授权公告号CN2...
广电流量卡深度测评:信号、流量... 办卡关注 微 信 公 众 号 :找卡乐园 这里是专为你打造的流量卡服务站,既能帮你揭开流量卡市场的各...
东旭光电取得重载连接器专利,具... 国家知识产权局信息显示,芜湖东旭光电装备技术有限公司取得一项名为“重载连接器”的专利,授权公告号CN...
【赠书福利】豆瓣9.1分的神级... 天气预报为什么总不准? 股市为什么难以预测? 心跳为什么偶尔会咯噔一下? ——全是“混沌”在捣鬼! ...
原航发集团董事长曹建国: 已从... 12月27日,据澎湃新闻报道,曾任中国航空发动机集团有限公司(简称“中国航发集团”)董事长、党组书记...
原创 荣... 2025年12月26日,根据多家科技媒体的消息,荣耀这家智能手机厂商在成都举办新品发布会,正式发布“...
理文造纸取得用于造纸生产的打浆... 国家知识产权局信息显示,广东理文造纸有限公司取得一项名为“一种用于造纸生产的打浆磨浆装置”的专利,授...
美国初创公司高管:人形机器人市... 在加利福尼亚州山景城举行的Humanoids Summit上,多位人形机器人初创公司的创始人与高管表...
更安全更便捷更微创:重庆医生首... 近日,聚焦胸外科机器人手术的专题研修活动“胸外科机器人手术大师班”在重庆医科大学附属大学城医院举行。...
“成都造”家储产品发往尼日利亚... 12月26日,四川华体照明科技股份有限公司(以下简称“华体科技”)在其成都双流总部基地举行了新型储能...
上海旅超AI音乐赛携手AI开放... 第一届上海旅游攻略超级大赛(第一季)启动以来,收获热烈反响。为有效扩大赛事社会影响半径,上海旅超大赛...
原创 仅... 最近,台湾的气氛有些紧张。台防务部门发布了一则消息,称大陆将于12月27号,也就是大约48小时后,在...
联名徕卡三年后,小米造了一台“... 如果一台手机,它的开机界面是 Leica、机身刻着 Leica,背面还镶了颗 Leica 经典可乐标...
北京京东公益基金会曾晨:用商业... 本报(chinatimes.net.cn)记者卢梦雪 北京报道 12月26日,由华夏时报社主办的20...