发布日期:2025-10-28 12:14 点击次数:117

9 月 19 日音信,阿里开源全新当作生成模子通义万相 Wan2.2-Animate,该模子同期救济动画和替换两种模式,输入一张扮装图片和一段参考视频,可将视频扮装的当作、阵势挪动到图片扮装中,赋予图片扮装动态阐扬力;同期还可在保留原始视频的当作、阵势及环境的基础上,将视频中的扮装替换为图片中的扮装。该模子救济运转东说念主物、动漫形象和动物相片,可讹诈于短视频创作、跳舞模板生成、动漫制作等边界。 
昨年事首,阿里推出了 Animate Anyone 模子,基于该模子的「全民舞王」功能一度火爆全网,戎马俑、萌宠跳科目三的视频在外交平台刷屏。但此前的时间框架无法同期截止当作、阵势和环境交互,生成的视频依旧存在不当然的问题。
这次,通义万相团队构建了一个涵盖语言、面部阵势和肉体当作的大限制东说念主物视频数据集,并基于通义万相图生视频模子进行后锻练。Wan2.2-Animate 将扮装信息、环境信息和当作等,模范到一种和解的暗意要津,罢了了单一模子同期兼容两种推理模式;针对肉体通顺和脸部阵势,分裂使用骨骼信号和隐式特征,互助当作重定向模块,罢了当作和阵势的精确复刻。在替换模式中,团队还假想了一个孤独的光照交融 LoRA,用于保证完好意思的光照交融服从。
实测终端流露,Wan2.2-Animate 在视频生成质地、主体一致性和感知亏空等纰谬计算上,越过了 StableAnimator、LivePortrait 等开源模子,是当今性能最强的当作生成模子,在东说念主类主不雅评测中,Wan2.2-Animate 以至越过了以 Runway Act-two 代表的闭源模子。
自本年 2 月以来kaiyun官方网站,通义万相已邻接开源 20 多款模子,在开源社区和三方平台的下载量已超 3000 万,是开源社区最受接待的视频生成模子之一。通义万相模子家眷已救济文生图、文生视频、图生视频、东说念主声生视频和当作生成等 10 多种视觉创作才调。


