Wan2.1-VACE：阿里开源的AI视频生成和编辑模型-AI视频生成

通义万相 Wan2.1-VACE 是什么？

通义万相 Wan2.1-VACE 是阿里巴巴推出的强大 AI 视频生成与编辑模型。这款单一的模型即可实现多种功能，包括文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等，涵盖了全系列的基础生成和编辑能力。此次开源发布了 1.3B 和 14B 两个版本，其中 1.3B 版本可以在消费级显卡上流畅运行。开发者可以在 GitHub、HuggingFace 以及魔搭社区上下载并体验这一先进技术。此外，该模型还计划逐步在通义万相官网和阿里云百炼平台上线，为更多用户提供便捷的使用途径。 Wan2.1-VACE：阿里开源的<a href= AI视频生成和编辑模型" />

通义万相 Wan2.1-VACE的主要功能

多模态视频生成：
- 支持文本生成视频、图像参考生成视频、视频参考生成视频等多种输入方式。
- 通过局部区域生成或修改视频，可以实现视频的局部编辑、内容重塑。
视频编辑与重绘：
- 支持视频的背景扩展、局部编辑、视频重绘等功能。
- 用户可以通过深度图、光流、布局等控制信号对视频进行精确的编辑。
功能自由组合：
- 用户可以通过输入条件的组合，实现更复杂的任务，如将图片参考与主体重塑结合，进行物体替换；将首帧参考与背景扩展结合，生成不同类型的长视频。
支持广泛输入格式：
- 支持文本、图像、视频、Mask和控制信号等多种输入方式，能够保持视频生成的一致性和灵活控制视频的布局、运动姿态等。