5分钟上手 Stable Video Infinity (SVI)

本指南将帮助你在5分钟内完成SVI环境配置,并生成你的第一段AI视频

环境要求

支持的操作系统

Linux Windows (WSL2) macOS

运行环境

Python >=3.8 必需
CUDA >=11.8 必需

所需工具

Git

克隆项目代码

必需

操作步骤

1

克隆项目并安装依赖

获取SVI源代码并安装必要的Python包

克隆主仓库
git clone https://github.com/vita-epfl/Stable-Video-Infinity.git
进入项目目录
cd Stable-Video-Infinity
安装Python依赖
pip install -r requirements.txt

预期结果:所有依赖包安装成功,无错误信息

建议使用Python虚拟环境,如:python -m venv svi_env && source svi_env/bin/activate

2

下载预训练模型

下载SVI 2.0 Pro模型(基于Wan 2.2)

切换到Wan 2.2分支
git checkout sviwan22
下载模型权重
python scripts/download_model.py --model svi_2.0_pro

预期结果:模型文件下载完成,保存在models/目录下

模型文件较大(约10GB),请确保有足够的磁盘空间和稳定的网络连接

3

生成第一段视频

使用简单提示词生成10秒的测试视频

生成日落山脉视频
python generate.py --prompt "A beautiful sunset over mountains" --duration 10 --output test_video.mp4

预期结果:视频生成进度显示,最终生成test_video.mp4文件

首次生成需要加载模型,可能需要1-2分钟。建议从简单提示词开始

验证成功

检查是否成功生成了视频文件

test_video.mp4文件存在且大小正常(>10MB)
视频可以正常播放,无错误提示
控制台显示生成完成的确认信息

快速提示

配置

使用不同seed值生成不同视频片段,这对长视频质量至关重要

性能

建议使用480p分辨率(854x480)以获得最佳性能

调试

如果遇到CUDA内存不足,可尝试减小batch size或使用--low-vram参数

其他

查看社区工作流教程获取高级用法(如口型同步、舞蹈生成)

常见问题

1

CUDA out of memory错误

减小batch size:添加--batch-size 1参数,或使用--low-vram模式

2

视频生成速度慢

确保使用GPU运行,检查CUDA版本兼容性,使用480p分辨率

3

视频闪烁或质量下降

确保使用正确的SVI 2.0工作流,为不同片段使用不同seed值

4

模型下载失败

手动从HuggingFace下载模型并放入models/目录,或使用国内镜像源

下一步

尝试生成更长视频

增加--duration参数生成30秒以上的视频,观察错误回收机制效果

探索社区工作流

查看项目pinned issue中的ComfyUI工作流,实现口型同步等高级功能

在线体验SVI

访问Poe平台直接使用SVI-2.0 Pro,无需本地部署

加入社区交流

分享你的生成结果,获取更多创意提示和优化建议

助手