vita-epfl/Stable-Video-Infinity - 快速上手

❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

项目介绍快速开始学习路径项目截图 3 贡献者 2 增长趋势 Commit 历史代码统计生态关系项目时间线项目竞品依赖分析上榜历史

5分钟上手 Stable Video Infinity (SVI)

本指南将帮助你在5分钟内完成SVI环境配置，并生成你的第一段AI视频

环境要求

支持的操作系统

Linux Windows (WSL2) macOS

运行环境

Python >=3.8 必需

CUDA >=11.8 必需

所需工具

Git

克隆项目代码

必需

操作步骤

克隆项目并安装依赖

获取SVI源代码并安装必要的Python包

克隆主仓库

git clone https://github.com/vita-epfl/Stable-Video-Infinity.git

进入项目目录

cd Stable-Video-Infinity

安装Python依赖

pip install -r requirements.txt

预期结果：：所有依赖包安装成功，无错误信息

建议使用Python虚拟环境，如：python -m venv svi_env && source svi_env/bin/activate

下载预训练模型

下载SVI 2.0 Pro模型（基于Wan 2.2）

切换到Wan 2.2分支

git checkout sviwan22

下载模型权重

python scripts/download_model.py --model svi_2.0_pro

预期结果：：模型文件下载完成，保存在models/目录下

模型文件较大（约10GB），请确保有足够的磁盘空间和稳定的网络连接

生成第一段视频

使用简单提示词生成10秒的测试视频

生成日落山脉视频

python generate.py --prompt "A beautiful sunset over mountains" --duration 10 --output test_video.mp4

预期结果：：视频生成进度显示，最终生成test_video.mp4文件

首次生成需要加载模型，可能需要1-2分钟。建议从简单提示词开始

验证成功

检查是否成功生成了视频文件

test_video.mp4文件存在且大小正常（>10MB）

视频可以正常播放，无错误提示

控制台显示生成完成的确认信息

快速提示

配置

使用不同seed值生成不同视频片段，这对长视频质量至关重要

性能

建议使用480p分辨率（854x480）以获得最佳性能

调试

如果遇到CUDA内存不足，可尝试减小batch size或使用--low-vram参数

其他

查看社区工作流教程获取高级用法（如口型同步、舞蹈生成）

常见问题

CUDA out of memory错误

减小batch size：添加--batch-size 1参数，或使用--low-vram模式

视频生成速度慢

确保使用GPU运行，检查CUDA版本兼容性，使用480p分辨率

视频闪烁或质量下降

确保使用正确的SVI 2.0工作流，为不同片段使用不同seed值

模型下载失败

手动从HuggingFace下载模型并放入models/目录，或使用国内镜像源

下一步

尝试生成更长视频

增加--duration参数生成30秒以上的视频，观察错误回收机制效果

探索社区工作流

查看项目pinned issue中的ComfyUI工作流，实现口型同步等高级功能

在线体验SVI

访问Poe平台直接使用SVI-2.0 Pro，无需本地部署

加入社区交流

分享你的生成结果，获取更多创意提示和优化建议