AUTOMATIC1111/stable-diffusion-webui - 学习路径

❤️❤️❤️❤️❤️❤️ 我们已经正式推出微信小程序，在微信中搜索 TrendForge Pro 即可使用小程序，如果使用 Telegram 请搜索 trendforge_tg ❤️❤️❤️❤️❤️❤️

项目介绍快速开始学习路径项目截图 1 贡献者 428 增长趋势 Commit 历史代码统计生态关系项目时间线项目竞品依赖分析上榜历史

学习路径指南

难度等级

初级

预计时长

3-5小时

适合人群

对AI绘画感兴趣的初学者，无需编程经验，但需要基本的电脑操作能力。适合想快速体验Stable Diffusion功能的AI艺术爱好者、设计师和内容创作者。

学习目标：学会安装并运行Stable Diffusion WebUI，掌握文生图、图生图等核心功能，能够使用AI生成和编辑图像。

前置知识

Windows/Linux/Mac操作系统基础操作熟悉

需要能够安装软件、解压文件、运行脚本等基本电脑操作。

Python基础环境（仅手动安装需要）了解 (可选)

如果选择手动安装方式，需要知道如何安装Python并添加到系统PATH。

Git基础（仅手动安装需要）了解 (可选)

如果通过Git克隆仓库，需要知道基本的Git命令或使用Git GUI工具。

NVIDIA/AMD/Intel显卡驱动了解

确保显卡驱动已更新，以便硬件加速AI计算。

学习步骤

环境准备与安装

30-60分钟

选择安装方式

根据你的操作系统和硬件选择最适合的安装方式： 1. Windows用户（NVIDIA显卡推荐）：下载sd.webui.zip发布包 2. Windows用户（手动安装）：安装Python 3.10.6和Git，然后克隆仓库 3. Linux用户：安装依赖后运行webui.sh 4. Mac用户：查看专门的Apple Silicon安装指南

新手强烈推荐使用Windows发布包方式，最简单快捷。注意Python必须用3.10.6版本，新版本可能不兼容。

下载与安装

按照README中的说明完成安装： - 发布包用户：下载sd.webui.zip，解压后运行update.bat和run.bat - 手动安装用户：运行`git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git`，然后运行webui-user.bat（Windows）或webui.sh（Linux）

首次运行会自动下载所需模型和依赖，可能需要较长时间（取决于网络速度）。确保有足够的磁盘空间（至少10GB）。

验证安装成功

安装完成后，浏览器会自动打开WebUI界面（通常是http://127.0.0.1:7860）。看到Gradio界面即表示安装成功。

如果浏览器没有自动打开，可以手动在浏览器地址栏输入控制台显示的URL。

快速入门：第一次生成图像

30分钟

了解界面布局

熟悉WebUI的主要区域： 1. 顶部：模型选择、刷新按钮 2. 左侧：文生图（txt2img）、图生图（img2img）等标签页 3. 中间：提示词输入框、参数设置 4. 右侧：生成按钮、图像显示区域

鼠标悬停在大多数UI元素上会显示功能提示，善用这个特性。

第一次文生图

在txt2img标签页： 1. 在提示词（Prompt）框中输入英文描述，如"a beautiful sunset over mountains" 2. 负面提示词（Negative prompt）可以留空或输入不想要的内容 3. 点击"Generate"按钮 4. 等待生成完成，查看结果

第一次生成可能需要较长时间，因为要加载模型。后续生成会快很多。

保存你的第一张作品

生成完成后： 1. 右键点击图像可以保存 2. 图像会同时保存在项目的outputs/txt2img-images目录中 3. 图像文件包含了生成参数（PNG信息中）

可以拖动图像到"PNG info"标签页查看和恢复生成参数。

核心功能探索

1-2小时

掌握提示词技巧

学习提示词的基本语法： 1. 使用`(word)`增加权重，`((word))`增加更多权重 2. 使用`[word]`降低权重 3. 使用`word:1.5`精确控制权重值 4. 使用`AND`连接多个概念

提示词质量直接影响生成效果，多尝试不同的描述方式。

尝试图生图功能

切换到img2img标签页： 1. 上传一张图片 2. 输入提示词描述想要的变化 3. 调整去噪强度（Denoising strength）控制变化程度 4. 点击生成

去噪强度0.3-0.7之间效果较好，值越高变化越大。

体验局部重绘

在img2img页面选择"Inpaint"模式： 1. 上传图片 2. 使用画笔工具涂抹想要修改的区域 3. 输入提示词描述修改内容 4. 生成查看效果

局部重绘是修复图像或改变局部内容的强大工具。

使用面部修复和超分辨率

生成图像后或在图生图时： 1. 勾选面部修复选项（如GFPGAN或CodeFormer） 2. 在Extras标签页使用RealESRGAN等工具放大图像 3. 调整放大倍数和模型

面部修复对人物肖像特别有用，超分辨率可以提升图像细节。

进阶功能与个性化

1小时

安装和使用模型

学习如何扩展功能： 1. 从Civitai等网站下载模型（.ckpt或.safetensors文件） 2. 将模型文件放入models/Stable-diffusion目录 3. 在WebUI顶部下拉菜单刷新并选择新模型

不同模型有不同风格，尝试多种模型找到最适合你需求的。

探索扩展功能

浏览可用扩展： 1. 在Extensions标签页点击"Available" 2. 加载扩展列表 3. 安装感兴趣的扩展（如ControlNet、Dynamic Prompts等） 4. 重启WebUI应用扩展

扩展可以大大增强WebUI的功能，但不要一次性安装太多。

调整常用参数

了解关键参数的作用： 1. 采样方法（Sampling method）：影响图像质量和风格 2. 采样步数（Sampling steps）：通常20-30步效果较好 3. 图像尺寸：必须是8的倍数 4. 种子（Seed）：固定种子可以复现相同图像

不同参数组合会产生不同效果，多尝试找到最佳设置。

学习路径常见错误

Python版本错误

必须使用Python 3.10.6，不要使用更高版本。如果已安装其他版本，可以同时安装3.10.6并确保PATH指向正确版本。

显存不足错误

如果显卡显存小于4GB，在webui-user.bat中添加--lowvram参数。也可以减少图像尺寸或使用优化设置。

模型文件放错位置

检查点模型必须放在models/Stable-diffusion目录，VAE模型放在models/VAE目录，LoRA放在models/Lora目录。

提示词效果不理想

使用英文提示词效果最好，描述要具体。使用负面提示词排除不想要的内容。参考他人的成功案例学习提示词构造。

图像尺寸设置不当

图像尺寸必须是8的倍数（如512x512, 768x512）。过大的尺寸可能导致显存不足或图像扭曲。

学习路径下一步步骤

掌握基础后，可以深入学习ControlNet精确控制构图、训练自己的LoRA模型定制风格、学习高级提示词工程、探索API集成到其他应用、参与社区贡献扩展功能等。