学习目标:学会安装并运行Stable Diffusion WebUI,掌握文生图、图生图等核心功能,能够使用AI生成和编辑图像。
前置知识
需要能够安装软件、解压文件、运行脚本等基本电脑操作。
如果选择手动安装方式,需要知道如何安装Python并添加到系统PATH。
如果通过Git克隆仓库,需要知道基本的Git命令或使用Git GUI工具。
确保显卡驱动已更新,以便硬件加速AI计算。
学习步骤
环境准备与安装
30-60分钟选择安装方式
根据你的操作系统和硬件选择最适合的安装方式: 1. Windows用户(NVIDIA显卡推荐):下载sd.webui.zip发布包 2. Windows用户(手动安装):安装Python 3.10.6和Git,然后克隆仓库 3. Linux用户:安装依赖后运行webui.sh 4. Mac用户:查看专门的Apple Silicon安装指南
新手强烈推荐使用Windows发布包方式,最简单快捷。注意Python必须用3.10.6版本,新版本可能不兼容。
下载与安装
按照README中的说明完成安装: - 发布包用户:下载sd.webui.zip,解压后运行update.bat和run.bat - 手动安装用户:运行`git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git`,然后运行webui-user.bat(Windows)或webui.sh(Linux)
首次运行会自动下载所需模型和依赖,可能需要较长时间(取决于网络速度)。确保有足够的磁盘空间(至少10GB)。
验证安装成功
安装完成后,浏览器会自动打开WebUI界面(通常是http://127.0.0.1:7860)。看到Gradio界面即表示安装成功。
如果浏览器没有自动打开,可以手动在浏览器地址栏输入控制台显示的URL。
快速入门:第一次生成图像
30分钟了解界面布局
熟悉WebUI的主要区域: 1. 顶部:模型选择、刷新按钮 2. 左侧:文生图(txt2img)、图生图(img2img)等标签页 3. 中间:提示词输入框、参数设置 4. 右侧:生成按钮、图像显示区域
鼠标悬停在大多数UI元素上会显示功能提示,善用这个特性。
第一次文生图
在txt2img标签页: 1. 在提示词(Prompt)框中输入英文描述,如"a beautiful sunset over mountains" 2. 负面提示词(Negative prompt)可以留空或输入不想要的内容 3. 点击"Generate"按钮 4. 等待生成完成,查看结果
第一次生成可能需要较长时间,因为要加载模型。后续生成会快很多。
保存你的第一张作品
生成完成后: 1. 右键点击图像可以保存 2. 图像会同时保存在项目的outputs/txt2img-images目录中 3. 图像文件包含了生成参数(PNG信息中)
可以拖动图像到"PNG info"标签页查看和恢复生成参数。
核心功能探索
1-2小时掌握提示词技巧
学习提示词的基本语法: 1. 使用`(word)`增加权重,`((word))`增加更多权重 2. 使用`[word]`降低权重 3. 使用`word:1.5`精确控制权重值 4. 使用`AND`连接多个概念
提示词质量直接影响生成效果,多尝试不同的描述方式。
尝试图生图功能
切换到img2img标签页: 1. 上传一张图片 2. 输入提示词描述想要的变化 3. 调整去噪强度(Denoising strength)控制变化程度 4. 点击生成
去噪强度0.3-0.7之间效果较好,值越高变化越大。
体验局部重绘
在img2img页面选择"Inpaint"模式: 1. 上传图片 2. 使用画笔工具涂抹想要修改的区域 3. 输入提示词描述修改内容 4. 生成查看效果
局部重绘是修复图像或改变局部内容的强大工具。
使用面部修复和超分辨率
生成图像后或在图生图时: 1. 勾选面部修复选项(如GFPGAN或CodeFormer) 2. 在Extras标签页使用RealESRGAN等工具放大图像 3. 调整放大倍数和模型
面部修复对人物肖像特别有用,超分辨率可以提升图像细节。
进阶功能与个性化
1小时安装和使用模型
学习如何扩展功能: 1. 从Civitai等网站下载模型(.ckpt或.safetensors文件) 2. 将模型文件放入models/Stable-diffusion目录 3. 在WebUI顶部下拉菜单刷新并选择新模型
不同模型有不同风格,尝试多种模型找到最适合你需求的。
探索扩展功能
浏览可用扩展: 1. 在Extensions标签页点击"Available" 2. 加载扩展列表 3. 安装感兴趣的扩展(如ControlNet、Dynamic Prompts等) 4. 重启WebUI应用扩展
扩展可以大大增强WebUI的功能,但不要一次性安装太多。
调整常用参数
了解关键参数的作用: 1. 采样方法(Sampling method):影响图像质量和风格 2. 采样步数(Sampling steps):通常20-30步效果较好 3. 图像尺寸:必须是8的倍数 4. 种子(Seed):固定种子可以复现相同图像
不同参数组合会产生不同效果,多尝试找到最佳设置。
推荐资源
完整的官方文档,包含安装指南、故障排除、功能详解等
活跃的用户社区,分享作品、技巧和问题解答
大量入门到进阶的视频教程,直观易学
最大的Stable Diffusion模型分享平台,包含检查点、LoRA、Embeddings等
提示词分享平台,可以学习他人的提示词技巧
常见错误与避坑指南
Python版本错误
必须使用Python 3.10.6,不要使用更高版本。如果已安装其他版本,可以同时安装3.10.6并确保PATH指向正确版本。
显存不足错误
如果显卡显存小于4GB,在webui-user.bat中添加--lowvram参数。也可以减少图像尺寸或使用优化设置。
模型文件放错位置
检查点模型必须放在models/Stable-diffusion目录,VAE模型放在models/VAE目录,LoRA放在models/Lora目录。
提示词效果不理想
使用英文提示词效果最好,描述要具体。使用负面提示词排除不想要的内容。参考他人的成功案例学习提示词构造。
图像尺寸设置不当
图像尺寸必须是8的倍数(如512x512, 768x512)。过大的尺寸可能导致显存不足或图像扭曲。
下一步探索
掌握基础后,可以深入学习ControlNet精确控制构图、训练自己的LoRA模型定制风格、学习高级提示词工程、探索API集成到其他应用、参与社区贡献扩展功能等。
相关项目推荐
public-apis/public-apis
免费API资源汇总列表
EbookFoundation/free-programming-books
📚 免费提供的编程书籍
donnemartin/system-design-primer
学习如何设计大规模系统。为系统设计面试做准备。包含Anki记忆卡片。
vinta/awesome-python
精心整理的优质Python框架、库、软件及资源列表
TheAlgorithms/Python
所有算法均使用Python实现
Significant-Gravitas/AutoGPT
AutoGPT致力于实现人人可用的普惠AI,让每个人都能使用和构建AI。我们的使命是提供工具,让您专注于重要事务。