Stable Diffusion Web UI

一个基于 Gradio 库实现的 Stable Diffusion 网页界面。

功能特性

详细功能展示（含图片）：
- 原始的文生图（txt2img）和图生图（img2img）模式
- 一键安装和运行脚本（但仍需安装 Python 和 Git）
- 图像外延（Outpainting）
- 图像修复（Inpainting）
- 色彩草图（Color Sketch）
- 提示词矩阵（Prompt Matrix）
- Stable Diffusion 放大（Upscale）
- 注意力机制：可指定模型应更关注的文本部分
- ((燕尾服)) 中的男士 - 将更关注“燕尾服”
- (燕尾服:1.21) 中的男士 - 替代语法
- 选择文本并按 Ctrl+上箭头 或 Ctrl+下箭头（在 macOS 上为 Command+上箭头 或 Command+下箭头）自动调整所选文本的注意力（代码由匿名用户贡献）
- 循环回馈（Loopback）：多次运行图生图处理
- X/Y/Z 图表：绘制具有不同参数的三维图像图表
- 文本反转（Textual Inversion）
- 可拥有任意数量的嵌入向量，并可随意命名
- 可使用具有不同每令牌向量数的多个嵌入向量
- 支持半精度浮点数
- 可在 8GB 显存上训练嵌入向量（也有 6GB 成功的报告）
- 附加功能标签页，包含：
- GFPGAN：修复面部的神经网络
- CodeFormer：作为 GFPGAN 替代方案的面部修复工具
- RealESRGAN：神经网络放大工具
- ESRGAN：神经网络放大工具，包含大量第三方模型
- SwinIR 和 Swin2SR（见此）：神经网络放大工具
- LDSR：潜在扩散超分辨率放大
- 调整宽高比选项
- 采样方法选择
- 可调整采样器的 eta 值（噪声乘数）
- 更多高级噪声设置选项
- 随时中断处理过程
- 支持 4GB 显存显卡（也有 2GB 成功的报告）
- 批处理的正确种子值
- 实时提示词令牌长度验证
- 生成参数
- 用于生成图像的参数会随图像保存
- PNG 格式保存在 PNG 块中，JPEG 格式保存在 EXIF 中
- 可将图像拖拽至 PNG 信息标签页以恢复生成参数并自动复制到 UI 中
- 可在设置中禁用此功能
- 支持将图像/文本参数拖拽到提示词框
- 读取生成参数按钮：将提示词框中的参数加载到 UI
- 设置页面
- 从 UI 运行任意 Python 代码（必须使用 --allow-code 参数运行以启用）
- 大多数 UI 元素支持鼠标悬停提示
- 可通过文本配置文件更改 UI 元素的默认值/最小值/最大值/步进值
- 平铺支持：复选框可创建像纹理一样可平铺的图像
- 进度条和实时图像生成预览
- 可使用单独的神经网络生成预览，几乎不消耗 VRAM 或计算资源
- 负面提示词：额外的文本字段，用于列出不希望出现在生成图像中的内容
- 样式：保存部分提示词并通过下拉菜单轻松应用的方式
- 变体：生成相同图像但带有细微差异的方式
- 种子调整：生成相同图像但分辨率略有不同的方式
- CLIP 询问器：尝试从图像猜测提示词的按钮
- 提示词编辑：在生成过程中更改提示词的方式，例如开始生成西瓜，中途切换到动漫女孩
- 批处理：使用图生图处理一组文件
- 图生图替代方案：交叉注意力控制的反向欧拉方法
- 高清修复：一键生成高分辨率图片而无需通常的扭曲的便捷选项
- 动态重载检查点
- 检查点合并器：允许将最多 3 个检查点合并为一个的标签页
- 自定义脚本，包含来自社区的众多扩展
- 可组合扩散：同时使用多个提示词的方式
- 使用大写的 AND 分隔提示词
- 也支持提示词权重：一只猫 :1.2 AND 一只狗 AND 一只企鹅 :2.2
- 提示词无令牌限制（原始 Stable Diffusion 最多允许使用 75 个令牌）
- DeepDanbooru 集成：为动漫提示词创建 Danbooru 风格标签
- xformers：为特定显卡带来显著速度提升（在命令行参数中添加 --xformers）
- 通过扩展实现：历史记录标签页：在 UI 内方便地查看、定向和删除图像
- 无限生成选项
- 训练标签页
- 超网络和嵌入向量选项
- 图像预处理：裁剪、镜像翻转、使用 BLIP 或 deepdanbooru（用于动漫）自动打标签
- Clip skip
- 超网络（Hypernetworks）
- LoRA（与超网络类似但更美观）
- 一个独立的 UI，您可以在其中预览并选择将哪些嵌入向量、超网络或 LoRA 添加到提示词中
- 可从设置屏幕选择加载不同的 VAE
- 进度条中显示预计完成时间
- API 支持
- 支持 RunwayML 的专用修复模型
- 通过扩展实现：美学梯度：通过使用 CLIP 图像嵌入来生成具有特定美学的图像（实现自 https://github.com/vicgalle/stable-diffusion-aesthetic-gradients）
- Stable Diffusion 2.0 支持 - 查看 wiki 获取说明
- Alt-Diffusion 支持 - 查看 wiki 获取说明
- 现在没有任何不良字符！
- 支持以 safetensors 格式加载检查点
- 放宽分辨率限制：生成图像的尺寸必须是 8 的倍数，而不是 64
- 现在有许可证了！
- 可从设置屏幕重新排列 UI 中的元素
- Segmind Stable Diffusion 支持

安装与运行

请确保满足所需的依赖项，并按照以下说明操作：
- NVidia（推荐）
- AMD GPU
- Intel CPU、Intel GPU（集成和独立）（外部 wiki 页面）
- Ascend NPU（外部 wiki 页面）

或者，使用在线服务（如 Google Colab）：

在线服务列表

在 Windows 10/11 上使用发布包安装（适用于 NVidia GPU）

从 v1.0.0-pre 下载 sd.webui.zip 并解压。
运行 update.bat。
运行 run.bat。

更多详情请参阅 Install-and-Run-on-NVidia-GPUs

在 Windows 上自动安装

安装 Python 3.10.6（更高版本的 Python 不支持 torch），勾选“Add Python to PATH”。
安装 git。
下载 stable-diffusion-webui 仓库，例如运行 git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git。
以普通非管理员用户身份从 Windows 资源管理器运行 webui-user.bat。

在 Linux 上自动安装

安装依赖项：

# Debian 系：
sudo apt install wget git python3 python3-venv libgl1 libglib2.0-0
# Red Hat 系：
sudo dnf install wget git python3 gperftools-libs libglvnd-glx
# openSUSE 系：
sudo zypper install wget git python3 libtcmalloc4 libglvnd
# Arch 系：
sudo pacman -S wget git python3

如果您的系统非常新，可能需要安装 python3.11 或 python3.10：

# Ubuntu 24.04
sudo add-apt-repository ppa:deadsnakes/ppa
sudo apt update
sudo apt install python3.11

# Manjaro/Arch
sudo pacman -S yay
yay -S python311 # 不要与 python3.11 包混淆

# 仅适用于 3.11
# 然后在启动脚本中设置环境变量
export python_cmd="python3.11"
# 或在 webui-user.sh 中
python_cmd="python3.11"

导航到您希望安装 webui 的目录并执行以下命令：

wget -q https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh

或者直接克隆仓库到任意位置：

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

运行 webui.sh。
查看 webui-user.sh 了解选项。

在 Apple Silicon 上安装

请在此处查找说明：Installation-on-Apple-Silicon。

贡献

如何向此仓库添加代码：贡献指南

文档

文档已从此 README 移至项目的 wiki。

为了让 Google 和其他搜索引擎能够抓取 wiki，这里提供一个（非供人类阅读的）可抓取的 wiki 链接。

致谢

借用代码的许可证可在 设置 -> 许可证 屏幕中找到，也可在 html/licenses.html 文件中找到。

Stable Diffusion - https://github.com/Stability-AI/stablediffusion, https://github.com/CompVis/taming-transformers, https://github.com/mcmonkey4eva/sd3-ref
k-diffusion - https://github.com/crowsonkb/k-diffusion.git
Spandrel - https://github.com/chaiNNer-org/spandrel 实现了
GFPGAN - https://github.com/TencentARC/GFPGAN.git
CodeFormer - https://github.com/sczhou/CodeFormer
ESRGAN - https://github.com/xinntao/ESRGAN
SwinIR - https://github.com/JingyunLiang/SwinIR
Swin2SR - https://github.com/mv-lab/swin2sr
LDSR - https://github.com/Hafiidz/latent-diffusion
MiDaS - https://github.com/isl-org/MiDaS
优化思路 - https://github.com/basujindal/stable-diffusion
交叉注意力层优化 - Doggettx - https://github.com/Doggettx/stable-diffusion，提示词编辑的原始思路。
交叉注意力层优化 - InvokeAI, lstein - https://github.com/invoke-ai/InvokeAI（原为 http://github.com/lstein/stable-diffusion）
次二次交叉注意力层优化 - Alex Birch (https://github.com/Birch-san/diffusers/pull/1), Amin Rezaei (https://github.com/AminRezaei0x443/memory-efficient-attention)
文本反转 - Rinon Gal - https://github.com/rinongal/textual_inversion（我们未使用其代码，但使用了其思路）。
SD 放大思路 - https://github.com/jquesnelle/txt2imghd
外延 mk2 的噪声生成 - https://github.com/parlance-zz/g-diffuser-bot
CLIP 询问器思路及借用部分代码 - https://github.com/pharmapsychotic/clip-interrogator
可组合扩散思路 - https://github.com/energy-based-model/Compositional-Visual-Generation-with-Composable-Diffusion-Models-PyTorch
xformers - https://github.com/facebookresearch/xformers
DeepDanbooru - 动漫扩散器的询问器 https://github.com/KichangKim/DeepDanbooru
从 float16 UNet 进行 float32 精度采样 - marunine 提出思路，Birch-san 提供 Diffusers 实现示例 (https://github.com/Birch-san/diffusers-play/tree/92feee6)
Instruct pix2pix - Tim Brooks (star), Aleksander Holynski (star), Alexei A. Efros (no star) - https://github.com/timothybrooks/instruct-pix2pix
安全建议 - RyotaK
UniPC 采样器 - Wenliang Zhao - https://github.com/wl-zhao/UniPC
TAESD - Ollin Boer Bohan - https://github.com/madebyollin/taesd
LyCORIS - KohakuBlueleaf
重启采样 - lambertae - https://github.com/Newbeeer/diffusion_restart_sampling
Hypertile - tfernd - https://github.com/tfernd/HyperTile
初始 Gradio 脚本 - 由匿名用户在 4chan 上发布。感谢匿名用户。
（您）

项目地址：https://github.com/AUTOMATIC1111/stable-diffusion-webui

519 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

Stable Diffusion WebUI — 图像生成界的基石