一次了解所有功能！超详细【Stable Diffusion界面】使用指南

创作时间:

作者:

@小白创作中心

引用

CSDN

https://blog.csdn.net/2401_84760527/article/details/141186310

对于AI绘画的初学者而言，初次接触Stable Diffusion（SD）的用户界面可能会感到困惑，因为其中包含了许多陌生的专业术语，如大模型、提示词、采样迭代等。这些概念与传统的绘画方式大相径庭，使得学习曲线较为陡峭。本文将详细解析SD界面的各项功能，帮助用户快速掌握其使用方法。

Stable Diffusion 模型：这是出图的基础，也被称为底模或大模型。默认情况下，启动后是没有预装大模型的，但有些启动包可能会附带一两个模型。用户通常需要自行下载模型文件，其格式主要有两种：.ckpt和.safetensors。可以将这些模型理解为不同的"画师"，通过提示词向其描述需求，画师会根据自身的"画风"来生成相应的图像。
外挂VAE模型：VAE是变分自编码器的缩写，主要作用是优化画面的色彩饱和度，类似于摄影中的滤镜效果。使用VAE模型可以使画面颜色更加明亮艳丽，但如果没有也不会产生太大影响，通常建议选择自动加载。
跳过CLIP层数：全称是语言与图片对比预训练，用于控制提示词与生成图片的关联程度。数值越高，关联性越弱，SD的自由发挥空间越大，但可能偏离预期效果；数值越低，关联性越强，生成效果更接近预期，但SD的创作空间相对较小。一般建议保持默认值1不变。

这是SD的主要输入界面，虽然提供了多个选项，但实际使用中主要集中在"文生图"和"图生图"两个功能上。其他选项则作为辅助设置。

这一区域包含了多个影响生成效果的关键参数：

迭代步数：一般设定在20~30之间，具体数值取决于所使用的模型。较高的迭代步数可以生成更精细的图像，但会增加计算时间。并非迭代步数越高越好，合适的数值才能达到最佳效果。
采样方法：代表不同的图像生成算法，适用于不同场景。例如：
Euler a：适合快速生成简单的图像，如二次元场景。
DPM++ 2M Karras、DPM++ SDE Karras：适合生成高品质的真人或自然场景图像。
UniPC：特别适用于人形体相关的场景，可以在保持采样速度的同时生成更逼真的图像。

面部修复：主要用于真人场景，可以修复因画面比例问题导致的人脸模糊。
平铺图：实现图像拼贴效果，适合生成花纹等重复图案。
高分辨率修复：默认情况下，高分辨率图像（宽高大于756像素）可能会出现混沌效果。开启此选项可以改善这一问题，但会消耗更多显存。推荐使用R-ESRGAN 4X+（真实三次元）或R-ESRGAN 4X+ Anime6B（动漫二次元）进行放大处理。