掌握Stable Diffusion操作技巧：让你的图像生成更出色

创作时间:

作者:

@小白创作中心

引用

CSDN

https://blog.csdn.net/weixin_55607175/article/details/139132659

Stable Diffusion是当前最流行的AI图像生成工具之一，掌握其使用技巧对于创作高质量的图像至关重要。本文将详细介绍Stable Diffusion的基础操作、Prompt语法技巧以及一个实用的提示词中译英插件，帮助你提升图像生成效果。

如图所示，Stable Diffusion WebUI的操作界面主要分为：模型区域、功能区域、参数区域、出图区域。

正向提示词：描述图片中希望出现的内容
反向提示词：描述图片中不希望出现的内容
Sampling method：采样方法，推荐选择Euler a或DPM++系列，采样速度快
Sampling steps：迭代步数，数值越大图像质量越好，生成时间也越长，一般控制在30-50就能出效果
Restore faces：可以优化脸部生成
Width/Height：生成图片的宽高，越大越消耗显存，生成时间也越长，一般方图512x512，竖图512x768，需要更大尺寸，可以到Extras功能里进行等比高清放大
CFG：提示词相关性，数值越大越相关，数值越小越不相关，一般建议7-12区间
Batch count/Batch size：生成批次和每批数量，如果需要多图，可以调整下每批数量
Seed：种子数，-1表示随机，相同的种子数可以保持图像的一致性，如果觉得一张图的结构不错，但对风格不满意，可以将种子数固定，再调整prompt生成

img2img功能可以生成与原图相似构图色彩的画像，或者指定一部分内容进行变换。可以重点使用Inpaint图像修补这个功能：

Resize mode：缩放模式，Just resize只调整图片大小，如果输入与输出长宽比例不同，图片会被拉伸。Crop and resize裁剪与调整大小，如果输入与输出长宽比例不同，会以图片中心向四周，将比例外的部分进行裁剪。Resize and fill调整大小与填充，如果输入与输出分辨率不同，会以图片中心向四周，将比例内多余的部分进行填充
Mask blur：蒙版模糊度，值越大与原图边缘的过度越平滑，越小则边缘越锐利
Mask mode：蒙版模式，Inpaint masked只重绘涂色部分，Inpaint not masked重绘除了涂色的部分
Masked Content：蒙版内容，fill用其他内容填充，original在原来的基础上重绘
Inpaint area：重绘区域，Whole picture整个图像区域，Only masked只在蒙版区域
Denoising strength：重绘幅度，值越大越自由发挥，越小越和原图接近

安装完ControlNet后，在txt2img和img2img参数面板中均可以调用ControlNet。操作说明：

Enable：启用ControlNet
Low VRAM：低显存模式优化，建议8G显存以下开启
Guess mode：猜测模式，可以不设置提示词，自动生成图片
Preprocessor：选择预处理器，主要有OpenPose、Canny、HED、Scribble、Mlsd、Seg、Normal Map、Depth
Model：ControlNet模型，模型选择要与预处理器对应
Weight：权重影响，使用ControlNet生成图片的权重占比影响
Guidance strength(T)：引导强度，值为1时，代表每迭代1步就会被ControlNet引导1次
Annotator resolution：数值越高，预处理图像越精细
Canny low/high threshold：控制最低和最高采样深度
Resize mode：图像大小模式，默认选择缩放至合适
Canvas width/height：画布宽高
Create blank canvas：创建空白画布
Preview annotator result：预览注释器结果，得到一张ControlNet模型提取的特征图片
Hide annotator result：隐藏预览图像窗口

文生图模型的精髓在于Prompt提示词，如何写好Prompt将直接影响图像的生成质量。

Prompt提示词可以分为4段式结构：画质画风+画面主体+画面细节+风格参考

提示词排序：越前面的词汇越受AI重视，重要事物的提示词放前面
增强/减弱：(提示词:权重数值)，默认1，大于1加强，低于1减弱。如(doctor:1.3)
混合：提示词|提示词，实现多个要素混合，如[red|blue]hair红蓝色头发混合
+和AND：用于连接短提示词，AND两端要加空格
分步渲染：[提示词A:提示词B:数值]，先按提示词A生成，在设定的数值后朝提示词B变化。如[dog🐱30]前30步画狗后面的画猫，[dog🐱0.9]前面90%画狗后面10%画猫
正向提示词：masterpiece,best quality等画质词，用于提升画面质量
反向提示词：nsfw,bad hands,missing fingers……，用于不想在画面中出现的内容
Emoji：支持emoji，如😍形容表情，🖐修饰手