Stable Diffusion：文生图参数详解

创作时间:

作者:

@小白创作中心

Stable Diffusion：文生图参数详解

引用

CSDN

https://blog.csdn.net/HJS123456780/article/details/140201299

Stable Diffusion是一种基于深度学习的图像生成模型，能够根据文本描述生成高质量的图像。它在AI绘画、图像修复等领域有着广泛的应用。本文将详细介绍Stable Diffusion中几个关键参数的使用方法和效果，帮助用户更好地掌握这一强大的工具。

一. 面部修复与高分辨率修复

面部修复主要用于改善人脸的生成效果，特别是在生成真人模型全身照时。面部修复有两种模型：CodeFormer和GFPGAN，默认使用CodeFormer。

从上图可以看出，使用面部修复后，特别是在嘴唇等细节处，生成效果有明显提升。CodeFormer和GFPGAN两种模型在效果上差异不大。

高分辨率修复用于生成高画质图像。其机制是先将原图放大绘制，再还原到原始大小。因此，这一过程对计算资源要求较高，建议在高性能计算机上使用。

高清化算法（Upscaler）：改善真人、三次元脸部建议使用R-ESRGAN 4x+；如果是二次元建议使用R-ESRGAN 4x+ Anime6B。
高分辨率采样步数（Hires steps）：建议直接赋值0，表示使用原有出图的采样步数。
重绘幅度(Denoising)：取值范围0-1，值越大，生成的图片和原图差异越大。这一参数将在后续图生图章节详细讲解。
放大倍率（Upscale by）：一般设置为2倍。

通常情况下，建议开启面部修复和高分辨率修复功能。

二. 图片宽度和高度

图片尺寸主要控制生成图片的大小。SD Web UI默认分辨率为512*512。

SD模型训练的图片分辨率大部分都是512*512，因此这个分辨率的效果最佳。
512*512在满足高质量要求的情况下，可以同时兼顾到性能的要求。如果分辨率设置得较大，对电脑的显卡要求会比较高，生成图片时可能出现各种报错异常。

一般建议：

正方形图片：宽度512*高度512
长方形图片：宽度512*高度768

三. 提示词相关性（CFG Scale）

这个参数用于控制生成图片的自由度，取值范围1-30。

数值越小，生成的图片和提示词的吻合度越低；数值越大，生成的图片和提示词的吻合度越高。一般情况下，取值设置在7-10之间。
CFG 2-6：发挥创造力空间较大，可能会出现不按照提示词生成图片。
CFG 7-10：建议用于大多数场景，能很好在提示词引导和创造力之间平衡。
CFG10-15：提示词对生成的图片影响较大，当然要求提示词较好，足够具体。
CFG16-20：除非提示词非常详细。一般不推荐。
CFG高于20：可能会产生一些奇怪的现象，一般不推荐。

四. 种子（Seed）

种子相当于图片的DNA，决定了画面的内容。默认值是-1，表示随机生成。

在SD Web UI生成图片的下面，可以看到图片相关的文本信息，里面的Seed值就是当前生成图片所使用的Seed值。

只有当提示词、模型、参数设置（包括随机数的种子）完全一致时，才能生成相同的图片。

使用相同的种子Seed，最终生成的3张图片几乎没有区别。

在图像生成种子输入框栏的最右边有一个选择框，选中后，会出现一些差异种子的设置选项。

随机数差异种子（Variation seed）：在生成图像时可以同时使用图像生成种子和随机数差异种子。
差异强度（Variation strength）：取值范围0-1。如果值是0，相当于没有设置随机数差异种子；如果值是1，相当于是没有设置图像生成种子。

AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

热门推荐

中考复读减分录取，政策尤需公平合理