资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

Stable Diffusion 核心参数详解：新手必懂的配置指南！

创作时间:

作者:

@小白创作中心

Stable Diffusion 核心参数详解：新手必懂的配置指南！

引用

CSDN

https://blog.csdn.net/ice_99/article/details/145652598

在AI绘画的世界里，Stable Diffusion作为一款强大的图像生成工具，其核心参数的设置直接影响着最终的生成效果。对于初学者来说，掌握这些参数不仅能帮助你更好地控制图像的风格和细节，还能让你在创作过程中更加得心应手。本文将详细解析Stable Diffusion中的关键参数，包括CFG、Denoise、Sampling、Seed和Resolution等，帮助你从入门到精通，释放AI绘画的无限可能。

下图展示了这些参数在 ComfyUI 中的位置。尽管在 SD-WebUI 中的界面布局不同，但它们的用途和设置规则相同。

CFG（无分类引导，Classifier Free Guidance）

CFG 控制提示词（prompt）对生成图像的影响力。

值越高 → 越遵循提示词，但可能导致画面不自然、细节丢失（如过度锐利、涂抹感）。
值越低 → AI 更自由发挥，可能产生更自然的图像，但容易偏离提示词。
CFG = 0 → 完全忽略提示词，生成的图像内容几乎随机。

常见推荐数值：

SD 1.5 / SDXL → 推荐 6~~12（通常 7~~9 效果较平衡）
SD 3.5 Large/Medium → 推荐 4~5，SD 3.5 Large Turbo → 推荐 1.2（几乎无需修改）
FLUX.1 → 推荐 1（几乎无需修改）

注意：在使用不同模型时，建议先查阅官方推荐值，然后再根据具体需求微调，以获得最佳效果。

以下是以SD1.5模型测试为例，展示CFG对图像的影响：

提示词：a cat with wings

Denoise（去噪强度，或称重绘幅度）

Denoise 控制 Stable Diffusion 在生成过程中去除初始噪声的程度，从而影响最终图像的清晰度和变化程度。
Denoise 值高（接近 1） → 模型几乎完全摆脱初始噪声，图像自由度高，变动较大，适合文生图。
Denoise 值低（＜1） → 生成过程中保留更多原始图像特征，适合图生图或局部修复。例如：
Denoise = 0.2 ~ 0.4：适用于对原图进行微调。
Denoise = 0.6 ~ 0.8：会产生较大改动。
Denoise=0 → 完全不改变输入图像，仅用于特殊用途。

使用建议：

文生图 → 一般设置 Denoise=1，以确保模型完全根据提示词生成新图像。
图生图 → Denoise 介于 0.2 ~ 0.8，数值越高，原图改动越大。
局部修复 → Denoise 建议在 0.5 ~ 0.7，既能修复，又能与原图自然融合。

以下是文生图时，不同 Denoise 值对生成图像的影响：

提示词：a cat with wings

以下是图生图时，不同 Denoise 值对生成图像的影响：

提示词：a dog
输入一张猫的图像

CFG和Denoise的相互作用

CFG（提示依从度） → 控制模型多大程度遵循提示词。
Denoise（去噪强度） → 控制模型在去噪过程中修改图像的幅度。

由于 Stable Diffusion 生成图像的核心过程是从噪声中逐步提取可识别的形状和细节，而提示语的影响力（CFG）是在去噪过程中发挥作用的，所以 Denoise 值会影响 CFG 的实际效果：

Denoise 低（＜1） → 只进行部分去噪，意味着生成的图像更受原图约束，导致 CFG 的影响力变弱，即使提升 CFG 也不会完全按照提示生成新内容。
Denoise 高（接近 1） → 彻底去噪，模型可以完全重新塑造图像，这时 CFG 可以充分发挥作用，使生成结果更符合提示词。
Denoise 过高（>1，通常无效） → 可能导致生成结果失控，变得随机甚至崩坏。

示例（文生图）

低 Denoise + 高 CFG → 提示语影响较弱，生成图像较为随机，不太符合预期。
高 Denoise + 高 CFG → 提示语影响力强，图像严格按照提示生成。
高 Denoise + 低 CFG → 允许 AI 自由发挥，可能出现更具创造性的结果。
低 Denoise + 低 CFG → 生成图像几乎不受提示影响，更倾向于随机或保留初始输入特征。

以下是文生图时，不同Denoise和CFG对结果的影响：

提示词：a dog

以下是图生图时，不同Denoise和CFG对结果的影响：

提示词：a dog
导入一张猫的原始图像

Sampling（采样）

在 Stable Diffusion 中，Sampling（采样）是从随机噪声逐步生成清晰图像的过程。这个过程涉及多个步骤，每一步都会减少噪声，并使图像更接近提示词所描述的内容。

采样的核心参数包括：Sampler（采样器）、Noise Scheduler（噪声调度表）、Steps（采样步数）

Sampler（采样器）

采样器决定了去噪的方式，即模型如何一步步将噪声转换为清晰图像。不同的采样器在风格、质量和计算速度上有所不同，适用于不同需求的场景。

常见采样器及特点：

选择采样器的建议：

SD 1.5 → DPM++ 2M SDE 或 Euler a，兼顾速度和质量。
SDXL → UniPC，官方推荐，细节表现更好。
快速出图（低步数） → Euler a 或 DDIM。
高质量 & 细节丰富 → DPM++ 系列。

注意：不同模型的最佳采样器可能不同，建议先查阅模型官方推荐，再进行选用。

Noise Schedule（噪声调度表）

噪声调度表决定去噪的强度变化，影响图像的平滑度、细节和风格。

在图像生成过程中，最初的图像是完全随机的噪声，随着每一步去噪，图像逐渐清晰。噪声表控制每一步该去掉多少噪声，影响最终图像的细节表现。

噪声调度表的作用：

去噪幅度较大 → 收敛速度快，但可能损失细节。
去噪幅度较小 → 收敛更平滑，图像质量更高。

以SD1.5模型常用的噪声调度表 Karras 为例，从图中可以看出，它采用了一种更为平稳缓和的去噪方式，在接近过程结束时减少的幅度变得更小。这种方式有助于提升最终生成图像的质量。

以下是使用不同采样器和噪声调度表组合生成的图像矩阵对比：

注意：噪声调度表有多种类型，并且随着技术的发展，这些调度表也会不断迭代或新增。此外，不同的模型可能有不同的最佳噪声调度表。因此，建议在选用之前，先查阅模型官方推荐的噪声调度表。

Sampling steps（采样步幅）

采样步数决定了模型逐步优化图像的次数。更多的步数通常意味着更好的细节，但并不是越多越好：

✅ 步数适中（如 20-30 步） → 图像清晰、细节丰富，生成速度适中。
❌ 步数太低（如 5-10 步） → 细节不足，可能产生模糊或失真。
❌ 步数过高（如 100+ 步） → 计算变慢，可能导致过拟合，图像变得生硬、不自然。

一般建议：

SD 1.5 → 20 ~ 30 步
SDXL → 30 ~ 50 步
SD 3.5 → 28 ~ 50步
FLUX.1 → 20 ~ 50步

提示：不同模型的最佳采样步数有所不同，建议在选用之前，先查阅模型官方推荐。

通过测试可以看出，当采样步数达到一定数量后，图像质量的提升变得不再明显。因此，应该设置一个合适的步数，以实现图像质量和时间消耗之间的最佳平衡。

Seed（种子）

在Stable Diffusion中，Seed（种子）控制生成图像时的初始噪声。可以把 Seed 理解为一个“随机起点编号”，它决定了 AI 生成图像时的初始状态。

相同的 Seed 在相同模型、相同参数的条件下，会生成相同的图像，保证可重复性。
不同的 Seed 则会带来不同的随机噪声分布，即使其他参数不变，最终生成的图像也会有所不同。

因此，在调整参数时，固定 Seed 便于对比不同设置的影响，而随机 Seed（如设置为 -1）则用于探索更多变化可能。

Resolution（分辨率，图像宽/高）

正确设置图像分辨率对于生成质量至关重要。不同的模型在训练时使用的数据集尺寸不同，生成方式也有所差异，因此每个模型都有特定的最佳分辨率范围。如果设置不当，可能会导致图像细节缺失、构图失衡，甚至出现严重的畸变。

推荐的分辨率（宽 × 高）：

SD1.5 → 512 × 512（正方形），或 512 × 768 / 768 × 512（长方形）
SDXL → 1024 × 1024（正方形），或 1024 × 1344 / 1344 × 1024（长方形）
SD3.5 → 单边尺寸 1024 ~ 1440（图像比例较SD1.5/SDXL更加灵活）
FLUX.1 → 单边尺寸 1024 ~ 1440（图像比例较SD1.5/SDXL更加灵活）

初学者需注意：不要盲目追求超高分辨率！

直接设置超大尺寸不仅会大幅增加计算成本（占用更多显存、延长生成时间），还可能影响图像质量。正确的做法是先按模型推荐的分辨率生成图像，然后使用 “Image Upscale” 放大技术（如 R-ESRGAN、4x-UltraSharp）来提升分辨率，同时保持细节清晰度。

总结

在Stable Diffusion生成图像的过程中，多个核心参数共同决定了最终的效果：

CFG 控制模型对提示词的依从程度，值越高，图像越贴合提示；越低，AI自由发挥更多。
Denoise 影响去噪的强度，在图生图时决定对原始图像的保留程度。
Sampler 决定去噪的方式，不同的采样器会影响风格、质量和生成速度。
Noise Schedule/Scheduler 控制去噪强度的变化，影响图像的平滑度和细节表现。
Sampling Steps 设定去噪的步数，步数越多，画面细节越丰富，但过高可能导致过拟合。
Seed 设定随机噪声的初始状态，相同的种子可复现相同的结果。
Resolution 直接影响图像质量，设置合适的尺寸至关重要，过大可能影响效果，推荐使用最佳分辨率+放大技术的组合方式。

如果你是 Stable Diffusion 初学者，掌握这些参数是生成高质量图像的第一步！当然，Stable Diffusion 的世界远不止这些参数，还有 Lora、ControlNet、Inpainting 等进阶技术，可以进一步增强创作的自由度和可控性。未来的文章将继续深入解析这些内容，欢迎关注，一起探索 AI 绘画的无限可能！