Stable Diffusion 核心参数详解:新手必懂的配置指南!
Stable Diffusion 核心参数详解:新手必懂的配置指南!
在AI绘画的世界里,Stable Diffusion作为一款强大的图像生成工具,其核心参数的设置直接影响着最终的生成效果。对于初学者来说,掌握这些参数不仅能帮助你更好地控制图像的风格和细节,还能让你在创作过程中更加得心应手。本文将详细解析Stable Diffusion中的关键参数,包括CFG、Denoise、Sampling、Seed和Resolution等,帮助你从入门到精通,释放AI绘画的无限可能。
下图展示了这些参数在 ComfyUI 中的位置。尽管在 SD-WebUI 中的界面布局不同,但它们的用途和设置规则相同。
CFG(无分类引导,Classifier Free Guidance)
CFG 控制提示词(prompt)对生成图像的影响力。
- 值越高 → 越遵循提示词,但可能导致画面不自然、细节丢失(如过度锐利、涂抹感)。
- 值越低 → AI 更自由发挥,可能产生更自然的图像,但容易偏离提示词。
- CFG = 0 → 完全忽略提示词,生成的图像内容几乎随机。
常见推荐数值:
- SD 1.5 / SDXL → 推荐 6
12(通常 79 效果较平衡) - SD 3.5 Large/Medium → 推荐 4~5,SD 3.5 Large Turbo → 推荐 1.2(几乎无需修改)
- FLUX.1 → 推荐 1(几乎无需修改)
注意:在使用不同模型时,建议先查阅官方推荐值,然后再根据具体需求微调,以获得最佳效果。
以下是以SD1.5模型测试为例,展示CFG对图像的影响:
- 提示词:a cat with wings
Denoise(去噪强度,或称重绘幅度)
- Denoise 控制 Stable Diffusion 在生成过程中去除初始噪声的程度,从而影响最终图像的清晰度和变化程度。
- Denoise 值高(接近 1) → 模型几乎完全摆脱初始噪声,图像自由度高,变动较大,适合 文生图。
- Denoise 值低(<1) → 生成过程中保留更多原始图像特征,适合图生图或局部修复。例如:
- Denoise = 0.2 ~ 0.4:适用于对原图进行微调。
- Denoise = 0.6 ~ 0.8:会产生较大改动。
- Denoise=0 → 完全不改变输入图像,仅用于特殊用途。
使用建议:
- 文生图 → 一般设置 Denoise=1,以确保模型完全根据提示词生成新图像。
- 图生图 → Denoise 介于 0.2 ~ 0.8,数值越高,原图改动越大。
- 局部修复 → Denoise 建议在 0.5 ~ 0.7,既能修复,又能与原图自然融合。
以下是 文生图 时,不同 Denoise 值对生成图像的影响:
- 提示词:a cat with wings
以下是 图生图 时,不同 Denoise 值对生成图像的影响:
- 提示词:a dog
- 输入一张猫的图像
CFG和Denoise的相互作用
- CFG(提示依从度) → 控制模型多大程度遵循提示词。
- Denoise(去噪强度) → 控制模型在去噪过程中修改图像的幅度。
由于 Stable Diffusion 生成图像的核心过程是 从噪声中逐步提取可识别的形状和细节,而 提示语的影响力(CFG)是在去噪过程中发挥作用的,所以 Denoise 值会影响 CFG 的实际效果:
- Denoise 低(<1) → 只进行部分去噪,意味着生成的图像 更受原图约束,导致 CFG 的影响力变弱,即使提升 CFG 也不会完全按照提示生成新内容。
- Denoise 高(接近 1) → 彻底去噪,模型可以完全重新塑造图像,这时 CFG 可以充分发挥作用,使生成结果更符合提示词。
- Denoise 过高(>1,通常无效) → 可能导致生成结果失控,变得随机甚至崩坏。
示例(文生图)
- 低 Denoise + 高 CFG → 提示语影响较弱,生成图像较为随机,不太符合预期。
- 高 Denoise + 高 CFG → 提示语影响力强,图像严格按照提示生成。
- 高 Denoise + 低 CFG → 允许 AI 自由发挥,可能出现更具创造性的结果。
- 低 Denoise + 低 CFG → 生成图像几乎不受提示影响,更倾向于随机或保留初始输入特征。
以下是文生图时,不同Denoise和CFG对结果的影响:
- 提示词:a dog
以下是图生图时,不同Denoise和CFG对结果的影响:
- 提示词:a dog
- 导入一张猫的原始图像
Sampling(采样)
在 Stable Diffusion 中,Sampling(采样) 是从 随机噪声逐步生成清晰图像 的过程。这个过程涉及 多个步骤,每一步都会减少噪声,并使图像更接近提示词所描述的内容。
采样的核心参数包括:Sampler(采样器)、Noise Scheduler(噪声调度表)、Steps(采样步数)
Sampler(采样器)
采样器决定了去噪的方式,即模型如何一步步将噪声转换为清晰图像。不同的采样器在风格、质量和计算速度上有所不同,适用于不同需求的场景。
常见采样器及特点:
选择采样器的建议:
- SD 1.5 → DPM++ 2M SDE 或 Euler a,兼顾速度和质量。
- SDXL → UniPC,官方推荐,细节表现更好。
- 快速出图(低步数) → Euler a 或 DDIM。
- 高质量 & 细节丰富 → DPM++ 系列。
注意:不同模型的最佳采样器可能不同,建议先查阅模型官方推荐,再进行选用。
Noise Schedule(噪声调度表)
噪声调度表决定去噪的强度变化,影响图像的平滑度、细节和风格。
在图像生成过程中,最初的图像是完全随机的噪声,随着每一步去噪,图像逐渐清晰。噪声表控制每一步该去掉多少噪声,影响最终图像的细节表现。
噪声调度表的作用:
- 去噪幅度较大 → 收敛速度快,但可能损失细节。
- 去噪幅度较小 → 收敛更平滑,图像质量更高。
以SD1.5模型常用的噪声调度表 Karras 为例,从图中可以看出,它采用了一种更为平稳缓和的去噪方式,在接近过程结束时减少的幅度变得更小。这种方式有助于提升最终生成图像的质量。
以下是使用不同采样器和噪声调度表组合生成的图像矩阵对比:
注意:噪声调度表有多种类型,并且随着技术的发展,这些调度表也会不断迭代或新增。此外,不同的模型可能有不同的最佳噪声调度表。因此,建议在选用之前,先查阅模型官方推荐的噪声调度表。
Sampling steps(采样步幅)
采样步数决定了模型逐步优化图像的次数。更多的步数通常意味着更好的细节,但并不是越多越好:
- ✅ 步数适中(如 20-30 步) → 图像清晰、细节丰富,生成速度适中。
- ❌ 步数太低(如 5-10 步) → 细节不足,可能产生模糊或失真。
- ❌ 步数过高(如 100+ 步) → 计算变慢,可能导致过拟合,图像变得生硬、不自然。
一般建议:
- SD 1.5 → 20 ~ 30 步
- SDXL → 30 ~ 50 步
- SD 3.5 → 28 ~ 50步
- FLUX.1 → 20 ~ 50步
提示:不同模型的最佳采样步数有所不同,建议在选用之前,先查阅模型官方推荐。
通过测试可以看出,当采样步数达到一定数量后,图像质量的提升变得不再明显。因此,应该设置一个合适的步数,以实现图像质量和时间消耗之间的最佳平衡。
Seed(种子)
在Stable Diffusion中,Seed(种子) 控制生成图像时的初始噪声。可以把 Seed 理解为一个“随机起点编号”,它决定了 AI 生成图像时的初始状态。
- 相同的 Seed 在相同模型、相同参数的条件下,会生成相同的图像,保证可重复性。
- 不同的 Seed 则会带来不同的随机噪声分布,即使其他参数不变,最终生成的图像也会有所不同。
因此,在调整参数时,固定 Seed 便于对比不同设置的影响,而随机 Seed(如设置为 -1
)则用于探索更多变化可能。
Resolution(分辨率,图像宽/高)
正确设置图像分辨率对于生成质量至关重要。不同的模型在训练时使用的数据集尺寸不同,生成方式也有所差异,因此每个模型都有特定的最佳分辨率范围。如果设置不当,可能会导致图像细节缺失、构图失衡,甚至出现严重的畸变。
推荐的分辨率(宽 × 高):
- SD1.5 → 512 × 512(正方形),或 512 × 768 / 768 × 512(长方形)
- SDXL → 1024 × 1024(正方形),或 1024 × 1344 / 1344 × 1024(长方形)
- SD3.5 → 单边尺寸 1024 ~ 1440(图像比例较SD1.5/SDXL更加灵活)
- FLUX.1 → 单边尺寸 1024 ~ 1440(图像比例较SD1.5/SDXL更加灵活)
初学者需注意:不要盲目追求超高分辨率!
直接设置超大尺寸不仅会大幅增加计算成本(占用更多显存、延长生成时间),还可能影响图像质量。正确的做法是先按模型推荐的分辨率生成图像,然后使用 “Image Upscale” 放大技术(如 R-ESRGAN、4x-UltraSharp)来提升分辨率,同时保持细节清晰度。
总结
在Stable Diffusion生成图像的过程中,多个核心参数共同决定了最终的效果:
- CFG 控制模型对提示词的依从程度,值越高,图像越贴合提示;越低,AI自由发挥更多。
- Denoise 影响去噪的强度,在图生图时决定对原始图像的保留程度。
- Sampler 决定去噪的方式,不同的采样器会影响风格、质量和生成速度。
- Noise Schedule/Scheduler 控制去噪强度的变化,影响图像的平滑度和细节表现。
- Sampling Steps 设定去噪的步数,步数越多,画面细节越丰富,但过高可能导致过拟合。
- Seed 设定随机噪声的初始状态,相同的种子可复现相同的结果。
- Resolution 直接影响图像质量,设置合适的尺寸至关重要,过大可能影响效果,推荐使用最佳分辨率+放大技术的组合方式。
如果你是 Stable Diffusion 初学者,掌握这些参数是生成高质量图像的第一步! 当然,Stable Diffusion 的世界远不止这些参数,还有 Lora、ControlNet、Inpainting 等进阶技术,可以进一步增强创作的自由度和可控性。未来的文章将继续深入解析这些内容,欢迎关注,一起探索 AI 绘画的无限可能!