问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Stable Diffusion:文生图参数详解

创作时间:
作者:
@小白创作中心

Stable Diffusion:文生图参数详解

引用
CSDN
1.
https://blog.csdn.net/HJS123456780/article/details/140201299

Stable Diffusion是一种基于深度学习的图像生成模型,能够根据文本描述生成高质量的图像。它在AI绘画、图像修复等领域有着广泛的应用。本文将详细介绍Stable Diffusion中几个关键参数的使用方法和效果,帮助用户更好地掌握这一强大的工具。

一. 面部修复与高分辨率修复

面部修复主要用于改善人脸的生成效果,特别是在生成真人模型全身照时。面部修复有两种模型:CodeFormer和GFPGAN,默认使用CodeFormer。

从上图可以看出,使用面部修复后,特别是在嘴唇等细节处,生成效果有明显提升。CodeFormer和GFPGAN两种模型在效果上差异不大。

高分辨率修复用于生成高画质图像。其机制是先将原图放大绘制,再还原到原始大小。因此,这一过程对计算资源要求较高,建议在高性能计算机上使用。

  • 高清化算法(Upscaler):改善真人、三次元脸部建议使用R-ESRGAN 4x+;如果是二次元建议使用R-ESRGAN 4x+ Anime6B。
  • 高分辨率采样步数(Hires steps):建议直接赋值0,表示使用原有出图的采样步数。
  • 重绘幅度(Denoising):取值范围0-1,值越大,生成的图片和原图差异越大。这一参数将在后续图生图章节详细讲解。
  • 放大倍率(Upscale by):一般设置为2倍。

通常情况下,建议开启面部修复和高分辨率修复功能。

二. 图片宽度和高度

图片尺寸主要控制生成图片的大小。SD Web UI默认分辨率为512*512。

  • SD模型训练的图片分辨率大部分都是512*512,因此这个分辨率的效果最佳。
  • 512*512在满足高质量要求的情况下,可以同时兼顾到性能的要求。如果分辨率设置得较大,对电脑的显卡要求会比较高,生成图片时可能出现各种报错异常。

一般建议:

  • 正方形图片:宽度512*高度512
  • 长方形图片:宽度512*高度768

三. 提示词相关性(CFG Scale)

这个参数用于控制生成图片的自由度,取值范围1-30。

  • 数值越小,生成的图片和提示词的吻合度越低;数值越大,生成的图片和提示词的吻合度越高。一般情况下,取值设置在7-10之间。
  • CFG 2-6:发挥创造力空间较大,可能会出现不按照提示词生成图片。
  • CFG 7-10:建议用于大多数场景,能很好在提示词引导和创造力之间平衡。
  • CFG10-15:提示词对生成的图片影响较大,当然要求提示词较好,足够具体。
  • CFG16-20:除非提示词非常详细。一般不推荐。
  • CFG高于20:可能会产生一些奇怪的现象,一般不推荐。

四. 种子(Seed)

种子相当于图片的DNA,决定了画面的内容。默认值是-1,表示随机生成。

在SD Web UI生成图片的下面,可以看到图片相关的文本信息,里面的Seed值就是当前生成图片所使用的Seed值。

只有当提示词、模型、参数设置(包括随机数的种子)完全一致时,才能生成相同的图片。

使用相同的种子Seed,最终生成的3张图片几乎没有区别。

在图像生成种子输入框栏的最右边有一个选择框,选中后,会出现一些差异种子的设置选项。

  • 随机数差异种子(Variation seed):在生成图像时可以同时使用图像生成种子和随机数差异种子。
  • 差异强度(Variation strength):取值范围0-1。如果值是0,相当于没有设置随机数差异种子;如果值是1,相当于是没有设置图像生成种子。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号