一次了解所有功能!超详细【Stable Diffusion界面】使用指南
一次了解所有功能!超详细【Stable Diffusion界面】使用指南
前言
对于AI绘画的初学者而言,初次接触Stable Diffusion(SD)的用户界面可能会感到困惑,因为其中包含了许多陌生的专业术语,如大模型、提示词、采样迭代等。这些概念与传统的绘画方式大相径庭,使得学习曲线较为陡峭。本文将详细解析SD界面的各项功能,帮助用户快速掌握其使用方法。
1. 模型设定菜单栏
Stable Diffusion 模型:这是出图的基础,也被称为底模或大模型。默认情况下,启动后是没有预装大模型的,但有些启动包可能会附带一两个模型。用户通常需要自行下载模型文件,其格式主要有两种:.ckpt和.safetensors。可以将这些模型理解为不同的"画师",通过提示词向其描述需求,画师会根据自身的"画风"来生成相应的图像。
外挂VAE模型:VAE是变分自编码器的缩写,主要作用是优化画面的色彩饱和度,类似于摄影中的滤镜效果。使用VAE模型可以使画面颜色更加明亮艳丽,但如果没有也不会产生太大影响,通常建议选择自动加载。
跳过CLIP层数:全称是语言与图片对比预训练,用于控制提示词与生成图片的关联程度。数值越高,关联性越弱,SD的自由发挥空间越大,但可能偏离预期效果;数值越低,关联性越强,生成效果更接近预期,但SD的创作空间相对较小。一般建议保持默认值1不变。
2. 提示词编辑栏
这是SD的主要输入界面,虽然提供了多个选项,但实际使用中主要集中在"文生图"和"图生图"两个功能上。其他选项则作为辅助设置。
提示词:用于输入你想要的画面描述,支持英文词语、短语或完整句子,所有符号需使用英文半角格式,词语之间用半角逗号隔开。
反向提示词:用于排除画面中不需要的元素,同样采用英文半角格式。
3. 细节参数区
这一区域包含了多个影响生成效果的关键参数:
迭代步数:一般设定在20~30之间,具体数值取决于所使用的模型。较高的迭代步数可以生成更精细的图像,但会增加计算时间。并非迭代步数越高越好,合适的数值才能达到最佳效果。
采样方法:代表不同的图像生成算法,适用于不同场景。例如:
Euler a:适合快速生成简单的图像,如二次元场景。
DPM++ 2M Karras、DPM++ SDE Karras:适合生成高品质的真人或自然场景图像。
UniPC:特别适用于人形体相关的场景,可以在保持采样速度的同时生成更逼真的图像。
面部修复:主要用于真人场景,可以修复因画面比例问题导致的人脸模糊。
平铺图:实现图像拼贴效果,适合生成花纹等重复图案。
高分辨率修复:默认情况下,高分辨率图像(宽高大于756像素)可能会出现混沌效果。开启此选项可以改善这一问题,但会消耗更多显存。推荐使用R-ESRGAN 4X+(真实三次元)或R-ESRGAN 4X+ Anime6B(动漫二次元)进行放大处理。
分辨率及单批数量:设置生成图像的尺寸,数值越大,对显存的要求也越高。
提示词引导系数:系数越高,生成图像越贴近提示词描述;系数越低,AI的创作自由度越大。一般建议设置在3~11之间,过高可能会破坏图像结构和细节。
随机数种子:相当于每张图片生成的唯一标识。相同的种子值会生成相似的图像。"骰子"按钮用于生成随机值,"循环"按钮则用于固定值,以降低图像的随机性。
通过以上详细的参数介绍和使用建议,读者可以更好地掌握Stable Diffusion的使用方法,创作出满意的AI绘画作品。