掌握Stable Diffusion操作技巧:让你的图像生成更出色
创作时间:
作者:
@小白创作中心
掌握Stable Diffusion操作技巧:让你的图像生成更出色
引用
CSDN
1.
https://blog.csdn.net/weixin_55607175/article/details/139132659
Stable Diffusion是当前最流行的AI图像生成工具之一,掌握其使用技巧对于创作高质量的图像至关重要。本文将详细介绍Stable Diffusion的基础操作、Prompt语法技巧以及一个实用的提示词中译英插件,帮助你提升图像生成效果。
1. Stable Diffusion 基础操作
文生图
如图所示,Stable Diffusion WebUI的操作界面主要分为:模型区域、功能区域、参数区域、出图区域。
- txt2img:文生图功能,重点参数介绍:
- 正向提示词:描述图片中希望出现的内容
- 反向提示词:描述图片中不希望出现的内容
- Sampling method:采样方法,推荐选择Euler a或DPM++系列,采样速度快
- Sampling steps:迭代步数,数值越大图像质量越好,生成时间也越长,一般控制在30-50就能出效果
- Restore faces:可以优化脸部生成
- Width/Height:生成图片的宽高,越大越消耗显存,生成时间也越长,一般方图512x512,竖图512x768,需要更大尺寸,可以到Extras功能里进行等比高清放大
- CFG:提示词相关性,数值越大越相关,数值越小越不相关,一般建议7-12区间
- Batch count/Batch size:生成批次和每批数量,如果需要多图,可以调整下每批数量
- Seed:种子数,-1表示随机,相同的种子数可以保持图像的一致性,如果觉得一张图的结构不错,但对风格不满意,可以将种子数固定,再调整prompt生成
图生图
img2img功能可以生成与原图相似构图色彩的画像,或者指定一部分内容进行变换。可以重点使用Inpaint图像修补这个功能:
- Resize mode:缩放模式,Just resize只调整图片大小,如果输入与输出长宽比例不同,图片会被拉伸。Crop and resize裁剪与调整大小,如果输入与输出长宽比例不同,会以图片中心向四周,将比例外的部分进行裁剪。Resize and fill调整大小与填充,如果输入与输出分辨率不同,会以图片中心向四周,将比例内多余的部分进行填充
- Mask blur:蒙版模糊度,值越大与原图边缘的过度越平滑,越小则边缘越锐利
- Mask mode:蒙版模式,Inpaint masked只重绘涂色部分,Inpaint not masked重绘除了涂色的部分
- Masked Content:蒙版内容,fill用其他内容填充,original在原来的基础上重绘
- Inpaint area:重绘区域,Whole picture整个图像区域,Only masked只在蒙版区域
- Denoising strength:重绘幅度,值越大越自由发挥,越小越和原图接近
ControlNet
安装完ControlNet后,在txt2img和img2img参数面板中均可以调用ControlNet。操作说明:
- Enable:启用ControlNet
- Low VRAM:低显存模式优化,建议8G显存以下开启
- Guess mode:猜测模式,可以不设置提示词,自动生成图片
- Preprocessor:选择预处理器,主要有OpenPose、Canny、HED、Scribble、Mlsd、Seg、Normal Map、Depth
- Model:ControlNet模型,模型选择要与预处理器对应
- Weight:权重影响,使用ControlNet生成图片的权重占比影响
- Guidance strength(T):引导强度,值为1时,代表每迭代1步就会被ControlNet引导1次
- Annotator resolution:数值越高,预处理图像越精细
- Canny low/high threshold:控制最低和最高采样深度
- Resize mode:图像大小模式,默认选择缩放至合适
- Canvas width/height:画布宽高
- Create blank canvas:创建空白画布
- Preview annotator result:预览注释器结果,得到一张ControlNet模型提取的特征图片
- Hide annotator result:隐藏预览图像窗口
2. Prompt 语法技巧
文生图模型的精髓在于Prompt提示词,如何写好Prompt将直接影响图像的生成质量。
提示词结构化
Prompt提示词可以分为4段式结构:画质画风+画面主体+画面细节+风格参考
- 画面画风:主要是大模型或LoRA模型的Tag、正向画质词、画作类型等
- 画面主体:画面核心内容、主体人/事/物/景、主体特征/动作等
- 画面细节:场景细节、人物细节、环境灯光、画面构图等
- 风格参考:艺术风格、渲染器、Embedding Tag等
提示词语法
- 提示词排序:越前面的词汇越受AI重视,重要事物的提示词放前面
- 增强/减弱:(提示词:权重数值),默认1,大于1加强,低于1减弱。如(doctor:1.3)
- 混合:提示词|提示词,实现多个要素混合,如[red|blue]hair红蓝色头发混合
- +和AND:用于连接短提示词,AND两端要加空格
- 分步渲染:[提示词A:提示词B:数值],先按提示词A生成,在设定的数值后朝提示词B变化。如[dog🐱30]前30步画狗后面的画猫,[dog🐱0.9]前面90%画狗后面10%画猫
- 正向提示词:masterpiece,best quality等画质词,用于提升画面质量
- 反向提示词:nsfw,bad hands,missing fingers……,用于不想在画面中出现的内容
- Emoji:支持emoji,如😍形容表情,🖐修饰手
3. Stable Diffusion 提示词中译英插件
下载提示词中文扩展插件:
https://github.com/Physton/sd-webui-prompt-all-in-one.git
总结
以上就是Stable Diffusion的使用技巧介绍,这些方法可以帮助你快速便捷地处理图像,创作出更高质量的AI生成图像。
热门推荐
汽车静电如何消除?一文详解多种消除方法和日常注意事项
醋酸泼尼松片:系统性红斑狼疮治疗的重要选择
13年后再聚首,<甄嬛传>主创澳门开唱却遇售票难题
大连城市书房香炉礁店:地铁3号线便捷到达,24小时阅读空间
华夏文明发源于何处?《山海经》有记载:从冀州到雍州
圣女果维C含量是西红柿两倍,其他营养却不如
微改造唤醒老西关,荔湾区文商旅融合激发新活力
18点后运动效果最佳:降血糖、减风险,科学证据来了
黄花梨手串如何保持光泽?资深藏家详解养护秘诀
福建舰海试四川舰出坞,美国敏感神经被挑动,豪掷1万亿造船
调节脂质代谢和肠道菌群,鸡骨草胶囊治疗MAFLD获重大突破
成都航空EU2703航班因乘客未开飞行模式延误
三国演义中的赵云与真实历史:一个完美英雄的诞生
赵云长坂坡之战:七进七出救阿斗,奠定三国鼎立格局
张山版稳重,聂远版灵动,两位演员塑造赵云各具特色
战功赫赫却官职不高,赵云是蜀汉隐形实权派
Android飞行模式的黑科技:不止是断网那么简单
红旗-10 vs 海拉姆:谁才是最强近防?
开滦国家矿山公园:140年工业遗产讲述中国路矿之源
金秋捕捞季,俄罗斯帝王蟹对华出口将增近七成
北海道帝王蟹:体型超1米,肉质鲜甜的“蟹中之王”
怎么教孩子汉语拼音?不妨试试这几个方法!
王者荣耀:冷却缩减,团战制胜法宝
中国烧酒,不得不说的前世今生
甲减竟是乏力贪睡的罪魁祸首?
双十一股市攻略:线上阴线买,线下阳线卖
四川峨眉山二日游完整攻略:从清徐出发的全方位旅行路线指南
手把手教你用Python预测NBA比赛结果,附完整代码
王者荣耀新赛季:掌握这些沟通技巧,轻松carry全场!
王者荣耀CDR机制详解:从0到40%的冷却缩减攻略