问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Stable Diffusion进阶教程:图片的创成式填充

创作时间:
作者:
@小白创作中心

Stable Diffusion进阶教程:图片的创成式填充

引用
CSDN
1.
https://blog.csdn.net/A2421417624/article/details/139260576

图片的创成式填充是一种基于原有图片进行扩展或延展的技术,能够在保证图片合理性的同时实现与原图片的高度契合。这项技术是目前图像处理中常见的应用之一,之前大部分都是通过PS工具来处理的。今天,我们将详细介绍如何在Stable Diffusion中实现这一功能。

创成式图片处理效果展示

我们先来看一下创成式图片处理的效果:

  • 原图片:512*512

  • 横向扩展:1024*512

  • 纵向扩展:512*1024

具体操作步骤

第一步:图生图图片的上传

在图生图功能界面,上传一张图片,我这里上传一张512*768大小的图片。

下面进行相关参数设置:

  • 缩放模式:选择“缩放后填充空白”。
  • 蒙版区域内容处理:原图,只针对原图片的基础上进行一个小的改动
  • 重绘区域:整张图片
  • 采样器:DPM++ 2M SDE Karras
  • 采样迭代步数:30
  • 图片宽高:1024768。原图片是512768。这里我们保持图片的高度768不变,将图片宽度512横向扩展为1024。
  • 生成数量:2,一次多生成几张,提高抽签概率
  • 重绘强度:设置为1,尽量设置高一些(0.8以上),可以让AI充分发挥想象。

第二步:ControlNet的设置

相关参数设置如下:

  • 控制类型:选择"局部重绘"
  • 预处理器:inpaint_only+lama(局部重绘+大型模版,主要用于图片扩展)
  • 模型:control_xxx_inpaint
  • 控制权重:设置为1
  • 控制模式:选择“更偏向ControlNet”
  • 缩放模式:选择"缩放后填充空白"

第三步:提示词的编写

这里可以不用填写正向和反向提示词。但是为了防止图片扩充时产生的图片太随意,我们最好加上反向提示词。

(worst quality:2),(low quality:2),(normal quality:2),lowres,((monochrome)),((grayscale)),bad anatomy,DeepNegative,skin spots,acnes,skin blemishes,(fat:1.2),facing away,looking away,tilted head,lowres,bad anatomy,bad hands,missing fingers,extra digit,fewer digits,bad feet,poorly drawn hands,poorly drawn face,mutation,deformed,extra fingers,extra limbs,extra arms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions,gross proportions,missing arms,missing legs,extra digit,extra arms,extra leg,extra foot,teethcroppe,signature,watermark,username,blurry,cropped,jpeg artifacts,text,error,

不过个人还是建议加上原图片的正向提示词,以保证图片扩展时AI能结合提示词更好发挥,做到最合理保持与原图片的契合度。

第四步:大模型的选择以及图片的生成

大模型需要根据实际情况选择,对于写实类建议选择"majicMIX_realistic"或者"Realistic Vision", 对于二次元类的选择"revAnimated"。

点击【生成】按钮。不能保证每次扩充都是满意的效果,我们可以每次多生成几张从中挑选。


下面我们纵向扩展一下图片,把原图片的高度从768调整到1024。

相关说明

(1) 如果原图片宽高是512512的,直接扩充为10241024,我实际操作了一下,图片不会进行填充,只是将原图片进行了放大处理。如果想实现创成式扩充,可以先横向扩展为5121024,然后在基于扩展的图片基础上再次扩展为10241024,分2步操作即可。

(2)正向提示词和反向提示词可以不用填写,不过为了保证图片的合理性以及与原图片的契合度更高,建议写上正向提示词和反向提示词。

(3)大模型的选择要视具体情况而定,如果生成图片效果不理想建议多换几个模型试试。

好了,今天的分享就到这里了,希望今天分享的内容对大家有所帮助。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号