资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

AI绘画Stable Diffusion 高清放大，多种方法详解，建议收藏！

创作时间:

作者:

@小白创作中心

AI绘画Stable Diffusion 高清放大，多种方法详解，建议收藏！

引用

CSDN

https://blog.csdn.net/cxyxx12/article/details/137235079

在Stable Diffusion中，想要得到一张高分辨率且具有细节特征的图片时，可以使用多种图片放大算法来帮助实现。本文将详细介绍在Stable Diffusion中常用的高清修复方法及其应用场景，并给出一些推荐的工作流，帮助读者根据自己的需求选择合适的方法。

几种不同高清修复方法

一、文生图高清修复

在文生图界面中，可以在一开始就指定将图片进行放大。在打开高清修复后，会看到以下这些参数。关于这里的放大算法，推荐使用以下几种：

4x-ultrasharp：需要额外下载，下载地址为：https://civitai.com/models/116225/4x-ultrasharp
Anime6B：一般用于二次元风格

下载后，将模型放到：sd目录\models\ESRGAN

以下是这几种放大算法跑出来的效果图，可以看出来其实差距都很小，对于不同风格的结果会有所区别。对于细节把握比较强的用户，可以试试使用xyz脚本（还不知道这个脚本使用的见我之前编写的文章）跑出最合适你的参数。

二、后期处理缩放倍数

这个功能说实话使用较少，经过测试对于图片细节的处理不是太理想。不过你可以通过其他方法先将图片修复到一定程度后再使用该功能，因为后期处理速度很快，然后扩大无上限。

比如下图，未经过处理和经过处理后的结果：

处理前：

处理后：

那后期处理这块是不是没有用了呢？也不尽然，这里一般可以用来处理照片的裁剪或老照片修复。

三、图生图放大倍数和几个Upscale脚本

方法一：放大倍数

来到图生图界面，缩放模式选择仅调整大小，这里可以修改重绘尺寸或者直接指定重绘尺寸倍数。需要注意的是，因为是基于原图进行处理，所以这里需要固定好seed值以及降低重绘幅度。

刚刚那张照片的处理结果如下：

方法二：使用Sd upscale

打开脚本我们选择 upscale：

打开以后看到以下几个参数选项，upscale是将一张图片分为多个区块然后进行分别放大，最后再组合起来。这里的分块重叠像素宽度是用来避免最终成像会有明显的接缝，因为是分块绘制嘛，最后还需要拼接的。一般维持默认即可。不要忘了选择放大算法，否则不会生效。

这个方法用的其实也比较少，现在基本也被淘汰了，因为可能出现一些未知的情况。比如下图。

为什么会出现这种情况呢，因为它是分区块进行放大的，每个区块就可能按照AI自己的想法加入一些奇奇怪怪的玩意~。结果就不可控了，虽然我们减少区块的大小，但最终的结果可能还是难以预料的。

方法三：使用Ultimate SD upsale

该方法是 Sd upscale 的升级版，也需要额外下载，在扩展中搜索Ultimate就可以看到了，安装后记得重启UI界面。

来到图生图界面，使用的还是之前的照片参数，降低重绘幅度和固定种子。然后在脚本中找到 Ultimate SD upsale。

放大前：

放大后：

可以看到效果还不错，在这个脚本里涉及一些参数，我们有时候需要根据图片的最终成像来进行调整，根据官方的界面，具体说明如下：

「Target size type」: 定义最终图像的大小来源。

「From img2img settings」: 使用默认的「img2img」宽和高设置。
「Custom size」: 自定义宽高设置，最大值是8192。
「Scale from image size」: 以初始图像大小为基础进行缩放。（大多情况下直接使用这个）

「Redraw」: 图像重新绘制的设置。

「Linear」: 所有小块逐个、逐行逐列地处理。
「Chess」: 所有小块按棋盘模式处理，这样可以减少接缝产生的几率。（常用选项）
「None」: 禁用重新绘制。如果你看到明显的重叠或接缝上的瑕疵，就使用这个模式。
「Upscaler」: 在重新绘制之前放大图像。推荐使用ESRGAN来增强现实感的图像，对于其他的图像推荐使用R-ESRGAN 4x+。我们也可以使用4x-ultrasharp
「Type」:
「Tile width/height」: 要处理的小块的宽和高。对于2k图像，512px通常就够了。
「Padding」: 在处理一个小块时，会考虑多少像素的邻近小块。
「Mask blur」: 用于小块蒙版的模糊程度。如果你看到接缝，可以适当调整这个值。

「Seams fix」: 对于结果图像中可见的网格，通常不需要使用它，因为它只是另一种重新绘制方法。

「Bands pass」: 主要处理接缝（行和列），需要的时间比较短。
「Half tile offset pass」: 与重新绘制相似，但有一半的小块偏移。
「Half tile offset + intersections pass」: 先运行Half tile offset pass，然后对交叉点进行额外的处理。
「None」: 禁用接缝修复。
「Type」:

「Save options」: 保存图像的选项。

「Upscaled」: 默认启用。从Redraw保存图像。
「Seams fix」: 默认禁用。在Seams fix之后保存图像。

这个脚本也可以搭配controlnet的tiled进行使用。细节会更丰富些。

四、Tiled Diffusion脚本

该脚本需要另外下载，一般搭配Tiled Vae一起使用，秋叶启动包自带了。如果没有下载的童鞋可直接在扩展中搜索下载（或看文末扫描获取脚本文件）。下载后可在文生图和图生图中查看到。

放大的话一般先在文生图中生成一张满意的图片，然后发送到图生图中。不要忘记降低重绘幅度和固定种子。

我们打开脚本，然后点击启用，关于这里的参数设置先保持默认。不要忘记选择放大算法。

对于显存较大的同学可以将分块单批数量（「Tiled Diffusion Latent tile」）改为8，这样处理的速度会快很多。

这里我们放大两倍，点击生成。效果如下：

其实为了细节的更好处理，我们可以在这里再加入controlnet tile，效果会更好. 因为cn tile往往会产生更多的细节，MultiDiffusion会更多的修饰原图而缺少足够的细节。两者的适当结合会产生非常好的效果。

可以看出来，人物的真实感更加强烈，且增添了一些细节

上面的图像我们是在默认的参数下生成的，其实官方有给一些推荐的参数设置，具体如下：

Denoising Strength >= 0.75
Method = Mixture of Diffusers, Overlap = 8
Noise Inversion Steps >= 30
CN Tile preprocessor = tile_resample, downsampling rate = 2。

具体修改后的参数如下图（需要注意的是batch size这个参数，如果你的显存比较小，还是默认1吧）：

设置为推荐参数后，我们再生成结果：

由于篇幅原因，这里不再过多阐述，如果你对还想了解这些参数和其他参数的具体含义。可以查阅官方文档

五、Diffusion+StableSR

高清放大算法的后起之秀，由南阳理工大学的王建一同学等人开源。需要额外下载，可在扩展中选择从地址下载：https://github.com/pkuliyi2015/sd-webui-stablesr.git

如无法下载，请看文末扫描获取文件

这个脚本的使用还需要几个额外的模型：

在 https://huggingface.co/stabilityai/stable-diffusion-2-1/tree/main 中下载模型文件，下载完成后放入sd的Stable-diffusion 目录下。sd目录\models\Stable-diffusion
下载StableSR 模块的模型文件，下载地址为：https://huggingface.co/Iceclear/StableSR/blob/main/webui_768v_139.ckpt
如无法下载请看文末获取文件
下载配置vae文件，请看文末扫描获取文件。
下载下来后放在 sd目录/models/VAE 目录下。
官方推荐该脚本和Tiled Diffusion一起使用，这样速度更快，不容易OOM（内存溢出）。所以我们需要安装Tiled Diffusion插件，这个在上面已经介绍了。

到这里我们就安装好了，我们来使用一下它。来到图生图界面，设置好基础参数信息。需要注意的是这个基础参数的设置和我们前面的方法有所区别，这也是官方推荐的。

选择我们刚刚下载的checkpoints模型和配套vae。

输入正面词（不输也行）和负面词。

正面：
(masterpiece:2), (best quality:2), (realistic:2),(very clear:2)

负面：
3d,cartoon,anime,sketches,(worst quality:2),(low quality:2),

配置脚本参数：

官方推荐的参数配置如下：

如果生成图像尺寸 > 512，我们推荐使用 Tiled Diffusion & VAE，否则，图像质量可能不理想，VRAM 使用量也会很大。
这里是官方推荐的 Tiled Diffusion 设置。
方法 = Mixture of Diffusers
隐空间Tile大小 = 64，隐空间Tile重叠 = 32
Tile批大小尽可能大，直到差一点点就炸显存为止。
Upscaler「必须」选择None。
下图是24GB显存的推荐设置。
对于4GB的设备，「只需将Tiled Diffusion Latent tile批处理大小改为1，Tiled VAE编码器Tile大小改为1024，解码器Tile大小改为128。」
SDP注意力优化可能会导致OOM（内存不足），因此推荐使用xformers。
除非你有深入的理解，否则你「不要」改变Tiled Diffusion & Tiled VAE中的其他设置。「这些参数对于StableSR基本上是最优解」

最终成像如下，可以看到细节感真的不错哈，一些细节可以再做调整，如果需要更丰富就把放大倍数再调大些：

六、几种方式的优缺点对比：

方法名	优点	缺点
文生图高清修复	图片生成细节良好、操作简便	生成速度一般，占用较大显存
后期处理	生成速度很快，操作简便	几乎0重绘，对于细节的完善不足
图生图放大倍数	生成速度很快，操作简单，细节良好	生成图片细节有限
图生图Upscale脚本	生成速度中等，操作简便	容易生成过多不需要的画面，目前已基本废弃
图生图Ultimate脚本	生成速度中等，细节良好，可搭配cn tile	生成的结果具有一定的随机性，需要对参数有一定了解，进行细微调整
Diffusion+StableSR	几乎完全忠实于原图，细节最佳，最大支持放大8K	操作起来很麻烦，需要下载一些额外的模型，然后速度也并不快
Diffusion+VAE+cn	细节绝佳，最大支持放大8K	生成速度慢，可能会出现一些不需要的细节（可做调整）