问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

ComfyUI 基础教程(四) —— 应用 LoRA 模型控制图像生成特征

创作时间:
作者:
@小白创作中心

ComfyUI 基础教程(四) —— 应用 LoRA 模型控制图像生成特征

引用
1
来源
1.
https://www.cnblogs.com/joy99/p/18403415

LoRA(Low-Rank Adaptation)模型是一种用于微调大语言模型的低次序适应技术。在Stable Diffusion模型应用中,LoRA允许用户在不修改SD大模型的情况下,利用少量数据训练出具有特定画风、IP或者人物特征的模型。本文将详细介绍LoRA模型的概念、使用方法以及本地训练步骤。

一、LoRA模型的概念

LoRA模型全称是Low-Rank Adaptation of Large Language Models,最初用于NLP领域,特别是在微调GPT-3等模型时。在Stable Diffusion模型应用中,LoRA允许用户在不修改SD大模型的情况下,利用少量数据训练出具有特定画风、IP或者人物特征的模型,这种模型在社区和个人开发者中非常受欢迎。

二、LoRA的效果展示

LoRA相当于大模型之外的另外一种模型,它的主要作用是给原有的画面做一些微调。LoRA的种类有很多,有人物的、动作的、建筑的,甚至改变一些画风的、表情的、物品的,只要你加了某个特定的LoRA,它就会在画面中呈现。

最常用的一个就是人物的,举个例子,最近非常火的黑神话悟空的各种图片:

这就是使用悟空的LoRA生成的。

下面这个,用的是胡桃的LoRA:

可以看到不管怎么切换基础模型,不管怎么切换画风,LoRA始终是胡桃的LoRA,它画出来的就是胡桃。

三、LoRA的使用

3.1 LoRA模型加载器

首先到模型网站上下载自己想要的LoRA模型。放到ComfyUI\models\loras文件夹下。然后添加一个LoRA加载器节点。

该节点有三个参数:

  • 选择LoRA模型
  • LoRA模型的强度 - 这个数值越大,生成图像越偏向LoRA模型风格
  • Clip的强度 - 文本提示词的强度

这些参数根据需要调整就行。

最后再将主模型的模型输出点连接到LoRA加载器的输入点,主模型的Clip输出作为LoRA加载器的输入,最后,LoRA加载器的输出,分别连接到Clip文本编码器和采样器的模型输入。

需要强调的是:LoRA模型的版本要和主模型版本保持一致。

3.2 LoRA使用演示

可以看到,当前选择了一个中国风的水墨场景的LoRA,生成的图像,也就成了中国风的水墨风格。

3.3 LoRA堆的使用

如果要使用多个LoRA模型,可以添加多个LoRA加载器,依次串联起来。和ControlNet一样,多个LoRA模型可以使用LoRA堆节点进行加载。LoRA堆节点有很多,有的统一控制Clip强度,有的分别增加了开关,可以对每个LoRA分别控制,但是基本都大同小异。这里展示简易LoRA堆节点。

这里有一个总开关,可以开启或者关闭应用LoRA堆,模式高级的化可以针对每个LoRA模型设置Clip权重,最后输出到应用LoRA堆节点。

四、本地训练LoRA模型

前面提到,LoRA有一个特点,就是个人消费级显卡也可以很快完成训练,这样就给了我们很多施展的空间。下面来讲解训练LoRA模型的步骤:

4.1 下载安装LoRA训练器

训练模型的过程,俗称“炼丹”,训练模型的软件和环境,称为模型训练器,俗称“丹炉”。训练模型首先需要有一个模型训练器,目前网上有很多版本的SD LoRA模型训练器,这里还是比较推荐秋葉大佬的LoRA模型训练器。

4.2 训练数据准备

训练数据准备,主要做好下面几点:

  1. 训练素材处理
  • 首先要准备好训练素材,比如你想训练某个特定的人脸LoRA模型,你需要准备一些该特定人物的人脸的照片,素材的质量直接决定了训练出的模型的质量。
  • 对素材有一些的要求,比如图片数量不少于15张,一般可以准备20-50张;图片的质量要高,主体内容清晰可见,特征明显,图片尽量构图简单,避免其它杂乱的元素;尽可能以人物脸部特写为主,多角度,多表情等; 减少重复或者相似度太高的图片。
  • 素材准备完毕后,还需要对图片进一步处理,对低像素的素材图片,进行高清放大处理。图片统一分辨率,注意分辨率为64的倍数,显存低的可切为512 x 512, 显存高的可切为1024 x 1024。可以借助一些软件或者工具批量裁切。
  1. 素材打标
  • 这一步的关键是对素材进行打标。
  1. 打标优化
  • 打标完成之后,还要对生成的文件中的标签进行再优化,删除某些和要训练的风格不一致的图片。
  • 这一步相对比较复杂一点,训练不同风格的LoRA,打标的要求不一致。大家也可以在网上学习其它优秀的教程。

4.3 训练环境参数配置

这一步是需要配置训练的具体参数,比如每张素材图片训练多少步,总共训练多少轮等等。

4.4 模型训练

训练参数设置保存完之后,就可以开始训练了。训练过程中会自动进行模型保存。

4.5 模型测试

之前的文章有提到过,模型训练什么时候叫训练好了,是没有具体标准的,我们需要对训练生成的模型进行测试,感觉效果达到预期了,就可以停止训练了。

五、结束语

LoRA非常好用,使用也很简单,大家可以多到开源站点上看看别人训练的LoRA,学习学习。本文相对比较简单,到此结束。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号