ComfyUI入门教程:从基础概念到实战应用
ComfyUI入门教程:从基础概念到实战应用
在AI图像生成领域,ComfyUI以其直观的可视化界面和强大的功能,成为提升工作效率的得力助手。本文将带你从零开始,全面了解ComfyUI的核心概念、界面操作以及常见工作流,帮助你快速掌握这一工具。
相关概念
- 节点:节点是ComfyUI的重要组成部分。一个节点可以有多个输入和多个输出。
- 连线:不同的节点之间通过连线协同工作。连线只能从某个节点的输出连接到另一个节点的输入,且连线的两端必须是相同的类型。
- 工作流:所有节点及其连线构成一个完整的工作流。
模型种类
- Checkpoint:模型检查点,可以理解为基座模型。Stable Diffusion自发布以来经历了多个大版本的迭代,包括1.5、2.0、XL、3.5等版本。此外,FLUX(F.1)模型也备受关注,该模型由Black Forest Labs推出,团队成员包括Stable Diffusion的核心开发者,以其卓越的图像质量和先进的提示词遵循能力而闻名。
- LoRA:权重微调,基于checkpoint的微调,让输出的图片效果偏向某个方向或风格。
- CLIP:全称Contrastive Language-Image Pre-training,由OpenAI在2021年提出并开源。CLIP是一种基于对比学习的多模态模型,通过对比文本-图像对来学习匹配关系。简单来说,CLIP的功能就是将文字转化为潜空间向量。
- VAE:变分自编码器,在图生图中的应用主要是通过其生成模型的能力来生成新的图像。VAE通过将输入数据映射到潜在空间,并从潜在空间中采样来重建输入数据,从而实现图像的生成。简单来说,VAE的功能就是将图片在潜空间和现实空间进行相互转换,分别对应VAE编码和VAE解码。
ComfyUI界面
常见操作
节点搜索
双击空白处可以跳转到节点搜索界面。
节点连线
鼠标左键按住节点输出按钮,然后拖拽即可拉出连线。如果当前工作空间中没有对应的输入节点可以直接连线,可以将其拖拽到空白处松开鼠标,即可唤出节点搜索框,搜索自己想要使用的节点,找到后会直接连接。
提交生图任务
工作流搭建完毕后,点击执行队列即可执行工作流。
简易工作流
提示词
提示词与提示词之间需要使用逗号分隔,并且提示词可以换行。每个提示词的默认权重为 1 ,越靠前的提示词权重相对越高,因此越需要强调的提示词,需要写在越靠前的位置。
常用正向提示词:
HDR,UHD,8K(HDR、UHD、4K、8K和64K)——这样的质量词可以带来巨大的差异提升照片的质量
best quality——最佳质量
masterpiece——杰作
Highly detailed——画出更多详细的细节
Studio lighting——添加演播室的灯光,可以为图像添加一些漂亮的纹理
ultra-fine painting——超精细绘画
sharp focus——聚焦清晰
physically-based rendering——基于物理渲染
extreme detail description——极其详细的刻画
Professional——加入该词可以大大改善图像的色彩对比和细节
Vivid Colors——给图片添加鲜艳的色彩,可以为你的图像增添活力
Bokeh——虚化模糊了背景,突出了主体,像iPhone的人像模式
(EOS R8,50mm,F1.2,8K,RAW photo:1.2)——摄影币对相机设置的描述
High resolution scan——让你的照片具有老照片的样子赋予年代感
Sketch——素描
常用反向提示词:
lowres , bad anatomy , bad hands , text , error ,missing fingers,
extra digit, fewer digits, cropped, worst quality,
low quality , normal quality, jpeg artifacts, signature ,
watermark, username,blurry,missing arms, long neck,
Humpbacked ,missing 1 imb, too many fingers ,
mutated, poorly drawn,out of frame,bad hands 1
unclear eyes ,poorly drawn, cloned face,bad face
文生图
调参说明:
- 步数:降噪步数。
- CFG:提示词相关性。该值越大表示生成的结果约贴近提示词,但是过大会导致图像质量下降。
- 采样器:采样算法,会影响结果质量、生成速度、风格样式。
- 调度器:控制逐渐移除噪波的方法。
- 降噪:降噪的数值,降低该值会保留原图的大部分内容从而实现图生图。
图生图
图生图和文生图的过程基本相同,只是在latent部分需要传入一个对图像编码后的潜空间数据。
常用应用
图像高清放大(高清修复)
基本思想:对潜空间图像放大,然后再进行采样修复。
局部重绘
局部重绘,顾名思义就是将局部区域重绘为你想要的效果。
Controlnet
Controlnet是一种用于增强图像生成的神经网络技术,特别适用于稳定扩散模型(Stable Diffusion Model)。它的目的是在不改变生成模型核心结构的情况下,增加对生成内容的控制。ControlNet的主要思想是通过增加额外的控制信号来指导生成过程。这些控制信号可以是图像的边缘、草图、深度图或其他形态的信息。通过引入这些信号,ControlNet可以更好地满足用户对生成图像的特定要求。
SAM-GDinoSAM一键抠图
风格迁移
IPAdapter是一个轻量级的适配器,它的作用是将一张图像或几张图像的风格迁移到另一张图像上去。结合前面提到的ControlNet可以达到将风景照风格迁移到人物照的效果。
FLUX模型的使用
F.1模型在使用的时候和前面的SD系列不一样,需要通过不同的组件去分别导入UNET模型、CLIP模型和VAE模型。