问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

AI绘画技巧:如何通过提示词和LoRA控制图像布局和背景清晰度

创作时间:
作者:
@小白创作中心

AI绘画技巧:如何通过提示词和LoRA控制图像布局和背景清晰度

引用
1
来源
1.
https://www.fluxai.cn/detail/flux-how-to-control-image-layout-20240927

在AI绘画领域,如何通过调整提示词和运用LoRA技术来控制图像的布局和背景清晰度,是许多创作者关注的重点。本文将通过大量实例和对比图,详细介绍如何通过这些技术手段实现对生成图像的精准控制。

通过提示结构控制布局

控制图像布局的最有效方法之一是调整提示词中描述场景的方式。具体来说,描述的顺序和细节程度会显著影响图像中主体的大小和背景的清晰度。

主体优先 vs 背景优先

考虑以下两个提示词示例:

  • 主体优先

    一个渔夫,戴着磨损的帽子和厚厚的毛衣,渔网搭在肩上,脸庞被海风侵蚀;黎明时分的热闹港口。
    


    在这个例子中,大部分细节都给了渔夫,港口的描述则很简短。因此,生成的图像主要集中在渔夫身上,他在画面中占据主导地位,而背景(港口)则模糊且细节较少。

  • 背景优先

    黎明时分的热闹港口,渔船在水中摇晃,海鸥在空中盘旋;远处有一个渔夫,戴着磨损的帽子和毛衣,渔网搭在肩上。
    


    在这里,港口的详细描述占据了优先地位。生成的图像将更关注港口,使其更加清晰,而渔夫在画面中显得较小且远离。通过简单地调整描述的顺序和重点,我们可以获得截然不同的结果。

内容如何影响背景清晰度

图像中背景的清晰度不仅受提示词中细节程度的影响,还与背景内容本身有关。通过实验发现,模型的表现几乎像一个智能摄影师,会根据提示词中描述的内容自动调整模糊程度。

背景与主体的细节量对比

  • 高度详细的背景,模糊的主体

    一个被高耸山峰环绕的雪山村庄,雪山上冒着烟的温馨小屋,滑雪者在洁白的坡道上划出轨迹;常青树上覆盖着新雪,清新的空气中充满了笑声和热可可的香气;一个滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋。
    


    在这个提示词中,大部分词汇集中在风景上——雪山村庄、山脉和常青树。由于风景的描述如此详细,生成的图像使背景显得大且非常清晰。而滑雪者则显得相对较小且遥远。

  • 通过简单调整将主体聚焦

    一个被高耸山峰环绕的雪山村庄,雪山上冒着烟的温馨小屋,滑雪者在洁白的坡道上划出轨迹;常青树上覆盖着新雪,清新的空气中充满了笑声和热可可的香气;特写镜头的滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋。
    


    通过添加"特写镜头"的短语,图像发生了显著变化。滑雪者现在变得更大,占据了更多的画面。背景依然清晰,但滑雪者现在成为了主要焦点,占据了前景。

  • 减少背景细节以突出动作

    一个被雪覆盖的阿尔卑斯山村;一个滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋。
    


    在这个提示词中,我们显著减少了背景细节,更加关注滑雪者的动作。因此,生成的图像中滑雪者显得更加清晰,甚至捕捉到了他调整护目镜的具体动作。

  • 改变主体顺序以获得不同布局

    一个滑雪者正在调整他的护目镜,呼出的气息在寒冷的空气中形成云雾,眼中闪烁着兴奋;一个被雪覆盖的阿尔卑斯山村。
    

    在这个版本中,滑雪者的细节成为图像的主要焦点。他在画面中显得很大,描述中的所有细节——从他呼出的气息到眼中的兴奋——都得到了清晰的展现。与此同时,背景几乎不可见,严重模糊,占据的画面很少。

通过关键词调整布局

提示词中的某些关键词也可以直接控制主体占据的空间和背景的清晰度。这些关键词充当命令,改变图像的焦点。

  • 特写镜头:将主体聚焦,使其更大且更详细,而背景则变得模糊。

  • 在远处:将主体移得更远,使背景更突出且更清晰。

  • 鸟瞰图:改变视角为更高、更远的视点,捕捉更多背景,减少主体的突出程度。

通过 LoRA 控制背景清晰度

在使用Flux模型生成图像时,常见的挑战是:当主体在画面中占据更多空间时,背景往往会变得过于模糊。为了解决这一问题,可以使用LoRA(低秩适应)技术。

LoRA的工作原理

LoRA本质上是一种轻量级的修改,可以将预训练模型适应特定需求,在这种情况下,减少背景模糊。当标准输出无法提供足够的背景清晰度控制时,它特别有用。

在ComfyUI中设置LoRA

在ComfyUI中,可以通过以下步骤设置LoRA:

  1. 加载LoRA节点:在预配置的工作流程中,添加一个专门用于减少背景模糊的LoRA节点。可以根据需要调整LoRA的强度,例如设置为最大值2。

  2. 使用更高效的KSampler:选择一个更高效的采样方法,以产生更干净的结果。

  3. 高分辨率修复:使用上采样潜在节点和图像到图像的重绘,进一步提高图像的清晰度和质量。

并排比较:使用LoRA与不使用LoRA




通过将LoRA与高分辨率修复结合使用,可以实现背景更加清晰、定义更明确的效果。这种解决方案为解决背景模糊的常见问题提供了实用和高效的方法。

结论

通过调整提示词的结构、使用特定关键词以及应用LoRA技术,创作者可以实现对图像布局和背景清晰度的精准控制。这些技巧不仅适用于Flux模型,对使用其他Stable Diffusion衍生模型的用户也有参考价值。通过实践这些技巧,创作者将能够生成更具艺术性和专业性的AI绘画作品。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号