问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Stable Diffusion(SD)提示词使用指南及注意事项

创作时间:
作者:
@小白创作中心

Stable Diffusion(SD)提示词使用指南及注意事项

引用
1
来源
1.
http://www.360doc.com/content/24/1119/22/85330053_1139790871.shtml

Stable Diffusion(SD)AI绘图工具的提示词是生成理想图像的关键。本文将详细介绍提示词的基本使用方法、语法和注意事项,帮助用户更好地掌握这一工具。

01、提示词基本概述

提示词通常在文生图和图生图时使用,由多个描述性词汇组成,用英文逗号隔开,结尾不需要加分隔符。提示词分为正向提示词(positive prompt)和反向提示词(negative prompt),用于告诉AI我们想要生成什么和不想生成什么。

SD提示词支持多种类型的表达方式,包括英语单词、短语、自然语言、颜文字和emoji表情。我们固定种子点为4182552405,使用MajicMixRealistic_V7模型,对比英语单词、颜文字、emoji表情的效果:

SD对于这3种提示词都可以识别,但识别效果上稍微有点差别。

02、提示词顺序

提示词网上有个说法建议按如下顺序进行书写:

  1. 综述(图像质量+风格+镜头效果+光照效果+主题)
  2. 主体(人物&对象+动作+服装+饰品+道具)
  3. 细节(场景+环境)

具体说明如下:

  1. 质量提示词通常是整个画面的清晰度、分辨率、质量等关键词汇组成。如:masterpiece, best quality, 8k, Ultra-high resolution
  2. 风格提示词如有则建议放在质量提示词后面,例如某个画家或某些影视作品的风格如:ghibli style
  3. 镜头效果通常用来体现主体在画面中的位置,如长镜头(long shot),短镜头(short shot),全景镜头(panoramic)等,镜头通常最后只选择其中一种即可。
  4. 光照效果通常是环境的灯光效果,如电影级照明(cinematic lighting), 丁达尔效应(tyndall effect), 体积光(volumetric lighting)等
  5. 主题提示词这里通常是指整个画面呈现什么样的主题,与风格有所区别,如深色主题(dark theme),明亮主题(bright theme)等
  6. 主体提示词通常这里才是描绘我们整体想生成的作品内容,如:1girl, beautiful face, long hair, white hair,
  7. 动作提示词通常这里是我们主体的一些动作表现,如跑(running),走(walking),笑(smile)等
  8. 服装提示词这里是我们主体的服装表现,如裙子(dress),鞋子(shoes),外套(coat)等
  9. 饰品提示词这里通常是主体身上的一些饰品,如头花(hair flower),手镯(bracelet),项链(necklace)等
  10. 道具提示词通常这里是主体相关的道具,如手提包(handbag),话筒(microphone),照相机(camera)等等
  11. 场景提示词通常这里放主体所在的一些场景提示词,例如城市(city),咖啡厅(coffer shop),商场(mall)等
  12. 环境提示词这里通常是所处的自然环境,如白天(day),晚上(night),雨天(rain)等

实际测试发现,这个顺序建议基本有效。例如,使用提示词“panda, bicycle, park”时,如果将“panda”移动到提示词的后面,生成的图片中出现熊猫的概率会降低。这是因为提示词的位置顺序对其所营造的语境有着重要影响。

03、提示词权重语法

除了位置顺序外,还可以通过以下符号来调整提示词的权重:

  1. 逗号(,):提示词之间通过逗号分隔,逗号前面的提示词权重大于逗号后面的权重。
  2. 圆括号():提升提示词的权重至原来的1.1倍。如果存在多层圆括号,则其权重为1.1的N次方(N为圆括号的层数)。例如,对于((1girl)),1girl的权重就被提升为1.1×1.1=1.21倍。
  3. 冒号(:):用来自定义词汇的权重。即使该词汇在列表中排在后面,也可以通过冒号来提升它的权重。通常,冒号会与圆括号一起使用。例如,(1girl:1.5)表示1girl的权重被设定为1.5倍。
  4. 花括号{}:能够提升词汇的权重至原来的1.05倍。其使用方法与圆括号类似。例如,对于{{1girl}},1girl的权重就被提升为1.05×1.05=1.1025倍。
  5. 方括号[]:具有降低权重的作用,会将词汇的权重降低至原来的1/1.05倍。例如,[1girl]表示1girl的权重被降低为0.952倍。

推荐使用快捷键操作方法:选中提示词后,按住CTRL键并使用上下方向键来调整权重数值,这样可以避免繁琐的手动输入。

04、交替语法

交替语法允许你在每一步中交替计算不同的提示词,其书写格式为:

[提示词1|提示词2|...]

这种语法的典型应用是创建融合图像。例如,可以在方括号中写入“熊猫”和“狗”这两个提示词,并用竖线分隔它们。这样,SD模型就会在第一步计算“熊猫”的特征,第二步计算“狗”的特征,第三步再次计算“熊猫”的特征,以此类推,最终生成一个融合了“熊猫”和“狗”特征的图像。

它也能添加多个提示词,例如分别写了熊猫,狗和老虎,它就会先第一步计算熊猫,第二步计算狗,第三步计算老虎以此类推:

05、组合语法

组合语法与交替语法在某些方面相似,但它们的计算原理有所不同。组合语法更像是将各个提示词的结果直接相加,并且它还支持为提示词添加权重。其书写方式是:

将提示词依次列出,并使用“连接词”进行连接,如“提示词1 AND 提示词2 AND ...”,其中提示词的数量可以是多个。

具体说明如下:

  1. AND连接词:提示词1 AND 提示词2 AND。如提示词:1girl, green AND red hair。AND是以后右边的为主题,然后融合了AND左边的一点颜色。当提示词后面不输入数值的时候权重默认为1,你也可以在提示词后面冒号加数值的方式手动赋予权重。我个人认为,组合语法更适合用于场景的融合。比如,当我输入的提示词是“熊猫”和“海洋”时,画面中虽然会同时出现熊猫和海洋的元素,但它们可能各自独立。然而,当我使用“AND”将这两个提示词组合起来后,效果就仿佛是将一个熊猫的图像和一个海洋的图像融合在了一起,熊猫甚至会被呈现为在水中。这两种现象也不是绝对的,多次抽卡,“熊猫”和“海洋”中间不加入AND,也可以抽卡出熊猫在水里的图片
  2. and:将多个词缀聚合成一个提示词组,如:1girl, white hair and black hair。生成的头发每次抽卡没有规律,有时候是全部白头发,有时白头发中间有黑头发。也可以给每个关键词调整权重。查相关的资料说的是:and前后的初始权重一致,实际测试发现权重偏向于and前面的词
  3. 竖(|):这个是交替渲染的一个连接词,我们可以看下效果。例如:1girl, (green|red|yellow) hair。SD会先绘画绿色的头发,再将红色的头发渲染上去,最后再将黄色的头发渲染上去,会融合不同的颜色,不会有非常明显的颜色分块。抽卡生成图片的时候,绿色和红色会不太明显,偏重于黄色
  4. 加号(+):这个与AND连接符功能类似。1girl, (green hair)+(red hair)+(yellow hair)。多个提示词进行融合后的图像
  5. 下划线():会将多个关键词进行融合。1girl, (green hair)(red hair)(yellow hair)。测试看and、+、 三个连接词的效果基本一样

06、打断语法

SD的语言模型具有结合上下文进行理解的能力,而“打断语法”则是一种用于切断前后提示词之间联系的技巧,其书写方式为大写字母“BREAK”。

例如,提示词为“girl, red hat, blue clothes, green pants”:

你会发现原本应该是红色的帽子变成了蓝色的帽子。这是由于“red hat”这个提示词受到了“blue clothes”的干扰和影响,导致颜色判断出现了偏差。这就是我们常说的“提示词污染”现象。值得注意的是,当前的tokens数量只有12个,而它们的最大值可以达到75个。

当我们在帽子和衣服之间加入BREAK这个打断语法观察一下,现在tokens的数量变成了81,最大值变成150:

这就是打断语法发挥作用的原理。SD的标准处理方式是每75个tokens组成一个组,如果超出这个数量,就会被分割成两个组分别进行计算,然后再合并生成图像。第75个tokens与第76个tokens之间的关联性相对较弱。而BREAK这个语法的作用就相当于强制将提示词填充到每组的75个tokens位置,从而打断前后提示词之间的关联性。

如果我们只保留BREAK语法之前的提示词,并删除其后的内容,那么tokens的数量就恰好达到了75个。由于这种打断关联性的操作,在一定程度上可以减少提示词污染的情况,使得生成的图像更加符合我们的预期。但是测试发现打断关联性后,red hat 的作用好像减弱了,变成随机生成帽子的颜色,抽卡多次才能抽取到红色的帽子,原因暂时还没研究出来。

07、调用Lora

调用Lora通常是由<>包围:

  1. 在SD界面点击Lora,会显示目前你已有的lora。我们只需要点击需要使用的Lora,就可以在提示词里自动加载该Lora,部分lora提示词需要触发词,在调用这个lora时,需要加入触发词

08、常用的提示词

  1. 提高质量的正向提示词

    正向提示词
    描述
    HDR, UHD, 8K
    这样的质量词可以带来巨大的差异提升照片的质量
    best quality
    最佳质量
    masterpiece
    杰作
    Highly detailed
    画出更多详细的细节
    Studio lighting
    添加演播室的灯光,可以为图像添加一些漂亮的纹理
    ultra-fine painting
    超精细绘画
    sharp focus
    聚焦清晰
    physically-based rendering
    基于物理渲染
    extreme detail description
    极其详细的刻画
    Professional
    加入该词可以大大改善图像的色彩对比和细节
    Vivid Colors
    给图片添加鲜艳的色彩,可以为你的图像增添活力
    Bokeh
    虚化模糊了背景,突出了主体,像 iPhone 的人像模式
    (EOS R8, 50mm, F1.2, 8K, RAW photo:1.2)
    摄影师对相机设置的描述
    High resolution scan
    让你的照片具有老照片的样子赋予年代感
    Sketch
    素描
    Painting
    绘画
  2. 艺术风格代表的提示词

    艺术风格
    艺术家
    肖像画(Portraits)
    Derek Gores, Miles Aldridge, Jean Baptiste-Carpeaux, Anne-Louis Girodet
    风景画(Landscape)
    Alejandro Bursido, Jacques-Laurent Agasse, Andreas Achenbach, Cuno Amiet
    恐怖画(Horror)
    H.R.Giger, Tim Burton, Andy Fairhurst, Zdzislaw Beksinski
    动漫画(Anime)
    Makoto Shinkai, Katsuhiro Otomo, Masashi Kishimoto, Kentaro Miura
    科幻画(Sci-fi)
    Chesley Bonestell, Karel Thole, Jim Burns, Enki Bilal
    摄影(Photography)
    Ansel Adams, Ray Earnes, Peter Kemp, Ruth Bernhard
    概念艺术家(视频游戏)(Concept artists (video game))
    Emerson Tung, Shaddy Safadi, Kentaro Miura
  3. 常用的反向提示词

    反向提示词
    描述
    mutated hands and fingers
    变异的手和手指
    deformed
    畸形的
    bad anatomy
    解剖不良
    disfigured
    毁容
    poorly drawn face
    脸部画得不好
    mutated
    变异的
    extra limb
    多余的肢体
    ugly
    丑陋
    poorly drawn hands
    手部画得很差
    missing limb
    缺少的肢体
    floating limbs
    漂浮的四肢
    disconnected limbs
    肢体不连贯
    malformed hands
    畸形的手
    out of focus
    脱离焦点
    long neck
    长颈
    long body
    身体长
  4. 镜头视角

    提示词
    描述
    dynamic angle
    动态角度
    from above
    从上方
    from below
    从下面
    wide shot
    广角宽景
    Aerial View
    空中俯瞰视图
  5. 主体远近

    提示词
    描述
    full body shot
    全身
    cowboy shot
    半身
    close-up shot
    接近
  6. 光线

    提示词
    描述
    cinematic lighting
    电影光
    dynamic lighting
    动感光
  7. 主体视线

    提示词
    描述
    looking at viewer
    画面中的物体或人物在直接面对画面或观众
    looking at another
    两个角色正在相互交流或对视
    looking away
    看着别的方向,不直视对方
    looking back
    回头看
    looking up
    摄像机或观察者的视角调整为向上看
  8. 画风

    提示词
    描述
    sketch, one-hour drawing challenge
    草图、速写、手绘风
    photograph, photorealistic
    照片
  9. 表情

    提示词
    描述
    blush
    脸红
    wet sweat
    大汗
    flying sweatdrops
    飞汗
  10. 服装

    提示词
    描述
    china dress
    旗袍
    sailor dress
    水手服
    school uniform
    校服
    sailor senshi uniform
    水手服
  11. 风景指定

    提示词
    描述
    underwater
    水下
    shinto shrine
    神社
  12. 姿势指定

    提示词
    描述
    hands on
    hands on own face, hands on feet, hands on breast
    kneeling
    跪下
    hand between legs
    腿夹手
    hair flip
    将头发向后或向一侧甩动的动作
    skirt flip
    裙子甩起来
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号