问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Stable Diffusion生成二次元风格图片的初尝试——以“圆焰”为例

创作时间:
作者:
@小白创作中心

Stable Diffusion生成二次元风格图片的初尝试——以“圆焰”为例

引用
1
来源
1.
https://juejin.cn/post/7436739588491231251

最近尝试用Stable Diffusion(SD)生成了一些二次元风格的图片,效果超出预期!本文主要分享如何通过“提示词”(prompt)来帮助SD生成更精美的二次元风格图片,以及使用的一些模型。

1.选角色,定风格

选择了两位经典的角色——鹿目圆(Kaname Madoka)和晓美焰(Akemi Homura)。为了保证风格尽量符合二次元的特色,在提示词中加入了“anime”或“manga”的关键词。

2.写提示词,精准打击

接下来,提示词的写作就显得非常关键了!提示词决定了SD生成的图像质量和风格,写得好,模型才能理解想要的效果。

  • 角色描述:把角色的外貌、服装和个性特点描述清楚。比如小圆的粉色头发、粉色眼睛,还有她的魔法少女服装。一般会用一些具体的词汇去形容角色的细节,尽量避免模糊不清。

Madoka Kaname, pink hair, pink eyes, wearing magical girl outfit, standing in a magical pose, cute and determined expression, anime style.

  • 背景场景:给角色设计一个有氛围的背景非常重要!比如,在生成“晓美焰”时,加上了“废弃教室”或者“魔法世界”的背景描述,让画面更有故事感。

Homura Akemi, black hair, purple eyes, standing in a dark, abandoned classroom, surrounded by magical energy, anime style.

  • 风格和细节:为了让画面更符合二次元的氛围,在提示词中加入了“anime style”或者“manga style”,并且要求“高细节”和“干净线条”,这样生成的画面就更加符合想要的效果。

anime style, high detail, clean lines, soft lighting.

3.工具和模型的加持

使用了绘世启动器来部署Stable Diffusion,安装了一些LoRA插件来优化生成效果。各类插件在生成过程中增加了很多便利性,比如对模型的快速切换、参数调整、细节优化等等。

LoRA模型能够大幅提升图像的细节和质量,特别是在角色生成上表现得尤为突出。有了LoRA模型的加持,生成的图像不仅更加生动,而且细节处理得更到位,尤其是在头发、眼睛等细小部分的表现上,非常逼真。

4.调整和优化,提升画面质量

虽然初步生成的图像已经挺不错,但有时还是需要做一些微调。比如,有些图像中的角色比例不太对,或者背景看起来不够精致。这时,会通过调整一些参数,比如CFG ScaleSampling Steps,来让图像更加细腻。

如果遇到一些小错误,比如角色手部不自然、背景模糊等,可使用inpainting(修复)功能,手动调整图像中的某些区域,确保最终效果达到最佳。

5.结果与成图展示

最终成功生成了圆焰的神迹,角色的动作和表情得到了很好的体现!

Stable Diffusion的强大不仅在于它能生成图片,更在于通过精准的提示词和合适的模型加持,可以将创作潜力最大化。

以下是部分成图展示:


写在最后

笔者为某省重点大学计算机科学领域(CS)的学生,发现学校里二次元爱好者和CS领域大神高度重合。如果读者也想尝试用AI生成二次元风格图像,希望这些经验能够帮到你!

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号