问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

基于生成对抗网络的动漫人物图像合成技术详解

创作时间:

作者:

@小白创作中心

基于生成对抗网络的动漫人物图像合成技术详解

引用

CSDN

1.

https://blog.csdn.net/iiiiiiimp/article/details/144567463

本文介绍了一种基于生成对抗网络（GAN）的动漫人物图像合成技术。该技术通过引入角色身份张量、条件噪声以及基于语义分割和边缘检测的鉴别器，实现了高质量的动漫人物图像生成。

基于生成对抗网络的动漫人物合成

效果展示

该技术能够根据语义图形生成不同的人物图像，相比其他方法具有更自然的色彩和更清晰的纹理。以下是部分生成效果展示：

相比其他方法，该技术生成的图像在背景和衣服的色彩上更加自然：

在纹理细节方面，如头发纹理，该技术也表现得更为出色：

此外，该技术还被应用到Unity开发的AI绘画软件中，用户可以通过绘制语义图像来生成真实的动漫人物图像。

项目信息

论文地址：https://bmvc2024.org/proceedings/508/
代码地址：https://github.com/hahahappyboy/Semantic-Image-Synthesis-of-Anime-Characters-Based-on-Conditional-Generative-Adversarial-Networks/tree/main
软件地址：https://blog.csdn.net/iiiiiiimp/article/details/129804794

技术原理

1. 角色身份张量

在训练过程中，将三维张量作为生成器的输入，以实现对任意角色的控制。具体来说，为每张训练图像标注人物身份，在每次迭代前根据人物身份选择对应的身份张量与语义图拼接后作为生成器的输入。这种设计让生成器能够学习到特定角色的身份特征。

为什么使用三维张量？

语义图是三维的，二维张量容易被网络忽略。

为什么角色身份张量初始为正态分布？

正态分布便于训练。

2. 条件噪声

为了解决不同动漫人物图像间色彩差异导致的生成图像色彩模糊问题，借鉴StyleGAN的噪声思想，将三维正态分布的噪声按通道乘以一组可学习的系数后添加到网络的特征图中。这种设计能够增强网络对色彩的拟合能力。值得注意的是，每个动漫角色都设置了单独的噪声和可学习的系数，以适应不同角色的外观色彩特征。

3. 基于语义分割和边缘检测的鉴别器

传统的基于分类的鉴别器更关注图像整体质量，而基于语义分割的鉴别器则关注局部区域的质量，两者都无法很好地关注细节纹理。因此，提出了基于语义分割和边缘检测的鉴别器，通过在鉴别器中引入边缘检测实现对边缘纹理的像素级监督。具体来说，在网络末端通过双分支结构同时输出语义图像和边缘图像，以增强对细节纹理的关注。

结语

这项技术不仅展示了人工智能在动漫图像生成领域的强大能力，也为二次元爱好者提供了一个将创意转化为现实的工具。通过结合角色身份张量、条件噪声和改进的鉴别器设计，该技术能够生成高质量、细节丰富的动漫人物图像，为动漫创作和AI艺术领域开辟了新的可能性。

热门推荐

蝙蝠侠备受争议的“不杀生”规则将继续存在

蝙蝠侠备受争议的“不杀生”规则将继续存在

公务员考试分数计算规则详解

公务员考试分数计算规则详解

《中国银屑病生物制剂及小分子药物治疗指南》重磅更新！

《中国银屑病生物制剂及小分子药物治疗指南》重磅更新！

令美军潜艇无处遁形！港媒：中国最新反潜手段，可发现尾流磁场！

令美军潜艇无处遁形！港媒：中国最新反潜手段，可发现尾流磁场！

北欧神话中的十二主神：神秘力量的象征与传承

北欧神话中的十二主神：神秘力量的象征与传承

做了PET/CT检查，为何还加做CT或MR增强扫描？

做了PET/CT检查，为何还加做CT或MR增强扫描？

韩国地产,为什么韩国年轻人都“喜欢”租房?

韩国地产,为什么韩国年轻人都“喜欢”租房?

狗狗螨虫感染怎么办？一文详解治疗与预防方法

狗狗螨虫感染怎么办？一文详解治疗与预防方法

一张表全面了解！汽车纳米陶瓷膜 VS 磁控溅射金属膜

一张表全面了解！汽车纳米陶瓷膜 VS 磁控溅射金属膜

2025年2月香港演唱会全攻略：15场精彩演出信息汇总

2025年2月香港演唱会全攻略：15场精彩演出信息汇总

在花漾南京玩出“花”样，南京文旅春季产品发布

在花漾南京玩出“花”样，南京文旅春季产品发布

强化学习中的重要性采样技术详解

强化学习中的重要性采样技术详解

勾调为何被誉为白酒生产中的“艺术”？

勾调为何被誉为白酒生产中的“艺术”？

服用中成药为何要忌口

服用中成药为何要忌口

如何准确计算岁？这种计算有哪些依据？

如何准确计算岁？这种计算有哪些依据？

死海中有哪些动物？揭秘死海独特的生命世界

死海中有哪些动物？揭秘死海独特的生命世界

头皮发痒的原因终于找到了！教你几招快速舒缓

头皮发痒的原因终于找到了！教你几招快速舒缓

周田明教授：老年人健康减重指南

周田明教授：老年人健康减重指南

清甜爽口的娃娃菜，除了煮汤，还可以这样做

清甜爽口的娃娃菜，除了煮汤，还可以这样做

如何选择适合的营养学科研课题

如何选择适合的营养学科研课题

天津十大必吃美食：从十八街麻花到狗不理包子

天津十大必吃美食：从十八街麻花到狗不理包子

北欧神话中的世界末日：诸神黄昏的惊人预言

北欧神话中的世界末日：诸神黄昏的惊人预言

曼联放弃范尼是明智之举，莱斯特城连败泥沼深陷

曼联放弃范尼是明智之举，莱斯特城连败泥沼深陷

球兰：生长习性、特点与生长过程特性

球兰：生长习性、特点与生长过程特性

如何在银川选择合适的居住区域？这些区域的发展和便利性如何？

如何在银川选择合适的居住区域？这些区域的发展和便利性如何？

“把大象装进冰箱”：一个语言游戏背后的思维奥秘

“把大象装进冰箱”：一个语言游戏背后的思维奥秘

财会人员离职交接工作有哪些注意事项？

财会人员离职交接工作有哪些注意事项？

适合演员的八字(什么样的八字多才多艺)

适合演员的八字(什么样的八字多才多艺)

排列组合、概率问题与容斥原理详解

排列组合、概率问题与容斥原理详解

肾好不好，“尿”知道！建议这些人及时检查

肾好不好，“尿”知道！建议这些人及时检查

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号