问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

AI技术在绘画领域的应用

创作时间:
作者:
@小白创作中心

AI技术在绘画领域的应用

引用
1
来源
1.
https://hkaift.com/cn/ai%E6%8A%80%E6%9C%AF%E5%9C%A8%E7%BB%98%E7%94%BB%E9%A2%86%E5%9F%9F%E7%9A%84%E5%BA%94%E7%94%A8/

随着计算机技术和算法的不断进步,人工智能生成内容(AIGC)的应用近年来引起了广泛关注。比如,ChatGPT在推出仅两个月后,月活跃用户达到了一亿,三个月后更是达到惊人的18亿。国际数据公司(IDC)预测,2023到2026年间,全球在人工智能方面的支出将超过3,000亿美元。AI技术已经潜移默化地改变了多个行业,包括汽车、金融、医疗、零售、支付、艺术、智能家居等。[1]AI绘画作为AIGC的重要应用分支,近年来不断进入大众视野。2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞赛中,一幅由AIGC制作的作品《太空歌剧院》(图1)获得一等奖,而参赛者并没有任何绘画基础。这引起了广泛关注。那么,什么是AI绘画?它与传统绘画有什么联系?AI绘画的应用和影响是什么?下面将详细介绍。


图1.《太空歌剧院》

什么是AI绘画

AIGC利用大型训练模型和人工智能技术,根据已有数据寻找规律,通过泛化生成相关内容。AI绘画则是将AIGC应用于艺术绘画中,用户只需输入不同描述词汇(如艺术家构图、风格、色彩等)即可生成相应的绘画作品,实现文字生成图像甚至视频的跨模态产出。近年来,几个主流的生成模型包括生成对抗网络(GAN)、变分自动编码器(VAE)、流模型(Flow-based model)、扩散模型等,基本都基于深度学习进行训练。AI绘画与传统绘画相辅相成,但因创作机制限制,缺乏传统绘画的生动与人性化表现风格,导致其在大众中缺乏亲和力和心理认同感。

国内外有许多优秀的AI绘画平台,如Midjourney、Disco Diffusion、Stable Diffusion、百度文心等。以AI绘画龙头Midjourney为例,《太空歌剧院》便是使用Midjourney生成。Midjourney是一款搭载在Discord社群上的图像生成应用,通过差异化产品定位积累了早期数据和活跃社区。至2023年3月,Discord上的用户数超过1,300万,是目前用户数最多的服务器。

图2. Discord和Midjourney的合作模式

图2展现Midjourney与Discord是如何相辅相成。Discord为Midjourney提供了绝佳的社交体验平台以及海量的用户,而Midjourney卓越的AI绘画能力也为Discord带来社区流量。不仅如此,Discord的社区生态帮助Midjourney积累了大量的数据,通过鼓励用户对于AI生成的图片进行满意度评分,帮助模型在讨论中不断更新迭代,优化生成效果。Midjourney目前采取三种订阅模式,不同的订阅模式体现在反应速度以及图像生成次数。根据目前用户数量保守估计,年营收入可达到1亿美元。图3展示了近年来Midjourney和Discord用户数量的迅速提升,AI绘画受到了越来越多的关注。


图3. 近年来Discord和Midhourney用户数量的变化

AI绘画对企业的影响(以美图公司为例)

AI绘画操作简单、实用门槛低,引起了广大行业从业者和文娱爱好者的关注。AI绘画的用户近半数为美术设计类和互联网行业从业者,能辅助设计工作,同时对游戏等互联网行业有所助益。美图公司是AI绘画对企业帮助的成功案例。从2008年开始,美图公司通过「美图秀秀」应用加强人像技术研发,并在2013年进行多维度探索,但效果不佳。经历多年探索后,美图公司在2020年上线美图创意平台,2023年推出多款AI产品如美图宜肤、美图云修、美图证件照等,通过订阅付费、单产品付费、API外接等方式实现商业变现,成功转型为稳定的付费订阅业务,并实现显著的利润增长。图4和图5展现了美图公司近年来付费人数的稳定增长和转型后订阅收入的显著提升。


图4. 美图付费人数的变化


图5. 美图订阅业务收入的变化

不仅在美图行业有显著帮助,在各类行业下均有成功融合AI绘画应用的例子,例如在广告行业中借助AI制作宣传素材:《时尚芭莎》36周年纪念AI海报;漫画行业中辅助生成漫画、插画;视频:AI绘制《漠河舞厅》MV等等。

AI绘画的局限性

  • 依赖模型:AI生成模型极大程度依赖于训练数据,不一定能满足所有人的要求,效果也难以保证。
  • 随机生成:生成器在生成低细节图片时确定了构图,但这种确定是随机的,难以指定图片中某物的位置。
  • 指向性差:Midjourney擅长画人物、山水、建筑,但不擅长画抽象人造物,如字形、IP形象、图标和logo等。
  • 难以微调:每幅图片都要重新生成,微调内容时需要重新生成新图。

AI生成视频所面临的技术瓶颈

目前许多应用支持文字生成图片,但文字生成视频并不普遍,当中存在两个重要技术瓶颈:

  • 算力可控性:从图像到视频的转化,每秒视频至少由20帧到25帧图像组成,生成视频的算力是否可控、渲染成本是否过高等都是问题。
  • 图像可控性和视频逻辑性与连贯性:每秒钟生成25张图像,一分钟形成1,500张图像,质量是否可控,图像间的逻辑性和连贯性是否符合视频要求,都是重要的考虑因素[2]。

未来的机遇和挑战

开源公司Stability AI发布的Stable Diffusion图形模型,极大降低了研发成本,为AI绘画公司提供了高位且平等的技术平台。然而,开源模型并非万能,高昂的硬件、运营和训练成本提高了行业门槛,不确定的投资回报率也不是所有公司都能承担。

随着AI绘画的普及和完善,AI绘画能够帮助艺术家探索和创造全新艺术形式和风格,超越传统创作限制,开拓视觉审美新领域;根据用户偏好和需求进行个性化定制,为每个人创造独特艺术作品和体验;成为艺术教育的强大工具,帮助人们学习和理解艺术创作技术和理论,降低学习门槛,普及艺术教育;促进不同文化和艺术领域的交流与合作,推动全球艺术创作多样性和丰富性。

然而,AI绘画也带来侵权、隐私泄露等问题。AI绘画强大的学习和更新能力,使许多行业从业者产生担忧和恐慌,通过短短几天便可掌握许多画师需练习数年的技术,威胁许多底层画师的就业。此外,AI绘画作品的艺术价值存争议,批判者认为AI绘画创作没有灵魂,需人类不断调整参数才能产出满意作品。AI绘画作品还涉及肖像侵权等潜在风险,有画师表示不允许AI学习自己的作品或需收取版权费并标注。

NVIDIA創辦人暨執行長黃仁勳对于AI绘画的前景评价道: 「AI将为艺术家提供全新的表达方式,这不仅仅是自动化,而是以前所未有的方式增强创造力。」相信随着相关法律的不断健全和公众的参与和关注,AI绘画产业会找到属于自己合适合规的发展道路。

参考文献:

[1] Xu,J.; Zhang,X.; Li,H.; Yoo,C.; Pan,Y. Is Everyone an Artist? A Study on User Experience of AI-Based Painting System. Appl. Sci. 2023,13,6496.

[2] HorizonInsights.(2023). ‘科技与技术交汇,AI助美图腾飞’.

[3] GFSECURITIES.(2023).‘Midjourney: AI绘画“小”模型的成功之道’

[4] XinluLiu2020J. Phys.:Conf. Ser. 1648032125

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号