【AI学习】把古诗变成美图,只需两步!《天净沙·秋思》
【AI学习】把古诗变成美图,只需两步!《天净沙·秋思》
导 读
昨天学习了如何让大语言模型工具,生成古诗词的画面描述语。
今天这篇文章,包括2个部分:
1、分享一首古诗的提示词+图片生成(不同模型对比)
2、问题解惑
AI工具需求
即梦:https://jimeng./
一、根据提示词生成图片
《天净沙·秋思》第1版:
第一句:'枯藤老树昏鸦'
提示词: 国风卡通风格, 秋景萧瑟, 枯藤老树, 昏鸦哀鸣, 荒凉凄冷。生图模型:图片 2.0 Pro
生图模型:图片 2.0
第二句:“小桥流水人家”
提示词:国风卡通风格, 古朴小桥, 清澈溪水, 炊烟袅袅, 宁静祥和。生图模型:图片 2.0 Pro
生图模型:图片 2.0
第三句:“古道西风瘦马”
提示词:国风卡通风格, 古道苍凉, 西风凛冽, 瘦马艰辛, 苍凉艰辛。生图模型:图片 2.0
第四句:“夕阳西下,断肠人在天涯”
提示词:国风卡通风格, 夕阳西下, 余晖洒满大地, 断肠人孤独, 忧伤无尽思念。生图模型:图片 2.0
《天净沙·秋思》第2版
第一句:'枯藤老树昏鸦'
提示词: 国风卡通风格, 枯藤老树, 乌鸦栖息, 郊外荒凉, 秋风萧瑟, 落叶飘零。生图模型:图片 2.0 Pro
第二句:“小桥流水人家”
提示词:国风卡通风格, 小桥流水, 农舍炊烟, 田野金黄, 宁静祥和, 生活气息浓厚。生图模型:图片 2.0 Pro
生图模型:图片 2.0
第三句:“古道西风瘦马”
提示词:国风卡通风格, 古道西风, 瘦马前行, 荒凉原野, 旅途艰辛, 孤独疲惫。生图模型:图片 2.0 Pro
第四句:“夕阳西下,断肠人在天涯”
提示词:国风卡通风格, 夕阳西下, 旅人独行, 破旧衣衫, 眼神愁苦, 思乡断肠。生图模型:图片 2.0 Pro
《天净沙·秋思》第3版
第一句:'枯藤老树昏鸦'
提示词1: 国风卡通风格, 枯藤缠绕的老树, 几只乌鸦栖息其上, 黄昏昏暗的光线, 远处的山峦若隐若现, 萧瑟的秋天气氛。生图模型:图片 2.0 Pro
第二句:“小桥流水人家”
提示词1:国风卡通风格, 小桥流水, 白墙青瓦的人家, 夕阳余晖洒在河面上, 宁静温馨的村庄景色, 竹子与花草点缀其间。生图模型:图片 2.0 Pro
第三句:“古道西风瘦马”
提示词1:国风卡通风格, 荒凉的古道, 西风呼啸, 瘦马缓缓行进, 孤独的旅人, 颓废与漂泊的情绪。生图模型:图片 2.0 Pro
第四句:“夕阳西下,断肠人在天涯”
提示词1:国风卡通风格, 红色夕阳沉入地平线, 天空染上火红与金黄, 远山与河流笼罩在暮色中, 孤独的旅人站在山坡上, 凝望夕阳, 充满哀愁与思乡之情。生图模型:图片 2.0 Pro
《天净沙·秋思》第4版
第一句:'枯藤老树昏鸦'
提示词: 在一片荒芜的郊外,一棵老树孤零零地矗立着,枯藤缠绕其上,几只乌鸦在树梢上低鸣。秋风萧瑟,树叶凋零,整个画面充满了凄凉与孤独。生图模型:图片 2.0 Pro
第二句:“小桥流水人家”
提示词:一条清澈的小溪缓缓流淌,一座小桥横跨其上,桥边有几间简陋的农舍,炊烟袅袅升起。远处的田野里稻谷金黄,一片丰收的景象。整个画面虽然简朴,但充满了生活的气息。生图模型:图片 2.0 Pro
第三句:“古道西风瘦马”
提示词:国风卡通风格, 古道西风, 瘦马前行, 荒凉原野, 旅途艰辛, 孤独疲惫。生图模型:图片 2.0
第四句:“夕阳西下,断肠人在天涯”
提示词:一轮红日缓缓下沉,余晖洒满整个天空,将大地染上了一层金红色。古道上的瘦马和远处的农舍都被夕阳映照得格外温馨。然而,这温暖的色彩也掩盖不住旅人的孤独与漂泊。生图模型:图片 2.0 Pro
PS:以上是在即梦中生成的,下面这2组,在秒画中生成,大家对比效果。
二、解惑:提示词相关的2个问题
有不少小伙伴在使用AI绘画的过程中,会发现:同一个提示词在相同的AI工具中,重复生成的图片不一样。同一个提示词放到不同的AI模型中,生成的结果也不一样。
这个问题,可以用“文心一言”来解答。
提示词1:现在,我需要你回答我2个问题, 第1个问题是:为什么同一个问题在不同的AI大模型中,收到的答案不一样呢?第2个问题是:同一个问题,为什么向同一个AI大模型提问,收到的答案也不一样呢?
第1个问题:为什么同一个问题在不同的AI大模型中,收到的答案不一样?
同一个问题在不同的AI大模型中收到不同答案的原因,主要可以归结为以下几点:
- 训练方式和数据来源的差异:
- 每个AI大模型的训练方式和数据来源都是独特的。有的模型可能更侧重于科技文章,而有的则可能更关注文学创作或新闻报道。这种数据源的多样性直接导致了AI大模型在回答问题时的差异。
- 训练数据的优劣和覆盖面也会影响AI的回答。高质量、全面的数据源能够提供更丰富的信息,从而生成更准确和多样化的回答。
模型设计目标和偏好:
不同的AI大模型有不同的设计目标和偏好。例如,有的模型被优化为提供专业性强的长篇回答,而有的则追求简洁、通俗易懂的回答。这种设计上的差异也会导致AI在回答问题时表现出不同的风格。
算法随机性的引入:
为了避免总是给出相同的回答,有些AI大模型会故意引入一些随机性。这种随机性使得AI在回答问题时能够产生更自然、更不可预测的答案。
AI幻觉现象:
AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。这种现象在大模型中尤为常见,因为大模型在处理复杂问题时可能会依据数据的不同部分进行推理,导致答案的差异。
第2个问题:同一个问题,为什么向同一个AI大模型提问,收到的答案也不一样?
对于同一个问题,向同一个AI大模型提问却收到不同答案的情况,可能由以下原因造成:
- 上下文信息的差异:
- AI在回答问题时,会考虑上下文信息。如果每次提问的上下文环境有所不同(例如,提问前的对话内容、提问时的语境等),AI可能会给出不同的答案。
算法随机性的体现:
如前所述,为了增加答案的多样性和自然性,AI大模型可能会故意引入一些随机性。这种随机性在每次提问时都可能导致答案的差异。
模型更新和算法改进:
随着时间的推移,AI大模型的算法可能会不断更新和改进。这种更新可能会改变AI在处理问题时的逻辑和方式,从而导致答案的差异。
输入指令的微妙差异:
用户在提问时,即使问题本身相同,输入指令的微妙差异(如关键词的选择、语气的不同等)也可能影响AI的回答。
综上所述,AI大模型在回答问题时的差异是由多种因素共同作用的结果。这些因素包括训练方式和数据来源的差异、模型设计目标和偏好的不同、算法随机性的引入以及上下文信息、模型更新和输入指令的差异等。
提示词2:现在,我需要你回答我2个问题, 第1个问题是:为什么同一个图片提示词在不同的AI绘画大模型中,生成的图片不一样呢?第2个问题是:同一个图片提示词,为什么向同一个AI绘画大模型提问,生成的图片也不一样呢?
第1个问题:为什么同一个图片提示词在不同的AI绘画大模型中,生成的图片不一样?
同一个图片提示词在不同的AI绘画大模型中生成的图片不一样,主要归因于以下几个关键因素:
- 模型架构与训练数据:
- 不同的AI绘画大模型可能采用截然不同的神经网络架构,如GANs(生成对抗网络)、VAEs(变分自编码器)等。这些模型通过学习海量的图片数据来掌握绘画技巧,而训练数据的差异会直接影响模型的输出。
- 即使两个模型使用了相似的架构,它们的训练数据也可能有所不同,包括数据的数量、种类、质量等。这些差异会导致模型在理解和生成图片时产生不同的结果。
创造性与多样性:
AI绘画模型在生成图片时,并不仅仅是简单地复制或匹配输入的图片提示词。相反,它们会根据提示词的含义,在内部创意空间中“漫游”,寻找能够匹配描述的最佳表现方式。这种“漫游”过程具有一定的随机性和不确定性,因此即使对于相同的提示词,不同模型也可能生成截然不同的图片。
此外,模型还会尝试捕捉不同人对同一概念的不同解读,从而生成具有多样性的图片。这种多样性是AI绘画吸引人的重要原因之一。
算法规则与参数设置:
不同的AI绘画模型可能采用不同的算法规则和参数设置。这些规则和设置会影响模型在处理输入提示词时的行为和输出。例如,某些模型可能更注重细节和纹理的生成,而另一些模型则可能更注重整体色彩和构图的和谐。
第2个问题:同一个图片提示词,为什么向同一个AI绘画大模型提问,生成的图片也不一样?
对于同一个图片提示词,向同一个AI绘画大模型提问却生成不同的图片,这同样可以归因于多个因素:
- 随机性与多样性:
- 如前所述,AI绘画模型在生成图片时会引入一定程度的随机性。这种随机性是故意设计的,以增加模型的创造性和多样性。因此,即使对于相同的输入提示词,模型在每次生成图片时都可能选择不同的“漫游”路径,从而生成不同的结果。
内部状态与权重变化:
AI绘画模型在生成图片时,其内部状态和权重可能会发生变化。这些变化可能是由于模型在处理前一个输入时留下的“痕迹”或“记忆”,也可能是由于模型在处理新输入时进行的自我调整。这些内部状态的变化会导致模型在生成图片时产生不同的结果。
提示词权重与上下文:
尽管输入的图片提示词是相同的,但模型在处理这些提示词时可能会赋予不同的权重。这种权重的分配可能受到模型内部逻辑、训练数据以及上下文信息的影响。因此,即使对于相同的提示词,模型也可能根据权重的不同而生成不同的图片。
模型更新与迭代:
如果AI绘画模型在两次生成图片之间进行了更新或迭代,那么它可能会采用新的算法规则、参数设置或训练数据。这些变化会导致模型在生成图片时产生不同的结果,即使输入的图片提示词保持不变。
综上所述,同一个图片提示词在不同的AI绘画大模型中生成的图片不一样,主要是由于模型架构、训练数据、创造性与多样性以及算法规则与参数设置的差异所致。而向同一个AI绘画大模型提问却生成不同的图片,则可能是由于随机性与多样性、内部状态与权重变化、提示词权重与上下文以及模型更新与迭代等因素的共同作用。
三、写在最后
如此一来,大家就明白了,要想完成一个质量较高、自己比较满意的AI视频,需要反复优化提示词,反复生成图片,就是需要训练和调参,最终得到满意的图片后,再来生成视频片段,最后剪辑。过程是非常耗时的。
今天就学习到这儿啦。