智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
微积分基础2-积分篇
秦始皇究竟是谁的儿子?看王立群教授如何解答
李卫结局与雍正皇帝深厚情谊探析
李卫结局与雍正皇帝深厚情谊探析
什么是风格定位?如何进行有效的风格定位?
研究提出胺法碳捕集溶剂的催化再生新路径
北魏为什么信奉佛教?原因是什么?
如何阻止某人监视我的手机 [完整指南]
少年心事“剧”透!成长的故事,用校园心理剧说说
工作站怎么选?——全面解析与选购指南
揭秘温馨原木风:从材质选择到灯光设计的详细装修指南
全面质量管理的主要工具和方法有哪些?
GH4169高温合金力学性能和化学成分分析
X86架构寄存器介绍
受蒙古国沙尘暴传输影响,四川广元出现重度污染
二维码印刷最小尺寸:避免常见错误,提升识别效率
苏州新建机场瞄准低空经济 | 城市观察家
橱柜台面哪种材质最好?6种台面材质全面对比,四种方案推荐给你
如何利用自动化优化业务工作流程
如何选择最适合你的国际漫游数据方案?详解四大关键因素
智慧养殖管理系统的7大智能化应用,提升养殖场的运营效益
在Windows 11中更改文件扩展名的4种方法
除权的原理是什么?除权现象在哪些情况下会出现?
如何选择高质量防盗门 保障家庭安全
独显直连怎么设置?BIOS中开启独显直连的方法详解
在金融领域如何实现稳健收益?这种稳健收益的实现方式有哪些局限性?
今天起,洗头请务必调整一下!
草莓:春日的甜蜜使者,自然的馈赠
超市的面积分类标准是什么?
电器一级能效和三级能效的区别:行内人解析,看这篇就够了