智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
解密旋转奥秘:一文带你理解力矩公式及应用
地铁5号线、越城天地、中冶和记洋行……南京城建,大提速!
历史上的扶苏:仁德与悲剧并存的公子
无罪辩护的法律援助与保障措施
探秘T4的科学世界与应用前景
在楚雄悠然古镇里,邂逅一场慢时光!
文化中国行 | 灯塔文化:理性与浪漫,星辰与大海
员工怎样申请劳动仲裁赔偿金
央行提示“租售比”投资价值,房地产市场投资逻辑生变
离职后公司依旧为员工缴纳社保,员工应该返还吗?
电子信息工程专业学习路线的制定与实践
高铁司机月薪是多少?为什么每天才工作4小时?看完想当司机吗?
清朝科举制度:选拔士人的古代途径
盗墓贼挖出“天书”,记载了上古89位帝王,考古家:史记诸多疏漏
js如何判断是否微信关注公众号
行驶证照片的拍摄方法是什么?
一直以为是晕车,实际却是“中毒”!长途回家路上的你中招了吗?
中超第4轮前瞻:青岛海牛vs大连英博,一场遭遇之战
TCP与UDP连接策略:持续连接中的网络层决斗,优势全解析
甲午战争背后的晚清变局
关于巴塞罗那对阵马德里竞技,你所需要知道的一切
项目管理中如何对数据进行调整
存算一体技术与大模型
如何在全球市场中寻找投资机会?这些机会如何识别和把握?
适合投资哪些行业领域?这些行业领域的发展潜力如何?
六大行再次全面下调存款利率 此轮存款降息已持续近两年
香港去佛山最全交通指南:5种方式任你选
拆解储能电芯性能指标:电阻篇
DeepSeek预测《哪吒2》最终票房能否突破200亿?
10条可视化设计法则,3分钟教你设计出好的可视化作品