智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
笔记本屏幕不亮了怎么办?这份自救指南请收好
灵芝破壁孢子的功效作用与禁忌:避坑指南,哪些人群不适合使用
所有人注意:慎买带有QS标志产品!过时标识背后的食品安全隐忧
诸葛亮为何不早出山,而是死等三顾茅庐的刘备?
结核病预防性治疗,正在“突围”路上
【中国科学报】卢煜明院士:无创产检技术的“中国方案”引领世界
灰分含量对产品质量影响
现代人大脑为何比祖先大很多
河西走廊:春季旅游“热起来”
热力学第二定律在现代科技中的应用
什么是数字化工厂
温州新能源汽车上牌量连续多月超过燃油车
当生物标本被AI"复活" "数字世界"如何助力生物多样性保护?
猫咪腹膜炎,治疗关键早!
茉莉花的养殖技巧和注意事项
Nature|首次“看清”肌营养不良症核心蛋白!为基因治疗肌营养不良症提供新线索
经典再现 | 第一掌骨骨折综述及处理技巧
《美丽新世界》读后感:当人成为机器的零件
项羽为何被评为千古无二?他创造的3个世界第一,至今依旧无敌手
海明码的基本原理
五笔打字的艺术:解码码表结构与设计的科学
南工大两位同学的减重故事:一个减21斤,一个减52斤
面试结束后,致谢的方式与话术
从“死亡之海”到“诗和远方”——腾格里沙漠“不惑”之变
如何在考试季为孩子提供支持?辅导员的建议
三角有理式积分详解
体育励志人物作文素材
构建我国现代医学教育体系
如何安全有效地更换汽车电瓶?详细步骤与注意事项解析
安卓手机怎样改IP地址:详细指南与注意事项