智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
如何制作高质量的CRM PPT:从目标设定到案例分析
什么是精益设备管理
当代年轻人的不婚不育:自由与责任的权衡
提前离职扣几个月工资?三天旷工自动离职后果详解
香樟树6月份能栽活吗?夏季种植全攻略
“零添加”被误读,背后是健康观的单一化
管理项目投资方案怎么写
探索“翼”字的读音及其深刻象征意义与文化内涵
盆栽薄荷的养殖方法 怎样养长得好
法律解释原则是什么
针灸能减肥穴位(针灸减肥效果好吗)
一张书单带你走近“三国”
巴拿马运河自由通行:全球贸易新动脉
轻松游江西南昌三天两夜行程规划与实用景点攻略
电脑椅坏了怎么修理?使用年限是多久?
天天喝啤酒对身体有什么影响
哪些凭证才算合法有效的凭证
中国驻刚果(布)大使李岩逝世:从“工地大使”到外交丰碑,她用汗水浇筑中非友谊
同样是摔跤,学问大不同
地中海贫血症遗传吗?
如何选择符合国际标准的铝型材
香氛生活提案:打造你的居家香氛天堂!从扩香道具挑选到使用方法,一次搞懂!
如何调用应用程序的API接口
普洱茶生熟拼配配方:探秘独特风味与比例搭配秘诀
关节痛,可能是什么原因导致的?医生:可太多了……
关节炎怎样锻炼减少疼痛
最好的加密方式就是公开?为什么现代密码学这么奇怪?
特朗普和马斯克的奇特互动:一个反电车,一个卖电车
了解普通发票的种类及使用方法,轻松掌握财务管理技巧
氮化硅陶瓷抛光头耐蚀性能及应用