智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
【病例分享】警报拉响!心肌梗死后的生死较量
家里有老人小孩的可一定要做好这8个设计,关键时能救命
轮胎的关键数字一次看懂
高铁座位号ABCDF分布图,多种分布方式(选A座位置最佳)
清明祭祖,仅需5步核心流程
孩子沉迷手机怎么办?这样做比没收更有效!
打架斗殴调解的是怎么样的?
春醒山河!清明假期踏青赏春地图出炉 解锁你的绝佳出游地
肇庆七星岩游玩全攻略,含入口选择、交通指南、一日游路线
地毯怎么选?地毯材质最建议买哪种?
肝在左边还是右边:深入解析人体肝脏的位置与功能
顺治、康熙、雍正:清朝12位皇帝的年号有什么含义?
“全球500强”高校名单出炉:深圳2所高校入选,南方科技大学排名254
农历生日的命格与出生日期有何关联
宋神宗是董事长,王安石是总经理
走过水陆盘门 寻找苏州文化之根
中国食鸭地图,没一只鸭能逃离餐桌
数字化时代信息管理的五大策略
如何通过正面提示词提升个人魅力和影响力?
李嘉诚的企业经营哲学:成功之道与创新精神
功放机开机正常但无声音是什么原因
唐宋婚姻有何特征?社会背景是重要影响因素
如何处理离职后的户口迁移问题?这种迁移过程有哪些注意事项?
黑色素瘤前期症状全解析:及早发现是关键
烟花三月下扬州:天宁寺古玩市场里的文化盛宴
财务小白必存!会计分录入门指南
探索唐宋时期婚姻的变化,制度和观念都是当时社会发展的缩影
城建向“新”力,南京织密公共出行“幸福网”
短视频营销策略分析:如何让你的短视频内容更具吸引力与传播力?
深入理解大语言模型微调技术