智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
科举制度:各民族交往交流交融历史的典型例证
测金属成分的仪器叫什么?详解各类检测设备
喉咙痛喝金银花有效果吗?一文详解金银花的使用方法和注意事项
蝴蝶波尔精神,张继科alc,viscaria三款经典底板分析
红眼病(结膜炎)
糖尿病酮症酸中毒诊断与急救规范
西红柿鸡蛋面
带有雪花标志的服饰属于哪个品牌?
如何正确使用空调,拥有“清凉一夏”?
别问!问就是缺钙!如何科学的判定儿童是否缺钙?又该如何补?
上大学前,最最最适合自学的高分数学经典教材书单,0基础入门狂喜!
滤棉虽然干湿分离,不也产生各种毒素吗,和在鱼缸里有什么区别?
如何快速提升《巫师3》中白狼的战斗力?掌握这五个核心技巧!
家用监控摄像头安装指南(轻松设置和配置你的家庭监控系统)
葡萄籽的功效与作用、禁忌和食用方法
中考初三数学所有公式大全汇总
Steam新增私密游戏功能:指定游戏仅自己可见
打球膝盖疼痛怎么缓解
急性肺栓塞治疗新进展:机械血栓切除术 vs 导管定向溶栓
正月不理发的习俗从何而来 背后的文化意义
约会吃饭吃什么比较好?这些美食选择让你秒变约会达人!
喝水多,为啥还觉得口干?得了肾结石,要多喝水?
加强罪犯法纪教育,提升改造效果
康熙命施琅平定台湾,是他一生中最英明的一个决定
油条蓬松秘诀:完美发酵技巧全解析
以上帝的名义发动的战争——十字军东征
短视频拍摄价目表大概是多少钱?费用怎么计算
黄金期现价差异常扩大,空头或遭“绞杀”
初识pip:什么是pip以及为什么要使用它
来腾冲吃春,体验有一种叫云南的生活