智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
T恤搭配指南:打造个性时尚的穿搭方案
《有歌2024》:音乐媒介中的梦想叙事与时代脉动
如何化解卫生间位于北方和东北方带来的不利
ENFP情绪失控的10大迹象及应对方法
农村建房风水布局:杨明德大师的实用心得
冬季洗衣机使用的问题及解决方法(如何应对冬天洗衣机太冷的问题)
盘锦市十大旅游景点
中国佛教五大名山———奉化雪窦山
银发营销 – 面向老年人的营销方法
为什么要使用gamma校正?
多吃芒果好不好呢?芒果介绍及选购指南
狗狗做错事时如何正确惩罚
轻松上手,相机参数调整全攻略!
愉悦与心理健康:积极情绪对个体的影响
玻璃表面缺陷检测:技术进展与未来趋势
辛丑条约的内容及影响
【网络安全】对称加密、非对称加密以及密钥分配
从“习得性无助”到“成长型思维”:突破困境,拥抱成长
提升面包美味度:鲁邦种的魔法
逃离办公室内耗,年轻人为何选择轻体力活
五台山:中国四大佛教名山之首,山顶是冬天,山底却是春天!
远程医疗技术对农村医疗资源的优化配置研究-详解洞察
烧一样重的水,使用电和天然气哪种方式更划算?详细分析解决困扰
项目里程碑的负责人与达成日期设定:实践指南
糖尿病患者必知:眼健康管理全攻略
生存分析之基本概念
东莞刷新制造,首提“制造美学”概念
牙缝刷使用指南:清洁牙缝的正确方法
当代社会中年轻人面临的职业压力与挑战分析
掌握六大茶的科学冲泡法及最佳饮用时机,提升品茗体验