智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
孕妇吃红枣的好处
什么是急性白血病
租车协议的重要性及如何合法签订车辆租赁合同
游戏外挂存在风险,保护账号安全刻不容缓
现实主义作家福楼拜及其学生莫泊桑
16周岁能独立办理电话卡吗?完整指南
GEE:分块处理以降低内存压力
为什么看电影时要吃爆米花?这理由也是让人服气的……
每天喝杯咖啡确实对你的健康有益的所有原因
信号灯:光通信中的摩尔斯发射器
过电压是什么意思?过电压的类型有哪些?
《无畏契约》新手必看:准星设置完全指南
临时工辞职工资是立马结算吗
火的文化象征意义
基于决策树的集成模型——随机森林方法介绍
电源纹波:概念、测量与抑制方法详解
什么是美尼尔病?症状、原因及治疗全解析
揭秘"pl"的真正含义!
常用的三种脱毛方式优劣对比怎么样?
一文解读数据中台附搭建指南
惊蛰食梨,润肺正当时
2025年潮汕地区旅游攻略:必去景点、热门美食、酒店、交通路线(更新于3月)
如何进行资产分析的初步数据收集?
别被“功能”迷了眼 理性选择“梦中情枕”
中国各地白酒饮酒习俗大盘点:从河南鱼头酒到山西竹节杯
二手车价格评估的基本方法和前提条件,分享二手车价格估值的方法
吃鸡蛋算不算杀生?圣严法师开示佛教徒饮食疑惑
江苏首座AI智慧调控光储充换一体化站投运,光伏消纳率提升至99.7%
被害妄想症的治疗
减肥期间应选择什么食物以保持排便正常