智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
如何找到低估值股票?这些股票对投资决策有何帮助?
蛇床子的功效与作用
Long Black与美式咖啡的区别:从历史渊源到制作工艺
范仲淹《岳阳楼记》知识点归纳
心脏支架后吃什么药
如何正确使用银行卡?避免银行卡被冻结?
美国高中排名规则 到底哪个更靠谱
散瞳后检查出的远视度数准确吗
美国各地区气候与生活环境
园子温导演的电影世界:爱与性的深度探索与社会反思
变形通用机器人? IJRR顶刊深度解析模块化自重构机器人前世今生
怎么保持口腔健康
关于减刑,你想了解的真相都在这里
香港警队推出"领养警犬计划",让退役警犬安享晚年
加一笔变新字:20个汉字的奇妙变化
珠海医生科普:冬季烫伤高发,科学“冷”处理是关键
租客如何有效收集与整理租赁关系中的关键证据
素描工具这么多,在使用上都有什么讲究呢?
难治的玫瑰痤疮,该怎么治疗?
老人出虚汗是什么征兆吗
牙齿凹槽上的黑色是蛀牙吗?教你正确判断和应对方法
精密设备捆包打包运输指南
宠物洗澡水温宜控制在37-40度
通达信神奇九转指标原理及公式,无未来函数,数字不消失|k线|数列
正畸蜡怎么用
匈奴使答曰:魏王雅望非常,然床头捉刀人,此乃英雄也。
成语“请人捉刀”出自哪里?其中又有哪些历史典故呢?
巴沙鱼是什么鱼?4步告诉你答案_清晰图解
陈靖会长会见新加坡IHH百汇医疗集团首席执行官奈尔·平柯
宽基指数基金×个人养老金账户:选基策略与布局指南