智谱VS OPENAI 文生图模型对比测试
创作时间:
作者:
@小白创作中心
智谱VS OPENAI 文生图模型对比测试
引用
CSDN
1.
https://m.blog.csdn.net/2401_85549225/article/details/139507777
在AI文生图领域,智谱的CogView3和OpenAI的DALLE3是两个备受关注的模型。近日,一场对比测试展示了这两个模型在生成图像方面的表现。测试结果显示,CogView3在细节处理上略显不足,但其对文案逻辑的理解能力已经相当出色,且成本更低。
在今天的测试中,我们对比了智谱的CogView3和OpenAI的DALLE3两个文生图模型。智谱CogView3模型已达到DALLE3性能的90%,并且进行了价格调整,使其成为市场上成本最低的文生图解决方案。
我们首先使用文生文模型创作了一个三页绘本的文案,并设置了记忆缓存为0,确保模型仅基于当前输入生成图像。
第一个画面
在一个充满科技奇迹的赛博世界中,高楼大厦如同摩天轮般旋转,五彩斑斓的霓虹灯在夜空中闪烁。在这座城市的角落,住着一只名叫小智的聪明小猫。小智有着一双好奇的大眼睛和灵活的尾巴,它的家中摆满了各种电子设备和书籍。
第二个画面
小智穿上了特制的电子装备,背上了一个装满学习资料的小背包,开始了它的冒险。赛博森林里充满了奇异的生物,有些是机器小动物,有些是半机械化的植物。在这里,小智遇到了一只名叫小兔的机器人兔子,它正在为一道复杂的编程题目苦恼。
第三个画面
在赛博森林的深处,小智和小兔发现了一个巨大的迷宫,迷宫的入口是一道复杂的数学题。小智利用它所学到的知识,轻松地解开了数学题,迷宫的大门缓缓打开。
通过对比生成的图像,我们发现DALLE3在画面整体感上表现更佳,而CogView3虽然在细节上略显不足,但其对文案逻辑的理解能力已经相当出色。
与SD和MJ等模型相比,CogView3和DALLE3更擅长处理自然语言描述,能够更好地将故事转化为图像。这表明,随着技术的进步,AI在文生图领域的应用将越来越广泛,为用户提供更多可能性。
热门推荐
鸡爪槭的栽培技术
刮毛刀能带上飞机吗?航空安检规定解读
郡王与亲王:等级之差
明朝亲王与郡王的区别解析
红伞加持,婚礼仪式感满分!
秋冬打卡惠水:红石滩&好花红乡村游
房车安全驾驶全攻略:从驾驶技巧到事故预防
雅安茶文化:从千年古茶到国际名片
雅安:山水诗画中的诗意栖居
重庆市4A级风景区介绍
笔记本电脑黑屏时强制重启应按哪些键
哈佛医学院教你科学减肥:睡眠、饮食和运动的完美平衡
间歇性断食+有氧运动,助你快速瘦身!
低碳饮食:短期减重利器还是健康隐患?
一起健身打卡,帮女友燃脂又减压!
探索云南高原之旅:识别与应对高原反应的区域指南
汽车长途自驾游需要注意什么
赵本山全球巡演来袭!网友:终于等到你
天然气价格改革:阶梯气价如何影响你我?
电动汽车崛起:能源市场的新变局
《蛟龙行动》排片遇冷背后:影院公平排片大讨论
《蛟龙行动》遭遇排片危机,横店献策能否破解中国电影困局?
如何预防静脉曲张
虞书欣新作《永夜星河》定档引爆期待!
释迦的营养价值与食用指南
元江房车旅行:冬日里的“小三亚”,26℃的温暖之旅
冬季元江房车营地自驾游攻略
福州新房价格持续下滑,已连续十五个月下跌!
秋冬流感高发季:如何快速识别并预防?
文旅+融合如何玩出新花样?广州南沙妈祖文化的“焕新密码”