“弱智吧”成AI训练最佳素材,中科院研究揭示其独特价值
创作时间:
作者:
@小白创作中心
“弱智吧”成AI训练最佳素材,中科院研究揭示其独特价值
引用
虎嗅网
1.
https://m.huxiu.com/article/2963943.html
近日,一篇由中科院牵头的研究论文揭示了一个令人意外的发现:百度贴吧“弱智吧”成为了训练AI中文能力的最佳素材。研究显示,在经过弱智吧内容训练后,AI模型在多个能力测试中表现出色,特别是在34B大模型上成绩优异。这一发现引发了人们对AI训练和中文互联网文化的深入思考。
研究发现:弱智吧训练模型一骑绝尘
几天前,一篇由中科院牵头的论文引起了广泛关注。研究团队精选了多个中文互联网平台的语料库,包括豆瓣、小红书、微博、贴吧、知乎等,用于训练各种AI大模型,以提升它们对中文语境的适应能力。
研究结果显示,在GPT-4的打分下,经过弱智吧训练的模型脱颖而出。具体来看:
- 在6B小模型上,弱智吧训练的模型在开放问答、分类、封闭问答和编程能力上表现突出。
- 而在34B大模型上,弱智吧训练的模型更是遥遥领先,在8项能力测试中全部排名第一,平均分也远超其他平台训练的模型。
AI为何看不懂弱智吧?
研究团队进一步测试了多个主流AI模型(包括ChatGPT-3.5、Gemini、文心一言和Kimi)对弱智吧问题的理解能力。结果显示:
- 国产大模型表现较好,Kimi和文心一言能正确回答8道题,答错和半对各1道。
- 而ChatGPT-3.5和Gemini由于“水土不服”,准确率较低。例如,ChatGPT-3.5错误地认为变形金刚需要购买车险,对“6000元电脑”的问题也给出了离谱的答案。
更有趣的是,当要求这些AI模仿弱智吧的风格创作问题时,它们的表现同样不佳。例如:
- “我晚上想吃烧烤,早餐可以吃吗?”
- “掉在地上的冰淇淋,还能叫冰淇淋吗?”
- “在电梯里放屁被邻居投诉,我是否有权利保持沉默?”
这些模仿虽然在形式上相似,但缺乏弱智吧问题的核心——独特的逻辑思维。
为什么AI难以理解弱智吧?
弱智吧的内容之所以难以被AI理解,主要源于其独特的表达方式:
- 高度抽象:弱智吧的帖子往往高度抽象,充满各种修辞、脑洞和梗,普通人想创作也需要灵感,更别说一板一眼的AI了。
- 独特逻辑:吧友们擅长从日常生活中挖掘漏洞并加以利用,例如“午餐肉能不能晚上吃?”“香菇掉厕所了还能叫香菇吗?”等问题。
- 哲理性思考:弱智吧内不乏富含哲理的帖子,甚至有诗人用最简短的句子创作出令人深思的内容。
- 特殊手法:弱智吧常用“逻辑反推”“谐音双关”“跨服聊天”等手法生成段子,这些都需要人类特有的思维能力。
弱智吧的独特价值
与其他中文互联网平台相比,弱智吧的内容具有独特的价值:
- 可读性低但思考性强:弱智吧的内容往往一句话就能引发深思,需要读者反复琢磨才能理解其中的“梗”。
- 逻辑性强:虽然名为“弱智吧”,但其内容实际上非常讲究逻辑,这也是为什么用其训练的模型在编程能力测试中表现优异的原因。
- 文化特色鲜明:弱智吧的内容体现了独特的中文互联网文化,这种文化特征是AI目前难以完全掌握的。
结语
弱智吧的这一发现不仅揭示了AI训练中的一个有趣现象,也反映了人类思维与AI之间的本质区别。正如一位吧友所说:“编程最讲究逻辑,弱智吧最不缺逻辑。”这种独特的逻辑思维能力,或许正是人类在AI时代保持优势的关键所在。
热门推荐
"全棉"和"纯棉"的区别与选购指南
五积散不宜人群指南:安全用药,规避风险
如何选择适合初学者的docker容器技术书
上山容易下山难 且行且珍“膝”
厨房卫生间在西北角不好吗?风水布局解析与优化建议
医生推荐:5种运动训练方法缓解颈椎不适
喝好酒不上头,具体是什么原因?
日本签证有哪些种类,有什么申请流程?
5pp塑料可以用微波炉加热吗?使用注意事项全解析
如何通过法律手段查询酒店消费记录
百年村寨 美丽丙午——瑞丽傣族传统文化的“活态博物馆”
深度|爷爷奶奶戴上“老天才” 智能产品适老化成趋势
如何在Web查期刊影响因子
2024兰州大学国际本科项目详解:优势、招生条件及申请流程
银装素裹,诗情画意:探寻雪景诗词的魅力
诗词里的九种雪景:从苍茫到磅礴,尽显冬日之美
古代一两黄金的购买力与持久性探析
癌症晚期吃"狗药",3个月后肿瘤消失?"狗药"究竟是药是毒?
莲雾怎么吃正确方法,解锁莲雾美味密码,从挑选到享用的正确姿势
17世纪法国王室与司法系统:以黎塞留时期为例,产生哪些影响?
B超辐射的危害有多大?
春夜星空下的春天趣事
女朋友肚子疼怎么办?多种原因及应对方法全解析
九寨沟:或许真有它的神奇之处
手工凉粉制作全攻略:从选材到食用的完整指南
生花生的健康价值(解读花生的功效与作用)
小娃娃大高个挂儿科还是成人科?
北大版《红楼梦》,邀你观看!
打假人举报指南:应对假冒伪劣商品的策略与方法
防范传销陷阱,提高识假能力