“弱智吧”成AI训练最佳素材,中科院研究揭示其独特价值
创作时间:
作者:
@小白创作中心
“弱智吧”成AI训练最佳素材,中科院研究揭示其独特价值
引用
虎嗅网
1.
https://m.huxiu.com/article/2963943.html
近日,一篇由中科院牵头的研究论文揭示了一个令人意外的发现:百度贴吧“弱智吧”成为了训练AI中文能力的最佳素材。研究显示,在经过弱智吧内容训练后,AI模型在多个能力测试中表现出色,特别是在34B大模型上成绩优异。这一发现引发了人们对AI训练和中文互联网文化的深入思考。
研究发现:弱智吧训练模型一骑绝尘
几天前,一篇由中科院牵头的论文引起了广泛关注。研究团队精选了多个中文互联网平台的语料库,包括豆瓣、小红书、微博、贴吧、知乎等,用于训练各种AI大模型,以提升它们对中文语境的适应能力。
研究结果显示,在GPT-4的打分下,经过弱智吧训练的模型脱颖而出。具体来看:
- 在6B小模型上,弱智吧训练的模型在开放问答、分类、封闭问答和编程能力上表现突出。
- 而在34B大模型上,弱智吧训练的模型更是遥遥领先,在8项能力测试中全部排名第一,平均分也远超其他平台训练的模型。
AI为何看不懂弱智吧?
研究团队进一步测试了多个主流AI模型(包括ChatGPT-3.5、Gemini、文心一言和Kimi)对弱智吧问题的理解能力。结果显示:
- 国产大模型表现较好,Kimi和文心一言能正确回答8道题,答错和半对各1道。
- 而ChatGPT-3.5和Gemini由于“水土不服”,准确率较低。例如,ChatGPT-3.5错误地认为变形金刚需要购买车险,对“6000元电脑”的问题也给出了离谱的答案。
更有趣的是,当要求这些AI模仿弱智吧的风格创作问题时,它们的表现同样不佳。例如:
- “我晚上想吃烧烤,早餐可以吃吗?”
- “掉在地上的冰淇淋,还能叫冰淇淋吗?”
- “在电梯里放屁被邻居投诉,我是否有权利保持沉默?”
这些模仿虽然在形式上相似,但缺乏弱智吧问题的核心——独特的逻辑思维。
为什么AI难以理解弱智吧?
弱智吧的内容之所以难以被AI理解,主要源于其独特的表达方式:
- 高度抽象:弱智吧的帖子往往高度抽象,充满各种修辞、脑洞和梗,普通人想创作也需要灵感,更别说一板一眼的AI了。
- 独特逻辑:吧友们擅长从日常生活中挖掘漏洞并加以利用,例如“午餐肉能不能晚上吃?”“香菇掉厕所了还能叫香菇吗?”等问题。
- 哲理性思考:弱智吧内不乏富含哲理的帖子,甚至有诗人用最简短的句子创作出令人深思的内容。
- 特殊手法:弱智吧常用“逻辑反推”“谐音双关”“跨服聊天”等手法生成段子,这些都需要人类特有的思维能力。
弱智吧的独特价值
与其他中文互联网平台相比,弱智吧的内容具有独特的价值:
- 可读性低但思考性强:弱智吧的内容往往一句话就能引发深思,需要读者反复琢磨才能理解其中的“梗”。
- 逻辑性强:虽然名为“弱智吧”,但其内容实际上非常讲究逻辑,这也是为什么用其训练的模型在编程能力测试中表现优异的原因。
- 文化特色鲜明:弱智吧的内容体现了独特的中文互联网文化,这种文化特征是AI目前难以完全掌握的。
结语
弱智吧的这一发现不仅揭示了AI训练中的一个有趣现象,也反映了人类思维与AI之间的本质区别。正如一位吧友所说:“编程最讲究逻辑,弱智吧最不缺逻辑。”这种独特的逻辑思维能力,或许正是人类在AI时代保持优势的关键所在。
热门推荐
AI商业化的必备产品思维
CUDA 版本更新对于游戏开发的影响
AMH检测:评估女性生育能力的金标准
维生素D与AMH:提升女性生育能力的新思路
AMH检测:高龄妈妈生育能力的“预警器”
TP-Link路由器安全设置攻略:从基础到进阶
双向奔赴!这是警营里最值得嗑的CP
嘴唇乌黑怎么变红润
嘴唇颜色发乌是什么原因导致的
看诊挂号不蒙圈!心血管内科诊疗范围全解析
心脏神经官能症悄然而至?四大微妙症状,教你如何早期识别!
一年跑不到五千公里,买电车还是油车划算?教你算明白这笔账
换电池要22万!首批新能源车“8年质保”将到期,车主面临换车换电池难题
油焖大虾PK蒜香烤虾,谁才是虾界王者?
枪虾的超级武器:既能发出210分贝巨响,还能产生“虾光”!
新年吃虾,鸿运当头节节高
成都甘露海藏医院:特色诊疗服务揭秘
成都藏医院的神秘疗法揭秘
身体出现6类症状,小心肝炎!远离4个传播途径,做好预防
消炎利胆片怎么吃才最有效?
酒店消费维权指南:如何避免踩坑和有效维权?
罗浮山国药引领消炎利胆片新标准
消炎利胆片饮食禁忌全攻略:这些食物千万不能吃!
维权新姿势:法律渠道 vs 社交网络
消炎利胆片治疗胆囊炎获新突破,临床效果显著提升
金钗石斛:养生界的网红药材
金钗石斛的营养密码:从化学成分到药理作用
金钗石斛:中医界的“不老仙草”
香煎多宝鱼
多宝鱼的烹饪技巧、最佳时间以及美味食谱