资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

“弱智吧”成AI训练最佳素材，中科院研究揭示其独特价值

创作时间:

作者:

@小白创作中心

“弱智吧”成AI训练最佳素材，中科院研究揭示其独特价值

引用

虎嗅网

https://m.huxiu.com/article/2963943.html

近日，一篇由中科院牵头的研究论文揭示了一个令人意外的发现：百度贴吧“弱智吧”成为了训练AI中文能力的最佳素材。研究显示，在经过弱智吧内容训练后，AI模型在多个能力测试中表现出色，特别是在34B大模型上成绩优异。这一发现引发了人们对AI训练和中文互联网文化的深入思考。

研究发现：弱智吧训练模型一骑绝尘

几天前，一篇由中科院牵头的论文引起了广泛关注。研究团队精选了多个中文互联网平台的语料库，包括豆瓣、小红书、微博、贴吧、知乎等，用于训练各种AI大模型，以提升它们对中文语境的适应能力。

研究结果显示，在GPT-4的打分下，经过弱智吧训练的模型脱颖而出。具体来看：

在6B小模型上，弱智吧训练的模型在开放问答、分类、封闭问答和编程能力上表现突出。
而在34B大模型上，弱智吧训练的模型更是遥遥领先，在8项能力测试中全部排名第一，平均分也远超其他平台训练的模型。

AI为何看不懂弱智吧？

研究团队进一步测试了多个主流AI模型（包括ChatGPT-3.5、Gemini、文心一言和Kimi）对弱智吧问题的理解能力。结果显示：

国产大模型表现较好，Kimi和文心一言能正确回答8道题，答错和半对各1道。
而ChatGPT-3.5和Gemini由于“水土不服”，准确率较低。例如，ChatGPT-3.5错误地认为变形金刚需要购买车险，对“6000元电脑”的问题也给出了离谱的答案。

更有趣的是，当要求这些AI模仿弱智吧的风格创作问题时，它们的表现同样不佳。例如：

“我晚上想吃烧烤，早餐可以吃吗？”
“掉在地上的冰淇淋，还能叫冰淇淋吗？”
“在电梯里放屁被邻居投诉，我是否有权利保持沉默？”

这些模仿虽然在形式上相似，但缺乏弱智吧问题的核心——独特的逻辑思维。

为什么AI难以理解弱智吧？

弱智吧的内容之所以难以被AI理解，主要源于其独特的表达方式：

高度抽象：弱智吧的帖子往往高度抽象，充满各种修辞、脑洞和梗，普通人想创作也需要灵感，更别说一板一眼的AI了。
独特逻辑：吧友们擅长从日常生活中挖掘漏洞并加以利用，例如“午餐肉能不能晚上吃？”“香菇掉厕所了还能叫香菇吗？”等问题。
哲理性思考：弱智吧内不乏富含哲理的帖子，甚至有诗人用最简短的句子创作出令人深思的内容。
特殊手法：弱智吧常用“逻辑反推”“谐音双关”“跨服聊天”等手法生成段子，这些都需要人类特有的思维能力。

弱智吧的独特价值

与其他中文互联网平台相比，弱智吧的内容具有独特的价值：

可读性低但思考性强：弱智吧的内容往往一句话就能引发深思，需要读者反复琢磨才能理解其中的“梗”。
逻辑性强：虽然名为“弱智吧”，但其内容实际上非常讲究逻辑，这也是为什么用其训练的模型在编程能力测试中表现优异的原因。
文化特色鲜明：弱智吧的内容体现了独特的中文互联网文化，这种文化特征是AI目前难以完全掌握的。

结语

弱智吧的这一发现不仅揭示了AI训练中的一个有趣现象，也反映了人类思维与AI之间的本质区别。正如一位吧友所说：“编程最讲究逻辑，弱智吧最不缺逻辑。”这种独特的逻辑思维能力，或许正是人类在AI时代保持优势的关键所在。

热门推荐

AI商业化的必备产品思维

CUDA 版本更新对于游戏开发的影响

AMH检测：评估女性生育能力的金标准

维生素D与AMH：提升女性生育能力的新思路

AMH检测：高龄妈妈生育能力的“预警器”

TP-Link路由器安全设置攻略：从基础到进阶

心脏神经官能症悄然而至？四大微妙症状，教你如何早期识别！

一年跑不到五千公里，买电车还是油车划算？教你算明白这笔账

换电池要22万！首批新能源车“8年质保”将到期，车主面临换车换电池难题

油焖大虾PK蒜香烤虾，谁才是虾界王者？

枪虾的超级武器：既能发出210分贝巨响，还能产生“虾光”！

新年吃虾，鸿运当头节节高

成都甘露海藏医院：特色诊疗服务揭秘

成都藏医院的神秘疗法揭秘

身体出现6类症状，小心肝炎！远离4个传播途径，做好预防

消炎利胆片怎么吃才最有效？

酒店消费维权指南：如何避免踩坑和有效维权？

罗浮山国药引领消炎利胆片新标准

消炎利胆片饮食禁忌全攻略：这些食物千万不能吃！

维权新姿势：法律渠道 vs 社交网络

消炎利胆片治疗胆囊炎获新突破，临床效果显著提升