问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

“弱智吧”成AI训练最佳素材,中科院研究揭示其独特价值

创作时间:
作者:
@小白创作中心

“弱智吧”成AI训练最佳素材,中科院研究揭示其独特价值

引用
虎嗅网
1.
https://m.huxiu.com/article/2963943.html

近日,一篇由中科院牵头的研究论文揭示了一个令人意外的发现:百度贴吧“弱智吧”成为了训练AI中文能力的最佳素材。研究显示,在经过弱智吧内容训练后,AI模型在多个能力测试中表现出色,特别是在34B大模型上成绩优异。这一发现引发了人们对AI训练和中文互联网文化的深入思考。

研究发现:弱智吧训练模型一骑绝尘

几天前,一篇由中科院牵头的论文引起了广泛关注。研究团队精选了多个中文互联网平台的语料库,包括豆瓣、小红书、微博、贴吧、知乎等,用于训练各种AI大模型,以提升它们对中文语境的适应能力。

研究结果显示,在GPT-4的打分下,经过弱智吧训练的模型脱颖而出。具体来看:

  • 在6B小模型上,弱智吧训练的模型在开放问答、分类、封闭问答和编程能力上表现突出。
  • 而在34B大模型上,弱智吧训练的模型更是遥遥领先,在8项能力测试中全部排名第一,平均分也远超其他平台训练的模型。

AI为何看不懂弱智吧?

研究团队进一步测试了多个主流AI模型(包括ChatGPT-3.5、Gemini、文心一言和Kimi)对弱智吧问题的理解能力。结果显示:

  • 国产大模型表现较好,Kimi和文心一言能正确回答8道题,答错和半对各1道。
  • 而ChatGPT-3.5和Gemini由于“水土不服”,准确率较低。例如,ChatGPT-3.5错误地认为变形金刚需要购买车险,对“6000元电脑”的问题也给出了离谱的答案。

更有趣的是,当要求这些AI模仿弱智吧的风格创作问题时,它们的表现同样不佳。例如:

  • “我晚上想吃烧烤,早餐可以吃吗?”
  • “掉在地上的冰淇淋,还能叫冰淇淋吗?”
  • “在电梯里放屁被邻居投诉,我是否有权利保持沉默?”

这些模仿虽然在形式上相似,但缺乏弱智吧问题的核心——独特的逻辑思维。

为什么AI难以理解弱智吧?

弱智吧的内容之所以难以被AI理解,主要源于其独特的表达方式:

  • 高度抽象:弱智吧的帖子往往高度抽象,充满各种修辞、脑洞和梗,普通人想创作也需要灵感,更别说一板一眼的AI了。
  • 独特逻辑:吧友们擅长从日常生活中挖掘漏洞并加以利用,例如“午餐肉能不能晚上吃?”“香菇掉厕所了还能叫香菇吗?”等问题。
  • 哲理性思考:弱智吧内不乏富含哲理的帖子,甚至有诗人用最简短的句子创作出令人深思的内容。
  • 特殊手法:弱智吧常用“逻辑反推”“谐音双关”“跨服聊天”等手法生成段子,这些都需要人类特有的思维能力。

弱智吧的独特价值

与其他中文互联网平台相比,弱智吧的内容具有独特的价值:

  • 可读性低但思考性强:弱智吧的内容往往一句话就能引发深思,需要读者反复琢磨才能理解其中的“梗”。
  • 逻辑性强:虽然名为“弱智吧”,但其内容实际上非常讲究逻辑,这也是为什么用其训练的模型在编程能力测试中表现优异的原因。
  • 文化特色鲜明:弱智吧的内容体现了独特的中文互联网文化,这种文化特征是AI目前难以完全掌握的。

结语

弱智吧的这一发现不仅揭示了AI训练中的一个有趣现象,也反映了人类思维与AI之间的本质区别。正如一位吧友所说:“编程最讲究逻辑,弱智吧最不缺逻辑。”这种独特的逻辑思维能力,或许正是人类在AI时代保持优势的关键所在。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号