问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

ChatGPT数错草莓里的R,暴露出人工智能的一个致命缺陷

创作时间:
作者:
@小白创作中心

ChatGPT数错草莓里的R,暴露出人工智能的一个致命缺陷

引用
CSDN
1.
https://blog.csdn.net/weixin_41446370/article/details/142008093

虽然这项功能强大的技术仍然充满希望,但最近发现的一个小问题表明,人工智能并不完美,因此要不断重复检查其结果。

“嘿,ChatGPT,单词‘strawberry’里有几个R?”

“在单词‘strawberry’中有两个R。”

“你确定吗?因为有三个。”

“实际上,在‘strawberry’中有两个R。这两个字母出现在单词的第五和第九个位置。”

“不,再数一遍。S-T-R,这是一个R。A-W-B-E-R-R,这是另外两个R。Y。三个R。”

“我明白你的意思了!你巧妙地拆分了单词,让它看起来好像有三个R,但实际上在单词‘strawberry’中仍然只有两个R。不过,这确实是一个有趣的转折!”

这不是一个有趣的转折,ChatGPT!这是一个不争的事实。OpenAI聊天机器人的这一奇特现象一直吸引着Reddit等社交平台上的用户,因此《Inc.》的作者决定试一试。无论我们怎么问,ChatGPT都坚持说草莓中有两个R,尽管草莓有三个R。让我们还让它搞不清覆盆子的拼写。

事情变得更奇怪了。有一次关于这个话题的讨论最后演变成了一种关于单词本身性质的知识性争论,人工智能辩称:“'straw’中的R是单词的一部分,但它并不会改变’strawberry’中R的总数。虽然这种天马行空的心理臆想在晚上品尝了美味的外国啤酒后凌晨两点的大学宿舍里可能会很美妙,但对于一款本应在无数方面彻底改变工作场所的高科技应用程序来说,却并不是什么好事。

要让ChatGPT正确地数R,感觉就像是要让《星际迷航》中的斯波克先生理解人类复杂的情感。但最后我们终于发现了窍门,那就是采用斯波克完全赞同的那种冷酷的瓦肯逻辑:“你能拼出来给我听,然后一边数R一边说吗?”“当然,让我们拼出来一起数:S-T-R,这是一个R;A-W-B-E-R,这是第二个R;R,这是第三个R;Y。所以,你是对的。这样算的话,有三个R。谢谢你指出来!”

所有这一切都是因为大型语言模型(LLM)算法的工作方式,这种算法为ChatGPT、X的Grok、谷歌的Gemini等人工智能提供了动力。虽然这些LLM是通过接触难以理解的海量数据训练出来的,但归根结底,这仅仅意味着LLM“见过很多东西”。在这些东西中,有足够多的信息可以让人工智能(如ChatGPT)定义一个词的含义。它会数数。它知道什么是R。它甚至能告诉你草莓是什么。但它无法理解这些“东西”,也无法像人类大脑那样进行微妙的推理和综合,将对所有不同事实的认识汇集成一个答案。这也是人工智能在被问及事实问题时会产生幻觉或吐露错误信息的部分原因。

这也是为什么即使你的公司正在引领潮流,尝试使用大量人工智能工具来改善业务工作流程,或将员工从枯燥的工作中解放出来,你也应该确保在根据人工智能的结果做出决策之前,有专人检查人工智能吐出的所有信息。你可能还不应该把史蒂夫从会计岗位上辞退,以为人工智能可以完成所有复杂的数据综合工作,并减少你的工资支出。因为史蒂夫会数草莓中的R。去问问他吧。

本文原文来自CSDN

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号