问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

ChatGPT通过图灵测试:人工智能的里程碑还是幻象?

创作时间:
作者:
@小白创作中心

ChatGPT通过图灵测试:人工智能的里程碑还是幻象?

引用
CSDN
15
来源
1.
https://blog.csdn.net/m0_64979660/article/details/144246102
2.
https://blog.csdn.net/wwq982949/article/details/139465141
3.
https://www.sohu.com/a/787667855_121124334
4.
http://chinawto.mofcom.gov.cn/article/jsbl/zszc/202403/20240303487257.shtml
5.
https://cloud.baidu.com/article/3218399
6.
https://www.thepaper.cn/newsDetail_forward_28430060
7.
https://zh.wikipedia.org/wiki/%E5%9B%BE%E7%81%B5%E6%B5%8B%E8%AF%95
8.
https://www.7its.com/index.php?m=home&c=View&a=index&aid=22969
9.
https://www.cnblogs.com/aozhejin/p/18024302
10.
https://www.cnblogs.com/houbbBlogs/p/18023746
11.
https://worldscience.cn/c/2024-01-26/646007.shtml
12.
https://www.baike.com/wikiid/7202814196697301050
13.
https://docs.feishu.cn/article/wiki/L11EwdgYxi2neFkuteuc0IJmnbh
14.
https://www.ncsti.gov.cn/kjdt/kjrd/rgzn_kjrd/202404/t20240425_154745.html
15.
https://learn.microsoft.com/zh-cn/azure/ai-studio/concepts/evaluation-metrics-built-in

2024年6月,一项来自加州大学圣地亚哥分校的实验结果震惊了人工智能界:在与500名人类进行5分钟对话后,GPT-4在54%的时间里被误认为是人类,这一比例不仅超过了图灵测试设定的30%标准,也接近了人类自身67%的平均水平。这一突破性进展似乎预示着人工智能已经站在了“人类化”的门槛上,但事实真的如此吗?

01

图灵测试:一个过时的标准?

1950年,英国数学家艾伦·图灵提出了一个革命性的想法:通过对话来判断机器是否具有智能。在图灵设计的测试中,一名人类测试者将通过键盘与两个对象进行文字交流,其中一个对象是机器,另一个是人类。如果测试者无法可靠地区分哪个是机器,那么这台机器就被认为通过了测试,具备了人类智能。

然而,图灵测试自诞生之日起就饱受争议。语言学家和哲学家们指出,语言与思维并非完全等同。正如语言学家袁毓林所言,语言的主要功能并非仅仅是交流,更不是思维的全部。思维过程往往是一个“内心对话、自我争辩、设问拟答”的复杂过程,而不仅仅是语言的简单输出。因此,仅仅通过对话来判断机器是否具有智能,显然过于简单化了。

02

ChatGPT:人工智能的里程碑?

ChatGPT是OpenAI开发的一款基于Transformer架构的大型语言模型。它通过阅读大量文本数据来学习语言的统计特性和语义关系,能够理解语言的结构和含义,并生成符合语法和语义规则的文本。在预训练阶段,模型通过“下一个词预测”的方式来建模;在微调阶段,则通过特定任务数据的额外训练来提升性能。

ChatGPT的成功确实令人瞩目。它不仅能够进行连贯的对话,还能撰写文章、创作诗歌、解答问题,甚至编写代码。然而,这些能力是否意味着ChatGPT真正理解了人类语言和思维呢?答案可能并没有那么简单。

03

通过图灵测试,但……

尽管GPT-4在实验中达到了54%的“人类化”水平,但这并不意味着它真正具备了人类智能。正如批评者指出的那样,ChatGPT可能只是在模仿人类的对话模式,而不是真正理解对话的内容。这种模仿能力虽然强大,但在面对需要深度理解、创新思维和情感判断的问题时,仍然会暴露出局限性。

此外,图灵测试本身也存在诸多局限。它过于依赖测试者的主观判断,容易受到对话主题、测试者背景等因素的影响。更重要的是,图灵测试忽略了人工智能在视觉、听觉、运动等其他感官领域的能力,而这些能力同样是智能的重要组成部分。

04

重新思考人工智能的评估标准

随着人工智能技术的飞速发展,越来越多的专家开始呼吁建立更全面、更科学的AI评估体系。2024年1月,国际标准化组织(ISO)与国际电工委员会(IEC)联合发布了一系列人工智能相关标准和指南,涵盖了系统质量评估、功能安全、透明度、可解释性等多个维度。

这些新标准强调了对AI系统的风险管理和验证确认,要求在开发和应用过程中充分考虑安全性、可靠性、隐私保护等因素。同时,还提出了三阶段实现原则,为将AI技术应用于安全相关系统提供了指导框架。

显然,人工智能的未来评估标准将不再局限于对话能力,而是转向一个更加全面的评价体系。这一体系将涵盖技术性能、安全性、伦理影响等多个维度,以确保AI系统不仅在功能上接近人类,更能在复杂的社会环境中可靠、安全地运行。

05

结语

ChatGPT在图灵测试中的表现确实令人印象深刻,但这并不意味着它已经达到了人类智能的水平。正如一位AI专家所说:“通过图灵测试只意味着机器学会了如何‘假装’人类,而不是真正拥有了人类的思维能力。”未来,随着技术的不断进步,我们或许会看到更多像ChatGPT这样的AI系统出现。但要真正实现“通用人工智能”,我们还有很长的路要走。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号