资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

人工智能幻觉的成因分析和解决措施的挑战

创作时间:

作者:

@小白创作中心

人工智能幻觉的成因分析和解决措施的挑战

引用

CSDN

https://blog.csdn.net/u013669912/article/details/140786142

人工智能幻觉，即AI生成虚假或误导性信息的现象，是当前AI技术发展中的一个重要挑战。本文将从多个角度深入探讨AI幻觉的成因、检测方法和缓解策略，引用了大量研究论文和专家观点，旨在为读者提供全面而深入的理解。

AI幻觉的定义与现状

AI幻觉，即AI生成虚假或误导性信息的现象，是当前AI技术发展中的一个重要挑战。本文将从多个角度深入探讨AI幻觉的成因、检测方法和缓解策略，引用了大量研究论文和专家观点，旨在为读者提供全面而深入的理解。

Comparison of experimental results

AI幻觉的定义：当生成的内容是毫无意义或不忠于提供的源内容时，即为幻觉。幻觉可分为几种类型：逻辑谬误、事实捏造、数据驱动的偏差等。

Example of fabrication of facts:there were 12 Moon Walkers in total

AI幻觉的现状：据gen AI startup Vectarashow统计，聊天机器人产生幻觉的几率从3%到27%不等。科技公司如OpenAI、Google、Microsoft等都在积极应对这一挑战。

AI幻觉的成因

AI幻觉的成因主要包括数据压缩、训练数据的局限性、推理过程中的不确定性等。其中，数据压缩是核心问题。大型语言模型在训练过程中需要对大量数据进行压缩存储，这种压缩会导致信息失真，从而产生幻觉。

Compression of training data

此外，训练数据的局限性也是导致AI幻觉的重要原因。如果训练数据集包含有限、过时或相互矛盾的信息，模型就容易产生幻觉。例如，Google的AI聊天机器人Bard在首次演示中就犯了一个事实错误。

AI幻觉的检测与缓解

针对AI幻觉问题，研究者们提出了多种检测和缓解方法。其中，检索增强生成（RAG）是一种常用的技术，通过检索外部知识库来验证模型生成的内容。此外，还有基于不确定性的检测方法，通过评估模型生成内容的置信度来判断其真实性。

基于不确定性估计的幻觉检测方法

在缓解策略方面，研究者们提出了多种方法，包括调整模型的温度参数、改进提示工程、使用外部知识库等。其中，提示工程是一种非常有效的方法，通过设计特定的提示来引导模型生成更准确的内容。例如，让模型一步一步地思考，并在响应中提供事实和对来源的引用。

基于行为的方法则主要依赖于观察大模型的行为

AI幻觉的未来展望

尽管研究者们提出了多种检测和缓解方法，但AI幻觉问题仍然难以完全解决。新加坡国立大学的研究团队通过形式化证明表明，AI幻觉是不可避免的，即使采用现有的缓解方法也无法完全解决。这意味着在现实世界中也无法完全根除幻觉。

插图 (a) 展示了现实世界的语料库，它包含了 (b) 形式化世界中真值函数 f 及其训练样本 T 的所有内容

因此，未来的研究将更多地关注如何减轻幻觉现象的影响，并探讨如何在确保安全和可靠性的前提下充分利用AI的优势。例如，通过设计更强大的外部知识库和推理工具来检测和纠正幻觉，以及对AI的安全边界进行深入研究，以确保其持续健康发展。

图源：AIGC

多模态AI幻觉的特殊挑战

多模态AI幻觉，即AI在处理图像、视频等非文本信息时产生的幻觉，具有其独特的挑战。数据量不足、数据质量、统计偏差等因素都会影响多模态AI的性能。例如，视觉模型的误分类或误解释、语言模型的知识先验偏差、跨模态对齐模型的不足等都可能导致幻觉。

https://github.com/showlab/Awesome-MLLM-Hallucination/blob/main/assets/tax.png

在训练和推理过程中，自回归生成中的注意力稀释问题也是一个重要因素。随着序列长度的增加，模型对视觉内容的注意力可能会被稀释，导致生成的内容与视觉内容不相关。

最新案例：SearchGPT的幻觉问题

最近，OpenAI推出的SearchGPT在官方演示中出现了一个明显的搜索结果错误。用户搜索"8月在北卡罗来纳Boone举办的音乐节"时，SearchGPT给出的"阿巴拉契亚夏季节"（An Appalachian Summer Festival）的举办日期有误。这一事件再次凸显了AI幻觉问题的普遍性和挑战性。

OpenAI 发言人 Kayla Wood 已经向《大西洋月刊》承认了这个错误