问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

大模型的幻觉 (Hallucination) 因何而来？如何解决幻觉问题？

创作时间:

作者:

@小白创作中心

大模型的幻觉 (Hallucination) 因何而来？如何解决幻觉问题？

引用

CSDN

1.

https://blog.csdn.net/2301_81888214/article/details/138792705

大语言模型（LLM）在生成高度流畅的回复的同时，也倾向于产生幻觉或做出非事实陈述，这可能会损害用户的信任。本文将为您详细解析LLM幻觉的成因，并介绍多种缓解幻觉的方法及其实验效果。

图1：Stable Diffusion生成的图像

LLM幻觉概述

LLM幻觉是指模型生成的内容与提供的源内容不符或没有意义的现象。这种现象可能由以下几种类型引起：

逻辑谬误：模型在进行推理时出现错误，提供错误的答案。
捏造事实：模型自信地断言不存在的事实，而不是回答“我不知道”。
数据驱动的偏见：由于某些数据的普遍存在，模型的输出可能会偏向某些方向，导致错误的结果。

LLM幻觉的成因

LLM幻觉的产生主要源于数据压缩和不一致性。在训练过程中，模型需要对大量数据进行压缩存储，这种压缩不可避免地会导致信息丢失。当模型在回答问题时，如果遇到压缩或缺失的信息，就会尝试“填补空白”，从而产生幻觉。

此外，训练数据集的质量也会影响模型的表现。如果数据集过时、不可靠或存在矛盾，模型就更容易产生幻觉。

缓解LLM幻觉的方法

调整temperature参数

temperature参数控制生成语言模型中生成文本的随机性和创造性。通过调整这个参数，可以限制模型的创造力，从而减少幻觉的产生。实验结果显示，将temperature参数设置为0可以显著提高回答的准确性。

思维链提示（Chain of Thought Prompting）

思维链提示要求模型逐步思考并提供推理过程。这种方法可以提高模型的推理能力，减少逻辑谬误。实验结果显示，使用思维链提示可以将准确率提高到58%。

自我一致性（Self-Consistency）

自我一致性方法要求模型给出多个答案，并通过投票选择最佳答案。这种方法可以减少模型的不确定性，提高回答的可靠性。实验结果显示，使用自我一致性方法可以将准确率提高到57%。

多代理方法

多代理方法让多个语言模型实例提出各自的回答和推理过程，并进行多轮辩论，最终得出一个共同的最终答案。这种方法虽然可以提高准确率，但会增加API的使用成本和延迟，因此在实际应用中需要谨慎使用。

使用外部知识库

通过在预测过程中提供来自知识库的相关数据，可以将纯粹的生成问题转换为基于数据的搜索或摘要问题。实验结果显示，使用外部知识库可以将准确率提高到65%。

检索增强生成（RAG）

RAG技术将检索系统与大语言模型结合使用，通过检索相关文档片段来生成答案。这种方法可以进一步提高模型的准确性和可靠性。

综合解决方案

结合提示工程和外部知识库是缓解LLM幻觉最有效的方法之一。通过使用CRITIC框架，可以将准确率提高到67%。这种方法首先使用外部知识库提供相关信息，然后要求模型仔细检查并改进其回答。

结论

虽然减少LLMs中的幻觉并不是什么难事，但每种方法都有其优缺点。建议优先考虑prompt的合理设计，这是缓解幻觉最具性价比和有效率的方法。同时，结合外部知识库和检索增强生成技术，可以进一步提高模型的准确性和可靠性。

热门推荐

暴雨级防水！解密GORE-TEX黑标三层面料如何成就户外盔甲

暴雨级防水！解密GORE-TEX黑标三层面料如何成就户外盔甲

如何优化研发团队的会议效率

如何优化研发团队的会议效率

入境游热下导游“很忙”：西班牙语日薪千元，“档期排到11月”

入境游热下导游“很忙”：西班牙语日薪千元，“档期排到11月”

游戏中的动态音效：沉浸式体验的声学魔法

游戏中的动态音效：沉浸式体验的声学魔法

崴脚只有0次和无数次？！脚踝扭伤的应急处理你会吗？

崴脚只有0次和无数次？！脚踝扭伤的应急处理你会吗？

铁磁材料的磁滞回线及基本磁化曲线实验报告

铁磁材料的磁滞回线及基本磁化曲线实验报告

命格分析：地仙与天仙，谁更胜一筹

命格分析：地仙与天仙，谁更胜一筹

加拿大派錢政策如何影响移民生活？深度分析

加拿大派錢政策如何影响移民生活？深度分析

详解sin函数的三种实现方法：泰勒级数展开、查找表和CORDIC算法

详解sin函数的三种实现方法：泰勒级数展开、查找表和CORDIC算法

世界第一高楼排名出炉世界最高楼前五名排行榜

世界第一高楼排名出炉世界最高楼前五名排行榜

纯水机滤芯多久更换一次？更换步骤全攻略

纯水机滤芯多久更换一次？更换步骤全攻略

BIAS如何有效运用技巧？这种运用方式有哪些实际效果？

BIAS如何有效运用技巧？这种运用方式有哪些实际效果？

如何维护和保养电子设备？（延长设备使用寿命的小技巧）

如何维护和保养电子设备？（延长设备使用寿命的小技巧）

一个家庭的上等家风：书香、心静、人勤

一个家庭的上等家风：书香、心静、人勤

成语“卧薪尝胆”是什么意思？背后有什么历史故事？

成语“卧薪尝胆”是什么意思？背后有什么历史故事？

月光花的花语：绽放在夜晚的希望与梦想

月光花的花语：绽放在夜晚的希望与梦想

i love you隐藏式表白，如何用更特别的方式表达爱意

i love you隐藏式表白，如何用更特别的方式表达爱意

以考古之光照见八闽文化的根与魂！

以考古之光照见八闽文化的根与魂！

储存的照片如何提取

储存的照片如何提取

中国历史上谋略巅峰：四位军师的卓越智慧

中国历史上谋略巅峰：四位军师的卓越智慧

膝关节问题是否适合针灸？专业医生这样建议

膝关节问题是否适合针灸？专业医生这样建议

电子应用设计方案96：智能AI充电器系统设计

电子应用设计方案96：智能AI充电器系统设计

合力关紧预防校园欺凌这道“闸门”

合力关紧预防校园欺凌这道“闸门”

店家必备保险知识——一保单的解析与重要性

店家必备保险知识——一保单的解析与重要性

什么是权益维护？从定义到实践的全面解读

什么是权益维护？从定义到实践的全面解读

南瓜籽的营养价值及其对人体的益处

南瓜籽的营养价值及其对人体的益处

敏感肌的全面解析：从成因到护肤指南

敏感肌的全面解析：从成因到护肤指南

如何评估人民币贬值对黄金投资的长期影响？

如何评估人民币贬值对黄金投资的长期影响？

中高考临近，这些健康备考知识请收好

中高考临近，这些健康备考知识请收好

苯佐卡因软膏的适用范围和使用注意事项

苯佐卡因软膏的适用范围和使用注意事项

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号