清华大学发布DeepSeek与AI幻觉研究报告:从风险到创造力
创作时间:
作者:
@小白创作中心
清华大学发布DeepSeek与AI幻觉研究报告:从风险到创造力
引用
CSDN
1.
https://m.blog.csdn.net/weixin_55366265/article/details/145767831
清华大学最新发布的DeepSeek与AI幻觉研究报告,深入探讨了AI幻觉的定义、产生原因、评测方法、应对策略、潜在风险以及创造力价值等多个方面。该报告不仅揭示了AI幻觉的复杂性,还为如何有效应对AI幻觉提供了实用的建议。
AI幻觉的定义与类型
AI幻觉是指模型生成与事实不符、逻辑断裂或脱离上下文的内容。具体可以分为两类:
- 事实性幻觉:生成的内容与现实世界事实不一致,例如在回答糖尿病患者能否用蜂蜜代替糖的问题时出现错误。
- 忠实性幻觉:生成的内容与用户指令或上下文不一致,表现为偏题或答非所问。
DeepSeek产生幻觉的原因
研究发现,DeepSeek产生幻觉的主要原因包括:
- 数据偏差:训练数据的错误或片面性会被放大,例如医学领域过时论文可能导致错误结论。
- 泛化困境:模型难以处理训练集外的复杂场景,如预测南极冰层融化对非洲农业的影响。
- 知识固化:过度依赖参数化记忆,缺乏动态更新能力,对2023年后的事件可能完全虚构。
- 意图误解:用户提问模糊时,模型易“自由发挥”,如对“介绍深度学习”的理解可能偏离实际需求。
AI幻觉的评测
研究采用了两种主要的测试方法:
- 随机生成通用提示语获取回答后人工判断标注并交叉验证
- 抽取事实性幻觉测试题比对答案并标注类型交叉验证
评测结果显示:
- 在事实性幻觉评测中,DeepSeekV3的幻觉率为29.67%,DeepSeekR1为22.33%。
- 不同模型在不同测试场景下的幻觉率存在差异。
- 推理能力与幻觉率之间存在双向作用机制,推理增强可能降低或增加幻觉率。
减缓AI幻觉的方法
普通用户应对方式
- 双AI验证 / 大模型协作
- 提示词工程(如知识边界限定、对抗性提示等)
- 针对不同高发场景(如知识边界模糊、未来事件预测等)给出防护建议
技术方案
- RAG框架
- 结合外部知识库
- 精细训练
- 开发评估工具
AI幻觉的潜在风险
尽管AI幻觉带来了一些创新机会,但也存在以下风险:
- 信息污染风险:加剧虚假信息传播
- 信任危机:使用户怀疑专业场景可靠性
- 控制欠缺:可能被恶意利用
- 安全漏洞:影响自动化系统等
AI幻觉的创造力价值
AI幻觉在多个领域展现出独特的创造力价值:
- 科学发现:启发新型蛋白质结构设计,推动科研范式转变为“AI幻觉 - 实验验证 - 理论重构”。
- 文艺与设计:突破思维定式,为创作提供灵感。
- 娱乐与游戏:创造新体验,生成游戏资产等。
- 技术创新:如提升自动驾驶系统识别精度等。
热门推荐
吴姓的四大起源与地域分布
如何预防恶心呕吐
锥度的检查方法和相应仪器的使用方法
三相电机的霍尔传感器输出什么?
我国债券市场供需结构变化分析
研究证实:每周吃两次鱼,听力损失风险降低42%
“阿莫西林”是消炎药?提醒:真正的消炎药只有2种,别用错了
Win7/Win8双系统安装教程:兼顾兼容性与性能的完美方案
价值投资者的经验之谈:股市贯穿牛熊的投资核心策略
钢厂销售合同:钢材交易保障双方权益
初创公司营销策略指南:从定位到品牌建设的六大关键步骤
“喝水就尿”和“喝水不尿”的人,哪个更健康?
罪犯变身 “学霸” 背后的秘密
孔子、佛祖、老子,近乎同一时期出现,是巧合还是另有他因?
【健康饮食】十大碱性食物推荐:从菠菜到苹果的营养指南
坚持运动:提升心理健康的有力法宝
看重“礼物”的北极燕鸥
法律责任分配是什么
事故认定书的法律依据及责任划分
如何修改exe文件源码
摄影中的感光度 (ISO)—基础知识及参数配置技巧
男人行不行,看腿就知道
服务器多?密码烦?用这个脚本,一键搞定 SSH 免密信任!
孩儿立志出乡关,解析这句诗的寓意
瑶柱的热量
风水中的“龙上八煞”与“八煞黄泉”详解
喝中药胃疼怎么办
电动平车如何在低温环境下保障电池续航与动力
牙龈上出现黑线的原因及预防方法
广西靖西绣球文化:从传统工艺到现代创新