问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

面向实时智能客服场景的RAG问答系统应用

创作时间:

作者:

@小白创作中心

面向实时智能客服场景的RAG问答系统应用

引用

CSDN

1.

https://m.blog.csdn.net/yjh_se007/article/details/142534247

本文探讨了如何在工业环境中利用大型语言模型（LLMs）进行问题回答，特别是针对客服场景提供上下文相关的响应预测。文章详细介绍了RAG（Retrieval-Augmented Generation）技术在客服场景中的应用，包括数据集构建、RAG架构的主要组件、实验结果等。

系统架构

当用户提出一个有效的查询时，系统会检索相关的文档，并从中生成适当的响应供代理选择。代理可以直接使用生成的响应，点击即可。

对于超出领域范围的查询，系统会引导用户提出相关的问题。

A部分：手动搜索相关文档来响应查询。
B部分：基于BERT的系统，该系统从给定查询中提取相关的问答对，并为代理提供响应建议。
C部分：提出的RAG LLM系统，其中LLM检索相关知识库文章，并根据查询和检索到的文章生成答案。

方法

数据集

构建一个包含领域特定问题和对应答案的知识库文档的数据集。然后，利用LLM从公司文档中生成相关的问题-答案对，并从开源数据集中补充域外问题和答案。

RAG

RAG架构的主要组件包括检索器和生成器。检索器从知识库中检索相关文档，生成器则利用这些文档和历史聊天记录生成响应建议。

检索器

向量嵌入：使用不同的嵌入模型来表示查询和文档，以便计算它们之间的相似度。比较了Universal Sentence Encoder (USE)、Google的Vertex AI嵌入模型和SBERT-all-mpnet-base-v2等嵌入策略。实验结果表明，Vertex AI-textembedding-gecko@001(768)嵌入与ScaNN检索结合效果最佳。

检索策略：测试了多种检索算法，包括ScaNN和KNN HNSW。ScaNN因其在大规模数据集上的高效处理和高检索准确性而被选用。设置了不同的检索阈值，以确保不相关的文档不会被检索并传递给生成器。

生成器

LLM使用PaLM2基础模型（text-bison, text-unicorn）进行文本生成，确保在企业许可和安全要求方面具有优势。

实验结果

ScaNN检索器在大多数情况下优于KNN HNSW，Vertex AI嵌入模型在捕捉复杂语义关系方面表现最佳。设置检索阈值为0.7可以有效减少不必要的文档检索，提高响应生成效率。

RAG LLM在准确性、幻觉率和缺失率方面均优于现有的BERT模型。

总结

这篇文章主要介绍了RAG在传统智能客服场景的一个应用，减轻人工客服的工作负担。结果表明，检索相关知识库文档并利用LLMs生成响应比BERT响应更具上下文相关性和准确性。

热门推荐

自媒体互动性如何影响内容创作与受众参与度？

自媒体互动性如何影响内容创作与受众参与度？

孕婦該多吃的「葉酸食物」TOP23！了解葉酸功效、攝取量以及食用禁忌

孕婦該多吃的「葉酸食物」TOP23！了解葉酸功效、攝取量以及食用禁忌

养兔子用什么干草？一文详解兔子干草选择指南

养兔子用什么干草？一文详解兔子干草选择指南

早餐不吃有什么危害

早餐不吃有什么危害

“来”的多重含义：从基本用法到文化内涵

“来”的多重含义：从基本用法到文化内涵

北美租房全攻略：从找房到入住的实用指南

北美租房全攻略：从找房到入住的实用指南

《面纱》背后的爱情故事，你心动了吗？

《面纱》背后的爱情故事，你心动了吗？

临终关怀中的膳食管理：晚期肿瘤患者个案研究

临终关怀中的膳食管理：晚期肿瘤患者个案研究

文明7发售在即售价及配置要求详解

文明7发售在即售价及配置要求详解

栖霞楼：苏东坡笔下的黄州名楼

栖霞楼：苏东坡笔下的黄州名楼

“爵”：中国古代酒器中的身份象征

“爵”：中国古代酒器中的身份象征

了解显示器刷新率的重要性与选择指南，提升视觉体验

了解显示器刷新率的重要性与选择指南，提升视觉体验

2024年每月最佳旅游去处推荐：从冰雪世界到避暑胜地

2024年每月最佳旅游去处推荐：从冰雪世界到避暑胜地

切纸机换刀操作教程

切纸机换刀操作教程

脚气的科学治疗方法：从药物治疗到日常护理

脚气的科学治疗方法：从药物治疗到日常护理

净资产多少算富人？中国高净值人群年龄统计

净资产多少算富人？中国高净值人群年龄统计

纳米压印能否打破EUV光刻机垄断？佳能需要先兑现今年量产的诺言

纳米压印能否打破EUV光刻机垄断？佳能需要先兑现今年量产的诺言

鱼分公母吗？全面解析鱼类性别与繁殖特征

鱼分公母吗？全面解析鱼类性别与繁殖特征

股票投资如何提高收益并降低风险

股票投资如何提高收益并降低风险

人生在于体验的名言

人生在于体验的名言

旗鱼的形态特征、生活习性以及分布地区

旗鱼的形态特征、生活习性以及分布地区

微信换群，高效拓展人脉的新策略

微信换群，高效拓展人脉的新策略

怎么进行调研项目管理

怎么进行调研项目管理

电子应用设计方案90：智能鱼缸系统设计

电子应用设计方案90：智能鱼缸系统设计

被家暴可以通过法院解决吗

被家暴可以通过法院解决吗

为什么有些地方的生育津贴申请流程很复杂？

为什么有些地方的生育津贴申请流程很复杂？

985和211哪个级别高有什么区别

985和211哪个级别高有什么区别

怎麼咬字清楚？ - 生活改善專家

怎麼咬字清楚？ - 生活改善專家

清华北大减招，复交浙科扩招，2024“强基计划”浙江招生人数详析

清华北大减招，复交浙科扩招，2024“强基计划”浙江招生人数详析

为什么要合村并组？几百年地名的村子突然就没了，老百姓不能理解

为什么要合村并组？几百年地名的村子突然就没了，老百姓不能理解

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号