问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

北大：LLM共情数据合成方案

创作时间:

作者:

@小白创作中心

北大：LLM共情数据合成方案

引用

CSDN

1.

https://blog.csdn.net/weixin_46739757/article/details/141711254

近年来，随着大型语言模型（LLMs）的快速发展，实现出色的共情响应能力已成为关键先决条件。然而，共情数据通常是人工标注的，导致数据不足和浪费人力资源。为了解决这一问题，来自北京大学的研究团队提出了Synth-Empathy，一种基于LLM的数据生成、质量和多样性选择管道，可以自动生成高质量的共情数据并丢弃低质量的数据。通过从低共情模型生成的数据，研究团队能够进一步提高共情响应性能，并在多个基准测试中实现最先进的结果。

📖标题：Synth-Empathy: Towards High-Quality Synthetic Empathy Data
🌐来源：arXiv, 2407.21669

摘要

近年来，随着大型语言模型（LLMs）的快速发展，实现出色的共情响应能力已成为关键先决条件。因此，管理和理解共情数据变得越来越重要。然而，共情数据通常是人工标注的，导致数据不足和浪费人力资源。在这项工作中，我们提出了Synth-Empathy，一种基于LLM的数据生成、质量和多样性选择管道，可以自动生成高质量的共情数据并丢弃低质量的数据。通过从低共情模型生成的数据，我们能够进一步提高共情响应性能，并在多个基准测试中实现最先进的结果。此外，我们的模型在各种人类评估基准测试中实现了最先进的性能，展示了其在实际应用中的有效性和稳健性。此外，我们展示了数据数量和质量之间的权衡，为共情数据的生成和选择提供了深入的见解。

文章简介

研究问题：大语言模型（LLM）的共情反应能力越来越重要，但相关的数据很稀缺。
主要贡献：论文提出了一种新的共情数据生成和筛选流程，能够生成高质量的合成共情数据集，并在多个基准测试中实现了最先进的性能。

重点思路

相关工作

为模型注入同理心以增强情感体验是AGI的一个重要方面，包括整合情感标签、外部知识、结合常识推理等方向。
训练数据：LLM的出现带来了训练数据量的大幅增加，数据的质量和数量变得至关重要，也带来了数据管理、清洗和标注方面的挑战。
数据合成：合成数据在构建大规模、高质量数据集方面具有巨大潜力，当前有多重方法提高合成数据的质量、多样性和实用性。

论文方案

数据生成：基于权威的EmpatheticDialogues（ED）数据集，通过精心设计的提示生成共情响应。
数据质量选择：使用LLM在ED数据集上微调，作为鉴别器，筛选出与ED数据集共情风格相似的高质量数据。
数据多样性选择：通过结合数据特征和相似度评分，有效地识别和利用高质量数据进行共情响应。

分析总结

通过三维评估（连贯性、自然性和共情性），验证了生成数据集的高质量。
使用合成共情响应数据微调LLM，可以在多个基准测试中实现最先进的性能。
模型在基于BERT的嵌入评估中表现出优越性能，生成的文本具有更有意义和上下文准确的语义表示。
模型在人类评估基准上也达到了最先进的性能，凸显了其实用性和用户友好性。

个人观点

论文引入了生成的高质量共情数据集，解决了共情模型实际应用中的数据限制和低效问题。

附录

本文原文来自arXiv预印本

热门推荐

中国哪里看日出最美？中国最佳看日出的十个地方

中国哪里看日出最美？中国最佳看日出的十个地方

怎么回绝需求管理

怎么回绝需求管理

颠覆未来！这十大技术趋势将如何彻底改变我们的生活方式？

颠覆未来！这十大技术趋势将如何彻底改变我们的生活方式？

保险公司业务员夸大宣传，为何不构成欺诈？

保险公司业务员夸大宣传，为何不构成欺诈？

身价千万老板回应干苦力搬砖：每月全靠它赚油钱

身价千万老板回应干苦力搬砖：每月全靠它赚油钱

检测实验室设计：从规划到优化的全方位指南

检测实验室设计：从规划到优化的全方位指南

德国人名：从命名规则到文化内涵

德国人名：从命名规则到文化内涵

多酚类化合物的好处

多酚类化合物的好处

文案策划步骤详解：从构思到执行

文案策划步骤详解：从构思到执行

股票怎么选股：从策略制定到风险评估的完整指南

股票怎么选股：从策略制定到风险评估的完整指南

“中国哪里好玩？”“小红书一下”

“中国哪里好玩？”“小红书一下”

如何塑造配角人物：从形式、动机到戏剧性

如何塑造配角人物：从形式、动机到戏剧性

Cosplay摄影指南：从角色研究到后期处理，打造完美角色扮演照片

Cosplay摄影指南：从角色研究到后期处理，打造完美角色扮演照片

诉讼代理的职责是什么

诉讼代理的职责是什么

探索印度吠陀的奥秘与智慧

探索印度吠陀的奥秘与智慧

棒杰股份跨界光伏两年巨亏4.35亿遭1.11亿债务逾期重要子公司股权被冻结

棒杰股份跨界光伏两年巨亏4.35亿遭1.11亿债务逾期重要子公司股权被冻结

直觉究竟有多不可靠？从三门悖论到幸存者偏差

直觉究竟有多不可靠？从三门悖论到幸存者偏差

秦始皇：被黑得最惨的帝王，为中华民族的形成发挥了巨大作用

秦始皇：被黑得最惨的帝王，为中华民族的形成发挥了巨大作用

孩子这5个行为不是坏毛病！而是发育过程中的正常现象！

孩子这5个行为不是坏毛病！而是发育过程中的正常现象！

坐北朝南鱼缸对门口摆放：风水学中的布局技巧

坐北朝南鱼缸对门口摆放：风水学中的布局技巧

释迦果的成熟季节和上市时间（释迦果的生长环境和采摘收获时间）

释迦果的成熟季节和上市时间（释迦果的生长环境和采摘收获时间）

一年级下识字手抄报：趣味识字与书写技巧的完美结合

一年级下识字手抄报：趣味识字与书写技巧的完美结合

数独游戏入门：规则与解题技巧详解

数独游戏入门：规则与解题技巧详解

气质与风度：探讨魏晋时期男性的审美标准

气质与风度：探讨魏晋时期男性的审美标准

解决微信铃声不响问题的全面指南及排查方法

解决微信铃声不响问题的全面指南及排查方法

全球及中国天然香料市场分析

全球及中国天然香料市场分析

巨噬细胞原代培养中细胞贴壁的过程

巨噬细胞原代培养中细胞贴壁的过程

政策如何影响行业分析

政策如何影响行业分析

消防设施六项检查，一定要看到最后！

消防设施六项检查，一定要看到最后！

我的爱人，我应该如何爱你

我的爱人，我应该如何爱你

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号