问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

LLM2LLM：迭代式数据增强策略提升大模型微调效果

创作时间:

作者:

@小白创作中心

LLM2LLM：迭代式数据增强策略提升大模型微调效果

引用

1

来源

1.

https://developer.volcengine.com/articles/7382399281753227290

大模型目前已经在很多领域、很多场景中都取得了较为优异的效果，但很多实际场景中仍然需要进行模型微调，那么如何在有限数据情况下提高大模型微调效果呢？

今天给大家带来一篇针对性和迭代式的数据增强策略-LLM2LLM，主要在LLM训练的过程中发现预测错误的数据，并将其放大&增强，重新融合到训练数据集中，让LLM更专注于更有挑战的样本，显著提高LLM在低资源环境下的效果。

方法

LLM2LLM的主要流程如下：

在初始种子数据集中微调学生模型；
评估并提取学生模型在训练集中预测错误的数据；
利用教师模型对这些错误数据生成额外数据，将其加如原始训练数据中迭代训练学生模型。

值得注意的是，每一次数据增强时，仅对种子数据的进行数据扩充，以防止多次迭代时教师模型生成的错误示例影响整体数据集质量，导致数据退化，同时也可以进一步约束生成数据的总量。

结果分析

实验主要针对LLaMA2-7B模型，在GSM8K、CaseHOLD、SNIPS、TREC和SST-2数据集上，以0.02%到50%不同的抽样率对这些数据集进行采样，以评估在不同低数据环境下的LLM2LLM方法的性能，如下表所示，不同数量级的训练数据下，LLM2LLM方法均有效果提高，当数据较少的情况下，提高比例更大。

同时比较了与EDA和AugGPT增强方法之间的差异，如下表所示，LLM2LLM方法提升幅度更大。

对比了迭代增强与一次性增加等量数据的方法直接的差异，如下表所示，使用一次增强的效果显著低于执行10次LLM2LLM迭代增强的方法，说明即使是对错误数据的学习，也应该逐步分析，有的错误数据更难，在数据训练过程中即使调整数据分布。

分析仅在原始种子数据集上和在整体数据上进行数据增强的差异，如下表所示，仅在原始种子数据上进行数据增强效果更好，说明增强部分数据由于模型生成，可能存在错误数据，多次迭代过程中，可能会导致误差累积，数据退化。

对比从头微调和增量微调方法，如下表所示，从头开始微调始终显著优于增量微调方法，可能是由于在小种子数据集上多次增量微调存在过拟合，影响模型推理测试。

当然，不同的教师模型，对LLM2LLM方法影响也比较大，越好的教师模型，带来的效果越好，如下图所示，GPT4的效果最好，其次是GPT3.5。

写在最后

LLM2LLM方法就像是bad case分析，只不过是反复对训练集的bad case进行针对性优化，让大模型更专注困难样本。

热门推荐

波姬红无花果种植全攻略：从选种到管理，手把手教你种出优质果实

波姬红无花果种植全攻略：从选种到管理，手把手教你种出优质果实

无花果病虫害防治秘籍，让你的果园丰收无忧！

无花果病虫害防治秘籍，让你的果园丰收无忧！

重庆隐秘美景：8处人少景美的私藏地

重庆隐秘美景：8处人少景美的私藏地

智慧社区来了，小区物业如何升级？

智慧社区来了，小区物业如何升级？

交强险新规明年实施：死亡伤残赔偿提至18万，费率最高下浮30%

交强险新规明年实施：死亡伤残赔偿提至18万，费率最高下浮30%

男性养生新宠：生姜的秘密

男性养生新宠：生姜的秘密

“国民夫妻”张国立蒋雯丽：从《金婚》到《爱情最美丽》

“国民夫妻”张国立蒋雯丽：从《金婚》到《爱情最美丽》

从复原年轻成龙到数字换龄，AI换脸技术如何改变电影制作

从复原年轻成龙到数字换龄，AI换脸技术如何改变电影制作

美联储降息50个基点，全球经济再受“美元潮汐”影响

美联储降息50个基点，全球经济再受“美元潮汐”影响

进口关税上调为何影响汇率？解析贸易与预期双重作用

进口关税上调为何影响汇率？解析贸易与预期双重作用

探访罗马三大古迹：万神庙、斗兽场、凯旋门

探访罗马三大古迹：万神庙、斗兽场、凯旋门

冬日罗马必打卡：西班牙广场的浪漫之旅

冬日罗马必打卡：西班牙广场的浪漫之旅

应急管理部发布：五大自然灾害自救实用指南

应急管理部发布：五大自然灾害自救实用指南

加州山火致11死18万撤离，气候变化与基础设施不足成祸根

加州山火致11死18万撤离，气候变化与基础设施不足成祸根

让“华夏之光”闪耀迪拜：迪拜世博会中国馆设计揭秘

让“华夏之光”闪耀迪拜：迪拜世博会中国馆设计揭秘

金婚中的庄嫂：在妥协与坚守中经营50年婚姻

金婚中的庄嫂：在妥协与坚守中经营50年婚姻

金婚15年：赵丽颖成新生代中坚，老戏骨们持续耕耘

金婚15年：赵丽颖成新生代中坚，老戏骨们持续耕耘

《金婚》创新编年体叙事，演绎五十年婚姻变迁成经典

《金婚》创新编年体叙事，演绎五十年婚姻变迁成经典

垃圾分类遇尴尬：居民不懂不愿分，上海祭出罚款大招

垃圾分类遇尴尬：居民不懂不愿分，上海祭出罚款大招

2024年公共事业管理专业全国大学排名：含最好的10所本科名校

2024年公共事业管理专业全国大学排名：含最好的10所本科名校

制度不完善、居民参与度低，垃圾分类如何破局

制度不完善、居民参与度低，垃圾分类如何破局

垃圾分类在中国：政策引领下的挑战与突破

垃圾分类在中国：政策引领下的挑战与突破

校友会2024中国大学排名：江苏警官学院专业排名

校友会2024中国大学排名：江苏警官学院专业排名

家电智能化进程：AI如何赋能家居生活？

家电智能化进程：AI如何赋能家居生活？

领导力沟通的艺术：信息、激情与行动的三重奏

领导力沟通的艺术：信息、激情与行动的三重奏

企业安全生产指南：从危险源识别到应急救援

企业安全生产指南：从危险源识别到应急救援

陶渊明《归园田居其三》：种豆南山下的田园诗意与归隐理想

陶渊明《归园田居其三》：种豆南山下的田园诗意与归隐理想

手把手教你制作个性化本子：从设计到成品的完整指南

手把手教你制作个性化本子：从设计到成品的完整指南

成功创业者的赚钱秘诀：从市场调研到持续创新

成功创业者的赚钱秘诀：从市场调研到持续创新

心电图T波异常：6种可能原因与应对方案

心电图T波异常：6种可能原因与应对方案

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号