深度学习笔记:灾难性遗忘
创作时间:
作者:
@小白创作中心
深度学习笔记:灾难性遗忘
引用
CSDN
1.
https://blog.csdn.net/qq_40206371/article/details/135742469
灾难性遗忘是深度学习中一个重要的问题,特别是在连续学习或增量学习场景中。本文从梯度、权重和仿生学三个不同角度,深入探讨了灾难性遗忘的现象及其解决方案,为理解和解决这一问题提供了有价值的见解。
1 灾难性遗忘介绍
- 当神经网络被训练去学习新的任务时,它可能会完全忘记如何执行它以前学过的任务。
- 这种现象尤其在所谓的“连续学习”(continuous learning)或“增量学习”(incremental learning)场景中很常见
2 不同视角下看待灾难性遗忘 以及对应的解决方法
2.1 从梯度的视角
2.1.1 从梯度的视角看灾难性遗忘
- 我们有两个不同任务的损失曲面,用平滑的曲面训练完之后,再在坑坑洼洼的曲面上继续训练
- 在第二个任务上训练完之后,最优点沿着红色的箭头移动(向第二个任务平滑曲面的山峰移动),相当于向第一个任务(平滑曲面)的底部走了
- ——>第一个任务的损失越来越高,效果越来越差,这就是灾难性遗忘
2.1.2 从梯度的视角解决灾难性遗忘(1)——找到联通路径
[1803.00885] Essentially No Barriers in Neural Network Energy Landscape (arxiv.org) 【ICML2018】中提到,神经网络的所有的极小值都是连通在一起的;同时给出了如何从一个极小值找到一条通路连到另一个极小值的算法
——>从原始任务的某个极小值出发,在优化新任务的时候尽量沿着底部的通道走,就可以保证原始任务不受影响了
2.1.3 从梯度的视角解决灾难性遗忘(2)——新任务梯度和原始任务梯度垂直
- 在优化新任务的时候,保证优化的方向和原始任务不相干
- Orthogonal gradient descent for continual learning PMLR 2020:保证在优化新任务的时候产生的梯度和原始任务产生的梯度在一个低秩空间是垂直的
2.2 从权重的角度
2.2.1 从权重的角度看灾难性遗忘
- 某些权重对原始任务很重要,经过新任务训练,这些权重发生了改变,原始任务的效果当然也就受到了影响
2.2.2 从权重的角度解决灾难性遗忘(1)——如何调整权重
Overcoming catastrophic forgetting in neural networks 2016
- 原始任务A的最优参数是分布在灰色区域中的;新训练任务B的最优参数区间在白色区域中
- 如果不做任何限制,训练完A任务后直接训练B任务,可能会沿着蓝色的射线方向走,那么就走出了原始任务A的最优参数区间了
- 所以这里提出了EWC的方法,这样可以让参数不离开原始任务A的最优参数区间,同时接近/到达原始任务B的最优参数区间
2.2.3 从权重的角度解决灾难性遗忘(2)——冻结部分参数
- The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks 2019 ICLR
- 神经网络里只有一部分权重真正起作用,很多都是没用的
- ——>freeze住重要的参数,不重要的参数finetune(时间序列部分2023年的微调大模型的方法就是这个思路)
2.3 从仿生学的角度
2.3.1 从仿生学的角度看灾难性遗忘
- 仿生学着重于模仿自然界中的生物机制和策略,以解决工程和技术上的挑战。
- 在这个背景下,考虑人类和其他动物是如何处理学习和记忆的,可以帮助我们理解并改善神经网络中的灾难性遗忘问题。
2.3.2 从仿生学的角度解决灾难性遗忘(1)——复习
- 样本复习——训练新任务的时候混一些旧任务的数据样本
参考内容: 为什么神经网络会存在灾难性遗忘(catastrophic forgetting)这个问题? - 知乎 (zhihu.com)
热门推荐
澳大利亚投资移民哪个类型好
安防监控系统盲区:提高覆盖面和检测效率的方法
安防监控系统盲区:提高覆盖面和检测效率的方法
职业病甲亢的法律认定与责任追究
国际观察 | 校园霸凌,各国如何治理
生活資訊|使用汽車座椅意外死亡風險減60% 如何選擇+正確安裝方法+消委會推介
六脉神剑法硕在刑法领域的应用与影响
如何通过分析成功案例提升流程优化策略?
储能电站构成及控制原理
选购黄金首饰必知的几个常识和诀窍
如何带父母移民新加坡:条件与签证申请全解析
啥职业是公务员?公务员包括哪些岗位和职业?
如何预测现货黄金走势图?这种预测需要哪些技术分析工具?
如何通过激励机制提高团队和员工的积极性?
服务器远程连接端口配置指南:SSH、Telnet和RDP详解
考研数学复习之定积分定义求解数列极限(超详细教程)
氢键最全的知识点及其应用
离职失业金怎么领取?湖北武汉的失业保险金申请要求
公司治理中的权力制衡:董事会监事制度的法律实践
齿轮齿条的保养与维护指南
西宁市第三人民医院眼科:专业团队与先进设备助力眼健康
北京协和医院发布胰腺癌CAR-M疗法最新成果
胰腺癌手术关键技术、肺癌精准诊疗模式……上海市科学技术奖公布
各国航母排水量排名:美国福特级航母第一,中国8万吨福建舰第几
美国为什么索要中国月壤,6次任务已带回382公斤,不够用吗?
达梦数据库SQL调优
高中物理教学中学生推理能力培养策略的研究
锑价狂飙创12年新高!价格暴涨的核心原因是什么?有色金属板块将迎大牛市?
什么是文化自信?作为新时代人们,该如何增强文化自信?
发现数据异常波动怎么办?指标监控和归因分析来帮你