预训练模型微调的常见策略
创作时间:
作者:
@小白创作中心
预训练模型微调的常见策略
引用
CSDN
1.
https://m.blog.csdn.net/m0_56901025/article/details/143628418
假设要微调的下游任务为一个分类任务,采用全连接来作为分类头。
1. Finetuning或Full finetuning(全参微调)
分类头和预训练模型中的所有参数一起在下游任务上训练。
2. Linear Probing
仅对分类头调整参数,主要用于评估计算机视觉中的自监督学习表示。即仅分类头的参数是可训练的,预训练模型的参数在微调期间被冻结。
3. Linear-probing finetuning (LP-FT)
LP-FT 是两阶段调节方法。 LP-FT 的第 1 阶段是Linear Probing,第 2 阶段是Full finetuning,分类头初始化为第 1 阶段中训练好的分类头参数。事实证明,对于 OOD 样本,该方法比Full finetuning或Linear Probing更好。
4. Parameter-efficient Tuning(参数高效微调)
只改变一小部分参数,它包括限制可训练参数的方法,例如BitFit,以及添加小型可训练模块的方法,例如adapter modules (LoRA) , prompt tuning, sparse update methods,Prefix-Tuning。
图片来源于论文(Parameter-Efficient Tuning Makes a Good Classification Head)
- Prompt tuning 通过在预训练模型的基础上添加prompt来适应下游任务,而不需要对模型的参数进行大量的调整。这种方法特别适用于当下游任务的目标与预训练目标差距较大时,通过模板的引入,可以使得模型在小样本(Few-shot)或零样本(Zero-shot)场景下达到理想的效果。(什么是prompt看这里Prompt Tuning 相比于 Fine Tuning 在哪些场景下表现更好? - 知乎)
热门推荐
极简生活:解锁你的幸福密码
马丁·塞利格曼:幸福的五个维度
南昌城市更新:老小区变新地标!
滕王阁升级:南昌旅游新地标
闽越王城:武夷山下的千年古城
武夷山秋冬打卡攻略:白天鹅、红叶与碧水丹山的绝美邂逅
健康饮食不仅护心还能健脑!
闽南第一村福建漳州埭美古民居
秋冬季节家庭消毒指南:这些要点请收好
柯达破产背后:胶片到数码的巨变
HDR技术:让数码摄影更出彩!
《世界幸福报告》揭秘:高薪职业真的让人更幸福吗?
胡润财富报告背后的深思:财富增长真的能带来幸福吗?
金钱与幸福的平衡:情侣如何做好经济沟通?
三千块能买多少幸福?
静安区多措并举保障春节期间垃圾分类投放秩序
石门二路街道:春节垃圾分类不放松,智能管理提升环保实效
上海春节垃圾投放时间:沿用日常规定,需关注社区通知
成都东站进站换乘攻略:地铁公交高铁无缝对接
春节档票房大洗牌!哪吒断层领先 口碑与票房双丰收
企业危机管理经典案例之 康泰克PPA事件始末
恒大财务造假细节曝光!证监会:许家印手段恶劣
广西武鸣:游客戏水享清凉 峡谷风光惹人醉
岭南文化,中华文明的重要一脉
家居装修常见增项漏项解析:教你精准控制预算避免踩坑
家装10个避坑小技巧,让装修不再成为遗憾的工程
越南巴拿山:打卡世界最长缆车!
徐州烧烤:伏羊节必打卡!
徐州烧烤:羊眼和油包肝的奇妙组合!
淄博烧烤火了!徐州烧烤:我才是鼻祖