预训练模型微调的常见策略
创作时间:
作者:
@小白创作中心
预训练模型微调的常见策略
引用
CSDN
1.
https://m.blog.csdn.net/m0_56901025/article/details/143628418
假设要微调的下游任务为一个分类任务,采用全连接来作为分类头。
1. Finetuning或Full finetuning(全参微调)
分类头和预训练模型中的所有参数一起在下游任务上训练。
2. Linear Probing
仅对分类头调整参数,主要用于评估计算机视觉中的自监督学习表示。即仅分类头的参数是可训练的,预训练模型的参数在微调期间被冻结。
3. Linear-probing finetuning (LP-FT)
LP-FT 是两阶段调节方法。 LP-FT 的第 1 阶段是Linear Probing,第 2 阶段是Full finetuning,分类头初始化为第 1 阶段中训练好的分类头参数。事实证明,对于 OOD 样本,该方法比Full finetuning或Linear Probing更好。
4. Parameter-efficient Tuning(参数高效微调)
只改变一小部分参数,它包括限制可训练参数的方法,例如BitFit,以及添加小型可训练模块的方法,例如adapter modules (LoRA) , prompt tuning, sparse update methods,Prefix-Tuning。
图片来源于论文(Parameter-Efficient Tuning Makes a Good Classification Head)
- Prompt tuning 通过在预训练模型的基础上添加prompt来适应下游任务,而不需要对模型的参数进行大量的调整。这种方法特别适用于当下游任务的目标与预训练目标差距较大时,通过模板的引入,可以使得模型在小样本(Few-shot)或零样本(Zero-shot)场景下达到理想的效果。(什么是prompt看这里Prompt Tuning 相比于 Fine Tuning 在哪些场景下表现更好? - 知乎)
热门推荐
紫微斗数:父母宫化忌与父母关系解析
白色普洱有哪几种类型
Verilog代码调试方法详解
信息化和数字化的四大本质区别
Foxmail邮箱无法接收邮件怎么办?一文详解常见问题及解决方案
餐饮数字化转型现状、趋势与挑战
常见药物服用时间大盘点,告别服药困惑!
长生界的冒险与成长:萧晨的传奇旅程
Excel单元格内容自动调整指南:列宽、行高、换行与格式设置
在游戏中感受山城,重庆探索“游戏+文旅”跨界联动
跑鞋鞋底纹路与防滑性能解析
搭建和配置Stable Diffusion环境,超详细的本地部署教程
老旧前端项目如何构建
斗罗大陆:魂师对决唐月华玩法全攻略
空气炸锅烤蛋挞:香甜酥脆的速成秘籍
时间管理关键在于如何高效利用碎片时间吗?
期货持仓应该关注哪些指标?这些指标如何指导投资决策?
掌握购房合同要点,买卖双方必读的交易指南
伤口愈合有硬块正常吗?一文读懂伤口愈合后的硬块
Excel中计算中奖率的多种方法详解
三角洲行动特勤处升级加点攻略指南
未成年人支付宝如何退款?这些法律知识家长必知
无人机安全操作指南:飞行前的关键准备
多模态模型架构的演进
怎样选择公共英语考试级别?
实拍俄罗斯各地的列宁铜像,俄罗斯人现在如何看待那些列宁铜像?
社会工作者就业方向全解析:从一线社工到高级督导
婆媳之间顶级的相处方式,就三个字,做到你就赢了
东北四线城市:“大庆”迎来时代发展红利,未来即将破茧重生么?
如何写个人自传