预训练模型微调的常见策略
创作时间:
作者:
@小白创作中心
预训练模型微调的常见策略
引用
CSDN
1.
https://m.blog.csdn.net/m0_56901025/article/details/143628418
假设要微调的下游任务为一个分类任务,采用全连接来作为分类头。
1. Finetuning或Full finetuning(全参微调)
分类头和预训练模型中的所有参数一起在下游任务上训练。
2. Linear Probing
仅对分类头调整参数,主要用于评估计算机视觉中的自监督学习表示。即仅分类头的参数是可训练的,预训练模型的参数在微调期间被冻结。
3. Linear-probing finetuning (LP-FT)
LP-FT 是两阶段调节方法。 LP-FT 的第 1 阶段是Linear Probing,第 2 阶段是Full finetuning,分类头初始化为第 1 阶段中训练好的分类头参数。事实证明,对于 OOD 样本,该方法比Full finetuning或Linear Probing更好。
4. Parameter-efficient Tuning(参数高效微调)
只改变一小部分参数,它包括限制可训练参数的方法,例如BitFit,以及添加小型可训练模块的方法,例如adapter modules (LoRA) , prompt tuning, sparse update methods,Prefix-Tuning。
图片来源于论文(Parameter-Efficient Tuning Makes a Good Classification Head)
- Prompt tuning 通过在预训练模型的基础上添加prompt来适应下游任务,而不需要对模型的参数进行大量的调整。这种方法特别适用于当下游任务的目标与预训练目标差距较大时,通过模板的引入,可以使得模型在小样本(Few-shot)或零样本(Zero-shot)场景下达到理想的效果。(什么是prompt看这里Prompt Tuning 相比于 Fine Tuning 在哪些场景下表现更好? - 知乎)
热门推荐
全方位洗车解决方案:选择最合适的洗车精与方法
十万以内电车保养全攻略:低成本养车的6大核心技巧
失眠的非药物治疗
温州医科大学附属第一医院龙港院区正式启用
代餐奶昔有用吗?营养师解析功效、正确饮用方法及可能副作用
夏季养心五要点,中医智慧助你安然度夏
压力开关校验与故障排查
湿气重者食疗探析:木瓜能否助力祛湿?
高血压180会有生命危险吗
歼-16成我军主力,已装备15个航空旅,现役规模突破300架
解剖列车:筋膜的奥秘
司马将军歌
吐血是什么病?四种常见病因及应对措施
电视剧里的各种花式吐血科学吗?
室友打呼噜怎么办才会不打呼噜
历史教师资格证报考条件及考试科目概述:2024年解读与备考指南
2024年AI提示词优化终极指南:提升对话质量500%的秘密技巧
现代中国人起源:史前奇特“巧合”现象,非洲起源难以解释
蓝牙低功耗(BLE)安全机制详解:从配对到消息完整性保护
日本2024年人均GDP又被这个邻国超越
《盗梦空间》剧情赏析,梦境重叠构造的烧脑经典!
《盗梦空间》结局解析:陀螺转动背后的哲学思考
老白茶有没有副作用
喝老白茶影响睡眠吗?女性白茶对睡眠有影响吗?
TA18钛合金硬度详解:性能参数与应用场景
TC系列钛合金的性能与加工工艺详解
海军这俩新装备,不简单
新能源汽车冬日放电小技巧
慢性肠炎怎么治疗
中国对韩国汇率:现状、影响及政策分析