问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

一文详解视觉Transformer模型压缩和加速策略

创作时间:

作者:

@小白创作中心

一文详解视觉Transformer模型压缩和加速策略

引用

CSDN

1.

https://blog.csdn.net/csdn_xmj/article/details/138108823

视觉Transformer（ViT）在计算机视觉领域实现了革命性突破，但其高计算和内存需求限制了实际应用。本研究系统评估了量化、低秩近似、知识蒸馏和剪枝四种主要的模型压缩技术，以优化ViT在资源受限环境中的性能。

1. 引言

Transformer架构由Vaswani等人引入，以其强大的数据建模能力、可伸缩性以及出色的捕捉长距离依赖性的能力，彻底改变了机器学习领域。最初在自然语言处理（NLP）领域取得突破后，Transformer开始应用于计算机视觉任务，如图像分类和目标检测，并在多模态情感分析和医疗保健领域展现出巨大潜力。

然而，ViT的高性能伴随着庞大的参数集，数量达到数亿个，这在推理过程中产生显著的内存和计算开销。因此，开发和改进ViTs的模型压缩技术变得至关重要，尤其是在工业应用中。

2. 相关工作

2.1 量化

量化是促进神经网络高效推理的关键技术。通过将网络转换为低比特表示，可以减少计算需求和内存占用。量化感知训练（QAT）通过在每次梯度更新后重新量化模型参数，平衡了精度保留和量化效益。

2.2 低秩近似

ViT中的自注意力机制具有二次计算复杂度，Chen等人发现其注意力矩阵具有低秩特性。基于此，研究者开发了Nyström、Performer和Linformer等方法，并探索了与稀疏注意力机制的结合。

2.3 知识蒸馏

知识蒸馏通过教师模型的软标签训练紧凑的学生模型。Touvron等人提出的蒸馏token进一步优化了这一过程，通过自注意力机制参与优化蒸馏过程。

2.4 剪枝

剪枝通过减少模型维度复杂性来简化架构。研究表明，经过剪枝的模型有时甚至能超过原始模型的性能。

3. 方法论

3.1 量化

后训练量化（PTQ）：直接调整权重，但可能导致显著的精度下降。
量化感知训练（QAT）：通过在浮点表示的模型上执行前向和后向过程，并在每次梯度更新后重新量化参数，使模型适应量化变化。
学习步长量化（LSQ）：改进了量化器的配置过程，优化了量化间隔。
DIFFQ：引入可微分的模型压缩技术，使用伪量化噪声实现完全可微的量化过程。

3.2 知识蒸馏

知识蒸馏技术包括软蒸馏和硬蒸馏，通过最小化教师模型和学生模型的软化对数输出之间的Kullback-Leibler（KL）散度来传输知识。

3.3 剪枝

剪枝通过调整隐藏层之间的权重核维度来减少参数数量。目标是在保持准确性的同时减少模型复杂性。

3.4 低秩近似

利用自注意力的低秩性质进行低秩近似，旨在保持准确性的同时显著降低计算复杂度。

4. 实验

实验在Tesla V100-SXM2 16GB GPU上进行，使用PyTorch作为主要平台，数据集限于CIFAR-10和CIFAR-100。

4.1 实验设置

主要评估指标包括模型大小、推理速度和准确性。最佳压缩技术应在准确性上几乎无影响，同时显著降低模型大小并提升推理速度。

4.2 不同模型压缩方法的比较

量化和剪枝：量化技术，特别是动态量化，将模型大小减小至25倍。剪枝率0.1导致显著准确性降低。
知识蒸馏：DeiT基础模型在保持准确性的同时，推理速度几乎是标准ViT的两倍。DeiT微型配置在CIFAR-10上实现95.43%的准确率，速度提升四倍，仅占原始模型大小的6%。
低秩近似：Nyströmformer技术在准确性和速度之间实现微妙平衡，受landmark数量选择影响。

4.3 混合方法的探索

结合量化和知识蒸馏的混合方法显示出优化潜力。DeiT基础模型与动态量化结合，推理速度提升超过两倍，模型大小减小到原始尺寸的四分之一。

5. 结论

本研究系统评估了四种主要的模型压缩技术，发现后训练量化和知识蒸馏在减小模型大小和加快推理时间方面效果显著。结合量化和知识蒸馏的混合方法在保持可接受的性能降低的同时，实现了显著的效率提升。这些发现为优化Vision Transformers的操作效率提供了重要参考。

论文链接：https://arxiv.org/pdf/2404.10407

本文原文来自公众号“极市平台”，仅用于学术分享，侵权删。

热门推荐

肝囊肿高发人群，如何科学预防？

肝囊肿高发人群，如何科学预防？

优化客户服务流程：提升服务品质

优化客户服务流程：提升服务品质

从月季到薰衣草：小区绿化花卉精选26种

从月季到薰衣草：小区绿化花卉精选26种

仙侠文学里的修仙等级大揭秘

仙侠文学里的修仙等级大揭秘

道教修仙热潮来袭，你准备好飞升了吗？

道教修仙热潮来袭，你准备好飞升了吗？

天师道的修仙秘籍：从炼己筑基到合道飞升

天师道的修仙秘籍：从炼己筑基到合道飞升

《诛仙》与郭璞的游仙诗：古典修仙文化的双璧

《诛仙》与郭璞的游仙诗：古典修仙文化的双璧

太极拳修炼：道家修仙的现代演绎

太极拳修炼：道家修仙的现代演绎

龙井交警发布2025年春运期间出行安全提示｜两公布一提示

龙井交警发布2025年春运期间出行安全提示｜两公布一提示

拼手速时间到了！腊月廿六火车票今日开抢，预计当天为节前客流高峰日

拼手速时间到了！腊月廿六火车票今日开抢，预计当天为节前客流高峰日

白芷调味料：独特芳香去腥膻，烹饪牛羊必备良品

白芷调味料：独特芳香去腥膻，烹饪牛羊必备良品

尤卓尔乳膏怎么用？用量、禁忌和副作用全解析

尤卓尔乳膏怎么用？用量、禁忌和副作用全解析

丁酸氢化可的松乳膏：皮肤科常用药的正确使用方法与注意事项

丁酸氢化可的松乳膏：皮肤科常用药的正确使用方法与注意事项

道光皇帝与林则徐的“神仙打架”：一场禁烟运动背后的智慧较量

道光皇帝与林则徐的“神仙打架”：一场禁烟运动背后的智慧较量

道光帝的“神操作”：从虎门销烟到鸦片战争

道光帝的“神操作”：从虎门销烟到鸦片战争

红薯叶：富含膳食纤维的“蔬菜皇后”，有效缓解便秘

红薯叶：富含膳食纤维的“蔬菜皇后”，有效缓解便秘

中医辨治便秘有妙招：八种特色疗法助你轻松应对

中医辨治便秘有妙招：八种特色疗法助你轻松应对

工伤职工的心理康复之路有多难？

工伤职工的心理康复之路有多难？

2025新规来袭，利唐利唐教你搞定工伤待遇

2025新规来袭，利唐利唐教你搞定工伤待遇

从农场经营到海底探险：7款Steam休闲游戏精选

从农场经营到海底探险：7款Steam休闲游戏精选

每百克含70克膳食纤维，魔芋成冬季养生新宠

每百克含70克膳食纤维，魔芋成冬季养生新宠

魔芋减肥餐效果有限，专家建议搭配均衡饮食

魔芋减肥餐效果有限，专家建议搭配均衡饮食

魔芋的双重魅力：低热量+高纤维，4种美味吃法

魔芋的双重魅力：低热量+高纤维，4种美味吃法

旧硬盘变身移动硬盘，DIY教程手把手教你轻松完成！

旧硬盘变身移动硬盘，DIY教程手把手教你轻松完成！

旧硬盘变身移动硬盘：省钱又实用的存储升级指南

旧硬盘变身移动硬盘：省钱又实用的存储升级指南

一文详解汽车后视镜卡滞：原因分析、维修与改装指南

一文详解汽车后视镜卡滞：原因分析、维修与改装指南

汽车后视镜卡滞维修指南：原因分析与解决方案

汽车后视镜卡滞维修指南：原因分析与解决方案

冬季倒车镜卡滞怎么办？这些实用方法帮你轻松解决

冬季倒车镜卡滞怎么办？这些实用方法帮你轻松解决

贵州从江：鼓楼抢鸡，千年侗族婚俗的现代演绎

贵州从江：鼓楼抢鸡，千年侗族婚俗的现代演绎

易建联嫖娼传闻发酵：真假难辨，警方已介入调查

易建联嫖娼传闻发酵：真假难辨，警方已介入调查

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号