GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
个人所得税汇算清缴培训材料
发热的药物治疗方法
合法下载无版权争议软件:法律风险与合规路径
飞船飞往月球时需要不断变轨,为何不直接飞向月球?
如何确定合适的床头朝向?床头朝向对睡眠有何影响?
细思极恐!你卖掉的旧手机,可能“出卖”你的所有信息!恢复出厂设置就安全了?真相→
华硕主板内存条频率设置指南
周易离卦的卦象、卦辞及应用详解
鼻塞咽干黄痰用什么中药
法律硕士考试英语与考研英语一、二间的差异解析:特色与侧重点对比2024版
天龙八部只有三位主角,为何叫“八部”?你看八部分别指的是谁
胸部CT检查时,您学会吸气、憋气、呼气了吗?
胃穿孔手术方法及注意事项详解
如何引导新手进行基金投资?这种投资引导需要注意哪些方面?
西晋:短暂统一的辉煌与覆灭的悲歌
如何更换Debian系统的软件源?
保险杠刮蹭塑料件起毛且深的修复方法是什么?这种修复对车辆外观有何影响?
如何验证Docker是否安装成功
归还短期借款本金及利息时如何写会计分录?
“羊肉”冬季补虚祛寒的佳品,如何健康食用?牢记这6个注意事项!
学了这么久的逻辑学,“逻辑”的含义你真的了解吗?
黄金失守2900整数关口 技术指标恢复下跌走势
学人工智能需要什么基础
和新朋友增进友谊的水果糖转运法
芋泥巴斯克蛋糕制作教程
苏州针对网约配送员首次实行全线上培训 骑手上课跑单两不误
无独立请求权第三人范本的含义与应用
投产比:定义、计算方法及行业应用
如何从内到外养成地道的健身习惯:动机、计划、支持、追踪与饮食调整全解析
八字推算婚姻感情运势 出生时辰看婚姻