GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
莫雷诺冰川:阿根廷的“蓝色巨人”与冰川崩塌奇观
中国医学科学院教你快速缓解胃胀气
“面”字原来是这样长大的!
2025年韩国旅游签证新规详解:申请条件与办理攻略
武汉四天三夜美食游:从热干面到鸭脖,玩转江城经典小吃
植发新选择:机器人FUE和DHI技术详解
包头市青山区民主路第四小学教你缓解期末焦虑
流光溢彩:微信名设计的艺术感
武汉4天3夜冬季游:从黄鹤楼到东湖,玩转江城经典景点
无患子:从药用到生活,一文读懂它的多重价值
医保个人账户新变化:支付范围扩大,可绑定8名亲属
慢性鼻炎的长期管理策略
火焰月季栽培秘籍,让你秒变园艺达人
李白流放夜郎遇赦后,赠友人诗回顾生平
解酒怎么办最快最有效
《甄嬛传》揭秘:古代嫔妃的真实生活
肥城条水涧村芳草地景区:秋日打卡圣地
刀郎2025巡回演唱会:用音乐诉说家庭故事
饭局交际智慧:如何成为饭桌上的交际达人
西洋参片能否医保报销?答案令人遗憾但值得了解
四年级上册期末考试高效复习攻略
燃气灶更换电池后仍无法点火?这份应急指南请收好!
2025春七下人教英语高效学习秘籍
唐凯遭TKO,阿卜杜拉耶夫终结不败金身
最新!吴江至虹桥机场汽车班车时刻表及出行建议
每周75分钟慢跑,预防颈动脉斑块和心血管疾病
九寨沟修复后成网红打卡地,2024年游客量破511万创新高
进化论四大核心要点:从遗传变异到自然选择
春熙路到双流机场:2元公交vs 50元打车,怎么选?
揭秘古代嫔妃生活:陪皇帝过夜后为何无法走路?