GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
福州烟台山漫游记
烟台山:一座山,一城史,一段不灭的记忆与传奇!
冬天家居小知识:打造温暖、节能又环保的居家环境
5个实用养车小窍门:一年至少省下两箱油钱!
如何驾驶SUV以实现省油效果?实现省油的方法有哪些要点?
塔克拉玛干沙漠实现“锁边合龙”:中国荒漠化防治的里程碑
红沙漠:塔里木盆地的红色明珠
环塔拉力赛:捕捉新疆沙漠的光影瞬间
塔克拉玛干沙漠徒步挑战:发现隐藏的美丽
核心资产复星医药「震荡」,真正考验郭广昌的时候到了
药厂血拼价格战,消费者为何还是买不到便宜药?
科学素质提升|清淡饮食,到底怎么吃?
「燕麥」超健康?其實燕麥熱量比白米還高,這樣吃燕麥才能降脂、瘦身、護心肝
以为吃了会长胖,其实能帮你减肥的9种宝藏食物
健身吃麦片有用吗?什么时候吃效果最好?
没有借条怎么办?九种合法讨债方法全解析
泰尔丝治疗眉心和下颚痘痘全攻略:从用药到护肤
中医教你读懂面部痘痘:从位置看健康隐患
绿豆汤+青菜,轻松告别痘痘肌
斯坦福研究证实:压力大真的会长痘!
《尚食》与《延禧攻略》:谁更还原古代服饰?
沈梦辰巴黎时装周演绎新中式龙凤袍,东方神韵惊艳全球
汉服热背后的传统文化复兴
秋冬新中式穿搭指南:古韵配饰大揭秘
晨散步:改善心理健康的简单之道
新年新规划:你的2025职业跃迁计划
MBTI性格测试:职场规划的得力助手
塔罗牌揭示你的职场新机遇!
城市公园里的悠闲时光:最佳散步攻略
最新研究:每天快走半小时,远离四大疾病!