GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
森蚺:从《狂蟒之灾》到生态保护
周公流放成王:从权力斗争看古代政治智慧
考古新发现为周公旦正名:确为成王摄政而非篡位
野生猫爪草:真假辨别攻略
银行卡冻结自救指南:五大措施保护你的“钱袋子”
医学记忆口诀新方法:5大技巧助力临床知识学习
未成年人犯罪低龄化,教育如何发力?
溜达哥教你如何在影视中幽默调侃
未成年人犯罪低龄化,刑事责任年龄该不该降?
家庭教育缺失与不当:未成年人犯罪的温床
未成年人犯罪低龄化:挑战与应对
搞笑段子里的幽默元素大揭秘
万用表检测故障的方法有哪些?如何准确判断故障类型?
如何为电子设备选择合适的电源适配器
电工操作常用必备5大工具
机器学习数据集的归一化技巧大揭秘
手机壳材质选购指南:7种主流材质全面对比
高分子材料在新能源领域大放异彩,从电池隔膜到光伏胶膜,再到风电叶片和氢能储运,为产业进步提供关键支撑。
硅胶制品清洁与保养全攻略:4种清洁方法+5个保养技巧
硅胶制品不易脏:表面光滑抗污,定期清洁保洁净
TPE材料为何成为防尘面罩新宠?
别再误信谣言!心脏支架手术的科学解读
清华大学AI医院即将上线,重塑传统医疗服务
婺源:生态文旅催生新职业,村民共享“绿色红利”
帕金森病吞咽困难怎么办?康复训练和饮食调整是关键
黑枸杞、三文鱼、坚果:帕金森病患者的饮食良方
补肾益髓、温阳息风、化痰通络:中医治疗帕金森病痰症全攻略
一半帕金森病患者会抑郁,专家建议这样做
发病率攀升,专家推荐四招预防急性甲状腺炎
海带紫菜并非预防甲状腺炎良方,专家:碘摄入需适量