GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
地图投影简介
AI大模型在航运业的应用
胃溃疡和十二指肠溃疡的疼痛区别
十二指肠溃疡和胃溃疡有什么区别
2025乙巳年五运六气,2025年五运六气及疾病分析
一叶莲什么时候开花?花期长达8个月的养护要点
成长励志文言文短句精选
从IDE到SATA:硬盘数据接口的进化之路
PC端、Web端和移动端开发的主要区别
热效率提升至46.3% 中国自主发动机用60年问鼎全球
HIV核酸阴转阳:科学理解背后的意义与挑战
学校食堂的痛:智慧食堂如何破解营养与管理的双重困境?
岳阳楼记背诵技巧图 原文及翻译整理
可降解塑料袋行业深度市场分析及前景展望
如何了解不同类型的公司业务?这些公司的市场定位是怎样的 ...
这 9 大免疫治疗不良反应咋处理?梳理指南,权威答案在这里!
聊聊与校园霸凌相关的心理话题
叙永县:做强康养文旅 激活生态价值
最简单对比图告诉你:美元大幅贬值对全球市场意味着什么?
《周易》象数体系——八卦与五行的配属关系
为什么要约束患者:医疗行为中的法律与伦理探讨
痛经的四大缓解方法:从生活调理到药物治疗
IFF发布《2024 全球金融与发展报告》:绿色金融助力可持续发展
近视的影响真有这么多吗?真的!
王宝强在《棋士》中上演类型变奏 创新叙事引热议
酒后头疼怎么办?四种科学缓解方法请收好
蒸汽管道重大风险安全检查怎么做?
“不过尔尔”:一则非典型成语的剖析
CRM系统如何优化客户服务流程?4个重要方案
脑转移瘤影像诊断