GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
孩子先是轻微咳嗽然后才发烧怎么办?
躁郁症怎么办?全方位治疗与生活指南
双相情感障碍是什么,能治好吗
困扰科学家多年的问题:为什么太阳日冕的温度是表面温度的200倍?
智力障碍儿童的行为特点是什么
仿生科技将自然设计带入可持续建筑的3种方式
纸牌接龙对大脑有益吗? (提升记忆力)
小型犬买哪些好养的品种?哪些品种最适合家庭饲养?
建设项目管理由哪些费用组成
如何从创新创业的案例中提炼出可借鉴的经验?
西班牙地中海风格特点 西班牙地中海装修风格元素
睫毛增长液可以用来增长眉毛吗
无锡聚力打造全产业链品牌 助力现代产业高质量发展
冠状病毒感染后该如何处理出汗症状
梦见自己没穿裤子:多重象征意义解析
小小针头也有大学问:输液途径的选择与护理
集成电路设计中的功耗优化方法
厦门十大特色美食:从沙茶面到土笋冻,必尝的闽南美味
解锁几何奥秘:圆锥体积计算公式及应用
如何利用AI进行用户体验测试
氢弹是核聚变还是核裂变 基本原理是什么
高句丽的坚韧与战略
如何利用教师工作绩效评估系统反馈来改进教学?
绿檀玉珠手串的寓意、材质、制作工艺以及适合佩戴的人群全面解析
一个月辟谣三次,小米被舆论危机盯上了?
停工留薪期护理费和工资怎么算?老板不发怎么办?
揭秘:纨绔子弟为何常被误读为执跨子弟?
江西事业单位考试大解密:2024笔试内容与模拟题全攻略
巳火与十二地支关系解析——兼论于都杨公风水
同样是注射青霉素,为何中国要做皮试,而欧美却不用?