GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
有关游标卡尺的书籍
做事情要有闭环思维
跑步增高,真的有科学依据吗?
深入解析接近开关的最远距离与应用优势
冥想对抑郁症有好处吗
云南南华:“菌旅融合”拓展群众增收致富路
50平改水电一般多少钱?装修预算全解析
家装电话销售管理指南:从目标设定到风险管理的全方位策略
出国旅游换汇指南:六大实用建议助你轻松应对境外支付
新手也能轻松做的美味蘑菇汤(简单易学的蘑菇汤做法)
胀气"胃嘟嘟"小心消化不良!酵素助消化,喝蔬果汁有关键时间
地中海饮食中的全谷杂粮:如何提升你的营养摄入
莱西旅游:美丽自然的探秘之旅
关于腺样体肥大,你知道哪些?
警惕!“免密支付”实际是“自动扣款”?已有超5万条投诉
深圳北理莫斯科大学:中俄合作的高水平国际化高校
从DeepMind到OpenAI:科技巨头竞逐AI制药,形塑新经济超级周期
提高母猪产奶量的有效方法
荆州特产,流动的城市印记
荆州农产品加工产业:“链”出一篇新天地
霍兰德职业兴趣测试ACI型
它的发明,意义重大——弧度制
3个信号证明你缺钾了,医生多次提醒:做好3件事,或有助身体补钾
五岳独尊泰山的历史文化背景及旅游攻略
HR背调全解析:调查哪些内容?如何进行?
线上购药调查:便捷与风险并存,多方合力促规范
让青年敢生愿生 生育友好型社会如何构建
不同移动应用类别必备 KPI
张辽:三国时期的军事英雄与战略高手
明朝“妖僧”姚广孝:从佛门弟子到靖难功臣的传奇人生