GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
女人气血不足用什么方法食疗
胎儿心脏彩超最佳时间及注意事项全解析
国内期货的品种分类依据是什么?这种依据对市场有何作用?
Windows10 如何让笔记本的显示屏和外接显示器显示两个画面
腾讯围棋入门-行棋
仓配一体是什么模式,看完你就知道了[物流知识]
艾叶煮鸡蛋的做法是什么?有哪些健康益处?
金属材料的全面解析:种类、特性与应用
新手入门:如何找到公路车最佳胎压
文润庭州 | 非遗里的昌吉——回族宴席九碗三行子
图数据库在处理复杂关系数据中的优势与应用场景
隐藏于名画《伏尔加河上的纤夫》背后的精彩故事
家长版:简单易学的古诗配画指南,让孩子轻松掌握绘画技巧
半导体又行了?超百家机构调研3家电子行业公司
电脑上享受高品质DSD音乐,解码软件与播放步骤详解
C罗重返曼联后 曼联进球数排名!就这进球效率 真的是C罗耽误的?
白术种植知识详解(几月份种植最合适)
RTX3060游戏性能优化全攻略
X荧光测硫仪在微量硫分析中的重要性
从零到一:一键秒出PPT的实用技巧与应用
20句诗词,20种向往的生活:心中有诗意,处处皆清欢
神秘地质之美|顾艳荣:“洞”见贵州
黄金投资的风险与收益:深度剖析及应对策略
橡胶-20号胶近期强势反弹,后市能保持上涨势头吗?
深度解析期货橡胶价格波动:多重因素影响下的投资策略
产品开发工程师如何提升自己的职业技能?
探索济宁美景:一份实用的旅游指南
哪些行业适合进行生态数字化布局?
法乙:克莱蒙vs亚眠,谁能扭转目前的颓势?
私家侦探是否合法合规的服务范围