GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
乒乓球比赛奖励机制探讨:公司组织乒乓球比赛吸引众多员工参与
BCG分析法的理论框架与运用实践
如何申请成为国家行业标准的起草单位?
关税冲击下,科技股的机会和风险?
关税升级重构全球消费品供应链,内需迎发展契机!把握消费板块布局时点
大野芋:野生的是濒危植物,美味的小众蔬菜!
三叉神经痛是怎么回事
维生素C是蓝莓的4倍!好看又好吃的桑葚营养如何?一起了解
不要听导购瞎忽悠,全屋净水系统的使用寿命在这里
用营养均衡的家常菜为全家健康 “续航”,这样做营养均衡的家常菜,全家都爱
校服穿搭指南:玩转多彩校园风
BB便便全攻略:从胎便到辅食期,5个关键指标判断宝宝健康状况
沃柑和橘子的区别是什么?口感、营养与种植背后的秘密大公开!
铂基 ORR 催化剂形貌控制研究进展
服务器安装UEFI时,为何U盘无法启动系统安装?
喉咙痛能喝冰的吗?不同病因下的科学建议
360浏览器开机自动启动设置指南
赛时达:揭秘显示屏幕清晰度!显示器分辨率和PPI是什么?如何影响你的视觉体验?
《足球小将》中的角色消隐:长篇叙事中的配角困境与功能性牺牲
当MBA成为中产陷阱:精英教育如何沦为双重诅咒
宝藏珠宝新宠:莫桑钻、培育钻与培育彩宝首饰怎么选?
智能体验:用AI重构用户全感官交互
头皮屑问题:从医学角度探讨解决方案
期货燃油的市场特点是什么?如何分析其供需关系?
糖化血红蛋白是检查什么的?深度解读糖化血红蛋白
揭秘麻将胜率:数据支撑的策略与心理博弈
氯雷他定的功效与作用原理
新能源汽车动力电池回收:现状与破局之道
短暂性脑缺血发作(TIA)的诊断与治疗
高血压患者运动指南:运动类型、计划制定与注意事项全解析