GAM全局注意力机制:保留信息以增强通道与空间的相互作用
创作时间:
作者:
@小白创作中心
GAM全局注意力机制:保留信息以增强通道与空间的相互作用
引用
1
来源
1.
https://developer.aliyun.com/article/1651559
本文介绍了一种名为GAM(Global Attention Mechanism)的全局注意力机制,该机制通过3D排列和重新设计的子模块,能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互丢失的问题。
GAM注意力原理
整体结构
GAM采用了来自CBAM的顺序通道-空间注意力机制,并重新设计了子模块。给定输入特征图$F_{1} \in \mathbb{R}^{C \times H \times W}$,中间状态$F_{2}$和输出$F_{3}$的定义为:
- $F_{2} = M_{c}(F_{1}) \otimes F_{1}$
- $F_{3} = M_{s}(F_{2}) \otimes F_{2}$
其中$M_{c}$和$M_{s}$分别是通道和空间注意力图,$\otimes$表示元素级乘法。
通道注意力子模块
使用3D排列来保留跨三个维度的信息,然后通过两层MLP(多层感知机)放大跨维度的通道-空间依赖性。MLP是具有压缩比$r$的编码器-解码器结构,与BAM相同。
空间注意力子模块
为了关注空间信息,使用两个卷积层进行空间信息融合,并使用与通道注意力子模块相同的压缩比$r$(与BAM相同)。同时,由于最大池化会减少信息并产生负面影响,所以移除了池化以进一步保留特征图。为了防止参数显著增加,在ResNet50中采用了具有通道打乱的组卷积。
优势
- 保留信息:通过3D排列和重新设计的子模块,GAM能够在通道和空间方面保留信息,避免了先前方法中由于信息减少和维度分离而导致的全局空间-通道交互的丢失。
- 放大交互:能够放大“全局”跨维度交互,捕获所有三个维度(通道、空间宽度和空间高度)上的重要特征,从而增强了跨维度的交互能力。
- 性能提升:在CIFAR-100和ImageNet-1K数据集上的评估表明,GAM稳定地优于其他几种近期的注意力机制,无论是在ResNet还是轻量级MobileNet上,都能提高性能。例如,在ImageNet-1K数据集上,对于ResNet18,GAM以更少的参数和更高的效率优于ABN。
参考文献
热门推荐
装饰工程质量纠纷怎么解决
养肝从吃开始:四个饮食方法助力肝脏健康
AI工具:最受欢迎与最佳体验的探索
清凉琴苑:古琴指法如盖楼,宜慢不宜快
2024年广东省博物馆藏品管理业务培训在广州东莞成功举办
哀兵必胜,伤残的国足,反而有可能主场对阵澳大利亚拿分
高墙内的团圆:一盏灯,照亮归途
江南环境的自然景观和居住体验如何?这些因素如何影响居民的生活质量?
胃部肿瘤切除术后饮食指南:从流质到正常饮食的科学调理
什么是“缠腰龙”?不要慌!带状疱疹做好5点预防,降低患病风险
常见的三种高分子材料3D打印技术:FDM、SLS、SLA
未成年人办理身份证需要监护人陪同吗?
中国银行前2月收53张罚单,涉及金额超1100万元
孩子扁桃体和腺样体肥大,用不用切除?听听医生怎么说
吃什么补脾虚?10大必吃食物推荐
广西的奇怪习俗:人去世安葬了,为何几年后又挖出来重新安葬?
追溯英雄时代:吉尔伽美什与轩辕,谁更早?
谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得
研发团队中的角色定义和分工
生活与法︱舞蹈兴趣班闭店停业,没上几节课的消费者该吃哑巴亏吗?
材料化学表征检测方法大全
重庆长江三峡黄金游轮四日游攻略游记_长江黄金游船旅游线路推荐
如何找到并应对网络犯罪的法律策略
“身残志坚”的6位残疾艺人,个个才华横溢,有的不到1岁就失明
喀什市有哪些不可错过的旅游景点和特色体验?
解析一本二本大学差异:选拔标准与教育前景对比
申花背水一战,能否逆袭神户?亚冠精英联赛东亚区第8轮前瞻!
气膜体育馆建设解析:成本、因素与投资前景
职业健康体检项目及周期的法律规范与实施
甲鱼的养殖方法及注意事项(甲鱼养殖技术)