2025最新方案!Mamba赋能UNet!轻松实现高效分割!
创作时间:
作者:
@小白创作中心
2025最新方案!Mamba赋能UNet!轻松实现高效分割!
引用
CSDN
1.
https://blog.csdn.net/d22800/article/details/145870344
Mamba-UNet模型通过结合状态空间模型(Mamba)和经典UNet架构,旨在提升图像分割任务的性能。本文将介绍四篇相关论文的研究内容、方法和创新点,包括VM-UNET-V2、Weak-Mamba-UNet、CM-UNet和Mamba-SEUNet等模型在不同领域的应用和性能提升。
论文1:VM-UNET-V2
标题:VM-UNET-V2:重新思考用于医学图像分割的视觉曼巴UNet
方法:
- Vision State Space (VSS) Block:引入视觉状态空间块,用于捕获广泛的上下文信息,通过2D选择性扫描模块(SS2D)处理输入数据。
- 语义和细节注入(SDI)模块:增强低级和高级特征的融合,通过注意力机制对特征图进行空间和通道注意力计算,调整特征图的尺寸以匹配目标参考。
创新点:
- 性能提升:在ISIC17数据集上,VM-UNetV2的mIoU、DSC和Acc指标分别达到82.34%、90.31%和96.70%,相比UNetV2提升了超过2%的mIoU和DSC,准确率提升了0.38%。
- 计算效率:模型参数量减少至17.91M,FLOPs降低至4.40G,FPS提升至32.58,相比UNetV2在FLOPs和FPS上分别提升了约20%和1.6%。
- 长距离依赖建模:通过VSS块的线性复杂度和高效建模能力,解决了CNN在长距离依赖建模上的不足,同时避免了Transformer的二次复杂度问题。
- 语义和细节融合:通过SDI模块将语义信息注入低级特征,同时用细节信息优化高级特征,显著提升了分割精度。
论文2:Weak-Mamba-UNet
标题:Weak-Mamba-UNet:视觉曼巴使CNN和ViT在基于涂鸦的医学图像分割中表现更好
方法:
- 多架构融合:结合CNN(UNet)、ViT(SwinUNet)和Mamba(MambaUNet)三种架构,通过编码器-解码器网络实现局部特征提取、全局上下文理解和长距离依赖建模。
- 伪标签生成:通过多视图交叉监督机制,将稀疏的涂鸦标注转换为密集的伪标签,用于迭代学习和网络优化。
创新点:
- 性能提升:在MRI心脏分割数据集上,Weak-Mamba-UNet的Dice系数达到0.9171,准确率(Acc)达到99.63%,相比仅使用UNet或SwinUNet的框架,Dice系数分别提升了约0.017和0.012。
- 多视图交叉监督:首次提出结合CNN、ViT和Mamba架构的多视图交叉监督框架,通过伪标签实现不同网络之间的协同优化,显著提升了分割精度。
- 稀疏标注适应性:在涂鸦标注的弱监督条件下,通过伪标签生成和多网络协同训练,显著降低了对密集标注的依赖,降低了标注成本。
- 架构互补性:验证了Mamba架构在弱监督任务中的有效性,通过结合CNN和ViT的优势,进一步提升了模型的泛化能力和分割性能。
论文3:CM-UNet
标题:CM-UNet:用于遥感图像语义分割的混合CNN-Mamba UNet
方法:
- CNN编码器与Mamba解码器:提出CM-UNet框架,结合CNN编码器提取局部特征和Mamba解码器聚合全局信息,实现高效的语义分割。
- CSMamba块:引入CSMamba块作为核心分割解码器,通过通道和空间注意力增强特征交互和全局-局部信息融合。
创新点:
- 性能提升:在ISPRS Potsdam数据集上,CM-UNet的mF1达到93.05%,OA为91.86%,mIoU为87.21%,相比UNetformer分别提升了0.25%、0.56%和0.41%。在ISPRS Vaihingen数据集上,mIoU达到85.48%,相比其他方法提升了2.78%到16.08%。
- 全局-局部信息融合:通过CSMamba块和MSAA模块,有效整合全局和局部信息,显著提升了对大规模遥感图像的分割性能。
- 计算效率:CM-UNet在FLOPs、参数量和内存占用上表现出色,FLOPs仅为6.01G,参数量为12.89M,内存占用为366.33MB,同时mIoU达到85.48%,优于其他模型。
- 架构优化:结合多尺度特征学习和多输出监督,进一步提升了模型对复杂场景的分割精度。
论文4:Mamba-SEUNet
标题:Mamba-SEUNet:用于单声道语音增强的Mamba UNet
方法:
- Mamba-UNet架构:提出Mamba-SEUNet,结合Mamba和U-Net框架,通过双向Mamba块捕捉语音信号的前向和后向依赖关系。
- TS-Mamba块:引入时间-频率Mamba块,通过双向SSM公式整合过去和未来信息,增强全局和局部特征学习。
创新点:
- 性能提升:在VCTK+DEMAND数据集上,Mamba-SEUNet (L)的PESQ分数达到3.59,STOI为0.96,CSIG为4.80,CBAK为4.02,COVL为4.32。结合感知对比拉伸(PCS)技术后,PESQ进一步提升至3.73。
- 计算效率:相比Transformer和Conformer,Mamba-SEUNet显著降低了计算复杂度,FLOPs仅为10.28G(Mamba-SEUNet (M)),同时性能优于Conformer和Transformer。
- 双向信息捕捉:通过双向Mamba块,有效整合语音信号的前向和后向依赖关系,提升了对长序列语音信号的建模能力。
- 多尺度信息融合:通过U-Net架构中的跳跃连接和多尺度特征融合,增强了对语音信号细节的恢复能力。
热门推荐
如何为视觉障碍用户设计更友好的UI
小孩的乳牙是否可以进行根管治疗?了解乳牙根管治疗的必要性与适应症。
怎么查看内存条频率:全面指南
重点群体税收优惠 “入场券”:企业必备条件大盘点
Markdown换行符使用指南:从基础到实战
短视频拍摄剪辑师:职位描述、收入及工作内容全解析
乳糖不耐受要做哪些检查? 了解乳糖不耐受的检测方法和依据
甲酸生产技术新进展
“四叔”李兆基与香港经济往事
家庭聚餐不发愁,掌握这几道家常菜,家庭聚餐秒变厨神秀场
中美乙烷贸易格局演变:机遇与挑战并存
字节跳动张一鸣登顶中国首富,雷军首次跻身榜单前十
那些穿越凛冬的命运故事,在这些中短篇新作里交汇
黄山绝美风光必打卡十大景点深度游攻略合集
i人、e人后,偷感人、盗感人横空出世,你是什么感?
“齐味万方”的千年传承与创新
精神慰藉:如何化解情绪压力与焦虑,重拾内心平静与快乐
汉堡吃不完怎么保存?冷藏还是冷冻?
泰克示波器使用指南:采样频率与FFT功能设置详解
零存整取:一种灵活的储蓄方式
团队管理核心要点:如何有效领导和激励你的团队?
Minecraft刷线机修复引发生电玩家热议:社区如何应对游戏机制变更
什么是财务BP?500强财务BP每天都在干什么?
为流动摊贩“安家”——市城市管理局探索规范城市摊贩管理
新国标GB 4717-2024《火灾报警控制器》,一图读懂!
呕吐、腹泻、腹痛,可能得了诺如病毒!中医调护有妙招
美国本科120分的意义与解读
LED波长、发光颜色与实际应用概谈
羊肚菌工厂化栽培技术取得突破:产量翻四倍,有望走上百姓餐桌
数据报交换与虚电路交换:两种基本的数据传输方式