U-Net网络结构详解:从原理到实现
创作时间:
作者:
@小白创作中心
U-Net网络结构详解:从原理到实现
引用
CSDN
1.
https://blog.csdn.net/m0_72800308/article/details/139095117
U-Net是一种经典的卷积神经网络架构,主要用于生物医学图像分割任务。其独特的编码器-解码器结构能够有效地提取图像特征并进行精确的像素级分类。本文将详细介绍U-Net的网络结构及其关键组件,并探讨其在实际应用中的改进和优化。
网络结构概述
U-Net的网络结构可以分为两个主要部分:编码器(Encoder)和解码器(Decoder)。编码器负责特征提取和下采样,解码器则通过上采样和特征融合生成最终的分割图。
- 编码器(Encoder):对应U型结构的左半部分,主要通过卷积层和最大池化层进行特征提取和下采样。在论文中,这部分被称为收缩路径(contracting path)。
- 解码器(Decoder):对应U型结构的右半部分,通过上采样和跳跃连接(skip connections)逐步恢复图像的空间分辨率。这部分被称为扩张路径(expanding path)。
详细结构分析
我们从输入开始逐步分析U-Net的网络结构:
输入层
以572×572的单通道图像为例(单通道的原因在于第一个长条上面标的是数字1)。
编码器部分
- 卷积层:首先经过一个卷积层(蓝色箭头),卷积核大小为3×3,步长为1,padding为0。经过这个卷积层后,图像的高和宽会减小,变为570×570。接着再经过一个卷积层,变为568×568,通道数变为64。
- 下采样:接着进行一个2×2的最大池化操作,图像的高和宽缩小为原来的一半,从568变为284,通道数保持不变,为64。
- 重复卷积和下采样:重复上述卷积和下采样的过程,直到特征图的高和宽变为32,再经过两个3×3卷积层后,变为28,通道数变为1024。
解码器部分
- 上采样:首先进行一个转置卷积(绿色箭头),这是一个上采样操作,高和宽变为原来的2倍,从28变为56,通道数减半,变为512。
- 特征融合:在上采样后,通过一个灰色箭头表示的copy and crop操作,将左侧的特征图进行裁剪并与之拼接。例如,将64×64的特征图裁剪成56×56后与上采样后的特征图拼接,通道数变为1024。
- 重复上采样和特征融合:重复上述上采样和特征融合的过程,直到特征图的高和宽变为388×388,通道数变为64。
- 最终输出:最后通过一个1×1的卷积层(青蓝色箭头),将通道数调整为2,得到一个388×388×2的分割图。
现代实现的改进
现代实现中,U-Net的结构有一些改进:
- 添加padding:在卷积层中添加padding,使得经过卷积层后图像的高和宽保持不变。
- 加入BN层:在卷积层和ReLU之间加入Batch Normalization(BN)层,对输入张量的每个通道进行归一化操作。这种改进可以表示为conv+bn+relu的组合。
import torch.nn as nn
conv_bn_relu = nn.Sequential(
nn.Conv2d(in_channels=2, out_channels=8, kernel_size=3, stride=1, padding=1),
nn.BatchNorm2d(num_features=16),
nn.ReLU()
)
论文中的图像说明
输入输出区域:论文中的图2展示了输入和输出区域的关系。输入是蓝色框内的区域,输出是黄色框内的区域。对于边缘区域的处理,论文采用了镜像的原则,即以红色线为中心线对原图进行镜像处理。
分割示例:论文中的图3展示了具体的分割示例:
- 图A:原始图像的灰度图
- 图B:人工标注的实例分割标签数据
- 图C:语义分割图
- 图D:热力图,显示细胞间区域的权重分布
总结
U-Net通过其独特的编码器-解码器结构,能够在保持空间分辨率的同时提取深层特征,特别适合于生物医学图像的精确分割任务。现代实现中的一些改进,如添加padding和BN层,进一步提升了网络的性能和稳定性。
热门推荐
不羁的灵魂,独特的风格——艺术生的个性穿搭法则
火灾自动报警系统的组成和工作原理详解
小伙不幸被机器搅断右臂 医生奋战 6 小时重新接回
浅析镜头分辨率和MTF测试
公司规章制度的内部审查与评估
赤蛇之蕴:生肖文化的新时代表达
影视后期制作流程详解:从前期拍摄到特效制作
航线推荐 | 探索边境之城—丹东,感受不一样的魅力!
肺纤维灶什么意思,需要治疗吗
Excel高级数据处理:函数和公式的优化应用
如何让你的文字更具吸引力,让读者欲罢不能?
干蒸菜起势!地方小吃如何打造成全国品类?
太阳活动周接近峰值,除了极光多,还会如何影响我们生活?
皮下瘀血后为何会形成硬疙瘩及处理方法
开发音乐游戏的流程是什么?
福建高等教育:聚焦服务发展 综合实力显著提升
电阻上的数字意义及电阻值辨别方法
“自动辅助驾驶汽车”交通事故侵权主体责任分担规则研究
arctan与tan如何互换?深入解析反正切与正切的关系
这款上海元素满满的游戏走红,他们为啥扎堆在上海做二游?
如何搭建稳定的服务器环境:从选择到配置的全流程指南
如何管理项目论文的结题
多花上万元!买车要不要关注L2级别辅助驾驶?
错误代码0x800700E1该怎么解决
Win10错误代码0x800700E1的五种解决方案
执保冻结解除时间及法院处理流程揭秘
企业人力资源部如何确保合规性和遵循法律法规?
DeepAlpha短周期因子研究系列之:LSTM在量化选股中的应用
收缩压偏低的原因及危害
染整管理创新项目有哪些