问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

U-Net：生物医学图像分割的卷积神经网络架构

创作时间:

作者:

@小白创作中心

U-Net：生物医学图像分割的卷积神经网络架构

引用

CSDN

1.

https://blog.csdn.net/weixin_46831727/article/details/141390831

U-Net是一种广泛应用于图像分割任务的卷积神经网络架构，最初由Olaf Ronneberger等人在2015年提出。尽管它最初是为生物医学图像分割设计的，但由于其强大的特征提取和精细分割能力，U-Net已经被应用于各种其他领域。

什么是U-Net？

U-Net是一种基于全卷积网络（Fully Convolutional Network, FCN）的图像分割架构。它的独特之处在于其“U”形结构，由对称的编码器（Encoder）和解码器（Decoder）组成。编码器负责从图像中提取多尺度特征，而解码器则将这些特征逐步恢复到原始分辨率，从而生成高精度的分割结果。

U-Net的网络架构

U-Net的架构由两个主要部分组成：收缩路径（encoder）和扩展路径（decoder）。

U-Net架构详细示例

收缩路径（编码器）

收缩路径的作用是提取图像的多尺度特征，并逐步降低图像的分辨率。具体步骤如下：

步骤1：输入大小为256 × 256的图像，通过第一次卷积操作，使用3 × 3的卷积核，得到256 × 256 × 64的特征图。
步骤2：再进行一次3 × 3卷积操作，保持特征图的大小不变，输出仍然是256 × 256 × 64。
步骤3：通过2 × 2的最大池化操作（Max Pooling），将特征图的分辨率减半，输出为128 × 128 × 128。
步骤4：重复上述卷积和池化操作，最终得到16 × 16 × 512的特征图。
Conv1: ( 128 × 128 × 128 ) → ( 128 × 128 × 128 )
Conv2: ( 128 × 128 × 128 ) → ( 128 × 128 × 128 )
Pooling: ( 128 × 128 × 128 ) → ( 64 × 64 × 256 )
最终输出为：( 16 × 16 × 512 )

扩展路径（解码器）

扩展路径用于将编码器提取的特征恢复到原始分辨率，同时生成最终的分割图。具体步骤如下：

步骤1：将16 × 16 × 512的特征图通过反卷积操作（也称为上采样）扩展为32 × 32 × 256。
步骤2：将扩展后的特征图与编码器中对应层的32 × 32 × 256特征图拼接（Concatenate），得到32 × 32 × 512的特征图。
步骤3：再进行两次3 × 3卷积操作，将特征图精细化，输出为32 × 32 × 256。
Conv1: ( 32 × 32 × 512 ) → ( 32 × 32 × 256 )
Conv2: ( 32 × 32 × 256 ) → ( 32 × 32 × 256 )
步骤4：重复上采样和拼接操作，逐步恢复图像的分辨率，最终将特征图恢复为256 × 256 × 64。
Upsampling: ( 32 × 32 × 256 ) → ( 64 × 64 × 128 )
Concatenate: ( 64 × 64 × 128 ) + ( 64 × 64 × 128 ) → ( 64 × 64 × 256 )
Final Output: ( 256 × 256 × 64 )
最后一层：使用1 × 1卷积，将256 × 256 × 64的特征图映射到最终的类别数（例如：分割3个类别，输出为256 × 256 × 3）。
公式：Final Conv: ( 256 × 256 × 64 ) → ( 256 × 256 × 3 )

反卷积举例

假设我们有一个大小为2 × 2的输入特征图和一个2 × 2的卷积核，我们希望通过反卷积操作将其扩展为一个4 × 4的输出特征图。

1. 输入特征图和卷积核

输入特征图：
[ 1 2 3 4 ]
卷积核（假设所有元素均为1）：
[ 1 1 1 1 ]

2. 初始化输出特征图

我们初始化一个全零的4 × 4的输出特征图：
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ]

3. 逐步计算反卷积

步骤1：处理输入特征图的第一个元素1

卷积核与第一个元素相乘：
[ 1 1 1 1 ] × 1 = [ 1 1 1 1 ]
将结果累加到输出特征图的左上角：
输出特征图 = [ 1 1 0 0 1 1 0 0 0 0 0 0 0 0 0 0 ]

步骤2：处理输入特征图的第二个元素2

卷积核与第二个元素相乘：
[ 1 1 1 1 ] × 2 = [ 2 2 2 2 ]
将结果累加到输出特征图的右上角：
输出特征图 = [ 1 3 2 0 1 3 2 0 0 0 0 0 0 0 0 0 ]

步骤3：处理输入特征图的第三个元素3

卷积核移动到下一行与第三个元素相乘：
[ 1 1 1 1 ] × 3 = [ 3 3 3 3 ]
将结果累加到输出特征图的左下角：
输出特征图 = [ 1 3 2 0 4 6 2 0 3 3 0 0 0 0 0 0 ]

步骤4：处理输入特征图的第四个元素4

卷积核与第四个元素相乘：
[ 1 1 1 1 ] × 4 = [ 4 4 4 4 ]
将结果累加到输出特征图的右下角：
最终输出特征图 = [ 1 3 2 0 4 10 6 0 3 7 4 0 0 0 0 0 ]

通过以上步骤，我们将输入的2 × 2特征图通过反卷积操作扩展为4 × 4的输出特征图。在每一步中，输入特征图的元素与卷积核进行点积，并将结果累加到输出特征图的相应位置。反卷积的主要作用是“放大”特征图的空间维度，从而恢复图像的分辨率。

U-Net的训练方法

U-Net的训练依赖于大量的标注数据。首先，需要准备训练数据集，其中包括原始图像和对应的分割标签。为了提升模型的泛化能力和鲁棒性，通常会使用数据增强技术对训练数据进行扩充，包括旋转、缩放、平移、翻转和颜色调整等。

小批量训练

由于图像分割任务需要处理高分辨率图像，为了最大化GPU内存的利用率，通常会采用较小的批量大小（batch size），例如1到4。每次迭代通过一个小批量的图像计算梯度，并更新网络权重。

模型评估与保存

在训练过程中，模型会定期在验证集上进行评估。常见的评估指标包括交叉熵损失、Dice系数、IoU（Intersection over Union）等。为了避免过拟合，通常会应用早停策略，并保存验证集上表现最佳的模型。

损失函数选择

U-Net的损失函数选择直接影响训练的效果和分割结果的精度。以下是常用的损失函数：

交叉熵损失（Cross-Entropy Loss）

交叉熵损失是图像分割任务中最常用的损失函数之一。它通过计算预测概率与真实标签之间的差异来衡量模型的预测准确性。对于类别不平衡的场景，可以使用加权交叉熵，将更多的权重分配给较少出现的类别。

Dice损失（Dice Loss）

Dice损失通过直接优化分割结果的重叠度（即Dice系数）来提高小物体和边界区域的分割精度。它对于处理类别不平衡问题尤其有效，能够更好地保持细节。

联合损失

为了获得更好的分割效果，U-Net可以结合交叉熵损失和Dice损失进行训练。联合损失函数的形式为：
Loss = α × Cross-Entropy Loss + β × Dice Loss
其中α和β是可调参数，用于平衡两者的贡献。

实验结果

U-Net在各种图像分割任务中均表现优异，以下是一些典型的实验结果：

医学图像分割：U-Net在医学图像分割中表现尤为突出，尤其在肿瘤分割、器官分割任务中。实验结果显示，U-Net在ISBI挑战赛中取得了最佳的分割结果，Dice系数通常高达0.9以上。

总结

U-Net凭借其独特的架构设计和灵活的损失函数选择，在图像分割任务中取得了广泛的成功。通过合理的数据准备、优化器选择和损失函数调整，U-Net能够在多种分割任务中提供出色的结果。

热门推荐

重庆大渡口：垃圾分类进校园，童心同行向未来

重庆大渡口：垃圾分类进校园，童心同行向未来

如何加强PMC项目的进度管理

如何加强PMC项目的进度管理

PMC如何做好项目管理

PMC如何做好项目管理

基督山伯爵主旨思想是什么作者是谁

基督山伯爵主旨思想是什么作者是谁

胸痛就医指南：找准科室很关键

胸痛就医指南：找准科室很关键

拍照时如何找到适合自己脸型的角度

拍照时如何找到适合自己脸型的角度

如何利用手机拍出完美自拍（掌握技巧，让自拍更出彩）

如何利用手机拍出完美自拍（掌握技巧，让自拍更出彩）

校园楼梯楼道安全指南

校园楼梯楼道安全指南

阳光、水分、营养对兰花花品的影响分析

阳光、水分、营养对兰花花品的影响分析

中国平均家庭总资产约300万，住房占比超七成，你被“平均”了吗

中国平均家庭总资产约300万，住房占比超七成，你被“平均”了吗

衣服静电怎么处理最好？有效去除衣物静电的方法有哪些？

衣服静电怎么处理最好？有效去除衣物静电的方法有哪些？

足部麻木疼痛的治疗方法

足部麻木疼痛的治疗方法

沟通能力和团队协作能力在护理工作中的重要性如何体现

沟通能力和团队协作能力在护理工作中的重要性如何体现

大脑最爱的5种鱼类，建议多给孩子吃，有助大脑发育，增强记忆力

大脑最爱的5种鱼类，建议多给孩子吃，有助大脑发育，增强记忆力

额头太窄怎么改善？三种实用解决方案

额头太窄怎么改善？三种实用解决方案

清华狂降57分，全面出分！最新复试消息汇总

清华狂降57分，全面出分！最新复试消息汇总

如何在香港银行开户：所有你需要知道的步骤和注意事项

如何在香港银行开户：所有你需要知道的步骤和注意事项

便携式称重仪如何选型

便携式称重仪如何选型

中科院沈阳生态所揭示免耕秸秆还田对土壤微生物残体积累的影响机制

中科院沈阳生态所揭示免耕秸秆还田对土壤微生物残体积累的影响机制

饲养红鹦鹉鱼的几个注意事项

饲养红鹦鹉鱼的几个注意事项

星型模型（Star Schema）：详解与案例

星型模型（Star Schema）：详解与案例

止咳化痰的汤水有哪些

止咳化痰的汤水有哪些

保护插座怎么插？家居安全用电指南

保护插座怎么插？家居安全用电指南

手表和手环，区别你真的懂吗？

手表和手环，区别你真的懂吗？

女孩子内向怎么去沟通

女孩子内向怎么去沟通

冬季气温下降，电动车充电要注意这5点，电池能多使用2年

冬季气温下降，电动车充电要注意这5点，电池能多使用2年

这两种药食两用蔬菜建议老百姓常吃，功效不胜枚举，它们是？

这两种药食两用蔬菜建议老百姓常吃，功效不胜枚举，它们是？

WebHook：连接应用与实时事件的桥梁

WebHook：连接应用与实时事件的桥梁

孩子们的编程梦！如何通过机器人编程点燃他们的创造力？

孩子们的编程梦！如何通过机器人编程点燃他们的创造力？

农家自酿米酒口感

农家自酿米酒口感

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号