资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

使用深度学习的卫星图像超分辨率

创作时间:

作者:

@小白创作中心

使用深度学习的卫星图像超分辨率

引用

CSDN

https://blog.csdn.net/qq_35918970/article/details/129250425

随着商业航天工业的快速发展，低成本卫星图像的获取变得越来越普遍。然而，这些图像往往存在分辨率较低的问题。本文介绍了一种基于深度学习的卫星图像超分辨率技术，通过训练无监督学习算法来增强图像质量。这种方法不仅能够提高图像的清晰度，还能够保留图像中的细节信息，为遥感领域的应用提供了新的可能性。

Yann LeCun将监督学习比作锦上添花，将无监督学习比作蛋糕，断言我们知道如何做锦上添花，但不知道如何做蛋糕。在这篇文章中，我们提供了一个训练无监督学习算法以增强卫星图像的“蛋糕”食谱。

这项研究的动机是在新兴的商业航天工业中越来越多地获得低成本卫星图像。在这个新兴行业中，需要在传感器质量、重访率和价格之间进行权衡。我们研究了高级图像处理在减少权衡和改善同等价位的低质量传感器图像方面的潜力。

图 1：通过飞机、太空遥感。

该图意在传达遥感活动的潜在重叠。航空遥感可用于增强商业精美的卫星图像。商业精美的卫星图像可用于增强低分辨率卫星图像。

我们将高分辨率图像的图像细节嵌入到深度神经网络(DNN)中，并提取细节以增强地理相似图像。

什么是超分辨率？

有多种形式的图像增强，包括降噪和颜色调整。对于卫星图像，一种常见的图像质量度量是地面采样距离(GSD)，这是图像中一个像素表示的物理度量。这篇文章中的增强是指降低（更好）卫星图像中的GSD，也称为超分辨率。超分辨率过程合成图像中的亚像素信息以提高图像的分辨率。典型的合成技术包括：

图像内附近像素的插值
视频中附近帧的插值
频率滤波，以降低噪声

在本次调查中，我们将这些技术扩展到包括：

来自地理相关图像的深度学习结构。

图 2：超分辨率。

要将超分辨率从不适定的优化问题转化为适定的逆问题，我们必须从更高分辨率的图像开始，降级该图像，并优化超分辨率算法以从降级的图像重建原始图像。峰值信噪比衡量原始图像和重建图像之间的差异。

为了量化我们的增强技术的有效性，我们将增强前的峰值信噪比(PSNR)与增强后的PSNR进行比较。此外，我们展示了PSNR在图像上的地理分布及其与进一步分析的相关性。

PSNR是衡量超分辨率算法生成能力的自然选择。我们计划在未来发表一篇关于使用生成对抗网络学习更好的成本函数来执行超分辨率的文章。

具有扰动层的全卷积神经网络

在直接得出结果之前，我们绕道讨论为执行超分辨率过程而开发的架构。AlexNet、ResNet、VGG和GoogLeNet等标准DNN是低分辨率图像上图像分类和对象检测的绝佳架构，但不适用于超分辨率中呈指数级增长的输出空间。

受ResNet的启发，我们决定设计一个新的DNN作为恒等图的一系列扰动，因为超分辨率本质上是对较低分辨率图像的扰动。通过优化前一层和当前层的凸组合，网络一次扩展一层，为新层生成可训练的权重（旁路参数），以衡量其对最终输出的贡献。

图 3：我们的凸扰动层与 ResNet 层的比较。在这两种架构中，都有一个卷积层与一个恒等函数的组合。凸扰动允许一个人训练到最佳组合。随着 beta 值的降低，该层对增强的贡献也会降低。

这种结构有几个好处：

该网络架构非常适合用于训练极深神经网络的现代训练策略，包括跳跃连接和随机深度。
旁路参数衡量每一层的贡献，反馈网络应该有多深。
每一层执行近似恒等式变换，使用不同的结构增强图像。

在每个扰动层中，我们包括至少两个卷积层和每个卷积层之间的非线性ReLU层。扰动层内的更多卷积层增加了扰动层增强图像的能力，但训练收敛变得更加困难。或者，额外的扰动层具有类似的增强潜力而没有收敛问题。

图 4：具有扰动层的深度神经网络。

旁路参数直接反馈每个扰动层的影响。此反馈有助于回答网络必须有多深的问题。

图 5：训练期间绕过参数。

旁路参数的权重是在训练过程中绘制的。对于这个特定的训练算法，每层的训练分两个阶段进行：首先训练该层的参数，其次所有先前训练的参数与新层联合优化。旁路参数随着网络的增长而减小。最终，新层的影响不会影响增强图像中像素的积分值（不与其他层聚合）——这定义了一个亚像素阈值。

本实验

我们执行的初始实验测量了DNN增强巴拿马运河上退化的3波段GeoTIFF的能力。我们在实验中使用了由DigitalGlobe提供的两张GeoTIFF（非常大的卫星图像）：一张用于训练，一张用于测试。我们不会通过一次DNN增强整个图像，而是一次增强27像素x 27像素的区域。由于GeoTIFF是非常大的图像，因此采样27像素x 27像素区域可为我们的DNN提供足够的训练数据。访问更多训练图像应该会改善结果。使用这两个GeoTIFF，我们继续训练DNN：

重新缩放两个GeoTIFF以有效降低图像的分辨率。
来自第一个GeoTIFF的区域被随机采样以一次训练DNN一层。我们训练DNN的权重以最大化DNN输出的PSNR。
DNN用于增强两个降级的GeoTIFF。
结果与基于插值的增强算法进行比较。

我们使用TensorFlow框架在配备4个Titan X GPU的2015 Nvidia Devbox上构建、训练和推断DNN，但我们只使用一个GPU来训练DNN。为了训练神经网络，我们使用了ADAM优化算法；ADAM具有影响训练时间和收敛速度的相关参数。我们没有完全探索ADAM参数的最佳选择，但每个扰动层花费了大约12小时（在一个Titan X GPU上）训练。旁路参数收敛的速率（如图5所示）有助于我们选择ADAM参数以及随后的训练时间。

结果

在这个实验中，我们有两张巴拿马运河周围的GeoTIFF图像，一张用于训练，一张用于测试。

图 6：巴拿马运河的卫星图像。这是 DNN 的原始训练图像。

第一步是通过降级GeoTIFF创建训练数据。通过调整GeoTIFF的大小，生成的退化图像有效降低了GSD或分辨率。使用线性插值作为起点，我们可以绘制整个退化图像的PSNR分布。

图 7：DNN 输入中 PSNR 的分布。DNN 的输入是一个退化的卫星图像，它被调整大小（使用线性插值调整为 2 倍）以匹配原始 GeoTIFF 的尺寸。该图显示了降解过程引入的噪声的位置。蓝色区域有更多由退化过程引入的噪声，而红色区域则更少。蓝色区域往往是具有精细结构的区域（如船），而红色区域往往具有更粗糙的特征（如开阔水域）。

图7表明，用一个数字来表示PSNR不足以描述卫星图像中的噪声。与结构较少的区域（例如水）相比，具有更多结构的区域（例如船）在退化图像中具有更低的PSNR。当我们训练超分辨率算法来增强退化图像时，我们想要增强我们关心的区域，这些区域通常是具有结构的区域。

图 8：使用 DNN 增强后的 PSNR 增益。绘制了测试图像的 PSNR 增益分布——DNN 未在该图像上训练。大多数地区都受益于增强。蓝色区域是原始图像中噪声明显较少的一般区域。增强是与初始线性插值相比的 PSNR。

图 8：PSNR 增益与双三次插值。在测试 GeoTIFF 上，我们绘制了 PSNR 与双三次插值相比的差异。最初噪声较多的区域也会受益。

图 9：从线性和双三次插值到基于 DNN 的增强的 PSNR 变化（以 dB 为单位）。PSNR 变化是在整个 GeoTIFF 和包含船只的 GeoTIFF 的子区域上计算的。结构区域的增强明显高于水区域。

图9中的结果证明基于DNN的增强在具有更多结构的区域中提高了性能。即使测试图像和训练图像具有相同的GSD，不同的大气条件和云层覆盖也会影响增强，部分解释了测试图像的性能优于训练图像的性能。图像清晰度也会影响标记包含船只的区域的能力；不太准确的标签包括更多的水域，并且可能会降低该区域的dB增益。隔离这些现象的实验超出了本文的范围。

图 10：船加水域增强示例。此图显示了退化船的增强。由于该区域包含大部分水，因此 PSNR 低于仅包含一条船的区域。