问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

基于深度学习的街景图像建筑高度估算：iBHEDC算法详解

创作时间:

作者:

@小白创作中心

基于深度学习的街景图像建筑高度估算：iBHEDC算法详解

引用

CSDN

1.

https://blog.csdn.net/qq_33366130/article/details/144166452

随着城市化进程的加快，建筑高度数据在城市规划、灾害评估等领域变得越来越重要。传统的建筑高度测量方法往往成本高昂且效率低下，而基于街景图像的建筑高度估算提供了一种新的解决方案。本文将介绍一种基于深度学习和图像处理的建筑高度估算方法，该方法能够从街景图像中自动估算建筑高度，具有较高的精度和鲁棒性。

论文题目: Building height estimation from street-view imagery using deep learning, image processing and automated geospatial analysis
中文题目: 基于深度学习、图像处理和自动地理空间分析的街景图像建筑高度估算
作者: Ala’a Al-Habashna, Ryan Murdoch
作者单位: 加拿大统计局特别业务项目中心数据探索和集成实验室，加拿大渥太华
投稿时间：2023年5月16日
修改时间：2023年8月24日
接受时间：2023年9月28日
在线发表时间：2023年11月11日
期刊: Multimedia Tools and Applications（中国科学院SCI期刊分区的四区）

摘要

近年来，许多研究致力于从街景图像中提取有关建筑和基础设施、交通与移动性、步行性以及健康与福祉的有价值数据。本文提出了两种算法及其实现方法，用于利用深度学习（DL）和高级图像与地理空间数据处理算法，从街景图像中自动估算建筑高度。具体包括：

BHEDC算法：基础算法，用于估算建筑高度。
iBHEDC算法：改进版算法，增加了新的组件和优化步骤。

本文旨在通过改进现有算法 (BHEDC)，提出一种新的方法（iBHEDC），以提高建筑高度估算的精度和效率。

背景

建筑高度是城市建模与规划、城市与经济分析等领域的重要数据。传统方法依赖于昂贵的测量设备或高分辨率遥感图像，而街景图像提供了一种低成本、高可用性的替代方案。尽管街景图像在地理空间数据提取中具有潜力，但如何从中准确估算建筑高度仍然是一个挑战，尤其是在复杂的城市环境中。

相关研究

步行性分析：Smith等人提出了一种方法，通过街景图像提取人行道的存在及质量数据，用于设计步行友好型城市。
道路表面分类：Marianingsih和Utaminingrum使用街景图像训练分类器，将道路表面分类为多种类型（如沥青、砾石）。
视觉定位：通过与地理标记图像的比较，预测图像的地理位置。
建筑高度估算：Zhao等人提出了一种基于语义分割和边缘检测的建筑高度估算方法。Al-Habashna提出了BHEDC算法，利用街景图像和建筑轮廓数据进行高度估算。

方法

iBHEDC算法概述

预处理与语义分割：对输入图像进行预处理，使用CNN生成语义分割图像，提取建筑物区域。
建筑维度提取：通过颜色变换和单应性变换，提取建筑物在图像中的高度。
轮廓与顶部点提取：使用Ramer-Douglas-Peucker算法提取建筑轮廓，并确定建筑顶部点。
高度估算：结合相机投影模型和校正因子，估算实际建筑高度。

相关处理技术概览

颜色变换：对图像像素进行颜色变换，以避免语义分割输出中的问题。
单应性变换：将图像归一化为零俯仰角图像。
语义分割：使用训练好的CNN生成语义分割图像。
阈值处理：提取建筑物像素区域，并通过提取最大连通区域消除无关子区域。
轮廓提取：使用Ramer-Douglas-Peucker算法对轮廓进行近似，提取建筑物的顶部点。
相机投影模型：结合图像中的建筑维度和相机元数据，估算实际建筑高度。

数据集和评价指标

数据集

数据集包含400个建筑物的街景图像及其对应的建筑轮廓数据。数据来源包括多个平台（如Open Street Map和其他地理空间数据平台）。

评价指标

高度估算精度：通过与真实建筑高度的对比，评估算法的准确性。
算法鲁棒性：在复杂场景（如遮挡、光照变化）下测试算法的表现。

实验结果与分析

iBHEDC算法的工作流程

整个工作流程从获取街景图像开始，通过数据预处理、深度学习相关处理、地理空间数据分析和图像处理一步步实现建筑高度的估算。

预处理步骤对输入图像的影响

左图（a）：原始街景图像，体现了捕获数据的初始状态，但可能包含一些不利影响，比如色彩不均、光照问题、视角偏差等。

右图（b）：经过强度变换（Intensity Transformation）和图像校正（Plane-to-Plane Homography）后的图像，处理后建筑物呈现更好的可见性，同时减小了因拍摄角度引起的倾斜和失真问题。

强度变换（Intensity Transformation）：增强图像的对比度，为后续任务提供更清晰的边缘与物体分界线。
单应性变换（Plane-to-Plane Homography）：校正因相机拍摄角度引起的图像倾斜和投影变形问题。

预处理步骤对语义分割的影响

左图（a）：未经处理的原始街景图像（来自 Google Street View）。

右图（b）：未经预处理情况下语义分割的结果，展示了算法在分割建筑物区域时的失败案例。

定义感兴趣的区域

图6中的分割是令人满意的；然而，相邻的建筑被组合成一个单一的连接组件（都是同一个连接子区域的一部分）。高度估计的下一步是识别建筑物子区域中的最高点。然而，当相邻的建筑组合成一个连接的组件时，最高点可能属于错误的建筑。为了帮助避免选择属于不正确建筑物的点，开发了以下水平搜索区域识别算法。

建筑物轮廓提取和顶点检测

建筑高度估算的两步关键流程

平面单应性变换和校正

使用校正模型对建筑物实际高度估算结果的影响

自动选择相机仰视角度 (pitch)

从OpenStreetMap (OSM) 数据中提取建筑的边界轮廓以及节点信息

相机到建筑物水平距离的几何模型

高度计算

公式:
h ^ b = h u ⋅ d ′ / f + h c \hat{h}_b=h_u\cdot d^{\prime}/f+h_ch^b =hu ⋅d′/f+hc

h ^ b \hat{h}_bh^b : 估算的建筑高度 (Estimated Building Height)。
h u h_uhu : 建筑最高点相对于图像的中线（水平中线）所占的像素高度，表示为像素单位的垂直距离
d ′ d'd′: 相机到建筑的水平距离 (Projected Distance to the Building)
f ff: 相机的焦距 (Focal Length)
h c h_chc : 相机距地面的高度, 表示相机安装点到地面的固定高度，即相机本身的基础高度，通常由相机持有者（如人或车辆）的高度决定，为一个常量

效果

展示了针对不同类型住宅建筑的高度估算结果示例

高层公寓建筑 (apartment buildings)：在每张图片顶部显示了估算出的建筑高度值，分别为 44.451 米和 35.401 米。
低层住宅 (houses)：图片展示了独立式住宅的高度估算值，分别为 9.152 米和 9.154 米。

针对不同类型的非住宅建筑（Non-residential Buildings）的高度估算结果可视化示例

办公楼 (Office Building)：估算高度为 21.683 米，属于较高类型的建筑。
小型办公建筑 (Small Office Building)：估算高度为 8.714 米，是一种相对较低的办公场所建筑。
零售店 (Retail Store)：估算高度为 12.069 米，为常见的中型商业建筑高度。
餐厅 (Restaurant)：估算高度为 6.315 米，为低矮的单层小型商业建筑

两种算法（BHEDC 和 iBHEDC）在建筑高度估算任务中的绝对误差分析结果：

iBHEDC 显著优于 BHEDC

iBHEDC（改进后的建筑高度估算算法）中各项改进对估算性能提升的贡献

Image preprocessing（图像预处理）：对误差减少的贡献为 0.13 米。
Search region identification（搜索区域识别）：对误差减少的贡献为 1.27 米。
Post-homography height correction（单应性后高度校正）：对误差减少的贡献为 0.81 米。
Projected camera-building distance（投影相机-建筑距离校正）：对误差减少的贡献为 0.34 米。

挑战

该图说明由于相机到建筑物的距离测量错误，可能导致建筑高度估算出现偏差的问题

两条测量线：
红色线：错误的距离测量线
绿色线：正确的距离测量线

质疑

数据集是否足够多样化以涵盖不同类型的建筑和城市环境？
数据集中是否包含足够多的复杂场景（如遮挡、光照变化）以验证算法的鲁棒性？
在实际应用中，街景图像的质量和分辨率可能会影响算法的表现，这一点是否被充分考虑？
系统在实时应用中的表现如何，例如在动态城市环境中的部署？

热门推荐

安徽利辛创新登记管理，个人独资企业贡献超六成GDP

安徽利辛创新登记管理，个人独资企业贡献超六成GDP

长征中，朱老总曾向川军借道，敌将是他的老部下

长征中，朱老总曾向川军借道，敌将是他的老部下

五步蛇咬伤急救，这些关键步骤要记牢

五步蛇咬伤急救，这些关键步骤要记牢

五步蛇咬伤急救指南：广东版

五步蛇咬伤急救指南：广东版

王晓霆：末世暴风雨中心理调适的实用指南

王晓霆：末世暴风雨中心理调适的实用指南

如何挑到最新鲜的鲈鱼？三步搞定！

如何挑到最新鲜的鲈鱼？三步搞定！

维权有门路：消费者协会投诉指南

维权有门路：消费者协会投诉指南

五步蛇：中国最危险的毒蛇？

五步蛇：中国最危险的毒蛇？

讨回"被消费"的钱包！一文详解12315平台使用攻略

讨回"被消费"的钱包！一文详解12315平台使用攻略

多渠道受理、专业化培训、快速响应：提升客服满意度的三大法宝

多渠道受理、专业化培训、快速响应：提升客服满意度的三大法宝

消费维权双通道：12315和消协如何选择

消费维权双通道：12315和消协如何选择

从未来向现在致谢：一封感谢信的多重价值

从未来向现在致谢：一封感谢信的多重价值

锡山人民医院：用专业和关爱赢得患者信赖

锡山人民医院：用专业和关爱赢得患者信赖

职场新人感谢信写作指南：4大场景+3个实用技巧

职场新人感谢信写作指南：4大场景+3个实用技巧

马姓男孩取名指南：文化传承与现代审美的完美融合

马姓男孩取名指南：文化传承与现代审美的完美融合

2025年乙巳蛇年，马姓宝宝取名攻略

2025年乙巳蛇年，马姓宝宝取名攻略

马姓男孩取名全攻略：最新趋势与热门名字推荐

马姓男孩取名全攻略：最新趋势与热门名字推荐

独生子女四大心理挑战：从自我中心到社交能力

独生子女四大心理挑战：从自我中心到社交能力

歇后语：从先秦流传至今的民间智慧结晶

歇后语：从先秦流传至今的民间智慧结晶

黄山四绝配冬韵，游览攻略全解析

黄山四绝配冬韵，游览攻略全解析

“四二一”家庭结构下，中国如何破解独生子女养老难题

“四二一”家庭结构下，中国如何破解独生子女养老难题

老龄化社会的机遇与挑战：中国探索开发老年人力资源新路径

老龄化社会的机遇与挑战：中国探索开发老年人力资源新路径

专家建议：每周150分钟中等强度运动，搭配合理饮食维持健康体重

专家建议：每周150分钟中等强度运动，搭配合理饮食维持健康体重

北海自驾去广州，沿途哪些景点不容错过？

北海自驾去广州，沿途哪些景点不容错过？

Mis.Cai教你做完美可乐鸡翅：从选材到出锅的完整攻略

Mis.Cai教你做完美可乐鸡翅：从选材到出锅的完整攻略

王者荣耀程咬金最新出装攻略：全肉抗打流vs边路惩戒流

王者荣耀程咬金最新出装攻略：全肉抗打流vs边路惩戒流

王者荣耀程咬金最强出装攻略：红莲斗篷+巨人之握

王者荣耀程咬金最强出装攻略：红莲斗篷+巨人之握

双非研究生到底值不值得考？

双非研究生到底值不值得考？

夏季暴风雨来袭，你做好准备了吗？

夏季暴风雨来袭，你做好准备了吗？

全国跳绳锦标赛绍兴开赛，优胜者直通2025国际赛

全国跳绳锦标赛绍兴开赛，优胜者直通2025国际赛

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号