问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

小模型大突破!神经网络透视空间异质性,准确描述复杂地理现象

创作时间:
作者:
@小白创作中心

小模型大突破!神经网络透视空间异质性,准确描述复杂地理现象

引用
1
来源
1.
https://hyper.ai/cn/news/33007

在地理信息科学领域,如何准确描述复杂地理现象的空间异质性一直是一个挑战。浙江大学丁佳乐博士团队通过将神经网络优化的空间邻近性度量(OSP)与地理神经网络加权回归方法(GNNWR)相结合,构建了osp-GNNWR模型,为解决这一难题提供了新的思路。

研究背景:双重挑战下的科研突破

「空间异质性」是造成房价波动的关键因素,但单一的距离度量方式在捕捉复杂地理环境中房价的「空间异质性」时捉襟见肘;传统地理加权回归模型(GWR)在衡量空间邻近性时也面临挑战。正是由于这些因素,研究团队选择开展本项研究。

空间异质性:不同空间的差异性表达

普通线性回归模型OLS是确定变量回归关系最常用且最基础的统计方法,使用一个非常简洁的公式来描述因变量和多个自变量的关系。当我们把OLS等统计学方法应用在地理学时,往往需要考虑到一些地理问题固有的空间特征,于是就产生了空间统计和时空建模的相关研究。

普通线性回归模型会假定:回归系数和样本数据的空间位置和时间位置无关,计算得到的自变量系数是在研究区域的平均水平。但是,现实地理过程中的回归关系会在不同的空间位置上会表现出差异性。以房价为例,同样户型的一个房屋,在市中心和郊区的主要影响因素是不同的,因此它们的回归关系也有不同的形式,我们把这种特征称为空间异质性(空间非平稳性)。

空间异质性是地理要素关系描述的固有特征,是地理要素关系或结构在不同时空位置所具有的差异性表达。它意味着数据在不同空间位置的生成机制存在差异,会表现为相应的回归模型形式、或者参数会随空间的位置进行变化。

地理加权回归:通过核函数实现从空间邻近性到权重的转换

地理加权回归(GWR)是由美国A. Stewart Fotheringham院士提出的一种对空间异质过程的建模方法。通过下图的公式可以看到,虽然GWR的整体形式还是线性回归关系,但它的截距项和回归系数变成了与坐标位置(ui, vi)的映射关系。也就是说,在不同的坐标位置上,它的回归关系是不同的,整个公式反映出来的回归关系也会随着空间位置有不同的改变。

GWR的回归系数很难确定,现在最常用的解算方法类似OLS,即用一个加权的最小二乘法进行解算。在下图的公式中,对角权重矩阵W用于对样本进行加权,可反映自变量之间的空间关联性。具体而言,样本之间的权重是根据样本的空间邻近性解算的,空间上越临近的两个点会有越强的关联性,我们就会给它分配更大的权重,并以此来进行建模。

如何实现从空间邻近性到权重的转换?GWR是通过一个核函数,比如说高斯核函数、双平方核函数等,来把空间邻近性转化到一个权重,从而实现权重方程构造。不过,这种方法存在一定的局限性。

过去,空间异质过程建模的关键是以时空位置邻近性(Proximity)度量为基础,进行时空权重核函数的设计与构建,进而利用局部加权回归理论建立非平稳性目标解算函数,通过模型评价准则的最优求解,实现时空非平稳关系的地理建模。

现有研究对这种方法的改进也多侧重于细化核函数的使用范畴,进而建立含有多带宽参数的混合核模型,却忽略了对核函数本身结构的改进与发展:比如,以单参数解析为核心的现有核函数结构体系较为简单,难以充分估计时空邻近性对时空权重的复杂作用,导致无法精准解算复杂地理关系的时空非平稳特性。

随着近年大数据的不断发展,充分发挥大数据环境下的海量数据优势,高效利用深度神经网络的非线性拟合能力,使用神经网络来解释空间异质性,是解决当前时空关系建模方法发展困境的可行方案。

如何利用神经网络来解释空间异质性?

融合SWNN,GNNWR具有更强的泛化能力

之前,研究团队曾提出过一个地理神经网络加权回归模型GNNWR,该模型用一个深度神经网络(空间加权神经网络SWNN)来为每个位置上的样本赋予一系列空间权重。

具体而言,SWNN以每个样本点到其他样本点的距离向量为输入,输出该位置上的一系列的空间权重,也就是权重矩阵W,从而实现对空间异质性的表达。为了在较小样本上有强的泛化能力,也为了模型的训练能够更快收敛,研究团队在GNNWR方法中,把SWNN输出的权重和OLS先验得到全局回归系数相乘结合,形成了空间异质性的回归系数。

通过上图回归方程可得,该回归方程由自变量、全局回归系数、观测点上空间非平稳的调整参数组成。基于此,研究团队建立了一种基于神经网络的空间回归模型,进而解算空间非平稳过程。

用神经网络优化空间邻近性度量

前面提到,SWNN以每个样本点到其他样本点的距离向量为输入。在这个过程中,研究团队一般会采用欧式距离,比如用空间中两点连线的长度作为距离的度量,这是最直观也是最容易理解的距离表达方法。

然而在城市环境中,欧式距离受到自然和交通条件的影响,难以反应实际的空间邻近性。比如要去对岸的钱塘江,如果不能走公路大桥的话,就需要绕很大一圈才能过去。在这种情况下,两点之间的直线距离虽然很近,但它们在实际空间上是相隔非常远的,欧式距离并不能充分地反映它们的空间邻近性。

在现实世界中,受到自然景观和人造地物的约束,人员和物资的交流往往借助于道路交通网络,路网距离(Road Network Distance, ND)和旅行时间(Travel Duration, TD)也是一种适当的空间邻近性度量方法。然而,由于交通规则限制以及道路通行能力限制,同样长度的路网距离、同样的旅行时间时长所代表的空间邻近性并不相同。比如,同样驾车13分钟,校园内限速,只能走很短一段距离,如果在高架桥上,就能走很远的距离。

所以说,如果使用单一的空间邻近度量,会存在一定的局限性。因此,研究团队尝试建立一种距离融合函数,把多种距离度量值耦合在一起,来优化地去表征空间邻近性。根据上述方程,研究团队把两点间的若干个「距离」耦合,形成一个更优、更确切表征两点之间真实的空间邻近性值。

但这个方程也存在一个问题,fsp是一个需要统一多个不同量纲下的距离表征。比如,旅行时间和欧式距离的单位本身就是不一样的,数量级可能也会有较大差异,仅仅依靠普通的函数并不能充分地实现耦合效果。对此,研究团队构造了一个空间邻近性的神经网络SPNN,把这些距离映射到统一的空间邻近度量中。

随后,通过训练这个神经网络,就能把特定函数的计算转化成一个数据驱动的拟合过程,这就是研究团队用神经网络优化空间邻近性的想法。

连接两个神经网络,形成osp-GNNWR

由于空间邻近性是一个抽象概念,没有真值,比如说给定a点和b点,就不能说a、b之间的空间邻近性是一个确定的值x,这就导致SPNN的损失函数无法定义,也就无法训练。研究团队的解决方案是,把SPNN的输出直接作为GNNWR的距离输入,将两个神经网连接起来,形成统一的整体,他们将其称作优化空间邻近性度量的地理网络加权回归(osp-GNNWR)。

根据这个模型,研究团队就可以通过样本估计值的误差直接训练整个网络,将最后因变量y的拟合值和增值的误差作为损失函数来直接来训练网络。整个网络被训练完毕,前面SPNN也同时被训练完成,进而解决了SPNN的求解问题,完成了回归任务。

以武汉房价为例,osp-GNNWR为房价的空间异质性提供新解释

以武汉房价为例,研究团队选用968个独立的武汉市楼盘二手房成交数据,按85:15的比例划分为训练集和测试集。并在这些数据中,用房价建模中常用的特征价格法选取了3大类10个自变量,包括这些房屋的基本信息、周边配套设施、交通便利性等。在此基础上,研究团队选择欧式距离和旅行时间作为SPNN的输入距离来构建osp-GNNWR模型。

对于优化后的空间邻近性度量,据下图所示,图中每个点的颜色代表拟合结果的残差差值;橙色代表osp-GNNWR的拟合效果比原本的GNNWR模型效果更好;线条代表得到的优化空间邻近性和欧式距离之间的差异。


图 a 可以看到,在城市边缘区域,OSP 与欧式距离的差异较大,且由于受路网结构影响,表现出一定的方向差异性;特别地,研究团队在红色箭头方向上可以发现一个较低的差值,而这主要是由于该方向与武汉市二环快速路吻合,构建 OSP 所使用的欧式距离和旅行时间本身差异较小导致的。

图 b 可以看到,在城区中心地带,由于交通设施完善,无论往哪个方向走,不同方向的空间邻近性都是较为均衡的,所以 osp 与欧氏距离的差值表现出较规则的同心圆状分布。

通过这些OSP和欧式距离的差异特征,研究团队也得以证明了优化空间邻近性度量的实际意义。基于房价的建模结果,研究团队可以进一步讨论回归系数的空间异质性,比如研究大学距离对房价影响。

如下图所示,武汉市洪山区中心的UA参数明显高于其他地区,这表明大学对该地区的房价产生了积极影响,也就是说越靠近教育机构,房价越上涨。此外,这些大学和科研机构也带来了更好的宜居环境,创造了更繁荣的租赁市场。

小模型也有大意义

以上研究并没有用大模型,虽然现在非常流行大的神经网络模型、深度网络模型等,但小模型仍然存在它的实际意义。在没有那么多算力、丰富数据集样本的情况下,设计一个小而美的模型,对于解决某些问题也会有很大的帮助。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号