ArcGI基本技巧-科研常用OLS, GWR, GTWR模型实现
OLS,GWR,GTWR回归模型均可以揭示解释变量对被解释变量的影响且可以进行预测。Ordinary Least Squares (OLS)是最小二乘法,Geographically Weighted Regression (GWR)是地理加权回归,Geographically and Temporally Weighted Regression (GTWR)是时空地理加权回归。本次推送将介绍这三个模型的公式、在论文中的使用流程以及使用Arcgis实现这三个模型的操作步骤。
回归模型公式
下面公式中的n代表观测样本个数,m代表解释变量个数。
OLS:
GWR:
不同于普通最小二乘回归模型的拟合系数为常数,地理加权回归模型的拟合系数是样本点地理位置的函数。
GTWR:
将地理加权回归模型中的二维空间坐标加入时间维度,改进成三维时空坐标得到时空地理加权回归模型,其数学表达式如下:
注意事项:
1.共线性检验
多重共线性即输入的解释变量间存在高度关联性从而导致近似共线下模型的估计量非有效、显著性检验无意义且预测精度降低。建模过程中自变量存在多重共线性是常见的问题,因此在建模前必须对解释变量进行共线性检验,排除引起共线性的变量。计算自变量的方差膨胀因子(VIF),可剔除VIF大于10的自变量。剔除后的自变量间不共线,下一步建模具有可行性。
2.空间自相关
使用地理加权回归模型(GWR,GTWR)前还需要检验变量间的空间自相关性。对空间自相关性进行研究旨在确定所研究样本点的某一属性值与领域内其它样本点相同属性值在空间上是否关联,通过计算自相关系数并检验其显著性,定量地描述样本的空间关联度及分布特点。已有学者指出在构建变系数模型前检验变量的空间自相关性是必要的。可以通过计算全局Moran’s I指数进而确定输入变量在空间上是否相关及关联程度如何,可用如下公式得出:
Z得分用来对Moran’s I指数的显著性进行评估,计算公式如下:
ArcGIS实现OLS、GWR、GTWR实例展示:
下面介绍如何基于Arcgis实现这三种模型,Arcgis工具中有普通最小二乘法(OLS)和地理加权回归(GWR),但是没有GTWR,所以首先介绍一下GTWR插件的安装。
1.GTWR插件安装
黄波教授团队开发了GTWR模型的ArcGIS插件
(软件下载:黄波教授RG主页https://www.researchgate.net/publication/329518786_GTWR_ADDIN_Valid_till_Jan_2021)或者(直接通过链接下载其中一个版本,首先,确保你的电脑上安装有arcgis10.0以上的版本。 http://www.grm.cuhk.edu.hk/~huangbo/GTWR/GTWR_AddIn.rar)
具体安装过程详见https://blog.csdn.net/weixin_39624980/article/details/112268369
GTWR_AddIn.rar中除了GTWR的安装包外,还有名为“CalgaryData”的数据,本次推送将使用这个数据实现OLS、GWR、GTWR。(ArcGIS 10.8)
2.OLS的操作
① 导入数据CalgaryData中的HousePrice.shp
② 空间统计工具——>空间关系建模——>普通最小二乘法
③ 输入要素,此处要注意的是“唯一ID字段”,如果使用的数据中没有唯一ID的字段,需要自己构建一列(1,2,……即可)
③OLS结果,可以打开生成的图层“HousePrice_OrdinaryLeastSqua”的属性表,还可以看到出的PDF中的结果。重要的模型结果(AICc和R2在PDF文件中),更详细的结果分析可见
https://desktop.arcgis.com/zh-cn/arcmap/10.3/tools/spatial-statistics-toolbox/interpreting-ols-results.htm
3.GWR的操作
与OSL的过程类似
① 空间统计工具——>空间关系建模——>地理加权回归
② 输入要素
③ GWR结果:图层“GeographicallyWeightedRegression”和补充表格“GeographicallyWeightedRegression_supp”
补充表格中有AICc和R方
4.GTWR的操作
① 添加工具GTWR
② 输入变量,可能会遇到版本过期的问题,可以自己把电脑的时间调到2016年以前,还有其它问题可以参考https://mp.weixin.qq.com/s/SfpZ1a-1UtvS5rnBvKSGFg
③ GTWR的结果:图层“HousePrice_GTWR_0”和补充表格“HousePrice_GTWR_0——supplement.csv”
打开图层属性表可以看到变量的系数等信息。补充表格中有AICc和R方
最后三个模型的结果
大家请自行操作研究测试。