目录
一、理论原理
二、数据准备
三、程序代码及解释
四、代码运行结果
一、理论原理
空间自回归模型(Spatial Autoregressive Model,SAR)是一种用于分析具有空间相关性的数据的统计模型。它假设观测值之间的相关性不仅取决于传统的时间或其他因素,还受到空间位置的影响。
二、数据准备
为了演示 SAR 模型在 Stata 中的操作,我们将使用一个包含城市经济数据和地理空间信息的数据集。假设我们有以下变量:
gdp
:城市的国内生产总值(GDP),作为因变量。investment
:城市的投资水平,作为解释变量。latitude
和longitude
:城市的经纬度坐标,用于构建空间权重矩阵。
在实际应用中,数据的获取和预处理是非常重要的步骤。确保数据的准确性、完整性和合理性对于后续的分析结果至关重要。
首先,需要对数据进行清理,处理缺失值和异常值。然后,根据研究目的和数据特点,可能需要对变量进行标准化或对数变换等操作,以满足模型的假设和提高模型的性能。
三、程序代码及解释
* 导入数据
import delimited "your_data_file.csv", clear* 安装空间计量相关命令
ssc install spreg* 计算空间权重矩阵
spwmatrix using latitude longitude, wname(W)* 进行空间自回归模型估计
spregress gdp investment, wmat(W) model(sar)* 查看估计结果
estimates table* 模型诊断与检验// 检查残差的空间自相关性
spatdiag, wmat(W)// 异方差检验
hettest* 稳健性检验// 改变空间权重矩阵的构建方法
spwmatrix using latitude longitude, wname(W2) binary
spregress gdp investment, wmat(W2) model(sar)// 增加控制变量
spregress gdp investment other_control_variables, wmat(W) model(sar)
上述代码中:
import delimited "your_data_file.csv", clear
:用于导入数据文件。这里需要将"your_data_file.csv"
替换为您实际的数据文件路径和名称。ssc install spreg
:安装用于空间计量分析的命令。如果之前已经安装过,此步骤可以省略。spwmatrix using latitude longitude, wname(W)
:根据城市的经纬度坐标计算空间权重矩阵,并将其命名为W
。空间权重矩阵用于描述不同观测值之间的空间关系。spregress gdp investment, wmat(W) model(sar)
:使用计算得到的空间权重矩阵W
对gdp
和investment
进行空间自回归模型估计。指定model(sar)
表示使用空间自回归模型。estimates table
:查看模型的估计结果,包括回归系数、标准误差、t 值、p 值等。spatdiag, wmat(W)
:用于检查残差的空间自相关性。hettest
:进行异方差检验。spwmatrix using latitude longitude, wname(W2) binary
:以另一种方式(例如二进制)构建空间权重矩阵W2
。spregress gdp investment, wmat(W2) model(sar)
:使用新构建的空间权重矩阵重新估计模型,以检验结果的稳健性。spregress gdp investment other_control_variables, wmat(W) model(sar)
:增加控制变量,进一步完善模型。
四、代码运行结果
运行上述代码后,Stata 将会输出模型的估计结果,包括回归系数、标准误差、t 值、p 值等。您可以根据这些结果来评估解释变量对因变量的影响,以及空间相关性的强度。
例如,可能会得到类似于以下的结果:
------------------------------------------------------------------------------| Robustgdp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------investment | 0.5234 0.1256 4.17 0.000 0.2756 0.7712_cons | 10.256 2.5678 4.00 0.000 5.1587 15.3533
rho | 0.3567 0.1056 3.38 0.001 0.1458 0.5676
------------------------------------------------------------------------------
在这个结果中:
investment
的系数为 0.5234,其标准误差为 0.1256。t 值为 4.17,对应的 p 值为 0.000,表明在统计上显著。这意味着投资水平每增加一个单位,GDP 平均增加 0.5234 个单位。- 常数项
_cons
为 10.256,标准误差为 2.5678,t 值为 4.00,p 值为 0.000,同样在统计上显著。 rho
的值为 0.3567,标准误差为 0.1056,t 值为 3.38,p 值为 0.001,表明存在显著的空间正相关性。即一个城市的 GDP 受到相邻城市 GDP 的正向影响。
残差的空间自相关性检验结果可能会显示,例如:“Moran's I test for residuals: 0.123 (p = 0.056)”,这表明残差可能不存在显著的空间自相关性,模型拟合较好。
异方差检验结果可能会是:“Breusch-Pagan test: chi2(1) = 3.25 (p = 0.071)”,表明可能不存在显著的异方差。
面板数据的空间自回归模型及Stata估计 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/387369082
2015-2021年地级市月度空气质量数据(AQI、SO2、NO2、PM2.5、PM10、O3、CO)https://download.csdn.net/download/a519573917/89512273