为研究某地区房地产市场的价格与相关影响因素之间的关系,现从该地区采集了 20 份样本,数据如下表,请给出销售价格与相关影响因素之间的函数表达式,并从统计学角度分析这些因素之间的关系,最后预测 X 小区的平均销售价格?(该小区的地产估价为 970,房产估价为 3680,使用面积为 19836)
表 2 某地区房地市场调查结果
销售价格 | 地产估价 | 房产估价 | 使用面积 |
6890 | 596 | 4497 | 18730 |
4850 | 900 | 2780 | 9280 |
5550 | 950 | 3144 | 11260 |
6200 | 1000 | 3959 | 12650 |
11650 | 1800 | 7283 | 22140 |
4500 | 850 | 2732 | 9120 |
3800 | 800 | 2986 | 8990 |
8300 | 2300 | 4775 | 18030 |
5900 | 810 | 3912 | 12040 |
4750 | 900 | 2935 | 17250 |
4050 | 730 | 4012 | 10800 |
4000 | 800 | 3168 | 15290 |
9700 | 2000 | 5851 | 24550 |
4550 | 800 | 2345 | 11510 |
4090 | 800 | 2089 | 11730 |
8000 | 1050 | 5625 | 19600 |
5600 | 400 | 2086 | 13440 |
3700 | 450 | 2261 | 9880 |
5000 | 340 | 3595 | 10760 |
2240 | 150 | 578 | 9620 |
解答过程如下:
统计分析方法方面选择线性回归分析。将销售价格作为因变量,将地产估价、房产估价、使用面积作为自变量。SPSS分析结果如下所示:
1、输入/除去的变量
可以发现因变量为销售价格,模型构建方面采用输入法,使用的自变量包括地产估价、房产估价、使用面积。
2、模型摘要
可以发现模型的R方为0.897,调整后R方为0.878,说明模型的解释能力较强,选取的自变量可以较好的解释因变量。
3、ANOVA分析
可以发现ANOVA分析的显著性P值为0.000,远远小于0.05,说明模型在整体上具有统计显著性。
4、回归分析结果
回归方程即为销售价格与相关影响因素之间的函数表达式,具体为:
房产估价=148.7+0.815*地产估价+0.821*房产估价+0.135*使用面积
可以发现地产估价、房产估价、使用面积三个自变量的系数分别为0.815、0.821、0.135,均为正数,说明三个自变量在经济意义上对于因变量销售价格都会产生正向影响。
但从显著性P值来看,仅有房产估价的显著性P值(0.001)小于0.05,地产估价、使用面积的显著性P值分别为0.131、0.057均大于0.05,说明仅有房产估价的系数具有统计显著性,地产估价、使用面积的回归系数并不具备统计显著性。
5、X小区的平均销售价格预测
根据前面得到的回归方程,当X 小区的地产估价为 970,房产估价为 3680,使用面积为 19836时,其平均销售价格为:
X小区房产估价=148.7+0.815*970+0.821*3680+0.135*19836=6638.39
即X小区房产估价为6638.39。
这儿我谈谈SPSS学习的分析。针对没有统计学基础的新手和小白,SPSS入门方面,建议一定边看书边操作,通过边学知识边上手操作的方式学习,会事半功倍,也有解决问题的成就感。推荐三本避雷避坑、亲测可行的网红图书,也是杨维忠、张甜老师撰写的SPSS三部曲:
1、《SPSS统计分析入门与应用精解(视频教学版)》杨维忠 张甜 清华大学出版社 2022年。侧重SPSS统计分析操作,体现在对于窗口选项设置和运行结果解读都非常全面、细致、到位;
2、《SPSS统计学基础与实证研究应用精解》张甜 杨维忠 清华大学出版社 2023年。为使用SPSS写作实证研究类论文所精心设计,实现零基础入门学会用SPSS写论文的目的。
3、《SPSS统计分析商用建模与综合案例精解》杨维忠 张甜 清华大学出版社 2021年。侧重使用SPSS开展数据挖掘、机器学习以及统计分析的综合应用。
《SPSS