研究房价的影响因素

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

探究全国单位房价的价格和城镇居民

收入之间的关系

一、选题的意义和原因：

鉴于全国房价一直在涨，对于年轻的工作族来说，房价是一个很大的影响因素。所以想了解关于单位房价到底有什么因素在影响它，初步认为有城镇居民的收入水平占重要地位，但是也考虑到居民储蓄额度变化和房屋建设的成本以及开发商的土地购置费用等因素有影响。初步判断均认为这个重要因素对于房价的影响都是正相关的。至于是否还有影响较大的遗漏变量偏差，我们会在接下来的检验中详细的叙述。

二、数据的收集和整理

数据来源于中经网和国家统计局

插入Excel

三、数据描述性分析

认为城镇居民收入是影响单位房价的重要因素：

被解释变量Y(单位房价)和解释变量x1(城镇居民收入水平)

四、回归结果分析和检验

一元线性回归的检验：选取模型：Y=a+ßX+Ui

Y:房价：单位房价

X:选取居民收入水平

现在对它进行一元线性回归的假设：

研究单位房价和城镇居民收入水平之间的关系：

回归后得到的数据：

结果分析：

分析：由单位房价y和城镇居民收入X的回归可以知道：

Y=-2174.967+0.41*X R^2=0.82 SER=2016.2

（424.13）（0.026）

t(ß)=15.86 P值=0.000（双边）

ß的95%的双边置信区间是（0.36,0.46）；a的95%的置信区间是（-3023.94，-1326.0）

假设H: ß=0 H1: ß>0或ß<0 由于P值小于0.05 且F值为251.44

所以拒绝原假设

并且可以得出结论居民的收入水平对北京市房价每平方米有着重大的影响

虽然R^2 已经足够大，但是考虑到居民的储蓄额和开发商购买土地和投资额的影响，可能有遗漏变差，所以考虑加入这些遗漏变量。

采用多元回归模型：Y=a+ß1X1+ß2X2+ß3X3+ß4X4+ui

(1)由于一个自变量对于解释一个因变量可能有遗漏变量误差，仅考虑房价与居民

收入的关系来说，是有遗漏变量偏差的。现在考虑加入居民储蓄额和土地的建

设成本以及投资额等，并进行相关的假设检验以判断其相关性。

(2)加入多变量之后的结果是：

分析结果：Y=-2333.114+0.39X1-0.17X2-0.08X3+2.18X4 R^2=0.843 SER=1950.4

(444.04)（0.089）（10.90）（0.56）(0.95)

t(ß1=0)=4.41 t(ß2=0)=-0.15 t(ß3=0)=-0.14 t(ß4=0)=2.29 t(ß0=0)=-5.25

ß1的P值为0.00；ß2的p值是0.88>0.05 接受原假设；ß3的p值是0.889同理接受原假设，影响不显著；ß4的p值为0.026<0.05 拒绝原假设，故其影响较为显著。

由T检验知道，ß1在5%的显著水平下显著，而ß2在5%的水平下不显著，不能拒绝原假设ß2=0;同时ß3在5%的显著水平下不显著，ß4在5%的显著水平下显著，拒绝原假设ß4=0；所以总结一下是：对于单位房价的影响，居民收入和土地购置费用对于单位房价的影响较为显著。

ß0的95%的置信区间为（-322.98，-1443.25）

ß1的95%的置信区间为（0.21, 0.57）

ß2的95%的置信区间为（-0.23, 0.20）

ß3的95%的置信区间为（-1.20,1.04）

ß4的95%的置信区间为（0.27,4.08）

修正后的R^2及SER为：

R^2= 0.843 SER=1950.4

得出的结论是：在5%的置信区间中，居民储蓄和开发商的投资额对单位房价的影响没有那么显著，相反居民收入和土地的建设成本影响显著。

进一步检验采用Y 单位房价和居民收入以及土地的建设成本这l 两个显著性因素影响的模型：Y=a+ ß1X1+ ß4X4+ui

进行线性回归和多重共线性分析：

结果分析：Y=-2379.72+0.38X1+2.19X2

(406.1) (0.022) (0.94)

ß1的t值是17.19，P值是0.000；ß2的t值是2.34 ；P值是0.023<0.05所以拒绝原假设ß2=0；

R^2=0.844 SER=1916.7 F值为192.88

ß1的95%的置信区间是（0.33,0.42）ß4的95%的置信区间是（0.32,4.07）

这个模型较之前的多元模型有稍微的改变，提高些微的R^2

现在进行多重共线性的检验：

(1)先假设检验两个系数是否相等：

假设：H0:ß1= ß4 H1: ß1≠ß4

Yi=ß0+ß1X1i+ß2X2i+ui 模型转变为

Yi=ß0+(ß1-ß2)X1i+ß2(X1i+X2i)+ui

重新整理数据：转变为ß1-ß2=0 的检验

令ß1-ß2=h1 假设转为H0:h1=0 H1:h1≠0 构建t统计量，t=h1*-0/SE(h1*) 做回归得到：

T 检验结果为：t=-1.82-0/0.83=-2.19 5%的显著水平是1.96 故可以在5%的显著水平下拒绝原假设即h1≠0 意味着ß1≠ß2

（2）检验两个系数是否同时为0

H0: ß1=ß2 =0 H1: ß1 ß2 不同时为0

(3)VIF检验：带入调整后的数据：得到结果如下：

结果分析：容忍度的倒数，VIF越大，显示共线性越严重。经验判断方法表明：当0＜VIF＜10，不存在多重共线性；当10≤VIF＜100，存在较强的多重共线性；当VIF≥100，存在严重多重共线性。

从Stata的结果可以看出ß1和ß4不存在多重共线性。