异方差案例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
异方差案例分析
中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等。为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,可使用如下双对数模型:
1122ln ln ln Y X X βββμ0=+++
其中,Y 表示农村家庭人均消费支出,X 1表示从事农业经营的收入,X 2表示其他收入。下表列出了中国2001年各地区农村居民家庭人均纯收入及消费支出的相关数据。
中国2001年各地区农村居民家庭人均纯收入与消费支出 单位:元
资料来源:《中国农村住户调查年鉴》(2002)、《中国统计年鉴》(2002)。
我们不妨假设该线性回归模型满足基本假定,采用OLS 估计法,估计结果如下:
12ˆln 1.6550.3166ln 0.5084ln Y
X X =++ (1.87) (3.02) (10.04)
R 2=0.7831 R 2=0.7676 D.W.=1.89 F=50.53 RSS=0.8232
图1
估计结果显示,其他收入而不是从事农业经营的收入的增长,对农户消费支出的增长更具有刺激作用。下面对该模型进行异方差性检验。
1.图示法。
首先做出Y与X1、X2的散点图,如下:
图2
可见1X 基本在其均值附近上下波动,而2X 散点存在较为明显的增大趋势。
再做残差平方项2
ˆi e
与1ln X 、2ln X 的散点图:
图3
图4
可见图1中离群点相对较少而图2呈现较为明显的单调递增的
异方差性。故初步判断异方差性主要是2X引起的。
2.G-Q检验
根据上述分析,首先将原始数据按X2升序排序,去掉中间7个数据,得到两个容量为12的子样本,记数据较小的样本为子样本1,数据较大的为子样本2。对子样本1进行OLS回归,结果如下:
图5
得到子样本1的残差平方和RSS1=0.064806;
再对子样本2进行OLS回归,结果如下:
图6
得到子样本2的残差平方和RSS 2=0.279145。 计算F 统计量:
21RSS 0.279145F 4.3082
RSS 0.064806==≈
在5%的显著水平下,F 0.05(9,9)=3.18 < F,故应拒绝同方差假设,表明该总体随机干扰项存在单调递增的异方差。
3.white 检验
记原模型残差平方项为2ˆe
, 将其与X 1,X 2及其平方项与交叉项做辅助回归,结果如下:
图7
由各参数的t值可见各项都不是很显著,而且可决系数值也比较小,但white统计量nR2=31⨯0.464=14.38该值大于5%显著水平下自由度为5的2χ分布相应的临界值20.05
χ=11.07,因此应拒绝同方差假设。
去掉交叉项后的辅助回归结果如下:
图8
显然,X2和X2的平方项的参数的t检验是显著的,并且white 统计量nR2=31⨯0.437376=11.58656大于5%显著水平下自由度为5的2χ分布相应的临界值20.05
χ=11.07,因此应拒绝同方差假设。
4.异方差的修正——加权最小二乘法
我们以1/X2为权重进行异方差的修正。加权后的估计结果如
下:
图9
可见修正后各解释变量的显著性总体相对提高。其white检验结果如下:
精品
可编辑修改
图10
此时white 统计量nR 2=31⨯0.023325=0.723小于5%显著
水平下自由度为5的2
χ分布相应的临界值20.05χ=11.07,故此时满足同方差假设。故修正后的估计结果为:
12
ˆln 2.3250.441ln 0.284ln Y X X =++