异方差性案例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
异方差性案例分析
一、问题的提出和模型设定
根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为
i i i u X Y ++=21ββ (5.31)
其中i Y 表示卫生医疗机构数,i X 表示人口数。由2001年《四川统计年鉴》得到如下数据。
表5.1 四川省2000年各地区医疗机构数与人口数
地区
人口数(万人) X
医疗机构数(个)
Y
地区
人口数(万人) X
医疗机构数(个)
Y
成都 1013.3 6304 眉山 339.9 827 自贡 315 911 宜宾 508.5 1530 攀枝花 103 934 广安 438.6 1589 泸州 463.7 1297 达州 620.1 2403 德阳 379.3 1085 雅安 149.8 866 绵阳 518.4 1616 巴中 346.7 1223 广元 302.6 1021 资阳 488.4 1361 遂宁 371 1375 阿坝 82.9 536 内江 419.9 1212 甘孜 88.9 594 乐山
345.9
1132 凉山 402.4
1471 南充 709.2
4064
二、参数估计
进入EViews 软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下
表5.2
估计结果为
56.69,2665.508..,7855.0)
3403.8()
9311.1(3735.50548.563ˆ2===-+-=F e s R X Y i
i (5.32) 括号内为t 统计量值。 三、检验模型的异方差
本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。为此,必须对该模型是否存在异方差进行检验。
(一)图形法 1、EViews 软件操作。
由路径:Quick/Qstimate Equation ,进入Equation Specification 窗口,键入“y c x ”,确认并“ok ”,得样本回归估计结果,见表5.2。
(1)生成残差平方序列。在得到表5.2估计结果后,立即用生成命令建立序列2
i e ,记
为e2。生成过程如下,先按路径:Procs/Generate Series ,进入Generate Series by Equation 对话框,即
图5.4
然后,在Generate Series by Equation 对话框中(如图5.4),键入“e2=(resid )^2”,
则生成序列2
i e 。
(2)绘制2
t e 对t X 的散点图。选择变量名X 与e2(注意选择变量的顺序,先选的变量
将在图形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径view/graph/scatter ,可得散点图,见图5.5。
图5.5
2、判断。由图5.5可以看出,残差平方2
i e 对解释变量X 的散点图主要分布在图形中的下三角部分,大致看出残差平方2
i e 随i X 的变动呈增大的趋势,因此,模型很可能存在异方
差。但是否确实存在异方差还应通过更进一步的检验。
(二)Goldfeld-Quanadt 检验 1、EViews 软件操作。
(1)对变量取值排序(按递增或递减)。在Procs 菜单里选Sort Series 命令,出现排序对话框,如果以递增型排序,选Ascenging ,如果以递减型排序,则应选Descending ,键入X ,点ok 。本例选递增型排序,这时变量Y 与X 将以X 按递增型排序。
(2)构造子样本区间,建立回归模型。在本例中,样本容量n=21,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:1—8和14—21,它们的样本个数均是8个,即821==n n 。
在Sample 菜单里,将区间定义为1—8,然后用OLS 方法求得如下结果
表5.3
在Sample 菜单里,将区间定义为14—21,再用OLS 方法求得如下结果
表5.4
(3)求F 统计量值。基于表5.3和表5.4中残差平方和的数据,即Sum squared resid
的值。由表5.3计算得到的残差平方和为∑=9
.14495821i
e ,由表5.4计算得到的残差平
方和为∑
=8
.73435522i
e
,根据Goldfeld-Quanadt 检验,F 统计量为
066
.59
.1449588
.734355212
2==
=
∑∑i
i e e F (5.33)
(4)判断。在05.0=α下,式(5.33)中分子、分母的自由度均为6,查F 分布表得
临界值为
28.4)6,6(05.0=F ,因为28.4)6,6(066.505.0=>=F F ,所以拒绝原假设,表明
模型确实存在异方差。
(三)White 检验
由表5.2估计结果,按路径view/residual tests/white heteroskedasticity (no cross terms or cross terms ),进入White 检验。根据White 检验中辅助函数的构造,最后一项为变量的交叉乘积项,因为本例为一元函数,故无交叉乘积项,因此应选no cross terms ,则辅助函数为
t t t t v x x +++=2
2102ααασ (5.34) 经估计出现White 检验结果,见表5.5。
从表5.5可以看出,0694.182
=nR ,由White 检验知,在05.0=α下,查2
χ分布表,得临界值9915.5)2(205.0=χ(在(5.34)式中只有两项含有解释变量,故自由度为2),比
较计算的2χ统计量与临界值,因为0694.182=nR >9915.5)2(205
.0=χ,所以拒绝原假设,不拒绝备择假设,表明模型存在异方差。
表
5.5
四、异方差性的修正 (一)加权最小二乘法(WLS )