异方差的诊断及修正
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
异方差的诊断与修正
—甘子君 经济1202班 1205060432
一、
异方差的概念:
异方差性(heteroscedasticity )是相对于同方差而言的。
所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。
如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。
在回归模型的经典假定中,提出的基本假定中,要求对所有的i (i=1,2,…,n )都有
2
)(σ=i u Var
也就是说i
u 具有同方差性。
这里的方差2
σ度量的是随机误差项围绕其均值的分散程
度。
由于
)(=i u E ,所以等价地说,方差2σ度量的是被解释变量Y 的观测值围绕回归线
)(i Y E =
ki
k i X X βββ+++ 221的分散程度,同方差性实际指的是相对于回归线被解释变
量所有观测值的分散程度相同。
设模型为
n
i u X X Y i
ki k i i ,,2,1221 =++++=βββ
如果其它假定均不变,但模型中随机误差项
i
u 的方差为
).
,,3,2,1(,
)(22n i u Var i i ==σ
则称
i
u 具有异方差性。
也称为方差非齐性。
二、内容
根据1998年我国重要制造业的销售利润与销售收入数据,运用EV 软件,做回归分析,用图示法,White 检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。
三、过程:(实践过程、实践所有参数与指标、理论依据说明等)
(一) 模型设定
为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为:
i Y =1β+2βi X +i μ
其中,i Y 表示销售利润,i X 表示销售收入。
由1998年我国重要制造业的销售收入与销售利润的数据,如图1:
1988年我国重要制造业销售收入与销售利润的数据 (单位:亿元)
(二)参数估计
1、双击“Eviews”,进入主页。
输入数据:点击主菜单中的File/Open /EV Workfile—excel —异方差数据.xlsx ;
2、在EV主页界面的窗口,object-new object,输入“y c x”,按“Enter”。
出现OLS回归结果,如图2:
估计样本回归函数
Dependent Variable: Y
Method: Least Squares
Date: 12/18/14 Time: 22:10
Sample: 1 28
Included observations: 28
Variable Coefficient Std. Error t-Statistic Prob.
C 12.03564 19.51779 0.616650 0.5428 X
0.104393
0.008441
12.36670
0.0000
R-squared 0.854696 Mean dependent var 213.4650 Adjusted R-squared 0.849107 S.D. dependent var 146.4895 S.E. of regression 56.90368 Akaike info criterion 10.98935 Sum squared resid 84188.74 Schwarz criterion 11.08450 Log likelihood -151.8508 Hannan-Quinn criter. 11.01844 F-statistic 152.9353 Durbin-Watson stat 1.212795
Prob(F-statistic) 0.000000
估计结果为: i
Y ˆ = 12.03564 + 0.104393i X (19.51779) (0.008441) t=(0.616650) (12.36670)
2R =0.854696 2R =0.849107 S.E.=56.89947 DW=1.212859 F=152.9353
这说明在其他因素不变的情况下,销售收入每增长1元,销售利润平均增长0.104393元。
2R =0.854696 , 拟合程度较好。
在给定 =0.0时,t=12.36670 > )26(025.0t =2.056 ,拒
绝原假设,说明销售收入对销售利润有显著性影响。
F=152.9353 > )6,21(F 05.0= 4.23 ,表明方程整体显著。
(三) 检验模型的异方差
※(一)图形法
1、在“Workfile ”页面:选中x,y 序列,点击鼠标右键,点击Open —as Group
2、在“Group ”页面:点击View -Graph —Scatter, 得到X,Y 的散点图(下图3所示):
0100
200
300
400
500
600
销售收入X
销售利润Y
3、在“Workfile ”页面:点击Generate ,输入“e2=resid^2”—OK
4、选中x,e2序列,点击鼠标右键,Open —as Group
5、在“Group ”页面:点击View -Graph —Scatter, 得到X,e2的散点图(下图4所示):
05,000
10,00015,000
20,000
25,000
销售收入X
E 2
6、判断
由图3可以看出,被解释变量Y 随着解释变量X 的增大而逐渐分散,离散程度越来越大; 同样,由图4可以看出,残差平方2
i e 对解释变量X 的散点图主要分布在图形中的下三角部分,大致看出残差平方2
i e 随i X 的变动呈增大趋势。
因此,模型很可能存在异方差。
但是否
确实存在异方差还应该通过更近一步的检验。
※ (二)White 检验
1、 在“Equation ”页面:点击View -Residual Diagnostics —Heteroskedasticity Tests
—White 检验(no cross ),(本例为一元函数,没有交叉乘积项)得到检验结果,如图5:
White 检验结果
Heteroskedasticity Test: White
F-statistic
3.607218 Prob. F(2,25)
0.0420 Obs*R-squared 6.270612 Prob. Chi-Square(2) 0.0435 Scaled explained SS
7.631425 Prob. Chi-Square(2) 0.0220
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 12/18/14 Time: 22:35
Sample: 1 28
Included observations: 28
Variable Coefficient Std. Error t-Statistic Prob. C -3279.779 2857.117 -1.147933 0.2619 X^2 -0.000871 0.000653 -1.334000 0.1942 X
5.670634
3.109363
1.823728
0.0802
R-squared 0.223950 Mean dependent var 3006.741 Adjusted R-squared 0.161866 S.D. dependent var 5144.470 S.E. of regression 4709.744 Akaike info criterion 19.85361 Sum squared resid 5.55E+08 Schwarz criterion 19.99635 Log likelihood -274.9506 Hannan-Quinn criter. 19.89725 F-statistic 3.607218 Durbin-Watson stat 1.479908
Prob(F-statistic) 0.042036
2、因为本例为一元函数,没有交叉乘积项,则辅助函数为 2t σ=0α+1αt x +2α2
t x +t ν 从上表可以看出,n 2R =6.270612 ,有White 检验知,在α=0,05下,查2
χ分布表,得临界值5.002
χ
(2)
=5.99147。
比较计算的2χ统计量与临界值,因为n 2R = 6.270612 > 5
.002
χ
(2)=5.99147 ,所以拒绝原假设,不拒绝备择假设,这表明模型存在异方差。
(四) 异方差的修正
在运用加权最小二乘法估计过程中,分别选用了权数t 1ω=1/t X ,t 2ω=1/2
t X ,t 3ω=1/t X 。
1、在“Workfile ”页面:点击“Generate ”,输入“w1=1/x ”—OK ;同样的输入“w2=1/x^2”
“w3=1/sqr(x)”;
2、在“Equation ”页面:点击“Procs-Specify-Estimate ”进入Equation Specification 对话框,点击Options 按钮,在Type 中勾选“Inverse std. dev ”在weight series 输入w1,出现如图6:
用权数t 1ω的结果
Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 22:57 Sample: 1 28
Included observations: 28 Weighting series: W1
Weight type: Inverse standard deviation (EViews default scaling)
Variable Coefficient Std. Error t-Statistic Prob. C 5.988351 6.403392 0.935184 0.3583 X 0.108606
0.008155 13.31734 0.0000
Weighted Statistics
R-squared 0.032543 Mean dependent var 123.4060 Adjusted R-squared -0.004667 S.D. dependent var 31.99659 S.E. of regression 32.07117 Akaike info criterion 9.842541 Sum squared resid 26742.56 Schwarz criterion 9.937699 Log likelihood -135.7956 Hannan-Quinn criter. 9.871632 F-statistic 177.3515 Durbin-Watson stat 1.465148 Prob(F-statistic)
0.000000 Weighted mean dep. 67.92129
Unweighted Statistics
R-squared 0.853095 Mean dependent var 213.4650 Adjusted R-squared 0.847445 S.D. dependent var 146.4895 S.E. of regression 57.21632 Sum squared resid 85116.40
Durbin-Watson stat 1.261469
3、在“Equation”页面:同样的输入“w2”,出现如图7:
ω的结果
用权数
t2
Dependent Variable: Y
Method: Least Squares
Date: 12/18/14 Time: 23:01
Sample: 1 28
Included observations: 28
Weighting series: W2
Weight type: Inverse standard deviation (EViews default scaling)
Variable Coefficient Std. Error t-Statistic Prob.
C 6.496703 3.486526 1.863374 0.0737
X 0.106892 0.010991 9.725260 0.0000
Weighted Statistics
R-squared 0.922715 Mean dependent var 67.92129 Adjusted R-squared 0.919743 S.D. dependent var 75.51929 S.E. of regression 21.39439 Akaike info criterion 9.032884 Sum squared resid 11900.72 Schwarz criterion 9.128041 Log likelihood -124.4604 Hannan-Quinn criter. 9.061975 F-statistic 94.58068 Durbin-Watson stat 1.905670 Prob(F-statistic) 0.000000 Weighted mean dep. 36.45276
Unweighted Statistics
R-squared 0.854182 Mean dependent var 213.4650 Adjusted R-squared 0.848573 S.D. dependent var 146.4895 S.E. of regression 57.00434 Sum squared resid 84486.88 Durbin-Watson stat 1.242212
4、在“Equation”页面:同样的输入“w3”,出现如图8:
ω的结果
用权数
t3
Dependent Variable: Y
Method: Least Squares
Date: 12/18/14 Time: 23:08
Sample: 1 28
Included observations: 28
Weighting series: W3
Weight type: Inverse standard deviation (EViews default scaling)
Variable Coefficient Std. Error t-Statistic Prob.
C 8.640341 11.18733 0.772333 0.4469 X 0.106153
0.007746
13.70473 0.0000
Weighted Statistics
R-squared 0.611552 Mean dependent var
165.8420 Adjusted R-squared 0.596612 S.D. dependent var
67.13044 S.E. of regression 42.63646 Akaike info criterion 10.41205 Sum squared resid 47264.56 Schwarz criterion 10.50720 Log likelihood -143.7686 Hannan-Quinn criter. 10.44114 F-statistic 187.8197 Durbin-Watson stat 1.275429 Prob(F-statistic)
0.000000 Weighted mean dep. 123.4060
Unweighted Statistics
R-squared 0.854453 Mean dependent var 213.4650 Adjusted R-squared 0.848855 S.D. dependent var 146.4895 S.E. of regression 56.95121 Sum squared resid 84329.44
Durbin-Watson stat
1.233545
经估计检验,发现用权数t 1ω,t 3ω的结果,其可决系数反而减小;只有用权数t 2ω的效果最好,可决系数增大。
用权数t 2ω的结果
Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 23:12 Sample: 1 28
Included observations: 28 Weighting series: W2
Weight type: Inverse standard deviation (EViews default scaling)
Variable Coefficient Std. Error t-Statistic Prob. C 6.496703 3.486526 1.863374 0.0737 X 0.106892
0.010991 9.725260 0.0000
Weighted Statistics
R-squared 0.922715 Mean dependent var
67.92129 Adjusted R-squared 0.919743 S.D. dependent var
75.51929 S.E. of regression 21.39439 Akaike info criterion 9.032884 Sum squared resid
11900.72 Schwarz criterion
9.128041
Log likelihood -124.4604 Hannan-Quinn criter. 9.061975 F-statistic 94.58068 Durbin-Watson stat 1.905670 Prob(F-statistic)
0.000000 Weighted mean dep. 36.45276
Unweighted Statistics
R-squared 0.854182 Mean dependent var 213.4650 Adjusted R-squared 0.848573 S.D. dependent var 146.4895 S.E. of regression 57.00434 Sum squared resid 84486.88
Durbin-Watson stat
1.242212
用权数t 2ω的估计结果为: i
Y ˆ= 6.496703 + 0.106892i X (1.863374) (9.725260)
2R =0.922715 DW=1.905670 F=94.58068
括号中的数据为t 统计量值。
由上可以看出,运用加权最小二乘法消除了异方差后,参数2β的t 检验显著,可决系数提高了不少,F 检验也显著,并说明销售收入每增长1元,销售利润平均增长0.106892元。
四、结果:
1、用图示法初步判断是否存在异方差:被解释变量Y 随着解释变量X 的增大而逐渐分散,离散程度越来越大;同样的,残差平方2
i e 对解释变量X 的散点图主要分布在图形中的下三角部分,大致看出残差平方2
i e 随i X 的变动呈增大趋势。
因此,模型很可能存在异方差。
但是否确实存在异方差还应该通过更近一步的检验。
再用White 检验异方差:因为n 2
R = 6.270612 > 5.002
χ(2)=5.99147 ,所以拒绝原假设,
不拒绝备择假设,这表明模型存在异方差。
2、用加权最小二乘法修正异方差:
发现用权数t 2ω的效果最好,则估计结果为:
i
Y ˆ= 6.496703 + 0.106892i X (1.863374) (9.725260)
2R =0.922715 DW=1.905670 F=94.58068
括号中的数据为t 统计量值。
由上可以看出,2
R =0.922715,拟合程度较好。
在给定α=0.0时,t=9.725260 >
)26(025.0t =2.056 ,拒绝原假设,说明销售收入对销售利润有显著性影响。
F=94.58068 > )6,21(F 05.0= 4.23 , 表明方程整体显著。
运用加权最小二乘法后,参数2β的t 检验显著,可决系数提高了不少,F 检验也显著,并说明销售收入每增长1元,销售利润平均增长0.106892元。
3、再用White 检验修正后的模型是否还存在异方差:
White 检验结果
Heteroskedasticity Test White
F-statistic 3.144597 Probability 0.060509 Obs*R-squared
5.628058 Probability
0.059963
Test Equation:
Dependent Variable: STD_RESID^2 Method: Least Squares Date: 12/18/14 Time: 23:15
Sample: 1 28
Included observations: 28
Variable Coefficient Std. Error t-Statistic Prob. C 1927.346 675.2246 2.854378 0.0085 X -1.456613 0.734838 -1.982223 0.0585 X^2
0.000245
0.000154
1.586342
0.1252
R-squared 0.201002 Mean dependent var 425.0258 Adjusted R-squared 0.137082 S.D. dependent var 1198.210 S.E. of regression 1113.057 Akaike info criterion 16.96857 Sum squared resid 30972414 Schwarz criterion 17.11130 Log likelihood -234.5599 F-statistic 3.144597 Durbin-Watson stat
2.559506 Prob(F-statistic)
0.060509
由上看出,n 2
R = 5.628058 ,由White 检验知,在α=0,05下,查2
χ分布表,得临界值:
5.002χ(2)=5.99147。
比较计算的2
χ统计量与临界值,因为n 2R = 5.628058 < 5
.002
χ(2)=5.99147 ,所以接
受原假设,这说明修正后的模型不存在异方差。