计量经济学异方差的检验与修正
计量经济学上机实验手册
实验三异方差性实验目的:在理解异方差性概念和异方差对OLS回归结果影响的基础上,掌握进行异方差检验和处理的方法;熟练掌握和运用Eviews软件的图示检验、G-Q检验、怀特White 检验等异方差检验方法和处理异方差的方法——加权最小二乘法;实验内容:书P116例4.1.4:中国农村居民人均消费函数中国农村居民民人均消费支出主要由人均纯收入来决定;农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等;为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,建立双对数模型:其中,Y表示农村家庭人均消费支出,X1表示从事农业经营的纯收入,X2表示其他来源的纯收入;表4.1.1列出了中国内地2006年各地区农村居民家庭人均纯收入及消费支出的相关数据;表4.1.1 中国2006年各地区农村居民家庭人均纯收入与消费支出单位:元注:从事农业经营的纯收入由从事第一产业的经营总收入与从事第一产业的经营支出之差计算,其他来源的纯收入由总纯收入减去从事农业经营的纯收入后得到;资料来源:中国农村住户调查年鉴2007、中国统计年鉴2007;实验步骤:一、创建文件1.建立工作文件CREATE U 1 31 其中的“U”表示非时序数据2.录入与编辑数据Data Y X1 X2 意思是:同时录入Y、X1和X2的数据3.保存文件单击主菜单栏中File→Save或Save as→输入文件名、路径→保存;二、数据分析1.散点图①Scat X1 Y从散点图可看出,农民农业经营的纯收入与农民人均消费支出呈现一定程度的正相关;②Scat X2 Y从散点图可看出,农民其他来源纯收入与农民人均消费支出呈现较高程度的正相关;2.数据取对数处理Genr LY=LOG YGenr LX1=LOG X1Genr LX2=LOG X2三、模型OLS 参数估计与统计检验 LS LY C LX1 LX2得到模型OLS 参数估计和统计检验结果:Dependent Variable: LY Method: Least Squares Sample: 1 31Variable CoefficientStd. Errort-StatisticProb.C LX1 R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic 注意:在学术文献中一般以这种形式给出回归方程的输出结果,而不是把上面的软件输出结果直接粘贴到文章中可决系数,调整可决系数,显示模型拟合程度较高;同时,F 检验统计量,在5%的显着性水平下通过方程总体显着性检验;可认为农民农业经营的收入和其他收入整体与农村居民消费支出的线性关系显着成立;变量X2和截距项均在5%的显着性水平下通过变量显着性检验,但X1在10%的显着水平下仍不能通过检验;四、异方差检验对于双对数模型,由于12(0.150214)(0.477453)ββ=<=二者均为弹性系数,可认为其他来源的纯收入而不是从事农业经营的纯收入的增长,对农户人均消费的增长更有刺激作用;也就是说,不同地区农村人均消费支出的差别主要来源于非农经营收入及工资收入、财产收入等其他来源收入的差别,因此,如果模型存在异方差性,则可能是X2引起的;1.图示检验法观察残差的平方与LX2的散点图;①残差resid残差resid变量数据是模型参数估计命令完成后由Eviews软件自动生成在Workfile 框里可找到,无需人工操作获得;注意,resid保留的是最近一次估计模型的残差数据;②残差的平方与LX2的散点图Scat LX2 resid^2从上图可大体判断出模型存在递增型异方差性;2.G-Q法检验异方差补充:先定义一个变量T,取值为1、2、…、31分别代表各省市,用于在做完G-Q检验之后,再按T排序,使数据顺序还原;Data T 提示:输入1、2、…、31①将所有原始数据按照X2升序排列;Sort X2Show Y X1 X2 LY LX1 LX2显示各个变量数据的目的是查看一下,所有变量数据是否按X2升序排列好了;②将31对样本数据,去掉中间的7对,形成两个容量均为12的子样本,即1-12和20-31;③对1-12的子样本做普通最小二乘估计,并记录残差平方和RSS;1Smpl 1 12 意思是:将样本区间由1-31,改为1-12Ls LY C LX1 LX2Dependent Variable: LYMethod: Least Squares Sample: 1 12C LX1 LX2R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson statProbF-statistic子样本1:12ln 3.1412080.398385ln 0.234751ln Y X X e =+++1RSS =④对20-31的子样本做普通最小二乘估计,并记录残差平方和2RSS ; Smpl 20 31 意思是:将样本区间由1-12,改为20-31 Ls LY C LX1 LX2Dependent Variable: LY Method: Least Squares Sample: 20 31Included observations: 12C LX1 R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson statProbF-statistic子样本2:12ln 3.9936440.113766ln 0.6201681ln Y X X e =-++2RSS =⑤异方差检验在5%与10%的显着性水平下,自由度为9,9的F分布临界值分别为0.05(9,9) 3.18F=与0.10(9,9) 2.44F=;因此5%显着性水平下不能拒绝同方差假设,但在10%的显着性水平下拒绝;补充:怀特检验软件操作:在原始模型的OLS方程对象窗口中,选择view/Residual test/White Heteroskedasticity;Eviews提供了包含交叉项的怀特检验“White Heteroskedasticitycross terms”和没有交叉项的怀特检验“White Heteroskedasticityno cross terms”这样两个选择;问题:如果是刚做完上面的G-Q检验,如何得到原始模型答案:先恢复成全样本,再按T排序,然后做OLS回归;SMPL 1 31 意思是:将样本区间恢复到1-31补充:将样本数据按T升序排列,使数据顺序还原;Sort T 意思是:将数据顺序还原Ls LY C LX1 LX2下面是在原始模型的OLS方程对象窗口中,选择view/Residual test/White Heteroskedasticity,然后进行包含交叉项的怀特检验“White Heteroskedasticitycross terms”所得到的输出结果最上方显示了两个检验统计量:F统计量和White统计量nR2;下方显示的是以OLS的残差平方为被解释变量的辅助回归方程的回归结果:F-statistic ProbabilityTest Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 05/03/11 Time: 17:21Sample: 1 31C LNX1 LNX1^2 LNX1LNX2 LNX2 R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic 可见,怀特统计量nR 2==31×,大于自由度也即辅助回归方程中解释变量的个数为5的2分布临界值07.115205.0=)(χ,因此,在5%的显着性水平下拒绝同方差的原假设; 五、采用加权最小二乘法处理异方差以下内容和教材P118-120不一样,但是我们必须掌握的重点——以原始模型的OLS 回归残差的绝对值的倒数为权数,手工完成加权最小二乘估计LS LY C LX1 LX2Genr E=resid 意思是:记录双对数模型OLS 估计的残差 用残差的绝对值的倒数对LY 、LX1、LX2做加权: Genr LYE=LY/abs E Genr LX1E=LX1/abs E Genr LX2E=LX2/abs E Genr CE=1/abs E LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Sample: 1 31CELX1ER-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid Schwarz criterionLog likelihood Durbin-Watson stat可以看出,lnX1参数的t统计量有了显着改进,这表明在1%显着性水平下,都不能拒绝从事农业生产带来的纯收入对农户人均消费支出有着显着影响的假设;六、检验加权的回归模型是否还存在异方差1.检验是否由LX1E引起异方差Sort LX1E 意思是:将原始数据按LX1E升序排列①子样本1的回归:Smpl 1 12LS LYE CE LX1E LX2EDependent Variable: LYEMethod: Least SquaresSample: 1 12Variable Coefficient Std. Error t-Statistic Prob.CELX1ER-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid Schwarz criterionLog likelihood Durbin-Watson stat子样本1:RSS=1②子样本2的回归:Smpl 20 31LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Date: 05/01/11 Time: 23:23 Sample: 20 31Variable CoefficientStd. Errort-StatisticProb.CE LX1E R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihoodDurbin-Watson stat子样本2:2RSS =③异方差检验 注意做题的步骤提出假设 22012:H σσ= 22112:H σσ≠ 计算检验统计量:在5%的显着性水平下,自由度为9,9的F 分布临界值分别为0.05(9,9) 3.18F =;因此5%显着性水平下不能拒绝同方差假设;2.检验是否由LX2E 引起异方差Smpl 1 31 意思是:将样本区间复原Sort lx2e 意思是:将原始数据按LX2E 升序排列 ①子样本1的回归: Smpl 1 12LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Sample: 1 12CE LX1E R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihoodDurbin-Watson stat子样本1:1RSS = ②子样本2的回归: Smpl 20 31LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Sample: 20 31Included observations: 12CE LX1E R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihoodDurbin-Watson stat子样本2:2RSS =③异方差检验 注意做题的步骤提出假设 22012:H σσ= 22112:H σσ≠ 计算检验统计量:在5%的显着性水平下,自由度为9,9的F 分布临界值分别为0.05(9,9) 3.18F =;因此5%显着性水平下不能拒绝同方差假设;结论:用OLS 估计的残差绝对值的倒数作为权数,对存在异方差的模型加权,然后采用OLS估计,则一定会消除异方差;最终通过异方差检验的估计方程为:实验四序列相关性实验目的:在理解序列相关性的基本概念、序列相关的严重后果的基础上,掌握进行序列相关检验和处理的方法;熟练掌握Eviews软件的图示检验、DW检验、拉格朗日乘数LM检验等序列相关性检验方法和处理序列相关性的方法——广义差分法;实验内容:书P132例4.2.1:中国居民总量消费函数建立总量消费函数是进行宏观经济管理的重要手段;为了从总体上考察中国居民收入与消费的关系,P56表2.6.3给出了中国名义支出法国内生产总值GDP、名义居民总消费CONS以及表示宏观税负的税收总额TAX、表示价格变化的居民消费价格指数CPI1990=100,并由这些数据整理出实际支出法国内生产总值GDPC=GDP/CPI、居民实际消费总支出Y=CONS/CPI,以及实际可支配收入X=GDP-TAX/CPI;表2.6.3 中国居民总量消费支出与收入资料单位:亿元年份GDP CONS CPI TAX GDPC X Y19781979198019811982198319841985198619871988198919901991199219931994199519961997199819992000200120022003200420052006资料来源:根据中国统计年鉴2001,2007整理;实验步骤:一、创建文件1.建立工作文件CREATE A 1978 2006 其中的“A”表示年度数据2.录入与编辑数据Data X Y3.保存文件单击主菜单栏中File→Save或Save as→输入文件名、路径→保存;二、数据分析:趋势图Plot X Y 意思是:同时画出Y和X的趋势图从X和Y的趋势图中可看出它们存在共同变动趋势;三、OLS参数估计与统计检验LS Y C XDependent Variable: YMethod: Least Squares Sample: 1978 2006C R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared residSchwarz criterion Log likelihood F-statistic Durbin-Watson statProbF-statistic从OLS 估计的结果看,模型拟合较好:可决系数20.9880R =,截距项和斜率项的t 检验值均大于5%显着性水平下自由度为n-2=27的临界值0.025(27) 2.05t =;而且,斜率项符合经济理论中边际消费倾向在0与1之间的绝对收入假说;斜率项表明,在1978—2006年间,以1990年价计算的中国居民可支配总收入每增加1亿元,居民消费支出平均增加亿元;四、序列相关性检验 1.图示检验法①残差与时间t 的关系图趋势图 Plot resid②相邻两期残差之间的关系图 Scat resid-1 resid从两个关系图看出,随机误差项呈正序列相关性;.检验值为,表明在5%显着性水平下,n=29,k=2包括常数项,查表得1.34L d =, 1.48U d =,由于.= 1.34L d <=,故存在正序列相关;五、处理序列相关1.修正模型设定偏误剔除虚假序列相关首先面临的问题是,模型的序列相关是纯序列相关,还是由于模型设定有偏误而导致的虚假序列相关;从X 和Y 的趋势图中看到它们表现出共同的变动趋势,因此有理由怀疑较高的2R =部分地是由这一共同的变化趋势带来的;为了排除时间序列模型中这种随时间变动而具有的共同变化趋势的影响,一种解决方案是在模型中引入时间趋势项,将这种影响分离出来;由于本例中可支配收入X 与消费支出Y 均呈非线性变化态势,因此引入的时间变量TT=1,2,……,29以平方的形式出现,回归模型变化为:①编辑变量T data T在数据表中输入1-29; ②做如下的回归 Ls Y C X T^2Dependent Variable: Y Method: Least Squares Sample: 1978 2006 Included observations: 29C X T ^2R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterionSum squared resid 6054792. Schwarz criterionLog likelihood F-statistic 得到如下的修正模型:可见,T 2的t 统计量显着;但是,修正的模型.值仍然较低,没有通过5%显着性水平下的.检验n=29,k=3时,27.1=L D ,56.1=U D ,因此该模型仍存在正序列相关性;补充:序列相关性的拉格朗日乘数检验LM检验在EViews软件中,如果在上面的OLS回归方程界面直接做残差序列的LM检验,那么得到的是如下结果,和书上P133结果不一致:原因:EViews在做LM检验时,为了不损失样本,把滞后残差序列的“前样本”缺失值设定为0Presample missing value lagged residuals set to zero.;这样,它的样本容量仍然是n,而不是n-p;回归结果和书上也有不同;解决办法:要使软件的LM检验结果和教材P133结果一致,办法是进行OLS估计之后,先把残差序列resid用genr生成另一序列e,再做辅助回归,即:genr e=resid先做含1阶滞后残差的辅助回归:ls e c x t^2 e-1Dependent Variable: EMethod: Least SquaresDate: 04/26/13 Time: 07:08Sample adjusted: 1979 2006Included observations: 28 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.CXT^2E-1R-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid 2103016. Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProbF-statisticLM检验统计量必须自己算:LM=n-pR2=29-1=由于该值大于显着性水平为5%、自由度为1的2分布临界值84.31205.0=)(χ,由此判断原模型存在1阶序列相关;再做含2阶滞后残差的辅助回归: ls e c x t^2 e-1 e-2Dependent Variable: E Method: Least Squares Date: 04/26/13 Time: 07:32 Sample adjusted: 1980 2006Included observations: 27 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob. C X T^2 E-1 E-2R-squaredMean dependent var Adjusted R-squared . dependent var . of regressionAkaike info criterion Sum squared resid 1806465. Schwarz criterion Log likelihood Hannan-Quinn criter. F-statistic Durbin-Watson statProbF-statisticLM 检验统计量必须自己算:LM=n-pR 2=29-2=由于该值大于显着性水平为5%、自由度为2的2分布临界值99.52205.0=)(χ,由此判断原模型存在序列相关;但2~-t e 的系数未通过5%的显着性检验,表明在5%的显着性水平下不存在2阶序列相关性;所以,结合前面含1阶、2阶滞后残差的辅助回归结果,可以判断在5%的显着性水平下仅存在1阶序列相关性;2.广义差分法处理序列相关①Ls Y C X T^2 AR1Dependent Variable: Y Method: Least Squares Sampleadjusted: 1979 2006Included observations: 28 after adjusting endpoints Variable CoefficientStd. Errort-StatisticProb.C X T^2 AR1R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterionSum squared resid 2164144. Schwarz criterionLog likelihood F-statistic AR1前的参数值即为随机扰动项的1阶序列相关系数,在5%的显着性水平下显着;.= ,在5%显着性水平下,1.18.. 1.65L U d DWd =<<=样本容量为28,无法判断广义差分变换后模型是否已不存在序列相关;②继续引入AR2以下内容和教材P133-134的做法不同,但是我们必须掌握的基本做法Ls Y C X T ^2 AR1 AR2Dependent Variable: Y Method: Least Squares Sampleadjusted: 1980 2006Included observations: 27 after adjusting endpointsC X T^2 AR1 AR2R-squaredMean dependent var Adjusted R-squared. dependent var. of regression Akaike info criterionSum squared resid 1834086. Schwarz criterionLog likelihood F-statisticInverted AR Roots .53 .53+.32iAR2前的参数在10%的显着性水平下显着不为0;且.= ,接近于2,认为在10%显着性水平下,已不存在序列相关;但是,在5%的显着性水平下,则没必要引入AR2;注意:教材P133用LM检验的结果是,引入AR1 的回归方程在5%的显着性水平下已不存在序列相关性,因而不需要引入AR2;补充:下面是针对引入AR1的回归方程式的LM检验的命令操作和检验结果:首先,采用上面得到的1阶自回归系数1也即AR1的系数,做如下的1阶广义差分变量的OLS回归注:与式等价:Ls y-1 c x-1 t^t-1^2Dependent Variable: Y-1Method: Least SquaresDate: 06/02/13 Time: 11:07Sample adjusted: 1979 2006Included observations: 28 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.CX-1T^T-1^2R-squared M ean dependent varAdjusted R-squared . dependent var. of regression A kaike info criterionSum squared resid 2164144. S chwarz criterionLog likelihood H annan-Quinn criter.F-statistic D urbin-Watson statProbF-statistic然后,将上述1阶广义差分方程的残差序列resid 记为e :genr e=resid 最后,做如下的辅助回归:ls e c x-1 t^t-1^2 e-1Dependent Variable: E Method: Least Squares Date: 06/02/13 Time: 11:16 Sample adjusted: 1980 2006Included observations: 27 after adjustmentsVariable CoefficientStd. Errort-StatisticProb.C X-1 T^T-1^2 E-1R-squaredM ean dependent var Adjusted R-squared . dependent var . of regression A kaike info criterionSum squared resid 1965048. S chwarz criterionLog likelihood H annan-Quinn criter. F-statistic D urbin-Watson statProbF-statistic于是,LM 检验统计量:LM=27=;查表,当显着性水平为5%时,自由度为1的2的临界值)(1205.0χ为;上述LM <)(1205.0χ,表明模型的随机误差项已不存在序列相关;。
计量经济学异方差实验报告及心得体会
计量经济学异方差实验报告及心得体会一、实验简介本实验旨在通过构建模型来研究经济学中的异方差问题,并通过实证分析来探讨其对模型结果的影响。
实验数据采用随机抽样方法自真实经济数据中获取,共包括两个自变量和一个因变量。
在实验中,我将对模型进行两次回归分析,一次是假设无异方差问题,一次是考虑异方差问题,并比较两个模型的结果。
二、实验过程1.数据准备:根据实验设计,我根据随机抽样方法,从真实经济数据中抽取了一部分样本数据。
2.模型建立:我将自变量Y和X1、X2进行回归分析。
首先,我假设模型无异方差问题,得到回归结果。
然后,我将检验异方差性,若存在异方差问题,则建立异方差模型继续回归分析。
3.模型估计:利用最小二乘法进行参数估计,并计算回归结果的标准差和假设检验。
4.模型比较:对比两个模型的回归结果,分析异方差对模型拟合程度和参数估计的影响。
三、实验结果1.无异方差假设模型回归结果:回归方程:Y=0.9X1+0.5X2+2.1标准差:0.3显著性水平:0.05拟合优度:0.852.考虑异方差问题模型回归结果:回归方程:Y=0.7X1+0.4X2+1.9标准差:0.6显著性水平:0.05拟合优度:0.75四、实验心得体会通过本次实验,我对计量经济学中的异方差问题有了更深入的了解,并进一步认识到其对模型结果的影响。
1.异方差问题的存在会对统计推断结果产生重要影响。
在本次实验中,考虑异方差问题的模型相较于无异方差模型,参数估计值差异较大,并且拟合优度也有所下降。
因此,我们在实证分析中应尽可能考虑异方差问题。
2.在实际应用中,异方差问题可能较为普遍。
经济学中的许多变量存在异方差性,例如,个体收入、消费支出等。
因此,在进行经济学研究时,我们应当警惕并尽量排除异方差问题。
3.针对异方差问题,我们可以采用多种方法进行调整,例如,利用异方差稳健标准误、加权最小二乘法等。
在本次实验中,我们采用了异方差模型进行调整,并得到了相对较好的结果。
异方差检验结果解读
异方差检验结果解读
异方差检验(Heteroscedasticity test)是一种用于检验不同组之间是否存在方差
差异的统计方法。
该检验通常用于回归分析中,以确定回归模型的合理性和精确性。
异方差性可能导致回归模型的预测能力下降,因此解读异方差检验结果对于正确分析数据非常重要。
在异方差检验中,常用的检验方法包括Park、White、Goldfeld-Quandt等。
检
验结果通常以显著性水平为基准进行判断。
检验结果显示显著性水平小于或等于设定的阈值(通常为0.05),则可以认为不存在异方差;反之,如果显著性水平大于阈值,则可以认为存在异方差。
异方差检验的结果还提供了其他有用的信息,如异方差性的模式或形式。
一种
常用的方法是绘制残差图,通过观察残差与预测值的关系,可以初步判断异方差性的模式。
常见的异方差性模式包括上升或下降斜线、漏斗形状等。
在图形分析的基础上,可以进一步使用更专业的统计方法,如白噪声检验(White noise test)或Breusch-Pagan检验,来验证异方差性的模式。
在回归分析中,若检验结果显示存在异方差,需要采取相应的纠正措施。
常用
的纠正方法包括回归模型的转换、加权最小二乘法等。
这些方法可以有效地纠正异方差性,提高模型的准确性和稳定性。
总结来说,异方差检验结果的解读需要关注显著性水平、残差图以及其他专业
统计方法的检验结果。
通过综合分析这些信息,我们能够确定回归模型是否受到异方差性的影响,进而采取相应的纠正措施。
正确解读异方差检验结果对于准确分析数据和得出可靠的结论至关重要。
计量经济学讲义——线性回归模型的异方差问题1
Gleiser检验与Park检验存在同样的弱点。
(9.3) (9.4) (9.5)
9.4 异方差的诊断-方法4:怀特(White)检验法
Yi = B1 + B 2 X 2 i + B3 X 3 i + u i
2、做如下辅助回归: (9.6) (9.7)
1、首先用普通最小二乘法估计方程(9.6),获得残差ei
E(Y|X)=α+β*X Y
+u +u -u -u -u +u
0
同方差(homoscedasticity)
X 0
E(Y|X)=α+β*X
异方差(heteroscedasticity)
X
一元线性回归分析-回归的假定条件
假定5 无自相关假定,即两个误差项之间不相关。 Cov(ui,uj) = 0。
ui
9.2 异方差的性质
例9.1 美国创新研究:销售对研究与开发的影响 ^ R&D = 266.2575 + 0.030878*Sales se=(1002.963) (0.008347) t =(0.265471) (3.699508) p =(0.7940) R2 = 0.461032 从回归结果可以看出: (1)随着销售额的增加,R&D也逐渐增加,即销售 额每增加一百万美元,研发相应的增加3.1 万美元。 (2)随着销售额的增加,R&D支出围绕样本回归线 的波动也逐渐变大,表现出异方差性。 (0.0019)
计量经济学:异方差性
计量经济学:异方差性异方差性在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只是其中一个方面,本章将讨论违背基本假定的另一个方面——异方差性。
虽然它们都是违背了基本假定,但前者属于解释变量之间存在的问题,后者是随机误差项出现的问题。
本章将讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干方法。
第一节异方差性的概念一、异方差性的实质第二章提出的基本假定中,要求对所有的i (i=1,2,…,n )都有2)(σ=i u Var (5.1)也就是说i u 具有同方差性。
这里的方差2σ度量的是随机误差项围绕其均值的分散程度。
由于0)(=i u E ,所以等价地说,方差2σ度量的是被解释变量Y 的观测值围绕回归线)(i Y E =ki k i X X βββ+++ 221的分散程度,同方差性实际指的是相对于回归线被解释变量所有观测值的分散程度相同。
设模型为n i u X X Y iki k i i ,,2,1221 =++++=βββ (5.2)如果其它假定均不变,但模型中随机误差项i u 的方差为).,,3,2,1(,)(22n i u Var i i ==σ (5.3)则称i u 具有异方差性。
由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,如图5.1所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则)()(222i i i X f u Var σσ== (5.4)图5.1二、产生异方差的原因由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。
所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的影响,导致随机误差项的方差相异。
通常产生异方差有以下主要原因:1、模型中省略了某些重要的解释变量异方差性表现在随机误差上,但它的产生却与解释变量的变化有紧密的关系。
异方差的修正方法
异方差的修正方法在统计学和经济学中,异方差是指误差项的方差不是恒定的情况。
当误差项的方差不恒定时,会对统计分析结果产生影响,导致参数估计的不准确性。
因此,需要对异方差进行修正,以确保统计分析结果的准确性和可靠性。
异方差的修正方法主要包括加权最小二乘法(Weighted Least Squares, WLS)、异方差稳健标准误(Heteroscedasticity-Robust Standard Errors)和异方差稳健回归(Heteroscedasticity-Robust Regression)。
这些方法能够有效地处理异方差的问题,提高了统计分析结果的准确性。
加权最小二乘法是一种常用的异方差修正方法。
它通过赋予观测值不同的权重,对方差不恒定的数据进行加权处理,从而得到更为准确的参数估计值。
加权最小二乘法的核心思想是将方差不恒定的数据进行加权,使得方差较大的数据点在估计过程中起到较小的作用,从而降低了异方差对参数估计的影响。
另一种常用的异方差修正方法是异方差稳健标准误。
在普通最小二乘法中,通常假设误差项的方差是恒定的,但当误差项的方差不恒定时,普通最小二乘法的标准误就会产生偏误。
异方差稳健标准误通过对标准误进行修正,考虑了误差项方差的不恒定性,从而得到更为准确的统计推断结果。
此外,异方差稳健回归也是一种常用的异方差修正方法。
它通过对残差进行加权,从而得到更为准确的参数估计值。
异方差稳健回归在实际应用中具有较强的鲁棒性,能够有效地处理异方差的问题,提高了回归分析的准确性和可靠性。
总的来说,针对异方差的修正方法有多种选择,可以根据具体情况进行合理选择。
在进行统计分析时,需要对数据是否存在异方差进行检验,并采用适当的异方差修正方法,以确保统计分析结果的准确性和可靠性。
异方差的修正方法在实际应用中具有重要的意义,对于提高统计分析的准确性和可靠性具有重要作用。
计量经济学Stata软件应用4---【Stata软件之异方差】--1次课
如果拒绝原假设,则存在异方差,如果不能拒绝原假设,则
不存在异方差。
异方差的修正——加权最小二乘法
如果通过White检验发现存在异方差性,可以使用加权最小
二乘(WLS)进行估计。
1、异方差形式已知时的加权最小二乘估计(以一元为例)
假如已经知道异方差的具体形式,如:
Var(i
)
2 i
2h( Xi
1224 .281684812
Nu mber of obs = 1225
F( 3, 12 21) = 33.15
Pr ob > F
= 0.0000
R- squa red
= 0.0753
Ad j R- squa red = 0.0730
Ro ot M SE
= .51099
lnwa ge
e du e xp exp sq _co ns
为:
e2
0
1X1
2
X2
3X3
4
X12
5
X
2 2
6
X
2 3
7
X1X2
8
X1X3
a9 X 2
X3
H0 :1 2 a9 0
原假设实际上是对模型进行回归总体显著性检验 (F检验),
如果拒绝原假设,则存在异方差,如果不能拒绝原假设,
则不存在异方差。
容易看出,用于怀特一般检验的模型会包含很多解释变量;
例如如果原模型有3个解释变量,那么怀特一般检验的模型
将包含9个解释变量,而如果原模型有6个解释变量,那么怀
特一般检验的模型将包含27个解释变量。这样对于样本容量
EViews计量经济学实验报告异方差的诊断及修正
时间 地点 实验题目 异方差的诊断与修正一、实验目的与要求:要求目的:1、用图示法初步判断是否存在异方差,再用White 检验异方差;2、用加权最小二乘法修正异方差。
二、实验内容根据1998年我国重要制造业的销售利润与销售收入数据,运用EV 软件,做回归分析,用图示法,White 检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。
三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)(一) 模型设定为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为:i Y =1β+2βi X +i μ其中,i Y 表示销售利润,i X 表示销售收入。
由1998年我国重要制造业的销售收入与销售利润的数据,如图1:1988年我国重要制造业销售收入与销售利润的数据 (单位:亿元)(二) 参数估计1、双击“Eviews ”,进入主页。
输入数据:点击主菜单中的File/Open /EV Workfile —Excel —异方差数据2.xls ;2、在EV 主页界面的窗口,输入“ls y c x ”,按“Enter ”。
出现OLS 回归结果,如图2:估计样本回归函数Dependent Variable: Y Method: Least Squares Date: 10/19/05 Time: 15:27 Sample: 1 28Included observations: 28Variable Coefficient Std. Error t-Statistic Prob.C 12.03564 19.51779 0.616650 0.5428 X0.1043930.008441 12.366700.0000R-squared0.854696 Mean dependent var 213.4650 Adjusted R-squared 0.849107 S.D. dependent var 146.4895 S.E. of regression 56.90368 Akaike info criterion 10.98935 Sum squared resid 84188.74 Schwarz criterion 11.08450 Log likelihood -151.8508 F-statistic 152.9353 Durbin-Watson stat1.212795 Prob(F-statistic)0.000000估计结果为: iY ˆ = 12.03564 + 0.104393i X (19.51779) (0.008441) t=(0.616650) (12.36670)2R =0.854696 2R =0.849107 S.E.=56.89947 DW=1.212859 F=152.9353这说明在其他因素不变的情况下,销售收入每增长1元,销售利润平均增长0.104393元。
计量经济学第六章异方差性
构建统一的异方差 性处理框架
未来可以构建一个统一的异方 差性处理框架,整合现有的处 理方法和技巧,为实际应用提 供更为全面和系统的指导。同 时,该框架还可以为计量经济 学的教学和研究提供便利。
THANK YOU
感谢聆听
03
异方差性对假设检验 的影响
异方差性可能导致假设检验中的t统计 量和F统计量失效,从而影响假设检 验的结论。
异方差性下的模型选择和评价
异方差性检验
在进行模型选择和评价之前,需要对异方差性进行检验。常用 的异方差性检验方法有怀特检验、布雷施-帕甘检验等。
模型选择
在存在异方差性的情况下,应选择能够处理异方差性的模型, 如加权最小二乘法(WLS)、广义最小二乘法(GLS)等。
性质
异方差性违反了经典线性回归模型的同方差假设,可能导致参数 估计量的无偏性、有效性和一致性受到影响。
产生原因及影响
模型设定误差
模型遗漏了重要变量或函数形式设定错误。
数据采集问题
观测数据的误差或异常值。
产生原因及影响
• 经济现象本身:某些经济变量之间的关系可能随时间和空间的变化而变化,导致异方差性。
等级相关系数法
计算残差绝对值与解释变量之间的等 级相关系数,若显著则表明存在异方 差性。
Goldfeld-Quandt检验法
假设条件
该检验假设异方差性以解释变量的某个值为界,将样本分为两组,且两组的方差不同。
检验步骤
首先根据假设条件将样本分组,然后分别计算两组的残差平方和,最后构造F统计量进行假设检验。
05
异方差性在计量经济学模型中的应用
异方差性对模型设定的影响
01
异方差性可能导致参 数估计量的偏误
当存在异方差性时,普通最小二乘法 (OLS)的参数估计量可能不再具有无 偏性和一致性,从而导致估计结果的偏 误。
异方差性的概念、类型、后果、检验及其修正方法(含案例)
分别为两个子样对应的随机项方差。
H0成立,意味着同方差; H1成立,意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平,确定F分布表中相应的临界值
例4.1.2:以绝对收入假设为理论假设、以分组数据 (将居民按照收入等距离分成n组,取组平均数为样 本观测值)作样本建立居民消费函数:
Ci= 0+1Yi+i 一般情况下:居民收入服从正态分布,处于中等收入组中 的人数最多,处于两端收入组中的人数最少。而人数多的组 平均数的误差小,人数少的组平均数的误差大。所以样本观 测值的观测误差随着解释变量观测值的增大而先减后增。 如果样本观测值的观测误差构成随机误差项的主要部分,那 么对于不同的样本点,随机误差项的方差随着解释变量观测值
并不随解释变量 Xi的变化而变化,不论解释变量 的观测值是大还是小,每个i的方差保持相同, 即 i2 =常数 (i=1,2,…,n)
• 在异方差的情况下,i2已不是常数,它随Xi的
变化而变化,即
i2 =f(Xi) (i=1,2,…,n)
• 异方差一般可以归结为三种类型:
(1)单调递增型: i2=f(Xi)随Xi的增大而增大; (2)单调递减型: i2=f(Xi )随Xi的增大而减小; (3)复杂型: i2=f(Xi )随Xi的变化呈复杂形式。
③对每个子样本分别求回归方程,并计算各自的残差平方
e 2 ,较大的一 和。将两个残差平方和中较小的一个规定为 ~ 1i
nc 2 ~ k 1。 个规定为 e2i 。二者的自由度均为 2
2 2 H0 : 12 2 12 2 ④提出假设: ,H 1 : 2 12 与 2
异方差
第一节 异方差的概念
例:以某一行业的企业为样本建立企业生产函数模 型 Yi=Ai1 Ki2 Li3ei 被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境对产出量的影响被 包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不同 ,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量观 测值的变化而呈规律性变化,呈现复杂型。
第三节 异方差性的检验
三、戈里瑟(Gleiser)检验 1969年戈里瑟提出的,它不但可以检验异方差是 否存在,而且可以近似探测随机误差项的方差是 怎样随解释变量的变化而变化的。 基本思想:由OLS法得到残差 e i ,取 e i 的绝对 值 ,然后将 对某个 X i回归,根据回归模 ei ei 型的显著性和拟合优度来判断是否存在异方差。
二、异方差性的后果
ˆ
2
e
2 i
n2
ˆ s(1 )
ˆ ki
2
2
ˆ2
(Xi X )
2
但是,在异方差的情况下
ˆ* s( i ) ˆ ki i
2 2
ˆ i ki
2 2
ˆ ki
2
2
i ki ki
2
2
=
ˆ s(i )
i Байду номын сангаасi
第三节 异方差性的检验
异方差检验
目录案例引入 (2)数据分析 (4)建立多元线性模型及检验 (5)经济检验: (6)统计检验 (6)异方差检验 (7)异方差修正 (12)结果解释 (13)一、案例引入随着国内生产生产总值和城乡居民可支配收入的不断增长,使得人们的收入成倍增长,无论微观经济理论还是人们的感受,收入的增加能够满足人们的更多需求,从而是人们对生活状况的满意程度增加,即提升主观幸福感,增加生命质量得分。
同时,研究结果现实收入较低人群的生命质量得分均较低且与其他组间差异大。
随着收入的增加,生命质量有提升的趋势。
而在社会五大保险之中,只有医保与我们的生命息息相关,堪称社保之中的重中之重,医保的价值让我们的健康得到了保证。
数据(表1)为我们研究收入水平与医保对生命预期的影响提供了重要数据基础。
我们选择58国收入、医保、生命预期这3个变量的相关数据作为样本,进行研究。
观察值生命预期收入医保观察值生命预期收入医保1 71.8 2046 81 44 74.7 13410 1002 60.2 686 74 45 55.6 884 413 76.4 14862 100 46 77.4 14784 1004 75.9 11760 100 47 64.7 360 805 73.2 7944 100 48 45.0 150 306 49.8 296 18 49 46.8 230 497 51.6 3288 90 50 73.7 5842 1008 50.3 156 45 51 62.5 784 849 52.6 482 64 52 54.3 330 7310 64.5 1456 76 53 75.1 17714 10011 52.6 324 75 54 66.7 1322 10012 62.8 462 89 55 52.2 292 6113 50.3 292 56 56 49.5 306 4514 75.7 11924 100 57 77.7 14280 10015 48.0 294 28 58 49.3 360 5116 48.3 244 61 59 65.2 1124 6417 63.2 2560 90 60 47.5 472 4018 55.0 392 80 61 65.6 804 8019 66.8 1094 63 62 47.7 13730 10020 66.3 1038 89 63 46.7 186 1521 52.6 248 81 64 61.4 1056 3422 67.9 7794 100 65 51.5 270 2623 72.3 994 90 66 76.6 16192 10024 59.3 522 80 67 47.4 166 4925 53.6 384 61 68 70.4 2328 7226 70.7 4956 99 69 54.3 342 5527 74.6 13408 100 70 74.5 10490 10028 71.3 1974 100 71 76.8 19782 10029 62.1 3954 80 72 64.6 862 7030 45.5 420 30 73 65.1 1180 9131 44.0 252 43 74 60.9 604 7232 71.4 1472 97 75 70.1 396 9333 52.0 744 31 76 69.0 2736 9434 63.5 780 74 77 70.1 2142 10035 70.4 19182 90 78 74.4 1506 8036 74.7 11076 100 79 76.9 14472 10037 60.8 1078 75 80 72.9 15506 10038 52.2 980 81 81 68.0 1246 6039 74.1 16624 100 82 76.6 11060 10040 75.0 9898 100 83 46.5 160 2841 71.8 2036 82 84 61.0 862 5842 76.5 9532 100 85 50.1 638 4643 70.8 2366 100 ————数据来源:老师提供数据无需处理。
异方差性检验 计量经济学 EVIEWS建模课件
G-Q检验的步骤:
①将n对样本观察值(Xi,Yi)按观察值Xi的大 小排队;
②将序列中间的c=n/4个观察值除去,并 将剩下的观察值划分为较小与较大的相 同的两个子样本,每个子样的样本容量 均为(n-c)/2;
③对每个子样分别进行OLS回归,并计算各自 的残差平方和∑esi12 与∑esi22 ;
计量经济学模型一旦出现异方差性,如果仍采用 OLS估计模型参数,会产生下列不良后果:
1.参数估计量非有效
OLS估计量仍然具有无偏性,但不具有有效 性。因为在有效性证明中利用了 E(εε’)=2I 。
而且,在大样本情况下,尽管参数估计量具 有一致性,但仍然不具有渐近有效性。
2. 变量的显著性检验失去意义
例如以绝对收入假设为理论假设、以截面数据
为样本建立居民消费函数: Ci=0+1Yi+εi
将居民按照收入等距离分成n组,取组平均数 为样本观测值。 • 一般情况下,居民收入服从正态分布:中等收 入组人数多,两端收入组人数少。而人数多的组 平均数的误差小,人数少的组平均数的误差大。 • 所以样本观测值的观测误差随着解释变量观测 值的不同而不同,往往引起异方差性。
异方差性的检验与修正分析
一、异方差性问题 二、异方差性检验 三、异方差的修正及案例 四、条件异方差模型的建立
⒉ 在同方差情况下: 异 方 差 的 图 示 在异方差情况下: 说 明 :
异方差时
同方差:i2 = 常数 f(Xi) 异方差:i2 = f(Xi)
⒊异方差的类型
异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式
变量的显著性检验中,构造了t统计量
计量经济学教案(5)
但不具有有效性和渐近有效性。而且 ˆ 的分布将受到影响。
Var( ˆ ) = E [( ˆ - ) ( ˆ - )' ] = E [(X 'X )-1 X ' u u' X (X 'X)-1 ]
= (X ' X)-1 X ' E (u u' ) X (X ' X )-1 = 2 (X 'X )-1 X ' X (X ' X )-1 不等于 (X ' X )-1,所以异方差条件下 ˆ 是非有效估计量。
5. 克服异方差的方法 克服异方差的矩阵描述。设模型为
Y=X+u
6
其中 E(u) = 0,Var(u) = E(u u') = 2 。 已知, 与 k 未知。因为 I,违反了假定条件,所 以应该对模型进行适当修正。
因为 是一个 T 阶正定矩阵,所以必存在一个非退化 TT 阶矩阵 M 使下式成立。
⑤判别规则是
若 T R 2 2 (5), 接受 H0(ut 具有同方差)
若 T R 2 > 2 (5), 拒绝 H0(ut 具有异方差) 附录:White 检验的 EViwes 操作。 在回归式窗口中点击 View 键选 Residual Tests/White Heteroskedasticity 功能。检验式存在有无 交叉项两种选择。 (2) Goldfeld-Quandt 检验
图 5.7 菲律宾的季度数据
图 5.8 剔出 2 次趋势后的残差序列
3. 异方差的后果 下面以简单线性回归模型为例讨论异方差对参数估计的响。对模型
yt = 0 + 1 xt + ut
3
当 Var(ut) = t 2,为异方差时(t 2 是一个随时间或序数变化的量),回归参数估计量仍具有无偏性 和一致性。以 ˆ1 为例
多个解释变量异方差修正命令_解释说明
多个解释变量异方差修正命令解释说明1. 引言1.1 概述在经济学和统计学领域,研究人员常常使用多元回归模型来分析变量之间的关系。
然而,在进行多元回归分析时,我们必须考虑到可能存在的异方差问题,即误差项的方差随着解释变量的变化而发生改变。
异方差问题会导致回归系数估计的不准确性,从而影响对实际关系的解释。
为了解决异方差问题,研究人员提出了许多修正方法。
其中一种常见的方法是利用多个解释变量对异方差进行修正。
本文将详细介绍这种修正方法及其应用。
1.2 文章结构本文将分为五个部分进行阐述。
首先,在引言部分我们将概述本文的主题和目标,并描述文章的结构安排。
接下来,在第二部分中我们将介绍异方差问题的引出以及解释变量对异方差修正的影响。
紧接着,第三部分将重点论述多个解释变量的异方差修正方法,并列举具体要点进行解释说明。
在第四部分中,我们进一步探讨另一个角度下解释说明该方法,并提出一些相关要点。
最后,在结论部分,我们将总结讨论结果,展望未来研究方向,并分析本研究的局限性。
1.3 目的本文的目的是系统介绍多个解释变量异方差修正命令及其解释说明。
通过对该方法的详细阐述,读者可以了解到如何使用多个解释变量对回归模型进行异方差修正以获得更准确和可靠的估计结果。
同时,本文还旨在提供有关该方法的具体步骤和要点以供实践应用。
希望读者在阅读完本文后能够对多个解释变量异方差修正命令有一个清晰全面的了解,并能够在实际研究中灵活运用该方法来解决异方差问题。
2. 多个解释变量异方差修正命令2.1 异方差问题的引出在实证研究和统计分析中,我们常常会使用回归模型来研究一个或多个解释变量对于一个因变量的影响。
然而,在实际应用中,我们会发现回归模型假设了误差项具有同方差性。
但是,在许多情况下,误差项可能表现出异方差性,即其方差随着解释变量的不同取值而发生改变。
这可能会导致一些问题,例如参数估计结果的无效性、显著性检验结果的失真以及预测精度的降低。
异方差稳健标准误法
异方差稳健标准误法
异方差稳健标准误法的基本思想是对标准误进行修正,使其能够适应异方差的存在,从而得到更加准确的统计推断结果。
在传统的最小二乘法中,标准误的计算是基于误差项方差恒定的假设,当这一假设不成立时,就需要采用异方差稳健标准误法进行修正。
具体来说,异方差稳健标准误法的计算方法是利用残差的平方项来估计误差项的方差,然后将这一估计结果代入到标准误的计算公式中,从而得到修正后的标准误。
这样做的好处是能够更加准确地反映数据中的异方差结构,避免了传统OLS 方法中对方差恒定的假设。
采用异方差稳健标准误法进行统计推断时,可以得到更加可靠的参数估计和显著性检验结果。
特别是在样本量较小或者存在异方差的情况下,传统的OLS方法往往会出现显著性检验结果失真的问题,而异方差稳健标准误法能够有效地解决这一问题,提高了统计推断的准确性和稳健性。
除了修正标准误外,异方差稳健标准误法还可以通过修正协方差矩阵来得到更加准确的参数估计。
在存在异方差的情况下,传统OLS方法得到的参数估计可能会出现偏误,而采用异方差稳健标准误法进行修正后,可以得到更加准确的参数估计结果。
总之,异方差稳健标准误法是一种有效的统计推断方法,能够有效地处理数据中存在的异方差问题,提高了参数估计和显著性检验的准确性和稳健性。
在实际的计量经济学研究中,研究者应该重视数据的异方差结构,并在需要时采用异方差稳健标准误法进行分析,以确保得到可靠的统计推断结果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《计量经济学》实训报告
实训项目名称异方差模型的检验与处理
实训时间 2012-01-02
实训地点实验楼308
班级
学号
姓名
实 训 (实 践 ) 报 告
实 训 名 称 异方差模型的检验与处理
一、 实训目的
掌握异方差性的检验及处理方法。
二 、实训要求
1.求销售利润与销售收入的样本回归函数,并对模型进行经济意义检验和统计检验;
2.分别用图形法、Goldfeld-Quant 检验、White 方法检验模型是否存在异方差;
3.如果模型存在异方差,选用适当的方法对异方差进行修正,消除或减小异方差对模型的影响。
三、实训内容
建立并检验我国制造业利润函数模型,检验异方差性,并选用适当方法对其进行修正,消除或不同)
四、实训步骤
1.建立一元线性回归方程;
2.建立Workfile 和对象,录入数据;
3.分别用图形法、Goldfeld-Quant 检验、White 方法检验模型是否存在异方差;
4.对所估计的模型再进行White 检验,观察异方差的调整情况,从而消除或减小异方差对模型的影响。
五、实训分析、总结
表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料。
假设销售利润与销售收入之间满足线性约束,则理论模型设定为:
12i i i Y X u ββ=++
其中i Y 表示销售利润,i X 表示销售收入。
表1 我国制造工业1998年销售利润与销售收入情况
行业名称销售利润Y 销售收入X 行业名称销售利润销售收入
食品加工业187.25 3180.44 医药制造业238.71 1264.1
食品制造业111.42 1119.88 化学纤维制品81.57 779.46
饮料制造业205.42 1489.89 橡胶制品业77.84 692.08
烟草加工业183.87 1328.59 塑料制品业144.34 1345
纺织业316.79 3862.9 非金属矿制品339.26 2866.14
服装制品业157.7 1779.1 黑色金属冶炼367.47 3868.28
皮革羽绒制品81.7 1081.77 有色金属冶炼144.29 1535.16
木材加工业35.67 443.74 金属制品业201.42 1948.12
家具制造业31.06 226.78 普通机械制造354.69 2351.68
造纸及纸品业134.4 1124.94 专用设备制造238.16 1714.73
印刷业90.12 499.83 交通运输设备511.94 4011.53
文教体育用品54.4 504.44 电子机械制造409.83 3286.15
石油加工业194.45 2363.8 电子通讯设备508.15 4499.19
化学原料纸品502.61 4195.22 仪器仪表设备72.46 663.68
1.建立Workfile和对象,录入销售收入X和销售利润Y:
图1 销售收入X和销售利润Y的录入
2.图形法检验
⑴观察销售利润Y与销售收入X的相关图:在群对象窗口工具栏中点击
view\Graph\Scatter\Simple Scatter, 可得X 与Y 的简单散点图(图1),可以看出X 与Y 是带有截距的近似线性关系,即随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。
这说明变量之间可能存在递增的异方差性。
图2 我国制造工业销售利润与销售收入相关图
⑵残差分析
由路径:Quick/Estimate Equation ,进入Equation Specification 窗口,键入“y c x 确认并“ok ”,得样本回归估计结果,见图3。
图3 样本的回归估计结果
生成残差平方序列。
在得到图3的估计结果后,直接在工作文件窗口中按Genr,在弹出的窗口中, 在主窗口键入命令如下e2=resid^2(用e2来表示残差平方序列),得到残差平方序列e2;同时绘制2t e 对t X 的散点图。
按住Ctrl 键,同时选择变量X 与(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴)以组对象方式打开,进入数据列表,再按路径view\Graph\Scatter\Simple Scatter ,可得散点图,见图4。
图4 我国制造业销售利润回归模型残差分布
由图4可以大致看出残差平方2t e 随t X 的变动呈增大的趋势,因此,模型很可能存在异方差。
但是否确实存在异方差还应通过更进一步的检验。
3.Goldfeld-Quant 检验
⑴构造子样本区间,建立回归模型。
将样本安解释变量排序(SORT X )并分成两部分(分别有1到10共11个样本以及19到28共10个样本)
⑵利用样本1建立回归模型1(回归结果如图5),然后用OLS 方法求得如下结果 :其残差平方和为2579.587。
SMPL 1 10 LS Y C X
图5 样本1的回归结果
由图5可以看出,样本的估计结果为
15.764660.085894i Y X ∧
=+
2
0.714814 20.05192R F ==
⑶利用样本2建立回归模型2(回归结果如图6),然后用OLS 方法求得如下结果 :其残差平方和为63769.67。
SMPL 19 28 LS Y C X
图6 样本2回归结果
由图6可以看出,样本的估计结果为
11.996870.110552i Y X ∧
=-+
2
0.496413 7.886037R F ==
⑷计算F 统计量:12/RSS RSS F ==63769.67/2579.59=24.72,21RSS RSS 和分别是模型1和模型2的残差平方和。
取
05
.0=α时,查F 分布表得
44.3)1110,1110(05.0=----F ,而
44
.372.2405.0=>=F F ,所以拒绝原假设,表明模型存在异方差性。
4.White 检验
⑴建立回归模型:LS Y C X ,回归结果如图7。
图7 我国制造业销售利润回归模型
⑵在方程窗口上点击View\Residual\Test\White Heteroskedastcity,检验结果如图8。
图8 White 检验结果
其中F 值为辅助回归模型的F 统计量值。
取显著水平
05
.0=α,由于
2704.699.5)2(2
205.0=<=nR χ,所以存在异方差性。
实际应用中可以直接观察相伴概率
p 值的大小,若p 值较小,则认为存在异方差性。
反之,则认为不存在异方差性。
5.异方差性的修正 (1)确定权数变量:
根据Park 检验生成权数变量:GENR W1=1/X^1.6743 根据Gleiser 检验生成权数变量:GENR W2=1/X^0.5 另外生成:GENR W3=1/ABS(RESID );GENR W4=1/ RESID ^2 (2)利用加权最小二乘法估计模型:
在方程窗口中点击Estimate\Option按钮,并在权数变量栏里依次输入W1、W2、W3、W4,回归结果图9、10、11、12所示。
图9 权数为W1时的回归模型
图10 权数为W2时的回归模型
图11 权数为W3时的回归模型
图12 权数为W4时的回归模型
(3)对所估计的模型再进行White检验,观察异方差的调整情况
对所估计的模型再进行White检验,其结果分别对应图9、10、11、12的回归模型(如
图13、14、15、16所示)。
图13、14、16所对应的White 检验显示,P 值较大,所以接收不存在异方差的原假设,即认为已经消除了回归模型的异方差性。
图15对应的White 检验
没有显示F 值和2
nR 的值,这表示异方差性已经得到很好的解决。
图13 White 检验的回归模型
图14 White 检验的回归模型
图15 White 检验的回归模型(异方差得到解决)
图16 White 检验的回归模型
6.实验结果
(1)我国主要制造工业销售收入与销售利润的函数为12.033490.104394i Y X ∧
=+ (2)分别通过图形法、Goldfeld-Quant 检验、White 方法检验出该模型存在递增的异方差性。
(3)通过对异方差性的调整,模型中的异方差性已经得到了很好的解决:调整后的模型为 4.1689330.109408i Y X ∧
=+。
六、实训报告评价与成绩。