异方差案例分析
计量经济学计量经济学教学案例
计量经济学教学案例案例一 简单线性回归模型一、主题与背景用真实数据进行简单线性回归分析,应用Eviews6.0分析软件进行操作,与课本内容相对应,分析模型的截距、斜率以及可决系数,引导学生熟悉Eviews6.0的基本操作,能够解读分析报告,并尝试进行被解释变量的预测,体会变量测度单位的改变和函数形式变化给OLS 估计结果和统计特征的影响。
二、情景描述对于由CEO 构成的总体,令y 代表年薪(salary),单位为千美元。
令x 表示某个CEO 所在公司在过去三年的平均股本回报率(roe ,股本回报率定义为净收入占普通股价的百分比)。
为研究该公司业绩指标和CEO 薪水之间的关系,可以定义以下模型:Salary=0β+1βroe + u . 斜率参数1β衡量当股本回报率增长一个单位(一个百分点)时CEO 年薪的变化量,由于更高的股本回报率预示更高的CEO 年薪,所以,1β>0。
三、教学过程设计(一)数据说明数据集CEOSAL1.RAW 包含1990年209位CEO 的相关信息,该数据来自《商业周刊》(5/6/91),该样本中CEO 年薪的平均值为$1,281,120,最低值和最高值分别为$223,000和$14,822,000,1988、1989和1990年的平均股本回报率是17.18%。
(二)操作建议1:在 eviews6.0命令输入窗口定义变量:data salary roe2、用 edit+/- 编辑数据3、描述统计分析过程:view---descriptive stats---common sample4、画散点图:Scat roe salary5、在eviews6.0命令输入窗口运行简单线性回归 Ls salary c roe6、用resids 观测残差7、产生新序列:S eries lsalary =log(salary)8、改变函数形式:Ls lsalary c lsales9、改变变量测度单位:Ls salary*1000 c roe四、教学研究(一)案例结论1、回归结果估计出的回归线为:salˆary = 963.191 + 18.501 roe(1)截距和斜率保留了3位小数,回归结果显示,如果股本回报率为0,年薪的预测值为截距963.191千美元,可以把年薪的预测变化看做股本回报率变化的函数:∆salˆary = 18.501 (∆roe),这意味着当股本回报率增加1个百分点,即∆roe =1,则年薪的预测变化就是18.5千美元,在线性方程中,估计的变化与初始年薪无关。
《计量经济学》第五章 异方差性
(二)检验的特点
不仅能对异方差的存在进行判断,而且还能对异 方差随某个解释变量变化的函数形式 进行诊断。 该检验要求变量的观测值为大样本。
36
(三)检验的步骤
1.建立模型并求 ei 根据样本数据建立回归模型,并求残差序列
4
第一节 异方差性的概念
本节基本内容:
●异方差性的实质 ●异方差产生的原因
5
一、异方差性的实质
同方差的含义
同方差性:对所有的 i (i 1,2,...,n)有:
Var(ui ) = σ 2
(5.1)
因为方差是度量被解释变量 Y的观测值围绕回归线
E(Yi ) 1 2 X 2i 3X3i ... k X ki (5.2)
1.求回归估计式并计算 et2
用OLS估计式(5.14),计算残差
差的平方 et2 。
et
Yt
-Yˆt
,并求残
2.求辅助函数
用残差平方
et2
作为异方差
σ
2 t
的估计,并建立
X
2t
,
X
3t
,
X
2 2t
,
X
2 3t
,
X
2t
X
3t
的辅助回归,即
eˆt2
=
αˆ1
+
αˆ2
X
2t
+
αˆ3
X
3t
+
αˆ4
X
2 2t
+
αˆ5
X
2 3t
+
αˆ6
异方差案例分析
异方差案例分析中国农村居民人均消费支出主要由人均纯收入来决定。
农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等。
为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,可使用如下双对数模型:1122ln ln ln Y X X βββμ0=+++其中,Y 表示农村家庭人均消费支出,X 1表示从事农业经营的收入,X 2表示其他收入。
下表列出了中国2001年各地区农村居民家庭人均纯收入及消费支出的相关数据。
中国2001年各地区农村居民家庭人均纯收入与消费支出安徽 1412.4 1013.1 1006.9 甘肃 1127.37 621.6 887 福建 2503.1 1053 2327.7 青海 1330.45 803.8 753.5 江西 1720 1027.8 1203.8 宁夏 1388.79 859.6 963.4 山东 190512931511.6 新疆1350.231300.1410.3河南1375.6 1083.8 1014.1我们不妨假设该线性回归模型满足基本假定,采用OLS 估计法,估计结果如下:12ˆln 1.6550.3166ln 0.5084ln YX X =++ (1.87) (3.02) (10.04)R 2=0.7831 R 2=0.7676 D.W.=1.89 F=50.53 RSS=0.8232图1估计结果显示,其他收入而不是从事农业经营的收入的增长,对农户消费支出的增长更具有刺激作用。
下面对该模型进行异方差性检验。
1. 图示法。
首先做出Y 与X 1、X 2的散点图,如下:图2可见1X 基本在其均值附近上下波动,而2X 散点存在较为明显的增大趋势。
再做残差平方项2ˆi e与1ln X 、2ln X 的散点图:图3图4可见图1中离群点相对较少而图2呈现较为明显的单调递增的异方差性。
故初步判断异方差性主要是X引起的。
第三章异方差和自相关
2
第一节 异方差的介绍
一、异方差的定义及产生原因
▪ 异方差(heteroscedasticy)就是对同方差假设 (assumption of homoscedasticity)的违反。经典 回归中同方差是指随着样本观察点X的变化 i ,线 性模型中随机误差项 的方差并不改变,保持为
▪ 对每一个回归模型,计算残差平方和:记 值较小的一组子样本的残差平方和为 RSS1
= 1i2 ,xi 值较大的一组子样本的残差平
方和为 RSS2 = 2i2 。
13
▪ 第三步,建立统计量。
▪ 用所得出的两个子样本的残差平方和构成F统 计量:
F
2i
2
/(
n
2
d
1i
2
/(
n
2
d
k 1) k 1)
用OLS法。对 进行t检验,如果不显著,则没
有异方差性。否则表明存在异方差。 ▪ Park检验法的优点是不但能确定有无异方差性,
而且还能给出异方差性的具体函数形式。但也有
质疑,认为 仍可vi 能有异方差性,因而结果的真
实性要受到影响。
20
(四)Glejser检验法
▪ 这种方法类似于Park检验。首先从OLS回归取得
7
一、图示法
▪ 图示法是检验异方差的一种直观方法,通常有下 列两种思路:
▪ (一)因变量y与解释变量x的散点图:若随着x 的增加,图中散点分布的区域逐渐变宽或变窄,
或出现了偏离带状区域的复杂变化,则随机项可 能出现了异方差。
▪ (与x二的)散残点差图图,。或残者差在图有即多残个差解平释方变ˆ量i(2 时i2的可估作计残值)
R案例分析_异方差
R案例分析_异方差异方差是指在统计分析中,随着自变量的不同取值,因变量的方差也随之发生变化的现象。
异方差问题在实际数据分析中经常遇到,其存在会对统计模型的准确性和效果产生重要影响。
本文将以一个实际案例为例,分析异方差问题及其解决办法。
假设我们是一家电商公司的数据分析师,负责分析产品销售情况。
在进行销售数据分析时,我们发现在不同的销售渠道下,产品的销售量存在差异。
为了更准确地分析销售情况,我们希望解决异方差问题。
首先,我们需要通过数据分析手段来确认异方差的存在。
我们可以绘制销售量和销售渠道的散点图,观察销售量在不同渠道下的分布情况。
如果不同渠道下的散点图呈现出不同的方差大小,则可以初步判断存在异方差问题。
确定存在异方差问题后,我们需要采取措施来解决。
以下是几种常见的异方差处理方法:1.数据变换:可以通过对因变量进行一些数学变换,如开方、取对数等。
这样可以将异方差问题转化为方差齐性问题,便于后续的数据分析。
但需要注意的是,变换后的数据在解释上可能会有所改变。
2. 加权最小二乘法(Weighted Least Squares, WLS):WLS是一种适用于异方差数据的回归分析方法。
其基本思想是根据异方差结构,对不同的观测值赋予不同的权重,从而修正回归模型的误差项。
3.方差分析(ANOVA):如果我们可以找到一些能够解释异方差的因素,可以通过方差分析来进行处理。
对于不同的因子水平,通过统计方法比较其差异性,进而确定是否存在异方差问题。
4. 偏最小二乘回归(Partial Least Squares Regression, PLS):PLS是一种非参数化的回归分析方法,可以在一定程度上克服异方差问题。
PLS通过找到主成分来降低变量间的相关性,从而改善模型的准确性。
在实际应用中,我们可以尝试使用上述方法中的一个或多个来解决异方差问题。
需要注意的是,不同的方法适用于不同的数据情况,选择合适的方法需要基于实际情况和数据分析的目的进行综合考虑。
异方差的例子
异方差的例子异方差指的是在统计分析中,不同观测值的方差不相等。
这种情况下,使用传统的线性回归模型可能会导致结果的偏差和误差。
因此,为了得到更准确的结果,需要采取一些方法来处理异方差性。
下面将列举一些常见的异方差的例子,并介绍相应的处理方法。
1. 股票价格波动:股票价格的波动通常呈现出非常明显的异方差性。
在股票市场中,有些股票的价格非常波动,而有些股票的价格相对稳定。
这种情况下,可以使用加权最小二乘法来处理异方差。
2. 学生考试成绩:学生考试成绩的方差通常也会存在异方差性。
一些学生的考试成绩波动较大,而一些学生的考试成绩相对稳定。
在分析学生的考试成绩时,可以考虑使用方差齐性检验来确定是否存在异方差,并选择相应的处理方法。
3. 经济增长率:经济增长率在不同的时间段和地区通常也会呈现出异方差性。
一些地区的经济增长率波动较大,而一些地区的经济增长率相对稳定。
在分析经济增长率时,可以使用异方差稳健标准误来处理异方差。
4. 气温变化:气温在不同的季节和地区通常也会呈现出异方差性。
一些地区的气温波动较大,而一些地区的气温相对稳定。
在分析气温变化时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
5. 金融市场波动:金融市场的波动性也会导致异方差的问题。
一些金融资产的价格波动较大,而一些金融资产的价格相对稳定。
在分析金融市场波动时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
6. 人口增长率:人口增长率在不同的国家和地区也会呈现出异方差性。
一些国家的人口增长率波动较大,而一些国家的人口增长率相对稳定。
在分析人口增长率时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
7. 网络流量:网络流量在不同的时间段和地区也会呈现出异方差性。
一些地区的网络流量波动较大,而一些地区的网络流量相对稳定。
在分析网络流量时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
8. 土地价格:土地价格在不同的地区和时间段也会呈现出异方差性。
14异方差案例分析
14异方差案例分析异方差(heteroscedasticity)是指随着自变量的变化,因变量的方差也发生变化的一种情况。
在统计分析中,当异方差存在时,会影响到参数估计的准确性和统计检验的可靠性,因此需要进行异方差的诊断和处理。
下面通过一个案例来分析异方差的问题。
假设有一家电子产品公司,想要研究其产品销售量与广告投入的关系。
公司从10个城市中随机选择了200家零售店作为样本,并分别统计了广告投入金额(自变量)和产品销售量(因变量)。
数据如下:店铺编号,广告投入金额(万元),产品销售量(千件)---------,-----------------,-----------------1,1.2,102,1.8,113,1.5,94,2.3,155,2.0,86,1.6,107,1.9,128,1.1,99,2.5,1610,2.2,14...,...,...200,3.4,18```pythonimport matplotlib.pyplot as pltadvertising = [1.2, 1.8, 1.5, 2.3, 2.0, 1.6, 1.9, 1.1, 2.5, 2.2, ...]sales = [10, 11, 9, 15, 8, 10, 12, 9, 16, 14, ...]plt.scatter(advertising, sales)plt.xlabel("Advertising Investment (million yuan)")plt.ylabel("Product Sales (thousand units)")plt.show```从散点图中我们可以看出,随着广告投入的增加,产品销售量并没有呈现出明显的线性增长趋势,同时也可以看到在销售量较低和高投入时,方差较大的情况。
为了进一步确定是否存在异方差的问题,我们可以进行异方差的诊断检验,最常用的方法是利用残差图。
stata沃尔德组间异方差检验
stata沃尔德组间异方差检验下载提示:该文档是本店铺精心编制而成的,希望大家下载后,能够帮助大家解决实际问题。
文档下载后可定制修改,请根据实际需要进行调整和使用,谢谢!本店铺为大家提供各种类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to know different data formats and writing methods, please pay attention!Stata沃尔德组间异方差检验简介Stata是一种统计分析软件,被广泛应用于各种研究领域。
异方差加权最小二乘法修正(精)
第五章 案例分析一、问题的提出和模型设定根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。
假定医疗机构数与人口数之间满足线性约束,则理论模型设定为i i i u X Y ++=21ββ (5.31)其中i Y 表示卫生医疗机构数,i X 表示人口数。
由2001年《四川统计年鉴》得到如下数据。
表5.1 四川省2000年各地区医疗机构数与人口数地区人口数(万人) X医疗机构数(个)Y地区人口数(万人) X医疗机构数(个)Y成都 1013.3 6304 眉山 339.9 827 自贡 315 911 宜宾 508.5 1530 攀枝花 103 934 广安 438.6 1589 泸州 463.7 1297 达州 620.1 2403 德阳 379.3 1085 雅安 149.8 866 绵阳 518.4 1616 巴中 346.7 1223 广元 302.6 1021 资阳 488.4 1361 遂宁 371 1375 阿坝 82.9 536 内江 419.9 1212 甘孜 88.9 594 乐山345.91132 凉山 402.41471 南充 709.24064二、参数估计进入EViews 软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下表5.2估计结果为56.69,2665.508..,7855.0)3403.8()9311.1(3735.50548.563ˆ2===-+-=F e s R X Y ii (5.32) 括号内为t 统计量值。
三、检验模型的异方差本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。
为此,必须对该模型是否存在异方差进行检验。
异方差性的检验方法和修正
Z N UE L异方差性的检验方法和修正一、 实验目的熟练掌握异方差性的检验方法和修正处理方法二、实验原理异方差(heteroskedasiticity )是计量经济工作红线性回归模型经常遇到的问题,异方差的存在对线性回归分析有很强的破坏作用。
利用异方差的图形检验、戈德菲尔特-夸特检验、怀特检验方法,检验案例中线性回归模型的异方差是否存在,若存在的话,如何通过加权最小二乘法进行修正,建立能够真正反应案例的经济模型,实现对经济的正确指导作用。
三、实验要求通过Eviews 软件应用给定的案例做异方差模型的图形检验法、Glodfeld-Quanadt(戈德菲尔特-夸特)检验与White(怀特)检验,并使用加权最小二乘法(WLS)对异方差进行修正。
四、 实验步骤在现实经济活动中,最小二乘法的基本假定并非都能满足,本案例讲讨论随机误差项违背基本假定的一个方面—异方差性。
本案例将介绍:异方差模型的图形检验、戈德菲尔特-夸特检验、怀特检验;异方差模型的加权最小二乘法修正。
1、建立workfile 和对象,录入2007年城镇居民收入X 和消费额Y 的数据。
2、参数估计按住ctrl 键,同时选中序列X 和序列Y ,点右键,在所出现的右键菜单中,选择open\as Group 弹出一对话框,点击其上的“确定”,可生成并打开一个群对象。
在群对象窗口工具栏中点击view\Graph\Scatter\Simple Scatter, 可得X 与Y 的简单散点图,可以看出X 与Y 是带有截距的近似线性关系。
点击朱界面菜单Quick\Estimate Equation, 在弹出的对话框中输入 Y C X,点确定即可到回归结果,如下:VariableCoefficientStd. Errort-StatisticProb. C 756.6871570.1912 1.3270760.1948X0.3076930.01908216.124970.0000R-squared0.899659 Mean dependent var 8689.161Durbin-Watson stat1.694571 Prob(F-statistic)0.0000003、异方差检验本案例用的是2007年的全国各个诚实城镇居民收入和消费额,由于地区之间这种差异使得模型很容易产生异方差,从而影响模型的估计和运行,为此必须对该模型是否存在异方差进行检验。
异方差性案例分析
异方差性案例分析异方差性是统计学中一种常见的问题,指的是随机变量具有不同的方差或者方差不稳定的情况。
当异方差性存在时,会影响到统计模型的效果和结果的可信度。
本文将通过一个实际案例来分析异方差性的问题,并探讨如何解决这一问题。
假设我们进行了一项研究,调查了一批学生的学业成绩和上网时间的关系。
我们收集了60位学生的数据,其中包括学习时间(以小时为单位)和平均每周上网时间(以小时为单位)。
我们的研究目的是确定学生的学习时间与上网时间是否存在相关性,并且构建一个合适的回归模型来预测学生成绩。
首先,我们绘制了学习时间和上网时间的散点图,以探索两个变量之间的关系。
从散点图中,我们可以看到数据的分布情况和可能的相关性。
接下来,我们使用线性回归模型来分析学习时间和上网时间的关系。
我们假设学习时间是因变量,上网时间是自变量。
模型的形式为:学习时间=β0+β1*上网时间+ε其中,β0和β1是回归系数,ε是误差项。
我们利用最小二乘法估计出回归系数,进而得到回归模型。
然而,在进行异方差性检验时,我们发现了一个令人担忧的问题:残差的方差并不是恒定的。
简单说,残差并不是随机地围绕着回归线分布,而是变动的。
异方差性的存在会导致参数估计的不准确性,进而使统计结果产生偏差和误导性。
因此,解决异方差性问题是非常重要的。
为了解决这个问题,我们可以尝试使用加权最小二乘法,即引入一个权重系数来重新估计回归系数。
权重系数的选择与残差的方差相关,即越大的权重用于较小方差的观测值,越小的权重用于较大方差的观测值。
为了确定权重系数,我们可以进行一些统计方法的变换,例如对残差进行平方根、对数转换等。
我们还可以使用一些专门用于解决异方差性的模型,如加权最小二乘法(WLS)、广义最小二乘法(GLS)等。
在我们的案例中,我们尝试了通过对残差进行平方根转换来解决异方差性问题。
具体来说,我们计算了残差的平方根,并重新估计了回归系数。
经过尝试和比较,我们发现使用平方根转换的模型的残差方差相对于未加权的模型有了显著的改善。
(完整word版)R案例分析_异方差
第五章案例分析一、问题的提出和模型设定为了分析不同省份或城市的交通和通讯支出的规划提供依据,支配收入的关系,建立交通和通讯支出与可支配收入的回归模型。
支配收入满足线性约束,则理论模型设定为得到如下数据注:见数据文件 cumexp_income.csv利用最小二乘法估计模型(1 )的参数:mydata .lm <- lm(cumexp ~ in come) summary(mydata .Im) R 软件输出的结果为: Call:lm(formula = cumexp ~ in come) -97.465 -19.986 -5.111 15.532 184.115cum iin come i u i(1)其中cum i 表示交通和通讯支出,income i 表示可支配收入。
由1999年《中国统计年鉴》分析交通和通讯支出与可 假定交通和通讯支出与可f t . 可丸配收入 地 &t Ie宁n.尚議总江 内薫古 卅 中 北 南4009. 6] MSC 73 4112+ 41 4206. 61 421P. 42 4220.24 4240,13 4251. A2 4258. 50 4353.02 4&65+ 39 4617. 24 4770.47 4826, 36 ^852. 87159. 60137.11 231.51 172.65 bl 65 19】,76 197. 04 176.39 1S5. 7S 20«. 91 227. 2]201, &7237. lfi 2H. 37 265,朋册 河广t ;£云5000. 795084+ 64 5127,08 53S0. 085412. 24 5434.26 51G6. 57 6017, 85 6042. 78 £485.637110.54 7B36. 76 847 L 98 8773.10B839. 6Bcum212. 30270, Q9212,46 255.53 252.37255. 79 337. 83吳娠来画:中耳施计卑蓦,申M 皱计出蚤社卿参数估计Residuals:Min 1Q Median 3Q MaxI 单位=元}*4. I丈逋釦诞iff,支出incumJi &哥jt 配收人|交遇和道酬JI 出 ”- 一卜inCoefficie nts:Estimate Std. Error t value Pr(>|t|)(In tercept) -56.91798 36.20624 -1.5720.127in come 0.058080.006488.962 1.02e-09 ***Signif. codes: 0' *** ' 0.001' ** ' 0.01'* ' 1 0.05'. ' 0.1Residual sta ndard error: 50.48 on 28 degrees of freedom Multiple R-squared: 0.7415, Adjusted R-squared: 0.7323 F-statistic: 80.32 on 1 and 28 DF, p-value: 1.021e-09估计结果为:cuifl 56.92 0.06i ncome (36.21) (0.01)R 2 0.74 s.e. 5048 F 80.32括号内为标准差。
计量经济学案例分析
计量经济学案例分析一、问题提出国内生产总值(GDP)指一个国家或地区所有常住单位在一定时期内(通常为1 年)生产活动的最终成果,即所有常住机构单位或产业部门一定时期内生产的可供最终使用的产品和劳务的价值,包括全部生产活动的成果,是一个颇为全面的经济指标。
对国内生产总值的分析研究具有极其重要的作用和意义,可以充分地体现出一个国家的综合实力和竞争力。
因此,运用计量经济学的研究方法具体分析国内生产总值和其他经济指标的相关关系。
对预测国民经济发展态势,制定国家宏观经济政策,保持国民经济平稳地发展具有重要的意义。
二、模型变量的选择模型中的被解释变量为国内生产总值Y。
影响国内生产总值的因素比较多,根据其影响因素的大小和资料的可比以及预测模型的要求等方面原因, 文章选择以下指标作为模型的解释变量:固定资产投资总量(X1 ) 、财政支出总量(X2 )、城乡居民储蓄存款年末余额(X3 )、进出口总额(X4 )、上一期国内生产总值(X5)、职工工资总额(X6)。
其中,固定资产投资的增长是国内生产总值增长的重要保障,影响效果显著;财政支出是扩大内需的保证,有利于国内生产总值的增长;城乡居民储蓄能够促进国内生产总值的增长,是扩大投资的重要因素,但是过多的储蓄也会减缓经济的发展;进出口总额反映了一个国家或地区的经济实力;上期国内生产总值是下期国内生产总值增长的基础;职工工资总额是国内生产总值规模的表现。
三、数据的选择文中模型样本观测数据资料来源于2006 年《中国统计年鉴》,且为当年价格。
固定资产投资总量1995-2005 年的数据取自2006 年统计年鉴,1991-1994 年的为搜集自其他年份统计年鉴。
详细数据见表1。
表1四、模型的建立通过散点图可以发现,被解释变量Y与解释变量:X1、X2、X3、X4、X5、X6 之间大致存在线性相关关系。
于是可以设该模型的理论方程:Y =β0 +β1X1 +β2 X2 +β3 X3 +β4 X4+β5 X5 +β6X6+u (1)五、模型的参数估计对于理论模型运用OLS进行参数估计,再用Eviews软件进行运算,得到的结果如下:Y(^)=-2343.173-0.232209X1+0.285821X2-0.090052X3+0.265575X4+0.653820X5 +3.810634X6 (2)t =(-0.867663)(-0.663590)(0.569626)(-0.295743)(1.144851)(3.051578)(3.743547)R²=0.999342 D.W.=2.181505 F=2023.923六、模型的检验1、经济意义检验上面模型(2)可以看出β1<0,这表明随着固定资产投资总额的增加,国内生产总值反而减少,这是不符合实际的,因此不能通过经济意义检验,把此变量剔除。
异方差完整案例分析
10.5 一个更完整的例子让我们来看一个更完整的基于横殿面的异方差的例子。
20世纪70年代中期,美国能源部门试图基于各地过去的汽油消耗量和人口变动情况以及其他一些因素给各地区、各州甚至各零售点直接分配汽油。
实现这种分配必须将大量因素作为各州(各地区)的燃油消耗量(应变量)的函数而建立模型。
而对于这样的横截面模型,即使是估计的模型,也很可能会具有异方差问题。
在模型中,应变量为各州的燃油消耗量,可能的解释变量包括:与各州规模大小相关的变量(例如公路里程数、注册的机动车数量和人口),以及与各州规模大小无关的变量(例如燃油税率和最高限速)。
因为在模型中反映各州规模大小的变量不应多于一个(如果包含过多变量容易导致多重共线性),因为有许多州的最高限速相同(但在时间序列模型中,它将是一个有用的变量)。
因此,一个合理的模型为:012(,)i i i i i PCON f REG TAX REG TAX εβββε+-=+=+++ (10-20)式中 i PCON ——第i 个州的燃油消耗量(百万BTU ), i REG ——第i 个州的注册机动车数量(千辆), i TAX ——第i 个州的燃油税率(美分/加仑), i ε——经典误差项。
我们可以认为一个州注册的汽车数量越多,该州所消耗的燃油也越多;而一个州的燃油税率越高则该州的燃油消耗量越小1。
我们搜集那一时期的数据(见表10-1)用于估计方程(10-20),得到:i i i TAX REG PCON 59.531861.07.551-+=∧(10-21)(0.0117) (16.86)15.88t = 3.18-20.861R =50N =表10-1 燃油消费例子中的数据PCON UHM TAX REG POP e state270 2.2 9 743 1136 62.335 Maine 122 2.4 14 774 948 176.52 New Hampshire58 0.7 11 351 520 30.481 Vermont 82120.69.937505750101.87Massachusetts1在方程中我们也可用*TAX REG 或者*TAX PO P (iPOP 代表第i 个州的人口)取代TAX 作为方程的解释变量。
固定效应模型异方差stata
固定效应模型异方差stata固定效应模型是一种常用的面板数据模型,它可以帮助研究人员解决面板数据中可能存在的异方差问题。
本文将介绍固定效应模型的基本原理和在STATA软件中的实现方法,并通过一个案例来说明如何应用固定效应模型来处理异方差问题。
1. 引言面板数据是指在时间上观察同一组个体的多次观测数据,它具有一定的时间维度和个体维度。
在面板数据中,个体间可能存在着不同的特征和差异,而时间序列之间也可能存在异方差问题。
异方差是指方差不恒定的现象,即在不同时间点,方差的大小存在差异。
在面板数据分析中,异方差的存在可能会影响模型的稳健性和效率性。
固定效应模型可以有效地解决异方差问题,因此在面板数据分析中得到了广泛应用。
2. 固定效应模型的基本原理固定效应模型通过引入个体固定效应来控制个体间的差异,从而消除由于异方差引起的估计偏误。
在固定效应模型中,个体固定效应被视为未被观测到的个体特征,与解释变量无关。
因此,个体固定效应可以被视为一个捕捉个体特征的虚拟变量,并通过引入虚拟变量进行估计。
3. STATA中固定效应模型的实现方法在STATA软件中,可以通过面板数据命令xtreg来实现固定效应模型的估计。
在估计固定效应模型之前,首先需要将面板数据进行排序和标识个体,然后将数据转化为面板数据形式。
接下来,利用xtreg命令进行模型的估计。
在xtreg命令中,可以通过选项fe来指定固定效应模型的估计,即引入个体固定效应。
4. 案例分析为了说明固定效应模型在处理异方差问题中的应用,假设有一个研究关于企业绩效的面板数据集。
数据集包括100家企业在10年内的绩效指标和影响绩效的解释变量。
首先,我们可以通过描述性统计分析来观察面板数据的特征和异方差现象。
然后,我们可以利用固定效应模型来研究解释变量对企业绩效的影响,同时控制个体固定效应。
最后,我们可以利用固定效应模型的估计结果来检验异方差是否还存在,并评估模型的拟合度和有效性。
异方差检验
目录案例引入 (2)数据分析 (4)建立多元线性模型及检验 (5)经济检验: (6)统计检验 (6)异方差检验 (7)异方差修正 (12)结果解释 (13)一、案例引入随着国内生产生产总值和城乡居民可支配收入的不断增长,使得人们的收入成倍增长,无论微观经济理论还是人们的感受,收入的增加能够满足人们的更多需求,从而是人们对生活状况的满意程度增加,即提升主观幸福感,增加生命质量得分。
同时,研究结果现实收入较低人群的生命质量得分均较低且与其他组间差异大。
随着收入的增加,生命质量有提升的趋势。
而在社会五大保险之中,只有医保与我们的生命息息相关,堪称社保之中的重中之重,医保的价值让我们的健康得到了保证。
数据(表1)为我们研究收入水平与医保对生命预期的影响提供了重要数据基础。
我们选择58国收入、医保、生命预期这3个变量的相关数据作为样本,进行研究。
观察值生命预期收入医保观察值生命预期收入医保1 71.8 2046 81 44 74.7 13410 1002 60.2 686 74 45 55.6 884 413 76.4 14862 100 46 77.4 14784 1004 75.9 11760 100 47 64.7 360 805 73.2 7944 100 48 45.0 150 306 49.8 296 18 49 46.8 230 497 51.6 3288 90 50 73.7 5842 1008 50.3 156 45 51 62.5 784 849 52.6 482 64 52 54.3 330 7310 64.5 1456 76 53 75.1 17714 10011 52.6 324 75 54 66.7 1322 10012 62.8 462 89 55 52.2 292 6113 50.3 292 56 56 49.5 306 4514 75.7 11924 100 57 77.7 14280 10015 48.0 294 28 58 49.3 360 5116 48.3 244 61 59 65.2 1124 6417 63.2 2560 90 60 47.5 472 4018 55.0 392 80 61 65.6 804 8019 66.8 1094 63 62 47.7 13730 10020 66.3 1038 89 63 46.7 186 1521 52.6 248 81 64 61.4 1056 3422 67.9 7794 100 65 51.5 270 2623 72.3 994 90 66 76.6 16192 10024 59.3 522 80 67 47.4 166 4925 53.6 384 61 68 70.4 2328 7226 70.7 4956 99 69 54.3 342 5527 74.6 13408 100 70 74.5 10490 10028 71.3 1974 100 71 76.8 19782 10029 62.1 3954 80 72 64.6 862 7030 45.5 420 30 73 65.1 1180 9131 44.0 252 43 74 60.9 604 7232 71.4 1472 97 75 70.1 396 9333 52.0 744 31 76 69.0 2736 9434 63.5 780 74 77 70.1 2142 10035 70.4 19182 90 78 74.4 1506 8036 74.7 11076 100 79 76.9 14472 10037 60.8 1078 75 80 72.9 15506 10038 52.2 980 81 81 68.0 1246 6039 74.1 16624 100 82 76.6 11060 10040 75.0 9898 100 83 46.5 160 2841 71.8 2036 82 84 61.0 862 5842 76.5 9532 100 85 50.1 638 4643 70.8 2366 100 ————数据来源:老师提供数据无需处理。
异方差定义及检验
回归模型的预测
预测精度下降
异方差会导致回归模型的预测精度下降,使得预测值与实际 值之间的差距增大。
预测区间的不准确
异方差会影响预测区间的准确性,使得预测区间不能准确反 映实际结果的分布情况。
回归模型的应用
模型应用的限制
异方差的存在限制了回归模型的应用 范围,使得模型在某些情况下无法适 用。
模型解释性的降低
异方差产生的原因
数据特性
01
数据本身的特性可能导致异方差的出现,如数据异常值、非线
性和非正态分布等。
模型设定不当
02
模型设定不准确或者过于简单可能导致异方差的出现,如线性
回归模型未考虑非线性关系或者遗漏重要解释变量等。
样本误差
03
样本误差也可能导致异方差的出现,如样本选择偏差、测量误
差等。
02
异方差检验方法
异方差会影响回归模型的解释性,使 得模型在解释自变量对因变量的影响 时变得困难。
04
如何处理异方差
方差齐性变换
01
对数变换
将原始数据取对数,可以使得数 据更接近正态分布,从而减少异 方差的影响。
平方根变换
02
03
Box-Cox变换
对原始数据取平方根,也可以在 一定程度上减少异方差。
Box-Cox变换是一种更加通用的 方法,通过选择一个适当的λ值, 使得变换后的数据满足方差齐性。
VS
详细描述
通过对经济增长数据进行异方差检验,可 以了解各国或地区经济增长的非平稳性和 非线性特征,进而为政策制定和经济预测 提供依据。常用的检验方法包括单位根检 验、协整检验和误差修正模型等。
感谢观看
THANKS
异方差定义及检验
统计学─从数据到结论第八章异方差
子样的顺序判断是递增型异方差还是递减异
型方差。
4. 怀特(White)检验 怀特检验不需要排序,且适合任何形式的异
方差。 怀特检验的基本思想与步骤(以二元为例): Yi 0 1 X 1i 2 X 2i i
然后做如下辅助回归
e~i2
0
E(μ) 0
Cov(μ) E(μμ) 2 W
w1
W
w2
w
n
即存在异方差性。
W是一对称正定矩阵,存在一可逆矩阵D使得 W=DD’
用D-1左乘 Y=X+
两边,得到一个新的模型:
D 1Y D 1Xβ D 1μ
Y*
X
*β
μ *
该模型具有同方差性。因为
nR
2
~
2 (5)
* 对给定的 ,查表得: 2 (5) * 计算 nR2
*
nR2
2
(5),拒绝
H
,表示存在异方差。
0
2、 White 检验在EViews上的实现
设 Yt 1 2 X 2t 3 X 3t t
1)Ls Y C X1 X2
2)点击 View/residual test/White/回车;
• 注意: 在实际操作中人们通常采用如下的经验方法:
不对原模型进行异方差性检验,而是直接选 择加权最小二乘法,尤其是采用截面数据作样 本时。
如果确实存在异方差,则被有效地消除了;
如果不存在异方差性,则加权最小二乘法等 价于普通最小二乘法。
在计量经济学实践中,计量经济学家偏爱使用对数变换解决问题,往 往一开始就把数据化为对数形式,再用对数形式数据来构成模型,进行回 归估计与分析。 这是因为: 对数形式可以减少异方差和自相关的程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
异方差案例分析
中国农村居民人均消费支出主要由人均纯收入来决定。
农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等。
为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,可使用如下双对数模型:
1122ln ln ln Y X X βββμ0=+++
其中,Y 表示农村家庭人均消费支出,X 1表示从事农业经营的收入,X 2表示其他收入。
下表列出了中国2001年各地区农村居民家庭人均纯收入及消费支出的相关数据。
中国2001年各地区农村居民家庭人均纯收入与消费支出
安徽 1412.4 1013.1 1006.9 甘肃 1127.37 621.6 887 福建 2503.1 1053 2327.7 青海 1330.45 803.8 753.5 江西 1720 1027.8 1203.8 宁夏 1388.79 859.6 963.4 山东 1905
1293
1511.6 新疆
1350.23
1300.1
410.3
河南
1375.6 1083.8 1014.1
我们不妨假设该线性回归模型满足基本假定,采用OLS 估计法,估计结果如下:
12ˆln 1.6550.3166ln 0.5084ln Y
X X =++ (1.87) (3.02) (10.04)
R 2=0.7831 R 2=0.7676 D.W.=1.89 F=50.53 RSS=0.8232
图1
估计结果显示,其他收入而不是从事农业经营的收入的增长,对农户消费支出的增长更具有刺激作用。
下面对该模型进行异方差性检验。
1. 图示法。
首先做出Y 与X 1、X 2的散点图,如下:
图2
可见1X 基本在其均值附近上下波动,而2X 散点存在较为明显的增大趋势。
再做残差平方项2
ˆi e
与1ln X 、2ln X 的散点图:
图3
图4
可见图1中离群点相对较少而图2呈现较为明显的单调递增的
异方差性。
故初步判断异方差性主要是2
X引起的。
2.G-Q检验
根据上述分析,首先将原始数据按X2升序排序,去掉中间7个数据,得到两个容量为12的子样本,记数据较小的样本为子样本1,数据较大的为子样本2。
对子样本1进行OLS回归,结果如下:
图5
得到子样本1的残差平方和RSS1=0.064806;
再对子样本2进行OLS回归,结果如下:
图6
得到子样本2的残差平方和RSS 2=0.279145。
计算F 统计量:
21RSS 0.279145F 4.3082
RSS 0.064806==≈
在5%的显著水平下,F 0.05(9,9)=3.18 < F,故应拒绝同方差假设,表明该总体随机干扰项存在单调递增的异方差。
3.white 检验
记原模型残差平方项为2ˆe
, 将其与X 1,X 2及其平方项与交叉项做辅助回归,结果如下:
图7
由各参数的t值可见各项都不是很显著,而且可决系数值也比较小,但white统计量nR2=31⨯0.464=14.38该值大于5%显著
χ=11.07,因此应水平下自由度为5的2χ分布相应的临界值20.05
拒绝同方差假设。
去掉交叉项后的辅助回归结果如下:
图8
显然,X2和X2的平方项的参数的t检验是显著的,并且white 统计量nR2=31⨯0.437376=11.58656大于5%显著水平下自由度
χ=11.07,因此应拒绝同方差假为5的2χ分布相应的临界值20.05
设。
4.异方差的修正——加权最小二乘法
我们以1/X2为权重进行异方差的修正。
加权后的估计结果如
下:
图9
可见修正后各解释变量的显著性总体相对提高。
其white检验结果如下:
图10
此时white 统计量nR 2
=31⨯0.023325=0.723小于5%显著水平
下自由度为5的2χ分布相应的临界值2
0.05χ=11.07,故此时满足
同方差假设。
故修正后的估计结果为:
12
ˆln 2.3250.441ln 0.284ln Y X X =++。