计量经济学-第13章 模型设定和诊断检验
实证经济学计量模型的构建与检验
实证经济学计量模型的构建与检验经济学是研究经济现象的科学,而实证经济学则更加注重对经济现象进行量化分析和实证检验。
实证经济学计量模型的构建与检验是实证经济学的核心内容之一,本文将探讨实证经济学计量模型的构建和检验方法,以及其在经济研究中的应用。
一、实证经济学计量模型的构建实证经济学计量模型是对经济现象进行量化分析的数学模型,其构建需要从理论出发,选取合适的变量并建立变量之间的关系。
以下是实证经济学计量模型构建的一般步骤:1.选取研究领域:确定研究的经济现象或问题,明确研究领域和目标。
2.文献综述:对该领域已有的理论和实证研究进行综述,了解已有的研究成果和方法。
3.变量选择:根据研究目标和理论基础,选择适当的经济变量,并明确它们的测量方法和数据来源。
4.模型功能:根据变量之间的理论联系,构建一个能够解释研究现象或问题的数学模型,包括变量的函数形式和参数的设定。
5.数据获取:收集相关的经济数据,保证数据的可靠性和有效性。
6.模型估计:运用统计学方法对模型的参数进行估计,得到估计结果。
二、实证经济学计量模型的检验实证经济学计量模型的检验是为了验证所构建的模型是否能够准确解释实际经济现象或问题。
以下是常用的实证经济学模型检验方法:1.拟合度检验:通过比较模型的观测值和估计值之间的差异,评估模型对实际数据的拟合程度。
常用的拟合度检验指标包括R方、平均绝对百分比误差等。
2.假设检验:通过对模型的假设进行检验,判断模型的显著性和有效性。
常用的假设检验包括参数显著性检验、模型整体显著性检验等。
3.稳健性检验:对模型的参数进行鲁棒性检验,验证模型是否对数据中的异常值和极端观测点具有较好的稳健性。
4.残差分析:对模型的残差进行检验,判断模型是否存在系统性误差或模型设定是否合理。
常用的残差分析方法包括残差图、残差正态性检验等。
三、实证经济学计量模型的应用实证经济学计量模型在经济研究中具有广泛的应用,可以应用于各个领域的经济问题。
模型设定和诊断检验
(13.3.6) (13.3.7)
18
我们知道:
ˆ 2
yix2i x22i
1
(
ˆ2
y x 2 )( x 3 2 ) ( y x 3 )( x 2 x 3 ) x 2 2 x 3 2 ( x 2 x 3 )2
1、如果X3与X2相关,r23 ≠ 0,那么
bˆห้องสมุดไป่ตู้
和
1
bˆ
1
是有偏误
2
且非一致的。也就是说,
E(bˆ1) 1
E(bˆ12) 2
2、如果X3与X2不相关,r23 = 0,那么bˆ 3 2
0 ,尽管bˆ
现在无
1
偏,但bˆ 1 2 是无偏的。
3、干扰的方差σ2将被不正确地估计。
4、bˆ 1 2 的方差 (
第十三章
计量经济建模: 模型设定和诊断检验
1
经济学家多年来对“真理”的寻求曾给人一种观感: 经济学家们就好像在一间黑房子里搜寻一直原本并不存在 的黑猫;而计量经济学家还经常声称找到了一只。
2
经典线性回归模型的假定之一(假定9)是,分析中 所使用的模型被“正确地”设定;如果模型并未被明确 设定,我们就遇到了这样的问题:模型设定误差(model specification error)或者模型设定偏误(model specification bias)。
因此,(13.2.2)中的误差项u2i事实上是:
u2i u1i 4Xi3
8
2、包含了一个无需或无关的变量 (Including an unnecessary or irrelevant variable)
假定另一个研究者使用了以下模型:
计量经济学重点
第一章:计量经济学方法论计量经济学方法论大致地说,传统的计量经济学方法论按下列路线进行:(1)理论或假说陈述(2)数学模型设定(3)计量模型设定(4 )获取数据(5)参数估计(6)假设检验(7)预测(8)利用模型进行控制或制定政策计量经济学所用数据的类型:(1)时间序列数据:对一个变量在不同时间取值的一组观测结果(2)横截面数据:对一个或多个变量在同一时间点上收集的数据(3)混合数据:两者兼有(4)综列、纵列或微观综列数据:混合数据的特殊类型,指对相同的横截面的单元在时间轴上进行跟踪调查的数据。
第二章总体回归函数的概念:反映Y的均值如何随X的变化而变化的函数被称为总体回归函数(PRF)。
女口:E(Y|XJ = M■ '-2X i其中B 1和B 2是未知但固定的参数,被称为回归系数PRF的随机设定:因为Y是随机的,每个具体的Y不可能恰好等于其均值,他们之间的离差被设定为一个随机扰动项:E(Y|Xi)被称为Ui=丫厂E(Y | XJ Yi的系统性或确定性成分ui称为随机或非系统性成分在给定X的条件下,随机扰动项的均值等于0样本回归函数:SRF在大部分情况下,我们很难获得总体的数据,而是通过对总体的抽样来探索总体的性质。
类比于总体回归函数(总体Y条件均值与X的关系),可以定义样本回归函数:抽样Y与X之间的关系。
如:其中Yi (帽)是总体均值的估计量, B 1 (帽)和B 2 (帽)分别是B 1和B 2的估计量随机形式的样本回归函数为:Y=fVf?2X i +u?第三章估计量和估计量方差矩阵形式X3 一小2u?2二Y - X ?':(?丁2X'Y -X ? =0* se ?第2页共10页最小二乘法的基本假定 P51最小二乘法的假定漏了:没有完全多重共线性 •判定系数:R2=ESS/TSS假定1 :参数线性模型。
回归模型对参数而言是线性的。
假定2 : X 非随机(条件回归分析)。
在重复抽样 X 值是固定的。
模型的诊断和修正(计量经济学模型专题)
模型的诊断和修正
自相关检验及修正的EViews操作
1.绘图检验自相关问题的EViews操作 进行了OLS回归后,选择EViews主窗口的Quick|Graph命令,输入残差序列名 (Resid),选择图形类型,最后单击确定键即得到残差图。绘制残差序列图也可以通 过Equation对象窗口的Resids按钮或View|Acutal,Fitted,Residual命令实现。 2.DW检验操作 通常OLS回归估计输出结果中包含着对模型的D.W.检验结果,无需单独进行操作。通 过查询DW临界值表可以判断模型自相关问题。DW统计量值越接近2,表明自相关程 度越弱。
哈维检验
戈列瑟检验 自回归条件LM检验 怀特检验 用户自主设定检验
模型的诊断和修正
(3)输出检验结果
F-statistic是辅助方程整体显著性的F统计量;Obs*Rsquared是怀特检验的统计量 ,通过比较 Obs*Rsquared的概率值和显著性水平可以对方程是否存在异方 差进行判断。 图示的怀特检验结果中Obs*R-squared的概率值小于显 著性水平0.05,则拒绝原假设,方程存在异方差。
模型的诊断和修正
内生变量问题与两阶段最小二乘法(TSLS) 最小二乘法要求解释变量与随机误差相互独立, 如 果解释变量与随机误差项不相互独立,模型就 存在 内生性问题。
பைடு நூலகம்
模型的诊断和修正
1. 内生性的含义及后果 当解释变量与随机误差不相互独立时,我们称模型存在内生性问题。 引起内生性问题的原因通常有忽略了重要的解释变量、变量之间存在 联立性、变量存在测量误差等等。 内生性使得模型不能满足OLS的基本假设,对模型进行OLS估计得到 估计量是有偏且不一致的。 2.内生性的解决方法-两阶段最小二乘法(TSLS) 模型存在内生性问题时,需要寻找一组工具变量(Instrument Variable)以消除解释变量和随机误差项之间的相关性。选择的工具 变量应当与解释变量高度相关但与随机误差项无关,且工具变量的个 数应大于等于模型需要估计的系数个数,以保证模型的可识别要求。 两阶段最小二乘法估计的第一阶段是利用原模型解释变量对工具变量 进行最小二乘法估计,得到解释变量的拟合值。第二阶段利用第一阶 段得到的解释变量拟合值对原模型进行最小二乘估计从而得到模型的 估计值。这样可以消除内生性影响,获得较为准确的模型估计值。
4模型设定与诊断
理论模型举例——生产函数
Q f T , K , L, Q Ae
t
其中, 1, 1, 1 0 0 0 资本,L表示劳动。
k L
u
u~N Q表示产出量,T表示技术,K表示 公式描述了技术、资本 、劳动与产出量之间 的理论关系,认为只有 加上一个随机扰动项 等式才成立。
• 判别设定的模型能否得到有意义的研究结果,在研究工作 中起着至关重要的作用。
17
一、模型的误设及其后果
• 1. 包含不相干的解释变量: • 则估计量是一致、无偏的,但不是最佳线 性无偏估计量。假设检验是有效的。 • 此外,如果包含的不相干的变量与其它解 释变量相关,则引起的主要后果是解释变 量之间的多重共线性.
1i i 1 2 1i
1i i 1i 1 1i 2 2i i 2 1i 2 1i 1i 2i 1i i 1 2 2 1i 2 1i
(1)如果漏掉的X2与X1相关,则式中的第二项在小样本下求 期望与大样本下求概率极限都不会为零,从而使得OLS估计 量在小样本下有偏,在大样本下非一致。
25
(2)如果X2与X1不相关,则1的估计满足无偏性 与一致性;但这时0的估计却是有偏的。
29
2、检验是否有相关变量的遗漏或函数 形式设定偏误 (1)残差图示法
30
•
残差序列变化图
趋势变化 :模型设
定时可能遗漏了一随着 时间的推移而持续上升 的变量
循环变化:模型设定
时可能遗漏了一随着时间 的推移而呈现循环变化的
变量
31
• 模型函数形式设定偏误时残差序列呈现正负 交替变化
32
3、检验是否有相关变量的遗漏或函数 形式设定偏误
空间计量经济学模型的估计与检验
一、空间滞后模型的IV和ML估计
1、空间滞后模型IV估计
• 空间滞后模型(空间自回归模型)的解释变量中 出现随机变量,普通最小二乘估计(OLS)将不 再适用,工具变量估计(IV)、广义矩估计 (GMM)和最大似然估计(ML)是合适的估计 方法。
22
2
N l n 2 1 l n { |Ω |* [ |B |] 2 } 1 [ B Y B X β ] 'Ω 1 [ B Y B X β ] 1
22
2
2
0
s21e'e,Ttr(W 'W W 2) N
1 e 'We 2
LM(e'Wes2)2 ~2(1)
T
• 该检验统计量有两个备择假设,也就是说,该统 计量对于空间残差自相关和空间残差移动平均两 种空间效应均有检验效力。
• 如果怀疑模型存在以空间矩阵W表示的空间结构,则可以 构造一个Moran’I算子:
I e'We S e 'e N
I e'W e e 'e
I E(I) N(0,1) Var(I)
空间矩阵W 中所有元素
之和
空间矩阵 行标准化
相当于模型 参数γ的OLS
估计
Weeμ
如果原假设 成立,则有
Moran’I 统计量
型的类型,然后进行估计。 • 但是,所有检验统计量的构造,需要模型参数估
计量,所以本节首先讨论估计,然后讨论检验。
• 不同类型空间计量经济学模型的估计方法很多, 本节并不是系统的讨论,只是选择若干模型的估 计方法加以介绍。
• 不同类型的空间模型分别描述了空间实质相关和 空间扰动相关,那么检验是否存在空间实质相关 时需要在空间扰动相关存在与否的假设下进行, 反之亦然。
南开大学计量经济学课件第13章 模型检验的常用统计量.ppt
(13-9)
(0.2) (2.2) (31.5) (17.8) R2 = 0.999, DW=2.12, RSSu= 48460.78, T =22, (1980-2001) 由上述 4 个变量的相关系数矩阵知,DEBTt 和 GDPt 的相关性最强,达 0.9678。那么是否 可以从模型中删掉 DEFt 和 REPAYt 两个解释变量呢? 可以用本节介绍的 F 统计量完成上述检验。原假设 H0 是2 = 3 = 0,(约束 DEFt 和 REPAYt 的系数为零)。给出约束模型 OLS 估计结果如下,
2021/3/2
计量经济学
13.2 检验回归系数显著性的 t 统计量 对于多元线性回归模型, yt = 0 +1xt1 + 2xt2 +…+ k-1 xt k-1 + ut 如果 F 检验的结论是接受原假设,则检验止。如果 F 检验的结论是拒绝原假设, 则进一步作 t 检验,检验每一个回归系数是否显著地不为零,即检验模型中相应 解释变量是否为模型重要解释变量。原假设与备择假设分别是
0.4
若用样本计算的 t t-k,则接受 H 0;
若用样本计算的 t > t-k,则拒绝 H 0。
0.3
其中指检验水平。详见第 3 章。
0.2
2021/3/2
0.1
/2
-4
计量经济学
-2
-t/2(T-k)
/2
2
4
t/2(T-k)
13.3 检验线性约束条件是否成立的 F 统计量 再介绍一种情形。比如对模型
中国当前正处在社会主义市场经济体制逐步完善,宏观经济运行平稳阶段。国债发 行总量应该与经济总规模,财政赤字的多少,每年的还本付息规模有关系。选择这 3 个 因素做解释变量,名称是国内生产总值,财政赤字额,年还本付息额。数据见表 13-1。 根据散点图(作者自己做)建立中国国债发行额模型如下:
计量经济学模型建立与分析
影响财政收入的若干因素分析一、 问题提出我们如果把经济增长当做源,财政收入当做流,又或者把经济增长当做是源,财政收入当做叶,源远才能长,根深才能叶茂。
经济增长带动财政收入的增长。
随着改革开放,我国经济快速发展,我国的财政收入逐年增长。
二、 变量设置我国财政收入的主要来源于税收收入、罚没收入、专项收入、政府基金收入、行政事业单位收费收入、国有资本经营收益、国债收入、其他收入等。
我们将挑选税收收入、行政事业收入、上一年财政收入作为解释变量。
来就影响财政收入的这几个因素作进一步的分析。
三、 建立模型εββββ++++=3322110x x x y y 为财政收入为,1x 表示税收收入,2x 表示行政事业性收入 ,3x 表示上一年财政收入。
ε表示其他随机影响因素。
四、 数据收集影响财政收入的若干影响因素资料表时间财政收入 税收收入 行政事业性收费时 间上一年财政收入1990 576.95 1985 2004.82 1991 697 1990 2821.86 1992 885.45 1991 2990.17 1993 1317.83 1992 3296.91 1994 1722.5 1993 4255.3 1995 2234.85 1994 5126.88 1996 3395.75 1995 6038.04 1997 2414.32 1996 6909.82 19981981.9219978234.0419992354.2819989262.820002654.54199910682.5820013090200012581.5120023238200115301.3820033335.74200217636.4520043208.42200320017.3120053858.19200424165.6820064216.8200528778.5420074681.0532********.3520084835.807200745621.9720094589.11200854223.79数据来源:《中国统计年鉴》(2010)五、具体的spss软件分析如下:Regression[DataSet0]变量的进入(模型的线性显著性分析)(回归系数)六、模型检验一、异方差检验先做普通最小二乘回归可得到方程式:321121.0384.0067.1585.152x x x y +-+-=(-0.752) (21.018) (-3.351) (2.131) 在对该模型做了最小二乘法回归,并得到2iε,然后做如下辅助回归:31932821732622512433221102x x x x x x x x x x x x iααααααααααε+++++++++=i ε+(模型的线性显著性分析)根据怀特检验 22χ-nRR 2=0.820, 怀特统计量NR 2=20×0.820=16.4,因此,查(课本P3532λ分布表)可得在5%的显著性水平下,自由度为9的2χ分布的对应临界值为 92.1605.02=χ。
华中科技大学《计量经济学》计量经济建模模型(精)PPT课件
未加证明的经验: 包含一个不相关变量比去掉了一个相关变量要好!但 是包含一个不相关变量导致估计量的精度降低,还可 能引起多重共线性等。因此最好的方法是,基于经济 学理论或变量间的逻辑关系或已有的文献,模型仅包 含那些直接影响应变量的解释变量,且这些解释变量 还不应被模型所包含的其它解释变量所解释
在上述5类设定问题中,1-4类设定误差是基本和 常见的,称为模型设定误差(Model specification error),其基本特征是与正确设定的模型相比较, 而第5种设定误差称为模型误设所引起的误差 (Model mis-specification error,),简称为误设误 差,其特征是不知道正确设定的模型,而是从相 互竞争的模型开始, 如凯恩斯理论强调政府支 出对GDP的作用,而货币学派则强调货币对于解 释GDP的作用.基于这2种经济学理论就形成了 两个相互竞争的模型,回归因子分别为政府支出 和货币.从经济学理论和计量经济学的实证,并 不知道其中的哪一个是正确设定的模型.
Yi=a1+a2X2i+vi
(13.9)
王少平教授:华中科技大学经济学院本科试验班计量经济学讲义
产生的后果
若X3i与X2i相关,即相关系数为r23≠0 这种设定误差导致参数估计有偏 若r23=0,但,即X3i与X2i无关,具有对于设
定有误偏差而的a2的模估型计(是13无.9)偏的。估计,a1的估计是 真实模型的误差ui的方差s2也不能通过估计
a1、a2和a3的估计是无偏和一致的,即 E(ˆ1) 1 E(ˆ2 ) 2 E(ˆ3) 3 0(b3在正确设定的模型中不出
现即为0)。
王少平教授:华中科技大学经济学院本科试验班计量经济学讲义
计量经济学理论的模型解释与预测
计量经济学理论的模型解释与预测引言计量经济学是经济学中一个重要的分支,其研究方法主要基于经济理论和数理统计学,旨在通过使用数学和统计方法来解释经济现象,并进行预测和政策分析。
计量经济学理论的模型是实现这一目标的核心工具。
本文将对计量经济学理论的模型进行解释,并探讨其在预测方面的应用。
一、计量经济学理论的模型解释1.1 常见的计量经济学模型计量经济学模型是对经济现象进行抽象和概括的数学表达式。
常见的计量经济学模型包括线性回归模型、时间序列模型、面板数据模型等。
线性回归模型是计量经济学中最基础且广泛应用的模型之一。
它假设变量之间存在线性关系,并通过估计各个变量的系数来解释经济现象。
时间序列模型是用于分析时间序列数据的模型,其中包括自回归模型、移动平均模型、ARMA模型等。
时间序列模型主要用于分析时间上的趋势和周期性。
面板数据模型是同时包含横截面和时间序列数据的模型,通常用于分析跨国或跨地区的经济现象。
面板数据模型可以同时考虑个体特征和时间特征,提高了模型的解释能力。
1.2 模型解释的基本步骤模型解释是对计量经济学模型进行参数估计和推断的过程。
基本的模型解释步骤包括模型设定、估计方法选择、参数估计和模型诊断。
模型设定是根据研究目的和数据特征选择适当的计量经济学模型,并确定模型中包含的变量和假设条件。
估计方法选择是根据模型的性质和数据的特点选择合适的估计方法,常见的估计方法包括最小二乘法、广义最小二乘法、极大似然估计等。
参数估计是利用选定的估计方法对模型的参数进行估计,通常使用计算机软件进行参数的数值计算。
模型诊断是对估计结果进行评价和检验,包括残差分析、假设检验等。
模型诊断可以用于判断模型的拟合程度和参数的显著性。
1.3 模型解释的应用领域计量经济学模型的解释应用广泛,包括实证研究、政策评估和预测分析等。
实证研究是计量经济学模型应用的基本领域,通过对模型进行解释,可以验证和检验经济理论的有效性,并提供实证证据支持。
计量经济学模型的计量检验
263.8
587.8
0.449
3182.5 3674.5
6076.3 7164.4
0.524 0.513
314.6 492.0
Hale Waihona Puke 587.1 1088.10.536 0.452
4589.0 8792.1
0.522
914.5 1627.7
0.562
5175.0 10132.8
0.511
586.0 1340.7
如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间 存在共线性关系。
克服多重共线性的方法
第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除出去。
以逐步回归法得到最广泛的应用。 第二类方法:差分法 时间序列数据、线性模型:将原模型变换为差分模型:
Yi=1 X1i+2 X2i++k Xki+ i 可以有效地消除原模型中的多重共线性。 一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。
➢也可用怀特异方差校正功能(方差未知)来消除异方差 以上两种都可以通过Eviews实现
➢通过对数据取自然对数消除异方差
异方差的修正
序列相关性
自相关定义为:按时间(在时间序列数据中)或空间(在横截面数 据中)排序的观测序列个成员之间的相关。经典模型假定,任一次 观测的干扰项都不收任何其他观测干扰项的影响。
格里瑟检验:
查表得拒绝原假设,存在异方差
F检验统计量概率为0小于,因此 拒绝原假设,模型存在异方差。
异方差的修正
➢模型检验出存在异方差性,可用加权最小二乘法来消除异方差。 (方差已知) 加权最小二乘法是对原模型加权,使之变成一个新 的不存在异方差性的模型,然后采用OLS估计其参数。
模型的计量经济学检验
模型旳计量经济学检查一、 概念1、 异方差:2)(i i Var σε=,随机扰动项旳方差随解释变量(被解释变量)旳变化而变化2、 自有关:s t E s t ≠≠ , 0)(εε时。
一阶自有关:t t t v +=-1ρεε,0≠ρ,t v 中不存在自有关性;二阶自有关:t t t t v ++=--2211ερερε,02≠ρ,t v 中不存在自有关性。
3、 多重共线性:完全多重共线性:1)(+<k X Rank ,02211=+++k k x x x λλλ ;不完全多重共线性:02211=++++u x x x k k λλλ二、 产生旳背景1、 异方差● 模型设立错误(缺失解释变量、函数形式设立错误);● 样本数据旳观测误差;● 异常值旳影响。
2、 自有关● 经济变量旳惯性作用;● 经济行为旳滞后性;● 随机因素旳影响;●模型设立错误;●蛛网现象。
3、多重共线性●经济变量变化趋势旳共向性;●经济变量之间旳密切内在联系;●模型中使用滞后变量;●模型设立中变化选择不当。
三、产生旳影响1、异方差●最小二乘估计无偏,参数估计值旳方差不再最小;●t检查失效(也许浮现虚假通过现象);●估计与预测精度减少。
2、自有关:●最小二乘估计无偏,参数估计值旳方差不再最小;●∧2σ低估2σ;●t检查失效(也许浮现虚假通过现象);●估计与预测精度减少。
3、多重共线性(不完全多重共线性)●难于区别单个解释变量旳作用、回归模型缺少稳定性;●参数估计旳原则差扩大(膨胀);●t检查失效(也许浮现虚假通但是现象);●估计与预测精度减少。
四、检查措施1、 异方差● 图示法:⏹一元模型:Scat x y ⏹ 多元模型:Scat y e● 有关性检查:残差与解释变量或被解释变量与否存在较强有关性● GoldFeld-Quandt 检查● White 检查● ARCH 检查2、 自有关● 图示法: Scat e e(-1);● 有关性检查:残差与其滞后项与否存在较强有关性;● D-W 检查:根据DW 记录量与U L d d ,旳比较得出检查成果;● Breusch-Godfrey 检查(高阶自有关检查、辅助回归法):根据辅助回归模型旳2nR 与)(2p αχ旳比较得出检查成果。
计量经济学模型的计量检验
多重共线性的后果
4. 变量的显著性检验失去意义
存在多重共线性时 参数估计值的方差与标准差变大 容易使通过样本计算的t值小于临界值,误导作 出参数为0的推断 可能将重要的解释变量排除在模型之外
5.
模型的预测功能失效
◦ 变大的方差容易使区间预测的“区间”变大,使预测失去意义。
多重共线性检验
1、检验多重共线性是否存在 (1) 简单相关系数法 两个变量时,求出X1与X2的简单相关系数r,若|r|接近1,则说明 两变量存在较强的多重共线性。多个变量时,如果两两变量的相关 系数高,则存在多重共线性,如果两两变量的相关系数不高,不能 说明不存在多重共线性,因为多个解释变量之间可能线性相关。 (2) 采用综合统计检验法 若 在OLS法下:R2与F值较大,但t检验值较小,说明各解释变量对Y 的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y 的独立作用不能分辨,故t检验不显著。
数 据 题假 定 问
7.自变量取值变异 8.自变量间无线性关系 9.模型无设定偏误 10.误差正态分布
内容提要
1. 多重共线性问题 2. 异方差问题 3. 自相关问题 4. 模型设定和诊断 5. 正态性检验 6. 参数稳定性检验
多重共线性
如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multi-collinearity)。 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
产生多重共线性的主要原因
(1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退 时期,又同时趋于下降。
横截面数据: 生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小 企业都小。
回归诊断与模型假设检验
回归诊断与模型假设检验回归分析是一种重要的统计方法,广泛应用于经济学、社会学、医疗研究等多个领域。
随着数据量的增加和模型复杂性的提高,确保回归模型的有效性与可靠性尤为重要。
为了实现这一目标,回归诊断与模型假设检验被广泛使用,以确保我们所建立的模型准确反映了实际情况。
一、回归分析的基本概念回归分析的核心理念是通过已知自变量(或称解释变量、预测变量)来预测因变量(或称响应变量、被解释变量)。
简单线性回归模型通常可以表示为:[ Y = _0 + _1 X + ]其中,( Y ) 为因变量,( X ) 为自变量,( _0 ) 是截距,( _1 ) 是斜率,() 是误差项。
通过估计参数( _0 )和( _1 ),我们便可以构建用于预测和解释变量关系的模型。
在实际应用中,我们往往涉及到多个自变量的情况,即多元线性回归,其扩展形式如下:[ Y = _0 + _1 X_1 + _2 X_2 + … + _k X_k + ]二、回归诊断的重要性在构建回归模型之后,仅仅依靠模型拟合优度(如决定系数( R^2 ))来判断模型的好坏是不够的。
原因在于,( R^2) 只能反映模型对数据的拟合程度,而不能保证模型本身满足统计假设。
因此,在进行回归分析时,回归诊断是一个不可或缺的步骤,其主要目的是验证以下几个假设:线性关系:自变量与因变量之间存在线性关系。
误差独立性:残差(即观测值与预测值之间的差异)是独立的。
误差同方差性:残差具有恒定方差。
误差正态性:残差应当符合正态分布。
通过回归诊断,可以识别和修正模型中可能存在的问题,从而提高模型的预测性能与解释力。
三、常见的回归诊断方法1. 残差分析残差分析是最常用的一种回归诊断方法。
首先,计算每个观测值的残差:[ e_i = y_i - _i ]其中 ( y_i ) 为实际观测值,(_i) 为根据模型计算得到的预测值。
接下来,我们可以通过绘制残差图来检查残差的分布特征。
如果残差与自变量或预测值之间不存在明显的模式,则说明线性关系假设成立。
第13章 计量经济建模:模型设定和诊断
③错误的函数形式:
ln Yi
=
β1
+
β2 X i
+
β3
X
2 i
+
β
4
X
3 i
+ u4i
因变量以对数的形式出现在模型中。
④测量误差:
Y* i
=
β* 1
+
β *X 2
*
i
+
β X * *2 3i
+
β X * *3 4i
+
u* i
其中
Yi*
= Yi
2. αi的估计量是非有效的,即 Var(αˆi ) ≥ Var(βˆi )
由OLS所估计的结果有
∑ V a r ( βˆ2 ) =
σ2
x2
2i
∑ Var(αˆ2 ) =
σ2
x
2
2i
(1
−
r223
)
故
Var(αˆ2 ) Var(βˆ2 )
=
1 1− r223
≥1
所以 Var(αˆ2 ) ≥ Var(βˆ2 )
不知道遗漏了哪个变量,寻找一个替代变量Z,来进 行统计检验。
RESET检验中,采用所设定模型中被解释变量Y的估计 值Ŷ的若干次幂来充当该“替代”变量。
RESET检验的步骤:
(1)从上述模型得到 Yi 的估计值Yˆi 。 (2)将Yˆi作为增补自变量引入,重新做回归,由残差可以发现 Yˆi 与残差
之间有曲线关系,因此重新引入Yˆi 2 和 Yˆi 作3 为增补自变量,再做回归:
继续用立方总成本函数来说明。
关于模型诊断与检验
关于模型诊断与检验1.动态分布滞后模型与一般到特殊建模法最常见的动态分布滞后模型是ADL (1, 1) 和ADL (2, 2) ,y= α0 + α1 y t-1 + β0 x t + β1 x t-1+ u t, u t~ IID (0, σ 2 ),t(5.9)和y= α0 + α1 y t-1 + α2 y t-2 + β0 x t + β1 x t-1+ β2 x t-2+ u t, u t~ IIDt(0, σ 2 )通过对α0 , β0 和β1施加约束条件,从ADL模型(5.9)可以得到许多特殊的经济模型。
下面以9种约束条件为例,给出特定模型如下:(1)当α1 = β1 = 0 成立,摸型(5.9)变为y= α0 +β0 x t + u t .t(5.11)这是一个静态回归模型。
(2)当β0= β1= 0时,由模型(5.9)得y= α0 + α1 y t-1 + u t .t(5.12)这是一阶自回归模型。
(3)当α1 =β0 = 0 时,则有y= α0 + β1 x t-1 + u t .t(5.13)x是y t的超前指示变量。
此模型称为前导模型。
t-1(4)当约束条件是α1 =1,β1 = - β0时,(5.9)式变为∆ y= α0 + β0 ∆ x t+ u t .t(5.14)这是一个一阶差分模型。
当x t与y t为对数形式时,上述模型为增长率模型。
(5)若α1 = 0成立,模型(5.9)则变为一阶分布滞后模型。
y= α0 + β0 x t+β1 x t - 1 + u t.t(5.15)(6) 取β1 = 0,则模型(5.9)变为标准的局部调整模型(偏调整模型)。
y= α0 + α1 y t -1 + β0x t+ u t.t(5.16)(7) 当β0 = 0 时,由模型(5.9)得y= α0 + α1 y t -1 + β1 x t -1 + u t .t(5.17)模型中只有变量的滞后值作解释变量,y t的值仅依靠滞后信息。
计量经济学经典eviews定义和诊断检验
计量经济学经典eviews 定义和诊断检验本章描述的每一检验过程包括假设检验的原假设定义。
检验指令输出包括一个或多个检验统计量样本值和它们的联合概率值(p 值)。
p 值说明在原假设为真的情况下,样本统计量绝对值的检验统计量大于或等于临界值的概率。
这样,低的p 值就拒绝原假设。
对每一检验都有不同假设和分布结果。
方程对象菜单的View 中给出三种检验类型选择来检验方程定义。
包括系数检验、残差检验和稳定性检验。
其他检验,如单位根检验(13章)、Granger 因果检验(8章)和Johansen 协整检验(19章)。
§15.1 系数检验一、Wald 检验——系数约束条件检验Wald 检验没有把原假设定义的系数限制加入回归,通过估计这一无限制回归来计算检验统计量。
Wald 统计量计算无约束估计量如何满足原假设下的约束。
如果约束为真,无约束估计量应接近于满足约束条件。
考虑一个线性回归模型:εβ+=X y 和一个线性约束:0:0=-r R H β,R 是一个已知的k q ⨯阶矩阵,r 是q 维向量。
Wald 统计量在0H 下服从渐近分布)(2q χ,可简写为: )())(()(112r Rb R X X R s r Rb W -'''-=--进一步假设误差ε独立同时服从正态分布,我们就有一确定的、有限的样本F-统计量q W k T u u q u u u u F /)/(/)~~(=-''-'= u~是约束回归的残差向量。
F 统计量比较有约束和没有约束计算出的残差平方和。
如果约束有效,这两个残差平方和差异很小,F 统计量值也应很小。
EViews 显示2χ和F 统计量以及相应的p 值。
假设Cobb-Douglas 生产函数估计形式如下:εβα+++=K L A Q log log log (1)Q 为产出增加量,K 为资本投入,L 为劳动力投入。
系数假设检验时,加入约束1=+βα。
计量经济学模型的估计方法与模型检验
一、模型估计方法的比较 二、为什么普通最小二乘法被普遍采用 三、模型的检验
一、模型估计方法的比较
⒈大样本估计特性的比较
• 在大样本的情况下,各种参数估计方法的统计特 性可以从数学上进行严格的证明,因而也可以将 各种方法按照各个性质比较优劣。
• 按渐近无偏性比较优劣
•
7、
。202 0年7月 下午11 时50分 20.7.31 23:50Jul y 31, 2020
•
8、业余生活要有意义,不要越轨。20 20年7 月31日 星期五1 1时50 分59秒2 3:50:59 31 July 2020
我们必须在失败中寻找胜利,在绝望中寻求希望
•
9、
。下 午11时5 0分59 秒下午1 1时50 分23:50: 5920.7. 31
⒉ 充分利用样本数据信息
• 除OLS之外的其它估计方法可以部分地或者全部 地利用某个结构方程中未包含的先决变量的数据 信息,从而提高参数估计量的统计性质。但是其 前提是所有变量具有相同的样本容量。
• 在实际上变量经常不具有相同的样本容量。
• 采用先进估计方法所付出的代价经常是牺牲了该 方程所包含的变量的样本数据信息。
⒉预测性能检验
• 如果样本期之外的某个时间截面上的内生变量实际 观测值已经知道,这就有条件对模型系统进行预测 检验。
• 将该时间截面上的先决变量实际观测值代入模型, 计算所有内生变量预测值,并计算其相对误差。
RE ( yi0 yi0 ) yi0
• 一般认为,RE<5%的变量数目占70%以上,并且 每个变量的相对误差不大于10%,则认为模型系统总 体预测性能较好。
• 凡是在单方程模型中必须进行的各项检验,对于 联立方程模型中的结构方程,以及应用2SLS或 3SLS方法过程中的简化式方程,都是适用的和需 要的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(13.2.7)所表明的是,研究者没有使用真正的Yi和Xi,却用
了含有测量误差的替代变量Yi*和Xi*。
11
5、对随机误差项ui不正确的设定 (Specification errors to the stochastic error )
如果真实的、正确的模型是:
Yi Xiui
并且lnui满足CLRM的假定
就很困难。
表现出数据的协调性;即从模型中估计的残差必须完全随机
(从技术上而言必须是白噪音)。
模型有一定的包容性;即模型应该包容或包括所有与之竞争
的模型。
6
§13.2 设定误差的类型
1、漏掉一个有关变量(1.Omitting A Relevant Variable)
为了简明起见,令这个模型为:
因此,(13.2.2)中的误差项u2i事实上是:
u2i
u1i
4
X
3 i
8
2、包含了一个无需或无关的变量 (Including an unnecessary or irrelevant variable)
假定另一个研究者使用了以下模型:
Yi
1
2 X i
3
X
2 i
4
X
3 i
或近似地为 例如,若 c = 15,k = 5,α = 5%, 由(13.4.3),真实的显著性水平为 (15/5)(5%) = 15%
(13.4.2) (13.4.3)
28
在实践中,多数研究者都仅报告其“最终”回归结 果,而不透露此前是如何通过大量数据开采或预检验而 得到这些结果的详情。
——这与个人升迁有关!
( E(ˆ3) 2
x2x3)( x22 ) ( x22 x32 (
x2 x3 )( x2 x3 )2
x22 ) 0
6
20
x3在真实模型中不存在,它的系数为0。 因此,这一设定误差(拟合过度)将导致如下后果: (1)所有参数的OLS估计量都是无偏且一致的,即,
但是,在应用计量经济学家看来,纯粹主义者(即 非数据开采者)的建模方法也存在问题。
29
查曼(Zaman,1995)的观点: 如果我们从一个更开阔的视角来看待数据开采, 把它看成一种寻求经验规律的过程,并能从这些经验 规律中判断现有理论模型中是否存在错误或纰漏,那 么它将起到一个非常大的作用。 肯尼迪(Kennedy,1992)认为,“应用计量经济 学家的艺术在于,容许数据驱动理论进展而又不致陷 入太大的数据开采的危险。”
(13.3.6) (13.3.7)
18
我们知道:
ˆ2
yi x2i x22i
1
( ˆ2
yx2 )( x32 ) ( yx3)( x2 x3)
x22
x32 (
x2
x 3
)2
2
真实模型的离差形式为:
19
将(3)代入(2):
( E(ˆ2 ) 2
Yi
1
2 Xi
3
X
2 i
4
X
3 i
u1i
其中,Yi = 生产的总成本,Xi = 产量。
等式(13.2.1)是立方总成本函数。
(13.2.1)
7
但是,假设出于某种原因,研究者决定使用以下模型:
Yi
1
2 Xi
3
X
2 i
u2i
(13.2.2)
由于(13.2.1)被认为是真实的,采用(13.2.2)就构成了一种设定误 差,即漏掉了一个有关变量(Xi3)的误差。
bˆ 1和
bˆ12是有偏误
E(bˆ1 ) 1
E(bˆ12 ) 2
2、如果X3与X2不相关,r23 = 0,那么bˆ 32 0,尽管bˆ 1现在无
偏,但bˆ12 是无偏的。
3、干扰的方差σ2将被不正确地估计。
4、bˆ12 的方差
(
2
X
2 2i
)是真实估计量的方差的一个有偏误
的估计值。
26
本专业的纯化论者很看不起数据开采的实践。谴责 “数据开采”的原因之一如下:
在数据开采情况下的名义的与真实的显著性水平是不 同的。一种数据开采的危险是,诸如1%、5%、10%的常 用的显著性水平α并非是真实的显著性水平。
27
洛弗尔(Lovell,1983)曾指出,如果有c个备用的回 归元,根据数据开采的情况,从中最后选出k个(k ≤ c), 则真实的显著性水平(α*)和名义上的显著性水平(α)有 如下关系:
一般而言,最好的方法是,根据理论,仅仅包含那些 直接影响因变量,而又不能由已被引进的其他变量来代替 的解释变量。
23
§13.4 设定误差的检验
一、对过度拟合的侦察
假设,为了解释某一现象,我们提出一个k变量模型:
Yi 1 2 X 2i 3 X3i ...... k X ki ui (13.4.1)
3
寻找正确的模型就像寻找圣杯一样。具体而言,我 们需要考虑如下问题:
我们如何去寻找一个“正确”的模型?换言之,在经验分析中 选择一个模型的准则有哪些?
在实践中,容易遇到哪些类型的模型设定误差? 设定误差的后果有哪些? 如何侦查设定误差?换言之,我们可以使用哪些诊断工具? 一旦侦查出设定误差,我们能采取哪些补救措施? 如何评价几个表现不相上下的备选模型?
14
于是,等式(4)变换为:
bˆ12 2 3bˆ 32
X 2i (ui u )
X
2 2i
(5)
分别取等式两边的期望值
E(bˆ12) 2 3bˆ32
(6)
(其中,β2和β3都是常数,ui与X2i和X3i不相关)
15
于是,漏掉变量X3的后果如下: 1、如果X3与X2相关,r23 ≠ 0,那么 且非一致的。也就是说,
x22 )( x22
x32 ) ( x32 (
x2 x3 )2
x2
x 3
)2
2
4
因此,ˆ2 仍是无偏的。
我们发现:
( ˆ3
yx3 )(
x22 ) (
yx2 )(
x2
x 3
)
x22 x32 ( x2 x3 )2
(5)
将 (3) 代入 (5):
第十三章
计量经济建模: 模型设定和诊断检验
1
经济学家多年来对“真理”的寻求曾给人一种观感: 经济学家们就好像在一间黑房子里搜寻一直原本并不存在 的黑猫;而计量经济学家还经常声称找到了一只。
2
经典线性回归模型的假定之一(假定9)是,分析中 所使用的模型被“正确地”设定;如果模型并未被明确 设定,我们就遇到了这样的问题:模型设定误差(model specification error)或者模型设定偏误(model specification bias)。
4
§13.1 模型选择准则
根据亨得利和理查德的观点,一个被选用于经验分析的 模型应满足如下准则:
数据容纳性;即从模型做出的预测必须有逻辑上的可能性。 与理论一致;即必须有好的经济含义。 回归元的弱外生性;即解释变量或回归元必须与误差项不相
关。
5
表现出参数的不变性;即参数的值必须稳定,否则预测
后果将会如何?
13
三变量回归模型的离差形式:
Yi 2 X 2i 3 X3i ui u
有: Yi X2i 2
X
2 2i
3
X2i X3i
X2i (ui u )
Yi X3i 3
X
2 3i
2
X2i X3i
X3i (ui u )
两边分别除以∑X2i2:
Yi X2i
X
2 2i
2
3
X 2i X3i
X
2 2i
X 2i (ui u )
X
2 2i
回到前面,有
bˆ12
X 2i Yi
X
2 2i
bˆ 32
X 2i X 3i
X
2 2i
(X3对X2回归)
(1) (2) (3) (4)
2
x22i ,
而 var(ˆ2 )
2
x22i (1 r223)
0 r223 1,
0 1 r223 1
var(ˆ2 ) var(ˆ2 )
一个无益的结论似乎是:与其忽略有关变量,不如含有无 关变量。
22
但是,这种理论是不值得维护的,因为增加不必要的 变量将导致: 1、估计量的效率损失 2、多重共线性问题 3、自由度的损失
34
为了用德宾-沃森检验来侦察模型设定误差,我们以 如下方式进行:
(1)从假定的模型求得OLS残差。 (2)如果认为假定的模型因排除了一个有关的解释 变量,比如说Z而是误设的,则将第1步中所得的残差按 Z值的递增次序排列。 注意:Z变量可以是假定模型所含的X变量之一,或
该变量的某一函数,如 X2 或 X 3
(13.2.6)
10
4、测量偏误的误差(Errors of measurement bias)
考虑有研究者使用如下模型:
Yi*
1*
2*X*i
X * *2
3i
X * *3
4i
u*i
(13.2.7)
其中,Yi* Yi i ,X*i Xi i ,εi和ωi均为测量误差。