计量经济学(第四版)4.4 模型设定偏误问题
计量经济学模型设定及数据问题
此时用OLS方法得到的参数估计是有偏的和不一致的。偏差 的程度取决于测定误差方差的大小。 19
2、因变量存在测度误差
假定真实方程为
yi xi i
实际得到的Y的观测值则为
yi* yi vi
* ˆ E 1 1
14
包含不必要的解释变量
x y x x y x ˆ x x x x x u x x u x 0 x x x x
* 2 2i i 2 1i 1i i 2 1i 2 2i 2 1i 2i 2i i 2 1i 1i i 1i
16
三、随机误差项设定错误
如果模型的误差项出现设定错误,那么也将引起估计偏差。 设正确的回归模型为: Yi f X i ui 例如C-D函数。 式中误差项与f(.)是相乘关系,且假定有:
此时有 E u e 2 和 Var ui e 2 e 1 i 若将误差项错误地设为相加形式,即 Yi f X i ui 这时有:
ˆ*
1
x y x x y x x x x x
1i i 2 2i 2i i 2 1i 2 2i 2 1i 2 i
1i 2 i
x
13
包含不必要的解释变量
代入真实关系后有:
ˆ* 1
x x
1i 1 2 1i
5
一、遗漏必要的解释变量
设表示成离差形式的二元回归模型为: y=1x1+2x2+u 假定模型设定时遗漏了解释变量x2,回归方程变为: y 1* x1 u*
李子奈《计量经济学》(第4版)笔记和课后习题(含考研真题)详解
李子奈《计量经济学》(第4版)笔记和课后习题(含考研真题)详解李子奈《计量经济学》(第4版)笔记和课后习题详解第1章绪论一、计量经济学1计量经济学计量经济学,又称经济计量学,是由经济理论、统计学和数学结合而成的一门经济学的分支学科,其研究内容是分析经济现象中客观存在的数量关系。
2计量经济学模型(1)模型分类模型是对现实生活现象的描述和模拟。
根据描述和模拟办法的不同,对模型进行分类,如表1-1所示。
表1-1 模型分类(2)数理经济模型和计量经济学模型的区别①研究内容不同数理经济模型的研究内容是经济现象各因素之间的理论关系,计量经济学模型的研究内容是经济现象各因素之间的定量关系。
②描述和模拟办法不同数理经济模型的描述和模拟办法主要是确定性的数学形式,计量经济学模型的描述和模拟办法主要是随机性的数学形式。
③位置和作用不同数理经济模型可用于对研究对象的初步研究,计量经济学模型可用于对研究对象的深入研究。
3计量经济学的内容体系(1)根据所应用的数理统计方法划分广义计量经济学根据所应用的数理统计方法包括回归分析方法、投入产出分析方法、时间序列分析方法等;狭义计量经济学所应用的数理统计方法主要是回归分析方法。
需要注意的是,通常所述的计量经济学指的是狭义计量经济学。
(2)根据内容深度划分初级计量经济学的主要研究内容是计量经济学的数理统计学基础知识和经典的线性单方程计量经济学模型理论与方法;中级计量经济学的主要研究内容是用矩阵描述的经典的线性单方程计量经济学模型理论与方法、经典的线性联立方程计量经济学模型理论与方法,以及传统的应用模型;高级计量经济学的主要研究内容是非经典的、现代的计量经济学模型理论、方法与应用。
(3)根据研究目标和研究重点划分理论计量经济学的主要研究目标是计量经济学的理论与方法的介绍与研究;应用计量经济学的主要研究目标是计量经济学模型的建立与应用。
理论计量经济学的研究重点是理论与方法的数学证明与推导;应用计量经济学的研究重点是建立和应用计量模型处理实际问题。
计量经济学(第四版)习题及参考答案解析详细版
计量经济学(第四版)习题参考答案潘省初第一章 绪论试列出计量经济分析的主要步骤。
一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 计量经济模型中为何要包括扰动项为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
什么是时间序列和横截面数据 试举例说明二者的区别。
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
估计量和估计值有何区别估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y就是一个估计量,1nii YY n==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 计量经济分析的统计学基础略,参考教材。
请用例中的数据求北京男生平均身高的99%置信区间NS S x ==45= 用=,N-1=15个自由度查表得005.0t =,故99%置信限为x S t X 005.0± =174±×=174±也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在至厘米之间。
25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体 原假设 120:0=μH备择假设 120:1≠μH 检验统计量()10/2510/25XX μσ-Z ====查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。
计量经济学精要习题参考答案(第四版)
计量经济学(第四版)习题参考答案第一章 绪论1.1 一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。
为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y 就是一个估计量,1nii YY n==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 计量经济分析的统计学基础2.1 略,参考教材。
2.2 NS S x ==45=1.25 用α=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。
2.3 原假设 120:0=μH备择假设 120:1≠μH检验统计量()10/25XX μσ-Z ====查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即此样本不是取自一个均值为120元、标准差为10元的正态总体。
4.4 模型设定偏误问题
1、相关变量的遗漏(omitting relevant variables)
• 例如,如果“正确”的模型为
Y 0 1 X1 2 X 2
而我们将模型设定为
Y 0 1X1 v
即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相ding irrevelant variables)
直接线性模型的OLS估计
RESET检验
在1%显著性水平下,拒绝原模型与引入新变量的模型可 决系数无显著差异的假设,表明原模型存在设定偏误。
Var(ˆ1)
2
x12i
(1
r2 x1x2
)
2、包含无关变量偏误(including irrelevant variable bias)
Y 0 1 X1 v Y 0 1X1 2 X 2
Var(ˆ1 )
2
x12i
Var(ˆ1)
2
x12i
(1
r2 x1x2
)
• 对包含无关变量的模型进行估计,参数估计量是 无偏的,但不具有最小方差性。
3、错误函数形式偏误(wrong functional form bias)
• 产生的偏误是全方位的。
三、模型设定偏误的检验
1、检验是否含有无关变量
• 检验的基本思想:如果模型中误选了无关变量, 则其系数的真值应为零。因此,只须对无关变 量系数的显著性进行检验。
模型函数形式设定偏误时残差序列呈现正负交替 变化
图示:一元回归模型中,真实模型呈幂函数形 式,但却选取了线性函数进行回归。
• 一般性设定偏误检验
–拉姆齐(Ramsey)于1969年提出的RESET 检验 (regression error specification test)。
计量经济学第四版习题及参考答案解析
计量经济学(第四版)习题参考答案潘省初第一章 绪论1.1 试列出计量经济分析的主要步骤。
一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项?为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3什么是时间序列和横截面数据? 试举例说明二者的区别。
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4估计量和估计值有何区别?估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y就是一个估计量,1nii YY n==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 计量经济分析的统计学基础2.1 略,参考教材。
2.2请用例2.2中的数据求北京男生平均身高的99%置信区间NS S x ==45=1.25 用α=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。
《计量经济学》第四章精选题及答案
第四章:多重共线性二、简答题1、导致多重共线性的原因有哪些?2、多重共线性为什么会使得模型的预测功能失效?3、如何利用辅回归模型来检验多重共线性?4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。
(1)尽管存在完全的多重共线性,OLS 估计量还是最优线性无偏估计量(BLUE )。
(2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。
(3)如果某一辅回归显示出较高的2i R 值,则必然会存在高度的多重共线性。
(4)变量之间的相关系数较高是存在多重共线性的充分必要条件。
(5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。
5、考虑下面的一组数据:12233i i i Y X X βββ=++来对以上数据进行拟合回归。
(1) 我们能得到这3个估计量吗?并说明理由。
(2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计算过程。
6、考虑以下模型:231234i i i i i Y X X X ββββμ=++++由于2X 和3X 是X 的函数,那么它们之间存在多重共线性。
这种说法对吗?为什么? 7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。
我们考虑以下模型:12313233i t t t t t Y X X X X βββββμ---=+++++其中Y ——消费,X ——收入,t ——时间。
该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。
(1) 在这一类模型中是否会存在多重共线性?为什么? (2) 如果存在多重共线性的话,应该如何解决这个问题? 8、设想在模型12233i i i iY X X βββμ=+++中,2X 和3X 之间的相关系数23r 为零。
如果我们做如下的回归:1221i i i Y X ααμ=++ 1332i i i Y X γγμ=++(1)会不会存在22ˆˆαβ=且33ˆˆγβ=?为什么? (2)1ˆβ会等于1ˆα或1ˆγ或两者的某个线性组合吗? (3)会不会有22ˆˆvar()var()βα=且33ˆˆvar()var()γβ=? 9、通过一些简单的计量软件(比如EViews 、SPSS ),我们可以得到各变量之间的相关矩阵:2323232311 1k k k k r r r r R r r ⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪⎝⎭。
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品
量对其滞后一期的回归。
(2)德宾-沃森 d 统计量的定义
n
( ) et − et−1 2
d = t=2 n
et 2
t =1
5 / 28
(10-3)
圣才电子书 十万种考研考证电子书、题库视频学习平台
即残差递差的平方和与残差平方和的比值。注意:在计算 d 统计量分子时,其样本容量
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 10-1 自相关的模式 3.自相关产生的原因 (1)惯性 大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值 在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很 可能是互相依赖或是相关的。 (2)模型设定误差 不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函 数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验 方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应 用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法 与异方差情形相同,通过直接观察 OLS 残差 e 来判断误差项 u 中是否存在自相关。有 多种不同的残差图形的检验方法。 (1)残差 e 对时间的散点图 可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能 存在着自相关。图 10-2 是回归的残差关于时间的时序图,从图可以看出:残差 e 并不是随 机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然 后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存 在着正的自相关。
4.4 模型设定偏误问题
= = = = = =
48 13.49 0.0000 0.4791 0.4435 .18153
lnq lny lnp lnq2 _cons
. test lnq2 . ( 1) lnq2 = 0 F(
Coef. -5.364355 21.71813 1.820197 -122.4662
Std. Err. 2.895427 11.69552 .9203884 67.16167
x x x
1i 2 1i
2i
ˆ1 1 2
x x x
1i 2 1i
2i
x ( x
1i
i 2 1i
)
• 如果X2与X1相关, 1的估计量在小样本下有偏, 在大样本下非一致。 • 如果X2与X1不相关,则1的估计量满足无偏性 与一致性;但这时0的估计却是有偏的。 • 随机扰动项的方差估计也是有偏的。 • 1估计量的方差是有偏的。
lnq lny lnp lnq2 lnq3 _cons
Coef. 7.64013 -31.45867 -6.616041 .6267696 212.1164
Std. Err. 109.958 449.6269 71.31247 5.297703 2828.839
t 0.07 -0.07 -0.09 0.12 0.07
q y p _cons
Coef. 1.881861 -1.079949 198.4554
Std. Err. 1.546477 .2031451 23.004
t 1.22 -5.32 8.63
P>|t| 0.230 0.000 0.000
[95% Conf. Interval] -1.232902 -1.489104 152.123 4.996625 -.6707938 244.7879
计量经济学(第四版)习题及参考答案解析详细版
计量经济学(第四版)习题参考答案潘省初第一章 绪论1.1 试列出计量经济分析的主要步骤。
一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项?为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3什么是时间序列和横截面数据? 试举例说明二者的区别。
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4估计量和估计值有何区别?估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y就是一个估计量,1nii YY n==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 计量经济分析的统计学基础2.1 略,参考教材。
2.2请用例2.2中的数据求北京男生平均身高的99%置信区间NS S x ==45=1.25 用=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为x S t X 005.0± =174±2.947×1.25=174±3.684也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。
庞皓《计量经济学》(第4版)章节题库-第9章 设定误差与测量误差【圣才出品】
2 / 13
圣才电子书
严重的影响。
十万种考研考证电子书、题库视频学习平 台
(1)如果模型中遗漏变量,需要分成两种情况讨论:①遗漏变量与模型中的解释变
量相关。这种情况是最常见的,此时参数的估计是有偏且不一致的,并且参数估计也不满
圣才电子书
十万种考研考证电子书、题库视频学习平 台
第 9 章 设定误差与测量误差
一、选择题 1.若真实模型是解释变量为 X1 的一元线性回归模型,但在建模时将与 X1 无关的变量 X2 包含在模型中,则斜率参数的最小二乘估计量( )。 A.仍具有无偏性、一致性和最小方差性 B.不具有无偏性、一致性和最小方差性 C.仍具有无偏性、一致性,但不具有最小方差性 D.不具有无偏性、一致性,但仍具有最小方差性 【答案】C 【解析】在包含无关变量的模型中,最小二乘估计量是无偏且一致的,随机干扰项的 方差也能被正确估计,但 OLS 估计量不具有最小方差性。该类错误的后果通常体现为,包 含无关变量的偏误主要表现为“错误”模型的普通最小二乘估计量的方差一般会大于“正 确”模型相应参数估计量的方差。
程的自由度降低,从而扰动项的方差估计变小,模型中参数的标准误增大,从而影响参数
的假设检验,置信区间的计算。
都很严重。
3.“好的”经济计量模型有哪些性质? 答:一个好的模型应具备以下条件: (1)模型应尽可能简洁; (2)模型中系数的估计值应唯一; (3)对样本数据的拟合程度较好; (4)模型中估计系数的符号同相关经济理论相符; (5)具有良好的预测力。
料限制等问题,忽略某些重要变量而造成的模型设定偏误。
b.误选无关变量:在回归模型引入了一些无关紧要的自变量,从而造成模型设定偏
计量经济学-模型设定
Ct 0 1Yt 1t 考虑到边际消费倾向递减:
Ct 0 1Yt 2Yt2 2t
或 ln Ct 0 1 ln Yt 3t
——基于预期因素的模型
(5.1.1)
(5.1.2) (5.1.3)
Ct 0 1Yt C 2 t1 4t
(5.1.4)
(5.2.5)
▪问题:估计了一个不需要估计的参数
10
具体影响:
误差项满足经典假定,模型的参数估计量是无偏的。 问题本质:估计了一个实际上不必估计的参数 2 0
不会导致误差项与解释变量之间相关,不影响参数 OLS估计量的无偏性。 拟合过度模型OLS估计量的方差会增大:多余的解 释变量和模型中必要的解释变量总是存在一定的相 关性,部分变化信息重复。重复信息的影响难以在 解释变量间准确分解,导致系数估计精度下降。
2
§5.1 计量经济学模型的设定偏误
一、模型设定偏误
如果所建立的计量经济学模型与真实的经济关系 不一致,模型就出现了所谓的“设定偏误”。
对于正确设定的模型,一个最基本的信息是:其 参数估计值的符号必须与理论预期或基于现实观 察的经验预期相一致。
3
二、模型设定偏误的类型
消费函数:Ct为消费支出,Yt表为收入 ——凯恩斯的绝对收入假定模型
var(ˆ1)
2
(Yt Y )2
(5.2.7)
只要 Yt 和 Ct1 的样本相关系数不为0,多余解释 变量 Ct1 的加入就会导致系数 Yt 估计量 ˆ1 方差 的增大。
12
其他影响:
由于过度拟合模型的误差项是真实的随机误差项, 我们对 2 的估计是正确的。相应地,参数的置信 区间和显著性检验仍然有效,但由于估计量的方差 增大,统计推断的精度会下降。
计量经济学(第四版)习题及参考问题详解详细版
计量经济学(第四版)习题参考答案潘省初第一章 绪论1.1 试列出计量经济分析的主要步骤。
一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项?为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3什么是时间序列和横截面数据? 试举例说明二者的区别。
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4估计量和估计值有何区别?估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y就是一个估计量,1nii YY n==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 计量经济分析的统计学基础2.1 略,参考教材。
2.2请用例2.2中的数据求北京男生平均身高的99%置信区间NS S x ==45=1.25 用α=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。
计量经济学--模型设定偏误问题31-精选文档
1i 2 1i i
来自 中国最大的资料 库下载
将正确模型 Y=0+1X1+2X2+ 的离差形式
y x x i 1 1 i 2 2 i i
1i i 2 1i
代入
x y ˆ 得 x xy x ( x x ) ˆ x x xx x ( ) x x
来自 中国最大的资料 库下载
2、无关变量的误选
(including irrevelant variables) • 例如,如果
Y=0+1X1+2X2+
仍为“真”,但我们将模型设定为
Y=0+ 1X1+ 2X2+ 3X3 +
即设定模型时,多选了一个无关解释变量。
2 1 i2 i 2 1 i 2 x x 1 2
如果X2与X1相关,显然有 如果X2与X1不相关,也有
ˆ ˆ Var ( ) Var ( ) 1 1 ˆ ˆ Var ( ) Var ( ) 1 1
Why?
来自 中国最大的资料 库下载
2、包含无关变量偏误
显然,两者的参数具有完全不同的经济含义, 且估计结果一般也是不相同的。
来自 中国最大的资料 库下载
三、模型设定偏误的检验
1、检验是否含有无关变量
可用t 检验与F检验完成。
检验的基本思想:如果模型中误选了无关变量, 则其系数的真值应为零。因此,只须对无关变量 系数的显著性进行检验。 t检验:检验某1个变量是否应包括在模型中;
采用包含无关解释变量的模型进行估计带来的 偏误,称为包含无关变量偏误(including irrelevant variable bias)。 设 Y=0+ 1X1+v Y=0+1X1+2X2+ (*) (**)
计量经济学--模型设定偏误问题
来自 中国最大的资料库下 载
(2)一般性设定偏误检验
但更准确更常用的判定方法是拉姆齐(Ramsey) 于1969年提出的所谓RESET 检验(regression error specification test)。
x1i (i )
x12i
(1)如果漏掉的X2与X1相关,则上式中的第二项在小样本下求期望与大样本下求 概率极限都不会为零,从而使得OLS估计量在小样本下有偏,在大样本下非一
致。
来自 中国最大的资料库下 载
(2)如果X2与X1不相关,则1的估计满足无偏性与 一致性;但这时0的估计却是有偏的。
由 Y=0+ 1X1+v 得 由 Y=0+1X1+2X2+ 得
Var(ˆ1)
2
x12i
Var(ˆ1) 2
x22i
x12i x22i ( x1i x2i ) 2
2
x12i
(1
r2 x1x2
)
如果X2与X1相关,显然有 Var(ˆ1) Var(ˆ1)
如果X2与X1不相关,也有 Var(ˆ1) Var(ˆ1) Why?
(1)残差图示法
来自 中国最大的资料库下 载
• 残差序列变化图
(a)趋势变化 : 模型设定时可能遗 漏了一随着时间的 推移而持续上升的 变量
(b)循环变化: 模型设定时可能遗 漏了一随着时间的 推移而呈现循环变 化的变量
来自 中国最大的资料库下 载
• 模型函数形式设定偏误时残差序列呈现正负 交替变化
Var(ˆ1)
2
x12i
(1
r2 x1x2
计量经济学(第四版)习题及复习资料详细版
计量经济学(第四版)习题参考答案潘省初第一章 绪论1.1 试列出计量经济分析的主要步骤。
一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项?为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3什么是时间序列和横截面数据? 试举例说明二者的区别。
时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4估计量和估计值有何区别?估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y就是一个估计量,1nii YY n==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 计量经济分析的统计学基础2.1 略,参考教材。
2.2请用例2.2中的数据求北京男生平均身高的99%置信区间NSS x ==45=1.25 用=0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为x S t X 005.0± =174±2.947×1.25=174±3.684也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。
中级计量经济学第四章模型设定错误
中级计量经济学第四章模型设定错误中级计量经济学第四章模型设定错误第四章模型设定错误主要内容模型设定错误有广义和狭义两种情况狭义的错误指模型设定出现丢失重要解释变量、包括不必要的解释变量、解释变量测度存在误差等情况;广义的错误还包括多重共线、残差项出现异方差或序列相关等情况。
当出现模型设定错误时,利用OLS方法得到的参数估计不再具有最小方差和无偏性质。
主要内容多重共线模型变量设定错误遗漏必要的解释变量包括不必要的解释变量解释变量含有测度误差误差项不符合古典假定回归方程函数形式错误检验和解决办法多重共线根据古典假定,矩阵X'X应该是满秩的,即X'X可逆。
若数据违反上述假定,那么出现解释变量间的完全多重共线。
在实际工作中,由于数据原因造成的解释变量完全多重共线并不常见,并且多数是由于模型设定错误。
经常遇到的情况是解释变量之间的不完全多重共线。
令rj为不同时为零的常数,上述两种情况可以表示为:完全的多重共线不完全的多重共线(vi为一随机误差项)不同性质的多重共线右表中,X1与X2为完全的多重共线,即:X2=5X1X1与X3则为不完全多重共线,即:X2=5X1+vCorr(X1,X2)=0.9991521503011912024949018757515525010X3X2X1多重共线多重共线是由于解释变量之间存在较高的相关性。
经济变量之间总会存在较高的相关性,差别仅仅是在相关的程度上,因而在应用工作中常常难以避免多重共线问题。
当解释变量高度相关时,估计模型参数遇到困难。
从数学角度解释,这就是说,当两个变量存在共同的运动模式时,采用统计手段分离两者各自对因变量的影响将是非常困难的。
多重共线的来源数据收集方法不当抽样集中在一个非常类似的子群体;例1:对同一地点贫困人口的调查,多数指标相近。
例2:对同一地点农户农业生产的调查,很多投入与土地成比例(技术、市场和制度环境相近)。
总体存在经济指标相关,抽样时未采取对策;例:高收入户通常家庭资产也多,但可能通过适当的抽样方法(分层/配额抽样)取得变异大的样本。
4.4 模型设定偏误问题
2
2
x
1i
Var( ˆ1 )
2
2
2
x
(
1
r
1i x1x2 )
• 对包含无关变量的模型进行估计,参数估计量是无偏的,但不具有最小方
差性。
3、错误函数形式偏误(wrong functional form bias)
• 产生的偏误是全方位的。
例如,如果“真实”的回归函数为
正确模型
错误模型
Y 0 1 X 1 2 X 2
Y 0 1 X 1 v
y i 1 x1i 2 x 2i i
ˆ 1
代入
ˆ1
x y
x
1i
2
1i
i
x
1 2
1i
x y
x
( 1 x1i 2 x 2i i )
多选无关变量或遗漏相关变量的检验
•
如果怀疑某些变量是多选的无关变量,则可通过t检验或F检验来考察它
们是否确实是多选的无关变量。
•
如果怀疑某些变量被遗漏了,则可将它们引入模型,同样再通过要引入模型。
•
当我们并不知道是否有重要的相关变量被遗漏了,就需根据经济理论,
引入2个Ŷ的高次幂(即Ŷ2 、Ŷ )
回归信息
不拒绝同时引入的Ŷ
的2次幂、3次幂都不显
著的假设,表明原模型
不存在遗漏非线性项的
设定偏误。
如果将原模型设定为直接线性模型,对该线
性模型进行模型设定的RESET检验。
OLS估计
RESET检验:
实验八-模型设定偏误问题
实验八-模型设定偏误问题实验八 模型设定偏误问题姓名:何健华 学号:201330110203 班级:13金融数学2班 一 实验目的:掌握模型设定偏误问题的估计与应用,熟悉 EViews 的基本操作。
二 实验要求:应用教材 P183 例子 5.3.1 的案例,利用RESET 检验检验模型设定偏误问题;应用教材 P185 例子 5.3.2 的案例,利用Box-Cox 变换比较线性模型与双对数线性模型的优劣。
三 实验原理:普通最小二乘法、阿尔蒙法、格兰杰因果关系检验、DW 检验。
四 预备知识:普通最小二乘法,F 检验,Box -Cox 变换。
五 实验步骤一、下表列出了中国某年按行业分的全部制造业国有企业及规模以上制造业非序号 工业总产值Y(亿元) 资产合计K(亿元) 职工人数L (万人)序号工业总产值Y(亿元) 资产合计K (亿元) 职工人数L (万人)1 3722.70 3078.22 113 17 812.70 1118.81 43 2 1442.52 1684.43 67 18 1899.70 2052.16 61 3 1752.37 2742.77 84 19 3692.85 6113.11 240 4 1451.29 1973.82 27 20 4732.90 9228.25 222 5 5149.30 5917.01 327 21 2180.23 2866.65 806 2291.16 1758.77 120 22 2539.76 2545.63 96 7 1345.17 939.10 58 23 3046.95 4787.90 222 8 656.77 694.94 31 24 2192.63 3255.29 163 9 370.18 363.48 16 25 5364.83 8129.68 244 10 1590.36 2511.99 66 26 4834.68 5260.20 145 11 616.71 973.73 58 27 7549.58 7518.79 138 12 617.94 516.01 28 28 867.91 984.52 46 13 4429.19 3785.91 61 29 4611.39 18626.94 218 14 5749.02 8688.03 254 30 170.30 610.91 19 15 1781.37 2798.90 83 31 325.531523.1945161243.071808.4433确设定的模型,将如何检验哪一个模型设定更正确? i i i i L K Y μβββ+++=2101.建立工作工作文件并录入数据,得到图1.1图1.12.采用RESET 检验来检验模型的设定偏误 2.1对于原幂函数形式的模型,变换成双对数模型 0lnY alnK lnL ββμ=+++采用OLS 进行估计,估计结果如图1.2。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
型中。
2、检验是否有相关变量的遗漏或函数形 式设定偏误
• 残差图示法
残差序列变化图
(a)趋势变化 : 模型设定时可能遗 漏了一随着时间的 推移而持续上升的 变量
(b)循环变化: 模型设定时可能遗 漏了一随着时间的 推移而呈现循环变 化的变量
• 例如,如果“真”的模型为 Y=0+1X1+2X2+
但我们将模型设定为 Y=0+ 1X1+ 2X2+ 3X3 +
即设定模型时,多选了一个无关解释变量。
3、错误的函数形式 (wrong functional form)
• 例如,如果“真实”的回归函数为
YA1 X 1X2 2e
但却将模型设定为
Y 01 X 1 2 X 2 v
模型函数形式设定偏误时残差序列呈现正负交替 变化
图示:一元回归模型中,真实模型呈幂函数形 式,但却选取了线性函数进行回归。
• 一般性设定偏误检验
–拉姆齐(Ramsey)于1969年提出的RESET 检验 (regression error specification test)。
– RESET 检验基本思想:
• 对包含无关变量的模型进行估计,参数估计量是 无偏的,但不具有最小方差性。
3、错误函数形式偏误(wrong functional form bias)
• 产生的偏误是全方位的。
三、模型设定偏误的检验
1、检验是否含有无关变量
• 检验的基本思想:如果模型中误选了无关变量, 则其系数的真值应为零。因此,只须对无关变 量系数的显著性进行检验。
• 如果事先知道遗漏了哪个变量,只需将此变量引 入模型,估计并检验其参数是否显著不为零即可;
• 问题是不知道遗漏了哪个变量,需寻找一个替代 变量Z,来进行上述检验。
• RESET检验中,采用所设定模型中被解释变量Y 的估计值Ŷ的若干次幂来充当该“替代”变量。
– RESET 检验步骤 • 估计原模型,得到残差和被解释变量的估计量; • 根据它们的图形判断应该引入Ŷ的若干次幂; • 对增加变量的模型进行估计,并进行F检验或者t 检验来判断是否增加这些“替代”变量。
error term
1、相关变量的遗漏(omitting relevant variables)
• 例如,如果“正确”的模型为
Y 01 X 12 X 2
而我们将模型设定为
1X1v
即设定模型时漏掉了一个相关的解释变量。
这类错误称为遗漏相关变量。
2、无关变量的误选 (including irrevelant variables)
计量经济学(第四版)4.4 模型设定偏误问题
一、模型设定偏误的类型
Types of Specification errors(bias)
• Omission of a relevant variable(s) • Inclusion of an unnecessary variable(s) • Adopting the wrong functional form • Errors of measurement • Incorrect specification of the stochastic
二、模型设定偏误的后果
1、遗漏相关变量偏误(omitting relevant variable bias)
Y01 X 12X 2 Y01X1v
y i1 x 1 i2x 2 ii ˆ1
x1i yi x12i
ˆ1
x1i yi x12i
x1i(1x1i 2x2i i )
x12i
• 1估计量的方差是有偏的。
Var(ˆ1)
2
x12i
Va(rˆ1)
2
x12i (1rx21x2 )
2、包含无关变量偏误(including irrelevant variable bias)
Y01X1v Y01X 12X 2
Var(ˆ1)
2
x12i
Va(rˆ1)
2
x12i (1rx21x2 )
直接线性模型的OLS估计
RESET检验
在1%显著性水平下,拒绝原模型与引入新变量的模型可 决系数无显著差异的假设,表明原模型存在设定偏误。
12
x1ix2i x12i
x1i(i )
x12i
ˆ112
x1 ix2 i x1 i( i)
x1 2 i
x1 2 i
• 如果X2与X1相关, 1的估计量在小样本下有偏, 在大样本下非一致。
• 如果X2与X1不相关,则1的估计量满足无偏性 与一致性;但这时0的估计却是有偏的。
• 随机扰动项的方差估计也是有偏的。
引入1个变量检验结果
在5%显著性水平下,不拒绝原模型与引入新变量的模型可 决系数无显著差异的假设,表明原模型不存在设定偏误。
引入2个变量检验结果
不拒绝原模型与引入新变量的模型可决系数无显著 差异的假设,表明原模型不存在设定偏误。
• 如果将原模型设定为直接线性模型,对该线性模 型进行模型设定的RESET检验。
– RESET检验也可用来检验函数形式设定偏误的问题。 • 将非线性模型设定为线性可以近似认为遗漏了解 释变量的2次、3次项;
• 引入模型,再进行检验。
• RESET 检验例题:对§4.3的美国香烟的人均 消费模型进行模型设定的RESET检验。
原模型OLS估计
选择RESET检验
选择引入1个变量