计量经济学模型设定及数据问题.
第五章 模型的建立与估计中的问题及对策(计量经济学-西财 任栋)
例2 有人在建立某地区粮食产量回归模型时,以粮食产量 为因变量y,以化肥用量为x1,水浇地面积为x2,农业投入 资金为x3等作为自变量。 从表面上看到x1,x2,x3都是影响粮食产量的重要因 素,可是建立的回归方程效果很差,原因何在呢?
二 、后果 1. 不改变参数估计量的无偏性;事实上,对于不 完全多重线性,参数估计量仍为BLUE。 2. 但各共线变量的参数的OLS估计值方差很大, 即估计值精度很低。(BLUE表明在各线性无偏估 计量中方差最小,但不等于方差的值很小。)
ˆ ˆ ˆ Yi 0 1 X1i 2 X 2i 3Yi 2 4Yi 3 5Yi 4 ui
(3) 用F检验比较两个方程的拟合情况(类似于上一章中 联合假设检验采用的方法),如果两方程总体拟合情况 显著不同,则我们得出原方程可能存在误设定的结论。 使用的检验统计量为:
19
在Eview中,回归出方程中,reset检验的命令如下: View
Stability Tests
Ramsey RESET Test
20
第二节 多重共线性
应用OLS法的一个假设条件是;矩阵 X的秩 =K+1<N。即自变量之间不存在严格的线性关系, 观测值个数大于待估计的参数的个数。这两条无 论哪一条不满足,则OLS估计值的计算无法进行, 估计过程由于数学原因而中断,就象分母为0一样。 这两种情况都很罕见。然而,自变量之间存在 近似的线性关系则是很可能的事。事实上,在经 济变量之间,这种近似的线性关系是很常见的。 当某些解释变量高度相关时,尽管估计过程不 会中断,但会产生严重的估计问题,我们称这种 现象为多重共线性。解释变量间存在严格线性相 关关系时,称为完全的多重共线性。
24
建立计量经济学模型的步骤和要点
(2)数据来源
• 计量经济分析所需要的数据可以充分利用统计部 门提供的资料或是其他一些诸如网上期刊得到的 二手资料,以减少收集数据的工作量。
• 在没有有效来源时,可由自己通过调查得到。
(3) 样本数据的质量
数据高质量的标准: 完整性; 准确性; 可比性; 一致性
(1)完整性—— 模型中包含的所有变量都必须拥 有相同容量的样本观测值。 例如:P54表2.6.1 对于“遗失数据”的处理方法: 法一:样本容量足够大且样本点间的联系并不紧密 时,将出现遗失数据的所在样本点整个去掉。 法二:样本容量有限,样本点间的联系紧密时,采 取特定技术将遗失数据补上。
§1.2 建立计量经济学模型的步骤和要点(重 点)
一、理论模型的设计 (重点) 二、样本数据的收集(次重点) 三、模型参数的估计 四、模型的检验 五、计量经济学模型成功的三要素
讲述流程
一、用例子阐述建立计量经济学模型的步骤 二、具体实施中各步骤需完成的工作及各步 要点
一、建立计量经济学模型的步骤示例
(2)准确性有两方面含义: 第一:所得到的数据必须准确反映它所描述的经 济因素的状态,即统计数据或调查数据本身是准 确的;
α和β的经验值。
Q 76.05-3.88* P
Q顶上的帽子符号表示一种估计值。 根据估计结果,空调价格上涨100元,空调需 求量下降0.388万台。
④模型检验 以一定的标准,对估计结果进行检验。 如:斜率是否小于0?估计结果是否可靠?
小结:建立计量经济学模型的四个步骤
步骤
例子
1 理论模型的设计 2样本数据收集 3模型参数估计 4 模型检验
69
x
63
60 -
xx x
60
58
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第9章 模型设定和数据问题的深入探讨【圣才出
(c)
来检验模型
y 0 1x1 2 x2 u
(d)
或者把这两个模型反过来。然而,它们是非嵌套模型,所以不能仅使用标准的 F 检验。
(1)综合模型的 F 检验
构造一个综合模型,将每个模型都作为一个特殊情形而包含其中,然后检验导致每个模
型的约束。在目前的例子中,综合模型为:
y 0 1x1 2 x2 3 log x1 4 log x2 u
y 0 1x1 2 x2 3 x3 u
但有 x3 的一个代理变量,并称之为 x3
x3 0 3 x3 v3
其中,v3 是因 x3 与 x3 并非完全相关所导致的误差。参数 3 度量了 x3 与 x3 之间的关系。 x3 和 x3 正相关,所以 δ3 0 。如果 δ3 0 ,则 x3 不是 x3 合适的代理变量。截距 δ0 ,是容许 x3
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 9 章 模型设定和数据问题的深入探讨
9.1 复习笔记
一、函数形式设误 1.函数形式设误的概念 遗漏一个关键变量能导致误差与某些解释变量之间的相关,从而通常导致所有的 OLS 估计量都是偏误和不一致的。在遗漏的变量是模型中一个解释变量的函数的特殊情形下,模 型就存在函数形式误设的问题。遗漏自变量的函数并不是模型出现函数形式误设的唯一方 式。
②用戴维森—麦金农检验拒绝了式(d),这并不意味着式(c)就是正确的模型。模型 (d)可能会因多种误设的函数形式而被拒绝。
③在比较因变量不同那么就不能得到上面的综合嵌套模型。
二、对无法观测解释变量使用代理变量 1.代理变量 代理变量就是某种与我们在分析中试图控制而又无法观测的变量相关的东西。例如,人 的能力无法观测,可以使用 IQ 得分作为能力的一个代理变量。 (1)遗漏变量问题的植入解 假设在有 3 个自变量的模型中,其中有两个自变量是可以观测的,解释变量 x3 观测不 到:
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-模型设定和数据问题的深入探讨【圣才出品】
第9章模型设定和数据问题的深入探讨9.1复习笔记考点一:函数形式设误检验(见表9-1)★★★★表9-1函数形式设误检验考点二:对无法观测解释变量使用代理变量★★★1.代理变量代理变量就是某种与分析中试图控制而又无法观测的变量相关的变量。
(1)遗漏变量问题的植入解假设在有3个自变量的模型中,其中有两个自变量是可以观测的,解释变量x3*观测不到:y=β0+β1x1+β2x2+β3x3*+u。
但有x3*的一个代理变量,即x3,有x3*=δ0+δ3x3+v3。
其中,x3*和x3正相关,所以δ3>0;截距δ0容许x3*和x3以不同的尺度来度量。
假设x3就是x3*,做y对x1,x2,x3的回归,从而利用x3得到β1和β2的无偏(或至少是一致)估计量。
在做OLS之前,只是用x3取代了x3*,所以称之为遗漏变量问题的植入解。
代理变量也可以以二值信息的形式出现。
(2)植入解能得到一致估计量所需的假定(见表9-2)表9-2植入解能得到一致估计量所需的假定2.用滞后因变量作为代理变量对于想要控制无法观测的因素,可以选择滞后因变量作为代理变量,这种方法适用于政策分析。
但是现期的差异很难用其他方法解释。
使用滞后被解释变量不是控制遗漏变量的唯一方法,但是这种方法适用于估计政策变量。
考点三:随机斜率模型★★★1.随机斜率模型的定义如果一个变量的偏效应取决于那些随着总体单位的不同而不同的无法观测因素,且只有一个解释变量x,就可以把这个一般模型写成:y i=a i+b i x i。
上式中的模型有时被称为随机系数模型或随机斜率模型。
对于上式模型,记a i=a+c i和b i=β+d i,则有E(c i)=0和E(d i)=0,代入模型得y i=a+βx i+u i,其中,u i=c i+d i x i。
2.保证OLS无偏(一致性)的条件(1)简单回归当u i=c i+d i x i时,无偏的充分条件就是E(c i|x i)=E(c i)=0和E(d i|x i)=E(d i)=0。
第十章 计量经济学-模型设定.
对多元回归,非线性函数可能是关于若干个 或全部解释变量的非线性,这时可按遗漏变量的 程序进行检验。 例如,估计 Y=0+1X1+2X2+
但却怀疑真实的函数形式是非线性的。 这时,只需以估计出的Ŷ的若干次幂为“替代” 变量,进行类似于如下模型的估计
ˆ2 Y ˆ3 Y 0 1 X1 2 X 2 1Y 2
2.39 9.52
• 由所得系数可以看出,两种情况下均造成高估所保留变量的参数, 据此做分析可能导致得出错误的结论。 • 两个参数所处的区间应该分别为0 1 0.454 和 0 2 0.051
关于遗漏必要的解释变量的总结
• 遗漏必要的解释变量是一种严重的错误,必须 注意避免。 • 对别人的研究成果做评价时,是否存在遗漏必 要解释变量的错误是需要考察的最重要的一个 方面。
例如,先估计 Y=0+ 1X1+v 得 ˆ ˆ0 ˆ1 X 1 Y
ˆ2 Y ˆ3 Y 0 1 X 1 1Y 2
再根据增加解释变量的F检验来判断是否增加这 些“替代”变量。 若仅增加一个“替代”变量,也可通过t检验来 判断。
RESET检验也可用来检验函数形式设定偏误的 问题。
ˆ ) 2 Var( 1
ˆ1 ) Var(
2 x 1i
2
x
2 1i
x ( x1i x2i )
2 2i
x
2 2i
2
2 2 x ( 1 r 1i x1x2 )
2
如果X2与X1相关,显然有 如果X2与X1不相关,也有
ˆ) ˆ1 ) Var( Var( 1 ˆ) ˆ1 ) Var( Var( 1
计量经济学模型分析
城镇居民家庭人均可支配收入及城市政府支出驱动经济增长的计量分析:1979~2009一.问题的提出2010年上海世界博览会已经圆满落下帷幕,在“城市让生活更美好”的主题下,这场持续184天的盛会向世界呈现了中国城市化进程中所取得的成就。
所谓城市化,就是指随着社会生产力的发展,人类的生产和生活有农村向城市转化的过程,表现为城市数量的增加和规模的扩大,城市消费、投资持续增加,进而改变经济发展的空间方向和基本方式。
二.模型设定统计表明,改革开放以来,特别是进入21世纪之后,在中国的城市化进程中,城市化率、城镇居民家庭人均可支配收入、城市政府支出以及城镇居民消费水平都有了显著的上升,因此,我们把这四个指标作为反映城市化的变量。
根据GDP 的取决于消费、投资、政府支出的基本原理,这四个变量应该可以很好的解揭示城市化对经济的驱动作用。
本实验主要选取1979~2009年的以下数据:1.城市化率:该指标主要反映的是城市人口规模。
2.经济增长:大多数的研究采用的是以人均GDP表示经济增长,也有使用单位资本GDP 来体现的,我们采用了前者。
3.城镇居民家庭人均可支配收入:4.城市政府支出:这里较为理想的指标是城镇人均政府支出,限于数据的可获得性,我们采用的是人均政府消费支出作为替代。
这是因为,政府消费支出多集中于城镇级别的政府,而农村基层行政部门消费支出比重较低。
5.城镇居民消费水平:这里采用城镇人均消费水平,而不是全社会人均消费水平以便能更好的反映出城市消费对经济增长的拉动作用。
模型形式的设计:Y=β1+β2X1+β3X2+β4X3+β5X4+μ其中,Y:人均GDPX1:城市化率X2:城镇居民家庭人均可支配收入X3:城市政府支出X4:城镇居民消费水平三.数据的搜集本实验获取的是1979~2009年的数据,如下表:年份人均GDP 城市化率城镇居民家庭人均可支配收入政府支出城镇居民消费水平1978 381 17.92 343.4 1122.09 405 1979 419 18.96 405.0 1281.79 425 1980 463 19.39 477.6 1228.83 489 1981 492 20.16 500.4 1138.41 521 1982 528 21.13 535.3 1229.98 536 1983 583 21.62 564.6 1409.52 558 1984 695 23.01 652.1 1701.02 618 1985 858 23.71 739.1 2004.25 765 1986 963 24.52 900.9 2204.91 872 1987 1112 25.32 1002.1 2262.18 998 1988 1366 25.81 1180.2 2491.21 1311 1989 1519 26.21 1373.9 2823.78 1466 1990 1644 26.41 1510.2 3083.59 1596 1991 1893 26.94 1700.6 3386.62 1840 1992 2311 27.46 2026.6 3742.20 2262 1993 2998 27.99 2577.4 4642.30 2924 1994 4044 28.51 3496.2 5792.62 3852 1995 5046 29.04 4283.0 6823.72 4931 1996 5846 30.48 4838.9 7937.55 5532 1997 6420 31.91 5160.3 9233.56 5823 1998 6796 33.35 5425.1 10798.18 6109 1999 7159 34.78 5854.0 13187.67 6405 2000 7858 36.22 6280.0 15886.50 6850 2001 8622 37.66 6859.6 18902.58 7113 2002 9398 39.09 7702.8 22053.15 7387 2003 10542 40.53 8472.2 24649.95 7901 2004 12336 41.76 9421.6 28486.89 8679 2005 14185 42.99 10493.0 33930.28 9410 2006 16500 43.90 11759.5 40422.73 10423 2007 20169 44.94 13785.8 49781.35 11904 2008 23708 45.68 15780.8 62592.66 13526 2009 25575 46.59 17174.7 76299.93四.模型的估计与调整(一).散点图020000400006000080000100002000030000Y(二).OLS 回归结果:Dependent Variable: Y Method: Least Squares Date: 06/19/11 Time: 23:27 Sample(adjusted): 1979 2008Included observations: 30 after adjusting endpointsVariable Coefficient Std. Error t-Statistic Prob. C 1675.936 502.4538 3.335504 0.0027 X1 -85.42903 23.51347 -3.633196 0.0013 X2 0.694786 0.332357 2.090482 0.0469 X3 0.161081 0.034738 4.636982 0.0001 X40.3637490.2269861.6025140.1216R-squared0.998932 Mean dependent var 5882.433 Adjusted R-squared 0.998761 S.D. dependent var 6258.838 S.E. of regression 220.3462 Akaike info criterion 13.77929 Sum squared resid 1213812. Schwarz criterion 14.01282 Log likelihood -201.6893 F-statistic 5843.189Y=1675.936-85.42903X1+0.694786X2+0.161081X3+0.363749X4由此可见:该模型的R^2=0.998932,Adjusted R-squared=0.998761可决系数很高,F检验值为5843.189,明显显著。
简述建立计量经济学模型的基本步骤
简述建立计量经济学模型的基本步骤计量经济学模型是经济学研究中的一个重要工具,它能够用来理解经济现象、分析经济政策以及预测经济变量的变化趋势。
建立计量经济学模型可以帮助经济学家对经济现象进行量化分析,揭示经济规律。
下面将简要介绍建立计量经济学模型的基本步骤。
第一步:明确研究目的和问题在建立计量经济学模型之前,首先需要明确研究的目的和问题。
研究目的可以是解释某一经济现象的原因,预测某一经济变量的未来趋势,或评估某一经济政策的效果等。
明确研究目的和问题有助于确定模型的结构和变量选择。
第二步:选择适当的模型框架选择适当的模型框架是建立计量经济学模型的关键一步。
模型框架决定了模型的基本结构和变量之间的关系。
常用的模型框架包括线性回归模型、时间序列模型、面板数据模型等。
选择适当的模型框架要考虑研究问题的特点和数据的性质,以及模型的可解释性和预测准确性等因素。
第三步:收集和整理数据建立计量经济学模型需要大量的数据支持。
在收集数据时,要注意数据的准确性和可靠性。
对于时间序列数据,需要收集一段时间内的连续观测值;对于截面数据,需要收集同一时间点上的多个观测值;对于面板数据,既需要收集多个时间点上的连续观测值,也需要收集同一时间点上的多个观测值。
收集和整理数据需要耐心和细心,以确保数据的完整性和一致性。
第四步:制定假设和建立模型在建立计量经济学模型时,需要制定一些假设,以简化模型和提高模型的可解释性。
假设通常包括线性关系假设、正态分布假设、无多重共线性假设等。
制定假设后,可以根据模型框架和变量之间的关系来建立模型。
模型的建立要根据经济理论和实际情况进行合理的假设和推断,以保证模型的有效性和可靠性。
第五步:估计模型参数在建立计量经济学模型后,需要通过统计方法来估计模型的参数。
常用的估计方法包括最小二乘法、极大似然估计法等。
通过估计模型参数,可以获得模型的具体数值,以及各个变量对目标变量的影响程度。
估计模型参数需要注意数据的性质和假设的合理性,以及估计结果的稳健性和显著性等。
建立计量经济学模型的步骤和要点
建立计量经济学模型的步骤和要点一、理论模型的设计对所要研究的经济现象进行深入的分析,根据研究的目的,选择模型中将包含的因素,根据数据的可得性选择适当的变量来表征这些因素,并根据经济行为理论和样本数据显示出的变量间的关系,设定描述这些变量之间关系的数学表达式,即理论模型。
生产函数就是一个理论模型。
理论模型的设计主要包含三部分工作,即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围。
1、确定模型所包含的变量在单方程模型中,变量分为两类。
作为研究对象的变量,也就是因果关系中的“果”,例如生产函数中的产出量,是模型中的被解释变量;而作为“原因”的变量,例如生产函数中的资本、劳动、技术,是模型中的解释变量。
确定模型所包含的变量,主要是指确定解释变量。
可以作为解释变量的有下列几类变量:外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。
其中有些变量,如政策变量、条件变量经常以虚变量的形式出现。
严格他说,上述生产函数中的产出量、资本、劳动、技术等,只能称为“因素”,这些因素间存在着因果关系。
为了建立起计量经济学模型,必须选择适当的变量来表征这些因素,这些变量必须具有数据可得性。
于是,我们可以用总产值来表征产出量,用固走资产原值来表征资本,用职工人数来表征劳动,用时间作为一个变量来表征技术。
这样,最后建立的模型是关于总产值、固定资产原值、职工人数和时间变量之间关系的数学表达式。
下面,为了叙述方便,我们将“因素”与“变量”间的区别暂时略去,都以“变量”来表示。
关键在于,在确定了被解释变量之后,怎样才能正确地选择解释变量。
首先,需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。
这是正确选择解释变量的基础。
例如,在上述生产问题中,已经明确指出属于供给不足的情况,那么,影响产出量的因素就应该在投入要素方面,而在当前,一般的投入要素主要是技术、资本与劳动。
如果属于需求不足的情况,那么影响产出量的因素就应该在需求方面,而不在投入要素方面。
计量经济学期末重点
1.计量经济学的研究过程及内容:(1)模型设定(要有科学的理论依据、选择适当的数学形式、模型要兼顾真实性和实用性、包含随机误差项、方程中的变量要具有可观测性);(2)估计参数(参数是未知的,又是不可直接观测的。
由于随机误差项的存在,参数也不能通过变量值去精确计算。
只能通过变量样本观测值选择适当方法去估计);(3)模型检验(经济意义检验、统计推断检验、计量经济学检验、模型预测检验)(4)模型应用(经济结构分析、经济预测、政策评价、检验发展经济理论)2.数据的要求:真实性、完整性、可比性3.可利用来建立计量经济模型的关系:行为关系(如生产、投资、消费)、生产技术关系(如投入产出关系)、制度关系(如税率)、定义关系(根据定义表达的恒等式) 6.相关关系的特点(1)X 和Y 都是相互对称的随机变量YX XYγγ=(2)线性相关系数只反映变量间的线性相关程度,不能说明非线性相关关系(3)样本相关系数是总体相关系数的样本估计值,由于抽样波动,样本相关系数是个随机变量,其统计显著性有待检验(4)相关系数只能反映线性相关程度,不能确定因果关系,不能说明相关关系具体接近哪条直线7.回归是关于一个变量对另一个变量或多个变量依存关系的研究,用适当的数学模型去近似地表达或估计变量之间的平均变化关系,其目的是要根据解释变量的估计数值去估计所研究的被解释变量的总体平均值。
8.回归函数:应变量Y 的条件期望E(Y/Xi)随解释变量X 的的变化而有规律的变化,如果把Y 的条件期E(Y/Xi)望表现为X 的某种函数()()i i E Y X f X =,这个函数称为回归函数。
9.线性回归模型主要指就参数而言是“线性”,因为只要对参数而言是线性的,都可以用类似的方法估计其参数。
10.引入随机扰动项的原因:是未知影响因素的代表(理论的模糊性)、是无法取得数据的已知影响因素的代表(数据欠缺)、 是众多细小影响因素的综合代表(非系统性影响)、模型的设定误差(变量、函数形式的设定)、变量的观测误差(变量数据不符合实际)、经济现象的内在随机性(人类经济行为的内在随机性)11.样本回归函数与总体回归函数的区别:(1)总体回归函数虽然未知,但它是确定的;样本回归线却是随抽样波动而变化的,可以有许多条。
计量经济学-9
2 2 2 Var (v e0 ) u 0 u,即误差方差比没有测量误差时更大,也导致
函数形式误设的一般检验(RESET) 基本思想:如果原模型y 0 1 x1 2 x2 L k xk u 满足假定(u∣x) 0 E 那么,在方程中添加自变量的非线性关系应该是不显著的。 不过,当解释变量很多时,添加自变量的平方和立方项会产生更多的 解释变量,损失了很大一部分自由度。一般会在模型中添加被解释变量 ˆ ˆ 的预测值的平方y 2及立方y 3: ˆ ˆ y 0 1 x1 2 x2 L k xk 1 y 2 2 y 3 u 检验H 0:1 0, 2 0 F 统计量渐近服从F2,nk 3分布。显著的F 统计量表明存在某种函数形式问题
(2)经典的含误差变量(CEV)假定:cov(x1 , e1 )=0 2 2 2 x1 x1 e1, cov( x1 , e1 ) E ( x1e1 ) E ( x1 e1 ) E (e1 ) 0 e1 e1 ,
自变量与测量误差肯定相关,因此自变量与合成误差u 1e1也必然
因变量测量误差问题 假设模型:y 0 1 x1 L k xk u,满足CLRM 假定 y是对y 观测到的度量,它们之间的误差为:e0 y y , 可估计的模型变成:y 0 1 x1 L k xk u e0 , 随机误差项变成了u e0
自变量测量误差问题
考虑一个简单回归模型:y 0 1 x1 u,假设满足CLRM 假定, 则参数估计是无偏的和一致的,但是x1 观测不到,我们只能观测到x1, 它们之间存在着一个测量误差:e1 x1 x1 假定E(e1 )=0,u与x1和x1 都不相关,此时将x1取代x1 放入原方程进行OLS
计量经济学经济数据分析和经济模型的要点
计量经济学经济数据分析和经济模型的要点计量经济学是经济学的一个重要领域,它通过运用统计学和数学方法,对经济数据进行定量分析,以揭示经济现象背后的规律性关系,并建立经济模型来解释和预测经济行为。
在本文中,我们将重点介绍计量经济学中经济数据分析和经济模型的要点。
一、经济数据分析经济数据是计量经济学的基础,它描述了经济现象以及经济变量之间的相互关系。
在经济数据分析中,我们需要掌握以下几个重要的要点:1. 数据收集:经济数据的来源多种多样,可以通过问卷调查、统计局数据、企业报表等方式进行收集。
在进行数据收集时,我们需要确保数据的准确性和全面性,避免数据的偏倚和遗漏。
2. 数据质量检验:在进行数据分析之前,我们需要对数据进行质量检验。
主要包括数据的完整性、一致性、合理性等方面的检查,以确保数据的可靠性。
3. 数据描述统计:数据描述统计是对数据进行初步的分析和概括,主要包括数据的中心位置、分散程度、分布形态等方面的统计指标。
常用的描述统计指标包括均值、方差、标准差等。
4. 数据可视化:数据可视化是将经济数据以图表的形式展现出来,以便更直观地理解和分析数据。
常用的数据可视化工具包括散点图、折线图、柱状图等。
二、经济模型经济模型是计量经济学的核心内容,它用数学语言描述经济行为和经济变量之间的关系。
在建立经济模型时,我们需要注意以下几个要点:1. 假设的设定:经济模型基于一定的假设前提,这些假设用于简化现实情况,并突出研究重点。
在建立模型时,我们需要合理设定假设,并对其进行合理性检验。
2. 变量选择:在经济模型中,我们需要选择具有经济意义的变量进行建模。
变量的选择应该考虑到其与研究主题的相关性和可测度。
3. 变量间关系的确定:在建立经济模型时,我们需要确定变量之间的关系形式。
常用的函数形式包括线性关系、非线性关系、概率分布等。
4. 模型参数的估计:经济模型的参数估计是计量经济学的核心内容之一。
常用的估计方法包括最小二乘法、极大似然法等。
计量经济学-模型设定
Ct 0 1Yt 1t 考虑到边际消费倾向递减:
Ct 0 1Yt 2Yt2 2t
或 ln Ct 0 1 ln Yt 3t
——基于预期因素的模型
(5.1.1)
(5.1.2) (5.1.3)
Ct 0 1Yt C 2 t1 4t
(5.1.4)
(5.2.5)
▪问题:估计了一个不需要估计的参数
10
具体影响:
误差项满足经典假定,模型的参数估计量是无偏的。 问题本质:估计了一个实际上不必估计的参数 2 0
不会导致误差项与解释变量之间相关,不影响参数 OLS估计量的无偏性。 拟合过度模型OLS估计量的方差会增大:多余的解 释变量和模型中必要的解释变量总是存在一定的相 关性,部分变化信息重复。重复信息的影响难以在 解释变量间准确分解,导致系数估计精度下降。
2
§5.1 计量经济学模型的设定偏误
一、模型设定偏误
如果所建立的计量经济学模型与真实的经济关系 不一致,模型就出现了所谓的“设定偏误”。
对于正确设定的模型,一个最基本的信息是:其 参数估计值的符号必须与理论预期或基于现实观 察的经验预期相一致。
3
二、模型设定偏误的类型
消费函数:Ct为消费支出,Yt表为收入 ——凯恩斯的绝对收入假定模型
var(ˆ1)
2
(Yt Y )2
(5.2.7)
只要 Yt 和 Ct1 的样本相关系数不为0,多余解释 变量 Ct1 的加入就会导致系数 Yt 估计量 ˆ1 方差 的增大。
12
其他影响:
由于过度拟合模型的误差项是真实的随机误差项, 我们对 2 的估计是正确的。相应地,参数的置信 区间和显著性检验仍然有效,但由于估计量的方差 增大,统计推断的精度会下降。
计量经济学模型建立的步骤
计量经济学模型建立的步骤
建立计量经济学模型的步骤可以概括为以下几个阶段:
1. 模型的设定:首先确定研究的目标和问题,然后根据理论基础和研究对象的特点,选择适当的经济学理论模型作为分析框架。
2. 设定假设:根据模型设定的理论框架及前提条件,对模型中的关键变量进行假设设定,包括变量之间的函数形式、参数的取值范围以及各种约束条件。
3. 数据收集与处理:收集与研究问题相关的数据,对数据进行处理和整理,包括数据清洗、缺失值处理、数据变换等。
4. 模型估计与检验:根据设定的经济模型,利用计量经济学的方法进行模型的估计与检验,确定模型中的参数估计值,并对估计结果进行合理性检验,如参数的显著性检验、模型的拟合优度检验等。
5. 模型解释和分析:根据模型的估计结果,进行解释和分析,研究变量之间的关系、因果关系以及对实际问题的影响等,并提出相应的政策建议或研究结论。
需要注意的是,以上的步骤是一个一般性的描述,实际建立计量经济学模型时可能会因研究问题的不同而有所变化。
此外,在每个阶段都需要进行严谨的理论分
析和数据处理工作,以确保模型的可靠性和有效性。
计量经济学模型的设定
计量经济学模型的设定计量经济学是经济学中的一个分支,它利用统计方法和实证数据来研究经济现象和经济政策的效果。
在计量经济学中,构建一个合理的模型是非常重要的,因为模型的设定直接影响到实证研究的结果。
在构建计量经济学模型时,首先需要确定研究的目的和问题。
例如,我们想要研究某个政策对就业率的影响,那么我们的模型就应该包括就业率和该政策所涉及的变量。
其次,需要确定模型的函数形式。
比如,我们可以使用线性函数、对数函数或其他函数形式来描述变量之间的关系。
此外,还应该考虑模型的内生性问题。
如果模型中的某个变量受到其他变量的影响,那么该变量就是内生的。
为了得到准确的结果,模型的设定还应考虑到可能的非线性和异方差性问题。
非线性可以是由于被研究现象的特殊性质引起的,因此必须在模型中予以考虑。
异方差性是指随机误差项的方差不恒定,可能会导致估计结果的失真。
解决这些问题的方法包括引入非线性函数和使用异方差性稳健的估计方法。
此外,数据的选择也是模型设定的一个关键因素。
数据的可用性和质量应满足模型的需求,例如,如果我们的模型需要时间序列数据,那么我们必须选择包含足够时间跨度和频率的数据集。
在模型设定之后,计量经济学研究者需要选择适当的估计方法来得到参数估计值。
常用的估计方法包括最小二乘法、极大似然估计和广义矩估计等。
这些方法在处理不同类型的模型和数据时具有一定的优势和适用性。
最后,模型设定后需要进行模型检验和灵敏度分析。
模型检验可以用来检验模型是否具有良好的拟合度和解释力,以及是否存在模型假设的违背。
灵敏度分析可以用来检验模型结果对模型假设的敏感程度,以及对不同的数据设定和估计方法的稳健性。
总之,计量经济学模型的设定是一个复杂而关键的过程,它在很大程度上决定了研究结果的有效性和可靠性。
只有合理、生动、全面、有指导意义的模型设定,才能为我们提供可靠的实证分析和政策建议。
因此,在进行计量经济学研究时,我们应该根据研究问题的特点和数据的特征,选择适当的变量、函数形式和估计方法,进行合理的模型设定。
计量经济学模型
1969 R. Frish J. Tinbergen 1973 W. Leotief 1980 L. R. Klein 1984 R. Stone 1989 T. Haavelmo 2000 J. J. Heckman D. L. McFadden ○16位担任过世界计量经济学会会长 ○ 30位左右在获奖成果中应用了计量经济学 ○“二战以后的经济学是计量经济学的时代”-Samuelson ○“计量经济学的讲授已经成为经济学课程表中最有权威 的济活动中各因素之间的理论关系, 用确定性的数学方程描述。例如,生产函数可描述为: Q Aet K L 公式描述了技术、资本、劳动与产出量之间 的理论关系,认为这种关系是准确实现的。利用数理经济 模型,可以分析经济活动中各种因素之间的互相影响,为 控制经济活动提供理论指导。但是,数理经济模型并没有 揭示因素之间的定量关系,在上式中,参数是未知的。
解释:如何正确地选择解释变量
• 首先,需要正确理解和把握所研究的经济现象中暗含的经济学理论和 经济行为规律。这是正确选择解释变量的基础 – 例如,在上述生产问题中,已经明确指出属于供给不足的情况, 那么,影响产出量的因素就应该在投人要素方面,而在当前,一 般的投人要素主要是技术、资本与劳动 – 如果属于需求不足的情况,那么影响产出量的因素就应该在需求 方面,而不在投入要素方面。这时,如果研究的对象是消费品生 产,应该选择居民收人等变量作为解释变量;如果研究的对象是 生产资料生产,应该选择固定资产投资总额等变量作为解释变量。
• 经济计量模型由系统或方程组成,方程由 变量和系数组成。其中,系统也是由方程 组成。
怎样看待计量经济模型?
• 广义地说,一切包括经济、数学、统计三 者的模型;
计量经济学第三章课后习题详解
第三章习题2011年各地区的百户拥有家用汽车量等数据北京天津河北山西内蒙古辽宁吉林黑龙江上海江苏浙江安徽福建江西山东河南湖北湖南广东广西海南重庆四川贵州云南西藏陕西甘肃青海宁夏新疆一、研究的目的和要求经济增长,公共服务、市场价格、交通状况,社会环境、政策因素都会影响中国汽车拥有量。
为了研究一些主要因素与家用汽车拥有量的数量关系,选择“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”等变量来进行研究和分析。
为了研究影响2011年各地区的百户拥有家用汽车量差异的主要原因,分析2011年各地区的百户拥有家用汽车量增长的数量规律,预测各地区的百户拥有家用汽车量的增长趋势,需要建立计量经济模型。
二、模型设定为了探究影响2011年各地区的百户拥有家用汽车量差异的主要原因,选择百户拥有家用汽车量为被解释变量,人均GDP、城镇人口比重、交通工具消费价格指数为解释变量。
首先,建立工作文件、选择数据类型“integer data”、“Start date”中输入“1”,“End date”中输入“31”,在EViews命令框直接键入“data Y X2 X3 X4”,在对应的“Y X2 X3 X4”下输入或粘贴相应的数据。
探索将模型设定为线性回归模型形式:=三、估计参数在命令框中输入“LS Y C X2 X3 X4”,回车即出现下面的回归结果:根据数据,模型估计的结果写为:t == = F= n=31四、模型检验1.统计检验(1)拟合优度:由上表中的数据可以得到: =,修正的可决系数为=,这说明模型对样本的拟合一般。
说明解释变量“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”联合起来对被解释变量“百户拥有家用汽车量”做了绝大部分的解释。
(2)F检验:针对:=0,给定显著水平=,在F分布表中查出自由度为k-1=3和n-k=27的临界值(3,27)=,由上表可知F=>(3,27)=,应拒绝原假设:=0,说明回归方程显著,即“人均地区生产总值”、“城镇人口比重”、“交通工具消费价格指数”变量联合起来确实对“百户拥有家用汽车量”确实有显著影响。
中级计量经济学 第四章 模型设定错误
中级计量经济学第四章模型设定错误第四章模型设定错误主要内容模型设定错误有广义和狭义两种情况狭义的错误指模型设定出现丢失重要解释变量、包括不必要的解释变量、解释变量测度存在误差等情况;广义的错误还包括多重共线、残差项出现异方差或序列相关等情况。
当出现模型设定错误时,利用OLS方法得到的参数估计不再具有最小方差和无偏性质。
主要内容多重共线模型变量设定错误遗漏必要的解释变量包括不必要的解释变量解释变量含有测度误差误差项不符合古典假定回归方程函数形式错误检验和解决办法多重共线根据古典假定,矩阵X'X应该是满秩的,即X'X可逆。
若数据违反上述假定,那么出现解释变量间的完全多重共线。
在实际工作中,由于数据原因造成的解释变量完全多重共线并不常见,并且多数是由于模型设定错误。
经常遇到的情况是解释变量之间的不完全多重共线。
令rj为不同时为零的常数,上述两种情况可以表示为:完全的多重共线不完全的多重共线(vi为一随机误差项)不同性质的多重共线右表中,X1与X2为完全的多重共线,即:X2=5X1X1与X3则为不完全多重共线,即:X2=5X1+vCorr(X1,X2)=0.9991521503011912024949018757515525010X3X2X1多重共线多重共线是由于解释变量之间存在较高的相关性。
经济变量之间总会存在较高的相关性,差别仅仅是在相关的程度上,因而在应用工作中常常难以避免多重共线问题。
当解释变量高度相关时,估计模型参数遇到困难。
从数学角度解释,这就是说,当两个变量存在共同的运动模式时,采用统计手段分离两者各自对因变量的影响将是非常困难的。
多重共线的来源数据收集方法不当抽样集中在一个非常类似的子群体;例1:对同一地点贫困人口的调查,多数指标相近。
例2:对同一地点农户农业生产的调查,很多投入与土地成比例(技术、市场和制度环境相近)。
总体存在经济指标相关,抽样时未采取对策;例:高收入户通常家庭资产也多,但可能通过适当的抽样方法(分层/配额抽样)取得变异大的样本。
计量经济学模型
• 我们所要研究的是鸡肉年消费量Y,根据分析我 们认为鸡肉的年消费量应该与鸡肉的价格、家庭 收入以及其他同类肉类的价格有关。 • 所以,我们收集了以下数据:
• 其中,Y表示鸡肉的年消费量,X表示家庭月平均 收入,P1、P2、P3分别表示鸡肉价格、猪肉价 格和牛肉价格。 • 在eviews中分别作出X、P1、P2、P3对Y的散点 图,如下:
• 所以模型方程为:
• 多重共线性检验:
• 在eviews中计算解释变量两两之间的简单相关关系数,如 下图所示:
• 从相关系数矩阵可以看出,这四个变量两两之间 相关系数都在0.9以上,说明模型存在多重共线性。 • 逐步回归法: • 1、分别作lny与lnx、lnp1、lnp2、lnp3间的回归, 回归结果如下图:
• 异方差性检验:
• 1、分析残差图
• 2、怀特检验 • 有以下结果可以看出对应的p值大于0.05,说明可以在5% 的显著性水平下接受同方差假设
• 所以,最后的模型为: • LNY = 0.45*LNX - 0.37*LNP1 - 1.13 • 不存在随机解释变量问题
• 1)lny=0.32*lnx-0.81 • (19.16) (7.11) • Adjusted R-squared=0.943 D.W.=0.54
• 2) lny=0.68*lnp1+0.31 • (6.2) (1.81) • Adjusted R-squared=0.63 D.W.=0.48
ቤተ መጻሕፍቲ ባይዱ
• 由于lnp3不能通过t检验,所以将它剔除。 • 引入解释变量lnp2的回归结果如下:
• 由于变量lnp2也不能通过t检验,所以将它剔除。 • 引入解释变量lnp1的回归结果如下:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x x x x x x u x x x x u x x x x x x x u x x u x x x x x x
ˆ*
1
x y x x y x x x x x
1i i 2 2i 2i i 2 1i 2 2i 2 1i 2 i
1i 2 i
x
Hale Waihona Puke 13包含不必要的解释变量
代入真实关系后有:
ˆ* 1
x x
1i 1 2 1i
k
若将X的高次项看作独立的解释变量,那么上式为多元线性 回归方程。用一元线性方程进行估计相当于遗漏必要的解释 变量。
12
二、包含不必要的解释变量
设表示成离差形式的真实模型为 y 1x .1 u 在估计该模型时增加了一个不必要的解释变量x2, * 模型变成为 y 1* x1 2 x2 。 u* 应用OLS方法估计该模型得到:
关系数
若总体方差已知,那么遗漏必要的解释变量造成低估参数方 差。 在应用工作中,总体方差需要由样本估计,即: ˆ 2 s 2 u ˆ i2 N K 1 由于丢失必要的解释变量一方面增大分子,另一方面也增大 分母,因而难以确定参数方差的偏差方向。
9
总结遗漏必要的解释变量后果: 参数估计量是有偏的; 参数估计量不具有一致性; 参数的方差估计也是有偏的。
* ˆ E 1 1
14
包含不必要的解释变量
x y x x y x ˆ x x x x x u x x u x 0 x x x x
* 2 2i i 2 1i 1i i 2 1i 2 2i 2 1i 2i 2i i 2 1i 1i i 1i
11
在应用工作中,除由于理论和数据原因而导致遗漏必要解释 变量的错误外,更经常出现的两种情况是采用错误的数学函 数形式和解释变量的定义发生改变。
模型数学形式错误主要是用线性方程表示非线性关系,而用 非线性方程表示线性关系一般不会造成问题。 假设正确的函数形式 Y f X u 为一个K阶可导函数, j Y X u近似。 可以用X的K阶多项式 0 j
第八章 计量经济学模型设定 及数据问题
1
学习计量经济学的目的,一方面是 发展计量经济学,另一方面是应用计量 经济学模型,后者更为重要。 ----------李子奈
2
模型设定错误
模型设定错误有广义和狭义两种情况 狭义的错误指模型设定出现丢失重要解释变量、 包括了不必要的解释变量及解释变量存在测度误 差等情况; 广义的错误还包括多重共线性、残差项出现异方 差或序列相关等情况。 当出现模型设定错误时,利用OLS方法得到的参数 估计不再具有最小方差和无偏性质。
10
如何判断是否遗漏重要变量?
遗漏必要的解释变量可能出现以下症状: 某些估计参数的值与理论预期相矛盾(异常的符 号,不合理的数值大小); 模型误差项表现异常(出现序列相关或异方差)。 如果由于无法获得数据等原因导致上述错误,在做 分析时应该利用前面介绍的知识,指出重要参数的 偏差方向,并讨论其含义。
3
在应用研究中,我们在模型设定时通常包括以下 具体内容:
模型中解释变量的构成
模型的函数形式 有关随机误差项的假定
如果这些设定与客观实际不一致,利用计量经济 模型来描述经济变量关系时,就会产生误差(偏 差),我们把这种误差称为模型的设定误差。
4
模型变量设定错误
遗漏必要的解释变量
包括不必要的解释变量 变量含有测度误差 误差项不符合古典假定 回归方程函数形式错误
2 1i 2 2i 2 1i 2 i 1i i 2 2i 1 1i 2 i 2i i 1i 2 i 2 1i 2 2i 2 1i 2 i 1i i 2 2i 2i i 1i 2 i 1 2 1i 2 2i 2 1i 2 i
1 1i
2 ui x2 i x2 i 1 x1i ui x1i x2 i
8
遗漏必要的解释变量(续)
遗漏必要的解释变量时,估计参数的方差也是有偏的,从而 造成统计检验失真。 ˆ * 的方差计算公式为: 模型仅包括两个解释变量时, 1 2 2 * ˆ ) ˆ) 2是x1和x2之间的相 Var( Var ( r 1 1 2 2 2
x
1
(1 r ) x1
5
一、遗漏必要的解释变量
设表示成离差形式的二元回归模型为: y=1x1+2x2+u 假定模型设定时遗漏了解释变量x2,回归方程变为: y 1* x1 u*
对此模型采用OLS估计,得到的系数估计值为:
ˆ* x y 1 1
2 x 1
6
遗漏必要的解释变量(续)
将真实关系式代入后得到:
1 x12 2 x1 x2 x1u 1 2 ˆ* x y 1 1
2 x 1 x1 1 x1 2 x2 u 2 x 1 2 x 1
估计参数的期望值为
ˆ* E 1 1 2
x x x u x x
1 2 2 1 1 2 1
x x x
1 2 2 1
7
遗漏必要的解释变量(续)
当两个解释变量相关时,等号右边第二项不等于零。 因而当遗漏x2时有:
用OLS方法得到的
ˆ * 估计是模型真实参数的有偏估计 1
量; 此外,该项在样本容量无限增大时也不会趋近于零,即 对 1 的估计也不具有一致性特性; ˆ * 的偏差方向取决于 2 的符号和 Cov ( x1 x 2 ) 的符 1 号。 上述结论同样适用于多元回归模型。