第八章 模型中的特殊解释变量
模型中的特殊变量 计量经济学 EVIEWS建模课件
⒊随机解释变量的非平稳问题
由于时间序列经常出现非平稳现象,很容易 产生伪回归问题。
本节是在平稳的假设下来学习的,为了消除 时序固有的趋势性等非平稳特征,我们建议在模 型中都要引入时间变量。
有关非平稳时序的更复杂的情况,将在以后 的章节中介绍。
⒋ 时间变量作为解释变量
将被解释变量自身发展变化趋势,看作是时间 作用的结果时,即时间作为解释变量就叫做时间变 量,或叫趋势变量。一般以t为自然数来表示,也可 以让∑t=0,用正负整数两表示。
而图中的PAC和第二列的图示,是对偏自相关 函数的估计和描绘。因AR过程和ARMA过程中的 AR部分分量的偏相关系数具有p阶结尾的特征, 所以该图也是判断阶数p的依据。
自相关图中的检验信息 第一,估计的自相关函数的方差近似为T-1。所 以在观察相关图时,若估计的ACk的绝对值超过2个标 准差(2 T-1/2),就被认为是显著地不为零。如图中的虚 线就是两倍的标准差的位置,只要图中的横柱不超 出虚线,就可以认为不显著。 第二,可以正态近似,因当T充分大时,近似有: (ACk -0) / T-1/2 =ACk T1/2 ~ N (0, 1) 第三,Q统计量及其概率是在不相关的原假设下 计算的,即所列概率反映着“不相关”的可能性。
⒉ 变量的多重共线性问题 多重共线性是指模型中的部分解释变量之间, 存在着高度的线性相关性问题。如果是完全的线性 相关则无法求解模型的参数,即使是一定程度的线 性相关,又没有必要将其同时全部纳入模型之中。
⒊ 变量的协整均衡问题 回归分析要求各变量之间的平稳的序列,如果 参与回归的各元素有非平稳现象存在,则很可能产 生伪回归问题,除非它有长期的均衡规律存在。
互相 关图是在 序列组对 象的View 下选择: Cross corr -elogram 得到的。
8-3、模型中的特殊解释变量:虚拟变量
2016/3/29
1
8.3、 虚拟变量(Dummy variables)
8.3.1、.虚拟变量的概念
在回归分析中,常常碰到这样一种情况,即因变量 的波动不仅依赖于那种能够很容易按某种尺度定量化的 变量(如收入、产出、价格、身高、体重等),而且依 赖于某些定性的变量(如性别、地区、季节等)。 在经济系统中,许多变动是不能定量的。如政府的更 迭(工党 - 保守党)、经济体制的改革、固定汇率变为 浮动汇率、从战时经济转为和平时期经济等。 这样一些变动都可以用 0-1 变量来表示,用 1 表示具有 某一“品质”或属性,用0表示不具有该“品质”或属 性。这种变量在计量经济学中称为“虚拟变量”。虚拟 变量使得我们可以将那些无法定量化的变量引入回归模 型中。
2016/3/29 2
下面给出几个可以引入虚拟变量的例子。 例1:你在研究学历和收入之间的关系,在你的样 本中,既有女性又有男性,你打算研究在此关系中, 性别是否会导致差别。 例2:你在研究某省家庭收入和支出的关系,采集 的样本中既包括农村家庭,又包括城镇家庭,你打 算研究二者的差别。 例3:你在研究通货膨胀的决定因素,在你的观测 期中,有些年份政府实行了一项收入政策。你想检 验该政策是 否对通货膨胀产生影响。 上述各例都可以用两种方法来解决,一种解决方 法是分别进行两类情况的回归,然后检验参数是否 不同。另一种方法是用全部观测值作单一回归,将 定性因素的影响用虚拟变量引入模型。
女1 0 女2 0 男2 1 女3 0 男3 1 男4 1 女4 0 女5 0
21.2
男5 1
试建立模型研究之。
2016/3/29
9
4、虚拟变量在分段回归中的应用
2016/3/29
计量经济学课后习题答案第八章_答案
第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。
解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
计量经济学-第八章-模型中的特殊解释变量
E[( X
i
X )ui ]
1 1 1 [ E ( X i ui ) X E (ui )] 1 [0 0] 1 2 2 xi xi
第一节 随机解释变量
当 X j 与随机误差项
u 不独立,也不相关时,即
ˆ 1 依
Cov( X j , u) 0,则最小二乘估计量是有偏的,但
其中, X b1 表示结构发生变化时( t b1 )的 X t 值。
0, (1 t b1 ) D1 0 E(Yt ) 0 1 X t D1 1, (b1 t T ) D1 1 E(Yt ) ( 0 2 X b1 ) (1 2 ) X t
D 0 (女性)
Yi 0 1 X1i 2 X 2i 3 X 3i 4 D ui
第三节 虚拟变量
2. 虚拟变量的引入 当一个定性变量含有多种类别时,如“学历”变量 包括大学学历、中学学历、小学学历、无学历。此 时,应向模型中引入三个虚拟变量,取值方式为:
1 D1 0 (大学学历 ) 1 D2 (非大学学历 ) 0
第三节 虚拟变量
5 引入虚拟变量的作用三:测度结构突变 两个突变点时的模型如下:
Yt 0 1 X t 2 ( X t X b1 ) D1 3 ( X t X b 2 ) D2 ut
t b1 ,b2为回归函数发生突变的两个时间点。
0, (1 t b1 ) D1 1, (b1 t T ) 0, (1 t b2 ) D2 1, (b2 t T )
(11.0)
ˆ Yi 0.5667 0.0963X i
(3.5) (11.6) R 2 0.88, DW 1.85
第五章虚拟变量-第八章虚拟变量
说明虚拟解释变量 D1,D2,D3,D4 存在完全的多重共线性 从而无法用普通最小二乘法进行估计。 反映季节因素的商品需求模型为:
Yt 0 1 X 1t 2 X 2t 3 D1t 4 D2t 5 D3t t
例3、由经济实际得知,出口消费品数量Y 主要取决于国民支出X,我国革新开放前 后出口消费品的数量发作清楚变化,以 1979年为转机期,树立出口消费品需求 模型,并反映这种变化。
Yt 0 1 X i i
式中,Y 是职工工资收入;X 是工龄 考虑职工收入受教育程度的影响而引入合适的虚拟 变量,对上述模型加以改进。
解:教育程度一般分为:高中以下,高中,大学及以上(包括大专) 这样教育程度有三个特征,故引入两个虚拟变量,并设教育程度的 改变,只影响截距的变动。
D1=
1, 0,
Yt 0 1 X t t
1979 年以后,Dt 为 1, 模型为
Yt
0
2X
* t
1 2 X t t
第5章习题
一、单项选择题 1、假设一个回归模型中不包括截距项,对一个
具有m个特征的质的要素需求引入的虚拟变量 的个数为: A、m B、m-1 C、m-2 D、m+1
2、设团体消费函数Yi=c0+c1Xi+ui中,消费支出Y不只 与支出X有关,而且与消费者的性别、年龄构成有关, 年龄构成可分为青年、中年和老年三个层次,假定边 沿消费倾向不变,那么思索上述要素的影响,该函数 引入虚拟变量的个数为:
的需求模型为: Yt 0 1 X 1t 2 X 2t t
式中,Y 是商品的需求量,X1 是价格,X2 时收入, 为了反映四个季节对商品需求量的影响,假定引入四个虚拟变量:
8第八章:多重共线性及其改进方法
( X ' X kI ) X ' Y
1
^
Y 0 1 X1 2 X 2 3 X 3 4 X 4 5 X 5 6 X 6
共线性
Ridge Regression Syntax
岭回归程序路径
INCLUDE 'C:\Users\Administrator\Desktop\Ridge regression.sps'. ridgereg enter=x1 x2 x3 x4 x5 解释变量 被解释变量 /dep=y /inc=0.01.
统计方法
Y 0 1Z1 2 Z2
因子分析
岭回归
岭回归是一种专门用于共线性数据分析的有偏估计 回归方法,它实际上是一种改良的最小二乘法,以放
弃最小二乘的无偏性,损失部分信息,放弃部分精确
度为代价来寻求效果稍差但更符合实际的回归方程。
^
( X ' X ) X 'Y
1
事实上,并没有度量多重共线性的单一方法,这是因为对 于非实验数据,无法确定共线性的性质和程度。
判断存在多重共线性的经验法则:
典型特征
1.R2较高但解释变量t值统计显著的不多;
2.解释变量两两高度相关;
3.检查偏相关系数; 4.方差膨胀因子; 5.条件指数; 6.从属回归或辅助回归。
超过0.8
多解释变量
产生影响。同样地,被解释变量当前的变化也可能受其 自身过去水平的影响,这种被解释变量受到自身或另一 种解释变量的前几期值影响的现象称为滞后效应。
(2)滞后变量模型 以滞后变量作为解释变量的模型即为滞后变量模型。
Yt 0 1Yt 1 2Yt 2 qYt q 0 X t 1 X t 1 s X t s t
计量经济学复习
第二章 一元线性回归模型1.随机误差项形成的原因:① 在解释变量中被忽略的因素 ② 变量观测值的观测误差 ③ 模型的关系误差或设定误差 ④ 其他随机因素的影响。
2.总体回归方程和样本回归方程的区别和联系:总体回归方程是对总体变量间关系的定量表述,条件均值E(Y|X=x)是x 的一个函数 ,记作:E(Y|X=x)=f(x),其中,f(x)为x 的某个函数 ,它表明在X=x 下,Y 的条件均值与x 之间的关系。
但实际中往往不可能得到总体的全部资料 ,只能先从总体中抽取一个样本,获得样本回归方程 ,并用它对总体回归方程做出统计推断。
通过样本回归方程按照一定的准则近似地估计总体回归方程 ,但由于样本回归方程随着样本的不同而有所不同,所以这种高估或低估是不可避免的。
3.随机误差项的假定条件:(1)零均值:随机误差项具有零均值,即E( )=0,i=1,2,… (2)随机误差项具有同方差: 即每个 对应的随机误差项 具有相同的常数方差。
Var( )=Var( )= ,i=1,2,… (3)无序列相关:即任意两个 和 所对应的随机误差项 、 是不相关的。
Cov( , )=E( )=0,i j,i,j=1,2,… (4)解释变量X 是确定性变量,与随机误差项不相关。
Cov( , )=E( )=0,此假定保证解释变量X 是非随机变量。
(5) 服从正态分布, ~N(0, )4.为什么用决定系数 评价拟合优度,而不用残差平方和作为评价标准?判定系数 = = 1- ,含义为由解释变量引起的被解释变量的变化占被解释变量总变化的比重,用来判定回归直线拟合的优劣。
该值越大说明拟合得越好。
而残差平方和值的大小受变量值大小的影响,不适合具有不同量纲的模型的比较。
5.可决系数 说明了什么?在简单线性回归中它与斜率系数的t 检验的关系是什么?可决系数 是对模型拟合优度的综合度量 ,其值越大,说明在Y 的总变差中由模型作出了解释的部分占得比重越大 ,模 型的拟合优度越高 ,模型总体线性关系的显著性越强。
《计量经济学》课程教学大纲
《计量经济学》课程教学大纲英文名称:Econometric课程代码:221102004课程类别:专业核心课课程性质:必修开课学期:第四学期总学时:54(讲课:36,实验0,实践18,网络0)总学分:3考核方式:作业先修课程:高等数学、微观经济学、宏观经济学、统计学适用专业:经济学一、课程简介《计量经济学》是经济学专业的一门专业核心课程。
本课程以高等数学、宏微观经济学、统计学为先修课程,系统讲授计量经济学的基础理论、一元和多元线性回归模型、非线性回归模型的线性化、异方差、自相关、多重共线性、模型中特殊的解释变量以及Eviews基础操作等内容,为全国大学生市场调查与分析大赛以及毕业论文作理论与实践兼具的准备。
该课程分别从理论授课、软件学习以及团队实训等三个维度全面提高学生的思想水平、政治觉悟、道德品质及文化素养,重点培养学生经济学专业知识与技能,使其具有较为扎实的专业知识储备、数据分析的能力、实践与创新能力。
二、课程目标及其对毕业要求的支撑总体目标:全面提高学生的政治素养和道德品质,重点培养学生经济统计专业知识与技三、课程内容及要求第一章绪论教学内容:第一节计量经济学的定义与类型1.计量经济学的定义2.计量经济学的类型第二节计量经济学的特征1.经典计量经济学在理论方法方面特征2.经典计量经济学在应用方法方面特征第三节计量经济学的目的及研究问题的步骤1.计量经济学的目的2.计量经济学研究问题的步骤3.Eviews软件介绍学生学习预期成果:1.理解计量经济学的含义2.理解计量经济学的类型与特征3.了解计量经济学的目的及研究问题的步骤4.了解Eviews软件并下载安装成功教学重点:计量经济学的含义;计量经济学研究问题的步骤;Eviews软件介绍。
教学难点:计量经济学的含义;计量经济学研究问题的步骤。
第二章一元线性回归模型教学内容:第一节模型的建立及其假定条件1.回归分析的概念2.一元线性回归模型的介绍3.随机误差项的假定条件第二节一元线性回归模型的参数估计1.普通最小二乘法的概念2.参数估计第三节最小二乘估计量的统计性质1.线性性2.无偏性3.最小方差性第四节用样本可决系数检验回归方程的拟合优度1.总离差平方和的分解2.样本可决系数及相关系数第五节回归系数估计值的显著性检验与置信区间1.随机变量u的方差2.t检验3.置信区间第六节一元线性回归方程的预测1.点预测2.区间预测第七节案例分析1.用Eviews软件研究分析我国城镇居民年人均可支配收入与年人均消费性支出之间的关系学生学习预期成果:1.掌握回归分析的概念2.掌握随机误差项的假定条件3.掌握一元线性回归模型的参数估计4.熟悉最小二乘估计量的统计性质5.掌握用样本可决系数检验回归方程的拟合优度6.掌握回归系数估计值的显著性检验7.掌握Eviews软件的基础操作教学重点:回归分析的概念;随机误差项的假定条件;一元线性回归模型的参数估计;Eviews软件的基础操作。
8第八章 多重共线性:解释变量相关会有什么后果
H0 : B4 B5 0
作业 做在书上:8.1~8.12; 自行思考、上机操作:8.14~8.18、
P95:4.18
Variable C GPA GMAT EMPGRAD TUITION RECRUITER R-squared Adjusted Rsquared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
418通常物流需求是指一定时期内社会经济活动对生产流通消费领域的原材料成品和半成品商品以及废旧物品废旧材料等的配置作用而产生的对物品在空间时间作业量和费用方面的要求涉及运输库存包装装卸搬运流通加工以及与之相关的信息需求等物流活动的诸方面
第二部分
实践中的回归分析
基本假定违背:不满足基本假定的情况。
(1)模型设定有偏误;所选模型是正确设定的 基本假定 所选模型是正确设定的
5、OLS估计量及其标准误对数据的微小变化非常敏感。 6、回归系数的符号有误。 不能通过经济意义的检验。 7、难以评估各个解释变量对ESS或R2的贡献。
5、OLS估计量及其标准误对数据的微小变化非常敏感。
7、难以评估各个解释变量对ESS或R2的贡献。
补充:产生多重共线性的主要原因(了解)
(1)经济变量相关的共同趋势
Y:饰品需求 X2:价格 X3:消费者收入 X4:消费者工资
Yi A1 A2 X 2i A3 X 3i ui Yi B1 B2 X 2i B4 X 4i ui
Yi A1 A2 X 2i A3 X 3i ui X 3i 300 2 X 2i ; R2 1
Rj•2:第j个解释变量对其他解释变量的回归方程的判定系数
计量经济学第八章完整课件
对于矩阵形式: Y=X+
采用工具变量法(假设X2与随机项相关,用工具 变量Z替代)得到的正规方程组为:
ZY ZXβ
参数估计量为:
β~ (ZX)1 ZY
其中
1 1
X
11
X 12
Z
Z1
Z2
X k1 X k 2
1
X
1n
Zn
X kn
称为工具变量矩阵
3、工具变量法估计量是一致估计量
工具变量法是GMM的一个特例。 6、要找到与随机扰动项不相关而又与随机解释 变量相关的工具变量并不是一件很容易的事
可以用Xt-1作为原解释变量Xt的工具变量。
五、案例——中国居民人均消费函数
例4.4.1 在例2.5.1的中国居民人均消费函数的估 计中,采用OLS估计了下面的模型:
CONSP 0 1GDPP
通常把这种过去时期的,具有滞后作用的变量 叫做滞后变量(Lagged Variable),含有滞后变量 的模型称为滞后变量模型。
滞后变量模型考虑了时间因素的作用,使静态 分析的问题有可能成为动态分析。含有滞后解释变 量的模型,又称动态模型(Dynamical Model)。
1、滞后效应与与产生滞后效应的原因
Cov( X 2i, i ) E(x2i i ) 0 Cov( X 2i, is ) E(x2i is ) 0
s0
3. 随机解释变量与随机误差项同期相关 (contemporaneously correlated)。
Cov( X 2i, i ) E(x2i i ) 0
二、实际经济问题中的随机解释变量问题
第一步,用OLS法进行X关于工具变量Z的回归:
Xˆ i ˆ0 ˆ1Zi
第八章8.2一元线性回归模型及其应用PPT课件(人教版)
三、非线性回归
例3 下表为收集到的一组数据: x 21 23 25 27 29 32 35 y 7 11 21 24 66 115 325 (1)作出x与y的散点图,并猜测x与y之间的关系;
解 作出散点图如图,从散点图可以看出x 与y不具有线性相关关系,根据已有知识可 以发现样本点散布在某一条指数函数型曲线 y=c1ec2x的周围,其中c1,c2为待定的参数.
年份
2015 202X 202X 202X 202X
时间代号t
1
2
3
4
5
储蓄存款y(千亿元) 5
6
7
8
10
(1)求 y 关于 t 的经验回归方程y^=b^ t+a^ ;
n
tiyi-n t y
i=1
参考公式:b^ =
n
t2i -n
t2
,a^ =
y
-b^
t
i=1
解 由题意可知,n=5, t =1nn ti=155=3, i=1
来比较两个模型的拟合效果,R2 越 大 ,模型
n
yi- y 2
i=1
拟合效果越好,R2 越 小 ,模型拟合效果越差.
思考 利用经验回归方程求得的函数值一定是真实值吗? 答案 不一定,他只是真实值的一个预测估计值.
思考辨析 判断正误
SI KAO BIAN XI PAN DUAN ZHENG WU
知识点四 对模型刻画数据效果的分析
1.残差图法
在残差图中,如果残差比较均匀地集中在以 横轴为对称轴的水平带状
区域内 ,则说明经验回归方程较好地刻画了两个变量的关系.
2.残差平方和法
n
(yi-y^i)2
残差平方和 i=1
第八章 (1) 离散和受限被解释变量模型
SC -2 -2 -2 -2 -2 -2 -2 -1 0 -2 -1 0 -2 0 -1 1 1 1 -1 -1 1 1 1 1 -1 0
JGF 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.9979 0.0000 0.0000 1.0000 0.0000 0.0000 0.0000 0.9998 0.9999 1.0000 0.4472 0.0000 0.0000 1.0000 1.0000 0.9999 0.0000 0.0000
• 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
二、二元离散选择模型
1、原始模型
• 对于二元选择问题,可以建立如下计量经济学模 型。其中Y为观测值为1和0的决策被解释变量;X 为解释变量,包括选择对象所具有的属性和选择 主体所具有的属性。
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i
i
i
q i f (q i X i ) Xi F (q i X i ) i 1
n i 1
n
n
• 在样本数据的支持下,如果知道概率分布函数 和概率密度函数,求解该方程组,可以得到模 型参数估计量。
三、二元Probit离散选择模型及其参数 估计
1、标准正态分布的概率分布函数
F (t )
t
(2 )
12
exp( x 2 2)dx
f ( x) (2 )
模型中的特殊解释变量
Yt = + 0 Xt + 1 Yt-1 + …+ m Yt-m+ ut
可以用OLS法估计参数,为有偏、一致估计量。最大滞后阶数由AIC、SC 准则决定。
(3)自回归分布滞后模型
D2
1, (第2季度) 0,(其他季度)
D3
10,,((其第他3季季度度))D4
10,,((其第他4季季度度))DT10, ,119999m 810m ~~1219090m724m4
8.4 虚拟变量
例3:香港季节GDP数据(千亿港元)的拟合(file:dummy6)
得估计结果如下:
GDP
t
=
1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4+1.8338DT-
销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下:
1,(第四季度)
1,(第三季度)
D1 0,(其他季度) D2 0,(其他季度)
1,(第二季度) D3 0,(其他季度)
8.4 虚拟变量 例8.4
(第2版第224页) (第3版第192页)
以时间 t 为解释变量(1982年1季度取t = 1)的煤销售量(Yi)模型估计结 果如下:
由于定性变量通常表示的是某种特征的有和无,所
以量化方法可采用取值为1或0。这种变量称作虚拟
变量(dummy variable),用D表示。虚拟变量应
用于模型中,对其回归系数的估计与检验方法和定
量变量相同。
(第2版教材第218页) (第3版教材第187页)
第8章特殊解释变量优秀课件
5.2 5.6 6.0 6.4 6.8 7.2 7.6 8.0 8.4 8.8 9.2
第 8 章 特殊解释变量
例 8-1 农业产值与耕地面积关系研究(file:5break5)
上式说明,在 1993 和 1998 年农业产值对耕地面积的弹性系数
没有发生明显的变化,当耕地面积增加 1%时,农业产值增加
0
1996.4
1
x8
0
0
0
1
1997.1
1
x9
1
0
0
0
…
…
…
…
…
…
…
D1
1, 0,
1季度 2,3,4季度
,
D2
1, 0,
2季度 1,3,4季度
,
D3
1, 0,
3季度 1,2,4季度
,
D4
1, 0,
4季度 1,2,3季度
。
则必有 D4 = 1 – (D1 + D2 + D3),即 D1, D2, D3, D4 存在函数关系,当把 D1 D4 同时引入回归 模型中,D1 + D2 + D3+ D4 =1 与解释变量数据矩阵 X 的第 1 列(单位列向量)完全相同, 从而导致 X 降秩,无法用最小二乘法估计回归系数。
之上。不同年份的观测值呈两组特征。可以考虑用虚拟变量区别两个不同年度的产值并建
立模型。定义若数据属于 1993 年,虚拟变量 D 等于 0;若数据属于 1998 年,虚拟变量 D
等于
1,即
D
0, 1,
1993。建立模型 1998
Lnyt
=
0
+
1
D
计量经济学(内蒙古大学) 第八章 经典单方程计量经济学模型:专门问题(滞后变量模型)
第四章: 经典单方程计量经济学模型: 专门问题(滞后变量模型)
经世致用 管人悟道
内蒙古大学经济管理学院
在许多情况下被解释变量Y 不仅受到同期的解
释变量Xt 的影响,而且和X的滞后值Xt-1, Xt-2 ,
…,有很强的相关性 。
例如,人们的储蓄和当期的收入以及过去几期的收 入有着很强的相关性;固定资产的形成不仅取决 于现期投资额而且还取决于前几个时期的投资额 的影响等。这样的社会现象还有很多,有经济方 面的,也有其它领域的,对这些问题进行讨论就
经世致用 管人悟道
6
内蒙古大学经济管理学院
一、分布滞后模型的概念及相关问题
于是,由该例可以得到以下消费函数关系式
Yt 常量 0.4 X t 0.3X t 1 0.2 X t 2 ut
式中, Y=消费支出,X=收入。该方程就 是一个分布滞后模型,它表示收入对消费的 影响分布于不同时期。
在经济活动中,某一个经济变量的影响不仅 取决于同期各种因素,而且也取决于过去时期的各 种因素,有时还受自身过去值的影响。例如,居民 现期消费水平,不仅受本期居民收入影响,同时受 到前几个时期居民收入的影响。
把这些过去时期的变量,称作滞后变量, 把那些包括滞后变量作为解释变量的模型称作 滞后解释变量模型。
经世致用 管人悟道
5
内蒙古大学经济管理学院
一、分布滞后模型的概念及相关问题
什么是分布滞后模型? 例如:消费者每年收入增加10000元,假如,该
消费者把各年增加的收入按照以下方式分配:当年
增加消费支出4000元,第二年再增加消费支出3000
元,第三年再增加消费支出2000元,剩下的1000元 作为储蓄。第三年的消费支出不仅取决于当年的收 入,还与第一年和第二年的收入有关。当然,还可 以和前面更多期有关。
第八章---回归方程的函数形式
第八章回归方程的函数形式回忆参数线性模型和变量线性模型(见5.4)。
我们所关注的是参数线性模型,而并不要求变量Y与X一定是线性的。
在参数线性回归模型的限制下,回归模型的形式也有多种。
我们将特别讨论下面几种形式的回归模型:(1) 对数线性模型(不变弹性模型)(2) 半对数模型。
(3) 双曲函数模型。
(4) 多项式回归模型。
上述模型的都是参数线性模型,但变量却不一定是线性的。
8.1 三变量线性回归模型以糖炒栗子需求为例,现在考虑如下需求函数:Y =2BiAX( 8 - 1 )此处变量Xi是非线性的。
但可将式( 8 - 1 )做恒等变换表示成另一种形式:lnYi= lnA+B2lnXi ( 8 - 2 )其中,ln表示自然对数,即以e为底的对数;令B1= lnA ( 8 - 3 )可以将式( 8 - 2 )写为:lnYi = B1 + B2lnXi ( 8 - 4 )加入随机误差项,可将模型( 8 - 4 )写为:lnYi = B1+B2lnXi+ui ( 8 - 5 )( 8 - 5 )是一个线性模型,因为参数B1和B2是以线性形式进入模型的;形如式( 8 - 5 )的模型称为双对数模型或对数-线性( log-linear )模型。
一个非线性模型可以通过适当的变换转变为线性(参数之间)模型的:令Yi* = lnYi ,Xi* = lnXi则( 8 - 5 )可写为:Yi* = B1 + B2 Xi* + ui ( 8 - 6 )这与前面讨论的模型相似:它不仅是参数线性的,而且变形后的变量Y*与X*之间也是线性的。
如果模型( 8 - 6 )满足古典线性回归模型的基本假定,则很容易用普通最小二乘法来估计它,得到的估计量是最优线性无偏估计量。
双对数模型(对数线性模型)的应用非常广泛,原因在于它有一个特性:斜率B2度量了Y对X的弹性。
如果Y代表了商品的需求量,X代表了单位价格, Y代表Y 的一个小的变动,∆X 代表X 的一个小的变动(∆Y /∆X 是dY/dX 的近似),E 是需求的价格弹性,定义弹性E 为: E= Y100/Y X100 / X= Y X Y X=斜率×Y X ( 8 - 7 )对于变形的模型(8 - 6) B2= Y ln Y X ln X*=* Y/Y Y X/ X YX X == 可得B2是Y 对X 的弹性。
中级计量经济学 第八章 非线性模型和质量属性模型
主要内容
非线性模型估计方法 二元因变量模型
Probit模型
Logit模型
Tobit模型
参数非线性
当模型为参数非线性形式时,需要利用非线性估 计技术。 非线性模型的一般形式为:
= f(Xt, b) + et, t = 1, …, T 式中f(.)为一个可微分的非线性函数,b为K×1未知参 数向量,X为K×T解释变量矩阵,e为服从正态分布的 误差项。
非线性最小二乘法
需要注意的是,非线性最小二乘法并不能够保证 收敛到最优解。
收敛速度缓慢
收敛到局部最优解
估计系数出现发散情况
在应用工作中,当遇到上述情况时,一种做法是 改变初始值,然后重新开始迭代过程。 利用现有的计算机能力和软件,对模型重复做估 计不会发生过高的费用,或要求过长的时间投入。
T
e
Yt f X t , b 2
2 2
2 2
相应的对数似然函数为: Yt f X t , b Yt f X t , b T T 2 LnL Ln2 Ln
2 2 T T SSE Ln2 Ln 2 2 2 2 2 2 2
CD函数是CES函数的一个特例(替代弹性=1)
非线性回归方程案例
例2:可变边际消费倾向宏观消费函数
CONSt b0 b1DYt b2 et
与该函数对应的边际消费倾向为:
dCONS MPC b1b 2 DY b 2 1 dDY
当b2>1时,边际消费倾向递增,反之递减。
b*是真实参数b的一致估计量 b*服从渐近正态分布(根据中心极限定理) 这两个结论与模型误差项et假定的分布无关
计量经济学第八章分布滞后模型
根据实际问题的特点、实际经验给各滞后变 量指定权数,滞后变量按权数线性组合,构成新 的变量。权数据的类型有:
•递减型: 即认为权数是递减的, X 的近期值对 Y 的 影响较远期值大。 如消费函数中,收入的近期值对消费的影 响作用显然大于远期值的影响。 例如:滞后期为 3的一组权数可取值如下: 1/2, 1/4, 1/6, 1/8
1.
滞后效应与与产生滞后效应的原因
因变量受到自身或另一解释变量的前几期值 影响的现象称为滞后效应。 表示前几期值的变量称为滞后变量。 如:消费函数 通常认为,本期的消费除了受本期的收入影 响之外,还受前1期,或前2期收入的影响: Ct=0+1Yt+2Yt-1+3Yt-2+t Yt-1,Yt-2为滞后变量。
该模型可用OLS法估计。假如参数估计结果为:
ˆ0
=0.5
ˆ 1 =0.8
则原模型的估计结果为:
0 .8 0 .8 Yˆ t 0 . 5 Xt X 2 4
t 1
0 .8 6
X
t2
0 .8 8
X
t3
0 .5 0 .4 X t 0 .2 X
t 1
0 . 133 X
①在解释变量x之后必须指定k和m的值,d为可选项, 不指定时取默认值0;1强制b0趋于0;2强制bk趋于0; 3强制两端趋于0。
②如果有多个具有滞后效应的解释变量,则分别用几 个PDL项表示;例如: LS Y C PDL(x1,4,2) PDL(x2,3,2,2) ③在估计分布滞后模型之前,最好使用互相关分析命 令CROSS初步判断滞后期的长度k; 命令格式为: CROSS Y X 接着输入滞后期 p 之后,将输出 yt 与 xt , xt-1…xt-p的各期相关系数,以判断较为合适的滞后 期长度k。 例 表给出了中国电力基本建设投资X与发电 量Y的相关资料,拟建立一多项式分布滞后模型 来考察两者的关系。
第八章 模型中的特殊解释变量
一、随机解释变量 二、滞后变量问题 三、虚拟变量问题 四、时间变量
第一节
随机解释变量问题
一、估计量的渐近特征
1.渐进无偏性(P202) 所谓渐进分布是指,当样本容量N→∞时, 随机变量序列将收敛到某个特定的分布。 所谓渐进无偏性是指,如果当N→∞时, 参数估计量的数学期望值将趋向于总体参数 的真实值。这时,将参数估计量称为总体参 数的渐近无偏估计。
第三节 虚拟变量
一、虚拟变量的基本含义 许多经济变量(定量变量)是可以定量度量 的,如:商品需求量、价格、收入、产量等; 但是,经济中有一些影响经济变量的因素无 法定量度量(定性变量),如:职业、性别对收 入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并 提高模型的精度,需要将它们“量化”,这种 “量化”通常是通过引入“虚拟变量”来完成的。
一元回归中,工具变量法估计量为
1
~ z ( x ) z z x z x
i 1 i i i i 1 i i i
i
两边取概率极限得:
P lim(1 ) 1
~
P lim 1 n zi i P lim 1 n z i xi
如果工具变量Z选取恰当,即有
根据定性变量的属性类型,构造只取“0”或 “1”的人工变量,这些人工变量通常称为虚拟变量 (dummy variables),记为D。 • 例如,反映文程度的虚拟变量可取为: • 1, 本科学历 • D= • 0, 非本科学历 一般地,在虚拟变量的设置中: • 基础类型、肯定类型取值为1;
• 比较类型、否定类型取值为0。
四、工具变量法
模型中出现随机解释变量且它(们) 与随机误差项相关时,OLS估计量是有偏的。 此时,为了得到参数的无偏估计量,最常 用的估计方法是工具变量法(Instrument variables)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yt 0 X t 1 X t 1 2 X t 2 s X t s ut
具有这种滞后分布结构的模型称为分布滞后模型, 其中S为滞后长度。根据滞后长度S取为有限和 无限,模型分别称为有限分布滞后模型和无限 分布滞后模型。
T T ˆ ˆ X ) (Yt ˆt 0 u 0 1 t i 1 i 1 T T ˆ ˆ ˆt Z t 0 u (Yt 0 1 X t )Z t i 1 i 1
ˆ
1(IV ) =
( zt z )( yt y ) ( zt z )( xt x )
29
虚拟变量的定义
计量经济学中,将取值为0和1的人工变量称为虚 拟变量。虚拟变量也称:哑元变量、定性变量等 等。通常用字母D或DUM加以表示(英文中虚拟 或者哑元Dummy的缩写)。 对定性变量的量化可采用虚拟变量的方式实现。
30
二、虚拟变量设置规则
虚拟变量的设置规则涉及三个方面: 1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量 数量的关系 3.虚拟变量在回归分析中的角色以及作用等 方面的问题
Z 0t X t X t 1 X t 2 X t s Z1t X t 1 2 X t 2 3 X t 3 sX t s Z 2t X t 1 22 X t 2 32 X t 3 s 2 X t s ... Z mt X t 1 2m X t 2 3m X t 3 s m X t s
i
s
个单位时,由于滞后效应而形成的对Y总的影响大小。
15
i= 0
分布滞后模型的估计
一、经验权数法
所谓经验权数估计法,是根据实际经济问题的特 点及经验判断,对滞后变量赋予一定的权数,利 用这些权数构成各滞后变量的线性组合,以形成 新的变量,再应用最小二乘法进行估计。
16
优点:简单易行、不损失自由度、避免多重共 线性干扰及参数估计具有一致性。
缺点:设置权数的主观随意性较大,要求分析 者对实际问题的特征有比较透彻的了解。通常 的做法是,依据先验信息,多选几组权数分别 估计多个模型,然后根据可决系数、F检验值、 t检验值、估计标准误以及DW值,从中选出最 佳估计方程。
17
例:已知1955—1974年期间美国制造业库存量 Y和销售额X的统计资料如下表(金额单位: 亿美元)。设定有限分布滞后模型为: 运用经验加权法,选择下列三组权数: (1)1,1/2,1/4,1/8 (2)1/4,1/2,2/3,1/4 (3)1/4,1/4,1/4,1/4 分别估计上述模型,并从中选择最佳的方程。
计量经济学
第八章
模型中的特殊解释变量
1
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校
生的消费行为呈现多元化的结构。人际交往消费、
手机类消费、衣着类消费、化妆品类消费、电脑类
消费、旅游类消费占有较大的比例;而食品类消费、
学习用品类消费不突显。
显然,男女生在消费上存在差异。为了了解男、女
ˆ 仍具有 相互独立,模型其他假定条件都(
(2)如果模型中的解释变量 X 是随机的,与误差项 u 不独立, 也不相关,模型其他假定条件都成立,的 OLS 估计量具有一致
ˆ 性。 p lim
T
(3)如果模型中的解释变量 X 是随机的,且与误差项 u 相关, Cov (X ' u ) 0,模型其他假定条件都成立,的 OLS 估计量不具 有无偏性,也不具有一致性。
12
滞后变量模型的一般形式为
Yt 0 X t 1 X t 1 2 X t 2 s X t s 1Yt 1 2Yt 2 qYt q ut
其中 s, q 分别为滞后解释变量和滞后被解释变 量的滞后期长度。
13
1.分布滞后模型
生的消费支出结构差异,应当如何建立模型?
面临的问题:如何把男女生这样的非数量变量引 入方程?
2
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要
影响。例如,研究某个企业的销售水平,产业属性
(制造业、零售业)、所有制(私营、非私营)、
地理位置(东、中、西部)、管理者的素质、不同
的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化一种思路。
则称这类模型为自回归模型,其中q称为自回归 模型的阶数。
27
第三节 虚拟变量
本节基本内容:
●基本概念 ●虚拟变量设置规则 ●虚拟解释变量的回归
28
一、基本概念
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的 非数值性的因素。
基本思想:
直接在回归模型中加入定性因素存在诸多的困难 (那些困难?),是否可将这些定性因素进行量 化,以达到定性因素能与定量因素有着相同作用 之目的。
22
二、阿尔蒙法
目的:消除多重共线性的影响。 基本原理:在有限分布滞后模型滞后长度S已
知的情况下,滞后项系数有一取值结构,把它 看成是相应滞后期i的函数。在以滞后期i为横 轴、滞后系数取值为纵轴的坐标系中,如果这 些滞后系数落在一条光滑曲线上,或近似落在 一条光滑曲线上,则可以由一个关于i的次数 较低的m次多项式很好地逼近,即
19
记新的线性组合变量分别为: 1 1 1 Z1 X t X t 1 X t 2 X t 3 2 4 8
1 1 2 1 Z 2 X t X t 1 X t 2 X t 3 4 2 3 4
1 1 1 1 Z 3 X t X t 1 X t 2 X t 3 4 4 4 4 由上述公式生成线性组合变量 z1 ,z2 ,z3 的数据。 然后分别估计如下经验加权模型。
14
在分布滞后模型中,各系数体现了解释变量的各个滞 后值对被解释变量的不同影响程度,即通常所说的乘 数效应: β0 :称为短期乘数或即期乘数,表示本期X变动 一个单位对Y值的平均影响大小; βi :称为延迟乘数或动态乘数,表示过去各时期 X变动一个单位对Y值的平均影响大小;
β :称为长期乘数或总分布乘数,表示X变动一
1965
1966 1967 1968 1969 1970 1971 1972 1973 1974
682.21
779.65 846.55 908.75 970.74 1016.45 1024.45 1077.19 1208.7 1471.35
410.03
448.69 464.49 502.82 535.55 528.59 559.17 620.17 713.98 820.98
18
1955—1974年期间美国制造业库存量Y和销售额X
年份 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 Y 450.69 506.42 518.7 500.7 527.07 538.14 549.39 582.13 600.43 633.83 X 264.8 277.4 287.36 272.8 302.19 307.96 308.96 331.13 350.32 373.35
20
回归分析结果整理如下 ˆ 66.60404 1.071502 Z 模型一: Y t 1t
(3.6633) (50.9191) R 2 0.994248 DW 1.440858 F 2592 ˆ = -133.1988 +1.3667 Z 模型二: Y t 2t (-5.029) (37.35852)
23
i 0 1i 2i mi
2
m
i 0,1, 2,, s ;
此式称为阿尔蒙多项式变换。
ms
24
将阿尔蒙多项式变换代入分布滞后模型并整理, 模型变为如下形式 Yt 0 Z0t 1Z1t 2 Z2t m Zmt ut 其中
R 2 = 0.989367 DW = 1.042935 F = 1396
21
ˆ 121.7394 2.23973 Z 模型三: Y t 3t (4.8131) (38.68578) R 2 0.990077 DW 1.15853 F 1496 从上述回归分析结果可以看出,模型一的扰动 项无一阶自相关,模型二、模型三扰动项存在一 阶正自相关;再综合判断可决系数、F 检验值、 t 检验值,可以认为:最佳的方程是模型一,即 权数为(1,1/2,1/4,1/8)的分布滞后模型。
3
第八章 模型中的特殊解释变量
本章主要讨论:
●随机解释变量(一般性了解)
●滞后变量(一般性了解)
●虚拟变量(重点)
●时间变量
4
第一节 随机解释变量
假定条件⑵规定解释变量是非随机的且与随机误差项相互独立, 即 E (X ' u ) = 0. (1)如果模型中的解释变量是随机的,但具有平稳性且与误差项
ˆ = (Z'X)-1 Z'Y
ˆ 的工具变量法估计量具有一致性。 p lim IV
T
7
例8.1 用最终消费C1对国内生产总值Y回归。假定Y与误差项u相关,但资 本总额K与误差项u不相关,用K作Y的工具变量。
工具变量法的EViews操作:打开模型估计对话窗,选TSLS估计法。在方 程设定区填入 C1 C Y 在工具变量列写区填入 C K, 点击确定键。
势往往会延续到本期,从而形成被解释变量的当期变化同 自身过去取值水平相关的情形。 这种被解释变量受自身或其它经济变量过去值影响的现象 称为滞后效应。