虚拟变量模型滞后变量模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 可以通过传统的回归检验,对2的统计显著性 进行检验,以判断企业男女职工的平均薪金
水平是否有显著差异。
年薪 Y
男职工
女职工
2
0
工龄 X
又例:在横截面数据基础上,考虑个人保 健支出对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上。
这时需要引入两个虚拟变量:
1 D1 0
将n1与n2次观察值合并,并用以估计以下回归:
Yi 0 1 X i 3 Di 4 (Di X i ) i
Di为引入的虚拟变量:
1 Di 0
90年前 90年后
于是有: E(Yi | Di 0, X i ) 0 1 X i
E(Yi | Di 1, X i ) ( 0 3 ) (1 4 ) X i
一、滞后变量模型
在经济运行过程中,广泛存在时间滞后 效应。某些经济变量不仅受到同期各种因素 的影响,而且也受到过去某些时期的各种因 素甚至自身的过去值的影响。
通常把这种过去时期的,具有滞后作用的 变量叫做滞后变量(Lagged Variable),含有 滞后变量的模型称为滞后变量模型。
滞后变量模型考虑了时间因素的作用,使 静态分析的问题有可能成为动态分析。含有滞 后解释变量的模型,又称动态模型 (Dynamical Model)。
其矩阵形式为:
Y (X,D)α β μ
如果只取六个观测值,其中春季与夏季取了 两次,秋、冬各取到一次观测值,则式中的:
1 1 (X,D) 1 1 11
X 11 X 12 X 13 X 14 X 15 X 16
X k1 X k2 X k3 X k4 X k5 X k6
1 0 0 0 0 1
E(Yi | X i , Di 0) 0 1 X i 企业男职工的平均薪金为:
E(Yi | X i , Di 1) ( 0 2 ) 1 X i 几何意义:
• 假定2>0,则两个函数有相同的斜率, 但有不同的截距。意即,男女职工平均薪金对 教龄的变化率是一样的,但两者的平均薪金水 平相差2。
2. 乘法方式
• 加法方式引入虚拟变量,考察:截距的不同。 • 许多情况下:往往是斜率就有变化,或斜率、
截距同时发生变化。 • 斜率的变化可通过以乘法的方式引入虚拟变量
来测度。
例:根据消费理论,消费水平C主要取决于收 入水平Y,但在一个较长的时期,人们的消费倾 向会发生变化,尤其是在自然灾害、战争等反常 年份,消费倾向往往出现变化。这种消费倾向的 变化可通过在收入的系数中引入虚拟变量来考察。
•男职工本科以下学历的平均薪金:
E(Yi | X i , D1 1, D2 0) (0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E(Yi | X i , D1 0, D2 1) (0 3 ) 1 X i
•男职工本科以上学历的平均薪金:
E(Yi | X i , D1 1, D2 1) (0 2 3 ) 1 X i
1979~2001 年中国居民储蓄与收入数据(亿元)
GNP
90年后
储蓄
4038.2
1991
9107
4517.8
1992
11545.4
4860.3
1993
14762.4
5301.8
1994
21518.8
5957.4
1995
29662.3
7206.7
1996
38520.8
8989.1
1997
46279.8
由3与4的t检验可知:参数显著地不等于0, 强烈示出R两2 个时期的回归是相异的,储蓄函数 分别为:
1990年前: 1990年后:
Yˆi 1649.7 0.4116Xi Yˆi 15452 0.8881Xi
3. 临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指 标的虚拟变量模型来反映。
• 高中: E(Yi | X i , D1 1, D2 0) (0 2 ) 1 X i
• 大学及其以上: E(Yi | X i , D1 0, D2 1) (0 3 ) 1 X i
假定3>2,其几何意义:
保健 支出
大学教育 高中教育
低于中学教育
收入
• 还可将多个虚拟变量引入模型中以考察多种 “定性”因素的影响。
0, 非本科学历
• 一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1; • 比较类型,否定类型取值为0。
概念:
同时含有一般解释变量与虚拟变量的模 型称为虚拟变量模型或者方差分析(analysisof variance: ANOVA)模型。
一个以性别为虚拟变量考察企业职工薪 金的模型:
Yi 0 1 X i 2 Di i
可分别表示1990年后期与前期的储蓄函数。
在统计检验中,如果4=0的假设被拒绝, 则说明两个时期中储蓄函数的斜率不同。
• 具体的回归结果为:
Yˆi 15452 0.8881Xi 13802.3Di 0.4765Di Xi
(-6.11) (22.89) (4.33) (-2.55) =0.9836
1. 滞后效应与与产生滞后效应的原因 因变量受到自身或另一解释变量的前几期值
影响的现象称为滞后效应。 表示前几期值的变量称为滞后变量。
如:消费函数 通常认为,本期的消费除了受本期的收入影
响之外,还受前1期,或前2期收入的影响:
Ct=0+1Yt+2Yt-1+3Yt-2+t Yt-1,Yt-2为滞后变量。
如,设
1 正常年份 Dt 0 反常年份
消费模型可建立如下:
Ct 0 1 X t 2 Dt X t t
• 这里,虚拟变量D以与X相乘的方式引入了模型中, 从而可用来考察消费倾向的变化。
• 假定E(i)= 0,上述模型所表示的函数可化为:
正常年份:
E(Ct | X t , Dt 1) 0 (1 2 ) X t
以Y为储蓄,X为收入,可令:
• 1990年前: Yi=1+2Xi+1i
i=1,2…,n1
• 1990年后: Yi=1+2Xi+2i
i=1,2…,n2
则有可能出现下述四种情况中的一种:
(1) 1=1 ,且2=2 ,即两个回归相同,称为重 合回归(Coincident Regressions);
(2) 11 ,但2=2 ,即两个回归的差异仅在其截 距,称为平行回归(Parallel Regressions);
• 产生滞后效应的原因
1. 心理因素:人们的心理定势,行为方式 滞后于经济形势的变化,如中彩票的人不可能 很快改变其生活方式。
2. 技术原因:如 制度原因:如定期存款到期才能提取, 造成了它对社会购买力的影响具有滞后性。
2. 滞后变量模型 以滞后变量作为解释变量,就得到滞后变
反常年份:
E(Ct | X t , Dt 0) 0 1 X t
当截距与斜率发生变化时,则需要同时引入 加法与乘法形式的虚拟变量。
• 例5.1.1,考察1990年前后的中国居民的总储蓄 -收入关系是否已发生变化。 表5.1.1中给出了中国1979~2001年以城乡 储蓄存款余额代表的居民储蓄以及以GNP代表 的居民收入的数据。
10201.4
1998
53407.5
11954.5
1999
59621.8
14922.3
2000
64332.4
16917.8
2001
73762.4
18598.4
GNP
21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73142.7 76967.2 80579.4 88228.1 94346.4
(3) 1=1 ,但22 ,即两个回归的差异仅在其斜 率,称为汇合回归(Concurrent Regressions);
(4) 11,且22 ,即两个回归完全不同,称为 相异回归(Dissimilar Regressions)。
可以运用邹氏结构变化的检验。这一问题也 可通过引入乘法形式的虚拟变量来解决。
高中 其他
1 D2 0
大学及其以上 其他
模型可设定如下:
Yi 0 1 X i 2 D1 3 D2 i 在E(i)=0 的初始假定下,高中以下、高 中、大学及其以上教育水平下个人保健支出的 函数:
• 高中以下: E(Yi | X i , D1 0, D2 0) 0 1 X i
1 春季 D1t 0 其他
1 夏季 D2t 0 其他
1 秋季 D3t 0 其他
则冷饮销售量的模型为: Yt 0 1 X1t k X kt 1D1t 2 D2t 3 D3t t 在上述模型中,若再引入第四个虚拟变量:
1 冬季 D4t 0 其他
则冷饮销售模型变量为:
Yt 0 1 X1t k X kt 1D1t 2 D2t 3 D3t 4 D4t t
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
二、虚拟变量的引入
虚拟变量做为解释变量引入模型有两种基 本方式:加法方式和乘法方式。 1. 加法方式
上述企业职工薪金模型中性别虚拟变量的 引入采取了加法方式。
在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为:
0 1 0 0 1 0
0 0 1 0 0 0
0 0
0
1
0 0
0
β
1
k
1
α
2 3 4
显然,(X,D)中的第1列可表示成后4列的线性 组合,从而(X,D)不满秩,参数无法唯一求出。
这就是所谓的“虚拟变量陷阱”,应避免。
§5.2 滞后变量模型
一、滞后变量模型 二、分布滞后模型的参数估计 三、自回归模型的参数估计 四、格兰杰因果关系检验
例如,进口消费品数量Y主要取决于国民 收入X的多少,中国在改革开放前后,Y对X的 回归关系明显不同。
这时,可以t*=1979年为转折期,以1979 年的国民收入Xt*为临界值,设如下虚拟变量:
1 t t* Dt 0 t t *
则进口消费品的回归模型可建立如下:
Yt
0
1X t
2(Xt
X
* t
如在上述职工薪金的例中,再引入代表学 历的虚拟变量D2:
1 本科及以上学历 D2 0 本科以下学历
职工薪金的回归模型可设计为: Yi 0 1 X i 2 D1 3 D2 i
于是,不同性别、不同学历职工的平均薪金分别为:
•女职工本科以下学历的平均薪金:
E(Yi | X i , D1 0, D2 0) 0 1 X i
)Dt
t
OLS法得到该模型的回归方程为:
Yˆt
ˆ0
ˆ1 X t
ˆ2 (X t
X
* t
)Dt
则两时期进口消费品函数分别为:
当t<t*=1979年, Yˆt ˆ0 ˆ1Xt
当tt*=1979年,
Yˆt
(ˆ0
ˆ
2
X
* i
)
(
ˆ1
ˆ2 )X t
三、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定: 每一定性变量所需的虚拟变量个数要比该定 性变量的类别数少1,即如果有m个定性变量,只 在模型中引入m-1个虚拟变量。 例。已知冷饮的销售量Y除受k种定量变量Xk 的影响外,还受春、夏、秋、冬四季变化的影响, 要考察该四季的影响,只需引入三个虚拟变量即 可:
第五章 经典单方程计量经济学模型: 专门问题
• 虚拟变量
• 滞后变量 • 设定误差 • 建模理论
§5.1 虚拟变量模型
一、虚拟变量的基本含义 二、虚拟变量的引入 三、虚拟变量的设置原则
一、虚拟变量的基本含义
• 许多经济变量是可以定量度量的,如:商品需 求量、价格、收入、产量等。
• 但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾 害对GDP的影响,季节对某些产品(如冷饮) 销售的影响等等。
• 为了在模型中能够反映这些因素的影响,并提 高模型的精度,需要将它们“量化”。
这种“量化”通常是通过引入“虚拟变量” 来完成的。根据这些因素的属性类型,构造只取 “0”或“1”的人工变量,通常称为虚拟变量 (dummy variables),记为D。
• 例如,反映文程度的虚拟变量可取为:
1, 本科学历 D=
90年前 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990
表 5.1.1
储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2
相关文档
最新文档