5.1 第五章 经典单方程计量经济学模型(虚拟变量)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ ˆ ˆ 当t<t*=1979年, Yt 0 1 X t
当tt*=1979年,
ˆ ˆ ˆ ˆ ˆ Yt ( 0 2 X i* ) ( 1 2 ) X t
又例:在横截面数据基础上,考虑个人保健支出 对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 D1 0 高中 其他 1 D2 0 大学及其以上 其他
模型可设定如下: Yi 0 1 X i 2 D1 3 D2 i
• 加法方式引入虚拟变量,考察:截距的不同, • 许多情况下:往往是斜率就有变化,或斜率、截 距同时发生变化。 • 斜率的变化可通过以乘法的方式引入虚拟变量来 测度。 例:根据消费理论,消费水平C主要取决于收入水 平Y,但在一个较长的时期,人们的消费倾向会发生 变化,尤其是在自然灾害、战争等反常年份,消费 倾向往往出现变化。这种消费倾向的变化可通过在 收入的系数中引入虚拟变量来考察。
• 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”,
这种“量化”通常是通过引入“虚拟变量”来 完成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。
• 例如,反映文程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历
企业越来越在为“有效工作年资”的增长来付薪
本科学历的起薪与高学历者相差有限,但 领跑于低学历者
于是,不同性别、不同学历职工的平均薪金分别为: •女职工本科以下学历的平均薪金:
E(Yi | X i , D1 0, D2 0) 0 1 X i
•男职工本科以下学历的平均薪金:
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
二、虚拟变量的引入
• 虚拟变量做为解释变量引入模型有两种基本方式: 加法方式和乘法方式。
1、加法方式
上述企业职工薪金模型中性别虚拟变量的引入采 取了加法方式。 在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为: E(Yi | X i , Di 0) 0 1 X i 企业男职工的平均薪金为: E(Yi | X i , Di 1) ( 0 2 ) 1 X i
百度文库
GNP 21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73142.7 76967.2 80579.4 88228.1 94346.4
以Y为储蓄,X为收入,可令:
• 1990年前: Yi=1+2Xi+1i i=1,2…,n1
• 1990年后: Yi=1+2Xi+2i i=1,2…,n2 则有可能出现下述四种情况中的一种: (1) 1=1 ,且2=2 ,即两个回归相同,称为重合回 归(Coincident Regressions); (2) 11 ,但2=2 ,即两个回归的差异仅在其截距, 称为平行回归(Parallel Regressions); (3) 1=1 ,但22 ,即两个回归的差异仅在其斜率, 称为汇合回归(Concurrent Regressions); (4) 11,且22 ,即两个回归完全不同,称为相 异回归(Dissimilar Regressions)。
如,设
1 Dt 0
正常年份 反常年份
消费模型可建立如下:
Ct 0 1 X t 2 Dt X t t
• 这里,虚拟变量D以与X相乘的方式引入了模型中, 从而可用来考察消费倾向的变化。 • 假定E(i)= 0,上述模型所表示的函数可化为:
正常年份:
E(Ct | X t , Dt 1) 0 ( 1 2 ) X t
t t* t t
*
则进口消费品的回归模型可建立如下:
Yt 0 1 X t 2 ( X t X t* )Dt t
OLS法得到该模型的回归方程为
ˆ ˆ ˆ ˆ Yt 0 1 X t 2 ( X t X t* )Dt
则两时期进口消费品函数分别为:
1 D2 0
本科及以上学历
本科以下学历
职工薪金的回归模型可设计为:
Yi 0 1 X i 2 D1 3 D2 i
薪酬报告:本科学位成分水岭 2009年12月10日 07:48解放网-新闻晨报 http://finance.ifeng.com/job/zcgs/20091210/1564782.shtml
Yi 0 1 X i 2 Di i
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
虚拟变量模型的定义
引入虚拟解释变量后,回归方程中同时含有一 般解释变量和虚拟变量,称这种变量结构的模 型为虚拟变量模型(或斜方差分析模型) 。 虚拟变量作因变量的模型又称抉择模型。
1979~2001 年中国居民储蓄与收入数据(亿元) GNP 90年后 储蓄 4038.2 1991 9107 4517.8 1992 11545.4 4860.3 1993 14762.4 5301.8 1994 21518.8 5957.4 1995 29662.3 7206.7 1996 38520.8 8989.1 1997 46279.8 10201.4 1998 53407.5 11954.5 1999 59621.8 14922.3 2000 64332.4 16917.8 2001 73762.4 18598.4
虚拟变量作为因变量引入,D也只取1或0,不能用
OLS方法进行估计抉择模型,但是可以采用Logit方法 或Probit方法估计模型。例如,D=1(Clinton被罢免), D=0(Clinton不被罢免)。估计得到的模型,将给出 D=1或D=0的概率。
模型中引入虚拟变量的作用
(1)分离异常因素的影响,例如分析我国GDP的 时间序列,必须考虑“文革”因素对国民经济的 破坏性影响,剔除不可比的“文革”因素。 (2)检验不同属性类型对因变量的作用,例如工 资模型中的文化程度、季节对销售额的影响。 (3)提高模型的精度,相当于将不同属性的样本 合并,扩大了样本容量(增加了误差自由度,从 而降低了误差方差)。
反常年份:
E(Ct | X t , Dt 0) 0 1 X t
加法与乘法组合引入———截 距与斜率均不同
设定模型 Y=b0+ b1X+ b2D + b3DX +u
1, 异常时期 D 0,正常时期
• 异常时期模型:(截距与斜率均不同) Y= (b0 + b2) + (b1 +b3)X +u • 正常时期模型: Y= b0 + b1 X +u
• 大学及其以上: E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i 假定3>2,其几何意义:
大学教育 保健 支出 高中教育 低于中学教育
收入
• 还可将多个虚拟变量引入模型中以考察多种“定 性”因素的影响。
如在上述职工薪金的例中,再引入代表学历的虚拟 变量D2:
几何意义:
• 假定2>0,则两个函数有相同的斜率,但有不同 的截距。意即,男女职工平均薪金对教龄的变化 率是一样的,但两者的平均薪金水平相差2。 • 可以通过传统的回归检验,对2的统计显著性进 行检验,以判断企业男女职工的平均薪金水平是 否有显著差异。
年薪 Y 男职工 女职工
2
0
工龄 X
E(Yi | Di 1, X i ) ( 0 3 ) ( 1 4 ) X i
可分别表示1990年后期与前期的储蓄函数。
在统计检验中,如果4=0的假设被拒绝,则说 明两个时期中储蓄函数的斜率不同。 • 具体的回归结果为: ˆ Yi 15452 0.8881 i 138023Di 0.4765 i X i X . D
3、临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指标的虚 拟变量模型来反映。 例如,进口消费品数量Y主要取决于国民收入X 的多少,中国在改革开放前后,Y对X的回归关系明 显不同。 这时,可以t*=1979年为转折期,以1979年的国 民收入Xt*为临界值,设如下虚拟变量:
1 Dt 0
在E(i)=0 的初始假定下,高中以下、高中、 大学及其以上教育水平下个人保健支出的函数:
• 高中以下: • 高中:
E(Yi | X i , D1 0, D2 0) 0 1 X i
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i
•男职工本科以上学历的平均薪金:
E(Yi | X i , D1 1, D2 1) ( 0 2 3 ) 1 X i
2、乘法方式
运用虚拟变量同时改变回归直 线的截距和斜率
D=1反常 Y=(b0+b2)+(b1+ b3)X+u Y=b0+b1X+b2D+b3DX+u
Y=b0+b1X+u 正常时期 D=0正常
当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。 • 例5.1.1,考察1990年前后的中国居民的总储蓄-收 入关系是否已发生变化。
表5.1.1中给出了中国1979~2001年以城乡储蓄存 款余额代表的居民储蓄以及以GNP代表的居民收入 的数据。
表 5.1.1 90年前 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2
(-6.11) (22.89) (4.33) (-2.55)
R 2 =0.9836
由3与4的t检验可知:参数显著地不等于0,强 烈示出两个时期的回归是相异的,
储蓄函数分别为:
1990年前:
ˆ Yi 16497 0.4116X i .
1990年后:
ˆ Yi 15452 0.8881 i X
一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1; • 比较类型,否定类型取值为0。
虚拟变量在模型种的地位
虚拟变量在模型中,可以作解释变量, 也可以作因变量。
虚拟变量作解释变量时出现在方程的右
端,虚拟变量作因变量(被解释变量)
时出现在方程的左端。
概念: 同时含有一般解释变量与虚拟变量的模型称为虚 拟 变 量 模 型 或 者 方 差 分 析 (analysis-of variance: ANOVA)模型。 一个以性别为虚拟变量考察企业职工薪金的模型:
第五章 经典单方程计量经济学 模型:专门问题
§5.1 §5.2
虚拟变量 滞后变量
§5.3
设定误差
§5.1 虚拟变量模型
一、虚拟变量的基本含义 二、虚拟变量的引入 三、虚拟变量的设置原则
一、虚拟变量的基本含义
• 许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等 • 但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾害 对GDP的影响,季节对某些产品(如冷饮)销售 的影响等等。
可以运用邹氏结构变化的检验。这一问题也可通过 引入乘法形式的虚拟变量来解决。 将n1与n2次观察值合并,并用以估计以下回归:
Yi 0 1 X i 3 Di 4 ( Di X i ) i
Di为引入的虚拟变量:
1 Di 0
90年前 90年后
于是有: E(Yi | Di 0, X i ) 0 1 X i
当tt*=1979年,
ˆ ˆ ˆ ˆ ˆ Yt ( 0 2 X i* ) ( 1 2 ) X t
又例:在横截面数据基础上,考虑个人保健支出 对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 D1 0 高中 其他 1 D2 0 大学及其以上 其他
模型可设定如下: Yi 0 1 X i 2 D1 3 D2 i
• 加法方式引入虚拟变量,考察:截距的不同, • 许多情况下:往往是斜率就有变化,或斜率、截 距同时发生变化。 • 斜率的变化可通过以乘法的方式引入虚拟变量来 测度。 例:根据消费理论,消费水平C主要取决于收入水 平Y,但在一个较长的时期,人们的消费倾向会发生 变化,尤其是在自然灾害、战争等反常年份,消费 倾向往往出现变化。这种消费倾向的变化可通过在 收入的系数中引入虚拟变量来考察。
• 为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”,
这种“量化”通常是通过引入“虚拟变量”来 完成的。根据这些因素的属性类型,构造只取“0” 或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。
• 例如,反映文程度的虚拟变量可取为: 1, 本科学历 D= 0, 非本科学历
企业越来越在为“有效工作年资”的增长来付薪
本科学历的起薪与高学历者相差有限,但 领跑于低学历者
于是,不同性别、不同学历职工的平均薪金分别为: •女职工本科以下学历的平均薪金:
E(Yi | X i , D1 0, D2 0) 0 1 X i
•男职工本科以下学历的平均薪金:
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
二、虚拟变量的引入
• 虚拟变量做为解释变量引入模型有两种基本方式: 加法方式和乘法方式。
1、加法方式
上述企业职工薪金模型中性别虚拟变量的引入采 取了加法方式。 在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为: E(Yi | X i , Di 0) 0 1 X i 企业男职工的平均薪金为: E(Yi | X i , Di 1) ( 0 2 ) 1 X i
百度文库
GNP 21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73142.7 76967.2 80579.4 88228.1 94346.4
以Y为储蓄,X为收入,可令:
• 1990年前: Yi=1+2Xi+1i i=1,2…,n1
• 1990年后: Yi=1+2Xi+2i i=1,2…,n2 则有可能出现下述四种情况中的一种: (1) 1=1 ,且2=2 ,即两个回归相同,称为重合回 归(Coincident Regressions); (2) 11 ,但2=2 ,即两个回归的差异仅在其截距, 称为平行回归(Parallel Regressions); (3) 1=1 ,但22 ,即两个回归的差异仅在其斜率, 称为汇合回归(Concurrent Regressions); (4) 11,且22 ,即两个回归完全不同,称为相 异回归(Dissimilar Regressions)。
如,设
1 Dt 0
正常年份 反常年份
消费模型可建立如下:
Ct 0 1 X t 2 Dt X t t
• 这里,虚拟变量D以与X相乘的方式引入了模型中, 从而可用来考察消费倾向的变化。 • 假定E(i)= 0,上述模型所表示的函数可化为:
正常年份:
E(Ct | X t , Dt 1) 0 ( 1 2 ) X t
t t* t t
*
则进口消费品的回归模型可建立如下:
Yt 0 1 X t 2 ( X t X t* )Dt t
OLS法得到该模型的回归方程为
ˆ ˆ ˆ ˆ Yt 0 1 X t 2 ( X t X t* )Dt
则两时期进口消费品函数分别为:
1 D2 0
本科及以上学历
本科以下学历
职工薪金的回归模型可设计为:
Yi 0 1 X i 2 D1 3 D2 i
薪酬报告:本科学位成分水岭 2009年12月10日 07:48解放网-新闻晨报 http://finance.ifeng.com/job/zcgs/20091210/1564782.shtml
Yi 0 1 X i 2 Di i
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
虚拟变量模型的定义
引入虚拟解释变量后,回归方程中同时含有一 般解释变量和虚拟变量,称这种变量结构的模 型为虚拟变量模型(或斜方差分析模型) 。 虚拟变量作因变量的模型又称抉择模型。
1979~2001 年中国居民储蓄与收入数据(亿元) GNP 90年后 储蓄 4038.2 1991 9107 4517.8 1992 11545.4 4860.3 1993 14762.4 5301.8 1994 21518.8 5957.4 1995 29662.3 7206.7 1996 38520.8 8989.1 1997 46279.8 10201.4 1998 53407.5 11954.5 1999 59621.8 14922.3 2000 64332.4 16917.8 2001 73762.4 18598.4
虚拟变量作为因变量引入,D也只取1或0,不能用
OLS方法进行估计抉择模型,但是可以采用Logit方法 或Probit方法估计模型。例如,D=1(Clinton被罢免), D=0(Clinton不被罢免)。估计得到的模型,将给出 D=1或D=0的概率。
模型中引入虚拟变量的作用
(1)分离异常因素的影响,例如分析我国GDP的 时间序列,必须考虑“文革”因素对国民经济的 破坏性影响,剔除不可比的“文革”因素。 (2)检验不同属性类型对因变量的作用,例如工 资模型中的文化程度、季节对销售额的影响。 (3)提高模型的精度,相当于将不同属性的样本 合并,扩大了样本容量(增加了误差自由度,从 而降低了误差方差)。
反常年份:
E(Ct | X t , Dt 0) 0 1 X t
加法与乘法组合引入———截 距与斜率均不同
设定模型 Y=b0+ b1X+ b2D + b3DX +u
1, 异常时期 D 0,正常时期
• 异常时期模型:(截距与斜率均不同) Y= (b0 + b2) + (b1 +b3)X +u • 正常时期模型: Y= b0 + b1 X +u
• 大学及其以上: E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i 假定3>2,其几何意义:
大学教育 保健 支出 高中教育 低于中学教育
收入
• 还可将多个虚拟变量引入模型中以考察多种“定 性”因素的影响。
如在上述职工薪金的例中,再引入代表学历的虚拟 变量D2:
几何意义:
• 假定2>0,则两个函数有相同的斜率,但有不同 的截距。意即,男女职工平均薪金对教龄的变化 率是一样的,但两者的平均薪金水平相差2。 • 可以通过传统的回归检验,对2的统计显著性进 行检验,以判断企业男女职工的平均薪金水平是 否有显著差异。
年薪 Y 男职工 女职工
2
0
工龄 X
E(Yi | Di 1, X i ) ( 0 3 ) ( 1 4 ) X i
可分别表示1990年后期与前期的储蓄函数。
在统计检验中,如果4=0的假设被拒绝,则说 明两个时期中储蓄函数的斜率不同。 • 具体的回归结果为: ˆ Yi 15452 0.8881 i 138023Di 0.4765 i X i X . D
3、临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指标的虚 拟变量模型来反映。 例如,进口消费品数量Y主要取决于国民收入X 的多少,中国在改革开放前后,Y对X的回归关系明 显不同。 这时,可以t*=1979年为转折期,以1979年的国 民收入Xt*为临界值,设如下虚拟变量:
1 Dt 0
在E(i)=0 的初始假定下,高中以下、高中、 大学及其以上教育水平下个人保健支出的函数:
• 高中以下: • 高中:
E(Yi | X i , D1 0, D2 0) 0 1 X i
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i
•男职工本科以上学历的平均薪金:
E(Yi | X i , D1 1, D2 1) ( 0 2 3 ) 1 X i
2、乘法方式
运用虚拟变量同时改变回归直 线的截距和斜率
D=1反常 Y=(b0+b2)+(b1+ b3)X+u Y=b0+b1X+b2D+b3DX+u
Y=b0+b1X+u 正常时期 D=0正常
当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。 • 例5.1.1,考察1990年前后的中国居民的总储蓄-收 入关系是否已发生变化。
表5.1.1中给出了中国1979~2001年以城乡储蓄存 款余额代表的居民储蓄以及以GNP代表的居民收入 的数据。
表 5.1.1 90年前 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2
(-6.11) (22.89) (4.33) (-2.55)
R 2 =0.9836
由3与4的t检验可知:参数显著地不等于0,强 烈示出两个时期的回归是相异的,
储蓄函数分别为:
1990年前:
ˆ Yi 16497 0.4116X i .
1990年后:
ˆ Yi 15452 0.8881 i X
一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1; • 比较类型,否定类型取值为0。
虚拟变量在模型种的地位
虚拟变量在模型中,可以作解释变量, 也可以作因变量。
虚拟变量作解释变量时出现在方程的右
端,虚拟变量作因变量(被解释变量)
时出现在方程的左端。
概念: 同时含有一般解释变量与虚拟变量的模型称为虚 拟 变 量 模 型 或 者 方 差 分 析 (analysis-of variance: ANOVA)模型。 一个以性别为虚拟变量考察企业职工薪金的模型:
第五章 经典单方程计量经济学 模型:专门问题
§5.1 §5.2
虚拟变量 滞后变量
§5.3
设定误差
§5.1 虚拟变量模型
一、虚拟变量的基本含义 二、虚拟变量的引入 三、虚拟变量的设置原则
一、虚拟变量的基本含义
• 许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等 • 但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾害 对GDP的影响,季节对某些产品(如冷饮)销售 的影响等等。
可以运用邹氏结构变化的检验。这一问题也可通过 引入乘法形式的虚拟变量来解决。 将n1与n2次观察值合并,并用以估计以下回归:
Yi 0 1 X i 3 Di 4 ( Di X i ) i
Di为引入的虚拟变量:
1 Di 0
90年前 90年后
于是有: E(Yi | Di 0, X i ) 0 1 X i