解释变量包含虚拟变量的回归模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•男职工本科以上学历的平均薪金:
E ( Y i |X i , D 1 1 , D 2 1 ) ( 0 2 3 ) 1 X i
2. 乘法方式
• 加法方式引入虚拟变量,考察:截距的不同。 • 许多情况下:往往是斜率就有变化,或斜率、
截距同时发生变化。 • 斜率的变化可通过以乘法的方式引入虚拟变量
•女职工本科以下学历的平均薪金:
E ( Y i|X i,D 1 0 ,D 2 0 ) 0 1 X i
•男职工本科以下学历的平均薪金:
E ( Y i|X i , D 1 1 , D 2 0 ) ( 0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E ( Y i|X i , D 1 0 , D 2 1 ) ( 0 3 ) 1 X i
• 高中: E ( Y i|X i , D 1 1 , D 2 0 ) ( 0 2 ) 1 X i
• 大学及其以上: E ( Y i|X i , D 1 0 , D 2 1 ) ( 0 3 ) 1 X i
假定3>2,其几何意义:
保 健 支 出
大 学 教 育 高 中 教 育
低 于 中 学 教 育
4860.3
1993
14762.4
5301.8
1994
21518.8
5957.4
1995
29662.3
7206.7
1996
38520.8
来测度。
例:根据消费理论,消费水平C主要取决于收 入水平Y,但在一个较长的时期,人们的消费倾 向会发生变化,尤其是在自然灾害、战争等反常 年份,消费倾向往往出现变化。这种消费倾向的 变化可通过在收入的系数中引入虚拟变量来考察。
如,设
1
Dt
0
正常年份 反常年份
消费模型可建立如下:
C t0 1 X t2 D tX tt
0, 非本科学历
• 一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1; • 比较类型,否定类型取值为0。
概念:
同时含有一般解释变量与虚拟变量的模 型称为虚拟变量模型或者方差分析 (analysis-of variance: ANOVA)模型。
一个以性别为虚拟变量考察企业职工薪 金的模型:
• 这里,虚拟变量D以与X相乘的方式引入了模型中, 从而可用来考察消费倾向的变化。
• 假定E(i)= 0,上述模型所表示的函数可化为:
正常年份:
E ( C t|X t,D t 1 ) 0 (1 2 ) X t
反常年份:
E ( C t|X t,D t 0 )0 1 X t
当截距与斜率发生变化时,则需要同时引入 加法与乘法形式的虚拟变量。
Y i01 X i2 D ii
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
二、虚拟变量的引入
虚拟变量做为解释变量引入模型有两种基 本方式:加法方式和乘法方式。 1. 加法方式
上述企业职工薪金模型中性别虚拟变量的 引入采取了加法方式。
在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为:
表 5.1.1
储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2
1979~2001 年中国居民储蓄与收入数据(亿元)
GNP
90年后
储蓄
4038.2
1991
9107
4517.8
1992
11545.4
• 可以通过传统的回归检验,对2的统计显著性 进行检验,以判断企业男女职工的平均薪金
水平是否有显著差异。
年 薪 Y
男 职 工
女 职 工
2
0
工 龄 X
又例:在横截面数据基础上,考虑个人保 健支出对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上。
这时需要引入两个虚拟变量:
E ( Y i|X i,D i 0 ) 0 1 X i
企业男职工的平均薪金为:
E ( Y i|X i,D i 1 ) (0 2 ) 1 X i
几何意义:
• 假定2>0,则两个函数有相同的斜率, 但有不同的截距。意即,男女职工平均薪金对 工龄的变化率是一样的,但两者的平均薪金水 平相差2。
第五章 解释变量包含虚拟变量 的回归模型
一、虚拟变量的基本含义 二、虚拟变量的引入 三、虚拟变量的设置原则
一、虚拟变量的基本含义
• 许多经济变量是可以定量度量的,如:商品需 求量、价格、收入、产量等。
• 但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾 害对GDP的影响,季节对某些产品(如冷饮) 销售的影响等等。
1 高中 1 大学及
D 1 0 其他 D 2 0
其他
模型可设定如下:
Y i 0 1 X i 2 D 1 3 D 2 i
在E(i)=0 的初始假定下,高中以下、 高中、大学及其以上教育水平下个人保健支出 的函数:
• 高中以下: E ( Y i|X i,D 1 0 ,D 2 0 ) 0 1 X i
• 为了在模型中能够反映这些因素的影响,并提 高模型的精度,需要将它们“量化”。
这种“量化”通常是通过引入“虚拟变量” 来完成的。根据这些因素的属性类型,构造只取 “0”或“1”的人工变量,通常称为虚拟变量 (dummy variables),记为D。
• 例如,反映文化程度的虚拟变量可取为:
1, 本科学历 D=
收 入
• 还可将多个虚拟变量引入模型中以考察多种 “定性”因素的影响。
如在上述职工薪金的例中,再引入代表
学历的虚拟变量D2:
1 本科及以上学历
D2
0
本科以Βιβλιοθήκη Baidu学历
职工薪金的回归模型可设计为:
Y i 0 1 X i 2 D 1 3 D 2 i
于是,不同性别、不同学历职工的平均薪金分别为:
• 例,考察1990年前后的中国居民的总储蓄-收 入关系是否已发生变化。 表 中 给 出 了 中 国 1979~2001 年 以 城 乡 储 蓄存款余额代表的居民储蓄以及以GNP代表的 居民收入的数据。
90年前 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990
E ( Y i |X i , D 1 1 , D 2 1 ) ( 0 2 3 ) 1 X i
2. 乘法方式
• 加法方式引入虚拟变量,考察:截距的不同。 • 许多情况下:往往是斜率就有变化,或斜率、
截距同时发生变化。 • 斜率的变化可通过以乘法的方式引入虚拟变量
•女职工本科以下学历的平均薪金:
E ( Y i|X i,D 1 0 ,D 2 0 ) 0 1 X i
•男职工本科以下学历的平均薪金:
E ( Y i|X i , D 1 1 , D 2 0 ) ( 0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E ( Y i|X i , D 1 0 , D 2 1 ) ( 0 3 ) 1 X i
• 高中: E ( Y i|X i , D 1 1 , D 2 0 ) ( 0 2 ) 1 X i
• 大学及其以上: E ( Y i|X i , D 1 0 , D 2 1 ) ( 0 3 ) 1 X i
假定3>2,其几何意义:
保 健 支 出
大 学 教 育 高 中 教 育
低 于 中 学 教 育
4860.3
1993
14762.4
5301.8
1994
21518.8
5957.4
1995
29662.3
7206.7
1996
38520.8
来测度。
例:根据消费理论,消费水平C主要取决于收 入水平Y,但在一个较长的时期,人们的消费倾 向会发生变化,尤其是在自然灾害、战争等反常 年份,消费倾向往往出现变化。这种消费倾向的 变化可通过在收入的系数中引入虚拟变量来考察。
如,设
1
Dt
0
正常年份 反常年份
消费模型可建立如下:
C t0 1 X t2 D tX tt
0, 非本科学历
• 一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1; • 比较类型,否定类型取值为0。
概念:
同时含有一般解释变量与虚拟变量的模 型称为虚拟变量模型或者方差分析 (analysis-of variance: ANOVA)模型。
一个以性别为虚拟变量考察企业职工薪 金的模型:
• 这里,虚拟变量D以与X相乘的方式引入了模型中, 从而可用来考察消费倾向的变化。
• 假定E(i)= 0,上述模型所表示的函数可化为:
正常年份:
E ( C t|X t,D t 1 ) 0 (1 2 ) X t
反常年份:
E ( C t|X t,D t 0 )0 1 X t
当截距与斜率发生变化时,则需要同时引入 加法与乘法形式的虚拟变量。
Y i01 X i2 D ii
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
二、虚拟变量的引入
虚拟变量做为解释变量引入模型有两种基 本方式:加法方式和乘法方式。 1. 加法方式
上述企业职工薪金模型中性别虚拟变量的 引入采取了加法方式。
在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为:
表 5.1.1
储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2
1979~2001 年中国居民储蓄与收入数据(亿元)
GNP
90年后
储蓄
4038.2
1991
9107
4517.8
1992
11545.4
• 可以通过传统的回归检验,对2的统计显著性 进行检验,以判断企业男女职工的平均薪金
水平是否有显著差异。
年 薪 Y
男 职 工
女 职 工
2
0
工 龄 X
又例:在横截面数据基础上,考虑个人保 健支出对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上。
这时需要引入两个虚拟变量:
E ( Y i|X i,D i 0 ) 0 1 X i
企业男职工的平均薪金为:
E ( Y i|X i,D i 1 ) (0 2 ) 1 X i
几何意义:
• 假定2>0,则两个函数有相同的斜率, 但有不同的截距。意即,男女职工平均薪金对 工龄的变化率是一样的,但两者的平均薪金水 平相差2。
第五章 解释变量包含虚拟变量 的回归模型
一、虚拟变量的基本含义 二、虚拟变量的引入 三、虚拟变量的设置原则
一、虚拟变量的基本含义
• 许多经济变量是可以定量度量的,如:商品需 求量、价格、收入、产量等。
• 但也有一些影响经济变量的因素无法定量度量, 如:职业、性别对收入的影响,战争、自然灾 害对GDP的影响,季节对某些产品(如冷饮) 销售的影响等等。
1 高中 1 大学及
D 1 0 其他 D 2 0
其他
模型可设定如下:
Y i 0 1 X i 2 D 1 3 D 2 i
在E(i)=0 的初始假定下,高中以下、 高中、大学及其以上教育水平下个人保健支出 的函数:
• 高中以下: E ( Y i|X i,D 1 0 ,D 2 0 ) 0 1 X i
• 为了在模型中能够反映这些因素的影响,并提 高模型的精度,需要将它们“量化”。
这种“量化”通常是通过引入“虚拟变量” 来完成的。根据这些因素的属性类型,构造只取 “0”或“1”的人工变量,通常称为虚拟变量 (dummy variables),记为D。
• 例如,反映文化程度的虚拟变量可取为:
1, 本科学历 D=
收 入
• 还可将多个虚拟变量引入模型中以考察多种 “定性”因素的影响。
如在上述职工薪金的例中,再引入代表
学历的虚拟变量D2:
1 本科及以上学历
D2
0
本科以Βιβλιοθήκη Baidu学历
职工薪金的回归模型可设计为:
Y i 0 1 X i 2 D 1 3 D 2 i
于是,不同性别、不同学历职工的平均薪金分别为:
• 例,考察1990年前后的中国居民的总储蓄-收 入关系是否已发生变化。 表 中 给 出 了 中 国 1979~2001 年 以 城 乡 储 蓄存款余额代表的居民储蓄以及以GNP代表的 居民收入的数据。
90年前 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990