第五章 虚拟变量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学 Econometrics
第五章 虚拟变量
▪ ● 两种分类的定性变量 ▪ ● 多种分类的定性变量 ▪ ● 定性变量对截距和斜率项影响 ▪ ● 应用
计量经济学 Econometrics
两种分类的定性变量
计量经济学 Econometrics
问题的提出
1.计量经济学模型,需要经常考虑属性 因素的影响。例如,职业、战争与和平、 繁荣与萧条、文化程度、灾害、季节
▪ ▪ C -1.750172 ▪ D1 1.483923 ▪ X 0.150450 ▪ D2 -0.103422 ▪ ▪ ▪ R-squared ▪ Adjusted R-squared ▪ S.E. of regression ▪ Sum squared resid ▪ Log likelihood ▪ Durbin-Watson stat
1 年龄在25~55岁之间 D1 0 其他
1 年龄大于55岁 D2 0 其他
Y 0 0D1 1D2 1X
三类家庭的虚拟变量取值情况
还有可能有更多的定性变量,如受教育程度、职称等
计量经济学 Econometrics
定性变量对截距和斜率项影响
计量经济学
定性变量对截距和斜率项影响 Econometrics
设Y表示工资,X表示工作经历,D表示性别虚拟变量
Y 0 0D 1 1D X
Y
ˆ0 ˆ0 ˆ1 ˆ1 X
ˆ0 ˆ1X
ˆ0
截距和斜率项发生变化
ˆ0
X
计量经济学 Econometrics
应用
计量经济学 Econometrics
应用
例工资差别:为了了解美国工作妇女是否受到
了歧视,用美国统计局的有关数据来作一分析。
计量经济学 Econometrics
两种分类的定Fra Baidu bibliotek变量
考察工资和性别有无关系的模型
Yi 0 0Di i
工资
0 女
Di 1 男
Y的条件期望值
男: E Yi D 1 0 0 女: E Yi D 0 0
例 计量经济学
Econometrics
数据data51.xls,data51.wfl,建立模型
(3) WAGE 14.79 2.64SEX 0.92ED 1.18NONWH 0.30HISP 0.62AGE 0.0063AGE2
(-4.59) (-4.50) (7.98) (-1.22)
(0.28) (3.87) (-3.18)
R2 0.398 F 6,199 21.9
计量经济学 Econometrics
R2 0.068 F 1, 204 14.9
(2) WAGE 6.41 2.76SEX 0.99ED 0.12AGE 1.06NONWH 0.24HISP
(-3.38) (-4.61) (8.54) (4.63) (-1.07)
(0.22)
R2 0.367 F 5, 200 23.2
设Y表示工资,X表示工作经历,D表示性别虚拟变量
Y 0 1 0D X
反映男女的工作经历对工资的影响情况,截距项表示 工作经历为0时的工资,这里假设男女是相等的
Y
ˆ0 ˆ1 ˆ0 X
ˆ0 ˆ1X
斜率项发生变化 ˆ0
X
计量经济学
Econometric定s 性变量对截距和斜率项影响(续)
例
▪ 数据data53.xls,为英国1946年至1963年居民 储蓄和收入数据,单位百万英镑。数据可分两 个时期,46~54,战后恢复期,55~63振兴时期。
建立模型: Y 0 0D 1 1D X
收入
虚拟变量
储蓄
D=1,X属于第一个时期 D=0,X属于第二个时期
计量经济学 Econometrics
数据:data52.xls
变量说明:
WAGE-工资(美元/小时) SEX-性别,1-女 ED-受教育年数 AGE-年龄 NONWH-1-非西班牙裔也不是白人,0-其他 HISP-1-西班牙裔,0-其他
计量经济学 Econometrics
估计的模型
(1)
WAGE 10.93 2.73SEX
(22.10) (-3.86)
▪ wfcreate a 1946 1963 ▪ read data53.xls 3 ▪ genr d2=d1*x ▪ equation eq1.ls y c d1 x d2 ▪ eq1.results
计量经济学 Econometrics
▪ Variable
Coefficient
Std. Error t-Statistic Prob.
0.331888 -5.273377 0.470362 3.154852 0.016286 9.238172 0.033260 -3.109471
0.0001 0.0070 0.0000 0.0077
性别虚拟变量的p值很小为0.003,表明非常显著。 这样在控制工作经历的情况下,平均工资的性别差异很 显著。
计量经济学 Econometrics
多种分类的定性变量
计量经济学
多种分类的定性变量 Econometrics 设Y表示家庭储蓄,X表示家庭收入。不同
年龄组,储蓄和收入之间的关系是不一样 的。把年龄分成三个组:25岁以下、 25~55岁和55岁以上,定义虚拟变量:
2.定性因素往往很难直接度量它们的大 小。只能给出它们的“Yes:D=1或 No:D=0、或者它们的程度或等级
3.为了反映定性因素和提高模型的精度, 必须将属性因素“量化”。通过构造01型的虚拟变量来量化属性因素
计量经济学
模型中引入虚拟变量的必要性 Econometrics
现实经济生活错综复杂,往往要求人们按照 经济变量的质或量的不同,分别进行处理。 因此,回归模型中,往往有必要引入虚拟变 量,以表示这些质的区别。例如,消费函数, 对于平时与战时,萧条与繁荣,乃至性别、 教育程度、季节性等等,都会因质的不同表 现出不同的差异。
Wage 0 0Gender
ˆ0 1518.70,ˆ0 568.23
这里性别为一虚拟变量
计算看看男女性各自的平均工资,结果如何?
计量经济学 Econometrics
加入其它定量解释变量
把上例模型中加入工作经历后变为:
Wage 1366.27 525.63Gender 19.81Exper
第五章 虚拟变量
▪ ● 两种分类的定性变量 ▪ ● 多种分类的定性变量 ▪ ● 定性变量对截距和斜率项影响 ▪ ● 应用
计量经济学 Econometrics
两种分类的定性变量
计量经济学 Econometrics
问题的提出
1.计量经济学模型,需要经常考虑属性 因素的影响。例如,职业、战争与和平、 繁荣与萧条、文化程度、灾害、季节
▪ ▪ C -1.750172 ▪ D1 1.483923 ▪ X 0.150450 ▪ D2 -0.103422 ▪ ▪ ▪ R-squared ▪ Adjusted R-squared ▪ S.E. of regression ▪ Sum squared resid ▪ Log likelihood ▪ Durbin-Watson stat
1 年龄在25~55岁之间 D1 0 其他
1 年龄大于55岁 D2 0 其他
Y 0 0D1 1D2 1X
三类家庭的虚拟变量取值情况
还有可能有更多的定性变量,如受教育程度、职称等
计量经济学 Econometrics
定性变量对截距和斜率项影响
计量经济学
定性变量对截距和斜率项影响 Econometrics
设Y表示工资,X表示工作经历,D表示性别虚拟变量
Y 0 0D 1 1D X
Y
ˆ0 ˆ0 ˆ1 ˆ1 X
ˆ0 ˆ1X
ˆ0
截距和斜率项发生变化
ˆ0
X
计量经济学 Econometrics
应用
计量经济学 Econometrics
应用
例工资差别:为了了解美国工作妇女是否受到
了歧视,用美国统计局的有关数据来作一分析。
计量经济学 Econometrics
两种分类的定Fra Baidu bibliotek变量
考察工资和性别有无关系的模型
Yi 0 0Di i
工资
0 女
Di 1 男
Y的条件期望值
男: E Yi D 1 0 0 女: E Yi D 0 0
例 计量经济学
Econometrics
数据data51.xls,data51.wfl,建立模型
(3) WAGE 14.79 2.64SEX 0.92ED 1.18NONWH 0.30HISP 0.62AGE 0.0063AGE2
(-4.59) (-4.50) (7.98) (-1.22)
(0.28) (3.87) (-3.18)
R2 0.398 F 6,199 21.9
计量经济学 Econometrics
R2 0.068 F 1, 204 14.9
(2) WAGE 6.41 2.76SEX 0.99ED 0.12AGE 1.06NONWH 0.24HISP
(-3.38) (-4.61) (8.54) (4.63) (-1.07)
(0.22)
R2 0.367 F 5, 200 23.2
设Y表示工资,X表示工作经历,D表示性别虚拟变量
Y 0 1 0D X
反映男女的工作经历对工资的影响情况,截距项表示 工作经历为0时的工资,这里假设男女是相等的
Y
ˆ0 ˆ1 ˆ0 X
ˆ0 ˆ1X
斜率项发生变化 ˆ0
X
计量经济学
Econometric定s 性变量对截距和斜率项影响(续)
例
▪ 数据data53.xls,为英国1946年至1963年居民 储蓄和收入数据,单位百万英镑。数据可分两 个时期,46~54,战后恢复期,55~63振兴时期。
建立模型: Y 0 0D 1 1D X
收入
虚拟变量
储蓄
D=1,X属于第一个时期 D=0,X属于第二个时期
计量经济学 Econometrics
数据:data52.xls
变量说明:
WAGE-工资(美元/小时) SEX-性别,1-女 ED-受教育年数 AGE-年龄 NONWH-1-非西班牙裔也不是白人,0-其他 HISP-1-西班牙裔,0-其他
计量经济学 Econometrics
估计的模型
(1)
WAGE 10.93 2.73SEX
(22.10) (-3.86)
▪ wfcreate a 1946 1963 ▪ read data53.xls 3 ▪ genr d2=d1*x ▪ equation eq1.ls y c d1 x d2 ▪ eq1.results
计量经济学 Econometrics
▪ Variable
Coefficient
Std. Error t-Statistic Prob.
0.331888 -5.273377 0.470362 3.154852 0.016286 9.238172 0.033260 -3.109471
0.0001 0.0070 0.0000 0.0077
性别虚拟变量的p值很小为0.003,表明非常显著。 这样在控制工作经历的情况下,平均工资的性别差异很 显著。
计量经济学 Econometrics
多种分类的定性变量
计量经济学
多种分类的定性变量 Econometrics 设Y表示家庭储蓄,X表示家庭收入。不同
年龄组,储蓄和收入之间的关系是不一样 的。把年龄分成三个组:25岁以下、 25~55岁和55岁以上,定义虚拟变量:
2.定性因素往往很难直接度量它们的大 小。只能给出它们的“Yes:D=1或 No:D=0、或者它们的程度或等级
3.为了反映定性因素和提高模型的精度, 必须将属性因素“量化”。通过构造01型的虚拟变量来量化属性因素
计量经济学
模型中引入虚拟变量的必要性 Econometrics
现实经济生活错综复杂,往往要求人们按照 经济变量的质或量的不同,分别进行处理。 因此,回归模型中,往往有必要引入虚拟变 量,以表示这些质的区别。例如,消费函数, 对于平时与战时,萧条与繁荣,乃至性别、 教育程度、季节性等等,都会因质的不同表 现出不同的差异。
Wage 0 0Gender
ˆ0 1518.70,ˆ0 568.23
这里性别为一虚拟变量
计算看看男女性各自的平均工资,结果如何?
计量经济学 Econometrics
加入其它定量解释变量
把上例模型中加入工作经历后变为:
Wage 1366.27 525.63Gender 19.81Exper