8-3、模型中的特殊解释变量:虚拟变量
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第8章 模型中的特殊解释变量 ——虚拟变量
2016/3/29
1
8.3、 虚拟变量(Dummy variables)
8.3.1、.虚拟变量的概念
在回归分析中,常常碰到这样一种情况,即因变量 的波动不仅依赖于那种能够很容易按某种尺度定量化的 变量(如收入、产出、价格、身高、体重等),而且依 赖于某些定性的变量(如性别、地区、季节等)。 在经济系统中,许多变动是不能定量的。如政府的更 迭(工党 - 保守党)、经济体制的改革、固定汇率变为 浮动汇率、从战时经济转为和平时期经济等。 这样一些变动都可以用 0-1 变量来表示,用 1 表示具有 某一“品质”或属性,用0表示不具有该“品质”或属 性。这种变量在计量经济学中称为“虚拟变量”。虚拟 变量使得我们可以将那些无法定量化的变量引入回归模 型中。
2016/3/29 2
下面给出几个可以引入虚拟变量的例子。 例1:你在研究学历和收入之间的关系,在你的样 本中,既有女性又有男性,你打算研究在此关系中, 性别是否会导致差别。 例2:你在研究某省家庭收入和支出的关系,采集 的样本中既包括农村家庭,又包括城镇家庭,你打 算研究二者的差别。 例3:你在研究通货膨胀的决定因素,在你的观测 期中,有些年份政府实行了一项收入政策。你想检 验该政策是 否对通货膨胀产生影响。 上述各例都可以用两种方法来解决,一种解决方 法是分别进行两类情况的回归,然后检验参数是否 不同。另一种方法是用全部观测值作单一回归,将 定性因素的影响用虚拟变量引入模型。
女1 0 女2 0 男2 1 女3 0 男3 1 男4 1 女4 0 女5 0
21.2
男5 1
试建立模型研究之。
2016/3/29
9
4、虚拟变量在分段回归中的应用
2016/3/29
10
2016/3/29
11
2016/3/29
12
Y 0 1 X 2 D u
其中,
D= 1 平时
2016/3/29 5
0
战时
此式等价于下列两式:
战时:Y 0 1 X u
平时:Y 0 2 1 X u
}截距变动,斜率不变
在包含虚拟变量的模型中,D的数据为0,0,0,0,0, Y 平时 1,1,1,1,1。 估计结果如下图所示:
0 其中,D={ 1 战时 平时
Y
战时
平时
不难看出,上式相当于下列பைடு நூலகம்式:
α X
Y 1 X u Y ( 1 2 ) X u
同样,包括虚拟变量的模型中,β 2是否显著可以表明斜 率在两个时期是否变化。
2016/3/29 7
3.斜率和截距都变动 在这种情况下,模型可设为:
Y ( 1 2 D) ( 3 4 D) X u 即:Y 1 2 D 3 X 4 ( DX ) u
0 其中,D={ 1 战时 平时
此式等价于下列两个单独的回归式:
战时:Y 1 3 X u 平时:Y ( 1 2 ) ( 3 4)X u
2016/3/29 4
8.3.3、虚拟变量的使用方法
1. 截距变动(用虚拟变量测量截距变动) 设Y表示消费,X表示收入,我们有:
战时:Y 1 X u 和平时期:Y 2 X
}假定β 不变。
对于5年战争和5年和平时期的数据,我们可分别估计上 ˆ 的不同值。 述两个模型,一般将给出 β 现引入虚拟变量D, 将两式并为一式:
2016/3/29 3
8.3.2、虚拟变量的设置规则
1、1个定性因素有多个属性(m) m-1 2、多个定性因素(M)多种不同属性(Mi) 3、虚拟变量的取值应该从分析问题的目的出发予 以确定,一般只取0、1来量化定量因素
4、虚拟变量在单一方程中,可以作为解释变量, 也可以作为被解释变量,本节中虚拟变量是作为解 释变量存在的。
战时
应用t检验,β 2是否显著 可以表明截距项在两个时 期是否有变化。
2016/3/29
α 2 - α 1 =β α 1 =β
0
2
X
6
2.斜率变动
如果我们认为战时和平时的消费函数中,截距项不变, 而斜率不同,即β 变动,则可用下面的模型来研究两个时 期边际消费倾向的差异:
Y ( 1 2 D ) X u 即:Y 1 X 2 ( DX ) u
引进了虚拟变量的回归模型对于检验两个时期中是否 发生结构性变化很方便。 如上例中,相当于检验 H0: β 2=β 4=0
2016/3/29 8
例题:
为研究工业产业人员,男女工资水平的差异,对某行业抽样调查10人,具体样 本如下:
起薪Y
人员n 性别D
22.0
男1 1
19.0 18.0 21.7 18.5 21.0 20.5 17.0 17.5
2016/3/29
1
8.3、 虚拟变量(Dummy variables)
8.3.1、.虚拟变量的概念
在回归分析中,常常碰到这样一种情况,即因变量 的波动不仅依赖于那种能够很容易按某种尺度定量化的 变量(如收入、产出、价格、身高、体重等),而且依 赖于某些定性的变量(如性别、地区、季节等)。 在经济系统中,许多变动是不能定量的。如政府的更 迭(工党 - 保守党)、经济体制的改革、固定汇率变为 浮动汇率、从战时经济转为和平时期经济等。 这样一些变动都可以用 0-1 变量来表示,用 1 表示具有 某一“品质”或属性,用0表示不具有该“品质”或属 性。这种变量在计量经济学中称为“虚拟变量”。虚拟 变量使得我们可以将那些无法定量化的变量引入回归模 型中。
2016/3/29 2
下面给出几个可以引入虚拟变量的例子。 例1:你在研究学历和收入之间的关系,在你的样 本中,既有女性又有男性,你打算研究在此关系中, 性别是否会导致差别。 例2:你在研究某省家庭收入和支出的关系,采集 的样本中既包括农村家庭,又包括城镇家庭,你打 算研究二者的差别。 例3:你在研究通货膨胀的决定因素,在你的观测 期中,有些年份政府实行了一项收入政策。你想检 验该政策是 否对通货膨胀产生影响。 上述各例都可以用两种方法来解决,一种解决方 法是分别进行两类情况的回归,然后检验参数是否 不同。另一种方法是用全部观测值作单一回归,将 定性因素的影响用虚拟变量引入模型。
女1 0 女2 0 男2 1 女3 0 男3 1 男4 1 女4 0 女5 0
21.2
男5 1
试建立模型研究之。
2016/3/29
9
4、虚拟变量在分段回归中的应用
2016/3/29
10
2016/3/29
11
2016/3/29
12
Y 0 1 X 2 D u
其中,
D= 1 平时
2016/3/29 5
0
战时
此式等价于下列两式:
战时:Y 0 1 X u
平时:Y 0 2 1 X u
}截距变动,斜率不变
在包含虚拟变量的模型中,D的数据为0,0,0,0,0, Y 平时 1,1,1,1,1。 估计结果如下图所示:
0 其中,D={ 1 战时 平时
Y
战时
平时
不难看出,上式相当于下列பைடு நூலகம்式:
α X
Y 1 X u Y ( 1 2 ) X u
同样,包括虚拟变量的模型中,β 2是否显著可以表明斜 率在两个时期是否变化。
2016/3/29 7
3.斜率和截距都变动 在这种情况下,模型可设为:
Y ( 1 2 D) ( 3 4 D) X u 即:Y 1 2 D 3 X 4 ( DX ) u
0 其中,D={ 1 战时 平时
此式等价于下列两个单独的回归式:
战时:Y 1 3 X u 平时:Y ( 1 2 ) ( 3 4)X u
2016/3/29 4
8.3.3、虚拟变量的使用方法
1. 截距变动(用虚拟变量测量截距变动) 设Y表示消费,X表示收入,我们有:
战时:Y 1 X u 和平时期:Y 2 X
}假定β 不变。
对于5年战争和5年和平时期的数据,我们可分别估计上 ˆ 的不同值。 述两个模型,一般将给出 β 现引入虚拟变量D, 将两式并为一式:
2016/3/29 3
8.3.2、虚拟变量的设置规则
1、1个定性因素有多个属性(m) m-1 2、多个定性因素(M)多种不同属性(Mi) 3、虚拟变量的取值应该从分析问题的目的出发予 以确定,一般只取0、1来量化定量因素
4、虚拟变量在单一方程中,可以作为解释变量, 也可以作为被解释变量,本节中虚拟变量是作为解 释变量存在的。
战时
应用t检验,β 2是否显著 可以表明截距项在两个时 期是否有变化。
2016/3/29
α 2 - α 1 =β α 1 =β
0
2
X
6
2.斜率变动
如果我们认为战时和平时的消费函数中,截距项不变, 而斜率不同,即β 变动,则可用下面的模型来研究两个时 期边际消费倾向的差异:
Y ( 1 2 D ) X u 即:Y 1 X 2 ( DX ) u
引进了虚拟变量的回归模型对于检验两个时期中是否 发生结构性变化很方便。 如上例中,相当于检验 H0: β 2=β 4=0
2016/3/29 8
例题:
为研究工业产业人员,男女工资水平的差异,对某行业抽样调查10人,具体样 本如下:
起薪Y
人员n 性别D
22.0
男1 1
19.0 18.0 21.7 18.5 21.0 20.5 17.0 17.5