计量经济学——虚拟解释变量模型PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量经济学——虚拟解释变量模 型
在经济计量模型中除了有量的因素外 还有质的因素,质的因素包括被解释变量 为质的因素和解释变量为质的因素。如果 被解释变量为质的因素,主要是逻辑回归 要涉及的内容。本章就解释变量为质的因 素也就是存在虚拟解释变量时如何进行参 数估计等一系列问题进行讨论。
.
1
第一节 引 言
在经济计量分析中, 经常会碰到
所建模型的被解释变量不仅受诸如收
入、产量、价格、 成本、需求、投资
等数量变量的影响,而且也受到诸如
战争、自然灾害、国际环境、季节变
动以及政府经济政策变动等质量变量
的影响。建立经济计量模型若不考虑
这些质量变量的影响作用,显然是不
适宜的。
.
2
所以,在建立经济计量模型时,即要 考虑数量变量,也要考虑质量变量。但 是,质量变量和数量变量不同,数量变 量可以在事前规定好的尺度上,用不同 的数值表现出来,质量变量却只能以属 性、种类的不同具体形式表现出来。
.
10
一 、截距变动模型和斜率变动模型
(一)包含一个虚拟变量的截距变动模型 首先从最简单的例子入手,假设只有一
个定性因素影响被解释变量的变化,而且这 个因素仅有两种特征,这时候只需要引入一 个虚拟变量。
.
11
【例8.1】假设Biblioteka Baidu一个包括正常年份和
非正常年份(亚洲金融危机或SARS的影
响)居民消费的样本,并打算用这些数据
.
13
假设E(u i)=0,式(8.1)可以写成
D 1正常E ( Y 年 i)0 份 1 2 X i
(8.2)
D 0 非正常 E (Y i)年 0 份 2X i
(8.3)
.
14
式(8.2)和式(8.3)分别为正常年 份和非正常年份的居民消费水平。二者 具有相同的斜率,但是截距不同。
.
15
.
8
以一个最简单的虚拟变量模型为例,如 果只包含一个质的因素,而且这个因素 仅有两个特征,则回归模型中只需引入 一个虚拟变量。如果是含有多个质的因 素, 自然要引入多个虚拟变量。
.
9
如果只有一个质的因素,且具有m个特 征,那么如果是含有截距项的,就要引入 m-1个虚拟变量;不含有截距项的, 应该 引入m个虚拟变量,这就是虚拟变量的设 定原则。
利用最小二乘法对式(8.1)进行估计,可得到
Y ˆi ˆ0ˆ1Dˆ2Xi (8.4)
对 β1 作t 检验,若 β1 显著地不为0,
我们就认为正常年份和非正常年份居民在
消费行为上的差异是明显的。若 β1 >0,则 正常年份的居民消费水平高于非正常年份
的居民消费水平。
.
16
通过例8.1,我们可以找出虚拟变量模型的 一些特征。
一特征将其数量化。给定某一质量变量某
属性的出现为1,未出现为0,称这样的变
量为虚拟变量。
.
5
当然,把哪种情况取0,哪种情况取1要视研 究情况而定。0和1只是一个符号而已,不代 表他们有高低的意义。我们可以把男性设为 1,也可以设为0,得到的结果是一致的。 这样就可以把量化的质量变量引入经济计量 模型中,以便进一步进行数学处理。
1.用“1”来代表质的因素的哪个特征 是可以任意设定的。我们一般认为,“1” 代表具有某些特征,但没有具体规定。在上 例中,也可以指定D=1时为非正常年份,而 D=0就必然为正常年份。在这种情况下,正 常年份和非正常年份的消费函数分别为
.
17
D 0时 正常E 年 ( Y ) i 份 02 X i D 1时 非正E 常 ( Y I) 年 01 份 2 X i
模型中的系数β0 为基础类型的截距项, 称为公共截距项;系数β1 称为差别截距
系数,指的是D取1时截距系数和基础类 型的截距系数的差异。
.
19
3.如果一个回归模型有截距项,而 且这个质的因素又有两种特征,也就是 将其分两类,则我们只需要引入一个虚 拟变量。如我们的例8.1所示。如果一个 回归方程有截距项,只有一个质的因素
.
6
需要指出的是,虚拟变量主要是用来 代表质的因素,但是有些情况下也可以 用来代表数量因素。例如在建立储蓄函 数时,“收入”显然是一个重要解释变 量,虽然是“数量”因素,但是为了方 便也可以用虚拟变量表示。
.
7
第二节 虚拟解释变量的设定
虚拟解释变量模型的设定因为质的 因素的多少和这些因素特征的多少而引 入的虚拟变量也会不同。
如果我们绘制图形,得到的结果仍然
是一样的。此时,β1<0,非正常年份的
线低于正常年份的线,代表非正常年份的 消费水平低于正常年份的消费水平。
.
18
2.虚拟变量D=0所代表的特性或 状态通常称为基础类型。和其它特征或状 态比较的意义上说,基础类型为对比的基 础,在式(8.2)和式(8.3)中,非正 常年份就是基础类型,而在式(8.5)和 式(8.6)中,正常年份就是基础类型。
影响被解释变量,它有个m特征,我们 就要引入m-1个虚拟变量;
.
20
如果回归方程没有截距项,那么这个质 的因素有多少个特征就要设多少个虚拟 变量,这就是虚拟变量的使用原则。如 果虚拟变量设定不当,会使最小二乘法 无解,称这种情况为虚拟变量陷阱。
.
21
下面就用线性代数中的知识来说明这一 点。同样用例8.1,引入两个虚拟变量对有 截距项和没有截距项的情况分别讨论。
(1)对有截距项的情况,我们如果设两个 虚拟变量,则回归模型为
Y i0 1 D 1 i2 D 2 i3 X i u i (8.7)
.
22
1 正常年份 D1i 0 非正常年份
.
3
例如,性别可表现为男或女;人种可表 现为白种人和非白种人;宗教信仰可表 现为教徒和非教徒;政府的经济政策可 表现为改革开放前和改革开放后,如此 等等。
.
4
显然,这种不同的具体形式是无法直接引
入经济计量模型中去的。但由于这类变量
通常表现为品质、属性、种类的出现或者
未出现,所以我们可以根据质量变量的这
估计消费函数。由于在正常年份和非正常
年份居民在消费水平上存在明显差异,所
以一些外界的影响是一个重要的解释变量
。
.
12
用一个虚拟变量来表示这个质的因素, 消费函数为
Y i01 D 2X i u i (8.1)
式中,Yi=第个居民的消费水平,Xi=第个 居民的收入水平,D为虚拟变量。我们用 D=1表示正常年份这一特征,用D=0来表 示非正常年份
在经济计量模型中除了有量的因素外 还有质的因素,质的因素包括被解释变量 为质的因素和解释变量为质的因素。如果 被解释变量为质的因素,主要是逻辑回归 要涉及的内容。本章就解释变量为质的因 素也就是存在虚拟解释变量时如何进行参 数估计等一系列问题进行讨论。
.
1
第一节 引 言
在经济计量分析中, 经常会碰到
所建模型的被解释变量不仅受诸如收
入、产量、价格、 成本、需求、投资
等数量变量的影响,而且也受到诸如
战争、自然灾害、国际环境、季节变
动以及政府经济政策变动等质量变量
的影响。建立经济计量模型若不考虑
这些质量变量的影响作用,显然是不
适宜的。
.
2
所以,在建立经济计量模型时,即要 考虑数量变量,也要考虑质量变量。但 是,质量变量和数量变量不同,数量变 量可以在事前规定好的尺度上,用不同 的数值表现出来,质量变量却只能以属 性、种类的不同具体形式表现出来。
.
10
一 、截距变动模型和斜率变动模型
(一)包含一个虚拟变量的截距变动模型 首先从最简单的例子入手,假设只有一
个定性因素影响被解释变量的变化,而且这 个因素仅有两种特征,这时候只需要引入一 个虚拟变量。
.
11
【例8.1】假设Biblioteka Baidu一个包括正常年份和
非正常年份(亚洲金融危机或SARS的影
响)居民消费的样本,并打算用这些数据
.
13
假设E(u i)=0,式(8.1)可以写成
D 1正常E ( Y 年 i)0 份 1 2 X i
(8.2)
D 0 非正常 E (Y i)年 0 份 2X i
(8.3)
.
14
式(8.2)和式(8.3)分别为正常年 份和非正常年份的居民消费水平。二者 具有相同的斜率,但是截距不同。
.
15
.
8
以一个最简单的虚拟变量模型为例,如 果只包含一个质的因素,而且这个因素 仅有两个特征,则回归模型中只需引入 一个虚拟变量。如果是含有多个质的因 素, 自然要引入多个虚拟变量。
.
9
如果只有一个质的因素,且具有m个特 征,那么如果是含有截距项的,就要引入 m-1个虚拟变量;不含有截距项的, 应该 引入m个虚拟变量,这就是虚拟变量的设 定原则。
利用最小二乘法对式(8.1)进行估计,可得到
Y ˆi ˆ0ˆ1Dˆ2Xi (8.4)
对 β1 作t 检验,若 β1 显著地不为0,
我们就认为正常年份和非正常年份居民在
消费行为上的差异是明显的。若 β1 >0,则 正常年份的居民消费水平高于非正常年份
的居民消费水平。
.
16
通过例8.1,我们可以找出虚拟变量模型的 一些特征。
一特征将其数量化。给定某一质量变量某
属性的出现为1,未出现为0,称这样的变
量为虚拟变量。
.
5
当然,把哪种情况取0,哪种情况取1要视研 究情况而定。0和1只是一个符号而已,不代 表他们有高低的意义。我们可以把男性设为 1,也可以设为0,得到的结果是一致的。 这样就可以把量化的质量变量引入经济计量 模型中,以便进一步进行数学处理。
1.用“1”来代表质的因素的哪个特征 是可以任意设定的。我们一般认为,“1” 代表具有某些特征,但没有具体规定。在上 例中,也可以指定D=1时为非正常年份,而 D=0就必然为正常年份。在这种情况下,正 常年份和非正常年份的消费函数分别为
.
17
D 0时 正常E 年 ( Y ) i 份 02 X i D 1时 非正E 常 ( Y I) 年 01 份 2 X i
模型中的系数β0 为基础类型的截距项, 称为公共截距项;系数β1 称为差别截距
系数,指的是D取1时截距系数和基础类 型的截距系数的差异。
.
19
3.如果一个回归模型有截距项,而 且这个质的因素又有两种特征,也就是 将其分两类,则我们只需要引入一个虚 拟变量。如我们的例8.1所示。如果一个 回归方程有截距项,只有一个质的因素
.
6
需要指出的是,虚拟变量主要是用来 代表质的因素,但是有些情况下也可以 用来代表数量因素。例如在建立储蓄函 数时,“收入”显然是一个重要解释变 量,虽然是“数量”因素,但是为了方 便也可以用虚拟变量表示。
.
7
第二节 虚拟解释变量的设定
虚拟解释变量模型的设定因为质的 因素的多少和这些因素特征的多少而引 入的虚拟变量也会不同。
如果我们绘制图形,得到的结果仍然
是一样的。此时,β1<0,非正常年份的
线低于正常年份的线,代表非正常年份的 消费水平低于正常年份的消费水平。
.
18
2.虚拟变量D=0所代表的特性或 状态通常称为基础类型。和其它特征或状 态比较的意义上说,基础类型为对比的基 础,在式(8.2)和式(8.3)中,非正 常年份就是基础类型,而在式(8.5)和 式(8.6)中,正常年份就是基础类型。
影响被解释变量,它有个m特征,我们 就要引入m-1个虚拟变量;
.
20
如果回归方程没有截距项,那么这个质 的因素有多少个特征就要设多少个虚拟 变量,这就是虚拟变量的使用原则。如 果虚拟变量设定不当,会使最小二乘法 无解,称这种情况为虚拟变量陷阱。
.
21
下面就用线性代数中的知识来说明这一 点。同样用例8.1,引入两个虚拟变量对有 截距项和没有截距项的情况分别讨论。
(1)对有截距项的情况,我们如果设两个 虚拟变量,则回归模型为
Y i0 1 D 1 i2 D 2 i3 X i u i (8.7)
.
22
1 正常年份 D1i 0 非正常年份
.
3
例如,性别可表现为男或女;人种可表 现为白种人和非白种人;宗教信仰可表 现为教徒和非教徒;政府的经济政策可 表现为改革开放前和改革开放后,如此 等等。
.
4
显然,这种不同的具体形式是无法直接引
入经济计量模型中去的。但由于这类变量
通常表现为品质、属性、种类的出现或者
未出现,所以我们可以根据质量变量的这
估计消费函数。由于在正常年份和非正常
年份居民在消费水平上存在明显差异,所
以一些外界的影响是一个重要的解释变量
。
.
12
用一个虚拟变量来表示这个质的因素, 消费函数为
Y i01 D 2X i u i (8.1)
式中,Yi=第个居民的消费水平,Xi=第个 居民的收入水平,D为虚拟变量。我们用 D=1表示正常年份这一特征,用D=0来表 示非正常年份