第7章 虚拟变量回归模型-案例 虚拟变量回归模型ppt汇总 计量经济学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图7.1.1表明,在相同的收入水平情况下,有适龄子女家庭的教育费用平均要 比无适龄子女家庭的教育费用多支a出个单位。
图7.1.1 虚拟变量对截距的影响
又例:在横截面数据基础上,考虑个人保健支出对个 人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 高中 1 大学及其
D 1= 0 其他 D 2= 0
其他
模型可设定如下:
Yt = b 0 + b1 Xt + b 2 D1 + b3 D2 + mt
在E(mt)=0 的初始假定下,高中以下、高中、大学 及其以上教育水平下个人保健支出的函数:
高中以下: E(Yt | Xt , D1 = 0, D2 = 0) = b0 + b1 Xt
这里,虚拟变量D以与X相乘的方式引入了模型中,从而 可用来考察消费倾向的变化。
假定E(mt)= 0,上述模型所表示的函数可化为:
正常年份:
bbb E ( C t|X t,D t= 1 ) = 0 + (1 + 2 ) X t
反常年份:
bb E ( C t|X t,D t= 0 )=0 + 1 X t
当tt*=1978年, Dt =1
ˆ y t= b ˆ 0 a ˆx t + b ˆ 1 + a ˆx t
§7.3 案例
scalar demvotes = 0.484-0.0324*1+0.0564*1+0.0097*1*30.0083*1*3.019=0.51024
D4= 0 不喜欢某种商品
5)表示天气变化的虚拟变量可取为
D5=
1 晴天 0 雨天
2.引入虚拟变量的作用 引入虚拟变量的作用,在于将定性因素或属性因素对因变
量的影响数量化。 (1)可以描述和测量定性(或属性)因素的影响; (2)能够正确反映经济变量之间的相互关系,提高模型的精
度; (3)便于处理异常数据。设置虚拟变量 (即将异常数据作为
•男职工本科以上学历的平均薪金:
E(Yt | Xt , D1 = 1, D2 = 1) = (b0 + b 2 + b3 ) + b1 Xt
2、乘法方式
在所设定的计量经济模型中,将虚拟解释变量与其他解释变 量相乘作为新的解释变量出现在模型中,以达到其调整设定 模型斜率系数的目的。
乘法形式引入虚拟解释变量的主要作用:①两个回归模型之间的比较; ②因素之间的交互影响分析;③提高模型对现实经济现象的描述精度。
一个特殊的定性因素)。例如:
§7.1 虚拟变量的基本含义
许多经济变量是可以定量度量的,如:商品需求量、价格、 收入、产量等,
但也有一些影响经济变量的因素无法定量度量,如:职业、 性别对收入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等等。
为了在模型中能够反映这些因素的影响,并提高模型的精 度,需要将它们“量化”。
一般地,在虚拟变量的设置中, 基础类型和肯定类型取值为1; 比较类型和否定类型取值为0。
例如:
1)表示性别的虚拟变量可取为
1 男性 D1= 0 女性
2)表示文化程度的虚拟变量可取为
1 本科及以上学历
D2=
0 本科以下学历
3)表示地区的虚拟变量可取为
D3=
1 城市 0 农村
4)表示消费心理的虚拟变量可取为 1 喜欢某种商品
高中:
E(Yt | Xt , D1 = 1, D2 = 0) = (b 0 + b 2 ) + b1 Xt
大学及其以上: E(Yt | Xt , D1 = 0, D2 = 1) = (b0 + b3 ) + b1 Xt
假定b3>b2,其几何意义:
保 健 支 出
β3
β2
β0
大 学 教 育 高 中 教 育 低 于 中 学 教 育
1 0
男性 女性
建立企业年薪模型:yt=b0+b1xt+aD+ut
企业女职工的薪金模型:yt=b0+b1xt+ut 企业男职工的薪金模型:yt=(b0+a)+b1xt+ut
几何意义: yt=b0+b1xt+aD+ut
男女职工的年薪对工龄的函数具有相同斜
率b1,表明随着工龄的增长,男女职工工
资的增长幅度相同;截距不同,说明男女 职工的初始年薪不同。这种虚拟变量只影 响截距不影响斜率的模型为加法模型。
这意味着,男女职工平均薪金对工龄的变化率
是一样的,但两者的平均薪金水平相差 a。
可以通过传统的回归检验,对 a 的统计显著性进行检验,
以判断男女职工的平均薪金水平是否显著差异。
例7.1.4 居民家庭的教育费用支出除了受收入水平的影 响之外,还与子女的年龄结构密切相关。如果家庭中 有适龄子女(6-21岁),教育费用支出就多。因此,为了 反映“子女年龄结构”这一定性因素,设置虚拟变量:
加法方式引入虚拟变量,考察:截距的不同, 许多情况下:往往是斜率就有变化,或斜率、截距同时发
生变化。 斜率的变化可通过以乘法的方式引入虚拟变量来测度。
例:根据消费理论,消费水平C主要取决于收入水平Y,但在 一个较长的时期,人们的消费倾向会发生变化,尤其是在自然 灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾 向的变化可通过在收入的系数中引入虚拟变量来考察。
•女职工本科以下学历的平均薪金:
E(Yt | Xt , D1 = 0, D2 = 0) = b 0 + b1 Xt
•男职工本科以下学历的平均薪金:
E(Yt | Xt , D1 = 1, D2 = 0) = (b0 + b 2 ) + b1 Xt
•女职工本科以上学历的平均薪金: E(Yt | Xt , D1 = 0, D2 = 1) = (b 0 + b3 ) + b1 Xt
(3)一般方式
实际应用中,一般是直接以加法和乘法方式引入虚
拟变量,然后再利用t检验判断其系数是否显著的不
等于零,进而确定虚拟变量的具体引入方式。 我们还可以用加法模型与乘法模型相结合的方式建 立模型来拟合经济发展出现转折的情况。
例7.1.9 进口商品消费支出y主要取决于国民 生产总值x的多少。我国改革开放前后,由于国家政 策的变化,及改革开放后外资的大量引入等因素的 影响,1978年前后,y和x
年 薪 Y
b0+a b0
男 职 工 女 职 工
工 龄 X
7.2.虚拟变量的引入
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。
1. 加法方式
yt=b 0+b 1xt+atD +u t,D
=
1 0
男性 女性
上述职工薪金模型(7-1)中性别虚拟变量的引入就采取了加法方式,
在该模型中,如仍假定 Eut =0 ,则:
虚拟变量模型
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。
在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要 是用作解释变量。
例如:一个以性别为虚拟变量来考察职工薪金的模型如下:
b b b m Y i=0+1X i+2D i+i
(7-1)
其中
Y i ——为职工的薪金;
D i =1 ——代表男性
(2)乘法类型
例7.1.6 随着收入水平的提高,家庭教育费用支出的边际消费倾向 可能会发生变化。为了反映定性因素对斜率的影响,可以用乘法方式 引入虚拟变量,将家庭教育费用支出函数取成:
图7.1.2 虚拟变量对斜率的影响
如,设
1 正常年份
Dt
=
0
反常年份
消费模型可建立如下:
bb b m C t=0 + 1 X t+2 D tX t+t
第7章 虚拟变量回归模型
§7.1 虚拟变量的基本含义 §7.2 虚拟变量的引入 §7.3 案例分析
为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将 它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。
这种用两个相异数字来表示对被解释变量有重要影响而自身又 没有观测数值的一类变量,称为虚拟变量(dummy variables)。
§7.2 虚拟变量的引入
1、加法方式
所设定的计量经济模型中加入适当的虚拟变量,此时虚 拟变量与其他解释变量在设定模型中是相加关系。其作 用是改变了设定模型的截距水平。
企业职工薪金模型中性别虚拟变量的引入采取了加法方式, 以研究妇女在工作中是否受到性别歧视(实验经济学)
令y
=年薪,x
=工作年限,D
=
这种“量化”通常是通过引入“虚拟变量”来完成的。 根据这些因素的属性类型,构造只取“0”或“1”的人工 变量,通常称为虚拟变量(dummy variables),记为D。
例如,反映文程度的虚拟变量可取为: 1, 本科学历
D= 0, 非本科学历
一般地,在虚拟变量的设置中:
• 基础类型、肯定类型取值为1;
虚拟变量也称为哑变量或定性变量。
虚拟变量的特点是:
1.虚拟变量是对经济变化有重要影响的不可测变量。
2.虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取 “0”或“1”的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而 把定性因素这样数量化的,所以虚拟变量的数值只表示变量的性质而不表 示变量的数值。
例如,进口消费品数量Y主要取决于国民收入 X的多少,中国在改革开放前后,Y对X的回归关 系明显不同。
这时,可以t*=1978年为转折期,以1978年 的国民收入Xt*为临界值,设如下虚拟变量:
1
Dt
=
Fra Baidu bibliotek
0
t t* t t*
则进口消费品的回归模型可建立如下:
y t= b 0 + b 1 x t+ a x t x t D t+ u t
• 比较类型,否定类型取值为0。
概念:
同时含有一般解释变量与虚拟变量的模型称为 虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。
一个以性别为虚拟变量考察企业职工薪金的模型:
Yt = b 0 + b1 Xt + b 2 Dt + mt
其中:Yt为企业职工的薪金,Xt为工龄, Dt=1,若是男性,Dt=0,若是女性。
为什么下面这样的写法?
女职工的平均薪金为:
E y tx t,D t= 0= b 0+ b 1 x t
男职工的平均薪金为:
E y tx t,D t= 1 = b 0 + a + b 1 x t
从几何意义上看(图7-1),
a
图7-1 男女职工平均薪金示意图
假定 a0 ,
则两个函数有相同的斜率,但有不同的截距。
X i ——为职工工龄;
D i =0 ——代表女性
§7.2 虚拟变量的引入
虚拟变量做为解释变量引入模型有两种基本方式:
加法方式 所设定的计量经济模型中加入适当的虚拟变量,此 时虚拟变量与其他解释变量在设定模型中是相加关 系。其作用是改变了设定模型的截距水平。 乘法方式 在所设定的计量经济模型中,将虚拟解释变量与其 他解释变量相乘作为新的解释变量出现在模型中, 以达到其调整设定模型斜率系数的目的。
收 入
还可将多个虚拟变量引入模型中以考察多种“定 性”因素的影响。
如在上述职工薪金的例中,再引入代表学历的 虚拟变量D2:
1 本科及以上学历
D2
=
0
本科以下学历
职工薪金的回归模型可设计为:
Yt = b 0 + b1 Xt + b 2 D1 + b 3 D2 + mt
于是,不同性别、不同学历职工的平均薪 金分别为:
临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界 指标的虚拟变量模型来反映。
当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。
OLS法得到该模型的回归方程为
则两时期进口消费品函数分别为:
当t<t*=1978年, Dt = 0
ˆ y t= b ˆ 0+ b ˆ 1 x t+ a ˆx t x t D t