《虚拟变量》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分析步骤
• 对数据进行对数变化: • 在不引入虚拟变量的情况下进行回归 • 引入虚拟变量 D1、D2、D3 • 删除D2再进行检验 • 删除常数项 • 删除 D3 • 保留D3
对数据进行对数变化
• 对数据进行对数变化,其命令为:
– genr lgdp=log(gdp) – genr ll=log(l) – genr lk=log(k)
0
1
0
B
1
;
Baidu Nhomakorabea
k
0
a
1
k
案例分析
• 在此例中我们考虑东、中和西部地方经济的增长方式, 在此选取了2001年的大多数代表性省份的总产出、劳 动力和固定资产投入来分析,我们把样本分为四个研 究范围,即(1)、东部地区领先组:北京、天津、上 海、辽宁;(2)东部地区领先组:浙江、江苏、广东、 福建和海南,本人曾试图把山东加入,但加入后对分 析的结果影响很大,证明山东省并不属于这一个范围; (3)中西部领先组:山西、内蒙、吉林、黑龙江、湖 北、江西、西藏、青海、宁夏、、甘肃、新疆;(4)、 中西部地赶超组:安徽、河南、湖南、四川、广西、 云南、陕西和贵州。样本划分的方法来自于《经济学 动态》2002.8中《技术效率、配置效率与劳动力市扭曲》 一文。
• 一般地,在虚拟变量的设置中,基础类型,肯定类型 取值为1,否定类型取值为0。引入虚拟变量之后,回 归方程中同时含有一般解释变量和虚拟变量,这种结
构的回归方程称为虚拟变量模型。
虚拟变量的引入
• 加法方式 – 当虚拟变量对解释变量的影响只是短期时,一般采用加法方式 引入。此 时虚拟变量与其它解释变量在模型中是相加的关系。
• 乘法方式 – 在一个较长的时期内,
虚拟变量设置原则
• 虚拟变量引入的原则为:如果有M种互斥的属性类型,在模型中引入M-1个虚 拟变量。
• 例如,要引入区分春夏秋冬四个不同季节的虚拟变量,此时M=4,应引入M1=3个虚拟变量。此时有模型:
k
Yt 0 i X it D k1 1t D k2 2t D k3 3t D k4 4t ut i 1
• 其中
D 1第1季I 1,2,3,4
it
0其他
• 将上式写成矩阵形式
Y
( XD)
B A
U
式中
1 x11 x21 xk1 1 0 0 0 1 x12 x22 xk 2 0 1 0 0
0 0 1 0
( XD)
0 0 0 1
1
x1n
x2n
xkn
0
0
在不引入虚拟变量的情况下进行回归
• 在不引入虚拟变量的情况下进行回归,命令为: • ls lgdp c ll lk d1 d2 d3 • 从下面的分析结果可以看出,该式中的常数项的T检验值不显著,模
型的拟优度很好,模型整体检验也很显著,且不存在自相关性。我们 相关系数检验,发现劳动力与固定资产的投入的相关系数为0.78,一 般当解释变量的相关系数不超过0.8时,可以认为模型不存在自相关性, 此时不作变换。 • 其结果如下:
OLS估计1
引入虚拟变量 D1、D2、D3
• 由于我们想分析东、中、西部区的经济增长方式是否存在差异,因此根据前 面的分析引入三个变量,其中D1表示东部地区领组,D2表示东部地区赶超组, D3表示中西部地区领先组。在此基本上进行分析,其命令为: ls lgdp ll lk d1 d2 d3
• 其结果为:
OLS估计4
删除 常数项
• 此时D3的系数从严格意义勉强可能通过,为了得到更好的拟合值,我们把D3 删除,再进行分析,结果如下图
• 此时拟合度没有保留D3的好,而且D1的显著性明显降低,证明删除D3是不优 的选择。所以我们保留D3
OLS估计5
分析结果综述
• 从上面的分析结果我们可以看出,在引入虚拟变 量后,模型的拟合度优于没有引入虚拟变量前的 拟合度,但最重要的是给我们分析问题提供了很 好的依据。在我国依然以资产投入为主,依然走 着粗放形经济增长的道路,而且东部赶超组与中 西部地区赶超组走着同样的道路,技术在经济增 长过程中的作用不大,与这两个地方的发展相比, 东部地区的注重到技术的作用,同时领先组的发 展环境也为经济的发展作出了不可忽视的贡献。
OLS估计2
删除D2再进行检验
• 从结果我们可以看出模型的拟合和模型整体显著,且不存在自相关, 但常数项和D2的系数不显著,我们可以先删除D2再进行检验,命令 为:
• s lgdp c ll lk d1 d3 • 结果如下:
OLS估计3
删除d3
• 此时常数项的系数依然不显 著,我们再删除常数项,进 行同样的分析,结果为:
虚拟变量及虚拟变量方程的定义
武汉大学经济学系数量经济学教研室《实践教改项目组》 编
• 在经济变量的讨论中,经常要考虑属性因素的影响, 例如职业、地区、季节、战争、文化程度、自然灾害 等,它们的特点不能直接度量。为了在模型中反映这 些属性因素的影响,必须将它们“量化”。根据其属
性类型,构造只取“0”或“1”的人工变量,这就是虚 拟变量,通常记为变量D。