第八章虚拟变量模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Di 0
i
2.检验模型结构的稳定性 设根据两个样本估计的回归模型分别为: 样本1: Yi=a1+b1xi +ε i 样本2: Yi=a2+b2xi +ε i 1 样本2 设置虚拟变量: D 0 样本1
估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+ε 其中,XDi=xi*Di。
ˆ yi 57.61 0.0119 xi 中高收入家庭: 89.48 0.003xi 此例说明了三个问题: ①如何设置和在模型中引入虚拟变量; ②如何测量定性因素(即收入层次)的影响; ③如何区分不同类型的模型(即需求函数)。
2.虚拟变量的设置原则
⑴ 一个因素多个类型 对于有m个不同属性的定性因素,应该设置m-1个 虚拟变量来反映该因素的影响。 例如,设公司职员的年薪与工龄和学历有关。 学历分成三种:大专以下、本科、研究生。为反映 “学历” 的影响,应该设置两个虚拟变量:
使用虚拟变量能如 实描述不同阶段的 经济关系,又未减 少估计模型时样本 容量,保证了估计 精度。
4.混合回归 能否将变量的时序数据和横截面数据混合建模 【例8】教材P143表3-9为我国城镇居民1998年、1999 年全年人均消费支出和可支配收入的统计资料。试 使用混合样本数据估计我国城镇居民消费函数。 设1998年、1999年我国城镇居民消费函数分别为: 1998年:Yi=a1+b1xi +ε i 1999年:Yi=a2+b2xi +ε i
1 D 0
中高收入家庭 低收入家庭
将我国城镇居民的彩电需求函数设成: Yi=a+bxi+α Di+β XDi+ε i DATA D1 (由于D是EViews软件的保留字,所以将虚拟变量取 名为D1;另外,此时也可以用SMPL和GENR命令直 接生成D1变量) GENR XD=X*D1 生成变量XD LS Y C X D1 XD 估计需求函数 结果如下图所示:

一、虚拟变量(dummy)及其作用
1.定义
反映品质指标变化、数值只取0和1的人工变量, 用符号D来表示。 1 城镇居民 1 销售旺季 如: D D 0 农村居民 0 销售淡季
1 D 0
政策紧缩
政策宽松
1 D 0
本科以上学历
本科以下学历
变量的划分应遵循穷举与互斥原则。
为比较两年的消费函数是否有显著差异,设置虚拟 变量: 1 1999年
D 0
1998年
并且合并两年的数据,估计以下模型: Yi= a1 +b1xi+α Di+β XDi +ε i 其中α =a2-a1 ,β =b2-b1。
使用EViews软件的估计过程如下: CREATE U 16 建立工作文件 DATA Y X (输入1998、1999年消费支出和收入的数据,1~8期 为1998年资料,9~16期为1999年资料) SMPL 1 8 样本期调为1998年
第七章 虚拟变量
【教学目的及要求】 一、虚拟变量及其作用 二、虚拟变量的设定 三、虚拟变量的特殊应用 四、虚拟被解释变量 课外练习 参考文献
教学目的及要求
了解虚拟变量的意义和作用,掌握虚拟解释 变量的引入方式与设置原则,掌握EViews软 件的相关应用。 掌握虚拟解释变量在调整季节波动、检验模 型的稳定性、分段回归和混合回归等方面的 特殊应用。 了解线性概率模型、Logit模型和Probit模型 的基本思想和估计方法。
1 D1 0
本科 其他
1 D2 0
研究生 其他
而将年薪模型取成(假设以加法方式引入):
Yi=a+bxi+α 1D1i+α 2D2i +ε 其等价于:
i
Yi=a+bxi+ε i Yi=(a+α 1)+ bxi+ε Yi=(a+α 2)+ bxi+ε
i i
大专以下(D1=D2=0) 本科(D1=1,D2=0) 研究生(D1=0,D2=1)
(3)一般方式 同时用加法与乘法方式引入虚拟变量,然后再利 用t检验判断α 、β 是否显著的不等于零,进而确 定虚拟变量的具体引入方式。 【例7】教材P126表3-8列出了1998年我国城镇居民 人均收入与彩电每百户拥有量的统计资料。
观察相关图
操作演示
从相关图可以看出, 前3 个样本点与后 5 个样 本点存在较大差异,因 此,可设置虚拟变量反 映“收入层次”:
2.作用
⑴可以描述和测量定性因素的影响。
⑵能够正确反映经济变量之间的相互关系,提高模 型的精度。 ⑶便于处理异常数据。 即将异常数据作为一个特殊的定性因素
1 D 0
异常时期 正常时期
二、虚拟变量的设定
1.虚拟变量的引入方式 (1)加法方式 Yi=a+bxi+α Di+ε i a+α 等价为: 当Di =0时:Yi=a+bxi+ε i a 当Di =1时:Yi=(a+α )+bxi+ε i
GENR SMPL GENR D1=0 9 16 D1=1 输入虚拟变量的值 样本期调为1999年 输入虚拟变量的值
SMPL 1 16 GENR XD=X*D1 LS Y C X D1 XD 估计结果为: 操作演示
t统计量
样本期调至1998~1999年 生成XD的值 利用混合样本估计模型
R2的值
调整的R2值
1 D1 0
农村居民 城镇居民
1 D2 0
高收入家庭 低收入家庭
这样可以反映各类居民家庭的住房消费情况: 城市低收入家庭 城市高收入家庭 农村低收入家庭 农村高收入家庭 (D1=0,D2=0) (D1=0,D2=1) (D1=1,D2=0) (D1=1,D2=1)
思考:若是多因素、多个属性水平的问题,如何设置?
课外练习

1.简述虚拟变量的引入方式及其影响。 2.设置虚拟变量时应遵守哪些原则? 3.虚拟变量有哪些特殊应用。 4.教材P187第18-21题
参考文献





1.张晓峒.计量经济学软件EViews使用指南.南开 大学出版社,2004 2.庞皓.计量经济学.科学出版社,2005 3.J.M.伍德里奇.计量经济学导论.中国人民 大学出版社,2003 4.古扎拉蒂.计量经济学基础(第四版).林少宫 译.中国人民大学出版社,2006 5.易丹辉.数据分析与EViews应用,中国统计出 版社,2002 6.高铁梅.计量经济分析方法与建模——EViews 应用及实例,清华大学出版社,2006
对应的t统 计量值
R2的值
调整的R2值 SE的值
我国城镇居民彩电需求函数的估计结果为: ˆ yi 57.61 0.0119 xi 31.8731Di 0.0088 XDi 结果表明不同收入家庭对彩电的消费需求,在 截距和斜率上都存在着明显差异。
低收入家庭: ˆ yi (57.61 31.8731) (0.0119 0.0088) xi
三、虚拟变量的特殊应用
1.调整季节波动 例如,用季度数据分析某公司利润y与销售 收入x之间的相互关系时,为研究四个季度的季 节性影响,引入三个虚拟变量(设第1季度为基 础类型): 第i+1季度 i=1,2,3 1
其他季度 利润函数可取为 : Yi=a+bxi+ α 1D1i+ α 2D2i + α 3D3i + ε
D=1 α D=0
以加法方式引入,反映定性因素对截距的影响
(2)乘法方式
Yi=a+bxi+β XDi+ε i 其中:XDi=Xi*Di, 上式等价于: a 当Di =0时:Yi=a+bxi+ε i 当Di =1时:Yi=a+(b+β )xi+ε
D=1
β
D=0
i
以乘法方式引入,可反映定性因素对斜率的影 响,系数β描述了定性因素的影响程度。
3.分段回归
1 设虚拟变量为: D 0
x>x* x<x*
分段回归模型设置成: Yi= a+bxi+β (xi-x*)Di+ε i 其中,x*是已知的临界水平(分段点)。 这样各段的函数为: Yi= a +bxi+ε i x<x* Yi= (a-β )+(b+β )xi+ε i x>x*
三类年薪函数的差异情况如下图所示:
年薪 α2 -α1 α1
研究生 本科 大专以下 工龄
设置虚拟变量D或增设D3行吗? D=
2 1 0 博士研究生
1 硕士研究生 D2 0 本科及以下
研究生
Leabharlann Baidu其他
(2)多个因素各两种类型 如果有m个定性因素,且每个因素各有两个不 同的属性类型,则引入 m 个虚拟变量。 例如,研究居民住房消费函数时,考虑到城乡 的差异以及不同收入层次的影响,将消费函数取成: yi=a+bxi+α 1D1i+α 2D2i +ε i 其中y ,x分别是居民住房消费支出和可支配收 入,虚拟变量设为:
i
第(1)种情况下模型结构是稳定的, 利用t检验判断D、XD系数的显著性,得到四种 其余情况都表明模型结构不稳定。 重合回归检验结果: (1)a2=a1,b2=b1,两个回归模型没有显著差异。 (2)a2≠a1 ,b2=b1 ,两个回归模型之间的差异仅仅 平行回归 表现在截距上。 (3)a2=a1 ,b2≠b1 ,两个回归模型的截距相同,但 汇合回归 斜率存在显著差异。 (4)a2≠a1,b2≠b1,表明两个回归模型完全不同。 相异回归
相关文档
最新文档