第六章虚拟变量回归PPT课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y ˆ i 5 .6 7 0 1 .0x 1 i 3 1 .8 1 9 D 7 i 0 3 .01 X 0i 8 D
样本1: Yi=a1+b1xi +εi
样本2: Yi=a2+b2xi +εi
设置虚拟变量: D
1
0
样本2 样本1
估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi
其中,XDi=xi*Di。
15
利用t检重验第合判其(回断余1归D)情、检种况X验情都D结况系表果下数明:模的模型显型结著结构性构是,不稳得稳定到定的四。,种 (1)a2=a1,b2=b1,两个回归模型没有显著差异。 (2)a2≠a1,b2=b1,两个回归模型之间的差异仅仅
(由于D是EViews软件的保留字,所以将虚拟变量取 名为D1;另外,此时也可以用SMPL和GENR命令直 接生成D1变量)
GENR XD=X*D1
生成变量XD
LS Y C X D1 XD 估计需求函数
结果如下图所示:
19
对应的t统 计量值
R2的值 调整的R2值 SE的值
我国城镇居民彩电需求函数的估计结果为:
思考:若是多因素、多个属性水平的问题,如何设置?
四、虚拟变量的引入方式
(一)加法方式
Yi=a+bxi+αDi+εi
a+α
等价为:
当Di =0时:Yi=a+bxi+εi a 当Di =1时:Yi=(a+α)+bxi+εi
D=1
α D=0
以加法方式引入,反映定性因素对截距的影响
1.临时虚拟
2.调整季节波动
3.定性数据的虚拟处理
例如,用季度数据分析某公司利润y与销售
收入x之间的相互关系时,为研究四个季度的季
节性影响,引入三个虚拟变量(设第1季度为基
础类型): 1
Di
0
第i+1季度 其他季度
i=1,2,3
利润函数可取为 : Yi=a+bxi+ α1D1i+ α2D2i + α3D3i + εi
(二)乘法方式
三类年薪函数的差异情况如下图所示:
年薪 α1
α2 -α1
研究生 本科 大专以下
工龄
设置虚拟变量D或增设D3行吗?
2 D= 1
0
博士研究生
硕士研究生 D 2
本科及以下
1
0
研究生 其他
(2)多个因素各两种类型
如果有m个定性因素,且每个因素各有两个不 同的属性类型,则引入 m 个虚拟变量。
例如,研究居民住房消费函数时,考虑到城乡 的差异以及不同收入层次的影响,将消费函数取成: yi=a+bxi+α1D1i+α2D2i +εi
计量经济学
第六章 经典单方程计量经济学模型:
专门问题 第一节 虚拟变量回归
1
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校 生的消费行为呈现多元化的结构。人际交往消费、 手机类消费、衣着类消费、化妆品类消费、电脑类 消费、旅游类消费占有较大的比例;而食品类消费、 学习用品类消费不突显。 显然,男女生在消费上存在差异。为了了解男、女 生的消费支出结构差异,应当如何建立模型?
3
虚拟变量回归
主要讨论:
●虚拟变量及其作用 ●虚拟变量设定 ●虚拟解释变量的回归
一、定义
反映品质指标变化、数值只取0和1的人工变量,
用符号D来表示。
如:
D
Fra Baidu bibliotek
1
0
城镇居民 农村居民
1
D
0
销售旺季 销售淡季
D
1
0
政策紧缩 政策宽松
1
D
0
本科以上学历 本科以下学历
变量的划分应遵循穷举与互斥原则。
二、作用 1.可以作为属性因素的代表。 2.作为某些非精确计量的数量因素的代表。 3.作为某些偶然因素或政策因素的代表。
1 异常时期
D
0
正常时期
三、虚拟变量的设置原则
⑴ 一个因素多个类型
对于有m个不同属性的定性因素,应该设置m-1个 虚拟变量来反映该因素的影响。
例如,设公司职员的年薪与工龄和学历有关。 学历分成三种:大专以下、本科、研究生。为反映 “学历” 的影响,应该设置两个虚拟变量:
1 本科
D1
0
其他
1 研究生
D2
0
其他
而将年薪模型取成(假设以加法方式引入):
Yi=a+bxi+α1D1i+α2D2i +εi 其等价于:
Yi=a+bxi+εi Yi=(a+α1)+ bxi+εi Yi=(a+α2)+ bxi+εi
大专以下(D1=D2=0) 本科(D1=1,D2=0) 研究生(D1=0,D2=1)
其中y ,x分别是居民住房消费支出和可支配收 入,虚拟变量设为:
1 农村居民
D1
0
城镇居民
1 高收入家庭
D2
0
低收入家庭
这样可以反映各类居民家庭的住房消费情况:
城市低收入家庭 城市高收入家庭 农村低收入家庭 农村高收入家庭
(D1=0,D2=0)
(D1=0,D2=1) (D1=1,D2=0) (D1=1,D2=1)
Yi=a+bxi+βXDi+εi
D=1
其中:XDi=Xi*Di, 上式等价于:
a
当Di =0时:Yi=a+bxi+εi
β
D=0
当Di =1时:Yi=a+(b+β)xi+εi
以乘法方式引入,可反映定性因素对斜率的影 响,系数β描述了定性因素的影响程度。
作用:检验模型结构的稳定性
设根据两个样本估计的回归模型分别为:
面临的问题:如何把男女生这样的非数量变量引 入方程?
2
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化一种思路。
表现在截距平上行。回归 (斜3)率a存2=a在1,显汇b著合2≠差回b异归1,。两个回归模型的截距相同,但 (4)a2≠a1,b2≠b1,表明两个回归模型完全不同。
相异回归
16
一般方式 : 同时用加法与乘法方式引入虚拟变量,然后再利
用t检验判断α 、β是否显著的不等于零,进而确 定虚拟变量的具体引入方式。
【例】现有1998年我国城镇居民人均收入与彩 电每百户拥有量的统计资料。
17
观察相关图
从相关图可以看出, 前3个样本点与后5个样 本点存在较大差异,因 此,可设置虚拟变量反 映“收入层次”:
1
D
0
中高收入家庭 低收入家庭
18
将我国城镇居民的彩电需求函数设成:
Yi=a+bxi+αDi+βXDi+εi DATA D1
相关文档
最新文档