第八章虚拟解释变量模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、在含有截矩项的模型中,定性因素有m个相互排 斥的类型或特征,模型中只能引入( m-1)个虚拟 变量,否则会陷入“虚拟变量陷阱”,产生完全共 线;
例1:居民住房消费支出Y、居民可支配收入X的模
型: Yi 0 1 X i ui (1)
为了将“城镇居民“、”农村居民“对Y的影响反映
模型中,设 1
Di 1: Yi (0 1) X i i Di 0 : Yi 0 X i i
城镇 农村
Y
2020/7/26
17
X
3、一个定量和一个多种属性定性解释变量
例: 啤酒销量Y、人均收入X、季节D
Yi 0 1D1 2D2 3D3 X i i
S X u
t
0
1t
t
2020/7/26
2
一般性的描述
在回归模型中,目前所遇的所有变量均为定量变 量(可直接测度、数值性),例如GDP,工资, 收入、受教育年数,销售额等。
在实际建模中,一些定性变量的影响也是不可忽 视的。例如,研究某个企业的销售水平,产业属 性(制造业、零售业)、所有制(私营、非私 营)、地理位置(东、中、西部)、管理者的素 质、不同的收入水平等也是值得考虑的影响因素, 但这些因素共同的特征是定性描述的。
问题是,依据现有的回归分析知识,如何对非定 量因素进行回归分析?以及为什么对定性因素要 采用回归分析?
2020/7/26
3
本章讨论Leabharlann Baidu
☻虚拟变量 ☻虚拟解释变量回归 ☻案列分析
2020/7/26
4
第一节 虚拟变量
一、虚拟变量的基本概念
前面讨论的数量因素(变量)可以直接度量,但质的因素 (如:性别、职业、文化程度、所有制形式等定性因素)不
1 城镇居民 D1i 0 农村居民
1 农村居民 D2i 0 城镇居民
任一家庭都有:D1i+D2i=1,即D1i=1-D2i(完全共线)。
2020/7/26
7
例2:虚拟变量
(1)D
1 0
男 女
(2)D
1 0
改革开放前 改革开放后
(3)D1
1 0
天气阴 其它
1 天气雨 D2 0 其 它
( 1,0) 即:(D1, D2 ) ( 0, 1)
虚拟被解释变量的研究是当前计量经济学研究 的前沿领域,如MacFadden、Heckmen等人 的微观计量经济学研究,大量涉及到虚拟被解 释变量的分析。
本课程只是讨论虚拟解释变量的问题,包括如 何在回归模型引入虚拟解释变量(包括加法形 式和乘法形式)、以及不同方式引入虚拟解释 变量后的作用。
2020/7/26
2020/7/26
14
第二节 虚拟解释变量回归
加法类型
一个定性解释变量 一个定量和一个两种属性定性解释变量 一个定量和一个多种属性定性解释变量 一个定量和多个定性变量解释变量
乘法类型
结构变化的检验
交互效应分析
分段线性回归
2020/7/26
15
一、加法类型
设定的虚拟变量以相加的形式出现(四类),作用 是改变了截距项。(截距变动模型)
10
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000
"for his development of theory and methods for analyzing selective samples”
D1i 0
城镇居民 其它
2020/7/26
6
则模型(1)为
Yi 0 1Xi 1D1i ui (2)
D1i 1: Yi (0 1) 1X i ui 城镇居民消费摸型
D1i 0 : Yi 0 1X i ui
农村居民消费摸型
若引入m=2个虚拟变量,则模型(2)为:
Yi 0 1Xi 1D1i 2D2i ui (3)
Econometrics
第八章 虚拟解释变量模型
—— 单一方程模型的专门问题(1)
2020/7/26
1
问题的提出
建国后中国城镇居民家庭的储蓄函数研究
数据来源:http://www.stats.gov.cn 根据1952—2002年人均收入和人均储蓄的数据资料
(以1952年的物价水平为100),建立储蓄模型:
1、一个定性解释变量
以居民收入为例:
例:Yi 0 1Di i
其中:Di
1 0
Yi (0 1) i 城镇
Yi 0 i
农村
( 比较的基础:农村)
2020/7/26
城镇 农村
16
2、一个定量和一个两种属性定性解释变量
例:Yi 0 1Di X i i
其中:Di
1 0
城镇 农村
Y :消费支出;X:收入
能直接度量。
为了在模型中反映这些属性因素的影响,人们采取了构造 人工变量的方法——当某种属性存在时人工变量的取值为1, 当某种属性不存在时人工变量的取值为0。
虚拟变量:取值为0和1的人工变量。(哑变量、双值变 量、定性变量、二元型变量等,D or Dum)
2020/7/26
5
二、虚拟变量的设置原则
( 0,0)
天气阴 天气雨 天气晴
2020/7/26
8
二、虚拟变量的设置原则(续)
2、虚拟变量取“0”或“1”应从分析问题的目的 出发予以界定(多以“0”代表基础类);
讨论:虚拟变量的取值可否为“1”或“2”,甚 至“3”、“4”、“5”……???
2020/7/26
9
3、虚拟变量在单一方程中,可以作为解释变 量,也可以作为被解释变量。
Daniel L McFadden
USA
2020/7/26
12
与麦克法登教授在林岛欢迎宴会上合影
2020/7/26
13
三、引入虚拟变量的作用
1、分离异常因素的影响 如观察我国社会总产值的时间趋势,须考虑 三年自然灾害这一特殊因素的影响
2、检验不同属性类型对因变量的作用
3、提高模型的精度
引入虚拟变量后,相当于把不同属性类型的 样本合并,即相当于扩大了样本容量,从而 可提高模型的精度
James J Heckman
USA
2020/7/26
11
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000
"for his development of theory and methods for analyzing discrete choice"