(优选)虚拟解释变量模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(优选)虚拟解释变量模型
2020/9/20
1
一般性的描述
在回归模型中,目前所遇的所有变量均为定量变 量(可直接测度、数值性),例如GDP,工资, 收入、受教育年数,销售额等。
在实际建模中,一些定性变量的影响也是不可忽 视的。例如,研究某个企业的销售水平,产业属 性(制造业、零售业)、所有制(私营、非私 营)、地理位置(东、中、西部)、管理者的素 质、不同的收入水平等也是值得考虑的影响因素, 但这些因素共同的特征是定性描述的。
Y X
Eviews的实现
需要建立虚拟变量!
4、一个定量和多个定性变量解释变量
例:不同人群组的衣着消费函数模型
Yi 1 2D2i 3D3i Xi ui
Xi —收入水平;Yi —年服装消费支出
1,女性
D 2
0,男性
1,大专及大专以上
D 3
0,其他
请同学们自己写出不同人群组具体的消费函数模型?
问题是,依据现有的回归分析知识,如何对非定 量因素进行回归分析?以及为什么对定性因素要 采用回归分析?
本章讨论
☻虚拟变量 ☻虚拟解释变量回归 ☻案列分析
第一节 虚拟变量
一、虚拟变量的基本概念
前面讨论的数量因素(变量)可以直接度量,但质的因素 (如:性别、职业、文化程度、所有制形式等定性因素)不 能直接度量。
讨论:虚拟变量的取值可否为“1”或“2”,甚 至“3”、“4”、“5”……???
3、虚拟变量在单一方程中,可以作为解释变 量,也可以作为被解释变量。
虚拟被解释变量的研究是当前计量经济学研究 的前沿领域,如MacFadden、Heckmen等人 的微观计量经济学研究,大量涉及到虚拟被解 释变量的分析。
为了在模型中反映这些属性因素的影响,人们采取了构造 人工变量的方法——当某种属性存在时人工变量的取值为1, 当某种属性不存在时人工变量的取值为0。
虚拟变量:取值为0和1的人工变量。(哑变量、双值变 量、定性变量、二元型变量等,D or Dum)
二、虚拟变量的设置原则
1、在含有截矩项的模型中,定性因素有m个相互排 斥的类型或特征,模型中只能引入( m-1)个虚拟 变量,否则会陷入“虚拟变量陷阱”,产生完全共 线;
例2:虚拟变量
(1)D
1 0
男 女
(2)D
1 0
改革开放前 改革开放后
(3)D1
1 0
天气阴 其它
1 天气雨 D2 0 其 它
( 1,0) 即:(D1, D2 ) ( 0, 1)
( 0,0)
天气阴 天气雨 天气晴
二、虚拟变量的设置原则(续)
2、虚拟变量取“0”或“1”应从分析问题的目的 出发予以界定(多以“0”代表基础类);
本课程只是讨论虚拟解释变量的问题,包括如 何在回归模型引入虚拟解释变量(包括加法形 式和乘法形式)、以及不同方式引入虚拟解释 变量后的作用。
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000
"for his development of theory and methods for analyzing selective samples”
例1:居民住房消费支出Y、居民可支配收入X的模
型: Yi 0 1 X i ui (1)
为了将“城镇居民“、”农村居民“对Y的影响反映
模型中,设 1
D1i 0
城镇居民 其它
则模型(1)为
Yi 0 1Xi 1D1i ui (2)
D1i 1: Yi (0 1) 1X i ui 城镇居民消费摸型
以居民收入为例:
例:Yi 0 1Di i
其中:Di
1 0
Yi (0 1) i 城镇
Yi 0 i
农村
( 比较的基础:农村)
城镇 农村
2、一个定量和一个两种属性定性解释变量
例:Yi 0 1Di X i i
Biblioteka Baidu
其中:Di
1 0
城镇 农村
Y :消费支出;X:收入
Di 1: Yi (0 1) X i i Di 0 : Yi 0 X i i
D1i 0 : Yi 0 1X i ui
农村居民消费摸型
若引入m=2个虚拟变量,则模型(2)为:
Yi 0 1Xi 1D1i 2D2i ui (3)
1 城镇居民 D1i 0 农村居民
1 农村居民 D2i 0 城镇居民
任一家庭都有:D1i+D2i=1,即D1i=1-D2i(完全共线)。
大专以下男性:Yi 1 X i
大专以下女性:Yi 1 2 X i
James J Heckman USA
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000
"for his development of theory and methods for analyzing discrete choice"
城镇 农村
Y
X
3、一个定量和一个多种属性定性解释变量
例: 啤酒销量Y、人均收入X、季节D
Yi 0 1D1 2D2 3D3 X i i
其中:D1
1 0
春季 其它
1 夏季 D2 0 其它
1 秋季 D3 0 其它
春季 Yi (0 1) X i i 夏季 Yi (0 2) X i i 秋季 Yi (0 3) X i i 冬季 Yi 0 X i i (比较的基础 — 冬季)
Daniel L McFadden USA
与麦克法登教授在林岛欢迎宴会上合影
三、引入虚拟变量的作用
1、分离异常因素的影响 如观察我国社会总产值的时间趋势,须考虑 三年自然灾害这一特殊因素的影响
2、检验不同属性类型对因变量的作用
3、提高模型的精度 引入虚拟变量后,相当于把不同属性类型的 样本合并,即相当于扩大了样本容量,从而 可提高模型的精度
第二节 虚拟解释变量回归
加法类型
一个定性解释变量 一个定量和一个两种属性定性解释变量 一个定量和一个多种属性定性解释变量 一个定量和多个定性变量解释变量
乘法类型
结构变化的检验
交互效应分析
分段线性回归
一、加法类型
设定的虚拟变量以相加的形式出现(四类),作用 是改变了截距项。(截距变动模型)
1、一个定性解释变量
2020/9/20
1
一般性的描述
在回归模型中,目前所遇的所有变量均为定量变 量(可直接测度、数值性),例如GDP,工资, 收入、受教育年数,销售额等。
在实际建模中,一些定性变量的影响也是不可忽 视的。例如,研究某个企业的销售水平,产业属 性(制造业、零售业)、所有制(私营、非私 营)、地理位置(东、中、西部)、管理者的素 质、不同的收入水平等也是值得考虑的影响因素, 但这些因素共同的特征是定性描述的。
Y X
Eviews的实现
需要建立虚拟变量!
4、一个定量和多个定性变量解释变量
例:不同人群组的衣着消费函数模型
Yi 1 2D2i 3D3i Xi ui
Xi —收入水平;Yi —年服装消费支出
1,女性
D 2
0,男性
1,大专及大专以上
D 3
0,其他
请同学们自己写出不同人群组具体的消费函数模型?
问题是,依据现有的回归分析知识,如何对非定 量因素进行回归分析?以及为什么对定性因素要 采用回归分析?
本章讨论
☻虚拟变量 ☻虚拟解释变量回归 ☻案列分析
第一节 虚拟变量
一、虚拟变量的基本概念
前面讨论的数量因素(变量)可以直接度量,但质的因素 (如:性别、职业、文化程度、所有制形式等定性因素)不 能直接度量。
讨论:虚拟变量的取值可否为“1”或“2”,甚 至“3”、“4”、“5”……???
3、虚拟变量在单一方程中,可以作为解释变 量,也可以作为被解释变量。
虚拟被解释变量的研究是当前计量经济学研究 的前沿领域,如MacFadden、Heckmen等人 的微观计量经济学研究,大量涉及到虚拟被解 释变量的分析。
为了在模型中反映这些属性因素的影响,人们采取了构造 人工变量的方法——当某种属性存在时人工变量的取值为1, 当某种属性不存在时人工变量的取值为0。
虚拟变量:取值为0和1的人工变量。(哑变量、双值变 量、定性变量、二元型变量等,D or Dum)
二、虚拟变量的设置原则
1、在含有截矩项的模型中,定性因素有m个相互排 斥的类型或特征,模型中只能引入( m-1)个虚拟 变量,否则会陷入“虚拟变量陷阱”,产生完全共 线;
例2:虚拟变量
(1)D
1 0
男 女
(2)D
1 0
改革开放前 改革开放后
(3)D1
1 0
天气阴 其它
1 天气雨 D2 0 其 它
( 1,0) 即:(D1, D2 ) ( 0, 1)
( 0,0)
天气阴 天气雨 天气晴
二、虚拟变量的设置原则(续)
2、虚拟变量取“0”或“1”应从分析问题的目的 出发予以界定(多以“0”代表基础类);
本课程只是讨论虚拟解释变量的问题,包括如 何在回归模型引入虚拟解释变量(包括加法形 式和乘法形式)、以及不同方式引入虚拟解释 变量后的作用。
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000
"for his development of theory and methods for analyzing selective samples”
例1:居民住房消费支出Y、居民可支配收入X的模
型: Yi 0 1 X i ui (1)
为了将“城镇居民“、”农村居民“对Y的影响反映
模型中,设 1
D1i 0
城镇居民 其它
则模型(1)为
Yi 0 1Xi 1D1i ui (2)
D1i 1: Yi (0 1) 1X i ui 城镇居民消费摸型
以居民收入为例:
例:Yi 0 1Di i
其中:Di
1 0
Yi (0 1) i 城镇
Yi 0 i
农村
( 比较的基础:农村)
城镇 农村
2、一个定量和一个两种属性定性解释变量
例:Yi 0 1Di X i i
Biblioteka Baidu
其中:Di
1 0
城镇 农村
Y :消费支出;X:收入
Di 1: Yi (0 1) X i i Di 0 : Yi 0 X i i
D1i 0 : Yi 0 1X i ui
农村居民消费摸型
若引入m=2个虚拟变量,则模型(2)为:
Yi 0 1Xi 1D1i 2D2i ui (3)
1 城镇居民 D1i 0 农村居民
1 农村居民 D2i 0 城镇居民
任一家庭都有:D1i+D2i=1,即D1i=1-D2i(完全共线)。
大专以下男性:Yi 1 X i
大专以下女性:Yi 1 2 X i
James J Heckman USA
The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000
"for his development of theory and methods for analyzing discrete choice"
城镇 农村
Y
X
3、一个定量和一个多种属性定性解释变量
例: 啤酒销量Y、人均收入X、季节D
Yi 0 1D1 2D2 3D3 X i i
其中:D1
1 0
春季 其它
1 夏季 D2 0 其它
1 秋季 D3 0 其它
春季 Yi (0 1) X i i 夏季 Yi (0 2) X i i 秋季 Yi (0 3) X i i 冬季 Yi 0 X i i (比较的基础 — 冬季)
Daniel L McFadden USA
与麦克法登教授在林岛欢迎宴会上合影
三、引入虚拟变量的作用
1、分离异常因素的影响 如观察我国社会总产值的时间趋势,须考虑 三年自然灾害这一特殊因素的影响
2、检验不同属性类型对因变量的作用
3、提高模型的精度 引入虚拟变量后,相当于把不同属性类型的 样本合并,即相当于扩大了样本容量,从而 可提高模型的精度
第二节 虚拟解释变量回归
加法类型
一个定性解释变量 一个定量和一个两种属性定性解释变量 一个定量和一个多种属性定性解释变量 一个定量和多个定性变量解释变量
乘法类型
结构变化的检验
交互效应分析
分段线性回归
一、加法类型
设定的虚拟变量以相加的形式出现(四类),作用 是改变了截距项。(截距变动模型)
1、一个定性解释变量