计量经济学6虚拟变量模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

X k1 X k2 X k3 X k4 X k5 X k6
1 0 0 0 0 1 0 0
0
0
1
0
0 0 0 1
0
1
0
0
1 0 0 0
0
β
1 k
1
α
2 3 4
显然,(X,D)中的第1列可表示成后4列的线性组 合,参数无法唯一求出。(完全多重共线性)
这就是所谓的“虚拟变量陷阱”,应避免。
则模型陷入了“虚拟变量陷阱”。
“虚拟变量陷阱”的实质是:完全多重共线性。
三、自变量为定性变量
含有虚拟变量的模型称为虚拟变量模型。 ▪ 虚拟变量做为解释变量引入模型有两种基本方 式:加法方式和乘法方式。
Yi 0 1 X i 2 Di i
Yi 0 1 X i 3 Di 4 (Di X i ) i
虚拟变量(dummy):
计量经济学中,将取值为0和1的人工变量称为虚拟 变量。虚拟变量也称:哑变量、定性变量、二值变 量等等。通常用字母D或DUM加以表示。
▪ 例如,反映文化程度的虚拟变量可取为:
1, 本科学历 D=
0, 非本科学历
二、虚拟变量的设置规则
1、“0”和“1”选取原则
虚拟变量取“1”或“0”。 从理论上讲,
第六章 虚拟变量模型
男女大学生消费真有差异吗?
男女生在消费上存在差异。为了了解男、 女生的消费支出结构差异,应当如何建 立模型? 面临的问题:如何把男女生这样的非数 量变量引方程?
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要 影响。例如,研究某个企业的销售水平,产业属性 (制造业、零售业)、所有制(私营、非私营)、 地理位置(东、中、西部)、管理者的素质、不同 的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析?
1 0
男 女
(2)
D
=
1 0
改革开放以后 改革开放以前
(3)
D1
=
1 0
天气阴 (4) 其他
D2
=Fra Baidu bibliotek
1 0
天气雨 其他
如:
D
1 0
1 D 0
城镇居民 农村居民 政策紧缩 政策宽松
D
1 0
1 D 0
销售旺季 销售淡季 本科以上学历 本科以下学历
虚拟变量也可用于标注两个不同的时期或者状态。
1 异常时期 D 0 正常时期
问题:为何只选0、1,选2、3、4可以吗?
• 虚拟变量一般用0和1表示,这里的0和1不是个真 实的数值,而只是“A”和“非A”的代码。0和1仅 仅是个代码,这就是虚拟的含义。
• 可以用0和1表示,也可以用1和2、4和8表示,无 论什么数值都可以表示,只不过我们习惯于用0和1 表示而已。
• 如果自变量是血型,分A、B、O、AB型。如果直 接给他们赋值1、2、3、4,当然也可以做,但不 利于模型的分析;而且1、2、3、4所默认的情形 是这4种血型有一种等级的秩序,但实际上可能血 型之间没有什么秩序。这时最好的办法就是采用虚 拟变量。
例。已知冷饮的销售量Y除受k种定量变量Xk的影 响外,还受春、夏、秋、冬四季变化的影响,要考察 该四季的影响,只需引入三个虚拟变量即可:
1 春季 D1t 0 其他
1 夏季 D2t 0 其他
1 秋季 D3t 0 其他
则冷饮销售量的模型为:
Yt 0 1 X1t k X kt 1D1t 2 D2t 3 D3t t
2、三种状态时的虚拟变量的设置
虚拟变量既可以用来分析反映两种定性因素 的属性,也可以反映多种状态。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 D1 0
高中 其他
1 D2 0
大学及其以上 其他
3、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
模型中有截距项时,每一定性变量所需的虚拟变 量个数要比该定性变量的类别数少1,即如果有m个 定性变量,只在模型中引入m-1个虚拟变量。
▪ 在上述模型中,若再引入第四个虚拟变量
1 冬季 D4t 0 其他
则冷饮销售模型变量为:
Yt 0 1 X1t k X kt 1D1t 2 D2t 3 D3t 4 D4t t
如果只取六个观测值,其中春季与夏季取了 两次,秋、冬各取到一次观测值,则式中的:
1 X 11 1 X 12 (X,D) 1 X13 1 X 14 1 X 15 1 X 16
虚拟变量陷阱 例2
研究居民住房消费支出 Yi和居民可支配收入 Xi 之 间的数量关系。回归模型的设定为:
Yi = 0 + 1Xi +ui (1)
现在要考虑城镇居民和农村居民之间的差异,如 何办?为了对“城镇居民”、“农村居民”进行区 分,分析各自在住房消费支Yi 出 上的差异,D1设i = 1 为城镇D; 1i = 0 为农村,则模型为
对定性变量的量化可采用虚拟变量的方式实现。
▪ 一、虚拟变量的基本含义 ▪ 二、虚拟变量的设置规则 ▪ 三、自变量为定性变量 ▪ 四、因变量为定性变量(不讲)
一、虚拟变量的基本含义
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的
非数值性的因素。 基本思想: 在回归模型中,是否可将这些定性因素进行量化。
虚拟解释变量的应用
➢ 结构变化分析 ➢ 交互效应分析 ➢ 分段回归分析
1、结构变化分析
结构变化的实质是检验所设定的模型在样本期内 是否为同一模型。以下的平行回归、共点回归、不 同的回归三个模型均不是同一模型。 平行回归模型的假定是斜率保持不变(加法类 型); 共点回归模型的假定是截距保持不变(乘法类 型); 相异回归模型的假定是截距、斜率均为变动的 (加法、乘法类型的组合)。
虚拟变量取“0”值通常代表比较的基础类型; 虚拟变量取“1”值通常代表被比较的类型。 “0”代表比较的基础类型(参照系/基准组); “1”代表被比较的类型。
例如,比较收入时考察性别的作用。当研究男性
收入是否高于女性时,是将女性作为比较的基础
(参照物),故有男性为“1”,女性为“0”。
例1
(1)
D
=
Yi = 0 + 1Xi +1D1 + ui (2)
注:模型有截距;“居民属性”定性变量只有两个相
互排斥的属性状态(m 2 ),故只设定一个虚拟变量。
若对两个相互排斥的属性 “居民属性” ,仍然 引入 m 2 个虚拟变量,则有
1 城镇居民 D1i = 0 农村居民
1 农村居民 D2i = 0 城镇居民
相关文档
最新文档