第七章虚拟变量

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Yt ( 0 2 ) 4 X t U t
Yt ( 0 3 ) ( 4 5 ) X t U t
四季度:
Yt 0 4 X t U t
不同属性因素可以交互作用产生影响
例2
1 XB 0
Y =劳动者报酬
男性 女性
因此,虚拟变量个数=定性因素的状态数-1
所以,虚拟变量应为:
Y b0 b1D1 b2 D2 b3 D3 X u
1 D1 0 大学 非大学
1 D2 0 中学 非中学
1 D3 0
小学 非小学
季节性变动虚拟变量

销售函数模型
Ct b0 b1 X 1t bk X kt ut
1 JY1 0
X =劳动者工龄
高中 其它
1 JY 2 0 大学及大学以上 其它
Y 1 X 2 XB 3 ( JY1 X ) 4 ( JY 2 X )
5 ( JY 1 XB) 6 ( JY 2 XB) 7 ( JY 2 XB X ) U
1:男生 其中:D 0:女生
虚拟变量的影响
男生 W 女生
截距项位移
h
7.2 虚拟解释变量
斜率式: Y 0 1 X 2 ( DX ) u
Yi 0 1 X i ui
i N2
Yi 0 (1 2 ) X i ui i N 1
(1 t b1 ) (b1 t T ) (1 t b2 ) (b2 t T )
虚拟变量方法处理异常数据
思路——行为变量在异常点处发生了基础水平的变异,
而行为变量与解释变量之间的边际量并没有变异。
1 G 0
j 为异常样本点序号 i j
Y 0 1 X 1 k X k k 1G u
各关系式
初中及其以下、女性:
Yl 1 X l ul
初中及其以下、男性:
高中、女性: 高中、男性: 大学及其以上、女性: 大学及其以上、男性:
Yl ( 2 ) 1 X l ul
Yl ( 1 3 ) X l ul
Yl ( 2 5 ) ul
1994年 其余年份
ˆ NMRJSHFZC 1156.245 0.0397 LSZCL 405.979G
(-6.550) (8.758) (4.500)
R2 0.904
SE 83.675
D W 1.072
结果显示,各项指标明显改进,农民人均生活费支出 在1994年向上跳跃405.98元
ˆ ˆ ˆ 女性 Y X
1 1
h


模型A
Y b0 b1D1 b2 D2 b3 D3 b4 D4 X u
1 D1 0 1 D3 0 大学 非大学 小学 非小学
1 D2 0
1 D4 0
中学 非中学
文盲 非文盲

考虑销售量的季节性波动,应如何引入虚拟变量?
Ct b0 b1 X 1t bk X kt a1Q1t a2Q2t a3Q3t ut
1 Qit 0 第i季 其它季
i=1,2,3
季节性变动虚拟变量
一种属性因素含有
例:
m 个类型小组,设置 m 1个虚拟变量。
NMRJSHFZC
35000
40000 LSZCL
45000
50000
携带异常数据直接回归:
ˆ NMRJSHFZC 1365.805 0.045684LSZCL
(-5.308) (6.977)
R2 0.764
1 G 0
SE 126.438
D W 0.866
定义虚拟解释变量回归:
在两个时刻结构发生变化:
Yt 0 1 X t 2 ( X t X b1 ) D1 3 ( X t X b 2 ) D2 ut 0 D1 1 0 D2 1
分段形式: (1 t b1 ) 0 1 X t ut Yt ( 0 2 X b1 ) ( 1 2 ) X t ut (b1 t b2 ) ( X X ) ( ) X u (b2 t T ) 2 b1 3 b2 1 2 3 t t 0
Yl ( 1 4 ) X l ul
Yl ( 2 6 )
( 1 4 7 ) X l ul
分段线性回归

模型结构发生变化,但回归函数保持连续 在一个时刻结构发生变化:
Y
对比两段的截 距和斜率
b1
X
Yt 0 1 X t 2 ( X t X b1 ) D1 ut 0 D1 1 当D1 0时, Yt 0 1 X t ut 当D1 1时, Yt ( 0 2 X b1 ) ( 1 2 ) X t ut (1 t b1 ) (b1 t T )
2 的显著性检验可以回答被解释变量关于解
释变量的边际量在两小组之间有无显著性差异。
例2

研究工作经验对工资的影响,假设由于法律 的原因,男性和女性参加工作时的起薪是一 样的

建立模型(Y是月薪,X是工龄)
Y 1 X 2 DX u
1:男性 D 0:女性
虚拟变量的影响
i N1
同时检验截距项和解释变量的边际量在两小组之 间有无显著性差异。
例3

对例2,如果男女参加工作时的起薪存在性别 歧视,应如何修正模型?
Y 1 2 D 1 X 2 DX u
1:男性 D 0:女性
虚拟变量的影响
截距项和斜率项均位移
W
ˆ ˆ ˆ ˆ ˆ 男性 Y (1 2 ) ( 1 2 ) X
第七章 虚拟变量
学习内容


虚拟变量 虚拟解释变量 虚拟被解释变量
学习目标



了解虚拟变量的概念及形式 掌握虚拟解释变量的模型形式及意义 掌握虚拟被解释变量的三种模型形式及 估计 熟练操作EVIEWS
7.1 虚拟变量

虚拟变量:某些因素对解释因变量是必须的, 但它们是定性的、不可计量的;为了将这些 变量引入所要研究的模型,必须将它们数量 化:比如起作用时赋值1,或0;不起作用时 赋值0,或1,这样的变量称为虚拟变量 比如:天气、季节、性别等
1 二季度 J3 其余季度 0 三季度 其余季度
1 J1 0
1 一季度 J2 其余季度 0
Yt 0 1 J1 2 J 2 3 J 3 4 X t 5 ( J 3 X t ) U t
一季度: 二季度: 三季度:
Yt ( 0 1 ) 4 X t U t

7.2 虚拟解释变量
(一)虚拟解释变量的基本介入方式
Yi 0 1 X i ui
截距式:
1 Di 0 i N1 i N2 N1 N 2 {1, , n}
Y 0 1 X 2 D u
Yi 0 1 X i ui
Yi ( 0 2 ) 1 X i ui
i N2
i N1
2 的显著性检验可以回答被解释变量的基础水平
在两小组之间有无显著性差异。
7.2 虚拟解释变量

例1:研究学生体重与身高的关系,随机抽样 80名学生,其中48名男生,32名女生(W表示 体重,h表示身高)
模型 : W 0 1h 2 D u
ˆ 估计结果:W 122.9621 23.8238 D 3.7402h ( 2.5884) (4.0149) (5.1613)
Y j ( 0 k 1 ) 1 X 1 j k X kj u j
Yi 0 1 X 1i k X ki ui
i j
异常数据模型举例 例1 Y=农民人均生活费支出 ,X=粮食总产量
1200 1000 800 600 400 200 0 30000
虚拟变量陷阱

对模型A 解释变量矩阵
1 1 1 1
1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
X1 非满秩矩阵 X2 存在多重共线性 X3 Xn
虚拟变量陷阱
定性因素的状态数等于虚拟变量个数 此时存在完全多重共线性
斜率项位移
W 男性
ˆ ˆ ˆ ˆ Y ( 1 2 ) X
ห้องสมุดไป่ตู้
ˆ ˆ ˆ 女性 Y 1 X
h
截距、斜率式:
Y 0 1 X 2 D 3 ( DX ) u
Yi 0 1 X i ui
i N2
Yi ( 0 2 ) (1 3 ) X i ui
相关文档
最新文档