虚拟变量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分段回归的实际应用
公司是如何酬劳其销售代表的? 其支付佣金的方式取决于销售量的一个目标或
临界水平X *
销售佣金在临界值X *之前随销售量线性增加, 在这个临界值之后仍线性增加,只是斜率更大。 于是得到由两段构成的分段线性回归
销售佣金是在临界值处改变斜率的。
类似的例子 税金的缴纳,产出与成本之间的关系
*
用虚拟变量表示不同斜率的回归 ---乘法类型:分段线性回归
储蓄-收入回归:1970~1981年
E Yt / Dt 0, xt 1 1 X t
储蓄-收入回归: 1982~1995年
E Yt / Dt 1, xt 1 2 1 2 Xt
储蓄—收入关系的回归结果
ˆ 1.02 152.48D 0.0803 X 0.0655 D X Y t t t t t se 20.16 33.08 0.0145 0.0159 t 0.05 4.61 5.54 4.10 p 0.960 0.000 0.000 0.000
加法+乘法类型:反映相异回归
• 以乘法形式引入虚拟解释变量,是在设定的计量经济模 型中,将 虚拟解释变量与其他解释变量相乘作为解释变 量,以表示模型中斜率系数的差异。 • 以乘法形式引入虚拟解释变量的主要作用是:
第一:分析因素间的交互影响;
第二:分段线性回归,提高模型对现实经济现象的 描述精度 。
ˆ 62.4226 0.0376 X Y i 邹式检验可知:1982年为突变点 t (4.8917)(8.8937) p (0.0001)(0.0000) 据此分成两个子样本分别进行回归好 R 2 0.7672
还是建立一个回归模型更好呢?
用虚拟变量表示不同斜率的回归 ---乘法类型:分段线性回归
用虚拟变量表示不同斜率的回归 ---乘法类型:分段线性回归
储蓄—收入的回归方程:
Yt 1 2 Dt 1 Xt 2 Dt Xt ut
Y—个人储蓄, X—个人可支配收入
1, 观察值从1982年开始 Dt 0, 其他(观察值到1982年)
Y 1 1 X 2 X X D ut
回归的类型
虚拟变量模型的性质
根据加入的途径,可以将虚拟变量模型分成两种类型:
—— 加法类型:用虚拟变量表示不同截距的回归,即 虚拟变量只可以改变回归方程的截距,是加法类型。
加法类型:反映平行回归
—— 乘法类型:用虚拟变量表示不同斜率的回归,即 虚拟变量影响到回归方程的斜率变化,是乘法类型。 乘法类型:反映并发回归
要检验回归在 临界值 X * 处 有没有转折, 只要考察所估 计的级差斜率 ˆ 的统 系数 2 计显著性即可
Y 1 1 X 2 X X D ut
*
分段线性回归的案例:美国个人储蓄与个人可支配收入
如果不考虑1982年的经济衰退对储蓄-收入的影响,对 1970-1995年整个区间进行估计,得到的回归结果如下:
虚拟变量
一、虚拟变量的性质
二、虚拟变量在分段回归中的应用 三、案例分析
虚拟变量的性质
虚拟变量的基本含义 许多经济变量是可以定量度量的,如:商品需求 量、价格、收入、产量等
但也有一些影响经济变量的因素无法定量度量, 如:学历、性别、种族、地区对收入的影响,战 争、自然灾害对 GDP 的影响,季节对某些产品 (如冷饮)销售的影响等等
为了在模型中能够反映这些因素的影响,并提高 模型的精度,需要将它们“量化”
虚拟变量的性质
这种“量化”通常是通过引入“虚拟变量”来完 成的。根据这些因素的属性类型,构造只取“0”或 “ 1” 的 人 工 变 量 , 通 常 称 为 虚 拟 变 量 ( dummy variables),记为D。 例如,反映文化程度的虚拟变量可取为:
t
t
153.5 0.0148 X t
课后作业: (1)根据英国1946~1963年或中国历年的居民储 蓄与收入资料,分析储蓄率的变动 (2)根据工资及性别的数据,检验工资是否存在 性别歧视 (3)分析季节对某产品销售量的影响
* * *
R 2 0.882 R 2 0.866 F 54.78
用虚拟变量表示不同斜率的回归 ---乘法类型:分段线性回归
根据以上分析,可以推导出两个时期的
储蓄-收入回归方程:
平均储蓄函数:1970-1981年 ˆ 1.02 0.0803 X Y
t
平均储蓄函数:1982-1995年 ˆ Y ( 1.02 152.48) (0.0803 0.0655)X
1,本科文化 Di 0,非本科文化
一般地,在虚拟变量的设置中: 基础类型取值为0(不具备某种性质); 比较类型取值为1(具备某种性质)。
虚拟变量陷阱
虚拟变量的个数须按以下原则确定:
• 每一定性变量所需的虚拟变量个数要比该定性Hale Waihona Puke Baidu量 的类别数少1
• 即如果某一定性变量有m个类别,只在模型中引入 m-1个虚拟变量 • 违背这一原则会陷入虚拟变量陷阱,导致多重共线 性问题。 例如:地区(东部、中部、西部三个类别,m=3) 只需设置两个虚拟变量D1,D2