第8章 虚拟变量模型和设定误差
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)一个定性解释变量(两种以上属性)和一 个定量解释变量的情形
模型形式 Yi = f ( X i,1, 2, ) + μi D D ... (如:民族有56种特性;季度有4种特性) 例如: 啤酒售量Y、人均收入X 、季度D; Yi 0 1D1 2 D2 3 D3 X i i 1 一季度 1 其中: D1 D2 0 其 它 0 1 三季度 D3 0 其 它 二季度 其 它
X 、年份状况
D 的影响
1 反常年份 其中: Y 消费支出;X 收入; Dt 0 正常年份 反常年份 E Yt | X t , Dt 1 ( 1 2 ) X t 正常年份 E Yt | X t , Dt 0 1 X t 在正常年份的基础上进行比较,(只有斜率系数发生改变)。
一季度:E Yi | X1, D1 1, D2 D3 0 0 1) X i ( 二季度:E Yi | X1, D2 1, D1 D3 0 ( 0 2 ) X i 三季度:E Yi | X1, D3 1, D1 D2 0 ( 0 3 ) X i 四季度:E Yi | X1, D1 D2 D3 0 0 X i
1 D 0
政策紧缩
政策宽松
1 D 0
本科以上学历
本科以下学历
设有模型, yt = 0 + 1 xt + 2D + ut , 其中 yt,xt 为定量变量;D 为定性变量。 当 D = 0 或 1 时,上述模型可表达为,
0 + 1xt + ut , (D = 0)
yt =
60
2.虚拟变量设置的规则 ① 若定性变量含有 m 个类别,应引入 m-1 个虚拟 变量,否则会导致多重共线性,称作虚拟变量陷阱 (dummy variable trap) 。 ② 关于定性变量中的哪个类别取 0,哪个类别取 1, 是任意的,不影响检验结果。 ③ 定性变量中取值为 0 所对应的类别称作基础类别 (base category) 。 ④ 对于多于两个类别的定性变量可采用设一个虚拟 变量而对不同类别采取赋值不同的方法处理。如: 1 (大学)
(2)截距和斜率均发生变化
模型形式: Yi f X t , Dt , Dt X t 0 1D, 1 2 D
例,同样研究消费支出 Y 、收入 X 、年份状况 D 间的影 响关系。
Yt 0 1 X t 1Dt 2 ( Dt X t ) t 1 反常年份 其中: Y 消费支出;X 收入; Dt 0 正常年份 反常年份 E Yt | X t , Dt 1 0 1 ( 1 2 ) X t 正常年份 E Yt | X t , Dt 0 1 X t
Yi 0 1) i ( Yi 0 i
E Yi | Di = 0 = 0
城市
农村
(2)一个定性解释变量(两种属性)和一个定 量解释变量的情形
模型形式 Yi = f(Di,X i )+ μi 0 1Di 例如:Yi = 0 1Di + X i + μi 1 城市 其中: Y-支出;X -收入; Di 0 农村
D=
0 -1
(中学) (小学)。
8.1.3 虚拟变量的作用
1.可以检验和度量用文字所表述的定性因素的影响。
2.可以测量变量在不同时期的影响。
3.可以用来处理异常数据的影响。
8.2 虚拟解释变量模型
8.2.1 虚拟变量的引入方式
在计量经济学中,通常引入虚拟变量的方式分为 加法方式和乘法方式两种:即
为了捕获该影响,设C Y u。假设边际消 费倾向 依赖于财产 Z 。一个简单的表示方法就 是 1 2 Z 。代入消费函数,有:
C 1Y 2YZ u
由于YZ 捕获了收入和财产之间的相互作用而被称为 交互作用项。
显然,刻画交互作用的方法,在变量为数量(定量) 变量时, 是以乘法方式引入虚拟变量的。
型斜率系数表示为虚拟变量的函数,以达到相同的目的。
乘法引入方式: (1)截距不变; (2)截距和斜率均发生变化; 分析手段:仍然是条件期望。
(1)截距不变的情形
模型形式: Yt = f X t , Dt X t ut , 1 2 D 例:研究消费支出Y 受收入 Yt 1 X t 2 ( Dt X t ) t
Yt 0 1t 2 (t X ) D ut
*
1 其中: D 0 t X t t X t
(t=1955,1956,…,2004)
居民消费趋势方程:
1979年以前: Yt 0 1t ut
1979年以后: Yt 0 2 X * ( 1 2 )t ut
本课主要讨论 (1)结构变化分析; (2)交互效应分析; (3)分段回归分析
1.虚拟变量在分段回归中的应用
作用: 提高模型的描述精度。 虚拟变量也可以用来代表数量因素的不同阶段。 分段线性回归就是类似情形中常见的一种。 一个例子: 研究不同时段我国居民的消费行为。
实际数据表明,1979年以前,我国居民的消费支 Yt 出 呈缓慢上升的趋势;从1979年开始,居民消 费支出为快速上升趋势。
(0 + 2) + 1xt + ut , (D = 1)
Y
D=1 D =0
40
20
0+2 0
0 0 20 40 X 60
D = 1 或 0 表示某种特征的有无。反映在数学 上是截距不同的两个函数。若2 显著不为零, 说明截距不同;若2 为零,说明这种分类无 显著性差异。 例: 中国成年人体重 (kg) y 与身高 x cm) ( 的回归关系如下: –105 + x D = 1 (男) y = - 100 + x - 5D = – 100 + x D = 0 (女)
加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改 变方程截距; 2.在没有定量解释变量的情形下,主要 用于方差分析。
2.以乘法方式引入虚拟变量
基本思想 以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟
Xi 解释变量与其它解释变量的乘积,作为新的解释变量出现在
模型中,以达到其调整设定模型斜率系数的目的。或者将模
第8章 虚拟变量模型和设定误差
1
内容安排
8.1 虚拟变量 8.2 虚拟解释变量模型 8.3 虚拟被解释变量模型 8.4 设定误差 8.5 案例
8.1 虚拟变量
8.1.1 什么是虚拟变量
用来描述经济现象的定量属性(类别)的变量称之 为虚拟变量(Dummy Variables)。用符号D 来表示。 城镇居民 1 销售旺季 如: D 1 D 0 农村居民 0 销售淡季
8.1.2 虚拟变量设置的规则
1.虚拟变量的设置
虚拟变量是用以反映质的属性的一个人工变量。一般 只取0来自百度文库1两个值,对基础类型或肯定类型设D=1; 对比较类型、或否定类型、或控制类型、或遗漏类 型设D=0。可作解释变量和被解释变量。
虚拟变量的系数称之为差别截距系数,模型称为虚拟 变量模型或斜方差分析模型。 引入虚拟变量,数学上无变化;经济学上为了反映经 济现象的属性。
E Yi | X i , Di 1 0 1) X i ( E Yi | X i , Di 0 0) X i (
Yi = 0 + 1 + X i + μi ( ) Yi = 0 + X i + μi
城市
农村
Y
X
共同的特征:截距发生改变
例: 是否发展油菜籽生产与是否发展养蜂生产的差 异对农副产品总收益的影响研究。 模型设定为:
如何刻画我国居民在不同时段的消费行为?
基本思路:采用乘法方式引入虚拟变量的手段。显
然,1979年是一个转折点,可考虑在这个转折点作
为虚拟变量设定的依据。若设 X * =1979,当 t < X * 时可引入虚拟变量。(为什么选择1979作为转折 点?)
依据上述思路,有如下描述我国居民在不同时段 消费行为模型:
1.以加法方式引入虚拟变量
以加法方式引入虚拟变量时,主要考虑的问 题是定性因素的属性和引入虚拟变量的个数。 分为四种情形讨论: (1)解释变量只有一个定性变量而无定量变量,而且定性 变量为两种相互排斥的属性; (2)解释变量分别为一个定性变量(两种属性)和一个定 量解释变量; (3)解释变量分别为一个定性变量(两种以上属性)和一 个定量解释变量; (4)解释变量分别为两个定性变量(各自分别是两种属性) 和一个定量解释变量;
基准:四季度
(4)两个定性解释变量(均为两种属性)和 一个定量解释变量的情形
夏季、城市居民
夏季、农村居民
E Yi | X i , D1 1, D2 1 0 1 2) X i (
E Yi | X i ,D1 = 1, D2 = 0 = 0 + 1) X i ( +
冬季、城市居民 E Yi | X i , D1 0, D2 1 ( 0 2 )+ X i
冬季、农村居民
E Yi | X i , D1 0, D2 0 0 X i
D1 1, D2 1
Y
D1 1, D2 0
D1 0, D2 1
D1 0, D2 0
X
上述图形的前提条件是什么?
运用OLS得到回归结果,再用t检验讨论因素
是否对模型有影响。
加法方式引入虚拟变量的一般表达式:
Yt 0 1D1t 2 D2t ... k Dkt X t ut
基本分析方法: 条件期望。
E(Yt / D1t , D2t ,..., Dkt ) 0 1D1t 2 D2t ... k Dkt X t
Yt 0 X t ut 1D Yt 1 X t ut 2 X t D
Yi = + βX i + ui
原模型:
= 0 + 1D 乘法方式引入 = 1 + 2 D
加法方式引入
实质:加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。
(1)一个两种属性定性解释变量而无定量变量 的情形
模型形式:Yi f ( Di ) i 0 1Di 例如:Yi 0 1Di i
1 其中:Di= 0 城市 农村 (比较的基础:农村)
那么: E Yi | Di = 1 = 0 + 1) (
1979年之前,回归模型的斜率为 ; 1 1979年之前,回归模型的斜率为 ; 1 2
Y
■
2
1
X*
X
若统计检验表明, 2 显著不为零,则我国居民的消 费行为在1979年前后发生了明显改变。
2.交互效应分析
交互作用: 一个解释变量的边际效应有时可能要依赖于另一 个解释变量。为此,Klein和Morgen(1951)提出了 有关收入和财产在决定消费模式上相互作用的假 设。他们认为消费的边际倾向不仅依赖于收入, 而且也依赖于财产的多少 ——较富有的人可能会有 不同的消费倾向。
在正常年份基础上比较,截距和斜率系数都改变,为什么?
不同截距、斜率的组合图形
重合回归:截距斜率均相同
平行回归:截距不同斜率相同
共点回归:截距相同斜率不同
交叉(不同)回归:截距斜率均不同
8.2.2 虚拟变量的特殊应用
所谓特殊应用是指将引入虚拟解释变量的加法方式、乘 法方式进行综合使用。
基本分析方式仍然是条件期望分析。