第八章__虚拟解释变量回归.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章虚拟变量回归
第一节虚拟变量
一、虚拟变量的基本概念
在前面的分析中,被解释变量主要受到一些可以直接度量的变量影响,如收入、产出、
商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属
性因素)的影响,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等因素。在实际经济分析中,这些定性变量有时具有不可忽视的重要影响。
例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者素质的高低等是值得经常考虑的影响因素,这些因素有共同的特征,即都是表示某种属性的,不能直接用数据精确描述的因素。因此,被解释变量的变动经常是定量因素和属性因素共同作用的结果。在计量经济模型中,应当同时包含定量和属性两种因素对被解释变量的影响作用。
定量因素是指那些可直接测度的数值型因素,如GDP、M2 等。定性因素,或称为属性
因素,是不能直接测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、城市居民或非城市居民、气候条件正常或异常、政府经济政策不变与改革等。在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。
为了在模型中反映定性因素,可以将定性因素转化为虚拟变量去表现。虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0 和1 的作为属性变量代表的变量,一般用字母
D (或DUM ,英文dummy 的缩写)表示。属性
因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0 时,表示某种属性或状态不出现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1 时,表示某种属性或状态出现或存在,即是某种类型。例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。这种做法
实际上是一种变换或映射,将不能精确计量的定性因素的水平或状态变换为用0 和1 来定量描述。
二、虚拟变量的设置规则
在计量经济学模型中引入虚拟变量,可以使我们同时兼顾定量因素和定性因素的影响和作用。但是,在设置虚拟变量时应遵循一定的规则。
1、虚拟变量数量的设置规则
虚拟变量个数的设置规则是:若定性因素有m 个相互排斥的类型(或属性、水平),在有截距项的模型中只能引入m-1 个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完
全的多重共线性。在无截距项的模型中,定性因素有m个相互排斥的类型时,引入m个虚
拟变量不会导致完全多重共线性,不过这时虚拟变量参数的估计结果,实际上是D=1 时的
样本均值。
例如,城镇居民和农村居民住房消费支出的模型可设定为:
其 中 , C i 为 居 民 的 住 房 消 费 支 出 , Y i 为 居 民 的 可 支 配 收 入 , D i 为 虚 拟 变 量 ,
D i
1 城镇居民
,即当 D i 1时为城镇居民; 当 D i 0 时为其他 (农村居民)。这里区分城
Di
0 其他
i i
镇居民和农村居民的定性变量的类型有 m=2 个,按虚拟变量的设置规则应引入
m - 1=2-
1=1 个虚拟变量。
1 城镇居民 ,
1 农村居民
,
其他
D 3i
0 其他
3D 3i u i
( 8.2)
这时,当 D 2i =1 时同时有 D 3i =0;反之,当 D 2i =0 时有 D 3i =1。即对于任何被调查的居民家
庭都有D 2i + D 3i =1 , D 2和D 3存在完全的共线性,无法利用OLS 估计其参数,从而陷入“虚 拟变量陷阱” 。由此,所谓的 “虚拟变量陷阱 ”的实质是出现完全多重共线性。可见,虚拟变 量有其积极作用的一面, 也有不良影响的一面, 引入的虚拟变量适当, 则发挥了积极的作用, 引入的虚拟变量过度,则会带来负面的影响。
2、虚拟变量的 “0”和“1”的选取原则
虚拟变量取“ 1”或“ 0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚 拟变量取“ 0”值通常代表为比较的基础类型;而虚拟变量取“
1 ”值通常代表为被比较的类
型。例如, 引入政府经济政策的变动对被解释变量的影响时, 由于此时的比较是在政府经济 政策不变的基础上进行的,故虚拟变量确定为:
1 基础类型 : 政府经济政策变动
D t
0 比较类型 : 政府经济政策不变
三、虚拟变量的作用 在计量经济模型中,虚拟变量可以发挥多方面的作用: (1) 可以作为属性因素的代表,如性别、所有制等;
(2) 作为某些非精确计量的数量因素的代表,如受教育程度、管理者素质等; (3) 作为某些偶然因素或政策因素的代表,如战争、灾害、改革前后等; (4) 还可以作为时间序列分析中季节(月份)的代表;
C i
Y i
2D i u
i
8.1)
但是,如果引入了 m=2 个虚假变量: D 2i
则有:
C
i 1 Y
i
2D
2i
(5)可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异。在计量经济学中,把包含有虚拟变量的模型称为虚拟变量模型。常用的虚拟变量模型有三种类型:(1)解释变量中只包含虚拟变量,作用是在假定其他因素都不变时,只研究定性变量是否使被解释变量表现出显著差异;(2)解释变量中既含定量变量,又含虚拟变量,研究定量变量和虚拟变量同时对被解释变量的影响;(3)被解释变量本身为虚拟变量的模型,
是被解释变量本身取值为0或1的模型,适于对某社会经济现象进行“是”与“否”的判断研究。
特别要注意的是,定型或属性变量,通常由1 个以上的虚拟变量描述。例如,分析考证区域这样一个定性因素的影响时,若将区域因素划分为东、中、西三种属性时,在有截距项的回归模型中,只能引人2 个虚拟变量,而这两个虚拟变量只是描述了1 个定性因素(区域因素),而不是2 个定性因素。当然,当定性因素为性别因素时,1 个虚拟变量就描述了1 个定性因素。
第二节虚拟解释变量的回归
在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类型。不同的途径引入虚拟变量有不同的作用,加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。
一、用虚拟变量表示不同截矩的回归——加法类型以加法类型引入虚拟解释变量的模型,如(8.3)式那样,
Y t 1 2X t 3D u t (8.3)
在(8.3)所设定的计量经济模型中,虚拟解释变量与其他解释变量是相加关系。以加法形式引入虚拟解释变量,从计量经济模型的意义看,其作用是改变了设定模型的截距水平。
以加法方式引入虚拟变量时,分为四种情形:(1)解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量;(2)解释变量包含一个定量变量和一个分为两种类型的定性变量;(3)解释变量包含一个定量变量和一个两种以上类型的定性变量;(4)解释变量包含
一个定量变量和两个定性变量。
1、解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归
这种情况的模型又被称为方差分析模型,例如(8.4)式
Y i D i u i 8.4)