虚拟变量在金融和经济中的作用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

虚拟变量在金融和经济中的作用

摘要

在现代经济计量分析中,利用模型进行回归分析是应用比较广泛的一种数量分析技术。一般回归分析中变量都是定量变量,这是因为模拟回归需要样本数据。但实际中有时模型仅考虑定量变量是不够的。因为经济现象不仅受一些定量因素的影响,还可能受到一些定性因素的影响。比如,不同时期的不同政策、战争、自然灾害等非常时期,人的不同性别、文化程度、婚姻状况等。如果某一应变量的确存在这种定性影响,那么仅用定量变量对被解释变量进行解释显然是不够的,利用虚拟变量技术可以解决此类问题。所谓虚拟变量技术就是把定性变量虚拟化,并把它作为解释变量或者是自变量纳入回归模型的一种方法。在这里,定性变量就是虚拟化的变量,即虚拟变量。一般可根据定性因素的二分特性进行人工赋值,即0和1,其中“1”表示具备某种属性或受到某种因素影响,而“0”则表示不受某种因素影响或不具备某种属性。定性变量虚拟化后就可以纳入回归模型,从而进行模拟分析或预测。

一.虚拟变量模型的性质与方法

1. 为了区分两个类别,只引入一个虚拟变量Di。一般规则是:如果一个定性变量有m

个属性值,则仅引入m-1个虚拟变量。

2. 虚拟变量0,1值的分配可以是任意的,但解释模型时一定注意1,0是怎样分配的。

3. 被分配0的类别或级别通常被用于比较的基础。

4. 虚拟变量的系数可以称为级差截距系数,表明取值1的类别截距项与基底类的截距

项的差距

虚拟的通常使用方法是,对一些通常表明“品质”或“属性”是否存在的属性变量,将其量化,给其赋值为“1”或“0”来表示虚拟变量出现某种属性和未出现某种属性。

设某个回归模型含有p个数量变量和一个品质变量,该品质变量可以有k+1个(k≥1)水平,据此,可建立以下回归模型:

其中x i,p+1 ,…x i,p+k为k个引入的虚拟变量,并且

需要拟合的回归方程为

通常情况下,该方程能较好地通过线性性检验,弥补仅用数量变量拟合的不足。

二.虚拟变量的其他使用方法

除此之外,虚拟变量也有一些其他的使用方法,例如将虚拟变量出现某种属性赋值为任意常数“a”,未出现某种属性赋值为“0”,并验证这种赋值方式,所得到的参数估计值是赋值“1”或“0”时的1/a,预测结果相一致。这可增加虚拟变量赋值的灵活性,同时根据这种思想,对变量数据进行放大或缩小处理以便于计算。

为了简化运算设模型为01122i i i i Y b b x b x ε=+++,将X2赋值为:

所对应的观测资料为表a1和a2所示。

由表a1得1

00(')x x -=

b=1000(')'x x x Y -=

于是回归方程为:

将X2i 取不同的值时代入所求得的方程得

由表a2得1

(')x x -=

于是得

这种赋值的回归方程为:

将X2取不同的值代入(d)得:

将上面两式进行比较可知X1i 前的系数相同, 0b 也相同,2b 表明将时2b 为

时的1/3,即只有X2i 前的系数发生了变化。

由上可知虚拟变量出现(或出现)某种属性时的最终回归方程是一样的,即估计值不受赋值方式的影响。

三.虚拟变量与t 检验的有效性

t 检验是假设检验的一项重要内容,它常用来考察两个独立的正态分布的总体的均值是否相等,在经济学、管理学、社会学和医学中有着广泛的应用。除了t 检验之外,方差分析的F 检验也是考察两个或者两个以上独立的正态分布的总体的均值是否相等的一种方法,因此人们经常将t 检验和F 检验联系起来讨论,将单因素的方差分析看作是比较两个独立总体均值的t 检验的一种等效的同一的方法。基于这两者的联系,很多学者还讨论了t 检验和F 检验的差异,如陶庄在2005年第7期的《统计研究》中讨论了t 检验对多重比较的适用性问题,姚俊在2007年第2期的《统计教育》中讨论了t 检验不能替代方差分析的原因。由于回归分析通常是用于分析一个变量与另一个变量或另一组变量的变动关系,因此很少有人认为回归分析能够代替t 检验来考察两个独立的正态分布的总体的均值是否相等的问题。虚拟变量是在回归分析中的一种处理定性因素的技术,它能够从定量的角度区分存在某种情况和不存在某种情况对因变量的影响,对于引入虚拟变量的加法模型(只考虑两种状态对模型截距水平的影响)来说,虚拟变量回归考察的是从均值上看这两种状态的差异对因变量有无显著影响,而t 检验的两个独立的总体可以看作是两种不同的状态,所以从这个角度上来说回归分析是能够代替t 检验来考察两个独立的正态分布总体的均值是否相等的。

举一个例子来说明,一个科学家提出,如果人们在早餐中食用高纤维的谷类食物,那么平均而言,与早餐没有食用谷物的人群相比,食用谷物这在午餐中摄取的热量将会减少。如果这个观点成立,谷物食品的生产商又将获得一个很好的机会,他们会宣传说:“多吃谷物吧,早上也吃,这样将有助于减肥。”为了验证这个假设,随机抽取了35个人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为两类,一类为经常的谷类食用者(总体1),一类为非经常谷物食用者(总体2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到的结果如下表1。

为了检验这个假设,可以建立一个虚拟变量回归来进行。设置因变量Y和虚拟变量D如下表2:

根据回归分析得到的结果如下:

虚拟变量前面的参数对应的t值为2.4135,在5%的显著性水平下大于其临界值2.034515,说明虚拟变量的取值0或者1对因变量Y的影响显著,即这两个总体的均值水平在5%的显著性水平下是不相同的,是有差异的。

虚拟变量回归作为一种特殊的回归分析,不仅可以用来分析一个变量与另一个定性的变量或另一组定性变量的变动关系,还可以利用其本身能够测度定性因素影响程度的特点来替代t检验,考察两个独立的正态分布的总体的均值是否相等的假设,其检验使用的检验参数显著性的统计量和用于比较两个独立的正态分布的总体的均值的t检验的统计量是完全一致的。而且虚拟变量回归不仅可以用于比较两个独立的正态分布的总体的均值是否相等的假设,通过引入多个虚拟自变量,它还可以用于比较两个以上的多个独立的正态分布的总体的均值是否相等的假设。

四.虚拟变量在经济中的作用

虚拟变量时表示属性的变量,使用到经济计量模型中,应该表示重要的属性。但是在我国目前的一些宏观经济模型中,虚拟变量被用的太多了。我国处于改革开放的过程中,不时会有一些特殊原因对经济变量产生正面或负面影响,因此,很容易为被解释变量中的离群

相关文档
最新文档