计量经济学——虚拟解释变量模型

合集下载

计量经济学第5章虚拟变量模型

第五章虚拟变量模型
在经济计量模型中除了有量的因素外还有质的因素，质的因素包括被解释变量为质的因素和解释变量为质的因素。如果被解释变量为质的因素，主要是逻辑回归要涉及的内容。本章就解释变量和被解释变量为质的因素也就是存在虚拟解释变量和虚拟被解释变量时如何进行参数估计等一系列问题进行讨论。
1
为基础类型截距项。
12
三、虚拟变量的作用 ⑴ 可以描述和测量定性因素的影响。
⑵ 能够正确反映经济变量之间的相互关系，提高模型的精度。
⑶ 便于处理异常数据。
即将异常数据作为一个特殊的定性因素
1 , 异常时期
D
0
,
正常时期
13
第二节虚拟解释变量模型
一、截距变动模型（加法模型）
虚拟变量与其它变量相加，以加法形式引入模
Y i 0 1 D 1 i 2 D 2 i 3 X i u i
Y i ------年支出医疗保健费用支出 X i ------居民年可支配收入
18
1 , 高中
D 1i
0
,
其他
1 , 大学
D 2i
0
,
其他
于是：小学教育程度：
E (Y i X i,D 1 i 0 ,D 2 i 0 )03 X i
7
二、虚拟变量的设置规则
虚拟解释变量模型的设定因为质的因素的多少和这些因素特征的多少而引入的虚拟变量也会不同。
以一个最简单的虚拟变量模型为例，如果只包含一个质的因素，而且这个因素仅有两个特征，则回归模型中只需引入一个虚拟变量。如果是含有多个质的因素，自然要引入多个虚拟变量。
8
如果只有一个质的因素，且该质的因素具有 m 个相互排斥的特征（或类型、属性），那么在含有截距项的模型中，只能引入 m-1 个虚拟变量，否则会陷入所谓“虚拟变量陷阱”（dummy variable trap），产生完全的多重共线性，会使最小二乘法无解；在不含有截距项的模型中，引入 m 个虚拟变量不会导致完全的多重共线性，不过这时虚拟变量参数的估计结果，实际上是 D = 1 时的样本均值。

金融计量经济第五讲虚拟变量模型和Probit、Logit模型

精品课件
原始模型：
YX (5.8)
• 其中Y为观测值取1和0的虚拟被解释变量，X为解释变量。
• 模型的样本形式： yi Xii
(5.9)
• 因为E(i)0
，E所(y以i)Xi
• 令： p i P ( y i 1 ) 1 p i P ( y i 0 )
• 于是有： E ( y i) 1 P ( y i 1 ) 0 P ( y i 0 ) p i
其它季度
1, 三季度
D3
0,
其它季度
• 小心“虚拟变量陷阱”！
精品课件
三、虚拟变量的应用
• 1、在常数项引入虚拟变量，改变截距。
y i0D 1 x 1 i kx k iu i (5.1)
• 对上式作OLS，得到参数估计值和回归模型：
y ˆiˆ0ˆD ˆ1 x 1 i ˆkx ki(5.2)
金融计量经济第五讲
虚拟变量模型和Probit、Logit模型
精品课件
第一节虚拟变量的一般应用
一、虚拟变量及其作用 1.定义：取值为0和1的人工变量，表示非量化
（定性）因素对模型的影响，一般用符号D表示。例如：政策因素、地区因素、心理因素、季节因素等。 2.作用： ⑴描述和测量定性因素的影响； ⑵正确反映经济变量之间的相互关系，提高模型的精度； ⑶便于处理异常数据。
yˆt ˆ ˆxt yˆt ˆ ˆxt ˆ2 yˆt ˆ ˆxt ˆ3 yˆt ˆ ˆxt ˆ4
精品课件
一季度二季度三季度四季度
例题：美国制造业的利润—销售额行为
• 模型：利 t 1 润 2 D 2 t 3 D 3 t 4 D 4 t ( 销 ) t u t售
0.503543 0.500354 1.13E+03 1.99E+09 -13241.74 1.648066

第九章：虚拟解释变量

[计量经济学讲义] 第九章：虚拟解释变量本章及下一章将变量类型由定量变量拓展到定性变量。

§1虚拟变量的性质1、变量的分类：定量变量：如收入、产量、价格、成本、高度等取值在一定分为内连续变化；定性变量：如性别、种族、肤色、宗教、国际、战争、地震、沿海省份等。

“量化”：将定性变量量化，可以根据其不同情况取值0或1。

2、虚拟变量（dummy variable ）：取值为0、1等这样的变量。

虚拟变量有时也称为二值变量(binary variable)、二分变量(dichotomous variable)、定性变量(qualitative variable)、指标变量（indicator variable ）3、ANOV A （方差分析analysis of variance ）：解释变量全为虚拟变量例：i Y =α+βi D +i u其中i Y 表示教授年薪，i D =1，男教授i D =0，女教授（假定年龄、学位和经验可以忽略）女教授的平均年薪为：E(i Y |i D =0)=α；男教授的平均年薪为：E(i Y |i D =1)=α+β；一个例子（略）§2 一个定量变量和一个二分定性变量1、例子：i Y =1α+2αi D +βi X +i u其中i Y 表示教授年薪，i X 表示年龄，则有：女教授的平均年薪为：E(i Y |i X ,i D =0)=1α+βi X ；男教授的平均年薪为：E(i Y |i X ,i D =1)= 1α+2α+βi X ；（假设共同斜率）2、问：有截距项的情况下，区分两个类别要几个虚拟变量？答案是一个，否则有完全贡献性。

结论：有截距项的情况下，若一个定性变量有m 个类别，则仅引入m-1个虚拟变量。

3、0与1的分配问题。

4、基准（benchmark ）：0类别的情况5、级差截距系数：D 的系数§3 一个定量变量和一个多分变量例子：假设在横截面数据的基础上，做个人保健支出对个人收入和教育水平的回归。

计量经济学课后习题答案第八章_答案

第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量，主要是为了寻找某(些)定性因素对解释变量的影响。

加法方式与乘法方式是最主要的引入方式，前者主要适用于定性因素对截距项产生影响的情况，后者主要适用于定性因素对斜率项产生影响的情况。

除此外，还可以加法与乘法组合的方式引入虚拟变量，这时可测度定性因素对截距项与斜率项同时产生影响的情况。

2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式，前者主要适用于定性因素对截距项产生影响的情况，后者主要适用于定性因素对斜率项产生影响的情况。

除此外，还可以加法与乘法组合的方式引入虚拟变量，这时可测度定性因素对截距项与斜率项同时产生影响的情况。

3．什么是虚拟变量陷阱？答：根据虚拟变量的设置原则，一般情况下，如果定性变量有m个类别，则需在模型中引入m-1个变量。

如果引入了m个变量，就会导致模型解释变量出现完全的共线性问题，从而导致模型无法估计。

这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题，称为“虚拟变量陷阱”。

4．在一项对北京某大学学生月消费支出的研究中，认为学生的消费支出除受其家庭的每月收入水平外，还受在学校中是否得到奖学金，来自农村还是城市，是经济发达地区还是欠发达地区，以及性别等因素的影响。

试设定适当的模型，并导出如下情形下学生消费支出的平均水平：(1) 来自欠发达农村地区的女生，未得到奖学金；(2) 来自欠发达城市地区的男生，得到奖学金；(3) 来自发达地区的农村女生，得到奖学金；(4) 来自发达地区的城市男生，未得到奖学金。

解答: 记学生月消费支出为Y，其家庭月收入水平为X，则在不考虑其他因素的影响时，有如下基本回归模型：Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型，可得如下各种情形下学生的平均消费支出：(1) 来自欠发达农村地区的女生，未得到奖学金时的月消费支出：E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生，得到奖学金时的月消费支出：E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生，得到奖学金时的月消费支出：E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生，未得到奖学金时的月消费支出： E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时，由数据散点图显示1979年前后Y 对X 的回归关系明显不同，进口消费函数发生了结构性变化：基本消费部分下降了，而边际消费倾向变大了。

计量经济学虚拟变量

在实际分析当中，根据T检验的结果，将不显著的季度虚拟变量从模型中消除，用剩下的显著的虚拟变量对模型进行估算就足够。
(2), 没有常数项的时候，可以设第4季度的季度虚拟。
Yi 1D1 2D2 3D3 4D4 ui
(3),虚拟变量的陷阱
Yi a 1D1 2D2 3D3 4D4 ui
2，存在结果性变化。 3，需要对难以量化的数据进行处理。
• 计量经济中的虚拟变量，在明确其引入理由基础上，被用于很多的多元回归模型。
二，虚拟变量的类型
1，临时虚拟
临时虚拟，也称为突发性虚拟。为了更好的对模型进行估算，经常需要在回归模型中排除一些由突发性事件产生的异常值（outlier），及其对模型的影响，例如战争，地震，内乱，罢工等。
• 第一季度到第四季度的常数项为：
第一季度：a 1
Yi (a 1) X i ui
第三季度：a 3
Yi (a 3 ) X i ui
第四季度： a
Yi a X i ui
• 现在第四季度是基准，分别表示第四季度与各季度之差。
数虚拟变量和常数虚拟变量。
Yi a 1X i 2D ui
1 异常时期 D=
0 平时
Yi a 1Xi 2D1 3D2 ui
1
D1= 0
发生地震的年份其他年份
1
D2= 0
发生水灾的年份其他年份
2,定性数据的虚拟处理
学历，性别，人种等定性的差异
3,季度虚拟
（1），定义：季度虚拟是通过回归模型的常数项的变化（斜率回归系数一定）来掌握季度和月度等季节变化，因此，从技术角度成为“常数项虚拟”。
这种“量化”通常是通过引入“虚拟变量” 来完成。根据这些因素的属性类型，构造只取 “0”或“1”的人工变量，通常称为虚拟变量（dummy variables），记为D。

金融计量经济第五讲虚拟变量模型和Probit、Logit模型

第二节虚拟被解释变量模型
• 问题1：对于商业银行，企业贷款可能出现违约，也就是说一家企业贷款后有违约和不违约两种可能，如何甄别？（李萌，2005）
• 问题2：证券投资者在特定时期内的投资选择是买或不买，如何确定这样的选择？（王冀宁等，2003）
• 问题3：上市公司出现经营问题，可能成为ST、PT，是什么原因导致这样的结果？
6563.76 1597.98
16.904 16.9416 157.922
0
应用例题2：股息税削减对股价的影响
• 背景资料—2005年6月14日，财政部、税务总局发文，规定对个人投资者从
上市公司取得的股息红利所得，暂减按50%计入个应纳税所得额（红利税从 20%降为10%）。
• 利用事件分析法分析该政策对股价有无显著影响，即政策出台前后股票有无异常收益。时间窗口为发布日及前后各二天。
E( yi ) P( yi 1) X i
• 但因为
i
1 X
Xi i
当yi 1，其概率为X i 当yi 0，其概率为1 X i
• 模型具有明显的异方差性，故而用模型（5.8）直接进行参数估计是不合适的。
• 另外，由于要求
E( yi ) P( yi 1) Xi 1
亦
难以达到。
Di 0, 其它季度的数据
, i 2,3,4
• •
原则模引型入若虚为拟变量后的y模t 型为：
xt
ut
yt xt 2 D2t 3 D3t 4 D4t ut (5.6)
• 回归模型可视为：
yˆt ˆ ˆxt
一季度
yˆt ˆ ˆxt ˆ2 二季度
yˆt ˆ ˆxt ˆ3 三季度
二、虚拟变量的设置原则

计量经济学-中-4-虚拟应变量

虚拟自变量的回归
(例题分析)
【例】为研究考试成绩与性别之间的关系，从某大学商学院随机抽取男女学生各8 名，得到他们的市场营销学课程的考试成绩如下表
虚拟自变量的回归
(例题分析)
100
散点图
¼ Ô É ¨ ¿ Ê ³ ¼
75
50
25
男
女 Ð ± Ô ð
y与x的回归
¼ Ô É ¨ë Ô ð Ä ¢ ã ¼ ¿ Ê ³ ¼ Ó Ð ±µ É µ Í

3.5）中的干扰必定是同方差性的了。真 E (Yi / X i ) 是不知道的，从而权wi 是不知道的，为了估计 wi ，可采用如下两步法： 1.对（11.2.1）作最小二乘回归，暂且撇 ˆ 开异方差性问题。于是得到 Yi ＝真 E (Yi / X i ) 的OLS估计值。再由此求wi 的估计值
7
对数单位模型
我们用住房所有权的例子说明对数单位模型的基本概念。解释住房所有权对收入的线性关系时的线性概率模型曾是：
其中X为收入，而Y＝1表示家庭拥有住房，但现
在考虑如下住房所有权的表达式:
Pi E (Y 1/ X i ) 1 2 X i
（11.7.1）
Pi E (Y 1/ X i )
显然，我们不再可能假定干扰项是正态分布的：实际上，它遵循二项分布。干扰项的异方差性由（11.3.2）中可以得到的概率分布：当 ui 1 2 X i 概率为 1 Pi ；当 ui 1 1 2 X i 概率为 Pi ，进而可得到：
var(ui ) Pi (1 Pi ) Pi (1 Pi )
ˆ (Yi / X 12) 0.9457 12(0.1021) ＝0.2795 就是说，收入为12000 美元的家庭拥有住宅的概率为28％。对于上面的估计受异方差的影响，因此我们可 ˆ Yi 是以用WLS来获得更有效的估计值。由于某些 ˆ 负的，和某些 Yˆi 大于1，对于这些 Yˆi 来说，wi 将是负的，因此删去这些值。得到的WLS回归为：

虚拟变量回归模型：计量经济学

在实时经济分析和决策支持方面，虚拟变量回归模型可以结合实时数据流进行动态更新和预测，为政策制定者和市场参与者提供及时、准确的经济分析和决策支持。
对未来研究的展望
拓展模型应用领域
未来研究可以进一步拓展虚拟变量回归模型的应用领域，如环境经济学、劳动经济学、金融经济学等，以更深入地揭示经济现象背后的规律。
宏观经济学领域应用
经济增长研究
引入虚拟变量以刻画不同国家或地区的经济增长模式，并分析各种因素对经济增长的贡献。
通货膨胀与货币政策研究
利用虚拟变量回归模型，探讨通货膨胀的成因、传导机制及货币政策的效应。
国际贸易研究
通过构建虚拟变量，分析贸易自由化、关税壁垒等因素对国际贸易流量的影响。
金融学领域应用
线性问题，影响模型的稳定性和解释性。
预测能力有限
03
对于具有复杂关系的数据，虚拟变量回归模型可能无法提供准
确的预测。
与其他模型的比较
01
与线性回归模型的比较
虚拟变量回归模型是线性回归模型的一种扩展，通过引入虚拟变量来处理分类变量。线性回归模型则主要关注连续变量的影响。
02 03
与逻辑回归模型的比引言 • 虚拟变量回归模型基本原理 • 虚拟变量回归模型应用举例 • 虚拟变量回归模型优缺点分析 • 虚拟变量回归模型在实证研究中的应用 • 虚拟变量回归模型的发展趋势和前景
01 引言
计量经济学简介
1 2
计量经济学定义
计量经济学是应用数学、统计学和经济学方法，对经济现象进行定量分析的学科。
完善模型理论和方法
在模型理论和方法方面，未来研究可以进一步完善虚拟变量回归模型的理论基础和方法体系，提高模型的解释力和预测能力。

第五讲虚拟变量模型

第七讲经典单方程计量经济学模型：专门问题虚拟变量模型学习目标：1. 了解什么是虚拟变量以及什么是虚拟变量模型；2. 理解虚拟变量的设置原则；3. 掌握虚拟变量模型的两种基本引入方式（加法方式和乘法方式）；4. 能够自行设计虚拟变量模型，并能够解释其中蕴含的经济意义；教学基本内容一、虚拟变量许多经济变量是可以定量度量，例如：商品需求量、价格、收入、产量等；但有一些影响经济变量的因素是无法定量度量。

例如：职业、性别对收入的影响，战争、自然灾害对GDP 的影响，季节对某些产品（如冷饮）销售的影响等。

定性变量：把职业、性别这样无法定量度量的变量称为定性变量。

定量变量：把价格、收入、销售额这样可以可以定量度量的变量称为定量变量。

为了能够在模型中能够反映这些因素的影响，提高模型的精度，拓展回归模型的功能，需要将它们“量化”。

这种“量化”通常是通过引入“虚拟变量”来完成的。

根据这些因素的属性类型，构造只取“0”或“1”的人工变量，通常称为虚拟变量（dummy variables ），记为D 。

虚拟变量只作为解释变量。

例如：反映性别的虚拟变量⎩⎨⎧=女男;0;1D 反映文化程度的虚拟变量⎩⎨⎧=非本科学历本科学历;0;1D 一般地，基础类型和肯定类型取值为1；比较类型和否定类型取值为0。

二、虚拟变量的设置原则设置原则：每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状态类别数(categories)少1。

即如果有m 种状态，只在模型中引入m-1个虚拟变量。

例如，冷饮的销售量会受到季节变化的影响。

季节定性变量有春、夏、秋、冬4种状态，只需要设置3个虚拟变量：⎩⎨⎧=其他春季;0;11D ⎩⎨⎧=其他夏季;0;12D ⎩⎨⎧=其他秋季;0;13D错误设置：⎩⎨⎧=其他春季;0;11D ⎩⎨⎧=其他夏季;0;12D ⎩⎨⎧=其他秋季;0;13D ⎩⎨⎧=其他冬季;0;14D 如果设置第4个虚变量，则出现“虚拟变量陷井”（Dummy Variable Trap ）问题。

计量经济学(共33张PPT)

假定3>2，其几何意义：
问题：
虚拟变量为何只选“0”, ‘1“，选择0，1，2 等可以吗
同一种属性，两个变量能够表示几种状态？思考，如果在模型中引入季节效应？月份效应？
（3）多个虚拟变量的引入——多种因素
例：研究学历（本科及以上，本科以下），性别（男、女）对员工工资的影响。
在例1基础上，再引入代表学历的虚拟变量D2：
离散选择模型（离散被解释变量）
D （2）多个虚拟变量的设定和引入 0 女职工本科以上学历的平均薪金：
本科以下
当回归模型有截距项时，只能引入 m-1 个虚拟变量
注意:加法方式引入虚拟变量，考察了截距的不同。
交互作用的引入方法：在模型中引入相关变量的乘积。
反映性别的虚拟变量可取为：女职工本科以下学历的平均薪金：
几何意义：
•两个函数有相同的斜率，说明男女职工平均薪金对工龄的变化率是一样的。
•如果2>0，表明两个函数截距不相同，且男职工平均薪金比女职工高，两者平均薪金水平相差2。 •如果2<0，表明两个函数截距不相同，且男职工平均薪金比女职工低，两者平均薪金水平相差2。 •如果2＝0，表明两个函数截距相同，即男职工，女职工的平
均薪金没有显著差异。
可以通过传统的回归检验，对2的统计显著性进行检验，以判断企业男女职工的平均薪金水平是否有显著差异。
2
0
（2）多个虚拟变量的设定和引入
——一种因素多种状态（水平）：
例：研究收入和教育水平（分为高，中，低三类）对个人保健支出的影响。
教育水平考虑三个层次：
低学历：高中以下，
中等学历：高中，及大中专高学历：大学及其以上。
2、基本概念
定量因素——可直接测度，数值性的因素定性因素——属性因素，表征某种属性存在

虚拟变量模型

§5.2 滞后变量模型
§5.1
虚拟变量模型
一、虚拟变量的含义二、虚拟变量的设置三、虚拟变量的引入
一、虚拟变量的含义
•一种人为构造的、取值仅为“1”或“0”的变量
1. 定量变量和定性变量

定量变量：测度等级为间距（interval）或比率（ratio）尺度的变量，
如需求量、价格、收入、产量等
测度等级名义nominal或顺序ordinal尺度的变量如性别教育程度等其取值为类别或顺序可用数值表示但数值不具有实际含义仅是表示类别或序次的代码实际建模中考虑定性变量的影响是必要的但直接使用定性变量的取值则具有不合理性直接使用定性变量的不合理性例
第五章经典单方程计量经济学模型专门问题
§5.1 虚拟变量模型
Yi 1 X i 2 E1i＋ 3 E2i 4 E3i i
大多数研究者认为，在一个含有截距的方程中，他们能更容易地处理他们通常感兴趣的问题，是否有某个组与基准组有所不同以及有多大不同，所以在方程中包括截距更方便。
——肯尼迪（Kennedy）
三、虚拟变量的引入

虚拟变量做为解释变量引入模型有两种基本方式：加法方式和乘法方式。
◦ 其取值为具有实际含义的数据 ◦ 可以在建模过程中直接使用这些变量及其数据

定性变量：测度等级名义（nominal）或顺序（ordinal）尺度的变量，
如性别、教育程度等
◦ 其取值为类别或顺序，可用数值表示，但数值不具有实际含义，仅是表示
类别或序次的代码
性别（1－男；0－女）、教育程度（1－小学、2－初中、3－高中、4－大学）
• 其差异为：
E(男)－E(女)＝ 2
• 可以看出，虚拟变量对应的回归系数β2表示：虚拟变量取值为1所代表的类别（男）相对于参照类别（取值为0，女）在因变量上的平均差异，反映出定性变量取值的变化对因变量的影响 • 从回归模型上看，两个组上的回归模型的差异主要在于截距的不同

计量经济学第八章虚拟变量

Yi X i Di X i i
如果该模型设定正确，此时有：
E(Yi
)

(
X
)
i
X
i
D 1 D0
可见，城镇ቤተ መጻሕፍቲ ባይዱ民的边际消费倾向为 ( ) ，农
村居民的边际消费倾向为。
如果不同属性类别对应的截距项和斜率项都是有差异的，可在回归模型中同时引入虚拟变量的加法方式和乘法方式，结果如下：
1 东部 D1 0 其他
1 中部 D2 0 其他
若考虑不同区域居民对应回归模型截距的不同，可构建模型如下：
Yi 1D1i 2 D2i X i i
则有：
E (Yi
)

( (

2) 1)

X i X i

Xi
Yi Di X i Di X i i
对于城镇居民和农村居民这两个类别，有总体回归函数如下：
E(Yi
)

(

)

( X i

)X
i
D 1 D0
可见，和分别表示城镇居民与农村居民
的消费函数在截距和斜率上的差异。
注：
对于包含多个类别（M个）的属性变量，构建M-1个虚拟变量，如在消费模型中，考虑区域因素（东部，中部，西部）影响，可构建2个虚拟变量：
Yi 1D1i 2 D2i (D1i D2i ) X i i
• 则有： ( 1 2 ) Xi

E
(Yi
)

( 1) Xi ( 2 ) Xi

计量经济学之虚拟变量

Yi=α0+α1D1i+α2D2i+α3（D1iD2i）+βXi +μi α1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数； α2为是否发展养蜂生产对农副产品生产总收益的截距差异系数； α3为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数。 α0 ~ α3组成截距水平。
四、虚拟变量的设置原则
每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1，
即如果定性变量有m个类别，则只在模型中引入m-1个虚拟变量。
Y t 0 1 X 1 t … k X k t 1 D 1 t 2 D 2 t 3 D 3 t 4 D 4 t t
Y (X
D)
冷饮的销售额与季节因素的关系
计量经济学之虚拟变量
为了能够在模型中反映这些因素的影响，并提高模型的精度，需要将它们人为地“量化”，这种“量化”通常是通过引入“虚拟变量”来完成的。
这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一类变量，称为虚拟变量。
虚拟变量的特点是：
1．虚拟变量是对经济变化有重要影响的不可测变量。 2．虚拟变量是赋值变量，一般根据这些因素的属性类型，构造只取 “0”或“1” 的人工变量，通常称为虚拟变量，记为D。这是为了便于计算而把定性因素这样数量化的，所以虚拟变量的数值只表示变量的性质而不表示变量的数值。
一般的，基础类型和肯定类型取值为1；比较类型和否定类型取值为0。
例如：
1）表示性别的虚拟变量可取为 D1=
1 男性 0 女性
2）表示文化程度的虚拟变量可取为 D2=
1 本科及以上学历 0 本科以下学历
3）表示地区的虚拟变量可取为
D3=
1 城市 0 农村

计量虚拟被解释变量模型

计量虚拟被解释变量模型引言在计量经济学中，虚拟被解释变量模型是一种统计技术，用于解决因果关系研究中的端点问题。

在这种模型中，被解释变量是通过处理虚拟（或二元）自变量所产生的。

虚拟被解释变量模型常用于实证研究，尤其是在经济学领域。

模型设定虚拟被解释变量模型的基本设定如下：$$ Y_i = \\alpha + \\beta D_i + \\gamma X_i + \\epsilon_i $$其中，Y i是被解释变量，$\\alpha$是常数项，D i是虚拟自变量，$\\beta$是虚拟自变量对被解释变量的系数，X i是其他自变量，$\\gamma$是其他自变量对被解释变量的系数，$\\epsilon_i$是误差项。

虚拟自变量D i通常是二元的，它代表了某一特定性质或条件。

例如，在教育研究中，D i可以表示某人是否接受过高等教育。

虚拟自变量模型的基本思想是比较接受和不接受某一特定条件的个体之间的差异。

性质和假设虚拟被解释变量模型基于以下性质和假设：1.线性性假设：模型假设自变量和被解释变量之间的关系是线性的，即线性回归模型。

2.独立性假设：模型假设误差项$\\epsilon_i$与自变量D i和X i之间不相关。

3.恰当性假设：模型假设虚拟自变量D i是恰当的，并且与被解释变量Y i之间存在着因果关系。

4.无多重共线性假设：模型假设自变量之间不存在高度相关性。

估计和推断对于虚拟被解释变量模型，可以使用最小二乘法进行参数估计，以获取对$\\alpha$、$\\beta$和$\\gamma$的估计值。

通常还可以利用t统计量和F统计量对参数进行假设检验，评估虚拟自变量对被解释变量的影响。

此外，还可以计算模型的拟合优度度量，如决定系数R2和调整决定2，来评估模型的拟合程度和解释能力。

系数R adj实证研究虚拟被解释变量模型在实证研究中有广泛的应用。

以下是一些实证研究领域的例子：在经济学中，虚拟被解释变量模型常用于研究各种政策对经济变量的影响。

计量经济学第九章虚拟变量

虚拟变量的类型
季节虚拟变量
用于反映季节变动对经济活动的影响。
政策虚拟变量
用于反映某项政策实施前后对经济活动的不同影响。
地区虚拟变量
用于反映不同地区之间经济活动的差异。
行业虚拟变量
用于反映不同行业之间经济活动的差异。
虚拟变量的引入原因
解决遗漏变量问题
01
当某些重要变量无法直接观测或获取时，可以通过引入虚拟变
在模型中引入虚拟变量与解释变量的交互项，通过改变斜率的值来反映不同组别之间的差异。
斜率变动模型的应用
适用于研究不同组别之间在某一解释变量上的边际效应差异，如不同教育水平对收入的影响等。
含有多个虚拟变量的模型
含有多个虚拟变量的模型的定义
当模型中引入多个虚拟变量时，称为含有多个虚拟变量的模型。
含有多个虚拟变量的模型的设定
VS
使用计算变量功能
可以使用SPSS的计算变量功能手动创建虚拟变量。在数据视图中，点击“转换”菜单下的“计算变量”选项。在弹出的对话框中，输入虚拟变量的名称和标签，并在计算表达式中输入相应的逻辑表达式。例如，对于分类变量`industry`，可以使用如下表达式生成虚拟变量
SPSS中实现虚拟变量的方法
截距变动模型的设
定
在模型中引入虚拟变量，通过改变截距项的值来反映不同组别之间的差异。
截距变动模型的应
用
适用于研究不同组别之间在某一解释变量上的平均差异，如不同性别、不同地区等。
斜率变动模型
斜率变动模型的定义
当虚拟变量不仅影响模型的截距项，还影响解释变量的斜率时，称为斜率变动模型。
斜率变动模型的设定
通过比较政策虚拟变量的系数，可以分析出政策变动对市场需求的影响程度。

古扎拉蒂《计量经济学基础》第9章

虚拟变量数量的设置规则
1．若定性因素具有m（m≥2）个相互排斥
属性(或几个水平)，当回归模型有截距项时，只能引入m-1个虚拟变量；
2．当回归模型无截距项时，则可引入m个虚拟变量；否则，就会陷入“虚拟变量陷阱”。（为什么？）
若对两个相互排斥的属性 “性别属性”，仍然引入m=2个虚拟变量，则有
E Yi | Di = 0 = 0
Yi （ 0 1） i 女性
Yi 0 i
男性
（2）一个定性解释变量（两种属性）和一
个定量解释变量的情形
模型形式 Yi = f(Di，Xi )+μi 0 1Di
例如：Yi =0 1Di +Xi +μi
其中：Y－支出；X－收入;
Di
1 0
女性支出
例：比较改革开放前、后我国居民（平均）“储蓄－收入”总量关系是否发生了变化？模型的设定形式为：
Yt 1 2 Dt 1X t 2 (Dt X t ) ut
其中 : Yt为储蓄总额，X t为收入总额。
D
1
0
改革开放后改革开放前
回归方程：
改革开放后 EYt | Xt , D 1 （1 2）（1 2）Xt 改革开放前 EYt | Xt , D 0 1 1Xt
夏季、农村居民
E Yi | X i ,D1 = 1, D2 = 0 =（ 0 + 1）+ X i
冬季、城市居民
E Yi | X i , D1 0, D2 1 (0 2 )＋ X i
冬季、农村居民
E Yi | X i , D1 0, D2 0 0 X i
Y
D1 1,D2 1
基准：四季度
（4）两个定性解释变量（均为两种属性）和一个定量解释变量的情形

3.6虚拟变量模型

王中昭制作
• ③、混合方式：虚拟变量与各解释变量之间同时存在相乘和相加关系。 • 特点：模型的截距和斜率均不相同。 • 例如： Yt=a1+a2Dt+b1Xt+b2Dt*Xt+μt • 当Dt=1时，截距=a1+a2，斜率= b1+b2； • 当Dt=0时，截距=a10 本科以上(含本科) , 其它 1 D2 0 本科以下其它
C x D1 D2 0 1 1 0 0 1 0 0 1 1
建立方程： Y=a0+a1D1+a2D2+a3X+μ
职工工资工龄
1 4 1 15 若有如下样本 : X 1 7 1 10 1 26 则D1+D2=1，导致
模型：加法模型, 乘法模型和混合模型.
王中昭制作
本节结束,See you next time！
• 作业：p106.10
由估计结果可知，这表明1989年、1990年物价的急剧变动使得农村居民平均消费有所降低。思考：能用混合模型吗？
王中昭制作
实例3:判断中国农村居民与城镇居民的消费行为是否有显著差异。被解释变量：居民家庭人均生活消费支出Y 解释变量：居民家庭人均工资收入X1、其他收入X2
样本：2013年31个地区农村居民与城镇居民人均数据,虚拟变量Di：农村居民取值1，城镇居民取值0 .
模型中引进虚拟变量的理由，在于考虑1989年、1990年物价的急剧变动对农村居民平均消费水平的影响。D1989和D1990分别定义如下：
1 D1989 0 1989年 1 , D1990 其它 0
(-0.374) (2.47)
1990年其它
, 样本区间为1981年至1997年, 估计结果如下 :

计量经济学-6-虚拟变量模型

1 0
男女
（ 2 ）D= 1 0改改革革开开放放以以后前
（ 3）D1= 0 1
天其气阴他（ 4）D2= 1 0
天气雨其他
如：
D
1
0
1
D
0
城镇居民农村居民政策紧缩政策宽松
D
1
0
1
D
0
销售旺季销售淡季本科以上学历本科以下学历
虚拟变量也可用于标注两个不同的时期或者状态。
在E(i)=0 的初始假定下，高中以下、高中、大学及其以上教育水平下个人保健支出的函数：
高中以下：
E ( Y i|X i , D 1 0 , D 2 0 ) 0 1 X i
高中：
E ( Y i |X i , D 1 1 , D 2 0 ) ( 0 2 ) 1 X i
大学及其以上： E ( Y i |X i , D 1 0 , D 2 1 ) ( 0 3 ) 1 X i
反常年份：
E ( C t|X t,D t 0 ) 0 1 X t
当截距与斜率发生变化时，则需要同时引入加法与乘法形式的虚拟变量。
▪ 例1，考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。
表6.1.1中给出了中国1980~2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。（见Excel）
于是，不同性别、不同学历职工的平均薪金分别为：
•女职工本科以下学历的平均薪金：
E ( Y i|X i , D 1 0 , D 2 0 ) 0 1 X i
•男职工本科以下学历的平均薪金：
E ( Y i |X i , D 1 1 , D 2 0 ) ( 0 2 ) 1 X i

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

5
当然，把哪种情况取0，哪种情况取1要视研究情况而定。0和1只是一个符号而已，不代表他们有高低的意义。我们可以把男性设为1，也可以设为0，得到的结果是一致的。这样就可以把量化的质量变量引入经济计量模型中，以便进一步进行数学处理。
6
需要指出的是，虚拟变量主要是用来代表质的因素，但是有些情况下也可以用来代表数量因素。例如在建立储蓄函数时，“收入”显然是一个重要解释变量，虽然是“数量”因素，但是为了方便也可以用虚拟变量表示。
影响被解释变量，它有个m特征，我们就要引入m-1个虚拟变量；
20
如果回归方程没有截距项，那么这个质的因素有多少个特征就要设多少个虚拟变量，这就是虚拟变量的使用原则。如果虚拟变量设定不当，会使最小二乘法无解，称这种情况为虚拟变量陷阱。
21
下面就用线性代数中的知识来说明这一点。同样用例8.1，引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。
计量经济学——虚拟解释变量模型
在经济计量模型中除了有量的因素外还有质的因素，质的因素包括被解释变量为质的因素和解释变量为质的因素。如果被解释变量为质的因素，主要是逻辑回归要涉及的内容。本章就解释变量为质的因素也就是存在虚拟解释变量时如何进行参数估计等一系列问题进行讨论。
1
第一节引
言
43
而在1979年以后, 物资逐渐丰富, 商品的买卖也取消了票证的限制, 消费者储蓄的主要目的之一是购买高档耐用消费品，储蓄不再具有“被迫”的性质。
；
4. 若 β1=0，β3≠0,则为斜率变动模型，
这种情况在现实中出现得不是很多。
37
ቤተ መጻሕፍቲ ባይዱ
下面，以我国的农村和城市的消费样本为例，实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。
【例8.2】已有数据资料为我国城镇居
民家庭1955年至1985年人均收入和人均储
蓄。根据经验，也就是先验信息，再通过
11
【例8.1】假设有一个包括正常年份和非正常年份（亚洲金融危机或SARS的影响）居民消费的样本，并打算用这些数据估计消费函数。由于在正常年份和非正常年份居民在消费水平上存在明显差异，所以一些外界的影响是一个重要的解释变量。
12
用一个虚拟变量来表示这个质的因素，消费函数为
Yi 0 1D 2 X i ui （8.1）
D2t 0
其他
1 第三季度
D3t 0
其他
这里，第四季度为基础类型，其截距项
为β0 。而其它三个季度的截距项分别为 β0+ β1，β0+ β2 ，β0+ β3 。β1，β2 , β3 代表季节变动引起的消费差异。
32
四个季度的回归模型分别为
第一季度第二季度第三季度第四季度
Yt Yt Yt Yt
（8.21）
β1和 β3 分别表示城镇居民家庭
和农村居民家庭的消费函数在截
距和斜率上的差异。
36
我们一般通过t 检验来判定它们之间是否
有差异。
1. 若β1≠0 ，β3≠0，则为截距和斜率同时变动模型；
2. 若 β1≠0,β3=0，则为截距变动模型； 3. 若 β1=0，β3=0, 则表示城镇居民家庭和农村居民家庭有着完全相同的消费模式
0 0 0 0
1 4Xt 2 4Xt 3 4Xt 4Xt ut
ut ut ut
（8.15）（8.16）（8.17）（8.18）
33
（四）截距和斜率同时变动模型在多数情况下，质的因素不但对
回归模型的截距有影响，而且还会改变模型的斜率。例如城镇居民和农村居民的消费函数不但在斜率上有差异，在截距上也是有可能不一致的，将两个问题同时考虑进来，我们可以得到回归方程
如果只有一个质的因素，且具有m个特征，那么如果是含有截距项的，就要引入 m-1个虚拟变量；不含有截距项的，应该引入m个虚拟变量，这就是虚拟变量的设定原则。
10
一、截距变动模型和斜率变动模型
（一）包含一个虚拟变量的截距变动模型首先从最简单的例子入手，假设只有
一个定性因素影响被解释变量的变化，而且这个因素仅有两种特征，这时候只需要引入一个虚拟变量。
34
Yi 0 1D 2 X i 3 (DX i ) ui
（8.19 式中，Yi=第个）家庭的消费水平，Xi=第个家庭的收入水平，
D
1 0
城镇居民家庭农村居民家庭
35
式（8.19）可以表示为
D 1 Yi 0 1 (2 3 )X i ui （8.20）
D 0 Yi 0 2 X i ui
24
(2)对没有截距的情况，我们如果设两个虚拟变量，
Yi 1D1i 2D2i 3 Xi ui （8.10）
显然模型(8.10)中，解释变量D1,D2和X 之间无完全的多重共线性。可以使用普通最小二乘法估计式（8.10）的参数。
25
（二）斜率变动模型在实际问题中，斜率单独变动出
现的情形一般比较少，它指的是改变了变动的速率也就是弹性。例如城镇居民家庭与农村居民家庭的消费函数，在边际消费倾向（斜率）上可能会有所不同，假设它们的消费函数在截距项没有区别。
(1)对有截距项的情况，我们如果设两个虚拟变量，则回归模型为
Yi 0 1D1i 2 D2i 3 X i ui （8.7）
22
1 D1i 0
正常年份非正常年份
1 非正常年份 D2i 0 正常年份
式(8.7)也可表示
为
Yi 0 X1i 1 X 2i 2 X 3i 3 X i ui （8.8）
D 0 时正常年份 E（Y） i 0 2Xi D 1 时非正常年份 E（YI ) 0 1 2Xi
如果我们绘制图形，得到的结果仍
然是一样的。此时，β1＜０，非正常年份
的线低于正常年份的线，代表非正常年份的消费水平低于正常年份的消费水平。
18
２．虚拟变量D=0所代表的特性或状态通常称为基础类型。和其它特征或状态比较的意义上说，基础类型为对比的基础，在式（8.２）和式（8.３）中，非正常年份就是基础类型，而在式（8.5）和式（8.6）中，正常年份就是基础类型。
其中，X1i 1, X 2i D1i , X 3i D2i
式成立。
X 1i X 2i X 3i
，显然如下等（8.9）
23
式(8.9)表明模型(8.8)即原模型 (8.7)中有完全的多重共线性，将导致最小二乘估计无解。我们称该情景为掉入虚拟变量陷阱。所以，在有截距项的情况下，如果一个质的因素有多少个特征就引入多少个虚拟变量是行不通的。
在经济计量分析中，经常会碰到所建模型的被解释变量不仅受诸如收入、产量、价格、成本、需求、投资等数量变量的影响，而且也受到诸如战争、自然灾害、国际环境、季节变动以及政府经济政策变动等质量变量的影响。建立经济计量模型若不考虑这些质量变量的影响作用，显然是不适宜的。
2
所以，在建立经济计量模型时，即要考虑数量变量，也要考虑质量变量。但是，质量变量和数量变量不同，数量变量可以在事前规定好的尺度上，用不同的数值表现出来，质量变量却只能以属性、种类的不同具体形式表现出来。
16
通过例8.1，我们可以找出虚拟变量模型的一些特征。
１．用“1”来代表质的因素的哪个特征是可以任意设定的。我们一般认为， “1”代表具有某些特征，但没有具体规定。在上例中，也可以指定D=1时为非正常年份，而D=0就必然为正常年份。在这种情况下，正常年份和非正常年份的消费函数分别为
17
模型中的系数β0 为基础类型的截距项，称为公共截距项；系数β1 称为差别截距
系数，指的是D取1时截距系数和基础类型的截距系数的差异。
19
３．如果一个回归模型有截距项，而且这个质的因素又有两种特征，也就是将其分两类，则我们只需要引入一个虚拟变量。如我们的例8.1所示。如果一个回归方程有截距项，只有一个质的因素
30
例如，我们用季度资料研究各种商品消费额在季节上有没有什么区别？可以建立模型如下：
Yt 0 1D1t 2 D2t 3 D3t 4 X t ut
（8.14 其中，Yt=季）度的消费，Xt=季度的收入，对于四个季度，我们引入了三个虚拟变量：
31
1 第一季度
D1t 0
其他
1 第二季度
7
第二节虚拟解释变量的设定
虚拟解释变量模型的设定因为质的因素的多少和这些因素特征的多少而引入的虚拟变量也会不同。
8
以一个最简单的虚拟变量模型为例，如果只包含一个质的因素，而且这个因素仅有两个特征，则回归模型中只需引入一个虚拟变量。如果是含有多个质的因素，自然要引入多个虚拟变量。
9
26
那么回归模型可记为
Yi 0 1 X i 2 (DX i ) ui （8.11 ）
其中，Yi=第个家庭的消费水平， Xi=第个家庭的收入水平，
D
1 0
城镇居民家庭农村居民家庭
27
式（8.11）可以表示为
D 1， Yi 0 (1 2)Xi ui D 0， Yi 0 1Xi ui
14
式（8.2）和式（8.3）分别为正常年份和非正常年份的居民消费水平。二者具有相同的斜率，但是截距不同。
15
利用最小二乘法对式（8.1）进行估计，可得到
Yˆi ˆ 0 ˆ1D ˆ 2 Xi （8.4）
对 β1 作t 检验，若 β1 显著地不为
0，我们就认为正常年份和非正常年份居民在消费行为上的差异是明显的。若 β1 >0 ，则正常年份的居民消费水平高于非正常年份的居民消费水平。
41
1979年以后，我国居民的收入水平大幅度提高，同时，居民储蓄也在大幅度增长。从这些可以看出来，1979 年前后两个时期，我国居民的边际储蓄倾向有显著性差异。

计量经济学——虚拟解释变量模型

计量经济学第5章 虚拟变量模型

金融计量经济第五讲虚拟变量模型和Probit、Logit模型

第九章：虚拟解释变量

计量经济学课后习题答案第八章_答案

计量经济学虚拟变量

金融计量经济第五讲虚拟变量模型和Probit、Logit模型

计量经济学-中-4-虚拟应变量

虚拟变量回归模型：计量经济学

第五讲 虚拟变量模型

计量经济学(共33张PPT)

虚拟变量模型

计量经济学第八章 虚拟变量

计量经济学之虚拟变量

计量虚拟被解释变量模型

计量经济学第九章虚拟变量

古扎拉蒂《计量经济学基础》第9章

3.6虚拟变量模型

计量经济学-6-虚拟变量模型

计量经济学第5章虚拟变量模型

第五讲虚拟变量模型

计量经济学第八章虚拟变量