第8章 虚拟变量模型和设定误差
第五章虚拟变量-第八章虚拟变量
![第五章虚拟变量-第八章虚拟变量](https://img.taocdn.com/s3/m/d6286315f61fb7360a4c65ca.png)
应如何引入虚拟变量?
33
(3)如果认为上述二种情况都存在,又应如何引 入虚拟变量?
请对上述三种情况分别设定利润模型。
34
谢谢
Dit 10( 第i季 度 — 1, 其 它 季 度 — 0) ( i1,2,3,4)
问 是 否 可 用 普 通 最 小 二 乘 法 进 行 估 计 ? 为 什 么
26
解 : 通 过 观 察 , 很 容 易 发 现 :
D 1D 2D 3D 41,
说 明 虚 拟 解 释 变 量 D 1,D 2,D 3,D 4存 在 完 全 的 多 重 共 线 性 从 而 无 法 用 普 通 最 小 二 乘 法 进 行 估 计 。 反 映 季 节 因 素 的 商 品 需 求 模 型 为 :
Yt 0 2X*t 1 2Xt t
29
第5章习题
一、单项选择题 1、如果一个回归模型中不包含截距项,对一个具
有m个特征的质的因素需要引入的虚拟变量的个 数为: A、m B、m-1 C、m-2 D、m+1
30ห้องสมุดไป่ตู้
2、设个人消费函数Yi=c0+c1Xi+ui中,消费支出Y不仅与收 入X有关,而且与消费者的性别、年龄构成有关,年龄构 成可分为青年、中年和老年三个层次,假设边际消费倾向 不变,则考虑上述因素的影响,该函数引入虚拟变量的个 数为:
Y=b0+b1X+b2D+e x
21
第二节 运用虚拟变量改变回归直 线的斜率
c C=b0+(b1+b2)x
D=1反常
Y=b0+b1X+b2DX
C=b0+b1x
8-3、模型中的特殊解释变量:虚拟变量
![8-3、模型中的特殊解释变量:虚拟变量](https://img.taocdn.com/s3/m/45924f23eefdc8d376ee32c8.png)
2016/3/29
1
8.3、 虚拟变量(Dummy variables)
8.3.1、.虚拟变量的概念
在回归分析中,常常碰到这样一种情况,即因变量 的波动不仅依赖于那种能够很容易按某种尺度定量化的 变量(如收入、产出、价格、身高、体重等),而且依 赖于某些定性的变量(如性别、地区、季节等)。 在经济系统中,许多变动是不能定量的。如政府的更 迭(工党 - 保守党)、经济体制的改革、固定汇率变为 浮动汇率、从战时经济转为和平时期经济等。 这样一些变动都可以用 0-1 变量来表示,用 1 表示具有 某一“品质”或属性,用0表示不具有该“品质”或属 性。这种变量在计量经济学中称为“虚拟变量”。虚拟 变量使得我们可以将那些无法定量化的变量引入回归模 型中。
2016/3/29 2
下面给出几个可以引入虚拟变量的例子。 例1:你在研究学历和收入之间的关系,在你的样 本中,既有女性又有男性,你打算研究在此关系中, 性别是否会导致差别。 例2:你在研究某省家庭收入和支出的关系,采集 的样本中既包括农村家庭,又包括城镇家庭,你打 算研究二者的差别。 例3:你在研究通货膨胀的决定因素,在你的观测 期中,有些年份政府实行了一项收入政策。你想检 验该政策是 否对通货膨胀产生影响。 上述各例都可以用两种方法来解决,一种解决方 法是分别进行两类情况的回归,然后检验参数是否 不同。另一种方法是用全部观测值作单一回归,将 定性因素的影响用虚拟变量引入模型。
女1 0 女2 0 男2 1 女3 0 男3 1 男4 1 女4 0 女5 0
21.2
男5 1
试建立模型研究之。
2016/3/29
9
4、虚拟变量在分段回归中的应用
2016/3/29
第八章 虚拟变量
![第八章 虚拟变量](https://img.taocdn.com/s3/m/67aa2b71f342336c1eb91a37f111f18583d00cd5.png)
Company Logo
9
一、为什么引入虚拟变量
(2)把虚拟变量取值为0所对应的类别称作基础类别。
例如:按上面对“学历”的赋值方法,“无学历”为 基础类别。
(3)当定性变量含有m个类别时,不能把虚拟变量的值 设成如下形式:
0 (第一个类别)
D
1
(第二个类别)
m 1 (第m个类别)
这种赋值法在一 般情形下与虚拟变 量赋值是完全不同 的两回事。
(因为D不能作为Eviews的用户变量名,所以取D1)
Company Logo
28
三、测量斜率变动
Company Logo
29
三、测量斜率变动
trade 0.2818 0.0746time 35.8809D 1.2559timeD
(1.35) (6.2)
(8.4)
(9.6)
还有虚拟变量的两项都是显著的,所以
Company Logo
10
一、为什么引入虚拟变量
(4)回归模型可以只用虚拟变量作解释变量,也可以 用定量变量和虚拟变量一起作解释变量。
Company Logo
11
二、用虚拟变量测量截距变动
❖ 下面给出的模型都属于测量截距变动的模型。
中使用虚拟变量时,回归函数就不再是连续 的了,分段线性回归可以既使用虚拟变量描述出模型 结构变化,又可以使回归函数保持连续,其中每一段 都是线性的。
Company Logo
31
四、分段线性回归
❖ 考虑下面的模型
Yt 0 1X t 2 ( X t X b1)D1 ut
其中Xb1表示结构发生变化的t=b1时刻的Xt的值。
Company Logo
4
一、为什么引入虚拟变量
第08章 虚拟变量(讲稿)
![第08章 虚拟变量(讲稿)](https://img.taocdn.com/s3/m/4d3d583d4b73f242336c5f50.png)
第8章 虚拟变量(dummy variable )在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。
例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。
这些因素也应该包括在模型中。
1。
虚拟变量由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。
这种变量称作虚拟变量,用D 表示。
虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。
⎩⎨⎧=不具有某属性具有某属性01D 例:表示季节的虚拟变量⎩⎨⎧=其它春季011D ⎩⎨⎧=其它夏季012D ⎩⎨⎧=其它秋季013D ⎩⎨⎧=其它冬季014D2.测量截距移动设有模型,y t = β0 + β1 x t + u加法方式增加虚拟变量y t = β0 + β1 x t + β2D + u t ,其中y t ,x t 为定量变量;D 为定性变量。
当D = 0 或1时,上述模型可表达为, β0 + β1x t + u t , (D = 0) y t = (β0 + β2) + β1x t + u t , (D = 1)2040600204060X Y图8.1 测量截距不同D = 1或0表示某种特征的有无。
反映在数学上是截距不同的两个函数。
若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。
例:中国成年人体重y (kg )与身高x (cm )的回归关系如下:–105 + x D = 1 (男) y = - 100 + x - 5D =–100 + x D = 0 (女) 注意:① 若定性变量含有m 个类别,应引入m -1个虚拟变量,否β0β0+β2D = 1D =0则会导致多重共线性,称作虚拟变量陷阱。
②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。
③定性变量中取值为0所对应的类别称作基础类别(base category)。
3测量斜率变化以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。
eviews分布滞后和虚拟变量模型
![eviews分布滞后和虚拟变量模型](https://img.taocdn.com/s3/m/c7184cc1d05abe23482fb4daa58da0116c171fe0.png)
2022/7/17
25
二、虚拟变量的设立(以加法类型为例)
1、自变量全都是虚拟变量
如果一个模型中的自变量全都是虚拟
变量,通常对这种模型的分析方法称之为
方差分析。(为什么把这种模型称为方差
分析模型?)
一个教授年薪的模型:
Yi a Di ui
第八章 分布滞后和虚拟变量模型
§8.1 多项分布滞后(PDL) §8.2 自回归模型 §8.3 虚拟变量回归模型 §8.4 非线性模型 §8.5 设定误差
2022/7/17
1
§8.1 多项分布滞后(PDL)
在经济分析中人们发现,一些经济变量,它们的数值是由 自身的滞后量或者其他变量的滞后量所决定的,表现在计量经济 模型中,解释变量中经常包含某些滞后变量。以投资函数为例, 分析中国的投资问题发现,当年的投资额除了取决于当年的收入 (即国内生产总值)外,由于投资的连续性,它还受到前1 个、 2个、3个…时期投资额的影响。已经开工的项目总是要继续下去 的,而每个时期的投资额又取决于每个时期的收入,所以可以建 立如下关于投资的计量经济方程
德宾提出了自回归模型一阶序列相关的一个大 样本检验,称之为h统计量,方法如下:
2022/7/17
h ˆ
n
1 n[var(ˆ2 )]
(8.2.3)
17
其中n为样本容量, 为滞后 的方 差, ˆ 为随机扰动项的一阶序列相关系数 的估计值。(8.2.3)又可写为:
h (1 1 d )
n
2 1 n[var(ˆ2 )]
2022/7/17
7
类似地, y c pdl(x , 12 , 4 , 2) 包含常数,解释变量 x 的当前 和12阶分布滞后拟合因变量 y,这里解释变量x的系数服从带有 远端约束的4阶多项式。
计量经济学课后习题答案第八章_答案
![计量经济学课后习题答案第八章_答案](https://img.taocdn.com/s3/m/1ac8469f49649b6648d74798.png)
第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。
解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
第八章 虚拟变量模型
![第八章 虚拟变量模型](https://img.taocdn.com/s3/m/41b2e77c27284b73f2425099.png)
正常年份 反常年份
Ct = β 0 + β1 X t + β 2 Dt X t + µt
(8-4) )
这里, 相乘的方式引入了模型中, 这里,虚拟变量 Dt 以与 Xt 相乘的方式引入了模型中,从而可用来 考察消费倾向的变化。 考察消费倾向的变化。
的假定下, 在E(µt)=0的假定下,上述模型所表示的函数可化为 的假定下 上述模型所表示的函数可化为: 正常年份: 正常年份:
例如: 例如:
在截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。 在截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。 个人保健支出对个人收入和教育水平的回归 教育水平考虑三个层次:高中以下,高中,大学及其以上 教育水平考虑三个层次:高中以下,高中, 这时需要引入两个虚拟变量: 这时需要引入两个虚拟变量: 1 0 高中 其它 D2= 1 0 大学及其以上 其它
例如: 例如:
对于改革开放前后储蓄-收入模型, 对于改革开放前后储蓄 收入模型,可设定为 收入模型
Yt = α 0 + α1 Dt + β1 X t + β 2 ( Dt X t ) + µt
其中, 为储蓄 为储蓄, 为收入 为收入, 其中,Y为储蓄,X为收入,Dt为虚拟变量 1 0 改革开放以后 改革开放以前
Y 改革开放以后 改革开放以前
假定 α1 > 0且 β 2 > 0, , 则其几何图形如图8 所示。 则其几何图形如图8-4所示。
X 图8-4 改革开放前后储蓄函数示意图
3.临界指标的虚拟变量的引入
在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。 在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。
第八章 虚拟变量模型分析
![第八章 虚拟变量模型分析](https://img.taocdn.com/s3/m/4eb373f519e8b8f67c1cb951.png)
◆某旅行社为了提高旅游业务 收入,希望通过建立个人旅游 支出模型,找出影响个人旅游 支出的关键因素,从而作出针 对性的旅游宣传。 根据实际经济理论,个人的旅 游支出往往与个人的收入、职 业、受教育程度、性别等有密 切关系,其中职业、教育、性 别因素不是我们前面章节常用 的定量变量,而是定性变量。 职业有教师、工程师、银行职 员等,教育程度可以分为大学 教育和非大学教育,同样性别 因素可以考虑是男是女。将这 样的定性变量作为自变量考虑 进旅游支出模型,模型如何建 立?有怎样的结果和意义?
E Yi | D1i 1 E 0 1 g 1 i 0 1
从上述的结果可以得知,模型截距 0 表示未
3、根据income变量构造虚拟变量d2,用1表示月收入 大于等于10000元的高收入者,0表示月收入小于10000 元的中低收入者。在命令窗口中输入:series d2=(sex="male"),点击回车键,得到虚拟变量d1。
二、虚拟变量作为自变量
在实际经济模型中,因变量不仅会受到定量变 量的影响,同时也会受到定性变量的影响。如个人 的月支出水平往往受到月收入、性别、职业、婚姻 状况等因素的影响,其中月收入为定量变量,性别、 职业、婚姻状况为定性变量。可见这些定性变量也 是影响因变量的重要因素,所以我们有必要将其量 化成虚拟变量后加入到模型中。在回归分析模型中, 我们假设模型自变量为非随机变量。而虚拟变量的 取值为0、1,说明虚拟变量是非随机变量。因此, 对于自变量中含有一个或多个虚拟变量的回归模型, 回归系数的普通最小二乘估计法以及模型检验方法 同样适用。
下面我们建立含有虚拟变量为自变量的回归模型。
1.方差分析模型(ANOVA模型) 在回归分析中,虚拟变量与定量变量一样 可以作为模型的回归元。一个回归模型的自 变量只有虚拟变量,这样的模型称为方差分 析模型(analysis of variance,ANOVA)。为 说明方差分析模型,我们看下面一个只含有 一个虚拟变量的ANOVA模型,含有多个虚拟 变量的ANOVA模型原理相似不再赘述。
第八章 虚拟变量模型
![第八章 虚拟变量模型](https://img.taocdn.com/s3/m/8dce6c85680203d8ce2f2433.png)
• 例如,以1978-2009年的数据为样本,以GDP 作为解释变量,建立居民消费函数。根据分析, 1992年前后,自发消费和消费率都可能发生变 化。
1 Dt 0 92年前 92年及以后
Ct 0 1GDP t 2 Dt 3 ( Dt GDP t ) t t 1978 ,,2009
1 Di 0 农村居民 城镇居民
Ci 0 1 X i 2 Di X i i
E(Ci | X i , Di 1) 0 (1 2 ) X i E(Ci | X i , Di 0) 0 1 X i
农村居民: 城镇居民:
• 例如,根据消费理论,收入决定消费。但是, 在自然灾害、战争等反常年份,消费倾向往往 发生变化。这种消费倾向的变化可通过在消费 函数中引入虚拟变量来考察。
Yi 0 1 X i 3 Di 4 ( Di X i ) i
1 农村居民 Di 0 城镇居民
• 估计得到
ˆ 450.33 0.6920X 271.14D 0.0275 Y Di X i i i i
由变量显著性检验得到:2007年农村居民与城 镇居民的边际消费倾向并无显著差异,他们有 着共同的消费函数。
如果设置第4个虚变量,则出现“虚拟变量陷井” (Dummy Variable Trap),为什么?
• 包含季节变量的正确模型:
Yt 0 1 X 1t k X kt 1 D1t 2 D2t 3 D3t t Yt 0 1 X 1t k X kt 1 D1t 2 D2t 3 D3t 4 D4t t
通过统计检验,判断两个时期中消费函数的截 距和斜率是否发生变化。
9第八章 虚拟变量回归模型
![9第八章 虚拟变量回归模型](https://img.taocdn.com/s3/m/c89250ca77eeaeaad1f34693daef5ef7ba0d12d9.png)
Logit 模型的估计
区分两类数据:
(1)个体水平数据
购房概率 p 0 0 1 1
收入 X(千美元) 6 8 10 12
如果
pi
0,
Zi
ln
0 1
pi
1,
Zi
ln
1 0
可见,Z 表达式无意义,无法用OLS,需用ML(最大似然法)
冰箱销售量(千台) FRIG 1317 1615 1662 1295 1271 1555 1639 1238 1277 1258 1417 1185 1196 1410 1417 919 943 1175 1269
耐用品支出(10亿美元) DUR 252.6 272.4 270.9 273.9 268.9 262.9 270.9 263.4 260.6 231.9 242.7 248.6 258.7 248.4 255.5 240.4 247.7 249.1 251.8
4 回归分析操作命令: equation eq.ls Frig c Dur D1 D2 D3
提问 根据回归分析结果,发现存在什么问题?如何修改回归模型?
8.4 虚拟被解释变量的回归模型
【例】 研究是否购买住房与收入水平的关系。
设是否购房为被解释变量,用 Y 表示;收入为解释变量, 用 X 表示。
1 变量分析:
将DUR作为解释变量;FRIG作为被解释变量; 引入3个季度虚拟变量D1,D2,D3。 (虚拟变量数 = 属性数 – 1 )
2 季度虚拟变量的赋值规则:
D1=
1 (第1季度) 0 (其他季度)
D3=
1 (第3季度) 0 (其他季度)
D2=
计量经济学 第二版 第8章 虚拟变量
![计量经济学 第二版 第8章 虚拟变量](https://img.taocdn.com/s3/m/b2853811227916888486d760.png)
房地产价格受到以下因素影响:
易于量化的定量因素,如成本因素、房地产供求因素、经济
因素、人口因素; 不易量化的定性因素,如社会因素、行政因素、区位因素、 个别因素、投机因素、自然因素。在研究房地产价格中这些 定性变量具有不可忽视的重要影响。
问题的一般性描述
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的非数值性的 因素。
D=
2 研究生 1 本科 0 大专及以下
这样设置隐含了一个假定:研究生和本科生、 本科生与大专生之间薪酬差异程度相同
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问题的 目的出发予以界定。 从理论上讲,虚拟变量取“0”值通常代表比较的 基础类型;而虚拟变量取“1”值通常代表被比较 的类型。 “0”代表基期(比较的基础,参照物); “1”代表报告期(被比较的效应)。
第八章 虚拟变量
一、虚拟变量及其作用 二、虚拟变量的设定 三、虚拟变量的特殊应用 四、虚拟被解释变量 练习题及参考资料 返回
教学目的及要求
了解虚拟变量的意义和作用,掌握虚拟解释变 量的引入方式与设置原则,掌握EViews软件 的相关应用。 掌握虚拟解释变量在调整季节波动、检验模型 的稳定性、分段回归和混合回归等方面的特殊 应用。 了解线性概率模型、Logit模型和Probit模型 的基本思想和估计方法。
例子:性别、国籍、城乡、政策实施、种族、学历、 季节等等
如:
1 D 0
城镇居民
农村居民 政策紧缩
1 D 0 1 D 0
销售旺季
销售淡季
本科以上学历 本科以下学历
1 D 0
政策宽松
变量的划分应遵循穷举与互斥原则。
第8章 虚拟变量模型和设定误差
![第8章 虚拟变量模型和设定误差](https://img.taocdn.com/s3/m/7fb261d4998fcc22bcd10dcb.png)
为了捕获该影响,设C Y u。假设边际消 费倾向 依赖于财产Z。一个简单的表示方法就 是 1 2Z 。代入消费函数,有:
C 1Y 2YZ u
由于YZ 捕获了收入和财产之间的相互作用而被称为 交互作用项。
显然,刻画交互作用的方法,在变量为数量(定量) 变量时, 是以乘法方式引入虚拟变量的。
其中:Di=10
城市 农村
(比较的基础:农村)
那么: E Yi | Di = 1 =(0 + 1)
E Yi | Di = 0 = 0
Yi (0 1) i 城市
Yi 0 i
农村
(2)一个定性解释变量(两种属性)和一个定 量解释变量的情形
模型形式 Yi = f(Di,Xi )+ μi 0 1Di
第8章 虚拟变量模型和设定误差
1
内容安排
8.1 虚拟变量 8.2 虚拟解释变量模型 8.3 虚拟被解释变量模型 8.4 设定误差 8.5 案例
8.1 虚拟变量
8.1.1 什么是虚拟变量
用来描述经济现象的定量属性(类别)的变量称之
为虚拟变量(Dummy Variables)。用符号D
来表示。
如:
1 D 0
Yi = 0 + X i + μi
农村
Y
X
共同的特征:截距发生改变
(3)一个定性解释变量(两种以上属性)和一 个定量解释变量的情形
模型形式 Yi = f ( Xi,D1,D2,...)+ μi
(如:民族有56种特性;季度有4种特性)
例如: 啤酒售量Y、人均收入X、季度D;
Yi 0 1D1 2D2 3D3 Xi i
计量经济学第二版第8章-虚拟变量ppt课件
![计量经济学第二版第8章-虚拟变量ppt课件](https://img.taocdn.com/s3/m/3915162904a1b0717ed5ddd4.png)
表1 我国各地区城乡居民收入 单位:元、人
地区 城镇居民
农村居民
人均可支配收入
人均纯收入
北 京 26738.48
11668.59
天 津 21402.01
8687.56
河 北 14718.25
5149.67
山 西 13996.55
4244.10
内蒙古 15849.19
4937.80
辽 宁 15761.38
➢ 了解线性概率模型、Logit模型和Probit模型的基 本思想和估计方法。
精品课件
引例:男女大学生的消费差异
在校大学生的消费行为越来越受到社会的关 注,学生家长也很关心自己的子女上大学的 花费问题。由共青团、全国学联共同发布的 《2004中国大学生消费与生活形态研究报告》 显示,当代大学生在消费结构方面呈现多元 化趋势。大学生除了日常生活费开支以外, 还有人际交往、网络通信、书报、衣着类、 化妆品类、电脑类、旅游类、食品类、学习 用品类、各类考证类等多重消费。
Yi=(a+α2)+ bxi+εi 研究生(D1=0,D2=1)
三类年薪函数的差异情况如下图所示:
上图直观地描述了三类 年薪函数的差异情况, 通过检验、 α1 、α2的 显著性,可以判断学历 层次对职员的年薪是否 有显著影响。
年薪
α1
精品课件
α2 -α1
研究生 本科 大专以下
工龄
虚拟变量数量的设置规则
4478.35
四 川 13839.40
4462.05
贵 州 12862.53
3005.41
云 南 14423.93
3369.34
西 藏 13544.41
3531.72
计量经济学课件:第08讲 虚拟变量与模型选择
![计量经济学课件:第08讲 虚拟变量与模型选择](https://img.taocdn.com/s3/m/733480092379168884868762caaedd3383c4b5af.png)
2022/3/27
金融与统计学院
10
加法方式
在所设定的计量经济模型中,根据问 题中定性变量的影响作用,按照虚拟 变量设置规则,直接加入适当的虚拟 解释变量,此时,虚拟解释变量与其 他解释变量是相加关系。
加法形式引入虚拟解释变量,作用在 于改变模型的截距水平。
2022/3/27
金融与统计学院
11
女性本科及以上:
E(Yi
|
D1
1,D2
1, X) i (0
1
2
3)
4 X i
男性本科及以上:
E(Yi
|
D1
0, D2
1, X ) i (0
2)
4 X i
女性本科以下:
E(Yi
|
D1
1,D2
0, X ) i (0
1)
4 X i
男性本科以下:
E(Yi
|
D1
0, D2
0, X ) i
0
根据这些因素的属性类型,构造只取“0” 或“1”的人工变量——虚拟变量 (Dummy Variables),记为D。
例如,反映文程度的虚拟变量可取为:
1 本科 D 0 非本科 一般地,在虚拟变量的设置中:
➢ 基础类型、肯定类型取值为1; ➢ 比较类型,否定类型取值为0。
虚拟变量的作用:定性因素定量化
4 X i
其中:
1为女性群体服装年均支出的截距差异系数;
为本科及以上群体服装年均支出的截距差异系
2
数;
3为本科及以上女性群体服装年均支出的截距差
异系数,成为本科女性的交互效应系数。
借助于交互效应虚拟解释变量系数ˆ 3的显著
性检验,可以判断交互效应是否存在。
计量经济学-虚拟变量回归
![计量经济学-虚拟变量回归](https://img.taocdn.com/s3/m/159d9dc3dc88d0d233d4b14e852458fb770b389f.png)
虚拟变量模型有三种类型
1. 解释变量中只包含虚拟变量 2. 解释变量中既包含定量变量也包含虚拟
变量。 3. 被解释变量本身为虚拟变量。
20
第二节 虚拟解释变量的回归
本节基本内容:
●加法类型 ●乘法类型 ●虚拟解释变量综合应用
21
在计量经济学中,通常引入虚拟变量的方式分为 加法方式和乘法方式两种:即
分为四种情形讨论: (1)解释变量只有一个定性变量而无定量变量,而且定性
变量为两种相互排斥的属性; (2)解释变量分别为一个定性变量(两种属性)和一个定
量解释变量;
23
(3)解释变量分别为一个定性变量(两种以上属 性)和一个定量解释变量;
(4)解释变量分别为两个定性变量(各自分别是 两种属性)和一个定量解释变量;
计量经济学
第八章 虚拟变量回归
1
引子:男女大学生消费真有差异吗?
由共青团中央,全国学联共同发布的 《 2004中国大学生消费与生活型态研究报 告》显示,当代大学生的消费行为呈现多元 化的结构。除日常生活开支外还有人际交往 消费、手机类消费、衣着类消费、化妆品类 消费、电脑类消费、旅游类消费等等。
2
4
第一节 虚拟变量
本节基本内容:
●基本概念 ●虚拟变量设置规则
5
一、基本概念
定量因素:可直接测度的数值型因素。 如收入、产出、价格、人数等。
定性因素:属性因素,不能直接测度、 表征某种属性或状态存在与否的非数值型 因素。如性别、婚否、政府经济政策不变 与改革、城市居民或非城市居民等。
6
在以前的学习中,解释变量主要是定 量变量,但现实经济生活中影响被解释 变量的还包括定性变量,比如:研究某 个企业的销售水平,所有制(私营、非 私营)、地理位置(东、中、西部)等 是必须考虑的因素。
第8章虚拟变量模型-精品文档
![第8章虚拟变量模型-精品文档](https://img.taocdn.com/s3/m/5accac32650e52ea551898bd.png)
当第i种属性类型出现时,第i个虚拟变量取1,其它 虚拟变量皆取0,而当所有 D i 都取0时,则表示出现第 m种属性类型。
例:虚拟变量反映季节变动的影响
已知冷饮的销售量 Y除受 k种定量变量 Xk 的影响 外,还受春、夏、秋、冬四季变化的影响,要考 察该四季的影响,只需引入三个虚拟变量即可:
1 春季 D 1t 0 其他
Y i 和居民可支配收入 X i 之间的
各自在住房消费支出
D1i = 0 为农村,则模型为
Y = + X + D + u 2 ) i 0 1 i 1 1 i(
(模型有截距,“居民属性”定性变量只有两个相互排斥
的属性状态( m 2 ),故只设定一个虚拟变量。)
Y i 上的差异,设
二、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
每一定性变量所需的虚拟变量个数要比该定性变 i 量的类别数少1,即如果定性变量有 m个类型,只在 i 模型中引入m-1个虚拟变量 。
每个虚拟变量定义为:
1 第 i个属性 类型 ( i 1 , 2 , , m 1 ) D i 0 非第 i个属性类型
D1i = 1 为城镇;
虚拟变量陷阱
若对两个相互排斥的属性 “居民属性” ,仍然 引入 m 2 个虚拟变量,则有
1城 镇 居 民 D 1 i= 0 农 村 居 民
1农 村 居 民 D 2 i= 0 城 镇 居 民
则模型(1)为 Y X D D u ( 3 ) i 0 1 i 1 1 2 2 i 则对任一家庭都有: , D D+ D1=0 1 +D 2 =1 1 2 即产生完全共线,陷入了“虚拟变量陷阱”。 “虚拟变量陷阱”的实质是:完全多重共线性。
第八章 虚拟变量模型分析PPT课件
![第八章 虚拟变量模型分析PPT课件](https://img.taocdn.com/s3/m/a87dd5a69ec3d5bbfd0a74dd.png)
Y i 0 1 D 1 i i ,
i 1 , 2 ,, n .
❖
其中Y i 为个人月支出;D1i 误差项且 E i =0
=
1, 未婚者的月期望支出为:
E Y i|D 1 i 0 E 0 1 0 i 0
❖ 已婚者的月期望支出为:
E Y i|D 1 i 1 E 0 1 1 i 0 1
下面给出含有一个定量变量和一个定性 变量的协方差模型,含有多个定量和定 性变量的协方差模型原理相似不再赘述。
Y i 0 1 D 1 i + 1 X 1 i i , i 1 , 2 ,, n .
其中Y i 表示大学生月话费支出,X 1 i 表示月生活
1,独生子女
费支出; ; 表示模型随机误差项 D1i=0,非独生子女
下面我们建立含有虚拟变量为自变量的回归模型。
1.方差分析模型(ANOVA模型) 在回归分析中,虚拟变量与定量变量一样
可以作为模型的回归元。一个回归模型的自 变量只有虚拟变量,这样的模型称为方差分 析模型(analysis of variance,ANOVA)。为 说明方差分析模型,我们看下面一个只含有 一个虚拟变量的ANOVA模型,含有多个虚拟 变量的ANOVA模型原理相似不再赘述。
i
且 。 Ei =0
则根据模型有: 非独生大学生月话费支出期望值为:
E Y i|D 1 i 0 E 0 1 0 + 1 X 1 i i 0 1 X 1 i
独生大学生月话费支出期望值为:
E Y i |D 1 i 1 E 0 1 1 + 1 X 1 i i 0 1 1 X 1 i
那么,像这样取值只为0、1的变量称为虚拟变量或哑变 量,并用符号表示,从而与常用符号区别开。我们把赋值为 0的一类称为基准类。需要注意的是虚拟变量的赋值是人为 的、任意的,根据人们的习惯而定。如前所提到的性别变量, 也可以用1表示女性,用0表示男性。
第8章虚拟变量模型
![第8章虚拟变量模型](https://img.taocdn.com/s3/m/1a701866cf84b9d528ea7a93.png)
1 农村居民 D2i = 0 城镇居民
则模型(1)为 Yi 0 1 X i 1D1 2 D2 ui (3) 则对任一家庭都有: , D1 + D2 = 1 D1 + D2 - 1 = 0 即产生完全共线,陷入了“虚拟变量陷阱”。 “虚拟变量陷阱”的实质是:完全多重共线性。
1 1 1 ( X, D) 1 1 1 X 11 X k1 X 12 X k 2 X 13 X k 3 X 14 X k 4 X 15 X k 5 X 16 X k 6 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0
各自在住房消费支出 Yi上的差异,设 D1i = 1 为城镇; D1i = 0 为农村,则模型为
Yi = 0 + 1 X i + 1D1 + ui
的属性状态(
(2)
(模型有截距,“居民属性”定性变量只有两个相互排斥
m 2 ),故只设定一个虚拟变量。)
虚拟变量陷阱
若对两个相互排斥的属性 “居民属性” ,仍然 引入 m 2 个虚拟变量,则有
Y为香烟消费量;
1 其中:Di= 0 城市 农村 (比较的基础:农村)
那么: E Yi | Di = 1 = ( 0 + 1)
Yi ( 0 1) i Yi 0 i
E Yi | Di = 0 = 0
城市
农村
(2) 一个定性解释变量(两种属性)和一个 定量解释变量的情形
iixy130??????????iixy120??????????iixy10???????3??2??0??33一个定性解释变量四种属性和一个定量解释变量的情形01122331234110010iiiyxdydddxddd????????????????????????例如
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一季度:E Yi | X1, D1 1, D2 D3 0 0 1) X i ( 二季度:E Yi | X1, D2 1, D1 D3 0 ( 0 2 ) X i 三季度:E Yi | X1, D3 1, D1 D2 0 ( 0 3 ) X i 四季度:E Yi | X1, D1 D2 D3 0 0 X i
X 、年份状况
D 的影响
1 反常年份 其中: Y 消费支出;X 收入; Dt 0 正常年份 反常年份 E Yt | X t , Dt 1 ( 1 2 ) X t 正常年份 E Yt | X t , Dt 0 1 X t 在正常年份的基础上进行比较,(只有斜率系数发生改变)。
D1 0, D2 0
X
上述图形的前提条件是什么?
运用OLS得到回归结果,再用t检验讨论因素
是否对模型有影响。
加法方式引入虚拟变量的一般表达式:
Yt 0 1D1t 2 D2t ... k Dkt X t ut
基本分析方法: 条件期望。
E(Yt / D1t , D2t ,..., Dkt ) 0 1D1t 2 D2t ... k Dkt X t
(3)一个定性解释变量(两种以上属性)和一 个定量解释变量的情形
模型形式 Yi = f ( X i,1, 2, ) + μi D D ... (如:民族有56种特性;季度有4种特性) 例如: 啤酒售量Y、人均收入X 、季度D; Yi 0 1D1 2 D2 3 D3 X i i 1 一季度 1 其中: D1 D2 0 其 它 0 1 三季度 D3 0 其 它 二季度 其 它
Yt 0 X t ut 1D Yt 1 X t ut 2 X t D
Yi = + βX i + ui
原模型:
= 0 + 1D 乘法方式引入 = 1 + 2 D
加法方式引入
实质:加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。
2.虚拟变量设置的规则 ① 若定性变量含有 m 个类别,应引入 m-1 个虚拟 变量,否则会导致多重共线性,称作虚拟变量陷阱 (dummy variable trap) 。 ② 关于定性变量中的哪个类别取 0,哪个类别取 1, 是任意的,不影响检验结果。 ③ 定性变量中取值为 0 所对应的类别称作基础类别 (base category) 。 ④ 对于多于两个类别的定性变量可采用设一个虚拟 变量而对不同类别采取赋值不同的方法处理。如: 1 (大学)
本课主要讨论 (1)结构变化分析; (2)交互效应分析; (3)分段回归分析
1.虚拟变量在分段回归中的应用
作用: 提高模型的描述精度。 虚拟变量也可以用来代表数量因素的不同阶段。 分段线性回归就是类似情形中常见的一种。 一个例子: 研究不同时段我国居民的消费行为。
实际数据表明,1979年以前,我国居民的消费支 Yt 出 呈缓慢上升的趋势;从1979年开始,居民消 费支出为快速上升趋势。
(0 + 2) + 1xt + ut , (D = 1)
Y
D=1 D =0
40
20
0+2 0
0 0 20 40 X 60
D = 1 或 0 表示某种特征的有无。反映在数学 上是截距不同的两个函数。若2 显著不为零, 说明截距不同;若2 为零,说明这种分类无 显著性差异。 例: 中国成年人体重 (kg) y 与身高 x cm) ( 的回归关系如下: –105 + x D = 1 (男) y = - 100 + x - 5D = – 100 + x D = 0 (女)
为了捕获该影响,设C Y u。假设边际消 费倾向 依赖于财产 Z 。一个简单的表示方法就 是 1 2 Z 。代入消费函数,有:
C 1Y 2YZ u
由于YZ 捕获了收入和财产之间的相互作用而被称为 交互作用项。
显然,刻画交互作用的方法,在变量为数量(定量) 变量时, 是以乘法方式引入虚拟变量的。
Yi 0 1) i ( Yi 0 i
E Yi | Di = 0 = 0
城市
农村
(2)一个定性解释变量(两种属性)和一个定 量解释变量的情形
模型形式 Yi = f(Di,X i )+ μi 0 1Di 例如:Yi = 0 1Di + X i + μi 1 城市 其中: Y-支出;X -收入; Di 0 农村
加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改 变方程截距; 2.在没有定量解释变量的情形下,主要 用于方差分析。
2.以乘法方式引入虚拟变量
基本思想 以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟
Xi 解释变量与其它解释变量的乘积,作为新的解释变量出现在
模型中,以达到其调整设定模型斜率系数的目的。或者将模
冬季、城市居民 E Yi | X i , D1 0, D2 1 ( 0 2 )+ X i
冬季、农村居民
E Yi | X i , D1 0, D2 0 0 X i
D1 1, D2 1
Y
D1 1, D2 0
D1 0, D2 1
如何刻画我国居民在不同时段的消费行为?
基本思路:采用乘法方式引入虚拟变量的手段。显
然,1979年是一个转折点,可考虑在这个转折点作
为虚拟变量设定的依据。若设 X * =1979,当 t < X * 时可引入虚拟变量。(为什么选择1979作为转折 点?)
依据上述思路,有如下描述我国居民在不同时段 消费行为模型:
(2)截距和斜率均发生变化
模型形式: Yi f X t , Dt , Dt X t 0 1D, 1 2 D
例,同样研究消费支出 Y 、收入 X 、年份状况 D 间的影 响关系。
Yt 0 1 X t 1Dt 2 ( Dt X t ) t 1 反常年份 其中: Y 消费支出;X 收入; Dt 0 正常年份 反常年份 E Yt | X t , Dt 1 0 1 ( 1 2 ) X t 正常年份 E Yt | X t , Dt 0 1 X t
Yt 0 1t 2 (t X ) D ut
*
1 其中: D 0 t X t t X t
(t=1955,1956,…,2004)
居民消费趋势方程:
1979年以前: Yt 0 1t ut
1979年以后: Yt 0 2 X * ( 1 2 )t ut
例: 是否发展油菜籽生产与是否发展养蜂生产的差 异对农副产品总收益的影响研究。 模型设定为:
型斜率系数表示为虚拟变量的函数,以达到相同的目的。
乘法引入方式: (1)截距不变; (2)截距和斜率均发生变化; 分析手段:仍然是条件期望。
(1)截距不变的情形
模型形式: Yt = f X t , Dt X t ut , 1 2 D 例:研究消费支出Y 受收入 Yt 1 X t 2 ( Dt X t ) t
(1)一个两种属性定性解释变量而无定量变量 的情形
模型形式:Yi f ( Di ) i 0 1Di 例如:Yi 0 1Di i
1 其中:Di= 0 城市 农村 (比较的基础:农村)
那么: E Yi | Di = 1 = 0 + 1) (
E Yi | X i , Di 1 0 1) X i ( E Yi | X i , Di 0 0) X i (
Yi = 0 + 1 + X i + μi ( ) Yi = 0 + X i + μi
城市
农村
Y
X
共同的特征:截距发生改变
1.以加法方式引入虚拟变量
以加法方式引入虚拟变量时,主要考虑的问 题是定性因素的属性和引入虚拟变量的个数。 分为四种情形讨论: (1)解释变量只有一个定性变量而无定量变量,而且定性 变量为两种相互排斥的属性; (2)解释变量分别为一个定性变量(两种属性)和一个定 量解释变量; (3)解释变量分别为一个定性变量(两种以上属性)和一 个定量解释变量; (4)解释变量分别为两个定性变量(各自分别是两种属性) 和一个定量解释变量;
8.1.2 虚拟变量设置的规则
1.虚拟变量的设置
虚拟变量是用以反映质的属性的一个人工变量。一般 只取0或1两个值,对基础类型或肯定类型设D=1; 对比较类型、或否定类型、或控制类型、或遗漏类 型设D=0。可作解释变量和被解释变量。
虚拟变量的系数称之为差别截距系数,模型称为虚拟 变量模型或斜方差分析模型。 引入虚拟变量,数学上无变化;经济学上为了反映经 济现象的属性。
1 D 0
政策紧缩
政策宽松
1 D 0
本科以上学历
本科以下学历
设有模型, yt = 0 + 1 xt + 2D + ut , 其中 yt,xt 为定量变量;D 为定性变量。 当 D = 0 或 1 时,上述模型可表达为,
0 + 1xt + ut , (D = 0)
yt =
60
D=
0 -1
(中学) (小学)。
8.1.3 虚拟变量的作用
1.可以检验和度量用文字所表述的定性因素的影响。
2.可以测量变量在不同时期的影响。
3.可以用来处理异常数据的影响。
8.2 虚拟解释变量模型