第五章虚拟变量第八章虚拟变量
第五章虚拟变量-第八章虚拟变量
第二节、数量因素与变参数模型
在经济转折时期,可以建立临界值指标的 虚拟变量模型来反映 设转折时期 t* 转折时期的指标值= x* 虚拟变量 D=1( t >= t*) D=0( t < t*) 模型 y = b0 + b1 x + b2 ( x-x*) D +e t < t* 时 y = b0 + b1 x+ e t >= t* 时 y = b0 -b2 x*+ (b1+ b2) x +e
9
三、虚拟变量模型
引入虚拟变量后,回归方程中同时 含有一般解释变量和虚拟变量,称 这种结构的模型为虚拟变量模型
10
四、模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国GDP的 时间序列,必须考虑“文革”因素对国民经济 的破坏性影响,剔除不可比的“文革”因素。 2、检验不同属性类型对因变量的作用,例如 工资模型中的文化程度、季节对销售额的影响。 3、提高模型的精度,相当与将不同属性的样 本合并,扩大了样本容量(增加了误差自由度, 从而降低了误差方差)。
Dit 10( 第i季 度 — 1, 其 它 季 度 — 0) ( i1,2,3,4)
问 是 否 可 用 普 通 最 小 二 乘 法 进 行 估 计 ? 为 什 么
26
解 : 通 过 观 察 , 很 容 易 发 现 :
第八章 虚拟变量回归 思考题
第八章 虚拟变量回归 思考题
8.1 什么是虚拟变量 ? 它在模型中有什么作用 ?
8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量
1,01D ⎧⎪
=⎨⎪-⎩
大专及大专以上,高中,高中以下
这样的设置方式隐含了什么假定 ? 这一假定合理吗 ?
8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应?
8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为
12233t
i i i i Y D D X u αααβ=++++
其中,
i X =收入水平 ;Y = 年服装消费支出 ;
1,30D ⎧=⎨
⎩大专及大学以上,其他 ;1,20D ⎧=⎨⎩女性
,其他
试写出不同人群组的服装消费函数模型。
8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ?
1) 一年里的 12 个月全部表现出季节模式 ;
2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。
练习题
8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型
[]ˆ 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+--
(4.37)(0.857)(2.42) R2=0.752
其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ;
第八章 虚拟变量
Company Logo
32
四、分段线性回归
❖ 如果回归函数在两个时刻t=b1,b2,(b1<b2)发生结 构变化时,定义两个虚拟变量如下:
以上面第二个模型为例,D=1、0时,回归函数分别是
E(Yi ) (0 2 ) 1X i (D=1)
E(Yi ) 0 1X i
(D=0)
由此可见,向模型引入虚拟变量,其数学意义就是 回归函数截距项发生变化。
对虚拟变量的系数作显著性检验,就是判别两条回
归直线的截距项是否存在显著性差异。
Company Logo
4
2
0 1950 1955 1960 1965 1970 1975 1980
Company Logo
TRADE
27
三、测量斜率变动
模型的数学形式: 以时间time为解释变量,进出口贸易总额用trade表示:
trade 0 1time 2D1 3timeD1 u
Eviews先中生成解释变量time和虚拟变量D的乘积: genr timeD=time*D1
设模型如下
Yi 0 1X i 2Di 3 ( X i Di ) ui
按β2、β3是否为零,回归函数可有如下四种形式:
E(Yi ) 0 1X i (2 3 0)
E(Yi ) (0 2 ) (1 3 ) X i (2 0, 3 0)
虚拟变量虚拟解释变量的回归虚拟被解释变量的回归
各自在住房消费支出 Yi上的差异,设 D1i = 1 为城镇;
D1i = 0 为农村,则模型为
Yi = 0 + 1Xi +1D1 + ui (2)
(模型有截距,“居民属性”定性变量只有两个相互排斥
4
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量 ●虚拟解释变量的回归 ●虚拟被解释变量的回归(选讲,不包括)
5
第一节 虚拟变量
本节基本内容:
●基本概念 ●虚拟变量设置规则
6
一、基本概念
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的
非数值性的因素。
基本思想:
直接在回归模型中加入定性因素存在诸多的困难 (那些困难?),是否可将这些定性因素进行量 化,以达到定性因素能与定量因素有着相同作用 之目的。
7
虚拟变量的定义
计量经济学中,将取值为0和1的人工变量称为虚 拟变量。虚拟变量也称:哑元变量、定性变量等 等。通常用字母D或DUM加以表示(英文中虚拟 或者哑元Dummy的缩写)。 对定性变量的量化可采用虚拟变量的方式实现。
8
二、虚拟变量设置规则
虚拟变量的设置规则涉及三个方面: 1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量
第8章 虚拟变量模型
y
0.25
0.2
0.15
0.1
0.05
x
0.2 0.4 0.6 0.8
1
Var(ui2) = pi - pi2当pi = 0.5时最大
1.4 Y
1.2
1.0
0.8
0.6
0.4
0.2
0.0
-Βιβλιοθήκη Baidu.2 0
X
5
10
15
20
25
30
xi取值在一定范围之内时对被解释变 量可能取值的概率估计才是合理的。
8.1.2 虚拟变量作为自变量的情况
1、虚拟变量的设置规则 (1)一个因素多种属性的问题 规则一:对于一个有m种可能的定性变量,只能引入 m-1个虚拟变量。 否则会导致多重共线性,称作虚拟变量陷阱 (dummy variable trap)。 如,学历、工龄对薪金都有影响,则薪金模型可写为:
Yt b0 b1D1t b2D2t b4t ut
(2)采用合适的方法求上述估计量的方差。
二、设有线性模型y=xB+u,u是随机项,并且已知
E(ui
)
0;
E(u12
)
1,
E(u
2 2
)
4,
E(u
2 3
)
(完整版)第八章 虚拟变量回归 答案
第八章 虚拟变量回归
一、判断题
1。虚拟变量只能作为解释变量.(F)
2。 引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。( T )
3.引入虚拟变量的个数与模型有无截距项无关.(F )
4。虚拟变量用来表示某些具有若干属性的变量.(T)
5。引入虚拟变量的个数与样本容量大小有关。(F )
二、单项选择题
1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨
⎩
东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D ).
A. 相互平行的 B 。 相互垂直的 C. 相互交叉的 D 。 相互重叠的
2.虚拟变量( A )
A 。主要来代表质的因素,但在有些情况下可以用来代表数量因素
B 。只能代表质的因素
C 。只能代表数量因素
D.只能代表季节影响因素
3。分段线性回归模型的几何图形是( D )
A 。 平行线 B. 垂直线 C 。 光滑曲线 D. 折线
4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B ).
A.m B 。m-1 C 。m —2 D.m+1
5.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。
A .异方差性
B .序列相关
C .不完全的多重共线性
D .完全的多重共线性
6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量
第八章 虚拟变量
Yt 1 1 X t ut (1)改革开放前 Yt (1 2 ) ( 1 2 ) X t ut (2)改革开放后 2 , 2 分别是等价模型的截距和斜率差异,分 别称为截距差异系数和斜率差异系数。
显然,用1950-2004年数据估计(*)式,比分别用 1950-1977年和1978-2004年的数据估计(1)和(2)式更好。 估计结果为:
第八章 虚拟变量
1
第一节 虚拟变量
回顾:前面各章讨论的变量都是可以直接用数字计 量的,即可以获得其实际观测值(如收入、支出、 产量物价水平等等)。这些变量称作数量变量。
然而,影响被解释变量的不仅有量的因素,还有质 的因素(如性别、民族、职业、季节、政策等等)
2
一、虚拟变量的概念
虚拟变量是用以反映质的属性的一个人工变量,取 值为 0 或 1,通常记为 D(Dummy Variable),又 可称之为属性变量、双值变量、类型变量、定性变 量、或二元型变量。 注意:虚拟变量D只能取0或1两个值,即属性之间 不能运算! 对基础类型或否定类型设 D=0 对比较类型或肯定类型设 D=1
1 Di 0
(城 ) 市 (农 ) 村
15
E( yi xi , Di 0) 0 xi
表示农村居民的消费水平
计量经济学第八章 虚拟变量
Yi 1D1i 2 D2i (D1i D2i ) X i i
• 则有: ( 1 2 ) Xi
E
(Yi
)
Biblioteka Baidu
( 1) Xi ( 2 ) Xi
Xi
男性 - 城镇 男性 - 农村 女性 - 城镇 女性 - 农村
中部 东部 西部
如果模型中包含不止一个定性变量,利用 虚拟变量还可以研究定性变量对因变量的
交互影响。如在消费模型中,同时考虑性
别(男,女)和来源(城镇,农村)两个 因素,构建虚拟变量如下:
1 男性 D1 0 女性
1 城镇 D2 0 农村
• 可以加法方式引进两个虚拟变量的交互乘 积项 D1D2,构建模型如下:
困难,而且没有截距项时怎样计算 R2 也没
有一个一致同意的方法,所以该方法很少人 使用(Jeffrey M. Wooldridge,2000)。
第二节 虚拟解释变量模型
采用虚拟变量可有效的衡量不同观测类别对 应回归参数的差异性,其中以加法方式引入 虚拟变量可以反映不同类别对应截距的不同 ,以乘法方式引入虚拟变量可以反映不同类 别对应斜率的不同。
Yi Di X i Di X i i
对于城镇居民和农村居民这两个类别,有总 体回归函数如下:
第八章 虚拟变量回归作业及答案一单选题
第八章虚拟变量回归作业及答案
一单选题
1、设某地区消费函数中,消费支出不仅与收入x有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为( C )。
A. 1个
B. 2个
C. 3个
D. 4个
2、对于含有截距项的计量经济模型,若想将含有m个互斥类型的定性因素引入到模型中,则应该引入虚拟变量个数为( B )。
A.m
B.m-1
C.m+1
D.m-k
3、对于一个不包含截距项的回归模型,若将一个具有m个特征的质的因素引入进计量经济模型,则虚拟变量数目为( A ) 。
A.m
B.m-1
C.m-2
D.m+1
4、在利用月度数据构建计量经济模型时,如果一年里的1、3、5三个月表现出季节模式,则应该引入虚拟变量个数为( A )。
A.3
B.12
C.11
D.7
5、设某计量经济模型为:Yi=a+b*Di+ui,其中Yi表示大学教授年薪,D为虚拟变量,D=1:男教授;D=0:女教授。对于参数b的含义,下列解释正确的是( C )。
A. b表示大学女教授的平均年薪
B. b表示大学男教授的平均年薪
C. b表示大学男教授与女教授平均年薪的差异
D. b表示大学男教授和女教授平均年薪
6、当质的因素引进经济计量模型时,需要使用( D )。
A.外生变量
B.前定变量
C.内生变量
D.虚拟变量
7、某商品需求函数为Yi=a+b*Xi+ui,其中Y为需求量,X为价格。为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为( B )。
第8章 虚拟变量模型和设定误差
E Yi | X i , Di 1 0 1) X i ( E Yi | X i , Di 0 0) X i (
Yi = 0 + 1 + X i + μi ( ) Yi = 0 + X i + μi
城市
农村
Y
X
共同的特征:截距发生改变
2.虚拟变量设置的规则 ① 若定性变量含有 m 个类别,应引入 m-1 个虚拟 变量,否则会导致多重共线性,称作虚拟变量陷阱 (dummy variable trap) 。 ② 关于定性变量中的哪个类别取 0,哪个类别取 1, 是任意的,不影响检验结果。 ③ 定性变量中取值为 0 所对应的类别称作基础类别 (base category) 。 ④ 对于多于两个类别的定性变量可采用设一个虚拟 变量而对不同类别采取赋值不同的方法处理。如: 1 (大学)
型斜率系数表示为虚拟变量的函数,以达到相同的目的。
乘法引入方式: (1)截距不变; (2)截距和斜率均发生变化; 分析手段:仍然是条件期望。
(1)截距不变的情形
模型形式: Yt = f X t , Dt X t ut , 1 2 D 例:研究消费支出Y 受收入 Yt 1 X t 2 ( Dt X t ) t
加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改 变方程截距; 2.在没有定量解释变量的情形下,主要 用于方差分析。
计量经济学课件:第08讲 虚拟变量与模型选择
假设2 0,则两个函数有相同的斜率,但有不
同的截距。即,男女职工平均薪水对工作年限
的变化率一样,但两者的平均薪水水平相差
。
2
可以通过传统的回归检验对
的统计显著性进
2
行检验,以判断男女职员的平均薪金水平是否
存在显著差异。
年薪 Y
男职工
女职工
工龄 X
一个定量解释变量和一个两种以上属性定 性解释变量
2022/3/27
金融与统计学院
29
第三节 虚拟应变量
(离散选择模型、定性响应回归模型) (第15章 定性响应回归模型)
虚拟解释变量回归模型中,隐含 假定应变量Y是定量的,而解释 变量是定量、定性的或二者兼有。 然而有的应变量可以是二分性质 的。
需要引入虚拟变量作为应变量,
以对某一经济现象或活动进行
4 X i
其中:
1为女性群体服装年均支出的截距差异系数;
为本科及以上群体服装年均支出的截距差异系
2
数;
3为本科及以上女性群体服装年均支出的截距差
异系数,成为本科女性的交互效应系数。
借助于交互效应虚拟解释变量系数ˆ 3的显著
性检验,可以判断交互效应是否存在。
因此,设定计量经济模型时,不能忽视统 计显著的交互效应变量,否则将会导致模 型的设定偏差。
如,在横截面数据基础上,考虑个人保健支出 对个人收入和教育水平的回归。教育水平考虑 三个层次:高中以下,高中,大学及其以上。 模型设定为
第八章虚拟变量参考答案
练习题8.1参考解答:
(1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。
(2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。 如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。即:
1 1097
(l n
()7)0 1097
i i D X ⎧-=⎨⎩人均收入大于美元人均收入低于
美元
(3) 对于贫穷国,其回归方程为:
2.409.39ln i X -+ 对于富国,其回归方程为:
2.40(9.39-
3.36)ln 3.36*721.12 6.03ln i i X X -++=+
习题8.2参考答案
由于有四个季度,因此引入三个季度虚拟变量
1 1 1 1220 0 0 D D D ⎧⎧⎧===⎨⎨⎨⎩⎩⎩一季度二季度三季度其它其它其它
(1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距
水平)
i 0112233i i Y =D D D X ααααβμ+++++
回归结果如下:
123i 22ˆ=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625
计量经济学 第八章 虚拟变量
0
反常年份
Ct 0 1 X t 2 Dt X t t
(8-4)
这里,虚拟变量 Dt 以与 Xt 相乘的方式引入了模型中,从而可用来 考察消费倾向的变化。
在E(μt)=0的假定下,上述模型所表示的函数可化为: 正常年份:
E(Ct X t , Dt 1) 0 (1 2 ) X t
对某些产品(如冷饮)销售的影响等。
为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将 它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。
这种用两个相异数字来表示对被解释变量有重要影响而自身又 没有观测数值的一类变量,称为虚拟变量(dummy variables)。
虚拟变量也称为哑变量或定性变量。
其中,Y为储蓄,X为收入,Dt为虚拟变量 Dt= 1 改革开放以后
(8-5)
0
改革开放以前
显然在式(8-5)中,同时使用加法和乘法两种方式引入了虚拟变量。
在E(μt)=0的假定下,上述模型所表示的函数可化为: 改革开放以前: E(Yt|Xt,Dt=0)=α0+β1Xt 改革开放以后: E(Yt|Xt,Dt=1)=(α0+α1) +(β1+β2 ) Xt
第八章
第一节 ◆ 虚拟变量
虚拟变量模型
虚拟变量
◆虚拟变量模型
◆虚拟变量的引入
第八章 虚拟变量
又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平 的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
这时需要引入两个虚拟变量:
1 D1 0
高中 其他
1 D2 0
大学及其以上 其他
模型可设定如下:
Yi 0 1 X i 2 D1 3D2 i
(2) 11 , 但 2=2 , 即 两 个 回 归 的 差 异 仅 在 其 截 距 , 称 为 平 行 回 归 (Parallel Regressions);
(3) 1=1 ,但22 ,即两个回归的差异仅在其斜率 ,称为汇合回归 (Concurrent Regressions);
(4) 11,且22 ,即两个回归完全不同,称为相异回归(Dissimilar Regressions)。
概念: 同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型 一个以性别为虚拟变量考察企业职工薪金的模型:
Yi 0 1 X i 2 Di i
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
二、虚拟变量的引入
•虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。
1、加法方式 上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。 在该模型中,如果仍假定E(ui)=0,则 企业女职工的平均薪金为:
第八章 虚拟变量模型分析PPT课件
2.协方差模型(ANCOVA模型)
❖ 方差分析模型在心理学、社会行为学、市 场研究等领域较常见,但在实际经济学模型 中,自变量往往既含有定量变量,也包含定 性变量。我们将自变量中同时包含定性变量 和定量变量的回归模型称为协方差模型 (analysis of covariance,ANCOVA)。
那么,像这样取值只为0、1的变量称为虚拟变量或哑变 量,并用符号表示,从而与常用符号区别开。我们把赋值为 0的一类称为基准类。需要注意的是虚拟变量的赋值是人为 的、任意的,根据人们的习惯而定。如前所提到的性别变量, 也可以用1表示女性,用0表示男性。
❖ 那么对于某些具有大于两个可能值的定性变量,又该如何量 化呢?如职业变量的可能取值为教师、工程师或其他职业。 这样的多分类定性变量在加入计量模型前,同样需要量化成
下面给出含有一个定量变量和一个定性 变量的协方差模型,含有多个定量和定 性变量的协方差模型原理相似不再赘述。
Y i 0 1 D 1 i + 1 X 1 i i , i 1 , 2 ,, n .
其中Y i 表示大学生月话费支出,X 1 i 表示月生活
第8章虚拟变量模型
2. 可以测量变量在不同时期的影响
例如:研究我国国民生产总值 Y 随时间 X 而增 长的过程,需要考虑反常年份这一特殊因素的 影响。若定义 1 反常年份
Dt 0 正常年份
则引入虚拟变量的模型为
Yt 0 1 X t 2 Dt ut
通过对参数 2 进行 t 检验,可以检验反常年份 对社会总产值有无显著影响,就把受反常年份 影响的时期从总过程中区分出来
假定3>2,其几何意义:
y
ˆ ˆ ) ˆX Yi ( 0 3 1 i
ˆ ˆ ) ˆX Yi ( 0 2 1 i
ˆ 3
ˆ 2
ˆ 0
ˆ ˆX ˆ Y i 0 1 i
x
(3)一个定性解释变量(四种属性)和一个 定量解释变量的情形
例如:季度有4种特性 例如: 啤酒售量Y、人均收入X 、季度D; Yi 0 1D1 2 D2 3 D3 X i i 1 一季度 1 二季度 其中: D1 D2 0 其 它 0 其 它 1 D3 0 三季度 其 它
二、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
每一定性变量所需的虚拟变量个数要比该定性变 i 量的类别数少1,即如果定性变量有 m个类型,只在 i 模型中引入m-1个虚拟变量 。
每个虚拟变量定义为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、斜率变动模型
模型中虚拟变量与其它解释变量是相乘关系,
称为虚拟变量的乘法引入方式。
乘法引入方式引起斜率变动
D=1 异常时期
D=0 正常时期
设定模型 Y= b0 + b1 x +b2 D x +e
异常时期模型:(截距相同斜率不同)
Y= b0 + (b1 +b2 ) x +e
正常时期模型:(截距相同斜率不同)
D1=
1, 0,
(高wk.baidu.com—1,
其它—0)
D2
1 0
(大学及以上—1,
其它—0)
则,截距变动模型:
Yi 0 1 X i 2 D1 3 D2 i
截距和斜率都变动的模型:
Yi 0 1 X i 2 D1 3 D2 4 X i D1 5 X i D2 i
25
例 2、设季节的变化对某种商品的需求量有相当大的影响,该商品
第5章 虚拟变量
1
问题的提出
1、计量经济学模型,需要经常考虑属性因素 的影响。例如,职业、战争与和平、繁荣与 萧条、文化程度、灾害、季节 2、属性因素往往很难直接度量它们的大小。 只能给出它们的“Yes—D=1”或”No—D=0”、 或者它们的程度或等级。 3、为了反映属性因素和提高模型的精度, 必须将属性因素“量化”。通过构造0-1型 的人工变量来量化属性因素。
的需求模型为: Yt 0 1 X 1t 2 X 2t t
式中,Y 是商品的需求量,X1 是价格,X2 时收入, 为了反映四个季节对商品需求量的影响,假定引入四个虚拟变量:
Dit
1 0
(第
i
季度—1,
其它季度—0)( i
1,2,3,4 )
问是否可用普通最小二乘法进行估计?为什么
26
解:通过观察,很容易发现:
Y= b0 + b1 x +e
17
三、截距与斜率同时变动 模型
D=1 异常时期 D=0 正常时期 设定模型 Y=b0+ b1x+ b2D + b3Dx +e 异常时期模型:(截距与斜率均不同) Y= (b0 + b2) + (b1 +b3) x +e 反常时期模型:(截距与斜率均不同) Y= b0 + b1 x +e
11
五、虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量的 个数应按下列原则确定: 1、如果模型中包含截距项,而有 m 种互斥 的属性类型,在模型中引入 m-1 个虚拟变量。 例如,性别有2个互斥的属性,引用2-1=1个 虚拟变量
再如,文化程度分小学、初中、高中、大学、
研究生5类,引用4个虚拟变量
9
三、虚拟变量模型
引入虚拟变量后,回归方程中同时 含有一般解释变量和虚拟变量,称 这种结构的模型为虚拟变量模型
10
四、模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国GDP的 时间序列,必须考虑“文革”因素对国民经济 的破坏性影响,剔除不可比的“文革”因素。 2、检验不同属性类型对因变量的作用,例如 工资模型中的文化程度、季节对销售额的影响。 3、提高模型的精度,相当与将不同属性的样 本合并,扩大了样本容量(增加了误差自由度, 从而降低了误差方差)。
当t = t*时, x=x* 两式计算的y 相等,两条直 线在转折期连接成一条折线
19
临界折线的图例
y y = b0 + b1 x + b2 ( x-x*) D
y = b0 + b1 x* x
X* ( t*)
20
第一节 运用虚拟变量改变回归直 线的截距
c
D=0正常
Y=b0+b1X
b2 b0
D=1反常 Y=(b0+b2)+b1X
Y=b0+b1X+b2D+e x
21
第二节 运用虚拟变量改变回归直 线的斜率
c C=b0+(b1+b2)x
D=1反常
Y=b0+b1X+b2DX
C=b0+b1x
D=0正常 x
22
第三节 运用虚拟变量同时改变回 归直线的截距和斜率
Y=(b0+b2)+(b1
D=1反常
+b3)x+e
Y=b0+b1X+b2D+b3DX+e
18
第二节、数量因素与变参数模型
在经济转折时期,可以建立临界值指标的 虚拟变量模型来反映 设转折时期 t* 转折时期的指标值= x* 虚拟变量 D=1( t >= t*) D=0( t < t*) 模型 y = b0 + b1 x + b2 ( x-x*) D +e t < t* 时 y = b0 + b1 x+ e t >= t* 时 y = b0 -b2 x*+ (b1+ b2) x +e
D1 D2 D3 D4 1,
2
模型中引入虚拟变量的必要性
现实经济生活错综复杂,往往要求人们 按照经济变量的质或量的不同,分别进 行处理。因此,回归模型中,往往有必 要引入虚拟变量,以表示这些质的区别。 例如,消费函数,对于平时与战时,萧 条与繁荣,乃至性别、教育程度、季节 性等等,都会因质的有不同表现出不同 的差异。
6
一、虚拟变量的定义
Y=b0+b1x+e 正常时期 D=0正常
23
本章例题
例1设某地区职工工资的收入模型为:
Yt 0 1 X i i
式中,Y 是职工工资收入;X 是工龄 考虑职工收入受教育程度的影响而引入合适的虚拟 变量,对上述模型加以改进。
24
解:教育程度一般分为:高中以下,高中,大学及以上(包括大专) 这样教育程度有三个特征,故引入两个虚拟变量,并设教育程度的 改变,只影响截距的变动。
虚拟变量是一用以反映质的属性 的一个人工变量,通常记为D (Dummy)。 虚拟变量D只取0或1两个值 对基础类型或肯定类型设D=1 对比较类型或否定类型设D=0
7
虚拟变量举例
1 D=
0
0 D=
1
本科学历 非本科学历 “文革”时期 非“文革”时期
8
二、虚拟变量的引入
虚拟变量在模型中,可以作解释变量,也 可以作因变量。 虚拟变量作解释变量时出现在方程的右端 虚拟变量作因变量(被解释变量)时出现 在方程的左端
12
2、如果模型中不包含截距项,则一个质 变量有m种特征,只需要引入m个虚拟 变量。
13
第一节、变参数模型
一、截距变动模型 虚拟变量D 与其它解释变量在模型中是 相加关系,称为虚拟变量的加法引入方 式。 例如,讨论消费问题,消费水平C主要 由收入水平Y决定,但是当特殊情况出 现时政府会采取对消费品限量供应措施, 因此引入虚拟变量D来表示这些特殊情 况与非特殊情况。