虚拟变量6452836875
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X
* t
,并引入虚拟变量:
Dt
1,t t * 0,t t *
进口消费品需求模型为:
Yt
0 1X t
2
Xt
X
* t
Dt
t
当 1979 年以前,Dt 为 0, 模型为:
Yt 0 1 X t t
1979 年以后,Dt 为 1, 模型为
2、检验不同属性类型对因变量的作用,例如 工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当与将不同属性的样 本合并,扩大了样本容量(增加了误差自由度, 从而降低了误差方差)。
11
五、虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量的 个数应按下列原则确定: 1、如果模型中包含截距项,而有 m 种互斥 的属性类型,在模型中引入 m-1 个虚拟变量。 例如,性别有2个互斥的属性,引用2-1=1个 虚拟变量
27
例3、由经济理论得知,进口消费品数量Y主 要取决于国民收入X,我国改革开放前后进 口消费品的数量发生明显变化,以1979年 为转折期,建立进口消费品需求模型,并 反映这种变化。
28
解:设我国进口消费品需求模型为:
Yt 0 1 X t t
以 t * 1979 年为转折期,并设 1979 年的国民收入为
Yt
0
2X
* t
1 2 X t t
29
第5章习题
一、单项选择题 1、如果一个回归模型中不包含截距项,对一个具
有m个特征的质的因素需要引入的虚拟变量的个 数为: A、m B、m-1 C、m-2 D、m+1
30
2、设个人消费函数Yi=c0+c1Xi+ui中,消费支出Y不仅与收 入X有关,而且与消费者的性别、年龄构成有关,年龄构 成可分为青年、中年和老年三个层次,假设边际消费倾向 不变,则考虑上述因素的影响,该函数引入虚拟变量的个 数为:
第5章 虚拟变量
1
问题的提出
1、计量经济学模型,需要经常考虑属性因素 的影响。例如,职业、战争与和平、繁荣与 萧条、文化程度、灾害、季节 2、属性因素往往很难直接度量它们的大小。 只能给出它们的“Yes—D=1”或”No—D=0”、 或者它们的程度或等级。 3、为了反映属性因素和提高模型的精度, 必须将属性因素“量化”。通过构造0-1型 的人工变量来量化属性因素。
15
二、斜率变动模型
模型中虚拟变量与其它解释变量是相乘关系,
称为虚拟变量的乘法引入方式。
乘法引入方式引起斜率变动
D=1 异常时期
D=0 正常时期
设定模型 Y= b0 + b1 x +b2 D x +e
异常时期模型:(截距相同斜率不同)
Y= b0 + (b1 +b2 ) x +e
虚拟变量在模型中,可以作解释变量,也 可以作因变量。
虚拟变量作解释变量时出现在方程的右端 虚拟变量作因变量(被解释变量)时出现
在方程的左端
9
三、虚拟变量模型
引入虚拟变量后,回归方程中同时 含有一般解释变量和虚拟变量,称 这种结构的模型为虚拟变量模型
10
四、模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国GDP的 时间序列,必须考虑“文革”因素对国民经济 的破坏性影响,剔除不可比的“文革”因素。
6
一、虚拟变量的定义
虚拟变量是一用以反映质的属性 的一个人工变量,通常记为D (Dummy)。 虚拟变量D只取0或1两个值 对基础类型或肯定类型设D=1 对比较类型或否定类型设D=0
7
虚拟变量举例
1
D=
0
0
D=
1
本科学历 非本科学历 “文革”时期 非“文革”时期
8
二、虚拟变量的引入
2ห้องสมุดไป่ตู้
模型中引入虚拟变量的必要性
现实经济生活错综复杂,往往要求人们 按照经济变量的质或量的不同,分别进 行处理。因此,回归模型中,往往有必 要引入虚拟变量,以表示这些质的区别。 例如,消费函数,对于平时与战时,萧 条与繁荣,乃至性别、教育程度、季节 性等等,都会因质的有不同表现出不同 的差异。
39
如题。设计量模型:Y=a1+a2X+a3Z+e, 若变量P作为制度因素通过对X、Z的影响间 接地影响Y,那么在检验P对Y的影响时,可 否直接回归方程 Y=a1+a2*P*X+a3*P*Z+e ? 这是叫做交互 项吗?回归结果出来以后,应该怎么解释 呢?P可以直接放到模型1里面和X、Z共同 作为自变量进行回归吗?
的需要而定,如果该变量的系数不够显著,
便无必要加入了。
41
42
1, D1= 0, (高中—1, 其它—0)
1 D2 0 (大学及以上—1, 其它—0)
则,截距变动模型:
Yi 0 1 X i 2 D1 3 D2 i
截距和斜率都变动的模型:
Yi 0 1 X i 2 D1 3 D2 4 X i D1 5 X i D2 i
问是否可用普通最小二乘法进行估计?为什么
26
解:通过观察,很容易发现:
D1 D2 D3 D4 1,
说明虚拟解释变量 D1,D2,D3,D4 存在完全的多重共线性 从而无法用普通最小二乘法进行估计。 反映季节因素的商品需求模型为:
Yt 0 1 X 1t 2 X 2t 3 D1t 4 D2t 5 D3t t
入虚拟变量? (2)如果认为季节因素使利润对销售额的变化额发生变异,
应如何引入虚拟变量?
33
(3)如果认为上述二种情况都存在,又应如何引 入虚拟变量?
请对上述三种情况分别设定利润模型。
34
虚拟变量是将非数量的品质因素影响加以 量化描述的一种假设的变量,是对事物属性 变化的一种虚拟的量化反应。在回归分析 中,一些社会经济和自然现象的变化,如政治 或经济政策的改变、自然条件的变化及文 化风俗等等,都会对回归模型的建立和准确 的预测带来影响。
35
如果将虚拟变量的出现和不出现加以变量 化的约定,在一个回归模型中反映其出现和 发展的
轨迹,这样就可以提高回归模型预测的准确 性。
具体步骤如下:
(1)分析历史数据的特征。分析历史 数据就是将现象的历史资料数据通过做图 表的方法,对其变化的轨迹进行分析判断。 36
通常做法是:在直角坐标系中将历史数据的 点连接成轨迹线并加以分析。假如在现象 发展的进程中 除了相关变量的影响 如果有 虚拟变量发生,在轨迹线上会出现跳跃性的 转折点。这些变化通常是某种政治、经济 政策的改变或自然因素发生根本性变化的 缘故,传统的回归模型对这些转折点的处理 是无能为力的。
再如,文化程度分小学、初中、高中、大学、
研究生5类,引用4个虚拟变量
12
2、如果模型中不包含截距项,则一个质 变量有m种特征,只需要引入m个虚拟 变量。
13
第一节、变参数模型
一、截距变动模型 虚拟变量D 与其它解释变量在模型中是 相加关系,称为虚拟变量的加法引入方 式。 例如,讨论消费问题,消费水平C主要 由收入水平Y决定,但是当特殊情况出 现时政府会采取对消费品限量供应措施, 因此引入虚拟变量D来表示这些特殊情 况与非特殊情况。
25
例 2、设季节的变化对某种商品的需求量有相当大的影响,该商品
的需求模型为:Yt 0 1 X 1t 2 X 2t t
式中,Y 是商品的需求量,X1 是价格,X2 时收入, 为了反映四个季节对商品需求量的影响,假定引入四个虚拟变量:
1 Dit 0 (第 i 季度—1, 其它季度—0)(i 1,2,3,4 )
40
P可以与X、Z生成交互项 然后重新放入模 型中进行回归
加入了较互项以后,具体解释如下,x和z
对因变量Y的边际影响在一定程度上受P
数值大小的决定,如果交互项足够显著的
话。因此,加了交互项以后,最好要分析
原自变量对因变量的边际影响(其值通过
计算Y对x或z的导数求得)。关于是否将
P作为独立自变量加入,根据你分析问题
当t = t*时, x=x* 两式计算的y 相等,两条直 线在转折期连接成一条折线
19
临界折线的图例
y y = b0 + b1 x + b2 ( x-x*) D
y = b0 + b1 x* x
X* ( t*)
20
第一节 运用虚拟变量改变回归直 线的截距
c
D=0正常
Y=b0+b1X
b2 b0
D=1反常 Y=(b0+b2)+b1X
Y=b0+b1x+e 正常时期 D=0正常
23
本章例题
例1设某地区职工工资的收入模型为:
Yt 0 1 X i i
式中,Y 是职工工资收入;X 是工龄 考虑职工收入受教育程度的影响而引入合适的虚拟 变量,对上述模型加以改进。
24
解:教育程度一般分为:高中以下,高中,大学及以上(包括大专) 这样教育程度有三个特征,故引入两个虚拟变量,并设教育程度的 改变,只影响截距的变动。
37
这里有必要注意的是虚拟变量D对YT的影 响主要有两种形式:A,反映某种因素发生 重大变异或政府政策发生变化的跳跃、间 断的模型;B,具有转折点的系统趋势变化 模型。
38
(2)建立虚拟变量的回归模型。在确定虚 拟变量产生的个数和时间点后,就可以建立 带虚拟变量的回归模型了。虚拟变量的个 数的确定对方程的建立至关重要。在回归 分析中,已有的自变量的个数已影响因变量 的发展,而虚拟变量的引入使得回归模型的 自变量个数得到改变。在建立虚拟变量的 回归模型前,应首先按传统的方法建立回归 模型,再将虚拟变量带入模型中。
正常时期模型:(截距相同斜率不同)
Y= b0 + b1 x +e
17
三、截距与斜率同时变动 模型
D=1 异常时期 D=0 正常时期
设定模型 Y=b0+ b1x+ b2D + b3Dx +e 异常时期模型:(截距与斜率均不同) Y= (b0 + b2) + (b1 +b3) x +e 反常时期模型:(截距与斜率均不同) Y= b0 + b1 x +e
Y=b0+b1X+b2D+e x
21
第二节 运用虚拟变量改变回归直 线的斜率
c C=b0+(b1+b2)x
D=1反常
Y=b0+b1X+b2DX
C=b0+b1x
D=0正常 x
22
第三节 运用虚拟变量同时改变回 归直线的截距和斜率
Y=(b0+b2)+(b1
D=1反常
+b3)x+e
Y=b0+b1X+b2D+b3DX+e
A、a1不等于0,B2不等于0; B、a1不等于0,B2等于0; C、a1等于0,B2等于0; D、a1等于0,B2等于0.
32
5、若随机解释变量的变动,被解释变量的变动存在两个转 折点,即有三种变动模型,则在分段线性回归模型中应引 入虚拟变量的个数为:
A、1个;B、2个;C、3个;D、4个
二、分析题 某行业利润Y不仅与销售额X有关,而且与季节因素有关。 (1)如果认为季节因素使利润平均值发生变异,应如何引
18
第二节、数量因素与变参数模型
在经济转折时期,可以建立临界值指标的 虚拟变量模型来反映 设转折时期 t* 转折时期的指标值= x* 虚拟变量 D=1( t >= t*) D=0( t < t*) 模型 y = b0 + b1 x + b2 ( x-x*) D +e t < t* 时 y = b0 + b1 x+ e t >= t* 时 y = b0 -b2 x*+ (b1+ b2) x +e
A、1个;B、2个;C、3个;D、4个
3、设某商品需求模型为Yi=B0+B1Xi+ut,其中Y是商品的需求 量,X是商品的价格,为了考虑全年12个月份季节变动的 影响,假设模型中引入了12个虚拟变量,则会产生的问题 是:A、异方差;B、序列相关;C、不完全的多重共线性; D、完全的多重共线性
31
4、设截距和斜率同时变动模型为Yi=a0+a1D+ B1Xi+B2(DXi) +ui,如果统计检验表明( )成立, 则上式为截距变动模型