模型中的特殊解释变量虚拟变量08经济

合集下载

计量经济学第5章 虚拟变量模型

计量经济学第5章 虚拟变量模型
第五章 虚拟变量模型
在经济计量模型中除了有量的因素外还有质的因 素,质的因素包括被解释变量为质的因素和解释变量 为质的因素。如果被解释变量为质的因素,主要是逻 辑回归要涉及的内容。本章就解释变量和被解释变量 为质的因素也就是存在虚拟解释变量和虚拟被解释变 量时如何进行参数估计等一系列问题进行讨论。
1
为基础类型截距项。
12
三、虚拟变量的作用 ⑴ 可以描述和测量定性因素的影响。
⑵ 能够正确反映经济变量之间的相互关系,提 高模型的精度。
⑶ 便于处理异常数据。
即将异常数据作为一个特殊的定性因素
1 , 异常时期
D
0
,
正常时期
13
第二节 虚拟解释变量模型
一 、截距变动模型(加法模型)
虚拟变量与其它变量相加,以加法形式引入模
Y i 0 1 D 1 i 2 D 2 i 3 X i u i
Y i ------年支出医疗保健费用支出 X i ------居民年可支配收入
18
1 , 高中
D 1i
0
,
其他
1 , 大学
D 2i
0
,
其他
于是:小学教育程度:
E (Y i X i,D 1 i 0 ,D 2 i 0 )03 X i
7
二、虚拟变量的设置规则
虚拟解释变量模型的设定因为质的因素的多少 和这些因素特征的多少而引入的虚拟变量也会不同。
以一个最简单的虚拟变量模型为例,如果只包 含一个质的因素,而且这个因素仅有两个特征,则 回归模型中只需引入一个虚拟变量。如果是含有多 个质的因素, 自然要引入多个虚拟变量。
8
如果只有一个质的因素,且该质的因素具有 m 个 相互排斥的特征(或类型、属性),那么在含有截距 项的模型中,只能引入 m-1 个虚拟变量,否则会陷入 所谓“虚拟变量陷阱”(dummy variable trap),产 生 完全的多重共线性,会使最小二乘法无解;在不含有 截距项的模型中, 引入 m 个虚拟变量不会导致完全 的多重共线性,不过这时虚拟变量参数的估计结果, 实际上是 D = 1 时的样本均值。

模型中的特殊解释变量虚拟变量经济

模型中的特殊解释变量虚拟变量经济

由于D2,D3的系数没有显著性,说明第二、三季度可以归并入基础类别 第一季度。于是只考虑加入一个虚拟变量D1,把季节因素分为第四季度 和第一、二、三季度两类。从上式中剔除虚拟变量D2,D3,得煤销售量 (Yi)模型如下:
Yˆi = 2515.86 + 49.73 t + 1290.91 D1
(32.03
以时间 t 为解释变量(1982年1季度取t = 1)的煤销售量(Yi)模型估计结 果如下:
Yˆi = 2431.20 + 49.00 t + 1388.09 D1 + 201.84 D2 + 85.00 D3
(26.04) (10.81) (13.43)
(1.96)
(0.83)
R2 = 0.95, DW = 1.2, F=100.4, T=28, t0.05 (28-5) = 2.07
1990~2019年香港季度GDP呈线性增长。2019年由于遭受东南亚金融危机
的影响,经济发展处于停滞状态,2019~2019年底GDP总量几乎没有增长
(见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简
单地用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期,
定义季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量DT如下,
欢迎
文末有福利
8.3 虚拟变量(重点掌握)
许多经济变量是可以定量度量的,如:商品需求量、 价格、收入、产量等。但也有一些影响经济变量的 因素无法定量度量,如:职业、性别对收入的影响; 战争、自然灾害对GDP的影响;季节对某些产品 (如冷饮)销售的影响等等。
为了在模型中能够反映这些因素的影响,并提高模 型的精度,需要将它们“量化”。

解释变量包含虚拟变量的回归模型

解释变量包含虚拟变量的回归模型
(3) 1=1 ,但22 ,即两个回归旳差别仅在其 斜率,称为汇合回归(Concurrent Regressions);
(4) 11,且22 ,即两个回归完全不同,称为 相异回归(Dissimilar Regressions)。
平行回归
汇合回归
相异回归
能够利用邹氏构造变化旳检验。这一问题 也可经过引入乘法形式旳虚拟变量来处理。
• 为了在模型中能够反应这些原因旳影响,并提 升模型旳精度,需要将它们“量化”。
这种“量化”一般是经过引入“虚拟变量” 来完毕旳。根据这些原因旳属性类型,构造只取 “0”或“1”旳人工变量,一般称为虚拟变量 (dummy variables),记为D。
• 例如,反应文化程度旳虚拟变量来自取为:1, 本科学历 D=
90年前 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990
表 5.1.1
储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2
1979~2001 年中国居民储蓄与收入数据(亿元)
GNP
90年后
储蓄
4038.2
1991
9107
4517.8
1992
11545.4
4860.3
1993
14762.4
5301.8
1994
21518.8
5957.4
1995
29662.3
7206.7
1996
38520.8
8989.1
1997
46279.8
第五章 解释变量包括虚拟变量 旳回归模型

计量经济学习题册第八章、第九章、第十章 答案

计量经济学习题册第八章、第九章、第十章 答案

第八章一、名词解释1、虚拟变量:在建立模型时,有一些影响经济变量的因素无法定量描述,如职业、性别对收入的影响,教育程度,季节因素等往往需要用定性变量度量。

为了在模型中反映这类因素的影响,并提高模型的精度,需要将这类变量“量化”。

根据这类边另的属性类型,构造仅取“0”或“1”的人工变量,通常称这类变量为“虚拟变量”2、虚拟变量陷阱:一般在引入虚拟变量时要求如果有m个定性变量,字在模型中引入m-1个虚拟变量。

否则,如果引入m个虚拟变量,就会导致模型解释变量间出现完全共线性的情况。

我们一般称由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题,称为“虚拟变量陷阱”二、单项选择题1、B:“地区”一个,“季节”三个2、A:将D=1代入估计后的方程即可3、D:“季节”包含4个类型,只能用3个虚拟变量,用4个虚拟变量会出现完全多重共线的问题,参数将无法估计4、C:“地区”只有两个类别,引入两个虚拟变量会出现完全多重共线问题5、A:1α体现了城镇和农村截距上的差异,1β体现了城镇和农村斜率上的差异,当它们为0时,表示无差异6、A:斜率相同,仅截距不同7、D:此问题表现为1000前后斜率的变化,B表示截距的变化,不合适;C在D=0时没有解释变量,不正确;A和D相比,D更合适,A会造成曲线在临界值出断开,但D会保证曲线的连贯的。

8、A:虚拟变量表示性别、季节等时,只表示属性的不同,没有等级之分,作为质的因素;表示收入高低时,高与低是有级别的,属于有序数据,可以表示数量的因素。

9、A/B:这题比较牵强,按书上原话应该选择B;但当用加法引入虚拟变量时,会存在问题。

【当用加法形式引入虚拟变量时,用一个虚拟变量作为截距项,取值全部为1;其他m-1个表示该因素的前三个类型。

如果不引入截距项,当虚拟变量都取0时不能解释该因素第四个类型的作用。

】10、D :概念性三、多项选择题1、B C D :A 太绝对,也可以表示数量因素;E 太绝对2、ABCDE :A 加法方式;B 乘法方式;C 临界指标的虚拟变量;D 在ABC 基础上可构造分段回归3、AB :C 当虚拟变量取0或2时,过程一样,但参数的意义稍作调整;D 见书P207倒数第二段。

第8章 虚拟变量模型

第8章 虚拟变量模型
设,则可以得出结论,上海股票市场不存在周内
效应。
8.1.3 虚拟变量作为因变量的情况
1、因变量为虚拟变量的回归模型
• 虚拟变量作为因变量的模型也称定性响应模型,既可 以包括二值变量模型(也称二分选择模型),也包括 多分选择模型。我们重点讨论二值变量模型。
• 模型举例: 一个大学毕业生是否会被一个不错的MBA项目录取, 取决于其学习成绩、GMAT分数和其它因素。 一位成年男子是否就业取决于总体失业率、平均工资 率、受教育程度和家庭收入等因素。
其中:
1
yi
{ 0
已购买汽车 未购买汽车
且假定E(ui ) 0
1.2 Y
1.0
0.8
0.6
0.4
0.2
0.0 X
-0.2 280 300 320 340 360 380 400 420
对于给定的xi ,E(yi / xi ) 0 1xi
设pi表示yi 1的概率,则1 pi表示yi 0的概率 E(yi / xi ) pi 1 (1 pi) 0 pi 可见,该模型描述了随着收入的变动, 第i个家庭 购买汽车的概率变动情况。
b0 + b1xt + ut , (D = 0)
Y
yt =
b0 + (b1 + b2) xt + ut , (D = 1)


t
0
3、一般方式
直接以加法和乘法方式引入虚拟变量。 可建立如下模型:
yt = b0 + b1 xt + b2 D + b3 xt D + ut ,
其中 xt 为定量变量;D 为定性变量。当 D = 0 或 1 时,上述模
yt =

虚拟变量模型

虚拟变量模型
设置虚拟变量:
建立如下模型:
注意:参照组是什么?
第14页/共30页
假定E(i)=0,则: 对于女职工(D=0),其平均薪金为:
对于男职工(D=1),其平均薪金为:
可以看出,虚拟变量对应的回归系数β2表示:虚拟变量取值为1所代表的类别(男)相对于参照类别(取值为0,女)在因变量上的平均差异,反映出定性变量取值的变化对因变量的影响 从回归模型上看,两个组上的回归模型的差异主要在于截距的不同
§5.1 虚拟变量模型
第1页/共30页
一、虚拟变量的含义
一种人为构造的、取值仅为“1”或“0”的变量
第2页/共30页
1. 定量变量和定性变量
定量变量:测度等级为间距(interval)或比率(ratio)尺度的变量,如需求量、价格、收入、产量等其取值为具有实际含义的数据可以在建模过程中直接使用这些变量及其数据定性变量:测度等级名义(nominal)或顺序(ordinal)尺度的变量,如性别、教育程度等其取值为类别或顺序,可用数值表示,但数值不具有实际含义,仅是表示类别或序次的代码性别(1-男;0-女)、教育程度(1-小学、2-初中、3-高中、4-大学)实际建模中,考虑定性变量的影响是必要的,但直接使用定性变量的取值则具有不合理性
由3与4的t检验可知:参数显著地不等于0,强烈显示出两个时期的回归是相异的,
1990年前:
1990年后:
储蓄函数分别为:
第27页/共30页
(三)临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。
则进口消费品的回归模型可建立如下:
例:进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。 这时,可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:

计量经济第七章虚拟变量模型

计量经济第七章虚拟变量模型
11
1.线性概率模型(LPM模型)
定义:以虚拟变量为因变量的线性回 归模型称为线性概率模型。 (linear probability model,LPM) 模型的基本形式为:
Yi 0 1 X1i +2 X 2i L k X ki ui ,
E Yi | X 0 1 X1i +2 X 2i L k X ki ,
第八章 虚拟变量模型
1
第一节 第二节 第三节
虚拟变量模型概述 二元概率模型 二元逻辑模型
2
第一节
虚拟变量模型概述
一、虚拟变量的含义 二、虚拟变量作为自变量 三、虚拟变量作为因变量
3
一、虚拟变量的含义
• 一个定性变量,它的可能值只有两个, 也就是说出现或不出现某种属性。一般 地,用1表示出现某种属性,用0表示没 有出现该属性。像这样取值只为0、1的 变量称为虚拟变量或哑变量。 • 并用符号 D表示,从而与常用符号 X区别 开。我们把赋值为0的一类称为基准类。
14
一、二元Probit模型
• 二元Probit模型的基本形式为:
1 Pi Zi 2

Zi

e
t 2 /2
dt
其中 Zi 0 1 X1i +L +k X ki ;是累积标 准正态分布函数,t 为服从标准正态分布 的随机变量。
Zi 1 P i 1 P i 0 1 X1i +L +k X ki .
i 1,2,L , n.
1,已婚 其中 Yi 为个人月支出, D1i = 0,未婚
7
• 未婚者的月期望支出为:
E Yi | D1i 0 E 0 1 g0 ui 0

第八章 虚拟变量模型

第八章  虚拟变量模型
Y 改革开放以后 改革开放以前
假定 1 0且 2 0, 则其几何图形如图8-4所示。
X 图8-4 改革开放前后储蓄函数示意图
3.临界指标的虚拟变量的引入
在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。
例如:
进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后, Y对X的回归关系明显不同。 这时,可以t*=1979为转折期,以1979年的国民收入Xt*为临界值, 设如下虚拟变量: Dt= 1 0 t≥t* t< t*
二、虚拟变量模型
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。
在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要
是用作解释变量。
例如:一个以性别为虚拟变量来考察职工薪金的模型如下:
Y X D i 0 1 i 2 i i
其中 ——为职工的薪金;
i
(8-1)
譬如年龄因素虽然可以用数字计量,但如果将年龄作为资料分组的特 征,则可将年龄选作虚拟变量。
例如:
家庭教育经费支出不仅取决于其收入,而且与年龄因素有关。 按年龄划分为三个年龄组:6—18岁年龄组(中小学教育);19—22岁 年龄组(大学教育);其它年龄组。于是设定虚拟变量 1 0 6-18岁年龄组 其它 1 0 19-22年龄组 其它
为描述虚拟变量交互作用对被解释变量的效应,在(8-9)式中以加法形式引入 两个虚拟解释变量的乘积,即
Yi=α0+α1D1i+α2D2i+α3(D1iD2i)+βXi +μi
(8-10)
(1)基础类型:不发展油菜籽生产,也不发展养蜂生产时农副产品生产平均总收益
E(Yi|Xi,D1=0,D2=0)= α0+βXi

计量经济学——虚拟解释变量模型PPT课件

计量经济学——虚拟解释变量模型PPT课件

编辑版pppt
8
以一个最简单的虚拟变量模型为例,如 果只包含一个质的因素,而且这个因素 仅有两个特征,则回归模型中只需引入 一个虚拟变量。如果是含有多个质的因 素, 自然要引入多个虚拟变量。
编辑版pppt
9Байду номын сангаас
如果只有一个质的因素,且具有m个特 征,那么如果是含有截距项的,就要引入 m-1个虚拟变量;不含有截距项的, 应该 引入m个虚拟变量,这就是虚拟变量的设 定原则。
编辑版pppt
10
一 、截距变动模型和斜率变动模型
(一)包含一个虚拟变量的截距变动模型 首先从最简单的例子入手,假设只有一
个定性因素影响被解释变量的变化,而且这 个因素仅有两种特征,这时候只需要引入一 个虚拟变量。
编辑版pppt
11
【例8.1】假设有一个包括正常年份和
非正常年份(亚洲金融危机或SARS的影
17
D 0时 正常E 年 ( Y ) i 份 02 X i D 1时 非正E 常 ( Y I) 年 01份 2 X i
如果我们绘制图形,得到的结果仍然
是一样的。此时,β1<0,非正常年份的
线低于正常年份的线,代表非正常年份的 消费水平低于正常年份的消费水平。
编辑版pppt
18
2.虚拟变量D=0所代表的特性或
编辑版pppt
6
需要指出的是,虚拟变量主要是用来 代表质的因素,但是有些情况下也可以 用来代表数量因素。例如在建立储蓄函 数时,“收入”显然是一个重要解释变 量,虽然是“数量”因素,但是为了方 便也可以用虚拟变量表示。
编辑版pppt
7
第二节 虚拟解释变量的设定
虚拟解释变量模型的设定因为质的 因素的多少和这些因素特征的多少而引 入的虚拟变量也会不同。

计量经济学第九章虚拟变量

计量经济学第九章虚拟变量

虚拟变量的类型
季节虚拟变量
用于反映季节变动对经济活动的影响。
政策虚拟变量
用于反映某项政策实施前后对经济活 动的不同影响。
地区虚拟变量
用于反映不同地区之间经济活动的差 异。
行业虚拟变量
用于反映不同行业之间经济活动的差 异。
虚拟变量的引入原因
解决遗漏变量问题
01
当某些重要变量无法直接观测或获取时,可以通过引入虚拟变
在模型中引入虚拟变量与解释变量的交互项,通过 改变斜率的值来反映不同组别之间的差异。
斜率变动模型的应用
适用于研究不同组别之间在某一解释变量上 的边际效应差异,如不同教育水平对收入的 影响等。
含有多个虚拟变量的模型
含有多个虚拟变量的模型的定义
当模型中引入多个虚拟变量时,称为含有多个虚拟变量的模型。
含有多个虚拟变量的模型的设定
VS
使用计算变量功能
可以使用SPSS的计算变量功能手动创建虚 拟变量。在数据视图中,点击“转换”菜 单下的“计算变量”选项。在弹出的对话 框中,输入虚拟变量的名称和标签,并在 计算表达式中输入相应的逻辑表达式。例 如,对于分类变量`industry`,可以使用如 下表达式生成虚拟变量
SPSS中实现虚拟变量的方法
截距变动模型的设

在模型中引入虚拟变量,通过改 变截距项的值来反映不同组别之 间的差异。
截距变动模型的应

适用于研究不同组别之间在某一 解释变量上的平均差异,如不同 性别、不同地区等。
斜率变动模型
斜率变动模型的定义
当虚拟变量不仅影响模型的截距项,还影响 解释变量的斜率时,称为斜率变动模型。
斜率变动模型的设定
通过比较政策虚拟变量的系数,可以分析 出政策变动对市场需求的影响程度。

计量经济学-虚拟变量回归

计量经济学-虚拟变量回归
19
虚拟变量模型有三种类型
1. 解释变量中只包含虚拟变量 2. 解释变量中既包含定量变量也包含虚拟
变量。 3. 被解释变量本身为虚拟变量。
20
第二节 虚拟解释变量的回归
本节基本内容:
●加法类型 ●乘法类型 ●虚拟解释变量综合应用
21
在计量经济学中,通常引入虚拟变量的方式分为 加法方式和乘法方式两种:即
分为四种情形讨论: (1)解释变量只有一个定性变量而无定量变量,而且定性
变量为两种相互排斥的属性; (2)解释变量分别为一个定性变量(两种属性)和一个定
量解释变量;
23
(3)解释变量分别为一个定性变量(两种以上属 性)和一个定量解释变量;
(4)解释变量分别为两个定性变量(各自分别是 两种属性)和一个定量解释变量;
计量经济学
第八章 虚拟变量回归
1
引子:男女大学生消费真有差异吗?
由共青团中央,全国学联共同发布的 《 2004中国大学生消费与生活型态研究报 告》显示,当代大学生的消费行为呈现多元 化的结构。除日常生活开支外还有人际交往 消费、手机类消费、衣着类消费、化妆品类 消费、电脑类消费、旅游类消费等等。
2
4
第一节 虚拟变量
本节基本内容:
●基本概念 ●虚拟变量设置规则
5
一、基本概念
定量因素:可直接测度的数值型因素。 如收入、产出、价格、人数等。
定性因素:属性因素,不能直接测度、 表征某种属性或状态存在与否的非数值型 因素。如性别、婚否、政府经济政策不变 与改革、城市居民或非城市居民等。
6
在以前的学习中,解释变量主要是定 量变量,但现实经济生活中影响被解释 变量的还包括定性变量,比如:研究某 个企业的销售水平,所有制(私营、非 私营)、地理位置(东、中、西部)等 是必须考虑的因素。

虚拟变量在金融和经济中的作用

虚拟变量在金融和经济中的作用

虚拟变量在金融和经济中的作用摘要在现代经济计量分析中,利用模型进行回归分析是应用比较广泛的一种数量分析技术。

一般回归分析中变量都是定量变量,这是因为模拟回归需要样本数据。

但实际中有时模型仅考虑定量变量是不够的。

因为经济现象不仅受一些定量因素的影响,还可能受到一些定性因素的影响。

比如,不同时期的不同政策、战争、自然灾害等非常时期,人的不同性别、文化程度、婚姻状况等。

如果某一应变量的确存在这种定性影响,那么仅用定量变量对被解释变量进行解释显然是不够的,利用虚拟变量技术可以解决此类问题。

所谓虚拟变量技术就是把定性变量虚拟化,并把它作为解释变量或者是自变量纳入回归模型的一种方法。

在这里,定性变量就是虚拟化的变量,即虚拟变量。

一般可根据定性因素的二分特性进行人工赋值,即0和1,其中“1”表示具备某种属性或受到某种因素影响,而“0”则表示不受某种因素影响或不具备某种属性。

定性变量虚拟化后就可以纳入回归模型,从而进行模拟分析或预测。

一.虚拟变量模型的性质与方法1. 为了区分两个类别,只引入一个虚拟变量Di。

一般规则是:如果一个定性变量有m个属性值,则仅引入m-1个虚拟变量。

2. 虚拟变量0,1值的分配可以是任意的,但解释模型时一定注意1,0是怎样分配的。

3. 被分配0的类别或级别通常被用于比较的基础。

4. 虚拟变量的系数可以称为级差截距系数,表明取值1的类别截距项与基底类的截距项的差距虚拟的通常使用方法是,对一些通常表明“品质”或“属性”是否存在的属性变量,将其量化,给其赋值为“1”或“0”来表示虚拟变量出现某种属性和未出现某种属性。

设某个回归模型含有p个数量变量和一个品质变量,该品质变量可以有k+1个(k≥1)水平,据此,可建立以下回归模型:其中x i,p+1 ,…x i,p+k为k个引入的虚拟变量,并且需要拟合的回归方程为通常情况下,该方程能较好地通过线性性检验,弥补仅用数量变量拟合的不足。

二.虚拟变量的其他使用方法除此之外,虚拟变量也有一些其他的使用方法,例如将虚拟变量出现某种属性赋值为任意常数“a”,未出现某种属性赋值为“0”,并验证这种赋值方式,所得到的参数估计值是赋值“1”或“0”时的1/a,预测结果相一致。

天津财经大学计量经济学题库及答案

天津财经大学计量经济学题库及答案

第一章绪论一、填空题:1.计量经济学是以揭示经济活动中客观存在的__________为内容的分支学科,挪威经济学家弗里希,将计量经济学定义为__________、__________、__________三者的结合。

数量关系、经济理论、统计学、数学2.数理经济模型揭示经济活动中各个因素之间的__________关系,用__________性的数学方程加以描述,计量经济模型揭示经济活动中各因素之间的__________关系,用__________性的数学方程加以描述。

理论、确定、定量、随机3.经济数学模型是用__________描述经济活动。

数学方法4.计量经济学根据研究对象和内容侧重面不同,可以分为__________计量经济学和__________计量经济学。

理论、应用5.计量经济学模型包括__________和__________两大类。

单方程模型、联立方程模型6.建模过程中理论模型的设计主要包括三部分工作,即__________、____________________、____________________。

选择变量,确定变量之间的数学关系,拟定模型中待估计参数的数值范围7.确定理论模型中所包含的变量,主要指确定__________。

解释变量8.可以作为解释变量的几类变量有__________变量、__________变量、__________变量和__________变量。

外生经济,外生条件,外生政策,滞后被解释9.选择模型数学形式的主要依据是__________。

经济行为理论10.研究经济问题时,一般要处理三种类型的数据:__________数据、__________数据和__________数据。

时间序列,横截面,虚变量11.样本数据的质量包括四个方面__________、__________、__________、__________。

完整性,准确性,可比性,一致性12.模型参数的估计包括__________、__________和软件的应用等内容。

计量经济学-期末考试-名词解释

计量经济学-期末考试-名词解释

第一章导论1、截面数据:截面数据是许多不同的观察对象在同一时间点上的取值的统计数据集合,可理解为对一个随机变量重复抽样获得的数据。

2、时间序列数据:时间序列数据是同一观察对象在不同时间点上的取值的统计序列,可理解为随时间变化而生成的数据。

3、虚变量数据:虚拟变量数据是人为设定的虚拟变量的取值。

是表征政策、条件等影响研究对象的定性因素的人工变量,其取值一般只取“0”或“1”。

4、内生变量与外生变量:。

内生变量是由模型系统决定同时可能也对模型系统产生影响的变量,是具有某种概率分布的随机变量,外生变量是不由模型系统决定但对模型系统产生影响的变量,是确定性的变量。

第二章一元线性回归模型1、总体回归函数:是指在给定X i下Y分布的总体均值与X i所形成的函数关系(或者说将总体被解释变量的条件期望表示为解释变量的某种函数)2、最大似然估计法(ML): 又叫最大或然法,指用产生该样本概率最大的原则去确定样本回归函数的方法。

3、OLS估计法:指根据使估计的剩余平方和最小的原则来确定样本回归函数的方法。

4、残差平方和:用RSS表示,用以度量实际值与拟合值之间的差异,是由除解释变量之外的其他因素引起的被解释变量变化的部分。

5、拟合优度检验:指检验模型对样本观测值的拟合程度,用表示,该值越接近1表示拟合程度越好。

第三章多元线性回归模型1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量影响的现象,表现在线性回归模型中有多个解释变量,这样的模型被称做多元线性回归模型,多元是指多个解释变量2、调整的可决系数:又叫调整的决定系数,是一个用于描述多个解释变量对被解释变量的联合影响程度的统计量,克服了随解释变量的增加而增大的缺陷,与的关系为。

3、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1单位对被解释变量带来的平均影响程度。

4、正规方程组:采用OLS方法估计线性回归模型时,对残差平方和关于各参数求偏导,并令偏导数为0后得到的方程组,其矩阵形式为。

第八章 模型中的特殊解释变量

第八章  模型中的特殊解释变量
第八章 模型中的特殊解释变量
一、随机解释变量 二、滞后变量问题 三、虚拟变量问题 四、时间变量
第一节
随机解释变量问题
一、估计量的渐近特征
1.渐进无偏性(P202) 所谓渐进分布是指,当样本容量N→∞时, 随机变量序列将收敛到某个特定的分布。 所谓渐进无偏性是指,如果当N→∞时, 参数估计量的数学期望值将趋向于总体参数 的真实值。这时,将参数估计量称为总体参 数的渐近无偏估计。
第三节 虚拟变量
一、虚拟变量的基本含义 许多经济变量(定量变量)是可以定量度量 的,如:商品需求量、价格、收入、产量等; 但是,经济中有一些影响经济变量的因素无 法定量度量(定性变量),如:职业、性别对收 入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并 提高模型的精度,需要将它们“量化”,这种 “量化”通常是通过引入“虚拟变量”来完成的。
一元回归中,工具变量法估计量为
1
~ z ( x ) z z x z x
i 1 i i i i 1 i i i
i
两边取概率极限得:
P lim(1 ) 1
~
P lim 1 n zi i P lim 1 n z i xi
如果工具变量Z选取恰当,即有
根据定性变量的属性类型,构造只取“0”或 “1”的人工变量,这些人工变量通常称为虚拟变量 (dummy variables),记为D。 • 例如,反映文程度的虚拟变量可取为: • 1, 本科学历 • D= • 0, 非本科学历 一般地,在虚拟变量的设置中: • 基础类型、肯定类型取值为1;
• 比较类型、否定类型取值为0。
四、工具变量法
模型中出现随机解释变量且它(们) 与随机误差项相关时,OLS估计量是有偏的。 此时,为了得到参数的无偏估计量,最常 用的估计方法是工具变量法(Instrument variables)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 这种“量化”通常是通过引入“虚拟变量” 来完成的。根据这些因素的属性类型,构造 只取“0”或“1”的人工变量,通常称为虚 拟变量(dummy variables),记为D。 • 例如,反映文程度的虚拟变量可取为: • • • 1,
D= 0, 非本科学历
本科学历
注意:(1) 当定性变量含有m个类别时,模型不能引入m个虚 拟变量。最多只能引入m -1个虚拟变量,否则当模型中存在 截距项时就会产生完全多重共线性,无法估计回归参数。
(2) 把虚拟变量取值为0所对应的类别称作基础类别。
(3) 当定性变量含有m个类别时,不能把虚拟变量的值设成如 下形式。
0 1 D m 1 , , , 第1个类别 第2个类别
, 第m个类别
这种赋值法在一般情形下与虚拟变量赋值是完全不同的两 回事。 (4) 回归模型可以只用虚拟变量作解释变量,也可以用定 量变量和虚拟变量一起做解释变量。
1,(有房户) D 0,(租房户)
3
y
2
1
0 10 20 30
X 40
例8.3 建立回归模型
Yi = 0 + 1 Xi + 2 Di + ut 得估计结果如下,
(第3版教材第190页)
ˆ = - 0.3204 + 0.0675 X + 0.8273 D Y i t i
(-5.2) (16.9) (11.0) R2 = 0.99, DW = 2.27
time , (D 0,1950 1978 ) 0.2818 0.0746 trade time , (D 1,1979 1984 ) 33.5991 1.3305
(第2版第226页) (第3版第194页)
上式说明,改革开放前后相比无论截距和 斜率都发生了变化。进出口贸易总额的
ˆ = 2515.86 + 49.73 t + 1290.91 D Y i 1
(32.03 (10.63) (14.79) R2 = 0.94, DW = 1.4, F = 184.9, T=28, t0.05 (25) = 2.06 这里第一、二、三季度为基础类别。
2. 测量斜率变动
(第2版第224页) (第3版第192页)
以上介绍了用虚拟变量测量回归函数的截距变化。实际上,也可以用虚拟 变量考察回归函数的斜率是否发生变化。方法是在模型中加入定量变量与 虚拟变量的乘积项。设模型如下, Yi = 0 + 1 Xi + 2 Di + 3 (Xi Di) + ui 按2,3 是否为零,回归函数可有如下四种形式。 E(Yi) = 0 + 1 Xi , E(Yi) = 0 + (1 + 3) Xi , E(Yi) = (0 + 2) + 1 Xi , (当 2 = 3 = 0) (当 2 = 0, 3 0) (当 2 0, 3 = 0) E(Yi) = ( 0 + 2) + ( 1 + 3) Xi , (当 2 0, 3 0)
100 Y 80
60
40
20 X 0 20 40 60
0
70 Y 60 50 40 30 20 10 T 0 0 20 40 60
截距、斜率同时发生变化的两种情形见图。
3. 分段线性回归(不讲)
例8.5 中国进出口贸易总额序列(1950~1984年)如图。试检验改革开放
前后该时间序列的斜率是否发生变化。定义虚拟变量D如下,
如时间变量t在生产函数模型中代表技术进步。 Lnyt = 0 + t + 1 Lnxt 1 + 2 Lnxt 2 + ut
第8章结束.
补充案例: 香港季节GDP数 据的拟合
如果不采用虚拟变量拟合效果将很差。
GDP t = 1.6952 + 0.0377 t

(20.6) (13.9)
R2 = 0.80, DW = 0.3, T=52, t0.05 (52-2) = 2.01
8.4 时间变量
以时间变量t作解释变量。估计与检验方法 与定量解释变量Xt相同。 Yt = + t + 0 Xt + ut Yt = + t + ut
“季节”是在研究经济问题中常常遇到的定性因素。比如,酒,肉的销 量在冬季要超过其它季节,而饮料的销量又以夏季为最大。当建立这类 问题的计量模型时,就要考虑把“季节”因素引入模型。由于一年有四 个季节,所以这是一个含有四个类别的定性变量。应该向模型引入三个 虚拟变量。
例8.4 市场用煤销售量模型。由于受取暖用煤的影响,每年第四季度的
由于回归系数0.8273显著地不为零,说明对住房状况不同的两类家庭 来说,回归函数截距项确实明显不同。 当模型不引入虚拟变量“住房状况”时,得回归方程如下,
ˆ = - 0.5667 + 0.0963 X Y i i
(-3.5) (11.6) R2 = 0.88, DW = 1.85
比较回归方程,前者的确定系数为0.99,后者的确定系数仅为0.88。说 明该回归模型中引入虚拟变量非常必要。
年平均增长量扩大了近17倍。
补充案例 :香港季节GDP数据(千亿港元)的拟合(file:dummy6)
3.6 GDP 3.2 2.8 2.4 2.0 1.6 1.2 90 91 92 93 94 95 96 97 98 99 00 01 02
1990~1997年香港季度GDP呈线性增长。1997年由于遭受东南亚金融危机 的影响,经济发展处于停滞状态,1998~2002年底GDP总量几乎没有增长 (见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简 单地用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期, 定义季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量DT如下,
D0 D 1
0+2 0
0 0 20 40
20
X 60
D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。 若2显著不为零,说明截距不同;若2为零,说明这种分类无显著性 差异。
(第3版教材第189页)
(第3版教材第189页)
例8.3 随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额Yi
对于1990:1 ~1997:4
GDP t=

1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4
对于1998:1~2002:4
GDP t
= 2.9911 + 0.0014 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4
1, (第2季度) 1, (第3季度) D3 D2 0,(其他季度) 0,(其他季度)
1, (第4季度) D4 0,(其他季度)
0, 1990m1 ~ 1997m4 DT 1, 1998m1 ~ 2002m4
例3:香港季节GDP数据(千亿港元)的拟合(file:dummy6)
1950 1978 ) 1,( D 1979 1984 ) 0,(
以时间time为解释变量,进出口贸易总额用trade表示,估计结果如下,
trade = 0.2818 + 0.0746 time - 35.8809D + 1.2559 time D

()
得估计结果如下:
GDP t=

1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4+1.8338DT- 0.0654DTt (50.8) (64.6) (3.7) (9.9) (11.0) (19.9) (-28.0)
R2 = 0.99, DW = 0.9, s.e. = 0.05, F=1198.4, T=52, t0.05 (52-7) = 2.01
销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下:
1,(第四季度) D1 0,(其他季度)
1,(第三季度) D2 0,(其他季度)
1,(第二季度) D3 0,(其他季度)
例8.4
(第2版第224页) (第3版第192页)
以时间 t 为解释变量(1982年1季度取t = 1)的煤销售量(Yi)模型估计结 果如下:
ˆ = 2431.20 + 49.00 t + 1388.09 D1 + 201.84 D2 + 85.00 D3 Y i
(26.04) (10.81) (13.43) (1.96) (0.83)
R2 = 0.95, DW = 1.2, F=100.4, T=28, t0.05 (28-5) = 2.07 由于D2,D3的系数没有显著性,说明第二、三季度可以归并入基础类别 第一季度。于是只考虑加入一个虚拟变量D1,把季节因素分为第四季度 和第一、二、三季度两类。从上式中剔除虚拟变量D2,D3,得煤销售量 (Yi)模型如下:
(千美元) 对年收入Xi (千美元) 的回归模型。通过对样本点的分析发现,居
于上部的6个点(用小圆圈表示)都是代表自己有房子的家庭;居于下部
的14个点(用小三角表示)都是租房住的家庭。而这两类家庭所对应的观 测点各自都表现出明显的线性关系。于是给模型加入一个定性变量“住房
状况”,用D表示。定义如下:
8.3 虚拟变量(重点掌握)
许多经济变量是可以定量度量的,如:商品需求量、 价格、收入、产量等。但也有一些影响经济变量的 因素无法定量度量,如:职业、性别对收入的影响; 战争、自然灾害对GDP的影响;季节对某些产品 (如冷饮)销售的影响等等。
为了在模型中能够反映这些因素的影响,并提高模 型的精度,需要将它们“量化”。
相关文档
最新文档