第五章虚拟变量模型.
第五章虚拟变量-第八章虚拟变量
第二节、数量因素与变参数模型
在经济转折时期,可以建立临界值指标的 虚拟变量模型来反映 设转折时期 t* 转折时期的指标值= x* 虚拟变量 D=1( t >= t*) D=0( t < t*) 模型 y = b0 + b1 x + b2 ( x-x*) D +e t < t* 时 y = b0 + b1 x+ e t >= t* 时 y = b0 -b2 x*+ (b1+ b2) x +e
9
三、虚拟变量模型
引入虚拟变量后,回归方程中同时 含有一般解释变量和虚拟变量,称 这种结构的模型为虚拟变量模型
10
四、模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国GDP的 时间序列,必须考虑“文革”因素对国民经济 的破坏性影响,剔除不可比的“文革”因素。 2、检验不同属性类型对因变量的作用,例如 工资模型中的文化程度、季节对销售额的影响。 3、提高模型的精度,相当与将不同属性的样 本合并,扩大了样本容量(增加了误差自由度, 从而降低了误差方差)。
Dit 10( 第i季 度 — 1, 其 它 季 度 — 0) ( i1,2,3,4)
问 是 否 可 用 普 通 最 小 二 乘 法 进 行 估 计 ? 为 什 么
26
解 : 通 过 观 察 , 很 容 易 发 现 :
计量经济学第5章 虚拟变量模型
D
1 , (比较类型)经济政策变动
0
,
(基础类型)经济政策不变
虚拟变量主要是用来代表质的因素,但是有些
情况下也可以用来代表数量因素。例如建立储蓄函
数时,“收入”显然是一个重要解释变量,虽然是 “数
量”因素,但是为了方便也可以用虚拟变量表示。
例如: D
1,
0
,
月收入2000元以下的居民 月收入2000元以上的居民
型。有四种情形:
1. 解释变量只有一个包含两个特征虚拟变量,
无定量变量,例如:
与单因素方差分析统计模 型原理即统计意义一致
Yi 01D iui
Y i ------居民年可支配收入
1 , 城镇居民
Di
0
,
其他
称为方差分 析模型
14
E(Yi Di 0)0
E(Yi D i 1)01
可见虚拟变量的作用是改变设定模型的截距水平。
Y i 0 1 D 1 i 2 D 2 i 3 X i u i
Y i ------年支出医疗保健费用支出 X i ------居民年可支配收入
18
1 , 高中
D 1i
0
,ຫໍສະໝຸດ Baidu
其他
1 , 大学
D 2i
0
,
其他
于是:小学教育程度:
E (Y i X i,D 1 i 0 ,D 2 i 0 )03 X i
金融计量经济第五讲虚拟变量模型和Probit、Logit模型
27.6588
0
D2(城北区块=1)
1740.953
123.9012
14.05114
0
D3(城东区块=1)
2148.309
137.9162
15.57691
0
D4(蒋村一带=1)
2404.3 133.6964
17.98328
0
D5(城西文教区=1)
2281.312
151.0731
15.10072
0
D6(南岸滨江区块=1)
• 实际应用中,用效用模型来求参数估计值:
yi*Xii*
(5.10)
• 其中: P (y i 1 ) P (y i * 0 ) P (i * X iB )
• 问题2:证券投资者在特定时期内的投资选 择是买或不买,如何确定这样的选择? (王冀宁等,2003)
• 问题3:上市公司出现经营问题,可能成为 ST、PT,是什么原因导致这样的结果?
.
虚拟变量作为被解释变量
• 这类模型称离散被解释变量数据计量经济 学模型(Models with Discrete Dependent Variables)
• 工资模型为:
• Ii01 [S 1 (1 D 1 i D 2 i)S ( i S 1 )] 2 [D 2 i(S 2 S 1 ) D 1 i(S i S 1 ) ]3 D 2 i(S i S 2 ) u i (5.7
第五章 虚拟变量
截距和斜率项发生变化
Y
ˆ
0
ˆ ˆ0 1 ˆ1 X
ˆ ˆ 0 1 X
ˆ0
ˆ 0
一致回归:截距斜率无差异 平行回归:斜率同截距不同 并行回归:截距同斜率不同 相异回归:截距斜率都不同
X
计量经济学 Econometrics
计量经济学 Econometrics
估计的模型
WAGE 10.93 2.73SEX
(22.10)(-3.86)
(1)
R 2 0.068 F 1, 204 14.9
(2) WAGE 6.41 2.76SEX 0.99 ED 0.12 AGE 1.06 NONWH 0.24 HISP
反映男女的工作经历对工资的影响情况,截距项表示 工作经历为0时的工资,这里假设男女是相等的 Y
ˆ ˆ 0 1 ˆ0 X
ˆ ˆ 0 1 X
斜率项发生变化
ˆ 0
X
计量经济学 Econometrics
定性变量对截距和斜率项影响(续)
设Y表示工资,X表示工作经历,D表示性别虚拟变量
Wage 434.821 470.460Gender 34.454 Exper 133.551Educ
性别虚拟变量的p值很小为0.002,表明非常显著。 这样在控制工作经历等的情况下,平均工资的性别差异 很显著。
古扎拉蒂计量经济学第四版讲义Ch5 Dummy Variables Models
第五章 虚拟变量回归模型
Dummy Variable Regression Models
1、什么是虚拟变量?
名义型变量又称为指标变量、分类变量、定性变量,或者虚拟变量(哑变量)。
2、方差分析模型(ANOVA models )
一种类型的回归模型就是解释变量全部是虚拟变量,这样的模型称为Analysis of Variance (ANOV A) models 。
假如我们想检验东(10个省)中(12个省)西(9个省)部三个地区教师的平均收入是否不同。对三个地区教师工资数据取算术平均值,发现不同,这种不同显著吗?
一般用D 表示哑变量,设定如下的哑变量: D2 =1 代表东部省份;否则用0表示 D3 =1代表中部省份;否则用0表示
可以写出如下的模型
12233i i i i y D D βββε=+++ 9.2.1
这类似于一般的多元回归模型的形式。
假定该模型的误差项满足通常OLS 回归的假定,对上式两边取期望,得到 对东部地区: ()2312|1,0i i i E y D D ββ===+ 对中部地区: ()2313|0,1i i i E y D D ββ===+ 对西部地区: ()231|0,0i i i E y D D β===
假定回归结果为
()()()
232
2158.622264.6151734.473:
0.00000.03490.23300.0901
i i i y D D p R =++=
1)虚拟变量使用注意
使用虚拟变量要小心,特别要注意以下几点:
1)一个定性解释变量如果分成m 类,则用m-1个哑变量表示;如果分成m 类用m 个哑变
第五节虚拟变量模型
例2:对某地区生产同一产品的各企业生产进行研 究,产量(Y)不仅受资金投入(K)、劳动力投入 (L)影响,而且与生产工艺有关,假设用甲、乙 两种不同的生产工艺,就可以建立虚拟变量模型。
引入虚拟变量
1 , 用甲种生产工艺 D 0 , 用乙种生产工艺 则生产函数可写作 ln Y ln A ln L ln K D u
0 正常年份
当这一模型满足普通最小二乘法假定条件时,可 应用普通最小二乘法求出消费函数回归方程 :
ˆ ˆ b1 b 2 X t , 正常年份 ˆ ˆ ˆ ˆ b b X b D Ct 1 2 t 3 t ˆ ˆ ˆ ( b1 b 3) b 2 X t ,反常年份
3.虚拟变量取值 为了将这些变量引入模型,必须将其数量化,比如当虚拟变量 起作用时取值为1(或0),不起作用时取值为0(或1)。 含有虚拟变量的模型称虚拟变量模型。 虚拟变量通常作为解释变量。 (二) 虚拟变量的设置原则 1、虚拟变量的设置规则 (1)一个因素m个属性,在模型中引入m-1个虚拟变量,否则产 生多重共线性。 (2)m个因素各两种属性,则引入m个虚拟变量。 (3)虚拟变量的取值(1或0)应从分析问题的目的出发予以 界定。 (4)虚拟变量在单一方程中可作为解释变量,也可作为被解 释变量。
第五节
ቤተ መጻሕፍቲ ባይዱ
虚拟变量模型
5 计量经济学第五章
• 在上例中同时引入性别和教育水平:
1 D1 0 男 女
1 D2 0
大学及以上 大学以下
Yi 0 1 X i 2 D1 3 D2 i
女职工本科以下学历的平均薪金:
E(Yi | X i , D1 0, D2 0) 0 1 X i
• 从上述2个得到:东部与中部自发性消费相差 154.6,中部与西部相差95.2。
• 虚变量与状态的不同对应关系对估计结果无影 响。
§5.2 滞后变量模型 Lagged Variables Regression Models
一、滞后变量模型 二、分布滞后模型的参数估计 三、自回归模型的参数估计 四、格兰杰因果关系检验
的反应增强,投资、进出口和消费才会不断上升,货币政 策才最终促使GDP增加。通常,货币扩张对GDP影响的最 高点可能是在政策实施以后的一到两年间达到。
引子: 货币政策效应的时滞
货币供给的变化对经济影响很大,货币政策总是备受关注。 货币政策的影响效应Fra Baidu bibliotek在着时间上的滞后。在货币政策的传
导过程中,货币扩张首先促使利率降低,或者一般价格水平
的上升,这需要一段时间。 这些因素对以GDP为代表的经济增长的影响,更是需要一
段时间才能显示出来。只有经过一段时间以后,支出对利率
(精品)第五章-虚拟变量模型和滞后变量模型
第五章虚拟变量模型
1.表5.1中给出了中国1980—2001年以城乡储蓄存款新增额代表的居民当年储蓄及以GNP 代表的居民当年收入的数据。以1991年为界,判断1991年前和1991年后的两个时期中国居民的储蓄—收入关系是否已发生变化。
年份储蓄S GNP 年份储蓄S GNP 1980 118.5 4517.8 1991 2072.8 21662.5 1981 124.2 4860.3 1992 2438.4 26651.9 1982 151.7 5301.8 1993 3217 34560.5 1983 217.1 5957.4 1994 6756.4 46670 1984 322.2 7206.7 1995 8143.5 57494.9 1985 407.9 8989.1 1996 8858.5 66850.5 1986 615 10201.4 1997 7759 73142.7 1987 835.7 11954.5 1998 7127.7 76967.2 1988 728.2 14922.3 1999 6214.3 80579.4 1989 1345.4 16917.8 2000 4710.6 88228.1 1990 1887.3 18598.4 2001 9430 94346.4 估计以下回归模型:
0123
()
i i i i i i
Y X D D X u
ββββ
=++++
其中
i
D为引入的虚拟变量:
1,1991
0,1991
i
D
⎧
=⎨
⎩
年前
年后
对上面的模型进行估计,结果如下:
所以表达式为:
第五章 虚拟变量模型(蓝色)
β1和 β3 分别表示城镇居民家庭和农村居民
家庭的消费函数在截距和斜率上的差异。
39
我们一般通过t 检验来判定它们之间是否有 差异。 1.若β1≠0 ,β3≠0,则为截距和斜率同时变 动模型; 2.若 β1≠0,β3=0,则为截距变动模型; 3.若 β1=0,β3=0, 则表示城镇居民家庭和农 村居 民家庭有着完全相同的消费模式; 4.若 β1=0,β3≠0,则为斜率变动模型,这种 情况在现实中出现得不是很多。
2.虚拟变量D=0所代表的特性或状态 通常称为基础类型。和其它特征或状 态比较的意义上说,基础类型为对比 的基础。
16
模型中的系数β 0 为基础类型的 截距项,称为公共截距项;系数β 1 称为差别截距系数,指的是 D 取 1 时截距系数和基础类型的截距系数的 差异。
17
3.如果一个回归模型有截距项,而 且这个质的因素又有两种特征,也就是 将其分两类,则我们只需要引入一个虚 拟变量。如我们的例5.1所示。如果一个 回归方程有截距项,只有一个质的因素
2
所以,在建立经济计量模型时,即要 考虑数量变量,也要考虑质量变量。但 是,质量变量和数量变量不同,数量变 量可以在事前规定好的尺度上,用不同 的数值表现出来,质量变量却只能以属 性、种类的不同具体形式表现出来。
3
例如,性别可表现为男或女;人种可表 现为白种人和非白种人;宗教信仰可表 现为教徒和非教徒;政府的经济政策可 表现为改革开放前和改革开放后,如此 等等。
【计量经济学】5 专门问题
1 D1 0
1 DD1 0
西部 其它
东部 其它
1 D2 0
1 DD2 0
中部 其它
中部 其它
Y = -240.6137536 + 249.8125832*D1 + 154.5909868*D2 + 0.6090284838*X1 + 0.2032206892*X2
Y = 9.198829575 - 249.8125832*DD1 - 95.22159634*DD2 + 0.6090284838*X1 + 0.2032206892*X2
Y (X,D)α β μ
1 1
X 11 X 12
X k1 X k2
1 0
0 1
0 0
0 0
(X, D) 1 1
X 13 X 14
X k3 X k4
0 0
0 0
1 0
0
1
1 X16 X k6 1 0 0 0
解释变 量完全 共线性
• 如果在服装需求函数模型中必须包含3个定性变 量:季节(4种状态)、性别(2种状态)、职 业(5种状态),应该设置多少虚变量? • 模型含常数项 • 模型不含常数项
三、虚拟变量的设置原则
• 每一定性变量(qualitative variable)所需的虚拟变 量个数要比该定性变量的状态类别数(categories) 少1。即如果有m种状态,只在模型中引入m-1 个虚拟变量。 • 例如,季节定性变量有春、夏、秋、冬4种状态, 只需要设置3个虚变量:
虚拟变量模型
2. 虚拟变量的设置说明
(1)这一规则适用于模型中包含一个或多个定性变量的情形。即如果模
型存在多个定性变量,则需要设置多组虚拟变量,每组虚拟变量的
个数取决于对应的定性变量所具有的类别数。 (2)定性变量的分类中,不指定其虚拟变量的类别(组)称为基准组 (base)或参照组(reference)。 • 如上例:本科教育程度组即为基准组或参照组 • 在基准组上,所有对应的虚拟变量的取值均为0 • 实际问题中,基准组或参照组的选择完全取决于研究者。 • 一旦选定基准组,分析中,所有其它组都将与基准组进行比较。
1979~2001 年中国居民储蓄与收入数据(亿元) GNP 90年后 储蓄 4038.2 1991 9107 4517.8 1992 11545.4 4860.3 1993 14762.4 5301.8 1994 21518.8 5957.4 1995 29662.3 7206.7 1996 38520.8 8989.1 1997 46279.8 10201.4 1998 53407.5 11954.5 1999 59621.8 14922.3 2000 64332.4 16917.8 2001 73762.4 18598.4
份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数
中引入虚拟变量来考察。Baidu Nhomakorabea
设
1 正常年份 Dt 0 反常年份
《虚拟变量模型 》课件
模型假设所有解释变量之间相互独立,但在现实 中,变量间可能存在交互效应或遗漏变量偏误。
3
同方差性假设
模型假设误差项的方差恒定,但在实际应用中, 方差可能会随着解释变量的变化而变化。
数据质量的挑战
数据来源与收集
虚拟变量模型对数据质量要求较 高,数据来源和收集方法可能影 响模型结果的准确性。
间的差异。
交互效应与高阶效应研究
探索解释变量之间的交互效应以及高 阶效应,以更全面地揭示变量之间的 关系。
跨领域应用研究
将虚拟变量模型应用于其他领域,如 生物医学、社会科学等,以拓展其应 用范围和价值。
06
结论
总结虚拟变量模型的主要观点
虚拟变量模型是一种用于处理分类变量的统计方 法,通过引入虚拟变量(也称为指示变量或分类 变量),可以将分类变量转换为一系列二元离散 变量,从而在回归分析中进行分析。
业类型的效应,可以使用虚拟变量模型。
虚拟变量模型的优缺点
优点
能够处理分类变量对连续结果的影响,能够同时分析多个分类变量的效应,有助于更好地理解数据之 间的关系。
缺点
当分类变量类别过多时,会导致虚拟变量的数量增加,从而增加模型的复杂性和计算负担。此外,虚 拟变量模型对于非线性关系的处理能力有限,可能无法准确捕捉数据之间的关系。
02
虚拟变量模型的建立
确定研究问题与假设
计量经济(第二版)-5 经典单方程计量经济学模型:专门问题168页PPT
1990年前: 1990年后:
Y ˆ i 1.6 7 0 .4X 9 1 i 1 6 Y ˆ i 15 0 .4 8X 5 8 i 2 81
3. 临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指 标的虚拟变量模型来反映。
在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为:
E ( Y i|X i , D i 0 ) 0 1 X i
企业男职工的平均薪金为:
E ( Y i |X i , D i 1 ) ( 0 2 ) 1 X i
几何意义:
• 假定2>0,则两个函数有相同的斜率, 但有不同的截距。意即,男女职工平均薪金对 教龄的变化率是一样的,但两者的平均薪金水 平相差2。
1高中 1 大学
D 1 0其他 D 2 0
其他
模型可设定如下:
Y i 0 1 X i 2 D 1 3 D 2 i
在E(i)=0 的初始假定下,高中以下、高
中、大学及其以上教育水平下个人保健支出的 函数:
• 高中以下: E ( Y i |X i , D 1 0 , D 2 0 ) 0 1 X i
(3) 1=1 ,但22 ,即两个回归的差异仅在其斜 率,称为汇合回归(Concurrent Regressions);
第五章 虚拟变量
第五章虚拟变量
5.1 怎样将定性信息转换为虚拟变量
填空题
(1)我们定义一个二值变量或一个0-1变量来刻画定性信息,这个二值变量称为。
答案:虚拟变量(dummy variable)
难易程度:容易
选择题
(1)某商品需求函数为y i=β0+β1x i+u i,其中y为需求量,x为价格。为了考虑“地
区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量.
则应引人虚拟变量的个数为()
A、2
B、4
C、5
D、6
答案:B
难易程度:较难
判断题
(1)如果分类信息有N组,实际上我们只需要N-1个虚拟变量就可以表达这N组的所有定性信息。
答案:对
难易程度:容易
5.2 理解虚拟解释变量的系数
选择题
(1)在教育回报方程wage=β
0+δ0female+β
1
educ+u中,female={
1女
0男
,wage表示工资率,educ
表示受教育年数, δ0的经济解释是()。
A、保持educ和其他因素不变,female每增加一个单位,工资率增加δ0个单位
B、保持educ和其他因素不变,女性和男性之间在工资率上的差异
C、保持educ不变,female每增加一个单位,工资率增加δ0个单位
D、保持educ不变,女性和男性之间在工资率上的差异
答案:B
难易程度:较难
(2)在教育回报方程wage
̂=1.725+2.037male+3.523educ中,解释变量male的含义是()。
A、保持educ和其他因素不变,男性的收入比女性的收入高2.037元每小时
B、保持educ和其他因素不变,男性的收入比女性的收入平均来说高2.037元每小时
计量经济学第五章 专门问题-虚拟变量模型
如,设
消费模型可建立如下:
这里,虚拟变量D以与X相乘的方式引入了模型中 ,从而可用来考察消费倾向的变化。 假定E(i)= 0,上述模型所表示的函数可化为:
正常年份:
反常年份:
当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。
例5.1.1,考察1990年前后的中国居民的总储蓄-收 入关系是否已发生变化。
在E(i)=0 的初始假定下,高中以下、高中、大学 及其以上教育水平下个人保健支出的函数:
高中以下:
E(Yi | X i , D1 0, D2 0) 0 1 X i
• 高中:
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
(-6.11) (22.89) (4.33) (-2.55)
R 2 =0.9836
由3与4的t检验可知:参数显著地不等于0,强 烈示出两个时期的回归是相异的,
储蓄函数分别为:
1990年前:
ˆ Yi 16497 0.4116X i .
ˆ Yi 15452 0.8881 i X
1990年后:
年薪 Y 男职工 女职工
2
0
工龄 X
又例:在横截面数据基础上,考虑个人保健支出 对个人收入和教育水平的回归。
教育水平考虑三个层次:高中以下, 高中, 大学及其以上
第五章-含虚拟变量的回归模型
Econometrics
第五章虚拟变量回归模型(教材第六章)
第五章虚拟变量回归模型
第一节虚拟变量的性质和引入的意义
第二节虚拟变量的引入
第三节交互作用效应
第四节含虚拟变量的回归模型
学习要点
虚拟变量的性质,虚拟变量的设定
5.1 虚拟变量的性质和引入的意义
虚拟变量的性质
f定性变量
性别(男,女)
婚姻状况(已婚,未婚)
受教育程度(高等教育,其他)
收入水平(高收入,中低收入)
肤色(白人,有色人种)
政治状况(和平时期,战争时期)
f引入虚拟变量(Dummy Variables)
1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。
2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。
3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本量,从而提高了估计精度)。
5.1 虚拟变量的性质和引入的意义
5.2 虚拟变量的引入
虚变量引入的方式主要有两种
f加法方式
虚拟变量与其它解释变量在模型中是相加关系,称为虚拟
变量的加法引入方式。
加法引入方式引起截距变动
5.2 虚拟变量的引入
f 虚拟变量的作用在于把定性变量“定量化”:通过赋值0和1,0表示变量不具备某种性质,1表示具备。f 例,0代表男性,1代表女性;0代表未婚,1代表已婚;等等。
f 这类取值为0和1的变量称为虚拟变量(dummy variables ),通常用符号D 表示。
f 事实上,模型可以只包括虚拟变量(ANOVA 模型):
其中,0,1,i i D D ==男性;女性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
β1和 β3 分别表示城镇居民家庭和农村居民
家庭的消费函数在截距和斜率上的差异。
16
我们一般通过t 检验来判定它们之间是否有 差异。 1.若β1≠0 ,β3≠0,则为截距和斜率同时变 动模型; 2.若 β1≠0,β3=0,则为截距变动模型; 3.若 β1=0,β3=0, 则表示城镇居民家庭和农 村居 民家庭有着完全相同的消费模式; 4.若 β1=0,β3≠0,则为斜率变动模型,这种 情况在现实中出现得不是很多。
正常年份的居民消费水平高于非正常年份
的居民消费水平。
4
(二)斜率变动模型
在实际问题中,斜率单独变动出现的情
形一般比较少,它指的是改变了变动的速
率也就是弹性。 例如城镇居民家庭与农村
居民家庭的消费函数, 在边际消费倾向
(斜率)上可能会有所不同,假设它们的
消费函数在截距项没有区别。
5
那么回归模型可记为
17
下面,以我国城镇居民家庭储蓄模型为 例,实际体会虚拟变量模型从建模到检验 再到估计参数最后下结论的全过程。 【例5.2】已有数据资料为我国城镇居民家 庭1955年至1985年人均收入和人均储蓄。 根据经验,也就是先验信息,再通过某些 检验,我们发现储蓄和收入有很强的相关 关系而且收入的变化会引起储蓄的变化。
候只需要引入一个虚拟变量。
2
例5.1描述了一个包括正常年份和非正常
年份(亚洲金融危机或SARS的影响)居
民消费的样本,并建立了虚拟变量计量模 型。
3
利用最小二乘法对式(5.1)进行估计,可得到
ˆ ˆ D ˆ X ˆ Y i 0 1 2 i
(5.6)
对 β1 作t 检验,若 β1 显著地不为0, 我们就认为正常年份和非正常年份居民在 消费行为上的差异是明显的。若 β1 >0,则
22
1979年以后,我国居民的收入水平大
幅度提高,同时,居民储蓄也在大幅
度增长。从这些可以看出来,1979年 前后两个时期,我国居民的边际储蓄 倾向有显著性差异。
(5.8) (5.9)
7
(三)包含多个虚拟变量的截距变动模型 如果一个质的因素仅有两种特征,只 需引入一个虚拟变量。但是,很多质的因素 往往不只具有两个特征,例如全世界的国家 可以分为发达国家、发展中国家、不发达国 家。
8
我国少数民族在很多问题上有差 异,所以当把民族作为虚拟变量时, 不能简单将其分为汉族和非汉族;季 节因素是我们最常见的质的因素,它 具有四个特征,按照前面的原则,我 们要引入三个虚拟变量。
18
假定它们之间为线性关系,我们可以建立 储蓄模型如下
St 0 1 X t ut
(5.18)
式中,St=人均储蓄,Xt=人均收入,t= 年份(t=1955,1956,…,1985)。
19
把1955年作为基期并把该期的价格水平 定为100,再分别扣除包含在和中的物价 上涨因素。用最小二乘法估计式(5.18) ,得到
(5.14)
12
(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对回 归模型的截距有影响,而且还会改变 模型的斜率。
13
例如城镇居民和农村居民的消费
函数不但在斜率上有差异,在截距上
也是有可能不一致的,将两个问题同
时考虑进来,我们可以得到回归方程
14
Yi 0 1 D 2 X i 3 ( DX i ) ui
(5.15) 式中,Yi=第个家庭的消费水平,Xi=第个 家庭的收入水平,
1 城镇居民家庭 D 0 农村居民家庭
15
式(5.15)可以表示为
D 1 D0
Yi 0 1 ( 2 3 ) X i ui (5.16) Yi 0 2 X i ui
ˆ 33.4 0.17X S t t
R2 =0.833, DW=0.398
(5.19)
20
模型(5.19)包含了这样一个假定,那 就是在1955到1985年期间我国城镇居民家 庭的储蓄行为大体保持不变。
21
这一假定实际上是行不通的,因为在 十一届三中全会召开之后,居民的收入 大大增加,而且与居民储蓄有关的许多 重要因素在1979年以后发生了明显变化。 在改革开放之前, 我国居民的收入水 平仅仅能够维持温饱水平,根本不可能 有多少储蓄。
1 第二季度 D2t 其他 0
1 第三季度 D3t 其他 0
这里,第四季度为基础类型,其截距项 为β0 。而其它三个季度的截距项分别为 β0+ β1,β0+ β2 ,β0+ β3 。β1,β2 , β3 代表 季节变动引起的消费差异。
ቤተ መጻሕፍቲ ባይዱ
11
四个季度的回归模型分别为
第一季度 第二季度 第三季度 第四季度 Yt 0 1 4 X t u t (5.11) Yt 0 2 4 X t u t (5.12) Yt 0 3 4 X t u t (5.13) Yt 0 4 X t u t
9
例如,我们用季度资料研究各种商品消 费额在季节上有没有什么区别?可以建立 模型如下:
Yt 0 1 D1t 2 D2t 3 D3t 4 X t ut (5.10)
其中,Yt=季度的消费,Xt=季度的收入, 对于四个季度,我们引入了三个虚拟变量:
10
1 第一季度 D1t 其他 0
Yi 0 1 X i 2 ( DX i ) ui (5.7)
其中,Yi=第个家庭的消费水平,Xi= 第个家庭的收入水平,
1 城镇居民家庭 D 0 农村居民家庭
6
式(5.7)可以表示为
D 1, D 0,
Yi 0 (1 2 ) X i ui Yi 0 1 X i ui
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
第2节 虚拟解释变量模型
一 、截距变动模型和斜率变动模型
(一)包含一个虚拟变量的截距变动模型
假设只有一个定性因素影响被解释变量
的变化,而且这个因素仅有两种特征,这时