第八章 虚拟变量回归 思考题

合集下载

第8章 虚拟变量回归

第8章 虚拟变量回归

计量经济学课程教案授课题目(教学章、节或主题):第8章 虚拟变量回归授课时间安排第16周共2课时教学器材与工具多媒体授 课 类 型(请打√)理论课√讨论课□ 实验课□ 习题课□ 双语课程□ 其他□教学目的、要求(分掌握、熟悉、了解三个层次):1、熟悉虚拟变量的含义;2、掌握虚拟变量设置原则;3、掌握虚拟变量回归引入方法;4、了解虚拟被解释变量模型。

教学重点及难点:虚拟变量回归引入方法与估计方法教 学 基 本 内 容§1 虚拟变量§2 虚拟解释变量的回归§3 虚拟被解释变量*§4 案例分析教学过程设计: 一、引入二、讲授三、小结教学方法及手段(请打√):讲授√、讨论□、多媒体讲解√、模型、实物讲解□、挂图讲解□、音像讲解□等。

作业、讨论题、思考题:1、什么是虚拟变量?它在模型中有什么作用?参考资料(含参考书、文献等):《计量经济学》,(美)D.Gujarati 著,林少宫译;《计量经济学》,李子奈编著;《经济计量学精要》,(美)D.Gujarati著,张寿等译。

课后小结:虚拟变量从本质上说是“数据分类器”,它根据样本的属性(性别、婚姻状况、种族、宗教等等)将样本分为各个不同的子群体并对每个子群体进行回归分析。

若模型包含多个定性变量,而且每个定性变量有多种分类,则引入模型的虚拟变量将消耗大量的自由度。

因此,应当权衡进入模型的虚拟变量的个数以免超过样本观察值的个数。

第8章 虚拟变量回归§8.1 虚拟变量一、虚拟变量的基本含义许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。

但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。

为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”, 这种“量化”通常是通过引入“虚拟变量”来完成的。

根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables),记为D。

第八章-虚拟变量回归

第八章-虚拟变量回归

1 高中 D2 0 其它
1 博士 D5 0 其它
1 大 学 D3 0 其 它
1 小 学 D6 0 其 它
则总体回归模型:
w 0 1 X 2 D1 3 D2 4 D3 5 D4 6 D5 7 D6+u
17
二、用虚拟变量测量斜率变动
基本思想
引入虚拟变量测量斜率变动,是在所设立的模型中,将虚 拟解释变量与其它解释变量的乘积,作为新的解释变量出 现在模型中,以达到其调整设定模型斜率系数的目的。
可能的情形:
(1)截距不变;
(2)截距和斜率均发生变化;
分析手段:仍然是条件期望。
18
(1)截距不变
模型形式:
意义:若α1显著,表明城市居民的平均人均可支配收入比农村 高α1元。但这种差异可能是由其它因素引起的,并不一定是由 户籍差异引起。
12
(2) 一个两属性定性解释变量和一个定量 解释变量
模型形式 Yi = f(Di,X i )+ μi 例如:Yi = 0 1 Di + X i + μi 1 城市 其中: Y-人均可支配收入;X-工作时间; Di 0 农村
会受到一些定性因素的影响,如性别、国籍、民族、自 然灾害和政治体制等。
问题:我们如何把这些定性想:将这些定性因素进行量化
由于定性变量通常表示某种属性是否存在,如是否男性、 是否经济特区、是否有色人和等。因此若该属性存在, 我们就将变量赋值为1,否则赋值为0,从而将定性因素 定量化。 计量经济学中,将取值为0和1的人工变量称为虚拟变量 (DUMMY)或哑元变量。通常用字母D或DUM表示。
7
一个例子(虚拟变量陷阱)
研究工资收入与学历之间的关系:

第八章 虚拟变量回归 思考题

第八章  虚拟变量回归   思考题

第八章 虚拟变量回归 思考题8.1 什么是虚拟变量 ? 它在模型中有什么作用 ?8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量1,01D ⎧⎪=⎨⎪-⎩大专及大专以上,高中,高中以下这样的设置方式隐含了什么假定 ? 这一假定合理吗 ?8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应?8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为12233ti i i i Y D D X u αααβ=++++其中,i X =收入水平 ;Y = 年服装消费支出 ;1,30D ⎧=⎨⎩大专及大学以上,其他 ;1,20D ⎧=⎨⎩女性,其他试写出不同人群组的服装消费函数模型。

8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ?1) 一年里的 12 个月全部表现出季节模式 ;2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。

练习题8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型[]ˆ 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+--(4.37)(0.857)(2.42) R2=0.752其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ;Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。

括号内的数值为对应参数估计值的t 值。

1) 解释这些计算结果。

计量经济学课后习题答案第八章_答案

计量经济学课后习题答案第八章_答案

第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。

加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。

除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。

除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。

如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。

这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。

4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。

试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。

解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。

庞皓《计量经济学》笔记和课后习题详解(虚拟变量回归)【圣才出品】

庞皓《计量经济学》笔记和课后习题详解(虚拟变量回归)【圣才出品】
考点二:虚拟解释变量的回归 ★★★★
1.用虚拟变量表示不同截距的回归——加法方式 以加法方式将虚拟变量引入模型,只会改变模型在不同情况下的截距,不会影响斜率。 按照变量的种类和数量进行分类,可以分成四种情况,具体如表 8-2 所示。
2 / 27
圣才电子书 十万种考研考证电子书、题库视频学习平台

2.用虚拟变量表示不同斜率的回归——乘法方式 以乘法形式引入虚拟解释变量,会改变模型的截距和斜率。用乘法方式引入虚拟变量的 作用是:①进行两个回归模型的比较,即结构变化检验;②进行因素间的交互影响分析;③ 使模型更加符合现实经济现象。按照不同的作用,可以将乘法方式分成三种,具体如表 8-3 所示。
表 8-3 以乘法方式引入虚拟变量的三种类型
2.虚拟变量的作用及模型的类型 (1)虚拟变量的作用 ①可以作为性别、所有制等属性因素的代表。 ②可以作为受教育程度、管理者素质等非精确计量的数量因素的代表。 ③可以作为战争、灾害、改革前后等偶然因素或政策因素的代表。 ④可以作为时间序列分析中季节(月份)的代表。 ⑤可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异等。 (2)虚拟变量模型的类型(见表 8-1)
考点三:虚拟被解释变量 ★★★★
1.线性概率模型(LPM) (1)线性概率模型含义 当被解释变量是虚拟变量,并且模型的函数形式为线性时,即 Yi=β1+β2Xi+ui,该模 型就是线性概率模型。 由于 E(Yi)=0·(1-pi)+1·pi=pi,其中 pi 表示 Yi=1 的概率,所以系数 β2 可解释 为:当其他条件不变时,X 每增加 1 单位,Y=1 的概率增加值。 (2)线性概率模型的估计 ①线性概率模型不能直接用普通最小二乘进行估计,因为存在如下问题: a.随机扰动项 ui 的非正态性。在线性概率模型中,ui 不再服从正态分布,但是对参数 的假设检验和区间估计要求随机扰动项 ui 服从正态分布。当对大样本进行估计时,OLS 估 计量的概率分布将会趋近于正态分布,估计值不会因为非正态性而产生很大的误差。

计量经济学思考题

计量经济学思考题

第一章绪论你能分别举出三个时间序列数据、截面数据、面板数据、虚拟变量数据的实际例子,并分别说明这些数据的来源吗?答:时间序列数据:中国1981年至2010年国内生产总值,可从中国统计年鉴查得数据。

截面数据:中国2010年各省、区、直辖市的国内生产总值,中国统计年鉴查得数据。

面板数据:中国1981年至2010年各省、区、直辖市的国内生产总值,中国统计年鉴查得数据。

虚拟变量数据:自然灾害状态,1表示该状态发生,0表示该状态不发生。

为什么对已经估计出参数的模型还要进行检验?你能举一个例子说明各种检验的必要性吗?答:模型中的参数被估计以后,一般说来这样的模型还不能直接加以应用,还需要对其进行检验。

首先,在设定模型时,对所研究经济现象规律性的认识可能并不充分,所依据的经济理论对所研究对象也许还不能作出正确的解释和说明。

或者经济理论是正确的,但可能我们对问题的认识只是从某些局部出发,或者只是考察了某些特殊的样本,以局部去说明全局的变化规律,可能导致偏差。

其次,我们用以估计参数的统计数据或其它信息可能并不十分可靠,或者较多地采用了经济突变时期的数据,不能真实代表所研究的经济关系,或者由于样本太小,所估计参数只是抽样的某种偶然结果。

此外,我们所建立的模型、采用的方法、所用的统计数据,都有可能违反计量经济的基本假定,这也可能导出错误的结论。

第二章简单线性回归模型2.1相关分析与回归分析的关系是什么?答:相关分析与回归分析有密切的关系,它们都是对变量间相关关系的研究,二者可以相互补充。

相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一定程度的相关关系时,进行回归分析才有实际的意义。

同时,在进行相关分析时如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且相关分析中相关系数的确定也是建立在回归分析基础上的。

相关分析与回归分析的区别。

从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据解释变量的固定值去估计和预测被解释变量的平均值。

第八章 虚拟变量回归作业及答案一单选题

第八章 虚拟变量回归作业及答案一单选题

第八章虚拟变量回归作业及答案一单选题1、设某地区消费函数中,消费支出不仅与收入x有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。

假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为( C )。

A. 1个B. 2个C. 3个D. 4个2、对于含有截距项的计量经济模型,若想将含有m个互斥类型的定性因素引入到模型中,则应该引入虚拟变量个数为( B )。

A.mB.m-1C.m+1D.m-k3、对于一个不包含截距项的回归模型,若将一个具有m个特征的质的因素引入进计量经济模型,则虚拟变量数目为( A ) 。

A.mB.m-1C.m-2D.m+14、在利用月度数据构建计量经济模型时,如果一年里的1、3、5三个月表现出季节模式,则应该引入虚拟变量个数为( A )。

A.3B.12C.11D.75、设某计量经济模型为:Yi=a+b*Di+ui,其中Yi表示大学教授年薪,D为虚拟变量,D=1:男教授;D=0:女教授。

对于参数b的含义,下列解释正确的是( C )。

A. b表示大学女教授的平均年薪B. b表示大学男教授的平均年薪C. b表示大学男教授与女教授平均年薪的差异D. b表示大学男教授和女教授平均年薪6、当质的因素引进经济计量模型时,需要使用( D )。

A.外生变量B.前定变量C.内生变量D.虚拟变量7、某商品需求函数为Yi=a+b*Xi+ui,其中Y为需求量,X为价格。

为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为( B )。

A.2B.4C.5D.6二多选题1、关于虚拟变量,下列表述正确的有( ABC )A.是质的因素的数量化 B.可取值为l和0C.代表质的因素 D.代表数量因素2、虚拟变量的特殊作用有( BCD )A.检验模型结构的显著性 B.检验模型结构的稳定性C.分段回归 D.混合回归3、虚拟变量的取值为0和1,分别代表某种属性的存在与否,其中( BC )A. 0表示存在某种属性B.0表示不存在某种属性C. 1表示存在某种属性D.0和1代表的内容可以随意设定4、下面关于虚拟变量的引入方式的说法,正确的有( AD )A.以加法方式引入虚拟变量,反映的是定性因素对截距的影响B.以加法方式引入虚拟变量,反映的是定性因素对斜率的影响C.以乘法方式引入虚拟变量,反映的是定性因素对截距的影响D.以乘法方式引入虚拟变量,反映的是定性因素对斜率的影响5、关于虚拟变量,下列说法正确的是( AC )。

8第八章包含虚拟变量的回归

8第八章包含虚拟变量的回归
D1=1,大学;=0,其他 D2=1,中学;=0,其他 D3=1,中学以下;=0,其他 回归方程为: Y=b0+b1 X1 +
c1D1 +c2 D2+ c3 D3
引入二个虚拟变量
D1=1,大学;=0,其他 D2=1,中学;=0,其他
Y=b0+b1 X1 +
c1D1 +c2 D2
2、模型中一个定性变量,该变量 具有多种分类,p218
即多分定性变量 假定根据横截面数据,我们做个人旅游支 出Y对其收入X和学历的回归,学历这个定 性变量,可分为:
中学以下、中学、大学三个层次,
如何设置虚拟变量?
我们有如下选择
引入一个虚拟变量D 引入三个虚拟变量
D= 2,大学;=1,中学;=0,中学以下 回归方程为:Y=b0+b1 X1 +b2 D
这里有两个两分定性变量,肤色和种族 可引入两个虚拟变量
例-性别、肤色和工龄、学历(3种类型) 一起解释薪酬
性别、肤色分别引入2个虚拟变量,学历引入2
个虚拟变量
例题
P221 10-18:性别、种族对收入的影响
Y-小时工资,X-教育年限 D2-=1(女性);=0(男性) D3-=1(非白种人且非西班牙裔);=0(其 他) Y^=-0.26-2.36 D2-1.73 D3+0.80X 总结:每个定性变量所需引入的虚拟变量 比该变量类型数少一。 返回
对于方程10-18 ,其样本回归线
Y^=-0.26-2.36 D2-1.73 D3+0.80X,隐含假定
了不同性别下,种族变量对收入的影响是一样 的。同样的,不同种族下,性别变量对收入的 影响也是相同的。

计量经济学第八章 虚拟变量回归

计量经济学第八章 虚拟变量回归
计量经济学
第八章
虚拟变量回归
1
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量
●虚拟解释变量的回归
2
本章的教学目标





(1)深刻理解定性因素在计量经济分析中的 背景和含义; (2)明确虚拟变量在建立和估计计量经济模 型中的意义和作用; (3)熟练掌握引入和应用虚拟变量的基本思 想和方法; (4)能够运用虚拟变量模型作相应的经济实 证分析方面的应用; (5)掌握Eviews软件中相关内容的操作方法。
这表明三个时期居民储蓄增加额的回归方程在统计 意义上确实是不相同的。1996年以前收入每增加1 亿元,居民储蓄存款的平均增加0.1445亿元;在 2000年以后,则为0.4133亿元,已发生了很大变化。
20
上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用虚拟变量法则,没有考虑通货 膨胀因素。而在实证分析中,储蓄函数还应当考
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
(1,0) 天气阴 如:(D1 ,D2)= (0,1) 天气雨 (0,0) 其 他
29
虚拟变量数量的设置规则
1.若定性因素具有 m 个 (m 2) 相互排斥属性(或 几个水平),当回归模型有截距项时,只能引入

(完整版)第八章 虚拟变量回归 答案

(完整版)第八章 虚拟变量回归 答案

第八章 虚拟变量回归一、判断题1。

虚拟变量只能作为解释变量.(F)2。

引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。

( T )3.引入虚拟变量的个数与模型有无截距项无关.(F )4。

虚拟变量用来表示某些具有若干属性的变量.(T)5。

引入虚拟变量的个数与样本容量大小有关。

(F )二、单项选择题1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨⎩东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D ).A. 相互平行的 B 。

相互垂直的 C. 相互交叉的 D 。

相互重叠的2.虚拟变量( A )A 。

主要来代表质的因素,但在有些情况下可以用来代表数量因素B 。

只能代表质的因素C 。

只能代表数量因素D.只能代表季节影响因素3。

分段线性回归模型的几何图形是( D )A 。

平行线 B. 垂直线 C 。

光滑曲线 D. 折线4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B ).A.m B 。

m-1 C 。

m —2 D.m+15.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。

A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量⎩⎨⎧=⎩⎨⎧=⎩⎨⎧=其他季度第三季度,其他季度第二季度,其他季度第一季度 0 0 0 321D 1D 1D 1,该模型中包含了几个定性影响因素?( A )。

A 。

1B 。

2C 。

3D 。

47。

设消费函数为i i i o i u Dx b x b D y ++++=101αα,其中虚拟变量⎩⎨⎧=农村家庭城镇家庭 0 1D ,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A ).A 。

计量经济学第八章关于虚拟变量的回归.

计量经济学第八章关于虚拟变量的回归.
年 薪 Y 女教授
类的截距。
2
2:级差截距系数
教龄X
1
0
薪金与性别:估计结果
1,若是男性 Di 0,若是女性
ˆ 17.969 1.371X 3.334D Y i i i se : (0.192) (0.036) (0.155) t : (93.61) (38.45) (21.455) r 2 0.993
一、虚拟变量的性质

例:教授薪金与性别、教龄的关系

男教授平均薪金和女 教授平均薪金水平相 差2,但平均年薪对 教龄的变化率是一样 的
Yi=1+2Di+Xi+I (1) 1,若是男性 D 其中:Yi=教授的薪金, Xi=教龄, Di=性别 0,若是女性 i 女教授平均薪金:E(Yi | X i , Di 0) 1 X i 被赋予0值的 男教授平均薪金:E(Yi | X i , Di 1) (1 2) X i 类别是基底(基 准),1是基底 男教授

比较英国在第二次大战后重建时期和重建后时期的总 储蓄-收入关系是否发生变化。数据如表。 Yt 1 2 Dt 1 X t 2 ( Dt X t ) t
D=1,重建时期
级差截距:区分两 个时期的截距 级差斜率系数:区分 两个时期的斜率 =0,重建后时期
D=1 D=0
E(Yt | Dt 0, X t ) 1 1 X t E(Yt | Dt 1, X t ) (1 2 ) ( 1 2 ) X t
男教授平均薪金水平比 女教授显著高$3.334K (男:21.3,女:17.969)
1,若是女性 Di 0,若是男性
ˆ 21.303 1.371X 3.334D Y i i i se : (0.182) (0.036) (0.155) t : (117.2) (38.45) (21.455)

9第八章 虚拟变量回归模型

9第八章 虚拟变量回归模型
说明 X i 变动一个单位,机会比率对数平均变化 2 个单位,
Logit 模型的估计
区分两类数据:
(1)个体水平数据
购房概率 p 0 0 1 1
收入 X(千美元) 6 8 10 12
如果
pi
0,
Zi
ln
0 1
pi
1,
Zi
ln
1 0
可见,Z 表达式无意义,无法用OLS,需用ML(最大似然法)
冰箱销售量(千台) FRIG 1317 1615 1662 1295 1271 1555 1639 1238 1277 1258 1417 1185 1196 1410 1417 919 943 1175 1269
耐用品支出(10亿美元) DUR 252.6 272.4 270.9 273.9 268.9 262.9 270.9 263.4 260.6 231.9 242.7 248.6 258.7 248.4 255.5 240.4 247.7 249.1 251.8
4 回归分析操作命令: equation eq.ls Frig c Dur D1 D2 D3
提问 根据回归分析结果,发现存在什么问题?如何修改回归模型?
8.4 虚拟被解释变量的回归模型
【例】 研究是否购买住房与收入水平的关系。
设是否购房为被解释变量,用 Y 表示;收入为解释变量, 用 X 表示。
1 变量分析:
将DUR作为解释变量;FRIG作为被解释变量; 引入3个季度虚拟变量D1,D2,D3。 (虚拟变量数 = 属性数 – 1 )
2 季度虚拟变量的赋值规则:
D1=
1 (第1季度) 0 (其他季度)
D3=
1 (第3季度) 0 (其他季度)
D2=

第八章 虚拟变量回归 答案

第八章 虚拟变量回归 答案

第八章 虚拟变量回归一、判断题1.虚拟变量只能作为解释变量。

(F )2. 引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。

( T )3.引入虚拟变量的个数与模型有无截距项无关。

(F )4.虚拟变量用来表示某些具有若干属性的变量。

(T )5.引入虚拟变量的个数与样本容量大小有关。

(F )二、单项选择题1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨ ⎩东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D )。

A. 相互平行的B. 相互垂直的C. 相互交叉的D. 相互重叠的2.虚拟变量( A )A.主要来代表质的因素,但在有些情况下可以用来代表数量因素B.只能代表质的因素C.只能代表数量因素D.只能代表季节影响因素3.分段线性回归模型的几何图形是( D )A. 平行线B. 垂直线C. 光滑曲线D. 折线4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B )。

A.mB.m-1C.m-2D.m+15.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。

A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量⎩⎨⎧=⎩⎨⎧=⎩⎨⎧=其他季度第三季度,其他季度第二季度,其他季度第一季度 0 0 0 321D 1D 1D 1,该模型中包含了几个定性影响因素?( A )。

A.1B. 2C. 3D. 47. 设消费函数为i i i o i u Dx b x b D y ++++=101αα,其中虚拟变量⎩⎨⎧=农村家庭城镇家庭 0 1D ,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A )。

第八章 虚拟变量回归作业及答案一单选题

第八章 虚拟变量回归作业及答案一单选题

第八章虚拟变量回归作业及答案一单选题1、设某地区消费函数中,消费支出不仅与收入x有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。

假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为( C )。

A. 1个B. 2个C. 3个D. 4个2、对于含有截距项的计量经济模型,若想将含有m个互斥类型的定性因素引入到模型中,则应该引入虚拟变量个数为( B )。

A.mB.m-1C.m+1D.m-k3、对于一个不包含截距项的回归模型,若将一个具有m个特征的质的因素引入进计量经济模型,则虚拟变量数目为( A ) 。

A.mB.m-1C.m-2D.m+14、在利用月度数据构建计量经济模型时,如果一年里的1、3、5三个月表现出季节模式,则应该引入虚拟变量个数为( A )。

A.3B.12C.11D.75、设某计量经济模型为:Yi=a+b*Di+ui,其中Yi表示大学教授年薪,D为虚拟变量,D=1:男教授;D=0:女教授。

对于参数b的含义,下列解释正确的是( C )。

A. b表示大学女教授的平均年薪B. b表示大学男教授的平均年薪C. b表示大学男教授与女教授平均年薪的差异D. b表示大学男教授和女教授平均年薪6、当质的因素引进经济计量模型时,需要使用( D )。

A.外生变量B.前定变量C.内生变量D.虚拟变量7、某商品需求函数为Yi=a+b*Xi+ui,其中Y为需求量,X为价格。

为了考虑“地区”(农村、城市)和“季节”(春、夏、秋、冬)两个因素的影响,拟引入虚拟变量,则应引入虚拟变量的个数为( B )。

A.2B.4C.5D.6二多选题1、关于虚拟变量,下列表述正确的有( ABC )A.是质的因素的数量化 B.可取值为l和0C.代表质的因素 D.代表数量因素2、虚拟变量的特殊作用有( BCD )A.检验模型结构的显著性 B.检验模型结构的稳定性C.分段回归 D.混合回归3、虚拟变量的取值为0和1,分别代表某种属性的存在与否,其中( BC )A. 0表示存在某种属性B.0表示不存在某种属性C. 1表示存在某种属性D.0和1代表的内容可以随意设定4、下面关于虚拟变量的引入方式的说法,正确的有( AD )A.以加法方式引入虚拟变量,反映的是定性因素对截距的影响B.以加法方式引入虚拟变量,反映的是定性因素对斜率的影响C.以乘法方式引入虚拟变量,反映的是定性因素对截距的影响D.以乘法方式引入虚拟变量,反映的是定性因素对斜率的影响5、关于虚拟变量,下列说法正确的是( AC )。

第八章虚拟变量参考答案

第八章虚拟变量参考答案

练习题8.1参考解答:(1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。

但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。

方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。

(2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。

如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。

即:1 1097(l n()7)0 1097i i D X ⎧-=⎨⎩人均收入大于美元人均收入低于美元(3) 对于贫穷国,其回归方程为:2.409.39ln i X -+ 对于富国,其回归方程为:2.40(9.39-3.36)ln 3.36*721.12 6.03ln i i X X -++=+习题8.2参考答案由于有四个季度,因此引入三个季度虚拟变量1 1 1 1220 0 0 D D D ⎧⎧⎧===⎨⎨⎨⎩⎩⎩一季度二季度三季度其它其它其它(1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距水平)i 0112233i i Y =D D D X ααααβμ+++++回归结果如下:123i 22ˆ=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625i Y -+-+)(-.) (.) (2)由于考虑利润对销售额的变化率发生变异,即斜率的改变,因此按照乘法模型引入三个虚拟变量,模型为:i 01i 1i 12i 23i 3i Y =X X D X D X D ββαααμ+++++回归结果如下:i i 1i 2i 322ˆ=7014.7570.037068X -0.000933X D 0.00791X D 0.002385X D t= (3.934394) (3.273896 (-0.216776) 0.0040180.58529 R =0.519733 R =0.418624 F=5.140311 DW=0.429628i Y ++--)() () (3)按照加法和乘法相结合的方式引入三个虚拟变量,模型为:i 01122331i 2i 13i 24i 3i Y =D D D X X D X D X D ααααββββμ++++++++回归结果为:i 123i i 1i 2i 322ˆY =10457.394752.26D 3764.21D 4635.46D 0.0159X 0.029X D 0.03X D 0.0266X D t= (2.566) (-0.87 (-0.6860.8320.6280824089960749 R =0.546701 R =0.348383 F=2---++++-)) () () (.) (.)(.).756686 DW=0.464982通过对三个模型对比分析可以看出,第三个模型的系数均不显著,模型一和二销售额的系数显著,其余系数也不显著。

计量经济学课后思考题答案

计量经济学课后思考题答案

第五章 异方差性思考题5.1 简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关?答 :设模型为),....,,(....n 21i X X Y i i 33i 221i =μ+β++β+β=,如果其他假定均不变,但模型中随机误差项的方差为),...,,()(n 21i Var 2i i =σ=μ,则称i μ具有异方差性。

由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,所以异方差的出现总是与模型中某个解释变量的变化有关。

5.2 试归纳检验异方差方法的基本思想,并指出这些方法的异同。

答:各种异方差检验的共同思想是,基于不同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否随解释变量变化而变化。

其中,戈德菲尔德-跨特检验、怀特检验、ARCH 检验和Glejser 检验都要求大样本,其中戈德菲尔德-跨特检验、怀特检验和Glejser 检验对时间序列和截面数据模型都可以检验,ARCH 检验只适用于时间序列数据模型中。

戈德菲尔德-跨特检验和ARCH 检验只能判断是否存在异方差,怀特检验在判断基础上还可以判断出是哪一个变量引起的异方差。

Glejser 检验不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。

5.3 什么是加权最小二乘法?它的基本思想是什么?答:以一元线性回归模型为例:12i i i Y X u ββ=++经检验i μ存在异方差,公式可以表示为22var()()i i i u f X σσ==。

选取权数 i w ,当2i σ 越小 时,权数i w 越大。

当 2i σ越大时,权数i w 越小。

将权数与 残差平方相乘以后再求和,得到加权的残差平方和:2i 21i 2i i X Y w e w )(**β-β-=∑∑,求使加权残差平方和最小的参数估计值**ˆˆ21ββ和。

这种求解参数估计式的方法为加权最小二乘法。

8第八章虚拟变量回归new

8第八章虚拟变量回归new

118.5 1993 34560.5 15203.5 3444.1
1981 4860.3 532.7
124.2 1994 46670
21518.8 6315.3
1982 5301.8 675.4
151.7 1995 57494.9 29662.3 8143.5
1983 5957.4 892.5
217.1 1996 66850.5 38520.8 8858.5

年 份
国民总收 入 (GNI)
民币储蓄存 款年底余额
(Y )
人民币储 蓄存款增 额
( Y)
YY
(YY)
1978 3624.1 210.6
NA
1991 21662.5 9241.6
2121.8
1979 4038.2 281
70.4 1992 26651.9 11759.4 2517.8
1980 4517.8 399.5
设1998年、1999年我国城镇居民消费函数分别为: 1998年:Yi=a1+b1xi +εi 1999年:Yi=a2+b2xi +εi
为比较两年的消费函数是否有显著差异,设置虚拟
变量:
1 1999年 D 0 1998年
并且合并两年的数据,估计以下模型:
Yi= a1 +b1xi+αDi+βXDi +εi 其中α=a2-a1 ,β=b2-b1。
1 Di 0
第i+1季度 其他季度
利润函数可取为 :
i=1,2,3
Yi=a+bxi+ α1D1i+ α2D2i + α3D3i + εi
二、检验模型结构的稳定性

第八章 虚拟变量回归

第八章 虚拟变量回归
YYt = β1 + β2GNIt + β3 ( GNIt 66850.50) D1t + β4 ( GNIt 88254.00) D2t + ut
其中:
1 t = 1996年以后 D1t = 0 t = 1996年及以前
1 t = 2000年以后 D2 t = 0 t = 2000年及以前
1
基本思路:采用乘法方式引入虚拟变量的手 段。显然,1979年是一个转折点,可考虑在 这个转折点作为虚拟变量设定的依据。若设 X*=1979,当 t < X* 时可引入虚拟变量。 (为什么选择1979作为转折点?)
2
依据上述思路,有如下描述我国居民在不同时段消费 行为模型:
Yt = β 0 + β1t + β 2 (t X * ) D + ut
5
表8.1
年 份 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 国民总收入 (GNI) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 7206.7 8989.1 10201.4 11954.5 14922.3 16917.8 18598.4
9
为了分析居民储蓄行为在1996年前后和2000年前 后三个阶段的数量关系,引入虚拟变量D1和D2。 D1和D2的选择,是以1996、2000年两个转折点 作为依据,1996年的GNI为66850.50亿元,2000年 的GNI为国为民8254.00亿元,并设定了如下以加法 和乘法两种方式同时引入虚拟变量的的模型:
城乡居民人民 币储蓄存款年 底余额(Y) 210.6 281 399.5 532.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7119.8

第八章第二节 虚拟解释变量的回归

第八章第二节  虚拟解释变量的回归

冬季、城市居民 Yi (0 2) X i i
冬季、农村居民 Yi 0 X i i
(比较的基础 — 冬季、农村)
20 15 10 5 0
1234567
补充案例研究:为了解工作妇女是否受到歧视,可
以用美国统计局的“当前人口调查”中的截面数据, 研究男女工资有没有差别。这项多元回归分析研究 所用到的变量有:
第二节 虚拟解释变量的回归 加入虚拟变量的两种基本途径:加法类型、乘法类型。 一、加法类型 设定的虚拟变量以相加的形式出现 作用:改变了设定模型的截距水平,称为截距变动模型。
(一)加法类型的虚拟变量模型
1、一个定性变量(两种属性):Yi f (Di ) i
例:Yi 0 1Di i
R2 0.398 F 21.9
注意上述模型,男女差异还是显著的。这个回归模型告 诉我们,在其他条件不变的情况下,雇员的工资率随年龄的
增长而增加,但增加的速度是递减的。
(二)一个定量变量X、多个虚拟变量(定性变量)的模型
Yt 0 1D1t D2t Dkt X t ut
下面分别对三个作用进行讨论: (一)回归模型的比较(结构变化检验)
通过对模型的参数检验,可以检验模型是否有不同的结构。 即
定性变量D的引入,是否影响不同类型(属性)模型的平均水平(截距
项)?
定性变量D的引入,是否影响不同类型(属性)模型的相对变化(斜率 系数)?
例如,在研究改革开放前后储蓄——收入总量关系时,所设 定的模型为:
例如,不同人群组的衣着消费函数
Yi 1 2 D2i 3D3i X i ui
(1)
其中:Y(i 服装年均支出费);X(i 收入水平)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章 虚拟变量回归 思考题
8.1 什么是虚拟变量 ? 它在模型中有什么作用 ?
8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量
1,01D ⎧⎪
=⎨⎪-⎩
大专及大专以上,高中,高中以下
这样的设置方式隐含了什么假定 ? 这一假定合理吗 ?
8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应?
8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为
12233t i i i i Y D D X u αααβ=++++
其中,i X =收入水平 ;Y = 年服装消费支出 ;
1,30D ⎧=⎨
⎩大专及大学以上
,其他
;1,20D ⎧=⎨⎩女性,其他 试写出不同人群组的服装消费函数模型。

8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ?
1) 一年里的 12 个月全部表现出季节模式 ;
2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。

练习题
8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型
[]ˆ 2.409.39ln 3.36(ln 7)i i i i
Y X D X =-+-- (4.37)(0.857)(2.42) R2=0.752
其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ;
Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。

括号内的数值为对应参数估计值的t 值。

1) 解释这些计算结果。

2) 回归方程中引入(ln 7)i i D X =-的原因是什么?如何解释这个回归解释变量?
3) 如何对贫穷国进行回归 ? 又如何对富国进行回归 ? 4)这个回归结果中可得到的一般结论是什么 ?
8.2 表 8.4 给出 1965-1970 年美国制造业利润和销售额的季度数据。

假定
利润不仅与
销售额有关 , 而且和季度因素有关。

1) 如果认为季度影响使利润平均值发生变异 , 应如何引入虚拟变量 ?
2) 如果认为季度影响使利润对销售额的变化率发生变异 , 应当如何引入虚
拟变量 ?
3) 如果认为上述两种情况都存在 , 又应当如何引入虚拟变量 ? 的对上述
三种情况分别估计利润模型 , 进行对比分析。

8.3 在统计学教材中 , 采用了方差分析方法分析了不同班次对劳动效率的
试采用虚拟解释变量回归的方法对上述数据进行方差分析。

8.4Joseph Camelld 基于 1961 斗 1966 年的 200 只 Aa 级和 Baa 级债券的数据 ( 截面数据和时间序列数据的合并数据 ), 分别建立了 LPM 和 IAgit 模型 1)LPM
2
122334455i i i i i i Y X X X X u βββββ=+++++
2)IAgit 模型
2
122334455ln 1i
i i i i i i i p
L X X X X u p βββββ⎛⎫==+++++ ⎪-⎝⎭
其中 , i Y =1[ 债券信用等级为a A ( 穆迪信用等级 )];
i L =[债券信用等级为aa B (穆迪信用等级)];
2i X =⨯长期债券的市值
债券的资本化率(作为杠杆的测度=
100)总资本的市值
3i X =⨯税后收入
利润率(
100)总资产净值
4i X = 利润率的标准差( 测度利润率的变异性 ): 5i X = 总资产净值 ( 测度规模 ) 。

上述模型中 , 2β和4β事先期望为负值 , 而3β和5β 期望为正值。

对于 LPM,Cappelleri 经过异方差和一阶自相关校正 , 得到以下结果
272345ˆ0.68600.01790.04860.05720.37810i i i i i
Y X X X X -=-+++⨯
se =(0.1775)(0.0024) (0.0486)(0.0178)(0.039⨯810-)
20.6933R =
对于LDgit 模型 ,Cappelleri 在没有对异方差进行弥补的情形下用 ML 得以下结果 :
262345ln 1.66220.31850.62480.90410.92101i i i i i i p X X X X p -⎛⎫=--+-+⨯ ⎪-⎝⎭ 试解下列问题 :
1) 为什么要事先期望2β和4β为负值 ? 2) 在 LPM 中 , 当4β>0 是否合理 ? 3) 对 LPM 的估计结果应做什么样的解释 ?
的已知2
2X =9.67%,3X =7.77%,4X =0.5933%,5X =3429000( 元 ), 问债券晋

Aa 信用等级的概率有多大?
8.5 Greene 在分析讲授某门经济学课程采用新的教学方法效应时,搜集了如表 8.5 所示的数据 , 其中 ,GRADE 是学生在接受新教学方法
(PSI,PSI=1,0⎧⎨⎩接受新教学方法
,没有采用新方法
) 后学习
成绩是否有所提高的虚拟变量 ,GRADE=1,0⎧⎨⎩
有所提高
,没有提高; 其他变量分别为平均级
点 GPA 、非期末考试成绩分数 TUCE 。

试用对数单位模型对此进行估计,并分析
相应的边际效应。

表8.5采用新的教学方法讲授某门经济学课程的数据
obs GRADE
GPA
TUCE
PSI
obs GRADE
GPA
TUCE
1 0 2.66 20 0 17 0 2.75 25
2 0 2.89 22 0 18 0 2.8
3 19 3 0 3.28 2
4 0 19 0 3.12 23 4 0 2.92 12 0 20 1 3.16 2
5 5 1 4 21 0 21 0 2.0
6 22 6 0 2.86 1
7 0 22 1 3.62 2
8 7 0 2.76 17 0 23 0 2.8
9 14 8 0 2.87 21 0 24 0 3.51 26 9 0 3.03 25 0 25 1 3.54 24 10 1 3.92 29 0 26 1 2.83 27 11 0 2.63 20 0 27 1 3.39 17 12 0 3.32 23 0 28 0 2.67 24 13
3.57
23
29
1
3.65
21
14 1 3.26 25 0 30 1 4 23
15 0 3.53 26 0 31 0 3.1 21
16 0 2.74 19 0 32 1 2.39 19
8.6 依据某大型超市的调查数据表8.6,分析股份制因素是否对销售规模产生影
响。

表8.6某大型超市的调查数据。

相关文档
最新文档