第8章 模型中的特殊解释变量
8-3、模型中的特殊解释变量:虚拟变量
2016/3/29
1
8.3、 虚拟变量(Dummy variables)
8.3.1、.虚拟变量的概念
在回归分析中,常常碰到这样一种情况,即因变量 的波动不仅依赖于那种能够很容易按某种尺度定量化的 变量(如收入、产出、价格、身高、体重等),而且依 赖于某些定性的变量(如性别、地区、季节等)。 在经济系统中,许多变动是不能定量的。如政府的更 迭(工党 - 保守党)、经济体制的改革、固定汇率变为 浮动汇率、从战时经济转为和平时期经济等。 这样一些变动都可以用 0-1 变量来表示,用 1 表示具有 某一“品质”或属性,用0表示不具有该“品质”或属 性。这种变量在计量经济学中称为“虚拟变量”。虚拟 变量使得我们可以将那些无法定量化的变量引入回归模 型中。
2016/3/29 2
下面给出几个可以引入虚拟变量的例子。 例1:你在研究学历和收入之间的关系,在你的样 本中,既有女性又有男性,你打算研究在此关系中, 性别是否会导致差别。 例2:你在研究某省家庭收入和支出的关系,采集 的样本中既包括农村家庭,又包括城镇家庭,你打 算研究二者的差别。 例3:你在研究通货膨胀的决定因素,在你的观测 期中,有些年份政府实行了一项收入政策。你想检 验该政策是 否对通货膨胀产生影响。 上述各例都可以用两种方法来解决,一种解决方 法是分别进行两类情况的回归,然后检验参数是否 不同。另一种方法是用全部观测值作单一回归,将 定性因素的影响用虚拟变量引入模型。
女1 0 女2 0 男2 1 女3 0 男3 1 男4 1 女4 0 女5 0
21.2
男5 1
试建立模型研究之。
2016/3/29
9
4、虚拟变量在分段回归中的应用
2016/3/29
第8章滞后变量模型
第8章滞后变量模型8.1 滞后变量模型的基本概念8.1.1 滞后现象与产生滞后现象的原因因变量受其自身或其他经济变量前期水平影响的经济现象,称之为滞后现象(或滞后效应)。
产生滞后现象的原因主要有以下几个方面:1.经济变量自身的原因:有些经济变量的发展变化有很强的继往性,当期水平与前期水平有极为密切的关系。
2.决策者心理上的原因3.技术上的原因4.制度的原因8.1.2 滞后变量与滞后变量模型所谓滞后变量(lagged variable),是指过去时期的、对当前因变量产生影响的变量。
滞后变量可分为滞后解释变量与滞后因变量两类。
把滞后变量(滞后解释变量与滞后因变量)引入回归模型,这种回归模型称为滞后变量模型。
含有滞后解释变量的模型,又称为动态模型。
滞后变量模型的一般形式为(8.1.1)其中,k,p分别为滞后解释变量和滞后因变量的滞后期长度。
为被解释变量的第阶滞后,为解释变量的第阶滞后。
若滞后期长度为有限,称模型为有限滞后变量模型;若滞后期长度为无限,称模型为无限滞后变量模型。
由于模型既含有对自身滞后变量的回归,还包括解释变量分布在不同时期的滞后变量,因此,一般称为自回归分布滞后模型(autoregessive distributed lag model,ADL)。
1.分布滞后模型如果滞后变量模型中没有滞后因变量,因变量受解释变量的影响分布在解释变量不同时期的滞后值上,即模型形如(8.1.2)(8.1.2)*具有这种滞后分布结构的模型称为分布滞后模型(distributed lag model)。
在分布滞后模型中,各系数体现了解释变量的各个滞后值对因变量的不同影响程度。
称为短期影响乘数(或即期乘数、短期乘数、短期效果),表示本期解释变量x变动一个单位对被解释变量y值产生的影响,即短期影响。
称为延期过渡性乘数(或中期乘数、动态乘数)(i=1,2,…,k,…),表示解释变量在各滞后期变动一个单位对y值的影响大小,即x的滞后影响。
南开大学考博参考书
南开大学会计学专业博士生入学考试科目和参考书目考试科目一:英语(包括:基础外语、听力,不包括专业外语)。
考试科目二:会计理论与方法(含财务会计学、审计学),其中财务会计部分大致占70%,审计部分大致占30%。
参考书目1.威廉姆.R.司可脱著,陈汉文等译《财务会计理论》,机械工业出版社,2000年11月。
2.夏恩.桑德著,方红星、王鹏、李红霞译《会计与控制理论》,东北财经大学出版社,2000年12月。
ISBN:7111078963.王光远,《审计学》,(会计大典系列,第十卷;总主编,葛家澍等),中国财政经济出版社,第1-6章。
考试科目三:会计综合基础(含财务管理、微观经济学、计量经济学),其中财务管理大致占60-70%,微观经济学与计量经济学占30-40%。
参考书目:1.詹姆斯.范.霍恩著,刘志远主译《财务管理与政策》,东北财经大学出版社,2006年。
2.计量经济学指定参考书及要求●指定参考书:张晓峒主编,《计量经济学基础》(第3版),南开大学出版社,2007年9月。
(该书为“普通高等教育”十一五“国家级规划教材”)●内容要求:第1章绪论第2章一元线性回归模型第3章多元线性回归模型第4章非线性回归模型的线性化第5章异方差第6章自相关第7章多重共线性第8章模型中的特殊解释变量本章只要求:§8.3 虚拟变量第11章模型的诊断与检验本章只要求:§11.1 模型总显著性的F检验§11.2 模型单个回归参数显著性的t检验3.微观经济学参考书目待定。
除以上参考书目外,考生还需要阅读了解《会计研究》、《中国会计评论》(北京大学出版社)、《审计研究》等专业期刊近两年来有关财务、会计和审计等方面的研究成果,特别是实证研究的有关成果。
spss第八章虚拟变量
10
模型中引入虚拟变量的作用
1、分离异常因素的影响,例如分析我国 GDP的时间序列,必须考虑“文革”因素 对国民经济的破坏性影响,剔除不可比 的“文革”因素。 2、检验不同属性类型对因变量的作用, 例如工资模型中的文化程度、季节对销 售额的影响。 3、提高模型的精度,相当与将不同属性 的样本合并,扩大了样本容量(增加了 12 误差自由度,从而降低了误差方差)。
虚拟变量在模型中,可以作解释变量,也 可以作因变量。 虚拟变量作解释变量时出现在方程的右端 虚拟变量作因变量(被解释变量)时出现 在方程的左端
9
虚拟变量模型
引入虚拟变量后,回归方程中同时含有一 般解释变量和虚拟变量,称这种结构的模 型为虚拟变量模型或斜方差分析模型。 在第8章(本章)中讨论虚拟自变量模型 在第14章(虚拟因变量)中讨论虚拟因变 量。虚拟变量作因变量又称抉择模型。
虚拟变量设置的原则
在模型中引入多个虚拟变量时,虚拟变量 的个数应按下列原则确定: 如果有 m 种互斥的属性类型,在模型中引 入 m-1 个虚拟变量 例如,性别有2个互斥的属性,引用2-1=1个 虚拟变量 再如,文化程度分小学、初中、高中、大 学、研究生5类,引用4个虚拟变量
13
虚拟变量是一用以反映质的属性的一个人 工变量,通常记为D(Dummy)。 虚拟变量D只取0或1两个值 对基础类型或肯定类型设D=1 对比较类型或否定类型设D=0
7
虚拟变量举例
D= D= 1 0 0 1 本科学历 非本科学历 “文革”时期 非“文革”时期
8
虚拟变量的引入
模型中引入虚拟变量的必要性
现实经济生活错综复杂,往往要求人们按 照经济变量的质或量的不同,分别进行处 理。因此,回归模型中,往往有必要引入 虚拟变量,以表示这些质的区别。例如, 消费函数,对于平时与战时,萧条与繁荣, 乃至性别、教育程度、季节性等等,都会 因质的有不同表现出不同的差异。6虚拟变量的定义
计量经济学_詹姆斯斯托克_第8章_非线性的回归模型
Ln(TestScore) = 6.336 + 0.0554 ln(Incomei) (0.006) (0.0021)
假设 Income 从$10,000 增加到$11,000(或者 10%)。
则 TestScore 增加大约 0.0554 10% = 0.554%。
如果 TestScore = 650, 意味着测试成绩预计会增加
非线性的回归模型
非线性的回归函数
“非线性”的含义:
(1)非线性的函数 自变量与解释变量之间的非线性
函 数形式。
(2)非线性的回归 参数与随机项的非线性形式。
非线性的回归函数
一、多项式回归 二、对数回归 三、自变量的交互作用 四、其他非线性形式的回归 五*、非线性回归(参数非线性)
一、多项式回归
1、指数函数曲线
指数函数方程有两种形式:
yˆ aebx yˆ abx
y a>0,b>0
a>0,b<0
x
图11.1方yˆ 程 aebx 的图象
二、对数函数曲线
对数函数方程的一般表达式为:
yˆ a b ln x
y
b>0
b<0
x
图11.2 方程yˆ =a+blnx 的图象
(2)根据拟合程度的好坏来确定(如,利用spss 的相关功能) 在社会科学领域里,阶数不会太高!
一、多项式回归
形式: Y 0 1X 2 X 2 ...r X r u
(2)多项式的本质 泰勒展开
一、多项式回归
形式: Y 0 1X 2 X 2 ...r X r u
Y——收入; D1——性别(1——男;0——女) D2——学历(1——大学学历;0——没有)
第8章 虚拟变量模型
效应。
8.1.3 虚拟变量作为因变量的情况
1、因变量为虚拟变量的回归模型
• 虚拟变量作为因变量的模型也称定性响应模型,既可 以包括二值变量模型(也称二分选择模型),也包括 多分选择模型。我们重点讨论二值变量模型。
• 模型举例: 一个大学毕业生是否会被一个不错的MBA项目录取, 取决于其学习成绩、GMAT分数和其它因素。 一位成年男子是否就业取决于总体失业率、平均工资 率、受教育程度和家庭收入等因素。
其中:
1
yi
{ 0
已购买汽车 未购买汽车
且假定E(ui ) 0
1.2 Y
1.0
0.8
0.6
0.4
0.2
0.0 X
-0.2 280 300 320 340 360 380 400 420
对于给定的xi ,E(yi / xi ) 0 1xi
设pi表示yi 1的概率,则1 pi表示yi 0的概率 E(yi / xi ) pi 1 (1 pi) 0 pi 可见,该模型描述了随着收入的变动, 第i个家庭 购买汽车的概率变动情况。
b0 + b1xt + ut , (D = 0)
Y
yt =
b0 + (b1 + b2) xt + ut , (D = 1)
男
女
t
0
3、一般方式
直接以加法和乘法方式引入虚拟变量。 可建立如下模型:
yt = b0 + b1 xt + b2 D + b3 xt D + ut ,
其中 xt 为定量变量;D 为定性变量。当 D = 0 或 1 时,上述模
yt =
第8章 多重共线性:解释变量相关会有什么后果
Yi A1 A2 X 2 i A3 (300 2 X 2 i ) ui
A1 300 A3 A2 2 A3 X 2 i ui
令
C1 A1 300 A3 C 2 A2 2 A3
ˆ ˆ X ˆ X ˆ 3t X 3.12 31.2 1t 32.1 2t
• 利用以上偏回归系数,3个变量之间的偏相关系数 可定义如下:
ˆ ˆ r12.3 12.3 21.3
ˆ ˆ r13.2 13.2 31.2
ˆ ˆ r23.1 23.1 32.1
案例分析 一、研究的目的要求
提出研究的问题——为了规划中国未来国内旅游产业 的发展,需要定量地分析影响中国国内旅游市场发展 的主要因素。
二、模型设定及其估计
影响因素分析与确定——影响因素主要有国内旅游 人数 X 2,城镇居民人均旅游支出 X 3,农村居民人均
旅游支出 X 4 ,并以公路里程次 X 5 和铁路里程
8.7鸡肉需求函数[方程(8.15)]的共线性诊断 1.相关矩阵
鸡肉需求函数[方程(8.15)]的共线性诊断 2.辅助回归
8.8 如何解决多重共线性:补救措施
• • • • • • 从模型中删掉一个变量 获取额外的数据或新的样本 重新考虑模型 参数的先验信息 变量变换 其他补救措施
(1)从模型中删掉一个变量
留该变量。
若新变量的引入未能改进 R 2 和 F 检验,且对其他回 归参数估计值的t 检验也未带来什么影响,则认为该 变量是多余变量。 若新变量的引入未能改进 R 2 和 F 检验,且显著地影 响了其他回归参数估计值的数值或符号,同时本身的 回归参数也通不过t 检验,说明出现了严重的多重共 线性。
2024春高中数学第8章成对数据的统计分析8-2一元线性回归模型及其应用8-2-1一元线性回归模型8
(2)通过(1)中的方程,求出y关于x的回归方程.
[解]
=1.2t-1.4,代入t=x-2
Ƹ
017,z=y-5,
得-5=1.2(x-2
ො
017)-1.4,
即=1.2x-2
ො
416.8.
故y关于x的经验回归方程为=1.2x-2
ො
416.8.
◆ 类型3 利用经验回归方程进行预测
【例3】 (源自湘教版教材)一个车间为了估计加工某种新型零件所
(√ )
(2)经验回归方程最能代表观测值x,y之间的线性关系,且回归直线
过样本点的中心(,
ҧ ).
ത
(√ )
(3)求经验回归方程前可以不进行相关性检验.
( × )
(4)利用经验回归方程求出的值是准确值.
( × )
①④
2.下列有关经验回归方程=
ො +
叙述正确的是______(填序号).
位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并
由调查数据得到y对x的经验回归方程:=0.254x+0.321.由经验回
ො
归方程可知,家庭年收入每增加1万元,年饮食支出平均增加
0.254
________万元.
0.254
[由于=0.254x+0.321知,当x增加1万元时,年饮食支出y增
ො
①反映与x之间的函数关系;
ො
②反映与x之间的函数关系;
③表示与x之间不确定关系;
ො
④表示最接近与x之间真实关系的一条直线.
①④
[=
ො +
表示
ො
与x之间的函数关系,而不是y与x之间的函数
ො
关系,但它反映的关系最接近y与x之间的真实关系,故①④正确.]
计量经济学复习
第二章 一元线性回归模型1.随机误差项形成的原因:① 在解释变量中被忽略的因素 ② 变量观测值的观测误差 ③ 模型的关系误差或设定误差 ④ 其他随机因素的影响。
2.总体回归方程和样本回归方程的区别和联系:总体回归方程是对总体变量间关系的定量表述,条件均值E(Y|X=x)是x 的一个函数 ,记作:E(Y|X=x)=f(x),其中,f(x)为x 的某个函数 ,它表明在X=x 下,Y 的条件均值与x 之间的关系。
但实际中往往不可能得到总体的全部资料 ,只能先从总体中抽取一个样本,获得样本回归方程 ,并用它对总体回归方程做出统计推断。
通过样本回归方程按照一定的准则近似地估计总体回归方程 ,但由于样本回归方程随着样本的不同而有所不同,所以这种高估或低估是不可避免的。
3.随机误差项的假定条件:(1)零均值:随机误差项具有零均值,即E( )=0,i=1,2,… (2)随机误差项具有同方差: 即每个 对应的随机误差项 具有相同的常数方差。
Var( )=Var( )= ,i=1,2,… (3)无序列相关:即任意两个 和 所对应的随机误差项 、 是不相关的。
Cov( , )=E( )=0,i j,i,j=1,2,… (4)解释变量X 是确定性变量,与随机误差项不相关。
Cov( , )=E( )=0,此假定保证解释变量X 是非随机变量。
(5) 服从正态分布, ~N(0, )4.为什么用决定系数 评价拟合优度,而不用残差平方和作为评价标准?判定系数 = = 1- ,含义为由解释变量引起的被解释变量的变化占被解释变量总变化的比重,用来判定回归直线拟合的优劣。
该值越大说明拟合得越好。
而残差平方和值的大小受变量值大小的影响,不适合具有不同量纲的模型的比较。
5.可决系数 说明了什么?在简单线性回归中它与斜率系数的t 检验的关系是什么?可决系数 是对模型拟合优度的综合度量 ,其值越大,说明在Y 的总变差中由模型作出了解释的部分占得比重越大 ,模 型的拟合优度越高 ,模型总体线性关系的显著性越强。
《计量经济学》课程教学大纲
《计量经济学》课程教学大纲英文名称:Econometric课程代码:221102004课程类别:专业核心课课程性质:必修开课学期:第四学期总学时:54(讲课:36,实验0,实践18,网络0)总学分:3考核方式:作业先修课程:高等数学、微观经济学、宏观经济学、统计学适用专业:经济学一、课程简介《计量经济学》是经济学专业的一门专业核心课程。
本课程以高等数学、宏微观经济学、统计学为先修课程,系统讲授计量经济学的基础理论、一元和多元线性回归模型、非线性回归模型的线性化、异方差、自相关、多重共线性、模型中特殊的解释变量以及Eviews基础操作等内容,为全国大学生市场调查与分析大赛以及毕业论文作理论与实践兼具的准备。
该课程分别从理论授课、软件学习以及团队实训等三个维度全面提高学生的思想水平、政治觉悟、道德品质及文化素养,重点培养学生经济学专业知识与技能,使其具有较为扎实的专业知识储备、数据分析的能力、实践与创新能力。
二、课程目标及其对毕业要求的支撑总体目标:全面提高学生的政治素养和道德品质,重点培养学生经济统计专业知识与技三、课程内容及要求第一章绪论教学内容:第一节计量经济学的定义与类型1.计量经济学的定义2.计量经济学的类型第二节计量经济学的特征1.经典计量经济学在理论方法方面特征2.经典计量经济学在应用方法方面特征第三节计量经济学的目的及研究问题的步骤1.计量经济学的目的2.计量经济学研究问题的步骤3.Eviews软件介绍学生学习预期成果:1.理解计量经济学的含义2.理解计量经济学的类型与特征3.了解计量经济学的目的及研究问题的步骤4.了解Eviews软件并下载安装成功教学重点:计量经济学的含义;计量经济学研究问题的步骤;Eviews软件介绍。
教学难点:计量经济学的含义;计量经济学研究问题的步骤。
第二章一元线性回归模型教学内容:第一节模型的建立及其假定条件1.回归分析的概念2.一元线性回归模型的介绍3.随机误差项的假定条件第二节一元线性回归模型的参数估计1.普通最小二乘法的概念2.参数估计第三节最小二乘估计量的统计性质1.线性性2.无偏性3.最小方差性第四节用样本可决系数检验回归方程的拟合优度1.总离差平方和的分解2.样本可决系数及相关系数第五节回归系数估计值的显著性检验与置信区间1.随机变量u的方差2.t检验3.置信区间第六节一元线性回归方程的预测1.点预测2.区间预测第七节案例分析1.用Eviews软件研究分析我国城镇居民年人均可支配收入与年人均消费性支出之间的关系学生学习预期成果:1.掌握回归分析的概念2.掌握随机误差项的假定条件3.掌握一元线性回归模型的参数估计4.熟悉最小二乘估计量的统计性质5.掌握用样本可决系数检验回归方程的拟合优度6.掌握回归系数估计值的显著性检验7.掌握Eviews软件的基础操作教学重点:回归分析的概念;随机误差项的假定条件;一元线性回归模型的参数估计;Eviews软件的基础操作。
第八章 虚拟变量回归 答案
第八章 虚拟变量回归一、判断题1.虚拟变量只能作为解释变量。
(F )2. 引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。
( T )3.引入虚拟变量的个数与模型有无截距项无关。
(F )4.虚拟变量用来表示某些具有若干属性的变量。
(T )5.引入虚拟变量的个数与样本容量大小有关。
(F )二、单项选择题1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨ ⎩东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D )。
A. 相互平行的B. 相互垂直的C. 相互交叉的D. 相互重叠的2.虚拟变量( A )A.主要来代表质的因素,但在有些情况下可以用来代表数量因素B.只能代表质的因素C.只能代表数量因素D.只能代表季节影响因素3.分段线性回归模型的几何图形是( D )A. 平行线B. 垂直线C. 光滑曲线D. 折线4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B )。
A.mB.m-1C.m-2D.m+15.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。
A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量⎩⎨⎧=⎩⎨⎧=⎩⎨⎧=其他季度第三季度,其他季度第二季度,其他季度第一季度 0 0 0 321D 1D 1D 1,该模型中包含了几个定性影响因素?( A )。
A.1B. 2C. 3D. 47. 设消费函数为i i i o i u Dx b x b D y ++++=101αα,其中虚拟变量⎩⎨⎧=农村家庭城镇家庭 0 1D ,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A )。
第八章 (1) 离散和受限被解释变量模型
SC -2 -2 -2 -2 -2 -2 -2 -1 0 -2 -1 0 -2 0 -1 1 1 1 -1 -1 1 1 1 1 -1 0
JGF 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.9979 0.0000 0.0000 1.0000 0.0000 0.0000 0.0000 0.9998 0.9999 1.0000 0.4472 0.0000 0.0000 1.0000 1.0000 0.9999 0.0000 0.0000
• 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
二、二元离散选择模型
1、原始模型
• 对于二元选择问题,可以建立如下计量经济学模 型。其中Y为观测值为1和0的决策被解释变量;X 为解释变量,包括选择对象所具有的属性和选择 主体所具有的属性。
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i
i
i
q i f (q i X i ) Xi F (q i X i ) i 1
n i 1
n
n
• 在样本数据的支持下,如果知道概率分布函数 和概率密度函数,求解该方程组,可以得到模 型参数估计量。
三、二元Probit离散选择模型及其参数 估计
1、标准正态分布的概率分布函数
F (t )
t
(2 )
12
exp( x 2 2)dx
f ( x) (2 )
(完整版)第八章 虚拟变量回归 答案
第八章 虚拟变量回归一、判断题1。
虚拟变量只能作为解释变量.(F)2。
引入虚拟变量后,用普通最小二乘法得到的估计量仍是无偏的。
( T )3.引入虚拟变量的个数与模型有无截距项无关.(F )4。
虚拟变量用来表示某些具有若干属性的变量.(T)5。
引入虚拟变量的个数与样本容量大小有关。
(F )二、单项选择题1.设消费函数011t t t y a a D b x u =+++,其中虚拟变量10D ⎧=⎨⎩东中部西部,如果统计检验表明10a =成立,则东中部的消费函数与西部的消费函数是( D ).A. 相互平行的 B 。
相互垂直的 C. 相互交叉的 D 。
相互重叠的2.虚拟变量( A )A 。
主要来代表质的因素,但在有些情况下可以用来代表数量因素B 。
只能代表质的因素C 。
只能代表数量因素D.只能代表季节影响因素3。
分段线性回归模型的几何图形是( D )A 。
平行线 B. 垂直线 C 。
光滑曲线 D. 折线4.如果一个回归模型中(包含截距项),对一个具有m 个特征的质的因素要引入虚拟变量数目为( B ).A.m B 。
m-1 C 。
m —2 D.m+15.设某商品需求模型为01t t t y b b x u =++,其中Y 是商品的需求量,X 是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题为( D )。
A .异方差性B .序列相关C .不完全的多重共线性D .完全的多重共线性6.设消费函数为i i i 33i 22i 11o i u bx D D D y +++++=αααα,其中y 为消费,x 为收入,虚拟变量⎩⎨⎧=⎩⎨⎧=⎩⎨⎧=其他季度第三季度,其他季度第二季度,其他季度第一季度 0 0 0 321D 1D 1D 1,该模型中包含了几个定性影响因素?( A )。
A 。
1B 。
2C 。
3D 。
47。
设消费函数为i i i o i u Dx b x b D y ++++=101αα,其中虚拟变量⎩⎨⎧=农村家庭城镇家庭 0 1D ,当统计检验表明下列哪项成立时,表示城镇家庭与农村家庭有一样的消费行为( A ).A 。
模型中的特殊解释变量
Yt = + 0 Xt + 1 Yt-1 + …+ m Yt-m+ ut
可以用OLS法估计参数,为有偏、一致估计量。最大滞后阶数由AIC、SC 准则决定。
(3)自回归分布滞后模型
D2
1, (第2季度) 0,(其他季度)
D3
10,,((其第他3季季度度))D4
10,,((其第他4季季度度))DT10, ,119999m 810m ~~1219090m724m4
8.4 虚拟变量
例3:香港季节GDP数据(千亿港元)的拟合(file:dummy6)
得估计结果如下:
GDP
t
=
1.1573+0.0668t+0.0775D2+0.2098D3+0.2349D4+1.8338DT-
销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下:
1,(第四季度)
1,(第三季度)
D1 0,(其他季度) D2 0,(其他季度)
1,(第二季度) D3 0,(其他季度)
8.4 虚拟变量 例8.4
(第2版第224页) (第3版第192页)
以时间 t 为解释变量(1982年1季度取t = 1)的煤销售量(Yi)模型估计结 果如下:
由于定性变量通常表示的是某种特征的有和无,所
以量化方法可采用取值为1或0。这种变量称作虚拟
变量(dummy variable),用D表示。虚拟变量应
用于模型中,对其回归系数的估计与检验方法和定
量变量相同。
(第2版教材第218页) (第3版教材第187页)
第8章虚拟变量模型-精品文档
当第i种属性类型出现时,第i个虚拟变量取1,其它 虚拟变量皆取0,而当所有 D i 都取0时,则表示出现第 m种属性类型。
例:虚拟变量反映季节变动的影响
已知冷饮的销售量 Y除受 k种定量变量 Xk 的影响 外,还受春、夏、秋、冬四季变化的影响,要考 察该四季的影响,只需引入三个虚拟变量即可:
1 春季 D 1t 0 其他
Y i 和居民可支配收入 X i 之间的
各自在住房消费支出
D1i = 0 为农村,则模型为
Y = + X + D + u 2 ) i 0 1 i 1 1 i(
(模型有截距,“居民属性”定性变量只有两个相互排斥
的属性状态( m 2 ),故只设定一个虚拟变量。)
Y i 上的差异,设
二、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
每一定性变量所需的虚拟变量个数要比该定性变 i 量的类别数少1,即如果定性变量有 m个类型,只在 i 模型中引入m-1个虚拟变量 。
每个虚拟变量定义为:
1 第 i个属性 类型 ( i 1 , 2 , , m 1 ) D i 0 非第 i个属性类型
D1i = 1 为城镇;
虚拟变量陷阱
若对两个相互排斥的属性 “居民属性” ,仍然 引入 m 2 个虚拟变量,则有
1城 镇 居 民 D 1 i= 0 农 村 居 民
1农 村 居 民 D 2 i= 0 城 镇 居 民
则模型(1)为 Y X D D u ( 3 ) i 0 1 i 1 1 2 2 i 则对任一家庭都有: , D D+ D1=0 1 +D 2 =1 1 2 即产生完全共线,陷入了“虚拟变量陷阱”。 “虚拟变量陷阱”的实质是:完全多重共线性。
离散选择模型分析
(4-4)
两元选择模型和多元选择模型
离散因变量是指因变量只有有限多个类别或有限多种取值。当 因变量只有两个类别或两种取值时,这种离散因变量的模型称为两 元选择模型(如例4-1)。 而当因变量有两个以上类别或两种以上取 值时,相应的离散因变量模型称为多元选择模型(例4-3)。
两元选择模型
对于两元选择模型,因变量 y i 的取值记为1或0,于是
本章讨论离散因变量模型和截取回归模型。
第二节 离散因变量模型
前二章讨论的回归模型,因变量都是连续变量,如产量、收入 和价格等。但在许多的实际问题中,所研究的因变量是离散的,或 是非数值型。对于这一类因变量,古典的回归分析方法已不完全适 用。
例 4—1
一家公司的人事部门研究高级人才是否接受招聘与招聘条件(如
于是1??最大似然估计themethodofmaximumlikelihoodiiyiniyinnxxyyyyyypl??????????????1122111????nn415probit模型的似然函数而对数似然函数1ln1lnln11????iiiiiixyxyl??????????lln?011ln11????????????????iniiiiiniiiixxxyxxxyl?????????ml??420421最大似然估计是使l或达到最大的值即满足如下的似然方程组牛顿法newtonsmethod??????????????????????????????????????????kkllllllh????????????lnlnlnlnlnln1211201202102002???417由于probit模型为非线性从而似然方程4021只能用迭代法求解
2 ln L
0
0
2 ln L
计量经济学第八章分布滞后模型
根据实际问题的特点、实际经验给各滞后变 量指定权数,滞后变量按权数线性组合,构成新 的变量。权数据的类型有:
•递减型: 即认为权数是递减的, X 的近期值对 Y 的 影响较远期值大。 如消费函数中,收入的近期值对消费的影 响作用显然大于远期值的影响。 例如:滞后期为 3的一组权数可取值如下: 1/2, 1/4, 1/6, 1/8
1.
滞后效应与与产生滞后效应的原因
因变量受到自身或另一解释变量的前几期值 影响的现象称为滞后效应。 表示前几期值的变量称为滞后变量。 如:消费函数 通常认为,本期的消费除了受本期的收入影 响之外,还受前1期,或前2期收入的影响: Ct=0+1Yt+2Yt-1+3Yt-2+t Yt-1,Yt-2为滞后变量。
该模型可用OLS法估计。假如参数估计结果为:
ˆ0
=0.5
ˆ 1 =0.8
则原模型的估计结果为:
0 .8 0 .8 Yˆ t 0 . 5 Xt X 2 4
t 1
0 .8 6
X
t2
0 .8 8
X
t3
0 .5 0 .4 X t 0 .2 X
t 1
0 . 133 X
①在解释变量x之后必须指定k和m的值,d为可选项, 不指定时取默认值0;1强制b0趋于0;2强制bk趋于0; 3强制两端趋于0。
②如果有多个具有滞后效应的解释变量,则分别用几 个PDL项表示;例如: LS Y C PDL(x1,4,2) PDL(x2,3,2,2) ③在估计分布滞后模型之前,最好使用互相关分析命 令CROSS初步判断滞后期的长度k; 命令格式为: CROSS Y X 接着输入滞后期 p 之后,将输出 yt 与 xt , xt-1…xt-p的各期相关系数,以判断较为合适的滞后 期长度k。 例 表给出了中国电力基本建设投资X与发电 量Y的相关资料,拟建立一多项式分布滞后模型 来考察两者的关系。
第八章 模型中的特殊解释变量
一、随机解释变量 二、滞后变量问题 三、虚拟变量问题 四、时间变量
第一节
随机解释变量问题
一、估计量的渐近特征
1.渐进无偏性(P202) 所谓渐进分布是指,当样本容量N→∞时, 随机变量序列将收敛到某个特定的分布。 所谓渐进无偏性是指,如果当N→∞时, 参数估计量的数学期望值将趋向于总体参数 的真实值。这时,将参数估计量称为总体参 数的渐近无偏估计。
第三节 虚拟变量
一、虚拟变量的基本含义 许多经济变量(定量变量)是可以定量度量 的,如:商品需求量、价格、收入、产量等; 但是,经济中有一些影响经济变量的因素无 法定量度量(定性变量),如:职业、性别对收 入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等等。 为了在模型中能够反映这些因素的影响,并 提高模型的精度,需要将它们“量化”,这种 “量化”通常是通过引入“虚拟变量”来完成的。
一元回归中,工具变量法估计量为
1
~ z ( x ) z z x z x
i 1 i i i i 1 i i i
i
两边取概率极限得:
P lim(1 ) 1
~
P lim 1 n zi i P lim 1 n z i xi
如果工具变量Z选取恰当,即有
根据定性变量的属性类型,构造只取“0”或 “1”的人工变量,这些人工变量通常称为虚拟变量 (dummy variables),记为D。 • 例如,反映文程度的虚拟变量可取为: • 1, 本科学历 • D= • 0, 非本科学历 一般地,在虚拟变量的设置中: • 基础类型、肯定类型取值为1;
• 比较类型、否定类型取值为0。
四、工具变量法
模型中出现随机解释变量且它(们) 与随机误差项相关时,OLS估计量是有偏的。 此时,为了得到参数的无偏估计量,最常 用的估计方法是工具变量法(Instrument variables)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第8章模型中的特殊解释变量
习题
一、单项选择题
1.对于一个含有截距项的计量经济模型,若某定性因素有m个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为( B )
A. m
B. m-1
C. m+1
D. m-k
2.在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。
例如,研究中国城镇居民消费函数时。
1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X的回归关系明显不同。
现以1991年为转折时期,设虚拟变
量,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。
则城镇居民线性消费函数的理论方程可以写作( D)
A. B.
C. D.
3.对于有限分布滞后模型
在一定条件下,参数可近似用一个关于的阿尔蒙多项式表示(),其中多项式的阶数m必须满足(A)
A. B. C.
D.
4.对于有限分布滞后模型,解释变量的滞后长度每增加一期,可利用的样本数据就会( B )
A. 增加1个
B. 减少1个
C. 增加2个
D. 减少2个
5.经济变量的时间序列数据大多存在序列相关性,在分布滞后模型中,这种序列相关性就转化为( B )
A.异方差问题 B. 多重共线性问题
C.序列相关性问题 D. 设定误差问题
6.将一年四个季度对因变量的影响引入到模型中(含截距项),则需要引入虚拟变量的个数为( B)
A. 4
B. 3
C.
2 D. 1
7.若想考察某两个地区的平均消费水平是否存在显著差异,则下列那个模型比
较适合(Y代表消费支出;X代表可支配收入;D
2、D
3
表示虚拟变量)(D)
A. B.
C. D.
二、多项选择题
1.以下变量中可以作为解释变量的有(ABCD )
A. 外生变量
B. 滞后内生变量
C. 虚拟变量
D. 前定变量
E. 内生变量
2.关于衣着消费支出模型为:,其中
Y i 为衣着方面的年度支出;X
i
为收入,
则关于模型中的参数下列说法正确的是(ABE )
A.表示在保持其他条件不变时,女性比男性在衣着消费支出方面多支出(或少支出)差额
B.表示在保持其他条件不变时,大学毕业及以上比其他学历者在衣着消费支出方面多支出(或少支出)差额
C.表示在保持其他条件不变时,女性大学及以上文凭者比男性大学以下文凭者在衣着消费支出方面多支出(或少支出)差额
D. 表示在保持其他条件不变时,女性比男性大学以下文凭者在衣着消费支出方面多支出(或少支出)差额
E. 表示性别和学历两种属性变量对衣着消费支出的交互影响
三、判断题
1.通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与样本容量大小有关。
F
2.虚拟变量的取值只能取0或1。
F
3.通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。
F
四、问答题
1.Sen和Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型(括号内的数值为对应参数估计值t值):
其中:X是以美元计的人均收入;Y是以年计的期望寿命。
Sen和Srivastava 认为人均收入的临界值为1097美元(),若人均收入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。
(1)解释这些计算结果。
(2)回归方程中引入的原因是什么?如何解释这个回归解释变量?
(3)如何对贫穷国进行回归?又如何对富国进行回归?
2.当模型中出现随机解释变量时,最小二乘估计量具有什么特征
习题答案
一、单项选择题
1.B 2.D 3.A 4.B 5.B 6.B 7.D
二、多项选择题
1.ABCDE 2.ABCE
三、判断题
1.错误。
引入虚拟变量的个数与样本容量大小无关,与变量属性,模型有无截距项有关。
2.错误。
虚拟变量的取值是人为设定的,也可以取其它值。
3.错误。
模型有截距项时,如果被考察的定性因素有m个相互排斥属性,则模型中引入m-1个虚拟变量,否则会陷入“虚拟变量陷阱”;模型无截距项时,若被考察的定性因素有m个相互排斥属性,可以引入m个虚拟变量,这时不会出现多重共线性。
四、问答题
1.答:(1)由,也就是说,人均收入每增加2.7183倍,平均意义上各国的期望寿命会增加9.39岁。
若当为富国时,,则平均意义上,富国的人均收入每增加2.7183倍,其期望寿命就会减少3.36岁,但其截距项的水平会增加23.52,达到21.12的水平。
但从统计检验结果看,对数人均收入lnX 对期望寿命Y的影响并不显著。
方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。
(2)若代表富国,则引入的原因是想从截距和斜率两个方面考证富国的影响,其中,富国的截距为,斜率为
,因此,当富国的人均收入每增加2.7183倍,其期望寿命会增加6.03岁。
(3)对于贫穷国,设定,则引入的虚拟解释变量的形式为;对于富国,回归模型形式不变。
2.答:(1)当随机解释变量X与随机项u时相互独立的时候,最小二乘估计量仍然是无偏的。
(2)如果随机解释变量X与随机项u既不独立也不相关时,最小二乘估计量是有偏的,但是一致估计量。
(3)如果随机解释变量X与随机项u具有高度的相关关系,最小二乘估计量是有偏的,非一致的。