计量经济学-设定误差与测量误差
计量经济学 考试要点整理
ˆ i y) 2 ei2 ( yi y) 2 ( y
在通过分析可知,回归平方差越大,残差平方和越小,回归直线与样本点拟 合程度越高,而我们要检验总体的线性是否显著,先看一下
ˆi y ) 2 ( y ei2
的比
值,如果其比值越大,则解释变量 X 对被解释变量 Y 的解释程度越高,可推测
计量经济学的概念
2 计量经济学的研究方法:(1)模型设定。
选择变量和数学关系式.(2)估计参数。
确定变量间的数量关系。
(3)模型检验。
检验所得结论的可靠性。
(4)模型应用。
作经济分析和经济预测3 为什么要对参数作估计一般说参数是未知的,又是不可直接观测的。
由于随机项的存在,参数也不可能通过变量值去精确计算。
只能通过变量样本观测值选择适当方法去估计4 内生变量:其数值由模型所决定的变量,是模型求解的结果。
一些变量是由模型体现的经济体系本身所决定的,在模型中是随机变量。
5 经济变量:不同时间、不同空间的表现不同,取值不同,是可以观测的因素。
是模型的研究对象或影响因素6 经济参数:表现经济变量相互依存程度的、决定经济结构和特征的、相对稳定的因素,通常不能直接观测7 应用的数据类型:时间序列数据、截面数据、面板数据、虚拟变量数据8 经济模型:是对实际经济现象或过程的一种数学模拟,是对复杂经济现象的简化与抽象9 参数估计方法:(1)单一方程模型。
最常用的是普通最小二乘法、极大使然估计法。
(2)联立方程模型。
二段、三段最小二乘法10 回归函数:应变量Y的条件期望 E(Y|X)随解释变量X的的变化而有规律的变化,如果把Y的条件期望E(Y|X)表现为X的某种函数12 随机扰动项:各个Y值与条件均值E(Y|X)的偏差u代表排除在模型以外的所有因素对Y 的影响13 样本回归函数:如果把应变量Y的样本条件均值表示为解释变量X的某种函数14 参数估计值的统计性质:无偏性、最小方差性、渐近性质15 拟合优度:样本回归线是对样本数据的一种拟合,不同估计方法可拟合出不同的回归线,拟合的回归线与样本观测值总有偏离。
样本回归线对样本观测数据拟合的优劣程度16 可决系数:在总变差分解基础上确定的,模型解释了的变差在总变差中的比重。
作用.:可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,模型拟合优度越好。
反之可决系数小,说明模型对样本观测值的拟合程度越差。
第九章 模型设定误差 《计量经济学》PPT课件
n
(ei ei1)2
d i2 n
ei2
i 1
(9.3.2)
3. 给定显著性水平,查DW表,若统计量显示为正
自相关,则拒绝原假设,首先考虑存在模型设定
误差。
• 例9.1 我们来看一个教学例子。表9.1给出了一个 总成本(Y)和产出(X)的数据,现在来建立总成 本函数模型
• 对于模型一,DW=2.7002,n=10,k′=3,给定显著
性水平5%,查表得临界值为dL=0.525和dU=2.016。 DW落在[4-dU,4-dL]=[1.984,3.475]区域,表明残 差中不存在显著的正相关。从而可以判断模型没
有遗漏的变量。
(三)拉姆齐的RESET检验
拉姆齐(Ramsey)于1969年提出了回归设定误 差检验(regression specification error test, RESET),它是一般性设定误差检验(test for general mis-specification)。
(一)残差图示法
进行OLS回归,得到残差序列ei,并做其与时间t 或某解释变量X的散点图,从图形上来考察残差序 列ei是否有规律地变动,以此来判断模型是否有遗 漏变量或函数形式设定的错误。
(二)DW检验
确定模型存在遗漏有关变量(非纯自相关)还是 模型真的存在自相关(纯自相关)。
假如真实模型为:
Yi 1 2 X 2i 3 X3i ui(9.2.1)
RESET检验的具体步骤:
1. 对所选模型
u)
(9.2.14)
从而,在满足经典假定条件下
计量经济学复习
解释变量:解释变量也称自变量,是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
被解释变量:被解释变量也称因变量或应变量,是作为研究对象的变量。
它的变动是由解释变量作出解释的,表现为议程所描述的因果关系的果。
时间序列:是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。
随机扰动项:各个被解释变量实际值YI与条件期望E的偏差,代表排除在模型以外的所有因素对Y的影响,称为随机扰动项。
拟合优度:样本回归线对样本观测数据拟合的优劣程度称为样本回归线的拟合优度。
残差:所谓残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。
内生变量:一些变量是由模型体现的经济体系本身所决定的,在模型中是随机变量,称为内生变量。
外生变量:一些变量是在模型体现的经济体系之外给定的,在模型中是非随机的,称为外生变量。
前定变量:在模型中滞后内生变量或更大范围的内生变量的作用视为外生变量,并与外生变量一起称为前定变量。
多重共线性:指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
异方差性:是指模型中随机误差项的方差不是常量,而且它的变化与解释变量的变动有关。
自相关:是指总体回归模型的随机误差项之间存在相关关系。
即不同观测点上的误差项彼此相关。
滞后变量:是指过去时期的、对当前被解释变量产生影响的变量。
可分为滞后解释变量和滞后被解释变量两类。
虚拟变量:计量经济学中,将取值为0和1的人工变量称为虚拟变量。
单位根:设n 是正整数,当一个数的n 次乘方等于1 时,称此数为n 次“单位根”。
单位根检验:检验序列的非平稳性就变为检验特征方程是否有单位根,这就是单位根检验法。
单整:经过一次差分后变为平稳的序列称为一阶单整序列。
协整:所谓协整,是指多个非平稳变量的某种线性组合是平稳的。
滞后期:滞后期就是说,事件发生后对后面要发生事件持续影响的时间。
计量经济学-第13章 模型设定和诊断检验
(13.2.7)所表明的是,研究者没有使用真正的Yi和Xi,却用
了含有测量误差的替代变量Yi*和Xi*。
11
5、对随机误差项ui不正确的设定 (Specification errors to the stochastic error )
如果真实的、正确的模型是:
Yi Xiui
并且lnui满足CLRM的假定
就很困难。
表现出数据的协调性;即从模型中估计的残差必须完全随机
(从技术上而言必须是白噪音)。
模型有一定的包容性;即模型应该包容或包括所有与之竞争
的模型。
6
§13.2 设定误差的类型
1、漏掉一个有关变量(1.Omitting A Relevant Variable)
为了简明起见,令这个模型为:
因此,(13.2.2)中的误差项u2i事实上是:
u2i
u1i
4
X
3 i
8
2、包含了一个无需或无关的变量 (Including an unnecessary or irrelevant variable)
假定另一个研究者使用了以下模型:
Yi
1
2 X i
3
X
2 i
4
X
3 i
或近似地为 例如,若 c = 15,k = 5,α = 5%, 由(13.4.3),真实的显著性水平为 (15/5)(5%) = 15%
(13.4.2) (13.4.3)
28
在实践中,多数研究者都仅报告其“最终”回归结 果,而不透露此前是如何通过大量数据开采或预检验而 得到这些结果的详情。
——这与个人升迁有关!
( E(ˆ3) 2
计量经济学重点
计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。
计量经济学-名词解释及简答
一、名词解释第一章1、计量经济学:计量经济学是以经济理论和经济数据的事实为依据,运用数学、统计学的方法,借助计算机为辅助工具,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
2、虚拟变量数据:虚拟变量数据是人为构造的,通常取值为1或0的,用来表征政策等定性事实的数据。
3、计量经济学检验:计量经济学检验主要是检验模型是否符合计量经济方法的基本假定。
4、政策评价:政策评价是利用计量经济模型对各种可供选择的政策方案的实施后果进行模拟测算,从而对各种政策方案做出评价第二章1、回归平方和:回归平方和用ESS 表示,是被解释变量的样本估计值与其平均值的离差平方和。
2、拟和优度检验:拟和优度检验指检验模型对样本观测值的拟合程度,用2R 表示,该值越接近1,模型对样本观测值拟合得越好。
3、相关关系:当一个或若干个变量X 取一定数值时,与之相对应的另一个变量Y 的值虽然不确定,但却按某种规律在一定范围内变化,变量之间的这种关系,称为不确定性的统计关系或相关关系,可表示为Y=f(X ,u),其中u 为随机变量。
4、高斯-马尔科夫定理:在古典假定条件下,O LS 估计式是其总体参数的最佳线性无偏估计式。
第三章1、偏回归系数:在多元线性回归模型中,回归系数j (j=1,2,……,k )表示的是当控制其他解释变量不变的条件下,第j 个解释变量的单位变动对被解释变量平均值的影响,这样的回归系数称为偏回归系数。
2、多重可决系数:“回归平方和”与“总离差平方和”的比值,用2R 表示。
3、修正的可决系数:用自由度修正多重可决系数2R 中的残差平方和与回归平方和。
4、回归方程的显著性检验(F 检验):对模型中被解释变量与所有解释变量之间的线性关系在总体上是否显著做出推断。
5、回归参数的显著性检验(t 检验):当其他解释变量不变时,某个回归系数对应的解释变量是否对被解释变量有显著影响做出推断。
6、无多重共线性假定:假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关,在此条件下,解释变量观测值矩阵X 列满秩Rank(X)=k ,此时,方阵X`X 满秩, Rank(X`X)=k从而X`X 可逆,(X`X) 存在。
庞皓《计量经济学》(第4版)章节题库-第9章 设定误差与测量误差【圣才出品】
2 / 13
圣才电子书
严重的影响。
十万种考研考证电子书、题库视频学习平 台
(1)如果模型中遗漏变量,需要分成两种情况讨论:①遗漏变量与模型中的解释变
量相关。这种情况是最常见的,此时参数的估计是有偏且不一致的,并且参数估计也不满
圣才电子书
十万种考研考证电子书、题库视频学习平 台
第 9 章 设定误差与测量误差
一、选择题 1.若真实模型是解释变量为 X1 的一元线性回归模型,但在建模时将与 X1 无关的变量 X2 包含在模型中,则斜率参数的最小二乘估计量( )。 A.仍具有无偏性、一致性和最小方差性 B.不具有无偏性、一致性和最小方差性 C.仍具有无偏性、一致性,但不具有最小方差性 D.不具有无偏性、一致性,但仍具有最小方差性 【答案】C 【解析】在包含无关变量的模型中,最小二乘估计量是无偏且一致的,随机干扰项的 方差也能被正确估计,但 OLS 估计量不具有最小方差性。该类错误的后果通常体现为,包 含无关变量的偏误主要表现为“错误”模型的普通最小二乘估计量的方差一般会大于“正 确”模型相应参数估计量的方差。
程的自由度降低,从而扰动项的方差估计变小,模型中参数的标准误增大,从而影响参数
的假设检验,置信区间的计算。
都很严重。
3.“好的”经济计量模型有哪些性质? 答:一个好的模型应具备以下条件: (1)模型应尽可能简洁; (2)模型中系数的估计值应唯一; (3)对样本数据的拟合程度较好; (4)模型中估计系数的符号同相关经济理论相符; (5)具有良好的预测力。
料限制等问题,忽略某些重要变量而造成的模型设定偏误。
b.误选无关变量:在回归模型引入了一些无关紧要的自变量,从而造成模型设定偏
计量经济学复习重点
计量经济学复习重点第一章1. 计量经济学的性质计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究的主体(出发点、归宿、核心):经济现象及数量变化规律研究的工具(手段):模型数学和统计方法方法手段要服从研究对象的本质特征(与数学不同),方法是为经济问题服务计量经济研究的三个方面理论:即说明所研究对象经济行为的经济理论(计量经济研究的基础)数据:对所研究对象经济行为观测所得到的信息(计量经济研究的原料或依据)方法:模型的方法与估计、检验、分析的方法(计量经济研究的工具与手段2. 计量经济学与相关学科的联系与区别联系:●计量经济学研究的主体—经济现象和经济系的数量规律●计量经济学必须以经济学提供的理论原则和经济运行规律为依据●经济计量分析的结果:对经济理论确定的原则加以验证、充实、完善区别:●经济理论重在定性分析,并不对经济关系提供数量上的具体度量●计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容3. 学习计量经济学的必要性4. 计量经济学研究的基本思路和步骤模型设定(选择变量和数学关系式)、估计参数(确定变量间的数量关系)、模型检验(检验所得结论的可靠性)、模型应用(作经济分析和经济预测)5. 模型的设定、参数估计、模型检验的要求模型设定要求●要有科学的理论依据●选择适当的数学形式(单一方程、联立方程线性形式、非线性形式)●模型要兼顾真实性和实用性●包含随机误差项●方程中的变量要具有可观测性参数估计要求参数的估计值:所估计参数的具体数值参数的估计式:估计参数数值的公式6. 模型中的变量及其类型从变量的因果关系区分:被解释变量(应变量)——要分析研究的变量解释变量(自变量)—说明应变量变动主要原因的变量(非主要原因归入随机误差项)从变量的性质区分内生变量—其数值由模型所决定的变量,是模型求解的结果外生变量—其数值由模型以外决定的变量(相关概念:前定内生变量、前定变量)注意:外生变量数值的变化能够影响内生变量的变化,内生变量却不能反过来影响外生变量7. 计量经济研究中数据的类型时间数列数据(同一空间、不同时间)、截面数据(同一时间、不同空间)、混合数据(面板数据 Panel Data)、虚拟变量数据8. 参数估计的方法类型单一方程模型最常用的是普通最小二乘法、极大似然估计法等联立方程模型常用二段最小二乘法和三段最小二乘法等9. 建立计量经济模型的依据第二章1、变量间的关系:函数关系——相关关系相关系数——对变量间线性相关程度的度量◆相关关系的类型●从涉及的变量数量看简单相关、多重相关(复相关)●从变量相关关系的表现形式看线性相关——散布图接近一条直线、非线性相关——散布图接近一条曲线●从变量相关关系变化的方向看正相关——变量同方向变化,同增同减、负相关——变量反方向变化,一增一减不相关2、现代意义的回归:一个被解释变量对若干个解释变量依存关系的研究实质:由固定的解释变量去估计被解释变量的平均值3、总体回归函数(PRF):将总体被解释变量Y的条件均值表现为解释变量X 的某种函数样本回归函数(SRF):将被解释变量Y 的样本条件均值表示为解释变量X 的某种函数。
计量经济学(重要名词解释)
——名词解释将因变量与一组解释变量和未观测到的扰动联系起来的方程,方程中未知的总体参数决定了各解释变量在其他条件不变下的效应。
与经济分析不同,在进行计量经济分析之前,要明确变量之间的函数形式。
经验分析(Empirical Analysis):在规范的计量分析中,用数据检验理论、估计关系式或评价政策有效性的研究。
确定遗漏变量、测量误差、联立性或其他某种模型误设所导致的可能偏误的过程线性概率模型(LPM)(Linear Probability Model, LPM):响应概率对参数为线性的二值响应模型。
没有一个模型可以通过对参数施加限制条件而被表示成另一个模型的特例的两个(或更多)模型。
有限分布滞后(FDL)模型(Finite Distributed Lag (FDL) Model):允许一个或多个解释变量对因变量有滞后效应的动态模型。
布罗施-戈弗雷检验(Breusch-Godfrey Test):渐近正确的AR(p)序列相关检验,以AR(1)最为流行;该检验考虑到滞后因变量和其他不是严格外生的回归元。
布罗施-帕甘检验(Breusch-Pagan Test)/(BP Test):将OLS 残差的平方对模型中的解释变量做回归的异方差性检验。
若一个模型正确,则另一个非嵌套模型得到的拟合值在该模型是不显著的。
因此,这是相对于非嵌套对立假设而对一个模型的检验。
在模型中包含对立模型的拟合值,并使用对拟合值的t 检验来实现。
回归误差设定检验(RESET)(Regression Specification Error Test, RESET):在多元回归模型中,检验函数形式的一般性方法。
它是对原OLS 估计拟合值的平方、三次方以及可能更高次幂的联合显著性的F 检验。
怀特检验(White Test):异方差的一种检验方法,涉及到做OLS 残差的平方对OLS 拟合值和拟合值的平方的回归。
这种检验方法的最一般的形式是,将OLS 残差的平方对解释变量、解释变量的平方和解释变量之间所有非多余的交互项进行回归。
计量经济学复习资料——概念和问答
计量经济学复习资料——概念和问答计量经济学复习资料⼀、基本概念1、计量经济学以经济理论为指导,以事实为依据,以数学和统计推断为⽅法,以电脑技术为⼯具,以建⽴经济计量模型为⼿段,定量分析研究具有随机性特征的经济变量关系的经济学科。
2、相关关系当⼀个或⼏个相互联系的变量取⼀定的数值时,与之相对应的另⼀变量的值虽然不确定,但它仍按某种规律在⼀定的范围内变化。
3、因果关系⼀个变量(y)的变化是另⼀个变量(x)的变化所引起的,这两个变量间的关系称为因果关系4、解释变量影响研究对象的变量,它解释了研究对象的变动。
5、被解释变量是作为研究对象的变量,⼜称因变量。
它的变动是由解释变量做出的解释。
6、总体回归线在给定解释变量Xi 条件下因变量Yi 的条件均值或期望的轨迹。
7、总体回归函数:总体回归线所对应的函数E(Y/X i )=f(X i )称为总体回归函数。
总体回归函数(PRF )说明被解释变量Y 的平均状态(总体条件期望)随解释变量X 变化的规律。
8、拟合优度检验:就是检验模型对样本观测值的拟合程度。
(拟合优度检验的⽅法:通过构造⼀个可以表征拟合程度的统计量来实现。
)9、判定系数2r :是告诉⼈们样本回归函数对数据拟合效果的⼀个总度量。
2r 表⽰在Y 的总变异中由回归模型解释的那个部分所占的⽐例或百分⽐。
10、调整后的判定系数:由于增加解释变量个数引起的R 2的增⼤与拟合好坏⽆关,从⽽对2R 所进⾏的调整。
调整的思路是:将残差平⽅和与总离差平⽅和分别除以各⾃的⾃由度,以剔除变量个数对拟合优度的影响:22222211)1(1)1/()/(1Y i i Se k n n R n y k n uR ΛΛΛ--=----=---=∑∑δ 11、置信区间:求两个正数δ和)1,0(,∈αα,使得随机区间),(22δβδβ+-ΛΛ包含真实2β的概率为α-1,如果这样的区间存在,就被称为置信区间。
12、偏回归系数:在多元回归i i i i u X X Y+++=33221βββ中,2β、3β称为偏回归系数。
《计量经济学》第九章 设定误差与测量误差
Y = α1 +α2 X2i +νi i
即设定模型时漏掉了一个相关的解释变量。 即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量 遗漏相关变量( 欠拟合” 这类错误称为遗漏相关变量(“欠拟合”)。
8
2. 无关变量的误选
(Including Irrevelant Variables)
ˆ E (σ v2 ) ≠ σ u2
5. 与方差相关的检验,包括假设检验、区间估计, 与方差相关的检验,包括假设检验、区间估计, 在关于参数的统计显著性方面, 在关于参数的统计显著性方面,都容易导出错误的 结论。 结论。
16
ˆ ˆ 比较α 2 和 β 2 的方差
ˆ ˆ (1) 若 X3与 2相关, 23 ≠ 0,显然,Var (α2 ) ≠ Var β2 X r2
(1)相关变量的遗漏(欠拟合); )相关变量的遗漏(欠拟合); (2)无关变量的误选(过拟合); )无关变量的误选(过拟合); (3)变量数据的测量误差 )
7
1. 相关变量的遗漏
(Omitting Relevant Variables) )
例如,如果“正确” 例如,如果“正确”的模型为
Yi = β1 + β2 X2i + β3 X3i + µi
σ µ2
15
ˆ 相关, ˆ 如果 X 3 与 X 2 相关,显然有 Var(α 2 ) ≠ Var( β 2 )
ˆ 不相关, 如果 X 3与 X 2不相关,也有 Var(α2 ) ≠ Var(β2 ) ˆ
4. 遗漏变量 X 3 ,式中的随机扰动项 v i的方差估计 量将是有偏的, 量将是有偏的,即: ˆ σ v2 = RSSv ( n - 2)
《计量经济学》习题及答案
《计量经济学》习题及答案(解答仅供参考)第一套一、名词解释:1. 计量经济学:计量经济学是经济学的一个分支,它使用数学和统计学的方法,对经济现象进行量化分析,建立经济模型,预测和解释经济行为和现象。
2. 异方差性:在回归分析中,如果误差项的方差随自变量的变化而变化,这种现象称为异方差性。
3. 自相关性:在时间序列分析中,如果一个变量的当前值与它的过去值存在相关性,这种现象称为自相关性。
4. 多重共线性:在多元回归分析中,如果两个或多个自变量之间高度相关,这种现象称为多重共线性。
5. 随机抽样:随机抽样是一种统计抽样方法,每个样本单位都有一定的概率被选入样本,且各个样本单位之间的选择是独立的。
二、填空题:1. 在线性回归模型中,参数估计的常用方法是______最小二乘法______。
2. 如果一个变量的分布是对称的,那么它的偏态系数应该接近于______0______。
3. 在时间序列分析中,______平稳性______是进行预测的前提条件之一。
4. ______工具变量法______是处理内生性问题的一种常用方法。
5. 如果一个经济变量的变化完全由其他经济变量的变化所决定,那么这个变量被称为______外生变量______。
三、单项选择题:1. 下列哪种情况可能导致异方差性?(B)A. 自变量和因变量之间存在非线性关系B. 自变量的某些组合导致误差项的方差增大C. 因变量和误差项之间存在相关性D. 样本容量过小2. 在进行回归分析时,如果发现数据存在多重共线性,以下哪种方法可以解决这个问题?(C)A. 增加样本容量B. 使用非线性模型C. 删除相关性较强的自变量D. 对自变量进行标准化3. 下列哪种情况可能会导致自相关性?(A)A. 时间序列数据中存在滞后效应B. 因变量和某个自变量之间存在非线性关系C. 样本容量过小D. 自变量之间存在多重共线性四、多项选择题:1. 下列哪些是计量经济学的基本假设?(ABCD)A. 线性关系假设B. 零均值假设C. 同方差性假设D. 无自相关性假设E. 正态性假设2. 下列哪些是处理内生性问题的方法?(ACD)A. 工具变量法B. 加权最小二乘法C. 两阶段最小二乘法D. 广义矩估计法E.岭回归法五、判断题:1. 在进行回归分析时,如果自变量和因变量之间不存在线性关系,那么回归结果将没有任何意义。
经济计量学简答
一、经典现行回归模型必须满足的5个假定:1随机误差的均值为零。
2所有随机误差都有相同的方差。
3任意两个随机误差互不相关,也就是这两个误差的协方差为零。
4解释变量X是确定变量,与随机误差不相关。
5对回归参数进行统计检验时,还需假定服从正态分布。
二、样本回归直线的四个特点:1样本回归直线必然通过点(X横,Y横)。
2、Y唉尖的平均值与Y唉的平均值相等。
3残差e哎的平均值为零。
4残差e唉与解释变量X唉不相关。
三、在经典线性回归模型的假定满足的条件下,最小二乘法估计量具有三个优良特性,1无偏性。
2线性特性。
3方差最小。
四、当线性回归模型的随机误差项存在异方差时,使用普通最小二乘法,将会有:1模型参数的估计虽然是无偏的,但却不是有效的。
2参数估计量的估计方差是有偏的,这将导致参数的假设检验也是非有效的。
五、当线性回归模型中随机误差项存在一阶自相关时,使用普通最小二乘法,将会有:1回归系数B贝塔的估计仍是无偏的。
2估计量贝塔尖的方差可能大于也可能小于经典假设之下估计量贝塔尖的方差,从而使对回归系数贝塔的经典假设检验方法失败。
六、对于一个特定的样本,这种非完全性的多重共线性可能产生的后果主要有以下几个方面:1各个解释变量对被解释变量的影响很难精确鉴别。
2由于存在多重共线时,模型回归系数估计量的方差会很大,这将使得进行显著性检验时认为回归系数的值与零无显著差异。
3模型参数的估计量对删除或增添少量的观测值以及删除一个不显著的解释变量都可能非常敏感。
七、各种方法检测多重共线性的区别:简单相关系数检测法和方差膨胀因子检测法都是从度量解释变量之间的相关程度来检测多重共线性的,判定系数增量贡献法则是从解释变量与被解释变量的相关程度来检测多重共线性的。
八、多重共线性问题的处理:1追加样本信息,2使用非样本先验信息,3进行变量形式的转换,4使用有偏估计。
九、设定误差是指狭义的设定误差。
主要有以下几种:1所设定的模型中遗漏了某个或某些与被解释变量有关的解释变量,2所设定的模型中包括了若干与被解释变量无关的某个或某些解释变量,3回归方程的模型形式设定有误。
第四章 设定误差(20140422)讲解
第四章模型的设定误差我们已经知道OLS方法是计量经济学的重要估计工具,是回归模型参数估计的核心方法。
该方法经常用于对大量数据集的分析,因为它是在对方程做出最简单的一组假定条件下推导出来的。
并且,由此得到的参数估计不仅具有令人满意的统计性质,还能得到一系列统计分布,这为进一步的统计推断建立了基础。
但是,上述所做的一切,即建立的样本回归模型距离真实的理论模型相差多远?包括变量和模型的函数形式。
对这一类问题的分析就是模型的设定误差分析。
本章主要内容:1、设定误差的概念。
2、设定误差的表现类型。
变量引起的设定误差——遗漏变量、多余变量3、测量误差——解释变量具有测量误差、被解释变量具有测量误差、解释变量和被解释变量均具有测量误差。
4、设定误差的检验。
内容可参见教材,庞皓,计量经济学,科学出版社,2005年,第九章。
第一节设定误差概述一、什么是设定误差一个计量经济模型能否正确地描述和解释经济现象(被解释变量)与影响因素(解释变量)之间存在的真实的客观关系,被称为模型的设定问题。
计量经济模型是对变量间经济关系因果性的设想,若所设定的回归模型是“正确”的,主要任务是对所选模型的参数进行估计和假设检验。
但是如果对计量模型的各种诊断或检验总不能令人满意,这时应把注意力集中到模型的设定方面。
考虑如下问题:所建模型是否遗漏了重要的变量?是否包含了多余的变量?所选模型的函数形式是否正确?随机扰动项的设定是否合理?被解释变量和解释变量的数据收集是否有误差(测量误差)?所有这些,在计量经济学中被统称为设定误差。
在设定模型时包括以下内容,模型中解释变量的构成、模型的函数形式以及随机扰动项的若干假定等。
如果关于这些内容的设定与客观实际(真实模型)不一致,利用计量经济模型来描述经济变量的关系时,就会产生误差,我们把这种误差称为设定误差。
二、设定误差的类型从误差来源看,设定误差主要包括 1、变量的设定误差包括遗漏相关变量(欠拟合),误选无关变量(过拟合)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
设正确的模型为:
Yi 1 2 X 2i 3i X 3i ui
正确模型离差形式为:
yi 2 x2i 2 x3i (ui - u )
15
却对方程 Yi 1 2 X 2i i 进行回归,得: 取期望
计量经济学
第 九 章 设定误差与测量误差
1
引子:简单一定胜于复杂吗?
西方国家盛行奥卡姆剃刀(Occam`s razor)原则,威廉修士称原理为“如 无必要,勿增实体”(意思是“简单优于复杂”的节约性原则)。这一原 理最常见的形式是:如果你有两个原理,它们都能解释观测到的事实, 那么你应该使用简单的那个,直到发现更多的证据。(经济原理、吝啬 定律、朴素原则)。经济模型永远无法完全把握现实,在建立模型中一 定的抽象和简化是不可避免的。 在研究进口与国内生产总值的关系时,考虑到时间趋势,建立并估计了 以下模型
对模型的设定是计量经济研究的重要环节。 前面各章除了对随机扰动项 ui 分布的基本假定以 外,还强调:
假定设定的模型对变量和函数形式的设定是
正确地描述被解释变量与解释变量之间的真实关
系,假定模型中的变量没有测量误差。
但是在实际的建模实践中,对模型的设定不一定
能够完全满足这样的要求,从而会使模型出现设
10
1. 相关变量的遗漏
(Omitting Relevant Variables)
例如,如果“正确”的模型为
Yi 1 2 X 2i 3 X 3i i
而我们将模型设定为
Yi 1 2 X 2i i
即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量(“欠拟合”)。
ˆ ) Var( ˆ 2 ); Var( 2
若这两个等式成立,意味着尽管变量 X 3,在理 论上分析是有关的变量,但从所选模型中略去 似乎也不会导致什么危害。这种认识实际也不 正确。
22
因为
2 ˆ v2 ˆ RSSv n - 2 RSSu n -3 u ˆ ˆ ˆ2 ) ˆ 2 ) Var( 是Var( 2 2 2 2 x x x x 2i 2i 2i 2i
7
• 经济学家多年来对真理的寻求曾给人一种 感觉:经济学家们就好像在一间黑房子里 搜寻一只原本并不存在的黑猫,而计量经 济学家还声称找到了一只。
8
一、设定误差及类型
计量经济模型是对变量间经济关系因果性的设想, 若所设定的回归模型是“正确”的,主要任务是所 选模型参数的估计和假设检验。但是如果对计量模 型的各种诊断或检验总不能令人满意,这时应把注 意力集中到模型的设定方面: 考虑所建模型是否遗漏了重要的变量? 是否包含了多余的变量? 所选模型的函数形式是否正确? 随机扰动项的设定是否合理? 变量的数据收集是否有误差? 9 所有这些,计量经济学中被统称为设定误差。
30
一、 DW检验
基本思想:
遗漏的相关变量应包含在随机扰动项中,那么回 归所得的残差序列就会呈现单侧的正(负)相关 性,因此可从自相关性的角度检验相关变量的遗 漏。 从遗漏变量的模型看,可以认为遗漏变量模型是 无遗漏变量模型的一个特例:被遗漏变量的系数 为 0。
ˆ 2 2 3
x x x
2i 2 2i
3i
x (u x
2i
3i 2 2i
i 2 2i
-u)
ˆ 2 E 2 3 E
x x x
2i
x (u x
2i
i 2 2i
-u)
16
遗漏变量设定误差的后果
X 3的遗漏将产生如下后果。 由此可以看出,
11
2. 无关变量的误选
(Including Irrevelant Variables)
例如,如果“真实模型”为:
Yi 1 2 X 2i 3 X 3i i
但我们却将模型设定为
Yi 1 2 X 2i 3 X 3i 4 X 4i i
即设定模型时,多选了一个无关解释变量。这类
1
此结论对 ˆ 也成立。
3. 随机误差项的方差的估计仍为无偏估计。 接受错误假设的概率会较高。
ˆ 2 方差增大, 4. 通常的区间估计和假设检验程序依然有效,但
27
遗漏相关变量和误选无关变量的比较
(1)遗漏相关变量 将导致参数估计量和假设检验有偏且不一致; (2)误选无关变量 虽参数估计量具无偏性、一致性,又会损失有效性。 (3)注重检验的无偏性、一致性 宁愿误选无关变量也不愿遗漏相关变量; (4)注重估计量的有效性,宁愿删除相关变量。 通常误选无关变量不如遗漏相关变量的后果严重。 因此,模型的设定实际是对偏误与有效进行权衡,偏爱哪一 方取决于模型的研究目的。权衡和折中可用均方误差准则 (MSE)。
设定误差的类型
从误差来源看,设定误差主要包括: (1)变量的设定误差,包括相关变量的遗漏 (欠拟合)、无关变量的误选(过拟合); (2)变量数据的测量误差; (3)模型函数形式的设定误差; (4)随机扰动项设定误差。 本章主要讨论的两类变量设定误差: (1)相关变量的遗漏(欠拟合); (2)无关变量的误选(过拟合)。
ˆ1 ) 1 E( ˆ1 ) 1 且 p lim(
n
ˆ2 ) 2 E( ˆ2 ) 2 p lim(
n
2. 如果X 3 与 X 不相关,则 2的估计满足无偏性与一致 2
性;但 3. ˆ 2 的方差是 2
(1)
但却估计了 Y α α X α X v (2) 1 2 2 3 3 如果 3 0,则(2)与(1)相同,因此,可将(1)式 视为以 3 0 为约束的(2)式的特殊形式。 采用OLS 法对(2)进行估计,有:
24
ˆ2
x y x -x y x x x - ( x x )
ˆ3 ) 3 0 E(
同理,可证明:
ˆ 2 ) 2 E(
ˆ2 2 p lim
ˆ1 1 p lim
n
ˆ 3 3 0 p lim
n
26
n
ˆ 2 不是有效估计量: 2.
ˆ2 ) Var( 1 v2 2 2 ˆ Var( 2 ) (1- r23 ) u
定误差。
4
第九章 设定误差与测量误差
本章主要讨论:
●设定误差 ●设定误差的检验 ●测量误差
5
第一节 设定误差
本节基本内容:
●设定误差及类型 ●变量设定误差的后果
6
• 不能机械的做应用计量经济学,他需要理 解、直觉和技巧: • …通常我们在驾车通过一座桥梁时,并不 担心其结构的可靠性,因为我们合理的相 信已经有人严格的检查过其工程的原理和 实践。经济学家做模型时也必须这样,否 则的话,就必须奉送一句警告“使用导致 坍塌概不负责。”
ˆ2 RSSv (n 2) RSSu (n 3) ˆu2 ;
因此,有可能:
RSSv (n 2) RSSu (n 3);
21
(2)若X 3与X 2 不相关,有
2 r23 0和 x2i x3i 2 x 2i 0;
似乎分别有: ˆ 2 2 E
IM = -172.42 + 0.271GDP - 949.12T + 160.73T 2 - 10.18T 3
t (-0.177) (5.67) (-2.22) (2.20)
R2 0.991 F 272.95
(-2.74)
DW 1.97
2
有人根据“简单优于复杂”原则,得到以下方程:
19
ˆ) 如果 X 3 与 X 2 相关,显然有 Var( ˆ2 ) Var( 2
ˆ) 如果 X 3与 X 2不相关,也有 Var( ˆ2 ) Var( 2
4. 遗漏变量 X 3 ,式中的随机扰动项 vi的方差估计 量将是有偏的,即:
2 ˆ v RSSv (n - 2)
2 2 ˆv E u
由
由
Y = 1 + 2 X 2 + v
Y = β1 + β2 X 2 + β3 X 3 + u
得
得
v2 ˆ2 ) Var( 2 x2i
ˆ ) Var( 2
x x x (1- x x
2 2i 2 i 3i 2 2i
2
2 3i
)
u2 2 2 x (1r 2i 23 )
错误称为无关变量的误选(“过拟合”)。
12
设定误差的原因
●数据来源渠道可能不畅。例如,数据很难取得被
迫将具有重要的经济意义变量排斥在模型之外。
●不知道变量应当以什么确切的函数形式出现在回
归模型中。
●事先并不知道所研究的实证数据中所隐含的真实
模型究竟是什么。
设定误差在建模中较容易出现。设定误差的存在
可能会对模型形成不良的后果。
13
二、变量设定误差的后果
当模型设定出现误差时,模型估计结果也会与
“实际”有偏误;
偏误的性质与程度与模型设定误差的类型密切相
关。
从实质上看,变量设定误差的主要后果,是一个
或多个解释变量与随机扰动项之间存在着相关性,
进而影响参数估计的统计特性。
14
1. 遗漏相关变量(欠拟合)偏误
28
第二节 设定误差的检验
本节基本内容:
●DW检验 ●拉各朗日乘数检验 ●一般性检验
29
对变量设定误差进行检验必须在经济理论指导下进行,
不可抛弃经济理论而进行假设检验。 对于是否误选无关变量的检验,只要针对无关变量系 数的期望值为零的假设,用t检验或F检验,对无关变 量系数作显著性检验即可。