计量经济学重点
计量经济学重点整理
㈢多重共线性的理论后果:①在古典线性回归模型(CLRM)的假定下,即使存在变量之间的多 重共线性,OLS 估计量仍然是最优线性无偏估计量,即使多元回归方程的一个或多个偏回归系 数是统计不显著的;②多重共线性通常是一个样本特有的现象. ㈣多重共线性的实际后果:①OLS 估计量的方差和标准误较大;②置信区间变宽;③t 值不显 著;④R2 值较高,但 t 值并不都是统计显著的;⑤OLS 估计量及其标准误对数据的微小变化非 常敏感,即它们很不稳定⑥回归系数符号有误;⑦难以评估各个解释变量对回归平方和(ESS)
个数,从 D-W 表中查到临界的 dL 和 dU;⑷根据规则进行判定.
4.内生变量、外生变量、前定变量、滞后变量、虚拟变量 ㈠内生变量:是由模型体现的经济体系本身所决定的,在模型中是随机变量的变量,内生变量 受模型中其它变量的影响,也可能影响其它内生变量,即内生变量既可以是被解释变量,也可 以是解释变量.内生变量受模型内随机误差项的影响,是随机变量. ㈡外生变量:一些变量是在模型体现的经济体系之外给定的,在模型中是非随机的. 由模型系统以外的因素决定其取值的变量,独立于该变量所在方程前期、当期、未来各期随 机误差项的变量.外生变量只影响系统内的其它变量,而不受其它变量的影响,因此在方程中 只能做解释变量,不能做被解释变量.由定义可看出,外生变量不受模型中随机误差项的影响. ㈢前定变量:是指独立于变量所在方程当期和未来各期随机误差项的变量.由定义可知,外生 变量属于前定变量,另外还有一类变量也属于前定变量,即滞后的内生变量,因为滞后的内生 变量仅与方程前期的随机误差项相关而与方程当期、未来各期的随机误差项无关. 前定变量也只能在现期的方程中做解释变量,并且不受随机误差项的影响. ㈣滞后变量:是指过去时期的、对当前被解释变量产生影响的变量.滞后变量分为滞后解释变 量与滞后被解释变量.把滞后变量引入回归模型,这种回归模型称为滞后变量模型. ①滞后的原因:心理上(惯性)/技术上(新旧更替时旧的降价)/制度上. ②滞后变量模型一般形式为下式,s/p 分别为滞后解释变量和滞后被解释变量的滞后期长度。
计量经济学重点
1. 计量经济学是以经济理论为前提,利用数学、数理统计方法与计算技术,根据实际观测资料来研究带有随机影响的经济数量关系和规律的一门学科。
经济理论、数据和统计理论这三者对于真正了解现代经济生活中的数量关系都是必要的,但本身并非是充分条件。
三者结合起来就是力量,这种结合便构成了计量经济学。
经济理论的作用是对经济现象进行分析和解释,描述在一定条件下经济变量之间的相互关系。
体现在计量经济学模型之中。
2. 三大要素的经济理论:经济理论对于计量经济学是建立计量经济模型的依据和出发点。
计量经济学对于经济理论而言是理论到实际的桥梁和检验工具。
观测数据:主要是指统计数据和各种调查数据。
是所考察的经济对象的客观反映和信息载体,是计量经济工作处理的主要现实素材。
经济数据是计量经济分析的材料。
经济数据是经济规律的信息载体。
数据类型有时间序列数据、截面数据、平行数据、虚拟变量数据。
统计理论:是指各种数理统计方法,包括参数的估计,假设检验等内容。
是计量经济的主要数学基础,很多计量经济学方法都是在数理统计的基础上发展起来的。
3. 计量经济模型的应用:结构分析 经济预测 政策评价 检验与发展经济理论4. 回归的含义:回归分析是研究关于一个叫做被解释变量的变量对另一个或多个叫做解释变量的依赖关系。
其用意在于通过后者(在重复抽样中)的已知或被设定值去估计和(或)预测前者的(总体)均值。
回归分析构成计量经济学的方法论基础,主要内容包括:根据样本观察值对经济计量模型参数进行估计,求得回归方程;对回归方程、参数估计值进行显著性检验;利用回归方程进行分析、评价及预测。
回归分析的用途:通过自变量的值来估计应变量的值。
对独立性进行假设检验——根据经济理论建立适当的假设。
通过自变量的值对应变量进行预测。
上述多个目标的综合。
5. 回归关系与确定性关系:回归关系(统计关系):研究的是非确定现象随机变量间的关系。
确定性关系(函数关系):研究的是确定现象非随机变量间的关系。
(完整版)计量经济学重点知识归纳整理
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
计量经济学(重点)
模型: 01i i i Y X u ββ=++ 1.最小二乘法参数估计C245.3522 153.9605 1.593605 0.1241 245.35220.551514i iY X =+ SE=153.9605 0.009135 t=(1.593605) (60.37623)20.993459R = 20.993187R =其中, i X 为解释变量”GDP”,ˆiY 为解释变量”最终消费支出”。
2. 经济意义的 检验所估计的参数1ˆ0.551514β=,说明人均国民收入每增加1元,可导致最终消费支出增加0.551514元。
这与经济学中边际消费倾向的意义相符。
3. 拟合优度检验由上表可以看出,本例中可决系数R 平方为0.993459,说明所建模型整体上对样本数据拟合较好,即解释变量“GDP ”对被解释变量“最终消费支出”的绝大部分变动做出了解释。
4. 回归系数的显著性检验(0.05的显著水平)对回归系数的t 检验:原假设0H :0β=0和0H :1β=0,由表还可以看出,估计的回归系数0ˆβ的标准误差和t 统计值分别为:SE (0ˆβ)=153.9605,t (0ˆβ)=1.593605;1ˆβ的标准误差和t 统计值分别为:SE (1ˆβ)=0.009135,t (1ˆβ)=60.37623取显著性水平α=0.005,查t 分布表得自由度=n-2=24的临界值0.0025(21)t =2.064因为0)ˆ(t β=1.593605<0.0025(21)t =2.064,所以不能拒绝0H :0β=0;因为t (1ˆβ)=60.37623>0.0025(21)t =2.064,所以应拒绝0H :1β=0,这表明GDP 对财政收入有显著影响5回归系数的区间估计(置信水平为95%)即我们以95%概率保证,1ˆβ的置信区间为: 1/2111/21ˆˆˆˆˆˆˆ()()P t SE t SE ααβββββ⎡⎤-<=<=+⎣⎦ 6)2004年Y 期望值的置信区间(预测期2004年X=38000亿元,置信水平为95%)Std. Dev. 9357.245222(2)(262)9357.2452101392816x x n σ∑=-=-⨯=222004()(3800014138.17)569386930.9X X -=-= 给定显著性水平0.05α=,查表得0.025(24) 2.064t =,由于0Y 在00.025(2)ˆn Y t σ-± 即2004ˆY 的95%预测区间为[]20052.31121,22353.43438。
计量经济学重点内容
计量经济学第一章use 打开数据 describe 查看数据集情况 summary 描述统计tabstat +[stats] 计算描述性统计量(指定)table+[contents] 类别变量+连续变量列联表 table/ tabulate 类别变量频次表 histogram 直方图第二章一元回归线性模型:基本思想∑∑∑∑--==2222Xn X Y X n Y X xy x b ii i iiiX b Y b 21-=第三章 第四章 一元、多元线性回归模型:假设检验 随机扰动项、参数的方差、标准误计算sort 排序 order 排序drop 去除记录 keep 保留记录generate 生产新变量 replace 给变量赋新值 rename 给变量重命名统计检验1模型的拟合优度检验:R2判定系数(可决系数)调整的可决系数:范围在0和1之间,越接近1,说明模型具有较高的拟合优度2方程的显著性检验:F 统计量,prob (F )F >F(k-1,n-k),拒绝原假设H0,即显著。
F<F(k-1,n-k),则暂时不拒绝,不显著。
显著性概率为0,小于给定显著性水平(0.05),表明模型对总体拟合显著 3变量的显著性检验:T 统计量 (服从n-2,n-k ),p 值Β2一般为0,T>2.306为显著,T<2.306为不显著(5%水平) 线性回归模型的基本假设:假设1:模型具有线性性(针对模型)。
Y 是参数βi 的线性组合,不一定要求是变量X 的线性组合。
假设2 :解释变量X 与u 不相关(针对扰动项)。
数学表达:cov(Xi,ui)=0通常说法:X 具有外生性 假设3:给定X ,扰动项的期望或均值为零(针对扰动项)。
数学表达:,i=1,2, …,n 假设4:同方差假定(针对扰动项)。
数学表达:Var (ui) = σμ2 = Var (Yi) i=1,2, …,n. 假设5:无自相关(针对扰动项)。
计量经济学重点
计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。
计量经济学重点
1.截面数据,时间序列,面板数据定义。
2.截面数据:同一时间(时期或时点)某个指标在不同空间的观测数据。
时间序列数据:把反映某一总体特征的同一指标的数据,按照一定的时间顺序和时间间隔(如月度.季度.年度)排列起来,这样的统计数据称为时间序列数据。
时间序列数据可以是时期数据,也可以是时点数据。
面板数据:指时间序列数据和截面数据相结合的数据。
如在具名手指调查中收集的对各个固定调查户在不同时期的调查数据。
3.有限分布滞后模型定义被解释变量受解释变量的影响分布在解释变量不同时期的滞后值上,即模型形如具有这种滞后分布结构的模型称为分布滞后模型,其中 s 为滞后长度。
根据滞后长度 s取为有限和无限,模型分别称为有限分布滞后模型和无限分布滞后模型。
4.设定误差定义考虑所建模型是否遗漏了重要的变量?是否包含了多余的变量?所选模型的函数形式是否正确?随机扰动项的设定是否合理?变量的数据收集是否有误差?所有这些,计量经济学中被统称为设定误差。
5.时间序列平稳性阶数判定所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。
6.t,F检验统计量表达式ESS(-1)~F(-1,)RSS(-)kF k n-kn k=7.OLS参数估计的统计学性质(1)线性特征;(2)无偏特征;(3)最小方差特性*222^^22ˆˆ~(2)ˆˆ()()t t nSE SEβββββ-==-二 名词解释:1.最小二乘法:又称最小平方法,指根据使估计的剩余平方和最小的原则确定样本回归函数的方法。
2. 多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型成为多元线性回归模型,多元指多个变量3. 偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1个单位对解释变量带来的平均影响程度。
4、调整的多元可决系数 :又称多元判定系数,是一个用于描述伴随模型中解释变量的增加和多个解释变量对被解释变量的联合影响程度的量。
计量经济学知识点(超全版)
1.经济变量:经济变量是用来描述经济因素数量水平的指标。
(3分)2.解释变量:是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
(2分)它对因变量的变动做出解释,表现为方程所描述的因果关系中的“因”。
(1分)3.被解释变量:是作为研究对象的变量。
(1分)它的变动是由解释变量做出解释的,表现为方程所描述的因果关系的果。
(2分)4.内生变量:是由模型系统内部因素所决定的变量,(2分)表现为具有一定概率分布的随机变量,是模型求解的结果。
(1分)5.外生变量:是由模型系统之外的因素决定的变量,表现为非随机变量。
(2分)它影响模型中的内生变量,其数值在模型求解之前就已经确定。
(1分)6.滞后变量:是滞后内生变量和滞后外生变量的合称,(1分)前期的内生变量称为滞后内生变量;(1分)前期的外生变量称为滞后外生变量。
(1分)7.前定变量:通常将外生变量和滞后变量合称为前定变量,(1分)即是在模型求解以前已经确定或需要确定的变量。
(2分)8.控制变量:在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量,(2分)它一般属于外生变量。
(1分)9.计量经济模型:为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型,(2分)是以数学形式对客观经济现象所作的描述和概括。
(1分)10.函数关系:如果一个变量y的取值可以通过另一个变量或另一组变量以某种形式惟一地、精确地确定,则y与这个变量或这组变量之间的关系就是函数关系。
(3分)11.相关关系:如果一个变量y的取值受另一个变量或另一组变量的影响,但并不由它们惟一确定,则y与这个变量或这组变量之间的关系就是相关关系。
(3分)12.最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数的方法,称为最小二乘法。
(3分)13.高斯-马尔可夫定理:在古典假定条件下,OLS估计量是模型参数的最佳线性无偏估计量,这一结论即是高斯-马尔可夫定理。
计量经济学整理重点
一、名词解释53分=15分斜体表明仅供参考计量经济学:以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科;最小二乘法:指在满足古典假设的条件下,用使估计的剩余平方和最小的原则确定样本回归函数的方法,简称OLS随机扰动项:总体回归函数中,各个Y值与条件期望的Y值的偏差,又称随机误差项;是代表那些对Y有影响但又未纳入模型的诸多因素的影响;总体回归函数:在给定解释变量Xi 条件下,总体被解释变量Yi的期望轨迹,函数式表示为EYi∣Xi=fXi=β0+β1Xi样本回归函数:在总体中抽取若干个样本构成新的总体,然后在新的总体下,给定解释变量Xi,被解释变量Yi 的期望轨迹,函数式表示为EYi∣Xi=Yi^= β^+β1^Xi系数显着性检验:t检验对回归系数对应的解释变量是否对被解释变量有显着影响的统计学检验方法方程显着性检验:F检验对模型的被解释变量与所有解释变量之间的线性关系在整体上是否显着的统计学检验方法高斯-马尔可夫定理:在古典假设的条件下,OLS估计量是总体参数的最佳线性无偏估计量,即BULE;拟合优度:为说明多元线性回归模型中对观测值的拟合情况,可以考察在Y的总变差中能由解释变量所解释的那部分变差的比重,即回归平方和与总体平方和的比值,R2=ESS/TSS=1-RSS/TSS.调整的可决系数:是一个用于描述多个解释变量对被解释变量的联合影响程度的统计量,相对可决系数而言,克服了随解释变量的增加而变大的缺陷;表达式为R—2=1-n-1RSS/n-kTSS多重共线性:指解释变量之间存在的完全或近似的线性关系异方差:模型中随机误差项不再满足经典假设的同方差假定,其方差随观测个体的变化而变化,即Dεi =σi2加权最小二乘法:在拟合存在异方差的模型中,对不同的σi 2区别对待重小轻大原则,构造权数Wi=1/σi2,根据最小二乘原理,使加权的残差平方和最小,从而估计参数,这种求解参数估计式的方法为加权最小二乘法;自相关:又称序列相关,是指在总体回归模型的随机误差项ui 之间存在相关关系就,即covui,uj≠0.i≠j判断题101分=10分1、随机误差项ui 与残差项ei是一回事; 乂2、总体回归函数给出了对应于每一个自变量的因变量的值; 乂3、线性回归模型意味着因变量是自变量的线性函数;乂4、在线性回归模型中,解释变量是原因,被解释变量是结果; √5、在实际中,一元回归没什么用,因为因变量的行为不可能仅由一个解释变量来解释;乂6、尽管有完全的多重共线性,OLS估计量仍然是最优线性无偏估计量;乂7、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显着性是不可能的;乂8、如果有某一辅助回归显示出高的2iR值,则高度共线性的存在是肯定无疑的了; √9、变量的两两高度相关并不表示高度多重共线性; 乂10、如果分析的目的仅仅是预测,则多重共线性是无害的; √11、在多元回归中,根据通常的t检验,每个参数都是统计上不显着的,你就不会得到一个高的2R值;乂12、变量不存在两两高度相关表示不存在高度多重共线性; 乂13、当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性; 乂14、当异方差出现时,常用的t检验和F检验失效; √15、在异方差情况下,通常OLS估计一定高估了估计量的标准差; 乂16、如果OLS回归的残差表现出系统性,则说明数据中有异方差性; √17、如果回归模型遗漏一个重要的变量,则OLS残差必定表现出明显的趋势; √18、在异方差情况下,通常预测失效; √19、当模型存在高阶自相关时,可用D-W 法进行自相关检验; 乂20、当模型的解释变量包括内生变量的滞后变量时,D-W 检验就不适用了; √21、DW 值在0和4之间,数值越小说明正相关程度越大,数值越大说明负相关程度越大;√22、假设模型存在一阶自相关,其他条件均满足,则仍用OLS 法估计未知参数,得到的估计量是无偏的,不再是有效的,显着性检验失效,预测失效; √23、当存在自相关时,OLS 估计量是有偏的,而且也是无效的; 乂 24、消除自相关的一阶差换变换假定自相关系数必须等于-1; 乂25、发现模型中存在误差自相关时,都可以利用差分法来消除自相关; √26、在自回归模型中,由于某些解释变量是被解释变量的滞后变量,如t t t t u y x y +++=-1321βββ 那么杜宾—沃森D —W 检验法不适用; √27、在杜宾—沃森D —W 检验法中,我们假定误差项的方差是同方差; √28、模型t t t u x y ++=21ββ中的2R 与t t t t t v x x y y +-=---)(121β中的2R 不可以直接进行比较; √ 三、汉译英15分 1、Autocorrelation also known asserial correlation, is theof awith itself, in linear regression analysis, if the errors are serially dependent => autocorrelation/serial correlation Likely causes: 1. Omit variable that ought to be included. 2. Misspecification of the functional form. This is most obvious where a straight line is put through a curve of dots. This would clearly show up in plots of residuals. 3. Errors of measurement in the dependent variable. If the errors are not random then the error term will pick up any systematic mistakes. The Problem :OLS is not the best estimation method.is unbiased, consistent, inefficient It will underestimate the true variance. So the t values will look too good, will reject H0 when it is trueTests :1. Plot the residuals over time or against a particular variable and see if there is a . Durbin Watson Statistic:Solutions :increase number of observations specify correctly GLS1、自相关又称序列相关,在线性回归分析中,如果随机误差是连续相关的,自相关是μ1,μ2,…,μn 序列自身的相关; 产生原因:1.忽略了遗漏变量2.函数形式的设定偏误;例如,将本应该是曲线的模型设定为线性曲线的模型,这将会在残差图中明确地表现出来;3.相关变量的处理错误;如果误差不是随机的,那么将会产生系统误差;后果:普通最小二乘法OLS 不是最好的估计方法无偏的,一致的,无效的 它将低估参数估计值的真实方差,从而过高估计t 统计量的值,当H 0为真时,拒绝H 0;检验:1.按照时间顺序或者一个特定的变量绘制回归残差项的图形并且观察是否逐次有规律地变化;检验法解决方法:增大样本容量 准确定义 GLS 广义的最小二乘法回归 2、The econometrics literature focuses on use of the bootstrap in hypothesis testing,which relies on approximation of probabilities in the tails of the distributions of statistics. Other applications are to confidence intervals, estimation of standard errors, and bias education. The bootstrap is straightforward to implement for smooth √N -consistent estimators based on iid samples, though bootstraps with asymptotic refinements are underutilized. Caution is needed in other settings, including non-smooth estimators such as the median, nonparametric estimators, and inference for data that are not iid.计量经济学文献侧重于假设检验中的自举估计方法的使用,它依赖于检验统计量尾部概率分布的近似值;其他的应用是对置信区间,标准误差估计和偏差的评判;通常统计量不是渐进充分的,但对于独立同分布的自举样本,且统计量是光滑√N 一致统计量时,自举估计量较容易实现;,对于样本不是独立同分布或者统计量是非光滑估计量和非参数估计量等其它情形,自举推断较复杂; 3、The Durbin –Watsontest has become so venerable that practitioners often forget the assumptions underlying the test. In particular, the assumptions that 1 the explanatory variables are non-stochastic; 2 the error term follows the normal distribution;3 the regression models do not include the lagged values of the regressand; and 4 only the first-order serial correlation is taken into account are very important for the application of the DW test. It should also be added that a significant DW statistic may not necessarily indicate autocorrelation. Rather, it may be an indication of omission of relevant variables from the model.注:venerable 珍贵的,神圣的;regressand 回归元,在计量经济学中常指被解释变量;normal distribution 正态分布;the first-order serial correlation 一阶自相关;DW检验如此高大上以至于检验人员经常忘记相关的假设检验,特别是,如下假设1被解释变量是非随机的2误差项遵循正态分布3回归模型不包括解释变量的滞后值4在应用DW检验最重要的一点是只考虑一阶自相关;同样应该注意的是,一个重要的DW统计量可能不一定表明自相关关系,而是这个序列模型遗漏了相关变量的一个迹象而已;四、简答题4~5个共20分1、回归分析与相关分析的区别与联系联系:回归分析与相关分析都是研究变量间的统计学课题;回归分析是在相关分析和因果分析的基础上,去研究解释变量对被解释变量的影响,相关分析中相关系数的确定是建立在回归分析的基础上的,二者互相补充、相辅相成;2、经典假设的内容是什么零均值假定;同方差假定;无自相关假定;随机扰动项与解释变量不相关;正态性假定;3、影响随机误差项的主要因素有哪些模型设定误差;变量的观测误差;经济变量的内在随机性;影响因素数据无法取得4、产生多重共线性的背景判断方法处理方法对模型的主要影响产生背景:经济变量之间有共同变化的趋势;模型中包含滞后变量;利用截面数据建立模型;样本数据自身的问题;判断方法:简单相关系数法、方差膨胀因子法、条件系数法、经验法、逐步回归检测法处理方法:增大样本数、剔除变量、岭回归完全多种共线性对模型的影响:参数的估计值不确定;参数估计值的方差无限大;严重多重共线性对模型的影响:参数估计的方差和协方差增大;参数估计的置信区间趋于变大;假设检验容易作出错误的判断;可能造成可决系数R^2较高,F检验的显着性很高,但t检验却可能不显着;5、异方差的影响检测手段补救措施影响:对估计参数的统计特性的影响有参数的OLS估计仍然具有无偏性但是其方差不再是最小的;古典假设下的假设检验即t、F检验不再成立;检测手段:图示法、Glejser检验、Goldfeld-Quanadt检验、White检验、ARGH检验;补救措施:加权最小二乘法、模型对数变换、对模型变换;怀特检验White检验的步骤了解120~121、加权最小二乘法的思想;6、自相关的后果同异方差对估计参数的统计特性的影响有参数的OLS估计仍然具有无偏性但是其方差不再是最小的;古典假设下的假设检验即t、F检验不再成立标准误被低估,t值高估7、DW检验的步骤、五个区域及其应用条件步骤:构建原假设H0:ρ=0;构建统计量DW≈21-ρ^;查DW分布表,得到相应DL和DU;判定模型自相关状态;五个区域:0≤DW≤DL 正相关;DL<DW≤DU不确定;DU<DW<4-DU无自相关;4-DU ≤DW<4-DL不能判定;4-DL≤DW≤4应用条件:解释变量X为非随机的;随机误差项为一阶自回归形式;线性模型的解释变量中不包含滞后的被解释变量;只适用于有常数项的回归模型;数据序列无缺失项;8、在回归模型中,如果模型的随机干扰项无自相关,但是我们错误的判定模型中有一阶自相关,并使用了广义差分模型,将会产生什么后果五、计算分析题2个30分;计算、软件输出结果的分析1、一元线性回归中相关参数估计,比如参数如何求得;R2的相关问题;t、F统计量的表达;标准误的计算;2、Eviews 案例输出结果的解释,主要就是F 值,t 值,R 2值,回归模型式,残差能否反映自相关或者异方差问题类似这些;多重共线性、异方差、自相关的判断 六、证明题一个10分第二章1、OLS 回归线的性质证明 见课本29~30页 1样本回归线通过样本均值2i i i n Y Y Y∧∧-的均值等于实际值Y 的均值3剩余项i e 的均值为零,由最小二乘准则知 4被解释变量i Y ∧与剩余项e i 不相关i ,iY e r ∧∧=因为2222222222222(y x )(x )(y x )x y x x x 0i i i i i i i i i i iiiy e y βββββββ∧∧∧∧∧∧∧∧∧∑=∑-=∑-=∑-∑=∑-∑=, 所以 i ,iY e r ∧=05解释变量i X 与剩余项e i 不相关X ,i i e X r ==由OLS 正规方程式有12()0i i i i i Y X X X e ββ∧∧∑--=∑=,所以 X ,i i e r =02、OLS 估计量的线性、无偏性、有效性的证明 见课本32~34页1线性: 2无偏性: 3有效性。
(完整版)计量经济学重点知识归纳整理
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
计量经济学重点内容
第一章导论计量经济学定义:计量经济学(Econometrics)是一门应用数学、统计学和经济理论来分析、估计和检验经济现象与理论的科学。
通过使用统计数据和经济模型,计量经济学试图量化经济关系,以更好地理解经济变量之间的相互作用。
研究的问题(相关关系):计量经济学的目的是研究经济变量之间的关系,例如:1. 消费与收入的关系。
2. 教育与工资的关系。
3. 利率与投资的关系。
第二章 OLS (普通最小二乘法):OLS 是一种用于估计线性回归模型中未知参数的方法。
它通过最小化误差平方和来找到回归线。
在一元线性回归中,我们通常使用普通最小二乘法(OLS)来估计模型参数。
对于模型 Y = α + βX + ε,我们可以使用以下公式来计算α和β:β= Σ( (X - mean(X)) (Y - mean(Y)) ) / Σ( (X - mean(X))^2 ) α̂ = mean(Y) - β̂ * mean(X)这里,mea n(X) 是 X 变量的平均值(即ΣX/n),mean(Y) 是 Y 变量的平均值(即ΣY/n)。
在这些公式中,mean 表示求平均值。
Σ 表示对所有数据点求和,n 是样本大小。
这里α_hat 是截距的估计值,β_hat 是斜率的估计值。
结论及推论:1. 在高斯马尔可夫假设下,OLS 估计量是最佳线性无偏估计量(BLUE)。
2. 当误差项的方差是常数时,OLS 估计量是有效的。
3. 如果模型是正确规范的,并且误差项是独立且同分布的,那么 OLS 估计量是一致的。
4. 如果误差项与解释变量相关,或者存在遗漏变量,那么 OLS 估计量可能是有偏的。
5. OLS 提供了估计的标准误差、t 统计量和其他统计量,这些可以用于进行假设检验和构建置信区间。
第三章一元回归:(1)总函、样函:总函数和样本函数是线性回归模型的两种表现形式。
总函数(总体函数)表示整体样本的关系,一般形式为Y = β0 + β1X + ε。
计量经济学复习重点
1、经济变量:用来描述经济因素数量水平的指标。
2、解释变量:用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
它对因变量的变额为发热所引5动做出解释。
3、被解释变量:是作为研究对象的变量。
它的变动是由解释变量做出解释的4、控制变量:在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量。
5、计量经济模型:为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型。
6、相关关系:如果一个变量y 的取值受另一个变量或另一组变量的影响,但并不由它们惟一确定,则y 与这个变量或这组变量之间的关系就是相关关系。
7、最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数的方法。
8、拟合优度:样本回归直线与样本观测数据之间的拟合程度。
9、残差:样本回归方程的拟合值与观测值的误差。
10、显著性检验:利用样本结果,来证实一个虚拟假设的真伪的一种检验程序。
11、偏相关系数:在Y 、X 1、X 2三个变量中,当X 1 既定时,表示Y 与X 2之间相关关系的指标。
12、异方差性:在线性回归模型中,如果随机误差项的方差不是常数,即对不同的解释变量观测值彼此不同,则称随机项U1具有异方差性。
13、序列相关性:对于模型01122i i k ki i y x x x i ββββμ=+++++… 1,2,,i n =…随机误差项互相独立的基本假设表现为(,)0i j Cov μμ= ,,1,2,,i j i j n ≠=…(1分)如果出现 (,)0i j Cov μμ≠ ,,1,2,,i j i j n ≠=…即对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在某种相关性,则认为出现了序列相关性。
14、自回归模型:t t t y y μρ+=-115、广义最小二乘法:是最有普遍意义的最小二乘法,普通最小二乘法和加权最小二乘法是它的特例。
16、相关系数:度量变量之间相关程度的一个系数,一般用ρ表示。
计量经济学重点
1.计量经济学重点2. 三大要素的经济理论:经济理论关于计量经济学是建立计量经济模型的依据和动身点。
计量经济学关于经济理论而言是理论到实际的桥梁和检验工具。
观测数据:要紧是指统计数据和各种调查数据。
是所考察的经济对象的客观反映和信息载体,是计量经济工作处理的要紧现实素材。
经济数据是计量经济分析的材料。
经济数据是经济规律的信息载体。
数据类型有时刻序列数据、截面数据、平行数据、虚拟变量数据。
统计理论:是指各种数理统计方法,包括参数的估量,假设检验等内容。
是计量经济的要紧数学基础,专门多计量经济学方法差不多上在数理统计的基础上进展起来的。
3. 计量经济模型的应用:结构分析 经济推测 政策评判 检验与进展经济理论4. 回来的含义:回来分析是研究关于一个叫做被说明变量的变量对另一个或多个叫做说明变量的依靠关系。
其用意在于通过后者(在重复抽样中)的已知或被设定值去估量和(或)推测前者的(总体)均值。
回来分析构成计量经济学的方法论基础,要紧内容包括:依照样本观看值对经济计量模型参数进行估量,求得回来方程;对回来方程、参数估量值进行显著性检验;利用回来方程进行分析、评判及推测。
回来分析的用途:通过自变量的值来估量应变量的值。
对独立性进行假设检验——依照经济理论建立适当的假设。
通过自变量的值对应变量进行推测。
上述多个目标的综合。
5. 回来关系与确定性关系:回来关系(统计关系):研究的是非确定现象随机变量间的关系。
确定性关系(函数关系):研究的是确定现象非随机变量间的关系。
6. 回来关系与因果关系:回来关系研究一个变量对另一个变量的统计依靠关系,从逻辑上说,统计关系式本身并不意味着任何因果关系。
7. 回来分析与相关分析:回来分析/相关分析研究一个变量对另一个(些)变量的统计依靠关系,但它们并不意味着一定有因果关系。
有相关关系并不意味着一定有因果关系。
相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的。
计量经济学要点
第一章绪论计量经济学是由挪威经济学家、第一届诺贝尔经济学奖得主弗里希提出来的。
定义:计量经济学是统计学、经济学、数学相结合的一门综合性学科,是一门从数量上研究物质资料生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学。
时间序列统计资料:指同一统计指标按时间顺序排列的数据列。
在同一数据列中各个数据统计的对象、范围和时间长度必须一致,是同一口径的,具有可比性。
同对象,不同时间。
横截面统计资料:横截面统计资料指在同一时间、不同单位按同一统计指标排列的数据列。
在同一数据列中各个数据也必须是同一口径的,具有可比性。
与时间序列数据的区别在于,横截面数据统计的对象和范围不同,但必须是同一时间截面上的数据。
计量经济学的目的: 结构分析:指应用计量经济模型对经济变量之间的关系作出定量的度量。
预测未来:指应用已建立的计量经济模型求因变量未来一段时期的预测值。
政策评价:指通过计量经济模型仿真各种政策的执行效果,对不同的政策进行比较和选择。
计量经济学研究问题分为四个阶段:建立模型。
根据所研究的问题与经济理论,找出经济变量间的因果关系及相互间的联系。
估计参数。
模型建立以后,首先收集模型中经济变量的统计资料,再应用相应的计量经济方法,估计模型中的待定系数。
检验模型。
模型的参数估计以后,这些参数是否可靠,是否符合经济理论和要求,要通过以下几个方面对模型进行检验。
1.检验估计参数是否符合经济理论和实际经济问题的要求。
2.用数理统计中关于假设检验的原理,对估计参数进行统计检验,对估计模型进行统计检验,对估计方法的假定条件进行检验。
经济预测。
应用估计出的并经过检验的回归模型预测因变量的未来值。
第二章一元线性回归模型回归分析是处理变量与变量之间关系的一种数学方法。
1.变量之间存在确定的函数关系。
2.变量之间存在着非确定的依赖关系。
随机变量误差因素:(1)回归模型中省略的变量。
(2)人们的随机行为。
(3)建立的数学模型的形式不够完善。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章 绪论计量经济学的含义:一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技术,通过建立计量经济模型,定量的分析经济变量之间的随即因果关系。
计量经济学研究的经济关系具有两个特征:一是随机关系,产出与生产要素投入、消费与收入、投资与收入和利率之间都不是精确的函数关系。
二是因果关系,计量经济模型中的每一个(随机)方程都是反映某个经济变量与其影响因素之间的因果关系。
计量经济学的研究步骤:建立理论模型、估计模型中的参数、检验估计的模型和应用模型进行定量分析。
1. 建立理论模型其任务是依据经济理论和对所研究经济系统的认识,将系统内各经济变量之间的相互关系用一组(或一个)数学方程表示出来。
这一阶段的工作又称为模型设定。
模型设定一般包括总体设定和个体设定。
总体设定的目标是能正确反映经济系统的运行机制。
个体设定的目标是能正确反映经济变量之间的因果关系。
①确定模型中的变量计量经济学中一般将方程中的变量分为两类,方程等号左端的变量称为被解释变量,有端的变量称为解释变量,即用这些变量来解释或说明被解释变量的变化情况(回归分析中称为因变量和自变量)。
建立理论模型时,主要是确定模型中的解释变量,一般时根据经济理论和经验确定被解释变量的主要影响因素。
②确定模型中的函数形式确定模型中的函数形式一般有两种方式,一种方式是根据经济行为理论,运用数理经济学的研究方法推导出模型的具体数学形式。
另一种方式是根据实际统计资料绘制被解释变量和解释变量的相关图,由相关图显示的变量之间的相关关系确定模型的数学形式,这也是目前经常采用的方式。
③确定统计指标并搜集整理数据需要根据模型中变量的含义和统计数据的可得性,模型的研究目的,以及统计数据的可比性和一致性等因素进行综合考虑,以确定适当的统计指标。
建立计量经济模型的统计数据主要有三种类型:时间序列数据,即按时间先后顺序排列的数据,时间频率可以是年、季、月、日等;横截面数据,即某一时点上的数据;合并数据,即时间序列与横截面数据的混合数据。
2.估计模型中的参数建立理论模型之后,需要根据实际统计资料估计出模型中各个参数的具体数值,即得到一个估计的计量经济模型,这样才能定量描述经济变量之间的数量关系。
3.检验估计的模型具体的检验内容包括:①经济检验:主要是检验参数估计值的符号以及数值的大小在经济意义上是否合理。
②统计检验:主要是利用数理统计中的推断统计方法,对估计结果的可靠性进行检验。
一般包括拟合优度检验、模型的显著性检验、解释变量的显著性检验等。
③计量经济检验:主要用于检验模型的计量经济学性质,如回归模型的假设条件检验,模型的识别性检验等。
④预测性能检验:主要检验模型参数估计量的稳定性,以及模型对样本期以外客观事实的近似描述能力(即所谓的超样本特性)。
4.应用模型计量经济模型主要有以下几个方面的用途。
①结构分析:即分析经济变量或结构参数的变动对整个经济系统的影响。
②经济预测:由于计量经济预测是根据事物变化的原因进行预测即为因果预测,而且预测模型可以同时考虑多个经济变量之间的多种因果关系。
③政策评价:即利用计量经济模型定量分析政策变量变化对经济系统运行的影响。
④实证分析:即利用计量经济模型和实际统计资料实证分析某个理论假说的正确与否。
计量经济研究的四个步骤可以进一步概括成:经济系统 计量经济模型 经济问题广义计量经济学与狭义计量经济学:广义计量经济学是利用经济理论、数学和统计定量研究经济现象的数量经济方法统称,内容包括回归分析、时间序列分析、投入产出分析,等等。
狭义计量经济学就是我们通常定义的计量经济学,主要研究经济变量之间的随机因果关系,采用的数学方法主要是在回归分析基础上发展起来的计量经济方法。
计量经济模型的类型:单方程模型与联立方程模型如果模型系统只包含一个方程,即只研究某一个经济关系,则称该模型为单方程模型。
如果模型系统涉及到多个经济关系而需要构造多个方程,则称该模型为联立方程模型。
随机方程与恒等方程恒等方程中没有随机误差项。
计量经济学主要研究经济变量之间的随机关系,所以单方程模型都是随机方程。
静态模型与动态模型只考虑本期变量之间相互关系的模型为静态模型;如果模型中引入了滞后变量,如前期收入、前期投资、前期利率等,则模型成为动态模型。
第二章 回归模型总体回归直线方程: 称为总体回归方程,常数称为总体回归(或回归系数)。
回归分析的主要任务就是设法求出总体回归参数的具体数值,进而利用总体回归方程描述和分析总体的平均变化规律。
只有了解总体的整个概率分布情况,才能确定总体回归方程。
但是在现实经济生活中,往往无法获取总体的所有资料,只能通过对总体的若干次观察得到总体的一个样本,再依据样本信息来估计总体回归方程。
虽然样本的观察值并没有完全落在总体回归直线上,但样本是从总体中随机抽取的,必然包含总体的信息,散点分布仍然呈现出明显的线性趋势;设法确定一条直线来较好地拟合这些样本观察值,称这条直线为样本回归直线,其对应的方程:称为样本回归方程,分别为总体回归参数的估计。
如果估计误差较小,即的值与总体回归参数比较接近,则可以用样本回归方程来近似的代替总体回归方程,即利用样本回归方程近似地描述总体的平均变化规律。
因此,回归分析的主要内容可以概括成:根据样本观察值确定样本回归方程;检验样本回归方程对总体回归方程的近似程度;利用样本回归方程分析总体的平均变化规律。
随机误差项设定:1. 随机误差项总体回归方程只是反映了总体的平均变化规律,单个家庭的消费支出与平均消费支出之间存在着一定的离差,将这个离差用表示,即:或 其中,是一个不可观测的、可正可负的随机变量,所以称之为随机误差项。
相应的,若样本回归方程为,则实际值与估计值的离差用表示,即: 称为残差(或拟合误差),它可以作为随机误差项的估计。
2. 产生随机误差的原因模型中被忽略因素的影响。
模型函数形式的设定误差。
数据的测量与归并误差和随机因素的影响(如自然灾害等)引入随机误差项后,之间的关系式就表示成以下形式:这就是一元回归模型的一般形式,或称为回归模型的随机设定形式。
以这种形式描述之间的关系有明确的意义:第一,误差的随机性使得之间呈现出一种随机的因果关系,由于经济变量之间大多是不确定的相关关系,因此,用这种形式描述经济关系更加准确、合理。
第二,的取值由两部分组成,一部分是总体的平均值,其 变化由模型中的解释变量来决定,可以称之为“系统内影响”;另一部分是随机误差,主要反映了那些对有影响、但又未能包括到回归模型中的所有因素的综合影响,可以称之为“系统外影响”。
因此,回归模型的随机设定形式更加全面地反映了被解释变量y的变化情况。
古典回归模型的基本假设:1. 解释变量x为非随机变量,即在重复抽样过程中,x取值是可控的、固定的。
2. 零均值假定:,即随机误差项的平均值为零。
在此假定下,才有:回归方程才能反映总体的平均变化趋势,否则将会差生系统误差。
3. 同方差假定:(常数),即各个随机误差项的离散程度(或变动幅度)是相同的。
4. 非自相关协定:,即随机误差项之间是互不相关、互不影响的。
这样可以独立考虑各个水平下随机误差项的影响。
5. 解释变量与随机误差项不相关假定,,即解释变量与随机误差项互不相关,彼此对立的对y产生影响。
在假定1成立的情况下,该假定自动成立。
6. 无多重共线性假定,即解释变量之间不存在完全的线性关系,这样才能分析每个解释变量对y的单独影响。
最小二乘法估计(OLS)1. 选择最佳拟合曲线的标准可以确定为:是总的拟合误差(即总残差)达到最小。
其中最常用的就是普通最小二乘法:所选择的回归模型应该使所有观察值的残差平方和达到最小。
即:2. 由于:是关于的二次函数并且非负,所以存在最小值。
解得:其中:在Eviews软件命令窗口中直接键入CREATE命令,也可以建立工作命令。
命令格式为:CREATE 时间频率类型 起始期 终止期在Eviews软件的命令窗口中,可以直接键入LS命令来估计模型。
命令格式为:LS 被解释变量 C 解释变量3. 最小二乘估计的性质参数估计量的评价标准:无偏性。
设是参数的估计量,如果,则称是的无偏估计。
无偏估计保证了参数估计值是在真实值(简称参数真值)的左右波动,并且“平均位置”就是参数的真值。
有效性(最小方差性)。
设、均为参数的无偏估计量,若,则称比有效;如果在的所以无偏估计中,最小,则称为有效估计量。
有效性衡量了参数估计量与参数真值平均离散程度的大小。
如果估计量是有效估计,则参数估计值不仅在参数真值左右波动,而且波动幅度最小,这样参数估计值就很可能接近于参数真值。
一致性。
这是估计量的一个大样本性质,如果随着样本的增加,估计量越接近于真值,则称是的一致估计。
严格的说,是依概率收敛于,即:其中,为一个任意小的正数。
4. 系数的估计误差与置信区间系数的估计误差估计误差即估计值与真值的偏差,随着抽样的不同,误差大小是一个随机变量,因此考虑概率意义下的平均误差。
由于,平均误差(平方)= 即等于估计量的方差;因为最小二乘法估计是无偏估计,均值即为参数真值,所以估计量关于均值的平均偏差--方差也就反映了估计量与参数真值的平均偏差。
在前面的证明过程中已经得到: 假定由于正态分布的线性组合仍是正态分布,而且分布形式由其均值和方差惟一确定,所以:这样,参数估计量的平均误差为: 其中,涉及到随机误差项的方差,这个值通常不知道,实际计算中一般采用的无偏估计量: 来估计,并且用符合来表示系数的估计误差为:同理的估计误差为:又称为系数的标准误差(或标准差)。
Eviews软件在估计回归模型时,将同时输出系数的估计值和标准差。
需要指出的是,系数的标准差只是反映了估计量和真值的相对偏离程度;越小,则与的近似误差越小,但不能认为与之间的绝对误差就是。
系数的置信区间统计量: 所以对于给定的置信度,由t分布表可以查得临界值,使得:,即:所以系数b的置信区间为: 即以的概率保证回归系数属于该区间的。
显然,置信区间越小,对回归系数的估计精度就越高。
从置信区间的计算公式可以看出,置信区间的长度为,在a取定的情况下,是一个常数,所以置信区间的长度主要取决于系数的标准差,越小,则估计的误差越小,估计值与真值越接近。
因此,称为系数的估计误差,并用它来衡量估计的精度是合理的;而且,在一定的概率下,与的绝对误差充其量不会超过。
5.极大似然估计的原理:既然所抽取的样本是在一次观测中得到的,表明“观察值落在该样本周围”是一个比较容易发生的大概率事件,因此,所选择的参数估计值应该使这一事件的概率达到最大。
最小二乘估计是使模型对样本的拟合达到最优,而极大似然估计却是使样本出现的概率达到最大。
回归模型的统计检验:1. 模型的拟合优度检验所谓“拟合优度”,即模型对样本数据的近似程度。