第5章回归模型的函数形式
05_回归方程的函数形式
b1 ln Y0 , b 2 ln(1 r ) , 并 加 上 随 机 误 差 项 ,
则复利公式变成了对数到线性的半对数模型:
ln(Yt ) b1 b 2 t u t
所以复利增长率 1。 Example 9.4 The growth of the U.S. Population,1970 to 1999 pp258-259
Y / Y Y / Y X b2 ( 是 一 个 b2 ( 是 个 常 数 ) X / X Y X / X
变量)
注:当用 X 和 Y 的样本均值 代 入 时( b2
X ) ,即 为 样 本 期 Y
的平均产弹性。
Y 对 X 的 斜率 判定系 数 R2
b2 ( 常 数 )
X 对 Y 变动的解释比例
两边取以 e 为底的对数得:
ln Yt ln a1 a 2 ln X t u t
设
Yt* ln Yt , X* t ln X t , b1 ln a 1 , b 2 a 2 则 模 型 变 为 : Yt* b1 b 2 X* t u t( 变 换 后 的 模 型 为 线 性 模 型 ,该 模
厦门大学经济学院 胡朝霞
1
当 当 的。
b2 1 时 , 则 称 该 商 品 的 价 格 是 有 弹 性 的 ;
b2 1 时 , 则 称 该 商 品 的 价 格 是 无 ( 缺 乏 ) 弹 性
思 考 : 如 何 检 验 价 格 弹 性 的 特 征 ? (用 t 检 验 ) 由于双对数模型的弹性是一个常数,所以双对数模 型又称为不变弹性模型。 2. 双 对 数 模 型 与 一 般 线 性 模 型 的 比 较 :
r eb 1, 即 等 于 回 归 系 数 的 反 对 数 减
古扎拉蒂-经济计量学习题答案
古扎拉蒂-经济计量学习题答案部分作业答案:(各题只要回答到如下程度就是满分哦)第1章概论一、填空1.近似,散点;2.平均值,平均值第2章线性回归的基础理论一、填空1.因变量Y,解释变量某二、单项选择题1-2AB三、名词解释总体:实验所有可能结果的集合称为总体或样本空间。
样本:也叫样本点,是指总体的某个元素或某种结果。
随机实验:至少有两个可能的结果,但不确定哪一个结果会出现的某个观察或测度过程。
估计量:是指总体参数的估计方法或计算公式。
估计值:估计量的某一具体取值称为估计值。
变量线性:是指因变量的条件均值是解释变量的线性函数。
参数线性:是指因变量的条件均值是参数B的线性函数,而变量之间不一定是线性的。
四、简述1.答:14世纪英国逻辑学家奥卡姆提出简单有效原理,即“如无必要,勿增实体”,亦即“切勿浪费较多东西去做用较少的东西同样可以做好的事情”。
因此,模型应尽量简化,只要不遗漏重要变量即可,即便某些变量对Y有影响,但它们的综合影响如果是有限的,非随机的,都可以不予考虑,即归入u中。
2.答:对双变量回归模型而言,如果总体回归线接近于直线,可用函数表示为E(Y︱某i)=B1+B2某i,其中,B1为截距,B2为斜率,该函数就称为非随机总体回归函数。
它表示在给定某的条件下,Y分布的均值。
对双变量回归模型而言,如果总体回归线接近于直线,回归方程可表示为Yi=B1+B2某i+ui,其中,B1+B2某i表示在给定某的条件下Y分布的均值,ui为随机误差项。
它表示真实的Y值是如何在均值附近波动的。
对双变量回归模型而言,若样本回归线接近于直线,则非随机样本回归函数可表示为=b1+b2某i,其中,Y=总体条件均值E(Y︱某i)的估计量,b1=真实截距B1的估计量,b2=真Yii实斜率B2的估计量。
对双变量回归模型而言,若样本回归线接近于直线,则随机样本回归函数可表示为Yi=b1+b2某i+ei,其中,b1+b2某i表示总体条件均值E(Y︱某i)的估计量,ei表示误差项ui的样本估计量,称为残差。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:OLS的渐近性【圣才出品】
第5章多元回归分析:OLS 的渐近性5.1复习笔记考点一:一致性★★★★1.定理5.1:OLS 的一致性(1)一致性的证明当假定MLR.1~MLR.4成立时,对所有的j=0,1,2,…,k,OLS 估计量∧βj 是βj 的一致估计。
证明过程如下:将y i =β0+β1x i1+u i 代入∧β1的表达式中,便可以得到:()()()()11111111122111111ˆnni ii i i i n ni i i i xx y n x x u xxnxx ββ-==-==--==+--∑∑∑∑根据大数定律可知上式等式右边第二项中的分子和分母分别依概率收敛于总体值Cov (x 1,u)和Var(x 1)。
假定Var(x 1)≠0,因为Cov(x 1,u)=0,利用概率极限的性质可得:plim ∧β1=β1+Cov(x 1,u)/Var(x 1)=β1。
这就说明了OLS 估计量∧βj 具有一致性。
前面的论证表明,如果假定只有零相关,那么OLS 在简单回归情形中就是一致的。
在一般情形中也是这样,可以将这一点表述成一个假定。
即假定MLR.4′(零均值与零相关):对所有的j=1,2,…,k,都有E(u)=0和Cov(x j1,u)=0。
(2)MLR.4′与MLR.4的比较①MLR.4要求解释变量的任何函数都与u 无关,而MLR.4′仅要求每个x j 与u 无关(且u 在总体中均值为0)。
②在MLR.4假定下,有E(y|x 1,x 2,…,x k )=β0+β1x 1+β2x 2+…+βk x k ,可以得到解释变量对y 的平均值或期望值的偏效应;而在假定MLR.4′下,β0+β1x 1+β2x 2+…+βk x k 不一定能够代表总体回归函数,存在x j 的某些非线性函数与误差项相关的可能性。
2.推导OLS 的不一致性当误差项和x 1,x 2,…,x k 中的任何一个相关时,通常会导致所有的OLS 估计量都失去一致性,即使样本量增加也不会改善。
第5章多元线性回归分析1
样本,可表示为
Y 1 1 2 X 2 1 3 X 3 1 ... k X k 1 u 1
Y 2 1 2 X 2 2 3 X 3 2 ... k X k 2 u 2
Y n 1 2 X 2 n 3 X 3 n ... k X k n u n
相关系数,即全部自变量参与回归的总体相
关系数,Rmxi 为去掉xi 的复相关系数。可见
部分相关系数的平方是在总体拟合效果中扣 除了其他变量综合拟合效果之后剩余部分。
15
16
多元线性回归模型
●多元线性回归模型及古典假定 ●多元线性回归模型的估计 ●多元线性回归模型的检验
17
§5.1多元线性回归模型及古典假定
j 个解释变量的单位变动对应变量平均值的影响。
20
多元线性回归
指对各个回归系数而言是“线性”的,对变量则 可是线性的,也可是非线性的 例如:生产函数
YALKu
取自然对数
l n Y ln A l n L l n K l n u
21
多元总体回归函数
Y 的总体条件均值表示为多个解释变量的函数
因为 Xe=0 ,则正规方程为:
XXβˆ =XY
32
OLS估计式
由正规方程 多元回归中 二元回归中
XXβˆ =XY ( X X ) k k 是 满 秩 矩 阵 ,其 逆 存 在
βˆ=(XX)-1XY
ˆ1Y-β ˆ2X2-β ˆ3X3
ˆ2(
yix2 i)( x3 2 i)-( yix3 i)( x2 ix3 i) ( x2 2 i)( x3 2 i)-( x2 ix3 i)2
计量经济学课件 第5章 回归模型的函数形式
• 模型选择的重点不是在判定系数大小,而是要考 虑进入模型的解释变量之间的相关性(即理论基 础)、解释变量系数的预期符号、变量的统计显 著性、以及弹性系数这样的度量工具。
线性回归模型的弹性系数计算
• 平均弹性:
E
Y X
X Y
B2
X Y
多元对数线性回归模型
• 偏弹性系数的含义: 在其他变量(如,X3)保持不变的条件下,X2 每变动1%,被解释变量Y变动的百分比为B2;
• (3)菲利普斯曲线
被解释变量:英国货币工资变化率,解释变量:失业率 结论:失业率上升,工资增长率会下降。 在自然失业率UN上下,工资变动幅度快慢不同。即失业率低于自然失业率时,工 资随失业率单位变化而上升快于失业率高于自然失业率时工资随失业率单位变化而下 降。
(P113例5-6) 倒数模型: 菲利普斯曲线
依据经济理论,失业率上升,工资增长率会下降;且 当失业率处于不同水平时,工资变动率变动的程度会 不一样,即Y对X 的斜率(Y / X)不会是常数。
Y / X 20.588*(1/ X 2 )
R2 0.6594
模型选择:
1、依据经济理论
以及经验判断;
2、辅助于对拟合
R2 0.5153 Y / X 0.79
1、B1、B2、B4 0; 2、B3 0 3、B32 3B2B4
WHY? —所以经济理论的学习对于模型的建立、选择
和检验有非常关键和重要的意义。 24
四、模型(形式)选择的依据
经济理论
工作经验
1、模型的建立需要正确地理论、合适可用的数据、 对各种模型统计性质的完整理解以及经验判断。
模型选择的基本准则:进入模型中的解释变量的关系(即 理论基础)、解释变量系数的预期符号、弹性系数等经济 指标、统计显著性等
第5章回归分析
价格X 5.0 5.2 5.8 6.4 7.0 7.0 8.0 8.3 8.7 9.0 10.0 11 消费量Y 4.0 5.0 3.6 3.8 3.0 3.5 2.9 3.1 2.9 2.2 2.5 2.6
5.2 一元线性回归
15
一元线性回归实例
例: 某种商品与家庭平均消费量的关系(续) 在坐标轴上做出价格与消费量的相关关系。
• 子女的身高与父亲及母亲的身高之间的关系。
• 农田粮食的产量与施肥量之间的关系。 • 商品的销售量与广告费之间的关系。
5.1 回归分析的基本概念
8
回归分析的步骤 • 确定变量。寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响 因素。 • 建立预测模型。依据自变量和因变量的历史统计资料进行计算,在此基础上建立 回归分析预测模型。 • 进行相关分析。作为自变量的因素与作为因变量的预测对象是否有关,相关程度 如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的 问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和 因变量的相关程度。 • 计算预测误差。回归预测模型是否可用于实际预测,取决于对回归预测模型的检 验和对预测误差的计算。 • 确定预测值。利用回归预测模型计算预测值,并对预测值进行综合分析,确定最 后的预测值。
最小二乘法的原理就是,找到一组 aˆ ,bˆ 。使所有点的实际测量值 yi 与预测值 yˆi 的偏差的平方和最小。
残差平方和(Residual Sum of Squares,RSS):
n
n
Q(aˆ,bˆ) (yi -yˆi )2 ( yi - aˆ - bˆxi )2
i=1
i=1
即,找到一组 aˆ ,bˆ 使RSS的值最小。
5、计量经济学【多元线性回归模型】
那么,多元线性样本回归函数 (方程) (3.3) 式的矩阵
表达式为: ˆ0
ˆ1
其中:ˆ
ˆ2
M
ˆk
(
Yˆ
YYˆˆ12 M
Yˆn
k 1)1
Yˆ X ˆ, , , , , , , , , , , , , , , , , , , , , , , (3.7)
该样本回归模型与总体回归模型相对应,其中残差 ei Yi Yˆi 可看成是总体回归模型中随机误差项 i 的 估计值。
2、多元线性回归模型的几种形式: 上述几种形式的矩阵表达式: 将多元线性总体回归模型 (3.1) 式表示的 n 个随机方 程写成方程组的形式,有:
Y1 0 1 X11 2 X 21 L k X k1 1 .Y.2.........0.......1.X...1.2........2.X...2.2. L k X k 2 2 Yn 0 1 X1n 2 X 2n L k X kn n
M
k
(k 1)1
n
n1
2、多元线性回归模型的几种形式:
并且,记
Y
Y1
Y2
为被解释变量的观测值向量;
M
Yn n1
1 X11 X 21 L
记
X 1 M
X12 M
X 22 M
L
1 X1n X 2n L
Xk1
X
k
Yi 0 1X1i 2 X 2i L k X ki i , , , ,i 1, 2,L , n, , , , (3.1)
计量经济学重点
计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。
回归模型的函数形式
图5-2数学S.A.T分数的双对数模型散点图
9-12
5.1 如何度量弹性:双对数模型
数学S.A.T分数函数取对数后的回归过程
9-13
5.1 如何度量弹性:双对数模型
数学S.A.T分数函数取对数后的回归结果
ˆ InYi 4.887712773 0.1258045149InX i se (0.1573)(0.0148) t (31.0740)(8.5095) p (0.0000)(0.0000)
第5章 回归模型的函数形式
Essentials of Econometrics
第5章回归模型的函数形式
本章讨论以下几种形式的回归模型
(1) 双对数线性模型或不变弹性模型 (2) 半对数模型 (3) 倒数模型 (4) 多项式回归模型 (5) 过原点的回归模型,或零截距模型
9-2
5.1 如何度量弹性:双对数模型
ˆ ˆ ˆ B B B 1 2 ˆ Y e L K 3
9-28
5.3 多元对数线性回归模型
例5-2 excel原始数据表
9-29
5.3 多元对数线性回归模型
例5-2 取对数后Eviews数据表
9-30
5.3 多元对数线性回归模型
例5-2 C-D函数Eviews回归过程
9-31
5.3 多元对数线性回归模型
令变量 Yi ln Yi , X ki ln X ki
* *
, B1 LnA 则回归函数可变为:
* Yi* B1 B2 X * B X ui 3 2i 3i
根据解释变量的观测值,进行OLS估计,得到:
ˆ* B ˆ B ˆ X* B ˆ X ˆ* Y 1 2 3 i 2i 3i
5章-一元线性回归模型
t
t
∑ ( x − x )( y − y ) = − x) ∑ (x − x)
t t 2 t
− y)
5.12 案例分析:用回归模型预测木材剩余物 案例分析: 通过这个案例一是掌握怎样利用实际数据建立、分析计量模型并预测 计量模型并预测, 通过这个案例一是掌握怎样利用实际数据建立、分析计量模型并预测, 二是怎样从 怎样从计量经济学专用软件 输出结果中找到这些有关的量。 中找到这些有关的量 二是怎样从计量经济学专用软件 EViews 输出结果中找到这些有关的量。 伊春林区位于黑龙江省东北部。 公顷, 伊春林区位于黑龙江省东北部。全区有森林面积 2 189 732 公顷,木材 蓄积量为 23 246.02 万 m3。 森林覆盖率为 62.5%, , 是我国主要的木材工业基 地之一。1999 年伊春林区木材采伐量为 532 万 m3。按此速度 44 年之后, 地之一。 年之后, 1999 年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规划与方式, 年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规划与方式, 保护森林生态环境。为缓解森林资源危机 并解决部分职工就业问题, 源危机, 保护森林生态环境。为缓解森林资源危机,并解决部分职工就业问题,除 了做好木材的深加工外,还要充分利用木材剩余物(主要是指伐下的树冠) 了做好木材的深加工外,还要充分利用木材剩余物(主要是指伐下的树冠) 生产林业产品,如纸浆、纸袋、纸板等。 生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是 安排木材剩余物加工生产的一个关键环节。下面, 安排木材剩余物加工生产的一个关键环节。下面,利用简单线性回归模型 预测林区每年的木材剩余物。 预测林区每年的木材剩余物。显然引起木材剩余物变化的关键因素是年木 材采伐量。 材采伐量。
《计量经济学》第五章最新完整知识
第五章 多元线性回归模型在第四章中,我们讨论只有一个解释变量影响被解释变量的情况,但在实际生活中,往往是多个解释变量同时影响着被解释变量。
需要我们建立多元线性回归模型。
一、多元线性模型及其假定 多元线性回归模型的一般形式是i iK K i i i x x x y εβββ++++= 2211令列向量x 是变量x k ,k =1,2,的n 个观测值,并用这些数据组成一个n ×K 数据矩阵X ,在多数情况下,X 的第一列假定为一列1,则β1就是模型中的常数项。
最后,令y 是n 个观测值y 1, y 2, …, y n 组成的列向量,现在可将模型写为:εββ++=K K x x y 11构成多元线性回归模型的一组基本假设为 假定1. εβ+=X y我们主要兴趣在于对参数向量β进行估计和推断。
假定2. ,0][][][][21=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n E E E E εεεε 假定3. n I E 2][σεε='假定4. 0]|[=X E ε我们假定X 中不包含ε的任何信息,由于)],|(,[],[X E X Cov X Cov εε= (1)所以假定4暗示着0],[=εX Cov 。
(1)式成立是因为,对于任何的双变量X ,Y ,有E(XY)=E(XE(Y|X)),而且])')|()([(])')((),(EY X Y E EX X E EY Y EX X E Y X Cov --=--=))|(,(X Y E X Cov =这也暗示 βX X y E =]|[假定5 X 是秩为K 的n ×K 随机矩阵 这意味着X 列满秩,X 的各列是线性无关的。
在需要作假设检验和统计推断时,我们总是假定: 假定6 ],0[~2I N σε 二、最小二乘回归 1、最小二乘向量系数采用最小二乘法寻找未知参数β的估计量βˆ,它要求β的估计βˆ满足下面的条件 22min ˆ)ˆ(ββββX y X y S -=-∆ (2)其中()()∑∑==-'-=⎪⎪⎭⎫ ⎝⎛-∆-nj Kj j ij i X y X y x y X y 1212ββββ,min 是对所有的m 维向量β取极小值。
第五章回归模型的函数形式
第五章回归模型的函数形式1.引言回归分析是统计学中一种重要的数据分析方法,用于研究自变量与因变量之间的关系。
在回归分析中,我们需要确定一个合适的函数形式来描述变量之间的关系,这个函数形式即为回归模型的函数形式。
本章将介绍回归模型的函数形式的基本概念和常用的函数形式。
2.线性回归模型线性回归模型是最简单的回归模型之一,其函数形式为:Y=β0+β1X1+β2X2+...+βnXn+ε其中,Y是因变量,Xi是自变量,βi是参数,ε是误差项。
线性回归模型假设自变量与因变量之间的关系是线性的,并且误差项服从正态分布。
3.多项式回归模型多项式回归模型是线性回归模型的一种扩展形式,其函数形式为:Y=β0+β1X+β2X^2+...+βnX^n+ε多项式回归模型允许自变量的幂次大于1,通过引入幂项和交互项,可以更好地拟合非线性关系。
4.对数回归模型对数回归模型是一种特殊的回归模型,其函数形式为:ln(Y) = β0 + β1X1 + β2X2 + ... + βnXn + ε对数回归模型适用于因变量为正数且取值范围较广的情况,通过取对数可以将因变量的范围缩小,使得模型更易拟合。
5.非线性回归模型除了线性回归模型和多项式回归模型外,还存在许多其他形式的非线性回归模型。
非线性回归模型的函数形式通常不容易直接确定,需要通过试验和拟合来确定参数。
常见的非线性回归模型包括指数模型、幂函数模型、对数模型等。
在实际应用中,选择适当的函数形式是回归分析的一个重要问题。
选择不合适的函数形式可能导致模型的预测效果较差。
为了选择适当的函数形式,可以通过观察变量之间的散点图、拟合曲线图、残差图等进行初步判断,然后利用统计方法进行模型的比较和选择。
7.总结回归模型的函数形式是回归分析的基础,选择合适的函数形式对于模型的拟合和预测效果至关重要。
线性回归模型、多项式回归模型、对数回归模型和非线性回归模型是常用的函数形式。
选择适当的函数形式需要综合考虑变量之间的实际关系和统计分析的要求,可以通过观察图形和利用统计方法进行模型的比较和选择。
经济计量学(第版)教材
Prob(F-statistic)
0.000000
分析:系数的符号是否与经济理论相符、对模型的解
释、拟合优度分析、参数显著性、模型显著性等。
22
第5章
5.4 如何测度增长率:半对数模型
半对数模型又称为增长模型,通常我们 用这类模型来测度许多变量的增长率。
23
第5章
例5-4 1970~1999年美国人口增长率
14
第5章
表5-2实际GDP,就业人数,实际固定资本——墨西哥
年份
GDP
就业人数
固定资产
1955
114043
8310
182113
1956
120410
8529
193749
1957
129187
8738
205192
1958
134705
8952
215130
1959
139960
9171
225021
1960
150511
2
第5章
在第2章我们已经讨论了线性回归中“线性”的含 义,在本书中我们所关注的是参数线性模型,而并不 要求变量Y与X一定是线性的。本章将特别讨论下面几 种形式的回归模型: 1 双对数模型(不变弹性模型) 2 半对数模型 3 倒数模型 4 多项式回归模型 5 零截矩模型
这些模型有一个重要特征:它们都是参数线性模 型,但变量却不一定是线性的。
118.3
144.5
1980
101.2
119.6
179
20
1981
98.1
121.1
189.4
第5章
根据表5-3提供的数据,得到如下对数线性 需求函数:
Eviews数据统计与分析教程5章 基本回归模型OLS估计-普通最小二乘法
选择工作文件窗口工具栏中的“Object”| “New Object”| “Equation”选项,在下图所示的对话框中输入方程变量。
EViews统计分析基础教程
一、普通最小二乘法(OLS)
2.方程对象
EViews5.1提供了8种估计方法: “LS”为最小二乘法; “TSLS”为两阶段最小二乘法; “GMM”为广义矩法; “ARCH”为自回归条件异方差; “BINARY”为二元选择模型,其中包括Logit模型、Probit 模型和极端值模型; “ORDERED”为有序选择模型; “CENSORED”截取回归模型; “COUNT”为计数模型。
五、 线性回归模型的检验
3.异方差性检验
异方差性的后果 :
当模型出现异方差性时,用OLS(最小二乘估计法)得到的 估计参数将不再有效;变量的显著性检验(t检验)失去意 义;模型不再具有良好的统计性质,并且模型失去了预测 功能。
EViews统计分析基础教程
五、 线性回归模型的检验
4.序列相关检验
方法:
EViews统计分析基础教程
四、 线性回归模型的基本假定
线性回归模型必须满足以下几个基本假定:
假定1:随机误差项u具有0均值和同方差,即 E ( ui ) = 0 i=1,2,…,n Var ( ui ) = σ2 i=1,2,…,n 其中,E表示均值,也称为期望,在这里随机误差项u的 均值为0。Var表示随机误差项u的方差,对于每一个样本 点i,即在i=1,2,…,n的每一个数值上,解释变量y对 被解释变量x的条件分布具有相同的方差。当这一假定条 件不成立是,称该回归模型存在异方差问题。
EViews统计分析基础教程
四、 线性回归模型的基本假定
第五章5讲 残差自回归模型 (1)
例5-6
(4)检验残差项是否相关,对此回归模型的残差 进行自相关性检验,一般采用DW检验(建议): library(lmtest) dwtest(x.fit1)
从这里可以看出该残差序列有着明显的自相关性,需要 对其残差序列进行拟合。
例5-6
(5)画出残差序列自相关,偏自相关图来识别模 型: x.fit2=x.fit1$residual acf(x.fit2,col=4,lwd=2) pacf(x.fit2,col=4,lwd=2)
根据样本容量n 和多元回归模型中解释变量的数 目 k (不包括常数项)查DW分布表,得临界值 dL 和 dU ,然后依下列准则考察计算得到的DW值,
以决定模型的自相关状态。
31
回顾:Durbin-Waston检验(DW检验)
DW检验决策规则
0 ≤ DW ≤ dL
误差项 u1,u2 ,...,un 间存在 正相关
(DW原假设)H0 : ρ = 0 ⇔ H0 : E(εtεt−1) = (0 残差相关性原假设)
26
回顾:Durbin-Waston检验(DW检验)
假设条件 原假设:残差序列不存在一阶自相关性
H 0
:
E(εtεt
)
−1
= 0 ⇔
H 0
:ρ
= 0
备择假设:残差序列存在一阶自相关性
H 0
: E(εtεt −1) ≠
思考:若模型不唯一,怎么处理?
建模步骤:模型的选择问题
模型
ARIMA(0,1,1)模型:
(1 − B)xt = 4.99661 + (1 + 0.70766B)ε t
Auto-Regressive模型一:
εxtt
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 根据半对数模型求的:lnY的相对变化率为0.0107,Y 的年增长率为1.07%。 2. 由于 b2 = B2 的估计值=ln(1+r)
所以 antilog(b2)=(1+r) r=antilog(b2)-1 =antilog(0.0107)-1=1.0108-1 =0.010757
Yˆ
e L K Bˆ1 Bˆ2
Bˆ3
9-26
5.3 多元对数线性回归模型
例5-2 excel原始数据表
9-27
5.3 多元对数线性回归模型
例5-2 取对数后Eviews数据表
9-28
5.3 多元对数线性回归模型
例5-2 C-D函数Eviews回归过程
9-29
5.3 多元对数线性回归模型
例5-2 C-D函数Eviews回归结果
在样本区间内,美国人口年复合增长率为1.0757%. 3.两增长率的区别
9-42
5.4 如何测度增长率:半对数模型
5.4.2 线性趋势模型
Yt B1 B2t ut
p 0.0000 (0.0000)(0.0000)
R2 0.994196 Rˆ 2 0.993615 F 1712.859
5.4 如何测度增长率:半对数模型
通常经济学家、工商业家和政府对某 一经济变量的增长率很感兴趣。比如说, 政府预算赤字规划就是根据预计的GNP增 长率这一最重要的经济活动指标而确定的。 类似地,联储根据未偿付消费者信贷的增 长率(自动贷款、分期偿还贷款等等)这一 指标来监视其货币政策的运行效果。
偏斜率系数 B2、 B3又称为偏弹性系数, B2是Y 对X2的弹性(X3保持不变,为一常量), X2每变动 1%,Y变动的百分比。
同样, B3是Y对X3的弹性(X2保持不变,为一常 量) ,X3每变动1%,Y变动的百分比。
9-25
5.3 多元对数线性回归模型
例5-2 柯布-道格拉斯生产函数(C-D函数)
引起Y的变化为100* B2 %
9-36
5.4 如何测度增长率:半对数模型
9-37
5.4 如何测度增长率:半对数模型
例5-4 1975-2007年美国人口取对数的数据
9-38
5.4 如何测度增长率:半对数模型
例5-4 1975-2007年美国人口取对数后对时间的散点图
图5-3 半对数模型
9-39
5.3 多元对数线性回归模型
例 5-3 OECD国家的能源需求(1960-1982)
9-31
表5-3 OECD国家的能源需求(1960-1982)
5.3 多元对数线性回归模型
9-32
5.3 多元对数线性回归模型
9-33
LnˆYt 1.554555 0.997797LnX 2t 0.333169LnX 3t se (0.089630)(0.019008)(0.024179) t (17.34419)(52.49368)(13.77902)
9-20
5.2 比较线性和双对数回归模型
对线性模型而言,其弹性系数随着需求曲线 上的点的不同而变化,而对双对数模型而言, 它在需求曲线上任何一点的弹性系数都是相同 的。因此,在这两类模型之间进行选择模型时, 我们可以根据这个特点作出判断。
9-21
5.2 比较线性和双对数回归模型
对于线性模型的弹性通常用平均弹性系数来计算 :
9-23
5.3 多元对数线性回归模型
假设建立如下随机多元指数模型:
Yi
AX X e B2 B3 ui 2i 3i
通过对原模型的对数变换,随机函数形式可变为:
ln Yi LnA B2 ln X 2i B3 ln X 3i ui
令变量
Y* i
ln
Yi
,
X
*
ki
ln
X ki
,B1 LnA 则回归函数可变为:
5.1 如何度量弹性:双对数模型
双对数线性模型的假设检验
就假设检验而言,线性模型与对数线性模型并没有 什么不同。在随机误差项服从正态分布(均值为0,方 差为 2)的假定下,每一个估计的回归系数均服从正态 分布。或者,如果用 2 的无偏估计量代替它,则每一 个估计的回归系数服从自由度为(n-k)的t分布,其中k 为包括截距在内的参数的个数。
9-35
5.4 如何测度增长率:半对数模型
对数-线性模型中斜率 B2的经济意义:
LnYt B1 B2 X 2t ut
dLnY B2 dX
B2
1 Y
dY dX
dY /Y dX
Y的相对变化量 X的绝对变化量
Y / Y X
Y / Y B2 (X )
在对数线性模型中,X变化一个单位(X =1)
5.4 如何测度增长率:半对数模型
例5-4 1975-2007年美国人口取对数后对时间的回归结果
LnˆYt 5.3593 0.010748time se (0.001614)(8.28R 05)
t (3321.127)(129.7794)
p 0.000(0.0000)(0.0000)
第5章 回归模型的函数形式
Essentials of Econometrics
第5章回归模型的函数形式
本章讨论以下几种形式的回归模型
(1) 双对数线性模型或不变弹性模型 (2) 半对数模型 (3) 倒数模型 (4) 多项式回归模型 (5) 过原点的回归模型,或零截距模型
9-2
5.1 如何度量弹性:双对数模型
Y* i
B1
B2
X
*
2i
B3
X
*
3i
ui
根据解释变量的观测值,进行OLS估计,得到:
Yˆ * i
Bˆ1
Bˆ 2
X
*
2i
Bˆ3
Xˆ
*
3i
因此可得到原模型的估计方程:
ln Yˆi Bˆ1 Bˆ2 ln X 2i Bˆ3 ln X 3i
9-24
5.3 多元对数线性回归模型
InYi B1 B2InX 2t B2InX 3t ui
9-13
5.1 如何度量弹性:双对数模型
数学S.A.T分数函数取对数后的回归结果
ˆInYi 4.887712773 0.1258045149InXi se (0.1573)(0.0148)
t (31.0740)(8.5095)
p (0.0000)(0.0000)
9-14
r2 0.900513
根据回归结果有b1 LnY0的估计值 5.3593 如果取5.3593的反对数,得到:anti log(5.3593) 212.5761 即当t 0时的Y值,也即Y的初始值。本例中的样本初始于1975年,所以21(3 百万) 可以解释为1974年末的人口值。
9-41
5.4 如何测度增长率:半对数模型
平均弹性系数 Y X X Y
9-22
5.2 比较线性和双对数回归模型
数学S.A.T分数函数
X 56000 ,Y 507 .因而,本例的平均弹性 为:
根据上表,我们知道 X 56000,Y 507 因而,本例的平均弹性为:
平均分数弹性 0.0013 56000 0.1436 507
回顾数学S.A.T函数一例,建立了家庭收入(x)与数 学S.A.T成绩(Y)的双变量线性回归模型:
EYi B2 B2 X i
对于变量之间是线性的模型来说,解释变量每 变动一个单位,应变量的变化率为一常数。
9-3
5.1 如何度量弹性:双对数模型
能否使用如下的指数形式来描述数学S.A.T成绩(Y) 与家庭收入(X)的关系呢?
定义弹性E为:
E
Y变动的% = Y Y
X 变动的%
X X
100 100
Y X
X Y
斜率 X slope( X )
Y
Y
9-7
5.1 如何度量弹性:双对数模型
图5-1 不变弹性模型
9-8
5.1 如何度量弹性:双对数模型
例5.1 数学S.A.T分数函数
9-9
5.1 如何度量弹性:双对数模型
Y ALB2 K B3 eu
其中, Y---表示产出, L---表示劳动投入, K---表示资本投入。
两边取对数后:
ln Yi ln A B2 ln Li B3 ln Ki ui
得到原模型的估计方程:ln Yˆ Bˆ1 Bˆ2 ln Li Bˆ3 ln Ki 因此,C-D 函数的估计形式为:
9-19
5.2 比较线性和双对数回归模型
能否用判定系数R2来选择模型?
如果两个模型的被解释变量形式是相同的,可用 R 2作 为选择标准。
但下列两模型, R2度量的意义不同
Y B BX u
i
1
2i
i
InYi B1 B2InX i ui
不能根据最高 R2值这一标准(high r 2value criterion)来 选择模型
9-15
5.2 比较线性和双对数回归模型
回归模型的函数形式成为一个经验性问题。 在模型选择过程中,要遵循哪些经验规律呢?
9-16
5.2 比较线性和双对数回归模型
9-17
5.2 比较线性和双对数回归模型
Yˆi = 432.4138+0.0013Xi Se= (16.9061)(0.000245) t= (25.5774)(0.0006) r2=0.7869