经典单方程计量经济学模型:一元线性回归模型
统计学一元线性回归模型
• 回归分析仅对存在因果关系而言。
正相关 线性相关 统计依赖关系 不相关 相关系数: 有因果关系 无因果关系 回归分析 相关分析 负相关 1 XY 1 正相关 非线性相关 不相关 负相关
1、关于模型关系的假设
• 模型设定正确假设。The regression model is correctly specified. • 线性回归假设。The regression model is linear in the parameters。
Yi 0 1 X i i
• 称为观察值围绕它的期望值的离差 (deviation),是一个不可观测的随机变量, 又称为随机干扰项(stochastic disturbance)或 随机误差项(stochastic error)。
i Yi E (Y | X i )
• 例2.1.1中,给定收入水平Xi ,个别家庭的支出 可表示为两部分之和:
• 回归分析构成计量经济学的方法论基础,其主 要内容包括:
– 根据样本观察值对经济计量模型参数进行估计,求得 回归方程;
– 对回归方程、参数估计值进行显著性检验;
– 利用回归方程进行分析、评价及预测。
二、总体回归函数 Population Regression Function, PRF
1、条件均值(conditional mean)
E (Y | X i ) f ( X i )
• 含义:回归函数(PRF)说明被解释变量Y的 平均状态(总体条件期望)随解释变量X变化 的规律。 • 函数形式:可以是线性或非线性的。 • 例2.1.1中,将居民消费支出看成是其可支配收 入的线性函数时:
李子奈《计量经济学》课后习题详解(经典单方程计量经济学模型:一元线性回归模型)【圣才出品】
2.下列计量经济学方程哪些是正确的?哪些是错误的?为什么?
(1)Yi=α+βXi,i=1,2,…,n;
(2)Yi=α+βXi+μi,i=1,2,…,n;
∧∧
(3)Yi=α+βXi+μi,i=1,2,…,n;
∧
∧∧
(4)Yi=α+βXi+μi,i=1,2,…,n;
∧∧
(5)Yi=α+βXi,i=1,2,…,n;
2 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.10Leabharlann
假定随机扰动项满足条件零均值、条件同方差、条件序列丌相关性以及服从正态分布。 (2)违背基本假设的计量经济学仍然可以估计。虽然 OLS 估计值丌再满足有效性,但 仍然可以通过最大似然法等估计方法或修正 OLS 估计量来得到具有良好性质的估计值。
4.线性回归模型 Yi=α+βXi+μi,i=1,2,…,n 的零均值假设是否可以表示为
1
n
n i 1
i
0 ?为什么?
n
1 0 答:线性回归模型 Yi=α+βXi+μi 的零均值假设丌可以表示为
i
。
n i1
原因:零均值假设 E(μi)=0 实际上表示的是 E(μi∣Xi)=0,即当 X 取特定值 Xi 时,
3.一元线性回归模型的基本假设主要有哪些?违背基本假设的计量经济学模型是否就 丌可以估计?
答:(1)针对普通最小二乘法,一元线性回归模型的基本假设主要有以下三大类: ①关于模型设定的基本假设: 假定回归模型的设定是正确的,即模型的变量和函数形式均为正确的。 ②关于自变量的基本假设: 假定自变量具有样本变异性,且在无限样本中的方差趋于一个非零的有限常数。 ③关于随机干扰项的基本假设:
习题一
习 题第二章 经典单方程计量经济学模型:一元线性回归模型1.假设居民户储蓄(Y )与收入(X )之间可建立如下形式的储蓄模型:μββ++=X Y 10 εμ21X =其中,ε为具有零均值0)(=εE 、同方差2)(εσε=Var 且与X 相互独立的随机变量。
(1) 该模型服从零均值基本假设吗?(2) 该模型服从同方差基本假设吗?(3) 如果该模型不满足同方差性,试解释随着居民户收入X 的提高,随机扰动项μ的方差是增大还是缩小?2.对于人均存款与人均收入之间的关系式t t t Y S μβα++=∧,使用美国36年的年度数据,得到如下估计模型(括号内为标准差):t t Y S 067.0105.384+=∧(151.105) (0.011)(1)β的经济解释是什么?(2) α、β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3) 你对于拟合优度有什么看法?(4) 检验是否每一个回归系数都与零显著不同(在1%的水平下)。
同时对零假设和备择假设,检验统计值及其分布和自由度,以及拒绝零假设的标准进行陈述。
你的结论是什么?3.对于一元线性回归模型μββ++=X Y 10,试证明OLS 估计量∧1β在所有线性无偏估计量中具有最小方差。
第三章 经典单方程计量经济学模型:多元线性回归模型1.在经典线性模型基本假定下,对含有三个自变量的多元回归模型:μββββ++++=3322110X X X Y你想检验的虚拟假设是12:210=-ββH 。
(1)用∧1β,∧2β的方差及其协方差求出)2(21∧∧-ββVar 。
(2)写出检验12:210=-ββH 的t 统计量。
(3)如果定义θββ=-212,写出一个涉及0β,θ,2β和3β的回归方程,以便能直接得到θ的估计值∧θ及其标准差。
2. 对于涉及三个变量Y ,1X ,2X 的数据做以下回归:(1)1110i i i X Y μαα++=(2)2210i i i X Y μββ++=(3)322110i i i i X X Y μγγγ+++=问在什么条件下才能有∧∧=11γα及∧∧=21γβ,即多元回归与各自的一元回归所得的参数估计值相同。
2 一元线性回归模型
负线性相关
不相关
正线性相关
3、常用的两种相关关系的分析方法 对变量间(不确定性的)相关关系(统计依赖关系)
的考察主要是通过相关分析(correlation analysis)或
回归分析(regression analysis)来完成的。
• ……
• E(Y|X=3500)=2585
• 问题4:收入X与平均消费支出E(Y|X)之 间是什么关系?如何用方程式来表现这两种 关系?
图形说明:平均来说,随着收入的增加,消费支出也
在线性增加。即每一个消费支出的(条件)期望均落
在一根正斜率的直线上。这条直线称为总体回归线。
3500
每 月 消 费 支 出 Y (元) 3000 2500 2000 1500 1000 500 0 500 1000 1500 2000 2500 3000 3500 4000 每月可支配收入X(元)
答:E(Y|X=800)=2420/4=561×1/4+ 594 ×1/4+ 627 ×1/4+ 638 ×1/4=605 • 知识点及注意点4: • 期望也称均值,描述一个随机变量的平均值 • 条件期望(条件均值):给定X的Y的期望值, 记为E(Y|X)。
• 对于每一个给定的X,都对应有且只有一个Y 的条件均值。 • E(Y|X=800)=561×1/4+ 594 ×1/4+ 627 ×1/4+ 638 ×1/4=605 • E(Y|X=1100)=825 • E(Y|X=1400)=1045
量。 • 记为
Y E (Y | X )
• 随机误差项主要包括下列因素(P27书中 六点综合为四点) –在解释变量中被忽略的因素的影响 P27; 说明:模型中被省略了的影响Y的那些 因素包含在随机扰动项中。
计量经济学课件一元线性回归
二、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要 求样本回归函数尽可能好地拟合这组值. 普通最小二乘法(Ordinary least squares, OLS) 给出的判断标准是:二者之差的平方和
ˆ ˆ X )) 2 ˆ ) (Y ( Q (Yi Y i i 0 1 i
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
ˆ Y 顺便指出 ,记 y ˆi Y i
则有
ˆ ˆ X ) ( ˆ ˆ X e) ˆi ( y 0 1 i 0 1 ˆ (X X ) 1 e 1 i n i
可得
ˆx ˆi y 1 i
(**)
(**)式也称为样本回归函数的离差形式。
注意:
在计量经济学中,往往以小写字母表示对均值 的离差。
易知 故
x k x
i
i
2 i
0
k X
i
i
1
ˆ k i i 1 1
ˆ ) E ( k ) k E ( ) E( i i 1 i i 1 1 1
同样地,容易得出
ˆ ) E ( w ) E( ) w E ( ) E( i i i i 0 0 0 0
1 (2 ) n
n 2
1 2
计量经济学例题
第二章 经典单方程计量经济学模型:一元线性回归模型例1.令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数.生育率对教育年数的简单回归模型为μββ++=educ kids 10(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释.解答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中.有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等.(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足.例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年).随机扰动项μ的分布未知,其他所有假设都满足.(1)从直观及经济角度解释α和β.(2)OLS 估计量αˆ和βˆ满足线性性、无偏性及有效性吗?简单陈述理由. (3)对参数的假设检验还能进行吗?简单陈述理由.解答:(1)N βα+为接受过N 年教育的员工的总体平均起始薪金.当N 为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金.β是每单位N 变化所引起的E 的变化,即表示每多接受一年学校教育所对应的薪金增加值.(2)OLS 估计量αˆ和仍βˆ满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项μ的正态分布假设.(3)如果t μ的分布未知,则所有的假设检验都是无效的.因为t 检验与F 检验是建立在μ的正态分布假设之上的.例3.在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化?解答:首先考察被解释变量度量单位变化的情形.以E*表示以百元为度量单位的薪金,则μβα++=⨯=N E E 100*.由此有如下新模型)100/()100/()100/(*μβα++=N E 或****μβα++=N E .这里100/*αα=,100/*ββ=.所以新的回归系数将为原始模型回归系数的1/100.再考虑解释变量度量单位变化的情形.设N*为用月份表示的新员工受教育的时间长度,则N*=12N ,于是μβαμβα++=++=)12/*(N N E 或μβα++=*)12/(N E可见,估计的截距项不变,而斜率项将为原回归系数的1/12.例4.对没有截距项的一元回归模型i i i X Y μβ+=1称之为过原点回归(regrission through the origin ).试证明(1)如果通过相应的样本回归模型可得到通常的的正规方程组00i i i e e X ⎧=⎪⎨=⎪⎩∑∑则可以得到1β的两个不同的估计值: X Y =1~β, ()()∑∑=21ˆi i i X Y X β. (2)在基本假设0)(i =μE 下,1~β与1ˆβ均为无偏估计量. (3)拟合线X Y 1ˆˆβ=通常不会经过均值点),(Y X ,但拟合线X Y 1~~β=则相反. (4)只有1ˆβ是1β的OLS 估计量. 解答:(1)由第一个正规方程 0=∑t e 得0)~(1=-∑t t X Y β或∑∑=t t X Y 1~β,求解得X Y /~1=β.由第2个下规方程0)ˆ(1=-∑t t t X Y X β得∑∑=21ˆt tt X Y X β, 求解得)/()(ˆ21∑∑=t t t X Y X β. (2)对于X Y /~1=β,求期望 11111111()()[()][{)()]t t t t X X E E Y X E X E E X n X n Xβββμμββ==+=+== 这里用到了t X 的非随机性.对于)/()(ˆ21∑∑=t t t X Y X β,求期望2112211ˆ()(/)()()()[()]t t t t t t t t t t E E X Y X E X Y E X X X X ββμ===+∑∑∑∑∑∑ 2112211()()()()t t t t tX X E X X βμβ=+=∑∑∑∑ (3)要想拟合值X Y 1ˆˆβ=通过点),(Y X ,X 1ˆβ必须等于Y .但X X Y X X t t t∑∑=21ˆβ,通常不等于Y .这就意味着点),(Y X 不太可能位于直线X Y 1ˆˆβ=上. 相反地,由于Y X =1~β,所以直线X Y 1~ˆβ=经过点),(Y X . (4)OLS 方法要求残差平方和最小Min ∑∑-==212)ˆ(tt t X Y e RSS β 关于1ˆβ求偏导得0))(ˆ(2ˆ11=--=∂∂∑t t t X X Y RSS ββ,即0)ˆ(1=-∑t t t X Y X β()()∑∑=21ˆi i i X Y X β.可见1ˆβ是OLS 估计量. 例5.假设模型为t t t X Y μβα++=.给定n 个观察值),(11Y X ,),(22Y X ,…,),(n n Y X ,按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜率;最后对这些斜率取平均值,称之为βˆ,即β的估计值.(1)画出散点图,给出βˆ的几何表示并推出代数表达式. (2)计算βˆ的期望值并对所做假设进行陈述.这个估计值是有偏的还是无偏的?解释理由. (3)证明为什么该估计值不如我们以前用OLS 方法所获得的估计值,并做具体解释.解答:(1)散点图如下图所示.(X n ,Y n )首先计算每条直线的斜率并求平均斜率.连接),(11Y X 和),(t t Y X 的直线斜率为)/()(11X X Y Y t t --.由于共有n -1条这样的直线,因此][11ˆ211∑==---=n t t t t X X Y Y n β (2)因为X 非随机且0)(=t E μ,因此βμμβμβαμβα=--+=-++-++=--][])()([][1111111X X E X X X X E X X Y Y E t t t t t t t 这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏的.(3)根据高斯-马尔可夫定理,只有β的OLS 估计量是最付佳线性无偏估计量,因此,这里得到的βˆ的有效性不如β的OLS 估计量,所以较差.例6.对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计模型,括号内为标准差:ˆ384.1050.067t tS Y =+ (151.105) (0.011) 20.538R = 023.199ˆ=σ (1)β的经济解释是什么?(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗?(4)检验是否每一个回归系数都与零显著不同(在1%水平下).同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述.你的结论是什么?解答:(1)β为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量.(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α符号应为负.储蓄是收入的一部分,且会随着收入的增加而增加,因此预期β的符号为正.实际的回归式中,β的符号为正,与预期的一致.但截距项为负,与预期不符.这可能与由于模型的错误设定形造成的.如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确.(3)拟合优度刻画解释变量对被解释变量变化的解释能力.模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动.(4)检验单个参数采用t 检验,零假设为参数为零,备择假设为参数不为零.双变量情形下在零假设下t 分布的自由度为n-2=36-2=34.由t 分布表知,双侧1%下的临界值位于2.750与2.704之间.斜率项计算的t 值为0.067/0.011=6.09,截距项计算的t 值为384.105/151.105=2.54.可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设.第三章 经典单方程计量经济学模型:多元线性回归模型例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为fedu medu sibs edu 210.0131.0094.036.10++-= 20.214R = 式中,edu 为劳动力受教育年数,sibs 为该劳动力家庭中兄弟姐妹的个数,medu 与fedu 分别为母亲与父亲受到教育的年数.问(1)sibs 是否具有预期的影响?为什么?若medu 与fedu 保持不变,为了使预测的受教育水平减少一年,需要sibs 增加多少?(2)请对medu 的系数给予适当的解释.(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?解答:(1)预期sibs 对劳动者受教育的年数有影响.因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短.根据多元回归模型偏回归系数的含义,sibs 前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个.(2)medu 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会.(3)首先计算两人受教育的年数分别为:10.36+0.131⨯12+0.210⨯12=14.452;10.36+0.131⨯16+0.210⨯16=15.816.因此,两人的受教育年限的差别为15.816-14.452=1.364例2.以企业研发支出(R&D )占销售额的比重为被解释变量(Y ),以企业销售额(X 1)与利润占销售额的比重(X 2)为解释变量,一个有32容量的样本企业的估计结果如下:120.4720.32log()0.05Y X X =++ (1.37) (0.22) (0.046) 20.099R = 其中括号中为系数估计值的标准差.(1)解释log(X 1)的系数.如果X 1增加10%,估计Y 会变化多少个百分点?这在经济上是一个很大的影响吗?(2)针对R&D 强度随销售额的增加而提高这一备择假设,检验它不虽X 1而变化的假设.分别在5%和10%的显著性水平上进行这个检验.(3)利润占销售额的比重X 2对R&D 强度Y 是否在统计上有显著的影响?解答:(1)log(x1)的系数表明在其他条件不变时,log(X 1)变化1个单位,Y 变化的单位数,即∆Y=0.32∆log(X 1)≈0.32(∆X 1/X 1)=0.32⨯100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y 会增加0.32个百分点.由此,如果X 1增加10%,Y 会增加0.032个百分点.这在经济上不是一个较大的影响.(2)针对备择假设H 1:01>β,检验原假设H 0:01=β.易知计算的t 统计量的值为t=0.32/0.22=1.468.在5%的显著性水平下,自由度为32-3=29的t 分布的临界值为1.699(单侧),计算的t 值小于该临界值,所以不拒绝原假设.意味着R&D 强度不随销售额的增加而变化.在10%的显著性水平下,t 分布的临界值为1.311,计算的t 值小于该值,拒绝原假设,意味着R&D 强度随销售额的增加而增加.(3)对X 2,参数估计值的t 统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y 在统计上没有显著的影响.例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量).数据为美国40个城市的数据.模型如下:01234567sin hou g density value income popchang unemp localtaxstatetax ββββββββμ=++++++++式中housing ——实际颁发的建筑许可证数量,density ——每平方英里的人口密度,value ——自由房屋的均值(单位:百美元),income ——平均家庭的收入(单位:千美元),popchang ——1980~1992年的人口增长验结果,你认为应该把变量保留在模型中还是去掉?(2)在模型A 中,在10%水平下检验联合假设H 0:0i β= (i=1,5,6,7).说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准.说明你的结论.(3)哪个模型是“最优的”?解释你的选择标准.(4)说明最优模型中有哪些系数的符号是“错误的”.说明你的预期符号并解释原因.确认其是否为正确符号.解答:(1)直接给出了P-值,所以没有必要计算t-统计值以及查t 分布表.根据题意,如果p-值<0.10,则我们拒绝参数为零的原假设.由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的.但由此去掉所有解释变量,则会得到非常奇怪的结果.其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择.本例中,value 、income 、popchang 的p-值仅比0.1稍大一点,在略掉unemp 、localtax 、statetax 的模型C 中,这些变量的系数都是显著的.(2)针对联合假设H 0:0i β=(i=1,5,6,7)的备择假设为H 1:0i β=(i=1,5,6,7),中至少有一个不为零.检验假设H 0,实际上就是参数的约束性检验,非约束模型为模型A ,约束模型为模型D ,检验统计值为462.0)840/()7763.4()37/()7763.47038.5()1/()/()(=-+-+-+=----=e e e k n RSS k k RSS RSS F U U R U U R 显然,在H 0假设下,上述统计量满足F 分布,在10%的显著性水平下,自由度为(4,32)的F 分布的临界值位于2.09和2.14之间.显然,计算的F 值小于临界值,我们不能拒绝H 0,所以i β(i=1,5,6,7)是联合不显著的.(3)模型D 中的3个解释变量全部通过显著性检验.尽管R2与残差平方和较大,但相对来说其AIC 值最低,所以我们选择该模型为最优的模型.(4)随着收入的增加,我们预期住房需要会随之增加.所以可以预期β3>0,事实上其估计值确是大于零的.同样地,随着人口的增加,住房需求也会随之增加,所以我们预期β4>0,事实其估计值也是如此.随着房屋价格的上升,我们预期对住房的需求人数减少,即我们预期β3估计值的符号为负,回归结果与直觉相符.出乎预料的是,地方税与州税为不显著的.由于税收的增加将使可支配收入降低,所以我们预期住房的需求将下降.虽然模型A 是这种情况,但它们的影响却非常微弱.例4.在经典线性模型基本假定下,对含有三个自变量的多元回归模型:μββββ++++=3322110X X X Y ,你想检验的虚拟假设是H 0:1221=-ββ.(1)用21ˆ,ˆββ的方差及其协方差求出)ˆ2ˆ(21ββ-Var . (2)写出检验H 0:1221=-ββ的t 统计量.(3)如果定义θββ=-212,写出一个涉及β0、θ、β2和β3的回归方程,以便能直接得到θ估计值θˆ及其标准误.解答:(1)由数理统计学知识易知)ˆ(4)ˆ,ˆ(4)ˆ()ˆ2ˆ(221121ββββββVar Cov Var Var +-=-. (2)由数理统计学知识易知)ˆ2ˆ(1ˆ2ˆ2121ββββ---=se t ,其中)ˆ2ˆ(21ββ-se 为)ˆ2ˆ(21ββ-的标准差. (3)由θββ=-212知212βθβ+=,代入原模型得02122330121233(2)(2)Y X X X X X X X βθβββμβθββμ=+++++=+++++这就是所需的模型,其中θ估计值θˆ及其标准误都能通过对该模型进行估计得到.第四章 经典单方程计量经济学模型:放宽基本假定的模型例1.下列哪种情况是异方差性造成的结果?(1)OLS 估计量是有偏的。
第二章 经典单方程计量经济学模型:一元线性回归模型
第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。
同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
计量经济学 第二章 一元线性回归模型
计量经济学第二章一元线性回归模型第二章一元线性回归模型第一节一元线性回归模型及其古典假定第二节参数估计第三节最小二乘估计量的统计特性第四节统计显著性检验第五节预测与控制第一节回归模型的一般描述(1)确定性关系或函数关系:变量之间有唯一确定性的函数关系。
其一般表现形式为:一、回归模型的一般形式变量间的关系经济变量之间的关系,大体可分为两类:(2.1)(2)统计关系或相关关系:变量之间为非确定性依赖关系。
其一般表现形式为:(2.2)例如:函数关系:圆面积S =统计依赖关系/统计相关关系:若x和y之间确有因果关系,则称(2.2)为总体回归模型,x(一个或几个)为自变量(或解释变量或外生变量),y为因变量(或被解释变量或内生变量),u为随机项,是没有包含在模型中的自变量和其他一些随机因素对y的总影响。
一般说来,随机项来自以下几个方面:1、变量的省略。
由于人们认识的局限不能穷尽所有的影响因素或由于受时间、费用、数据质量等制约而没有引入模型之中的对被解释变量有一定影响的自变量。
2、统计误差。
数据搜集中由于计量、计算、记录等导致的登记误差;或由样本信息推断总体信息时产生的代表性误差。
3、模型的设定误差。
如在模型构造时,非线性关系用线性模型描述了;复杂关系用简单模型描述了;此非线性关系用彼非线性模型描述了等等。
4、随机误差。
被解释变量还受一些不可控制的众多的、细小的偶然因素的影响。
若相互依赖的变量间没有因果关系,则称其有相关关系。
对变量间统计关系的分析主要是通过相关分析、方差分析或回归分析(regression analysis)来完成的。
他们各有特点、职责和分析范围。
相关分析和方差分析本身虽然可以独立的进行某些方面的数量分析,但在大多数情况下,则是和回归分析结合在一起,进行综合分析,作为回归分析方法的补充。
回归分析(regression analysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。
一元线性回归模型(计量经济学)
回归分析是一种统计方法,用于研究变量之间的关系。它基于最小二乘法,寻找最合适的直线来描述变 量间的线性关系。通过回归分析,我们可以理解变量之间的因果关系和预测未知数据。
一元线性回归模型的假设
1 线性关系
2 独立误差
一元线性回归模型假设自变量和因变量之 间存在线性关系。
模型的残差项是独立的,不受其他因素的 影响。
3 常数方差
4 正态分布
模型的残差项具有恒定的方差,即方差齐 性。
模型的残差项服从正态分布。
一元线性回归模型的估计和推断
1
模型估计
使用最小二乘法估计模型的回归系数。
2
参数推断
进行参数估计的显著性检验和置信区间估计。
3
模型拟合程度
使用残差分析和R平方评估模型的拟合程度。
模型评估和解释结果
通过残差分析和R平方等指标评估模型的拟合程度,并解释模型中回归系数的 含义。了解如何正确使用模型的结果,并识别异常值和离群点对模型的影响。
一元线性回归模型(计量 经济学)
在本节中,我们将介绍一元线性回归模型,探讨回归分析的基本概念和原理, 了解一元线性回归模型所做的假设,并学习模型的估计和推断方法。我们还 将探讨模型评估和解释结果的技巧,并通过实例应用和案例分析进一步加深 对该模型的理解。最后,我们将总结和得出结论。
回归分析的基本概念和原理
实例应用和案例分析
汽车价格预测Байду номын сангаас
使用一元线性回归模型预 测汽车价格,考虑车龄、 里程等因素。
销售趋势分析
通过一元线性回归模型分 析产品销售的趋势,并预 测未来销售。
学术成绩预测
应用一元线性回归模型预 测学生的学术成绩,考虑 学习时间、背景等因素。
计量经济学【一元线性回归模型——参数估计】
ˆ0计量ˆ1 和
可以分别表示为被解释变量观测Y值i
的线
性组合(线性函数);
ˆ证1 明
如( X下i : X )(Yi (Xi X )2
Y
)
(Xi X) (Xi X )2
(Yi
Y
)
ki (Yi Y )
其中ki :
(Xi X) (Xi X )2
ki
对ki于引0 进的 ki (X容i 易X证) 明有k如i X下i 的1 特性k:i2
2
,
,
,
,
,
,
,
,
i
1,
2,
n
假设3:随机误差项在不同样本点之间是独立的,不
存
Cov(i , j ) 0,,,,,,,i j,,,,i, j 1, 2, n
在序列相关,即:
一、一元线性回归模型的基本假设
假设 4:随机误差项与解释变量之间不相关, 即:
Cov( Xi , i ) 0,,,,,,,,,,,i 1, 2, n
:待估
E(Y
总样体本回回归归函函数数形形式式::Yˆi
| Xi)
ˆ0
0 ˆ1X i
1X i
其 计
中 估
方
ˆ0 , ˆ1 法ˆ0,, ˆ1求
是ˆ00,,ˆ11 出
的估计值,我们需要找到一种参数 , 并0 ,且1 这 种 参 数 估 计 方 法 保 证 了 估
计值 数
与总体真值
尽可能地接近;这种参
i
根据微 小,
积
分中
ˆ0 , ˆ1
求
极
值
的
原
理
,
要
使 i
ei2
待定系数
第二章 经典单方程计量经济学模型:一元线性回归模型
同学问题(西经教材55页):21()()00,d d d d d dd d d d TE TE TE P P Q Q PQ P Q P Q P Q P Q P Q dTE dP Q P dQ ∆=-=+∆+∆-=∆+∆+∆∆∆→∆→∆∆∴=+ 时,也,为更高阶无穷小抹掉高阶无穷小F X Y ,()X 2Y2-:=F华尔街200809-10月流行语:假设去年您有1000美元,如果买了达美航空的股票,现在还能剩下49美元; 如果买了AIG 的股票,剩下约12美元; 如果买了房地美股票,剩下约2.5美元; 如果买1000美元的啤酒,喝光后再把易拉罐送去回收站,还能换回214美元!美国经济学家克鲁格曼获得2008年诺贝尔经济学奖 08-10-13 斯德哥尔摩10月13日电 瑞典皇家科学院13日宣布,将2008年诺贝尔经济学奖授予美国普林斯顿大学经济学家保罗·克鲁格曼,以表彰他在分析国际贸易模式和经济活动的地域等方面所作的贡献。
瑞典皇家科学院发表声明说,克鲁格曼整合了此前经济学界在国际贸易和地理经济学方面的研究,在自由贸易、全球化以及推动世界范围内城市化进程的动因方面形成了一套理论。
根据瑞典著名化学家、硝化甘油炸药发明人阿尔弗雷德·伯恩哈德·诺贝尔(1833-1896)1895年立下的遗嘱,诺贝尔奖项只包括化学奖、物理学奖、文学奖、医学奖与和平奖。
诺贝尔经济学奖是瑞典中央银行在1968年为纪念诺贝尔而增设的,1969年首次颁奖。
诺贝尔经济学奖可以颁发给单个人,也可以最多由3人分享,其主要目的是表彰有关人员在宏观经济学、微观经济学、新经济分析方法等领域所作的贡献。
今年诺贝尔奖每项奖金仍(金融危机对奖金没有影响)为1000万瑞典克朗(约合140万美元)。
信计03吴丽然:苏老师:你好,我是03信计的吴丽然,现在在西南交大读研,我现在学的是交通运输,跨专业考得好多铁路专业知识都不懂,好在数学基础还有学起什么来都不太难,尤其是一些模型看起来要比本专业的容易懂些,现在发现咱们以前学的好多课都很有用。
计量经济学 第二章 经典单方程计量模型简化内容
• 3.拟合优度(拟合度) • ①R2指标是判断回归模型优劣的一个最基 本的指标,但比较笼统,不精细。 • ②在Eviews中就是回归结果中的第一个R2, 判断时要注意,其越接近1,说明模型总体 拟合效果越好。 • ③R2的正式名称是“决定系数”,但通常 称其为拟合度。
• 具体的,拟合优度的计算公式如下:
• 3.计量模型的设定 • (1)基本形式: • y x (2.3) • 这里是一个随机变量,称作随机扰动项, 它的数学期望为0,即 注意:上式中条件数学期望的含义是,在给 定x时,ε的平均值为0。试举现实中的例子 予以说明。 回归直线、回归模型概念说明
• 二.一个完美计量经济模型的假设 • 1.对模型提出一些假设(限制)的原因 • 保证模型设定具有较高的合理性,从而可用其进 行经济分析并有利于统计分析的进行。 • 2.基本假定 • (1)在x给定的条件下,ε的数学期望为0 • (2)在x给定的条件下, x与ε不相关 • (3)在x给定的条件下, ε的方差是一个常数 • (4)在x给定的条件下, ε的样本之间不存在序 列相关 • (5) N (0, 2 )
R
2
2 (Yi Y )
n
(Y Y )
i 1 i
i 1 n
1.它的直观的含义是:估计 出来的被解释变量的每个 值跟平均值的偏差之和与 真实的被解释变量样本值 跟平均值的偏差之和的比 例。 2.现实当中的理解:如果我们在做模型时 希望最有效的解释被解释变量的波动,那 么比较好的一个指标就是让R2最大。 但一定要注意,在实际应用当中,大部分 情况下,我们并不是关注整个模型,而只 是关注一个解释变量对被解释变量的影响。
12 1 L , , exp 2 2 2 2 2 2
(NEW)李子奈《计量经济学》(第3版)课后习题详解
目 录第1章 绪 论第2章 经典单方程计量经济学模型:一元线性回归模型第3章 经典单方程计量经济学模型:多元线性回归模型第4章 经典单方程计量经济学模型:放宽基本假定的模型第5章 经典单方程计量经济学模型:专门问题第6章 联立方程计量经济学模型:理论与方法第7章 扩展的单方程计量经济学模型第8章 时间序列计量经济学模型第9章 计量经济学应用模型第1章 绪 论1什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别?答:(1)计量经济学是经济学的一个分支学科,以揭示经济活动中客观存在的数量关系为主要内容,是由经济理论、统计学和数学三者结合而成的交叉学科。
(2)计量经济学方法通过建立随机的数学方程来描述经济活动,并通过对模型中参数的估计来揭示经济活动中各个因素之间的定量关系,是对经济理论赋予经验内容;而一般经济数学方法是以确定性的数学方程来描述经济活动,揭示的是经济活动中各个因素之间的理论关系。
2计量经济学的研究对象和内容是什么?计量经济学模型研究的经济关系有哪两个基本特征?答:(1)计量经济学的研究对象是经济现象,主要研究的是经济现象中的具体数量规律,即是利用数学方法,依据统计方法所收集和整理到的经济数据,对反映经济现象本质的经济数量关系进行研究。
(2)计量经济学的内容大致包括两个方面:一是方法论,即计量经济学方法或理论计量经济学;二是应用计量经济学。
任何一项计量经济学研究和任何一个计量经济学模型赖以成功的三要素是理论、方法和数据。
(3)计量经济学模型研究的经济关系的两个基本特征是随机关系和因果关系。
3为什么说计量经济学在当代经济学科中占据重要地位?当代计量经济学发展的基本特征与动向是什么?答:(1)计量经济学自20世纪20年代末30年代初形成以来,无论在技术方法还是在应用方面发展都十分迅速,尤其是经过20世纪50年代的发展阶段和60年代的扩张阶段,使其在经济学科占据重要的地位,主要表现在:①在西方大多数大学和学院中,计量经济学的讲授已成为经济学课程表中最具有权威的一部分;②从1969~2003年诺贝尔经济学奖的53位获奖者中有10位是与研究和应用计量经济学有关;③计量经济学方法与其他经济数学方法结合应用得到了长足的发展。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据被解释变量的估计值于观测值应该在 总体上最接近的原则,给出判断标准是二者 之差的平方和最小,即 n ˆ min ˆ ˆ Q (Y Y ) 2 (2.3.1)
i
2 ˆ 1 ~ N 1 , x2 i
X i2 2 ˆ 0 ~ N 0 , 2 n xi
ˆ
2
e i , 2 e i , 2 e i ˆ n2 ˆ n n
支出随收入变化的简单散点图如下:
回归的现代解释
研究某一变量(被解释变量)与另一 个或多个变量(解释变量)间的因果 关系。用解释变量的已知值来估计和 预测因变量的总体平均值。
Y 0 1 X
Y E (Y | X )
•由于客观经济现象的复杂性
随机误差项主要包括以下因素的影响
0
1 xi i ) xi ( 0 1 xi i ) xi n x 2i ( xi ) 2
n1 x 2i n xx i 1 ( xi ) 2 i xi n x 2i ( xi ) 2
ˆ E1
同样可证明
0 1
其中e被称为样本残差。
§2.2 一元线性回归模型的基本假设
yi 0 1xi i i 1,2,, n
1.对模型设定的假设 假设1:回归模型是正确设定的 2.对解释变量的假设 假设2:解释变量是确定的变量,不是随机变量,解 释变量之间互不相关。 假设3:解释变量X在所抽取的样本中具有变异性, 而且随着样本容量的无限增加,解释变量X的样 本方差趋于一个非零的有限常数
第二章 经典单方程计量经济学模型: 一元线性回归模型
线性回归模型的特征
历史渊源: 皮尔逊(Karl Pearson)搜集了一千 多个家庭成员身高的记录,发现身体高的 父亲一组,儿子们身高平均低于他们父亲 的身高,身体矮的父亲一组,儿子们平均 身高高于他们父亲的身高,这样,儿子的 高矮趋向所有人的平均身高,即“回归到 普通人”。
在如此假设条件下,可以推出
E ( i ) 0 Var(i ) 2
假设5:随机误差项与解释变量之间不相关, 即 Cov( xi , i ) 0 假设6:随机误差项服从0均值、同方差的正 态分布。即
i | X i ~ N (0, 2 )
i 1,2,, n
§2.3一元线性回归模型的参数估计
§2.1 回归分析概述 一、回归分析基本概念 1. 变量之间的相互关系 2. 相关分析与回归分析
两个变量总体相关系数公式
两个变量的样本
相关系数公式
回归分析是研究一个变量关于另一个变量的依 赖关系的计算方法和理论。目的在于通过后者 的已知或者设定值,去顾及或预测前者的均值。 分为解释变量(自变量)和被解释变量(因变 量)。 回归分析包含的内容: (1)根据样本进行模型参数估计,得回归方 程; (2)对回归方程、参数估计值的显著性检验; (3)利用回归方程进行分析、评价、预测。
x 1 Xi , n
Xi Xi X ,
y 1 Yi n
Y Yi Y
若再记
则有
ˆ ˆ 0 y 1 x ˆ Yi X i 1 X 2i
二、最大似然法(ML,Maximum Likelihood)
考虑在一组分布中使得样本出现的可能性最 大的分布为我们所求。 对于 yi 0 1xi i ( i 1,2,, n)
在同族中抽取n对父-子的身高, 即有n对数据: (X1,Y1), (X2,Y2), … , (Xn,Yn). Yk a + bXk , 1kn. Yk ~ a + bXk , 1kn --男人平均身高. 由上式得 Yk - ~a + bXk - ~ a +(b-1) + b(Xk -) ~c+ b(Xk -) (注意=(1-b)+b ,c= a +(b-1) ,0<b<1)
ˆ E 0 0
ˆ E1 1
ˆ E
2
2
3.有效性:所有无偏估计量中具有最小方差; 4.渐近无偏性,随着样本容量增加,估计量均值收 敛于总体真值; 5.一致性:随着样本容量的增加,估计量依概率收 敛于总体真值; 6.渐进有效性:随着样本容量的增加,估计量在所 有一致估计量中是否具有最小的方差。 在经典线性回归假设下,最小二乘估计量是具有最 小方差的线性无偏估计量,也就是具有所有有限 样本性质。
2 x i yi xi yi xi y x ˆ ˆ 2 2 1 0 n x i ( xi ) n yx y x ˆ 1 ix2i ix2 i n i ( i )
可见其与用最小二乘估计方法获得的估计量相同,因 此有相同的性质。关于方差的最大或然估计为满足下 式的量 2 L* 0 可得
f ( yi )
2
1
exp{
1 2 2
ˆ ˆ ( yi 0 1xi )2} i 1,2, n
联合密度(似然函数)
ˆ ˆ L( 0 , 1, ) f ( y1,, yn )
1 n ( 2 ) n / 2
exp{
1 2 2
ˆ ˆ 2 ( yi 0 1xi ) }
Yi n 0 1 X i (2.3.3) Yi X i 0 X i 1 X 2 i
解得:
其中
X 2i Yi X i Yi X i y X ˆ ˆ 2 2 1 n X i ( X i ) 0 ˆ n Yi X2i Yi X i 1 n X i ( X )2 i
2 ˆ 1 n
ˆ x )2 ( yi 0 ˆ1 i
三、参数估计的矩法(MM)
矩估计(Method of Moment)思想:由
Ei 0 Cov( xi , i ) E( xi i ) 0 使用相应的样本矩条件可写成
1 n 1 n
整理后可得与正规方程组(2.3.2)相同的组式, 故矩估计法与普通最小二乘法及极大似然法有相 同的结果。
证明:
由
2 x i yi xi yi xi y x ˆ ˆ 2 2 0 1 n x i ( xi ) ˆ n yi x2i yi 2xi 1 n x i ( x ) i
ˆ 对 1 进一步推导有
n ( ˆ 1
( n x2i ( xi )2 ) 1 n x2i ( xi )2
1
ˆ E(0 ) 0
五、参数估计量的概率分布及随机干扰项方 差的估计
ˆ ˆ 1.参数估计量 0 和 1 的概率分布 在随机干扰正态分布的假定下,有
2. 随机干扰项 的方差 2 的估计 ˆ 记 ei yi yi 为第 i 个样本观测点的残差,则随机 误差项方差的最小二乘、极大似然和MM估计量分 别为 2 2 2
表2.1.1 某社区家庭每月可支配收入与消费支出统计表 每月家庭可支配收入X 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 每月家庭消费Y 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510
一、普通最小二乘原理 OLS(ordinary least square) 给定一元线性回归模型
设由获得的样本观测值 ( yi , xi ) ( i 1,2,, n) 去估计计量经济模型中的未知参数,
Yi 0 1 X i
0 , 1
i 1 i i
由于
ˆ Q (Yi Yi ) 2
i 1 n n
ˆ ˆ (Yi - ( 0 1 X i ))2
1
是待估参数的二次非负函数,因此其极小值 总存在。 Q 0 0 Q 1 0 易得
( 0 1 X i Yi ) 0 (2.3.2) ( 0 1 X i Yi ) X i 0
Ei 0 Di 2 i 1,2,, n i 1,2,, n
i ~ N (0, 2 ) i 1,2,, n 则对随机抽取的样本在获得参数估计值时,
应服从如下的正态分布
2 ˆ ˆ y i ~ N ( 0 1 x i , )
则其概率密度为
•未知因素的影响;