第五讲 多元回归分析:渐近性
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】
![伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】](https://img.taocdn.com/s3/m/18eda0e150e2524de4187e2b.png)
y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台
对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM
不
χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。
c5 多元回归分析-渐进性质
![c5 多元回归分析-渐进性质](https://img.taocdn.com/s3/m/9605b5e0102de2bd96058838.png)
第
摘要:在第4章中,我们讨论了基于分布假设的小样本的精确统计性质,本章将讨论在没有分布假设前提下的大样本的渐近统计性质(asymptotic propertiesor large sample properties)。
几点说明:
1)唯一的假定是 是有限的;
2)多大样本量才算充分,没有定论,渐近是针对(n-k-1),而不是n;
3)需要同方差的假定;
4)试讨论 ;
5)在该定理中, 被称为 的渐近标准误差(asymptotic standard error),同样的t统计量被称为渐近t统计量(asymptotic t statistics),置信区间被称为渐近置信区间(asymptotic confidence interval),F统计量被称为渐近F统计量.
定理5.1 OLS估计量的一致性
在假设MLR.1-MLR.4下, 为 的一致估计,j=0,1,2,…,k。
该定理的证明示意:在一元回归中, = 收敛于 ,当 .
显然u和x的不相关在该证明中起到了决定性的作用。
假设 MLR.’4 零均值和不相关假设
假定 和 ,j=1,2,…,k.
不采用假设MLR.’4,一是因为若MLR.4不满足,我们得到的可能是一个一致但有偏的估计;二是因为在MLR.4下,我们得到了总体回归函数(PRF),从而线性模型的系统部分有比较明确的意义。
.(5.2)
但由于被忽略的自变量可能和(5.2)式的变量相关,所以我们需要一个辅助回归(auxiliary regression):
对 的回归,
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:OLS的渐近性【圣才出品】
![伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:OLS的渐近性【圣才出品】](https://img.taocdn.com/s3/m/6346b8fb0066f5335b812177.png)
第5章多元回归分析:OLS 的渐近性5.1复习笔记考点一:一致性★★★★1.定理5.1:OLS 的一致性(1)一致性的证明当假定MLR.1~MLR.4成立时,对所有的j=0,1,2,…,k,OLS 估计量∧βj 是βj 的一致估计。
证明过程如下:将y i =β0+β1x i1+u i 代入∧β1的表达式中,便可以得到:()()()()11111111122111111ˆnni ii i i i n ni i i i xx y n x x u xxnxx ββ-==-==--==+--∑∑∑∑根据大数定律可知上式等式右边第二项中的分子和分母分别依概率收敛于总体值Cov (x 1,u)和Var(x 1)。
假定Var(x 1)≠0,因为Cov(x 1,u)=0,利用概率极限的性质可得:plim ∧β1=β1+Cov(x 1,u)/Var(x 1)=β1。
这就说明了OLS 估计量∧βj 具有一致性。
前面的论证表明,如果假定只有零相关,那么OLS 在简单回归情形中就是一致的。
在一般情形中也是这样,可以将这一点表述成一个假定。
即假定MLR.4′(零均值与零相关):对所有的j=1,2,…,k,都有E(u)=0和Cov(x j1,u)=0。
(2)MLR.4′与MLR.4的比较①MLR.4要求解释变量的任何函数都与u 无关,而MLR.4′仅要求每个x j 与u 无关(且u 在总体中均值为0)。
②在MLR.4假定下,有E(y|x 1,x 2,…,x k )=β0+β1x 1+β2x 2+…+βk x k ,可以得到解释变量对y 的平均值或期望值的偏效应;而在假定MLR.4′下,β0+β1x 1+β2x 2+…+βk x k 不一定能够代表总体回归函数,存在x j 的某些非线性函数与误差项相关的可能性。
2.推导OLS 的不一致性当误差项和x 1,x 2,…,x k 中的任何一个相关时,通常会导致所有的OLS 估计量都失去一致性,即使样本量增加也不会改善。
5_多元线性回归分析
![5_多元线性回归分析](https://img.taocdn.com/s3/m/6f2838230c22590103029d0c.png)
……
n xn yn
y
εi 。。
。。。(。x。i, yi)。。。 。。
。
。。
x
0
一元线性回归模型
模型: yi=α+ β xi + εi
(i=1,2…n)
数据的假设条件:
1. 因变量是连续随机变量; 2. 自变量是固定数值型变量,且相互独立; 3. 每一个自变量与因变量呈线性关系; 4. 每一个自变量与随机误差相互独立; 5. 观察个体的随机误差之间相互独立; 6. 随机误差{ei}~N(0,σ)。
• 在模型中添加x变量的方法和向前选择法相同,从模型 中消去x变量的方法和向后消去法相同。
• 添加和消去x变量的顺序原则是,在每添加一个新的x 变量之前,首先用向后消去法原则消去模型内所有超 出停留允许水平的x 变量,然后用向前选择法原则在模 型中添加一个新的x变量。
• 逐步过程法和向前选择法的不同之处是,已经进入模 型的x变量还可以再次从模型中退出;逐步过程法和向 后消去法的不同之处是,已经从模型中消去的x变量还 可以再次进入模型中。
数学模型:
其中:{yi}和{xij}是因变量y和自变量xj 的观察值; β0, β1…βk是待估计的偏回归系数; e i 是yi 的随机误差,且{ei }~N(0,σ)。
一元线性回归分析的数学模型
id x
y
------------------------
1 x1 y1
2 x2 y2
……
i xi yi
data d;
input id x1-x3 y ; cards; 1 1.0 2.3 3.4 10 2 2.1 2.5 3.8 15 3 3.2 3.3 3.8 20 4 4.2 3.9 4.2 22 5 4.8 4.2 5.0 28 run ;
第讲 多元回归分析-OLS的渐近性
![第讲 多元回归分析-OLS的渐近性](https://img.taocdn.com/s3/m/99eb1ee1a0c7aa00b52acfc789eb172ded639992.png)
)
此时,如果 Cov(X1,X2) 0, 则plimβ~1 β1
例题:课本p161,问题5.1
三、渐近有效性
渐近有效性
经1-5过,以那上o么讨通论常我,的我F们检们验知知也道是,道适假用设,的总体假回归设模型总满足体ML回R. 归模型满足MLR.1-5,那么OLS估计 量是最优线性无偏估计量。现实上,可以证明在这些假定下 第五讲 多元回归分析:OLS的渐近性
样 本 容 量 的 增 加,的 分 布 越 来 越 集 中 在 的 周 围 。 经1-5过,以那上么讨O论LS,估我计们量知不道但,是假一设致总的体,回也归是模渐型近满有足效M的L。R.
1也-6就,是O说LS,估即计使量样是本最容优量无再偏大估,计O量LS,估而计且的基偏于误O也LS不估j会计消构逝造,的而某且些O统LS计估量计服值从会t分收布敛或到F一分个布有,偏从误而的可值以j〔进情展况假更设糟检糕验!
1
( Xi X )(Yi Y ) ( Xi X )2
( Xi X )Yi ( Xi X )2
(Xi
X )(0 1 Xi
( Xi X )2
ui
)
1
(Xi X)Xi ( Xi X )2
( Xi X )(ui u) ( Xi X )2
1
1 n1
( Xi X )(ui u)
对于Y 0 1X u
如果满M 足LR.4,即E(u| X) 0,则有: E(u) 0和Cov(X,u) 0。 另 外 , 对 于 任 意 两量组 Xi、 变Yi, 有 :
(Xi X)(Yi Y) (Xi X)Yi (Yi Y)Xi 以及(Xi X) 0
OLS的一致性
OLS的一致性:对简单回归模型的简单证明〔课本p159 〕
Chapter5 多元回归分析:
![Chapter5 多元回归分析:](https://img.taocdn.com/s3/m/6782a0f5ad02de80d5d84068.png)
u的正态性意味着在给定x的条件下y的分布是正态的。
u是不可观测的,因此考虑y的分布 是否是正态的则容易的多。
不幸的是有很多例子表明y的分布不是正态 分布的
例如一些明显偏态的变量:在 某一特定年份中被捕的青年数 量(大部分人不会被捕)
正态分布假定不会影响OLS称为最优线性无 偏估计量,但t统计量和F统计量是否服从t 分布和F分布则与正态分布假定有关。
5.2.1 Central Limit Theorem
利用中心极限定理我们可以证明OLS估计量满 足渐进正态性 (asymptotically normal)
渐进正态性的含义是: P(Z<z)F(z) as n , or P(Z<z) F(z)
中心极限定理表明任何(具有有限方差的)总 体 的一个随机样本的均值经过标准化以后都服 从渐进标准正态分布。
考察吸烟量(cigs)对婴儿体重产生的影响, 观测值共1388个。
当我们使用前一半观测值共694个得到βcigs估 计量标准误约为0.0013,当我们使用全部观测
值时标准误为0.00086
se ˆ j c j n c j se ˆ j n,
足以说明cj是一个不依 赖于样本容量的常数
0.0013 694 0.0342 0.0320 0.00086 1388
还是方差最小的 因此我们说OLS统计量是渐进有效的 注意,OLS统计量的最小方差性是依赖于同
方差假定的,同方差性不满足OLS统计量未 必是方差最小的。
5.2.3 Lagrange Multiplier statistic
在大样本情况下,无需正态假定我们也可以 运用t和F统计量。
但有时我们也可以用其他的方法检验多元排 除约束。
第五章 多元线性回归PPT课件
![第五章 多元线性回归PPT课件](https://img.taocdn.com/s3/m/59797c29f111f18583d05adb.png)
ˆ b0 b1 x1 b2 x2 ... bk xk y
如果xi增加一个单位,即xi变为xi+1,而 其他自变量均保持不变,相应有
ˆ b b x b x y
1 0 1 1 2
2
... bi ( xi 1) ... bk xk
则y的变化幅度为
ˆ [b b x b x ... b ( x 1) ... b x ] ˆ y y [b b x b x ... b ( x 1) ... b x ] b
R
2
二、调整的确定系数
R
2
偏高
<(1:10)
自变量个数 样本规模
三、多元相关系数R
因变量观测值和预测值之间的相关程度
四、方差分析
回归平方和
y的总变 差平方 和
第五节
回归方程的检验和回归系数的推断统计
检验
统计推断
参见郭志刚主编,《社会统计分析方法—SPSS软件应用》第二章, 中国人民大学出版社1999
第一节 相关和回归
一、相关统计量 用一个数值表示两个变量间的相关程度 (无单位度量)(-1~+1)
解读
X与y的相关系数为0.6,x与z的相关系数为 0.3
答案: 只能说明x与y相关程度高于x与z的相关程 度,但不能说前者是后者的两倍
x y x y x y 1 2 y y y y 1 y y 1 2 x x y x 1 x y
y
y
练习:根据下表数据计算lambda
志愿 男
快乐家庭 理想工作 增广见闻 总数 10 40 10 60
性别 女
30 10 0 40
总数
心理学研究方法多元回归分析PPT课件
![心理学研究方法多元回归分析PPT课件](https://img.taocdn.com/s3/m/b5a48005bf23482fb4daa58da0116c175f0e1e8a.png)
save ——distance –勾上Cook’s和leverage 值
Plots-histogram 和 normal probability plot勾
上-把ZPRED放入Y,把ZRESID放入X轴——
.
12
OK
原始回归方程Y=0.0498X+0.441
标准化回归方程Zy=0.881Zx
β = (δy/ δx)*r =(0.41989/7.426)*0.881=0.04981
.
29
步骤同一元回归
补充步骤 在statistic勾上R square change,part and partial correlation(半偏 相关和偏相关), conlinerarity diagnostics (共线性判断)
.
30
分层回归方法
Enter:强制进入 Forward:前向选择法 Backward:反向删除法 Stepwise:逐步回归,最常用 把需要控制的变量用这种方法强制enter法
.
39
对强影响点的诊断和处理
同一元线性回归
.
40
多重共线性(conlinerarity diagnostics)
判断方法
✓ 相关系数矩阵:当相关系数>0.8,代表共线性 越大。
✓ 容忍度(tolerance):最大值为1。当值越小, 代表共线性越大。
✓ 特征值(eigenvalue):表示该因子所解释变 量的方差。如果很多变量的特征值<1,表示共 线性。
残差是否独立:用durbin-watson进行分析(取值 0<d<4)。如果独立,则d约等于2。如果相邻两点的 残差为正相关,d<2。当相邻两点的残差为负相关时, d>2。
3.多元回归分析3:渐近性剖析.
![3.多元回归分析3:渐近性剖析.](https://img.taocdn.com/s3/m/02b2db24cc7931b764ce1505.png)
N=500
N=100
7
θ
无偏性和一致性
估计量在有限样本中有偏的,但可能具有一致性
若随机变量X的方差为 2,则对于随机样本{xi , i 1n},
2的有偏估计量sx2 (xi x)2 / n,却是 2的一致估计量。
估计量是无偏的,但可能不具有一致性
( Cov x1,u 0)
9
一个弱一点的假设
对于无偏性,利用的假定条件是:
E(u|x1, x2,…,xk) = 0
为得到一致性,所需要的假设要弱一些:零均值和零 相关性
E(u) = 0 cov(xj,u) = 0, for j = 1, 2, …, k
没有这一假定(cov(xj,u)≠0),OLS估计量可能是有偏
b1
b21
12
不一致性可以看成是偏误
不一致性与偏误主要的区别在于,偏误使用的是总体方差和总 体协方差,无偏性用的是样本方差和样本协方差
不一致性的严重程度取决于解释变量与遗漏变量之间的相关程 度
非一致性是大样本问题,不会因为样本容量的增大而消失
遗漏变量不仅会导致与之具有相关性的解释变量对应的估计系 数不具有一致性,也会导致与之不具有相关性的解释变量对应 的估计系数不具有一致性;除非遗漏的变量与所有的解释变量 都不相关,从而使得扰动项满足高斯-马尔科夫经典假定
多元回归分析:
大样本性质(渐近性)
1 y = b0 + b1x1 + b2x2 + . . . bkxk + u
在高斯-马尔科夫假定下,OLS估计量是BLUE。但并 不是在任何情况下都能得到无偏估计量。
多元回归分析 ppt课件
![多元回归分析 ppt课件](https://img.taocdn.com/s3/m/f4313eb1240c844769eaeeb3.png)
ppt课件
3
汽车销售
若公司管理人员要预测来年该公 司的汽车销售额y时,影响销 售额的因素---广告宣传费x1
还有个人可 支配收入x2, 价格x3
ppt课件
4
研究地区经济增长GDP,受劳动力投入人数 x1影响!
还有:资本要素X2,科 技水平X3的影响
ppt课件
5
多元回归应用
25.96732 2.85478 0.01449
Lower 95% 57.58835 -48.57626 17.55303
Upper 95%
555.46404 -12.237392
130.70888
多元回归方程
Sales 306.526- 24.975(Prci e) 74.131(Advertising)
Sales 306.526- 24.975(Prci e) 74.131(Advertising) 306.526- 24.975(5.50) 74.131(3.5) 428.62
预测销量为 428.62 pies
ppt课件
注意:单位百元,$350 意味 X2 = 3.5
24
模型的F检验 系数的T检验 拟合度检验--决定系数
描述因变量 y 依赖于自变量 x1 , x2 ,…, xk 和误差项 的方程,称为多元回归模型
y 0 1x1 2 x2 k xk
β0 ,β1,β2 ,,βk是参数
是被称为误差项的随机变量
包含在y里面但不能被k个自变量的线性关系所解释
的变异性
价格 Price
($) 5.50 7.50 8.00 8.00 6.80 7.50 4.50 6.40 7.00 5.00 7.20 7.90 5.90 5.00 7.00
第五讲多元线性回归
![第五讲多元线性回归](https://img.taocdn.com/s3/m/e10c8e390c22590103029d03.png)
当影响变量Y的主要因素有k个时,可以建立起的总体回归模型为
– 变量的季节性差异。如旺季和非旺季,一年 1、回归系数的显著性检验
同样可以通过最小二乘法求出回归系数的估计值。
四季等。 3、解决的办法是抛弃其中一个变量,或是对变量作一些变换,如用相对数代替绝对数等。
模型的检验
1、回归系数的显著性检验
– 查t分布表,自由度为n-k-1,在有多个自变量 时,某个回归系数通不过,可能是这个系数 对应的自变量对因变量的影响不显著,也可 能是多重共线性所致。
2、回归方程的显著性检验
– H0 :1=2=…=k=0 H1 : j不同时为零
F( y (ˆyˆy)2y/)n2/kk1
2、这时的净回归系数是不可靠的。
市与非城市的差别。X =1(城市),X =0 如果回归分析的目的是要精确地测定每个自变量对因变量的单独影响,那么,各个净回归系数的可靠性显然是重要的。
2、回归方程的显著性检验 Y= 0+ 1X1+ 2X2+…+庭食物支出额的影响因素中,考虑城市与非城市的差别。
是当X2保持固定时,X1每变化一个单位时Y所 发生的变化;b2测定的是当X1保持固定时,X2 每变化一个单位时Y所发生的变化
多重共线性问题
1、如果自变量之间高度相关,则我们在进行多元回 归分析时可能会得到一些奇怪的结果。如在一元 回归时,回归系数为正,而在二元回归时,回归 系数却为负。
2、这时的净回归系数是不可靠的。因为当自变量间 呈高度相关时,我们很难区分出每一个变量的单 独的影响。
第五讲多元线性回 归
多元线性回归模型
多元线性回归是一元线性回归的逻辑推广。当 影响变量Y的主要因素有k个时,可以建立起的 总体回归模型为
多元回归分析
![多元回归分析](https://img.taocdn.com/s3/m/8231fa555e0e7cd184254b35eefdc8d376ee1433.png)
多元回归分析多元回归分析是一种常用的统计方法,用于研究多个自变量对一个因变量的影响。
该方法可以帮助研究人员理解不同自变量对因变量的相对重要性,并建立预测模型。
本文将介绍多元回归分析的基本原理和应用,并通过一个实例来说明其实际应用价值。
多元回归分析的基本原理是基于线性回归模型。
线性回归模型的基本形式是:Y = β0 + β1X1 + β2X2 + ... + βnXn + ε其中,Y表示因变量,X1至Xn表示自变量,β0至βn表示回归系数,ε表示误差项。
多元回归分析通过求解最小二乘法来估计回归系数,以找到最佳拟合线。
回归系数的估计结果可以反映不同自变量对因变量的影响。
多元回归分析的应用十分广泛,特别是在社会科学、经济学以及市场营销等领域。
例如,研究人员可以使用多元回归分析来探索广告投资对销售额的影响,或者研究不同因素对消费者购买行为的影响。
为了更好地理解多元回归分析的应用,我们以市场营销领域的一个案例为例。
假设某公司希望了解其产品销售额与广告投资、价格和竞争公司销售额之间的关系。
研究人员首先收集了一段时间内的数据,包括广告投资、产品价格和竞争公司销售额的信息。
在进行多元回归分析之前,研究人员需要对数据进行预处理,包括数据清洗、变量选择和变量转换等。
然后,他们可以根据以上模型构建一个方程,以评估广告投资、价格和竞争公司销售额对销售额的影响。
通过对数据进行多元回归分析,研究人员可以得到各自变量的回归系数。
这些系数可以告诉他们不同自变量对销售额的相对重要性。
例如,如果广告投资的回归系数较大,则说明广告投资对销售额的影响较大;反之,如果竞争公司销售额的回归系数较大,则说明竞争对销售额的影响较大。
通过多元回归分析的结果,研究人员可以得出一些结论,并提出相应的建议。
例如,如果广告投资对销售额的影响较大,公司可以考虑增加广告投资以提高销售额。
如果价格对销售额的影响较大,公司可以考虑调整产品价格以更好地满足消费者需求。
5多元回归分析OLS渐近性课件
![5多元回归分析OLS渐近性课件](https://img.taocdn.com/s3/m/6cd582f0f7ec4afe04a1dfcb.png)
5多元回归分析OLS渐近性
2.复习:一致性
5多元回归分析OLS渐近性
何谓一致性 What is Consistency?
LetWn beanestimatorofbasedonasampley1,y2,...,yn. Wn isaconsistentestimatorof ifforevery>0, Pr(|Wn |)0asn. WhenWn isconsistent,wealsosaythatistheprobability limit ofWn, writtenasplim(Wn).
令W n 是基于样本y1,y2,...,yn的关于 的估计量。
如果对于任何 > 0 ,当 n时 P r(|W n|) 0
W n 便是 的一个一致估计量。 当 W n 具有一致性时,也称 为 W n 的概率极限,写作
plim(Wn).
5多元回归分析OLS渐近性
一致性的含义 Explaining consistency
Chapter 5 Multiple Regression Analysis: OLS Asymptotics (1)
y = b0 + b1x1 + b2x2 + . . . + bkxk + u
5多元回归分析OLS渐近性
Chapter Outline
• 一致性 • Consistency
• 渐近正态和大样本推断 Asymptotic Normality and Large Sample Inference
• Asymptotic Efficiency of OLS OLS的渐近有效性
5多元回归分析OLS渐近性
第五讲 多元回归分析:渐近性
![第五讲 多元回归分析:渐近性](https://img.taocdn.com/s3/m/a875d2d7d5bbfd0a795673c2.png)
计量经济学导论 刘愿
2
5.1 一致性 渐进性的含义:
如果误差并非正态分布,对任何的样本容量而 言,t统计量、F统计量并非恰好服从t分布、F 分布。 幸运的是,即使没有正态性假定,t统计量和F 统计量仍然渐进的服从t分布、F分布,至少在 大样本情况下使如此。
计量经济学导论
3
一致性
在高斯-马尔科夫假定下,OLS估计是最优线 性无偏的,但我们并非总能得到无偏的估计量。 一致性是对一个估计量最起码的要求。在无法 满足无偏性的情况下,我们可以搜集尽可能多 的样本,即使n→ ∞,参数估计值的分布将逼近 真实参数值。
计量经济学导论
4
一致性的正式定义
令Wn是基于样本Y1 , Y2 , , YN的参数的估计值, 则Wn是的一致估计量,对于任意一个正数 0, P Wn 0,当n 否则,Wn不是的一致估计量。 当Wn 是一致时,我们说 是Wn的概率极限,记为: plim Wn
j j
如果我们能够搜集到所需要的样本数据,我们就能让 估计量任意接近于b j。
一致性是统计学或计量经济学中对所用估计量的一个起 码要求。
计量经济学导论
6
当样本容量增加时的样本分布
计量经济学导论
7
定理5.1 OLS的一致性 在假定MLR.1~MLR.4下,对所有的j=0,1, ,k,OLS ˆ 都是b 的一致估计。 估计量b j j ˆ b pli m b j j
1 ^ 1
^
计量经济学导论
12
不一致性的推导
与遗漏变量偏误的推导类似,渐进偏误推导如下:
p lim b1 b1 cov(x, u) / var(x)
多元线性回归课件
![多元线性回归课件](https://img.taocdn.com/s3/m/5a38807a5b8102d276a20029bd64783e09127df6.png)
线性关系
自变量与因变量之间存在线性 关系。
无异方差性
误差项的方差在所有观测值中 保持恒定。
无异常值
数据集中没有异常值。
02
多元线性回归的参 数估计
最小二乘法
最小二乘法是一种数学优化技术,其 基本思想是寻找一个函数,使得该函 数与已知数据点的总误差(或总偏差 )的平方和最小。
最小二乘法通过构建残差平方和பைடு நூலகம்数 学模型,并对其求最小值来估计参数 ,这种方法具有简单、直观和易于计 算的特点。
在多元线性回归中,最小二乘法的目 标是找到最佳参数值,使得实际观测 值与通过模型预测的值之间的残差平 方和最小。
参数的估计值与估计量的性质
参数的估计值是通过最小二乘法 或其他优化算法从样本数据中得
多元线性回归课件
目录
CONTENTS
• 多元线性回归概述 • 多元线性回归的参数估计 • 多元线性回归的评估与诊断 • 多元线性回归的进阶应用 • 多元线性回归的软件实现 • 多元线性回归的案例分析
01
多元线性回归概述
定义与模型
定义
多元线性回归是一种统计学方法,用于 研究多个自变量与因变量之间的线性关 系。
决定系数(R^2)
衡量模型解释变量变异程度的指标,值越接近1表示模型拟合度越好。
调整决定系数(Adjusted R^2)
考虑了模型中自变量的增加,对R^2进行调整后的拟合度指标。
均方误差(MSE)
衡量模型预测误差大小的指标,值越小表示模型预测精度越高。
变量的显著性检验
t检验
通过t统计量检验自变量对因变量 的影响是否显著,值越大表明该 变量越重要。
用于判断自变量之间是否存在多重共线性的指标,值小于阈值时可能存在多重共线性问 题。
第5章 多元回归分析OLS的渐进性
![第5章 多元回归分析OLS的渐进性](https://img.taocdn.com/s3/m/be49ae4a767f5acfa1c7cd61.png)
Yt β 0 β 1 X 1t β 2 X 2t ..质或大样本性质
1.一致性
• OLS估计量在假定MLR1-MLR4下是无偏的, 但在时间序列回归中会失去无偏性 • 当n→∞时估计量接近于真实值
推导OLS的不一致性
• 如果误差与任何一个自变量相关,那么 OLS就是有偏而又不一致的估计 • β 的不一致性(渐进偏误)为
• 对于OLS的不一致性,根据定义这个问题 不会随着在样本中增加更多的观测而消失, 更多的观测只会使这个问题变得更糟
2.渐进正态和大样本推断
• 仅有一致性不足以进行参数假设检验 • 在经典线性模型假定MLR.1---MLR.6下,抽 样分布是正态的:t、F分布的基础 • OLS估计量的正态性 总体中误差u分布的 正态性 y分布的正态性 • 现实中存在很多y不是正态分布,是否放弃t 统计量?
• 定理5.2,去掉了正态性假定MLR.6,对误 差分布唯一的限定是有限方差 • 标准正态分布在式5.7中出现的方式与tn-k-1 不同,随着自由度的增加, tn-k-1趋近于正 态分布,因此如下写法也是合理的
• 进行t检验和构造置信区间与在经典线性模 型的假定下是一样的,n>30
其他大样本检验:拉格朗日乘数统计量
• 依赖于大样本条件下使得F统计量有效的假 定,无需正态性假设
3.OLS的渐进有效性
• 在k个回归元的情形中,将OLS的一阶条件推广, 可以得到一类一致估计量
多元回归分析:OLS的渐近性
![多元回归分析:OLS的渐近性](https://img.taocdn.com/s3/m/d8f3ac022f60ddccda38a0c1.png)
一致性与无偏性
无偏估计量未必是一致的,但是那些当样 本容量增大时方差会收缩到零的无偏估计 量是一致的。
ห้องสมุดไป่ตู้
一致性
在高斯-马尔可夫假定下OLS 是最优线性无偏 估计量,但在别的情形下不一定能找到无偏估计 量。 在那些情形下,我们只要找到一致的估计量,即 当n ∞时, 这些估计量的分布退化为参数的真值。
渐近偏差(续)
所以,考虑渐近偏差的方向就像是考虑存在一个 遗漏变量时偏差的方向。 主要的区别在于渐近偏差用总体方差和总体协方差表示,而 偏差则是基于它们在样本中的对应量。 记住,不一致性是一个大样本问题。因此,当数据增加时候 这个问题并不会消失。
有内生性时的一致性
考虑真实模型为y = b0 + b1x1 + b2x2 + u ,但u和x1相关。 若x1 和x2相关,而u和x2不相关,则对b1和b2的OLS估计量 都是不一致的。 若x1 和x2不相关,且u和x2不相关,则只有对b1的OLS估计 量是不一致的
xi1 x1 yi 2 x x i1 1 xi1 x1 ui b1 2 x x i1 1 n 1 xi1 x1 ui b1 2 1 n xi1 x1
ˆ b 1
证明一致性
Because as n , n 1 xi1 x1 ui 0 n
Wn 便是 的一个一致估计量。
当Wn 具有一致性时,我们也称 为 Wn 的概率极限,写 作是 p lim(Wn ) .
一致性与无偏性
一个估计量是否有可能在有限样本中是有偏的但 又具有一致性? 假设Z的真值为0,一个随机变量X以(n-1)/n的概 率取值为Z,而以1/n的概率取值为n。
第5章 多元回归分析OLS的渐近性
![第5章 多元回归分析OLS的渐近性](https://img.taocdn.com/s3/m/4f5d1abc69dc5022aaea00b6.png)
2
a
5.2 渐近正态和大样本推断
以上定理的重要之处在于,它去掉正态性假设 MLR.6,只要求误差项具有有限方差。它指出, 只要样本足够大,进行参数检验和构造置信区 间,都与经典线性模型下的做法完全一样。 样本容量要多大才能符合大样本的要求?有些 学者认为n=30就令人满意,但这不可能对付u 的所有可能的分布,样本还是尽可能的大,这 在社会科学基本能满足。在大样本下使用的统 计量又称渐近统计量。
LM统计量只要求估计约束模型:
y b0 b1 x1 b k q xk q u
湖大商学院 chenqianli
5.2 渐近正态和大样本推断
在原假设成立下,u 应该与样本中这些变量都不相 关,LM检验就是利用约束模型回归后的残差来 对此进行检验,采用的辅助回归:
u 0 1 x1
ˆ b cov x , u / var x p lim b j j 1 1
多元回归的推导涉及到大样本理论,比较复杂。
湖大商学院 chenqianli
5.1 一致性
OLS估计量的不一致性:误差项与任一自变量 相关 简单回归的渐近偏误:
ˆ b cov x , u / var x p lim b j j 1 1
湖大商学院 chenqianli
第五章 多元回归分析:OLS的渐近性
前两章讨论的多元回归模型的OLS估计 量的性质是有限样本、小样本或精确性 质,即对任何样本容量均成立的性质。 在统计推断时,我们需要假设误差项服 从正态分布的MLR.6,如果此假设不成 立,t统计量和F统计量不再原先的分布, 由此有必要了解估计量和检验统计量的 渐近性质或大样本性质。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
bˆ
j
ˆ b se b ~ t
a j j
n k 1
因此,随着样本量增大,我们无需再担心 正态性假定是否满足问题,但仍然需要同 方差性。
计量经济学导论
22
渐进标准误
如果u不是正态分布的,下式被称为渐进标准
误,t统计量称为渐进t统计量。
ˆ se b j
j
SST j 1 R
计量经济学导论
14
渐进偏误方向的总结
Corr(x1, x2) > 0 Corr(x1, x2) < 0
1 0
+
1 0
-
b2 > 0 b2 < 0
-
+
计量经济学导论
15
5.2 渐进正态与大样本推断 大样本推断:
在经典线性模型假定下,样本分布呈正态性, 我们可以进行t和F检验。 这一正态性假定依赖于我们假定总体误差服从 正态分布。 误差正态分布意味着,给定x情况下,y服从正 态分布。
计量经济学导论
16
大样本推断
不满足正态性的情形相当普遍。任何偏向的变 量,如工资、被逮捕次数、储蓄等,不可能是 正态分布的。(正态分布意味着对称分布) 注意:正态性假定在OLS的最优线性无偏性中 并非必要的,仅仅是影响推断。
计量经济学导论
17
中心极限定理
根据中心极限定理,可以证明OLS估计值服从 渐进正态。 渐进正态意味着: P(Z<z)F(z) as n , 或者 P(Z<z) F(z) (标准正态累积分布函数)。 中心极限定理表明,任何均值为m ,方差为s2 经标准化后渐进的服从标准正态分布
计量经济学导论 刘愿
2
5.1 一致性 渐进性的含义:
如果误差并非正态分布,对任何的样本容量而 言,t统计量、F统计量并非恰好服从t分布、F 分布。 幸运的是,即使没有正态性假定,t统计量和F 统计量仍然渐进的服从t分布、F分布,至少在 大样本情况下使如此。
计量经济学导论
3
一致性
在高斯-马尔科夫假定下,OLS估计是最优线 性无偏的,但我们并非总能得到无偏的估计量。 一致性是对一个估计量最起码的要求。在无法 满足无偏性的情况下,我们可以搜集尽可能多 的样本,即使n→ ∞,参数估计值的分布将逼近 真实参数值。
计量经济学导论
26
计量经济学导论
27
拉格朗日乘数统计量
将y对施加限制后的自变量集进行回归,并保 留残差uhat。 将uhat对所有自变量进行回归,并得到R2,记 为R u2. 计算LM=n Ru2. 将LM与xq2分布中适当的临界值c比较,如果 LM>c,就拒绝原假设。否则,我们就不能拒 绝原假设。
Z
Y mY
s
~ N 0,1
a
n
计量经济学导论
18
定理 5.2 OLS的渐进正态性
Under theGauss - Markovassumption s,
2 2 ˆ (i) n b j b j ~ Normal0, s a j ,
where a
2
2 j
ˆ plimn r
多元回归分析:渐进性
y = b0 + b1 x 1 + b2 x 2 + . . . bk x k + u
Copyright © 2007 Thomson Asia Pte. Ltd. All rights reserved.
1
5.1 一致性
5.2 渐进正态和大样本推断 5.3 OLS渐进有效性
ˆ2 s
2 j
ˆ s SSR j
,
1 n 2 SSR ˆ ˆi s u n 2 i 1 n2 ˆ c se b n , SST ns 2
j j j
可以预期,标准误的收缩速度为样本容量平方 根的倒数。
计量经济学导论
23
大样本检验方法:LM检验 LM Statistic (cont)
计量经济学导论
20
Law of large numbers—大数定理
令Y1,Y2,…,Yn是均值为u的独立同分布随机变量,则 (C.8)成立。大数定理意味着,我们若对估计总体均值u感 兴趣,通过选取一个足够大的样本,便能得到一个任意接近u 的数。
计量经济学导论
21
渐进正态性
随着自由度提高,t分布渐进服从正态分布, 因此有:
Suppose we have a standard model, y = b0 + b1x1 + b2x2 + . . . bkxk + u and our null hypothesis is H0: bk-q+1 = 0, ... , bk = 0 First, we just run the restricted model
计量经济学导论
25
LM Statistic (cont)
LM ~ , so can choosea critical
2 q 2 value, c, froma q distribution, or a
just calculatea p - value for
2 q
With a large sample, the result from an F test and from an LM test should be similar. LM>c, reject H
计量经济学导论
28
Example: Economic Model of Crime(数据来源: CRIME1)
Narr86为一个人被拘捕的次数; Pcnv为以前被拘捕后被定罪的次数; Avgsen为过去定罪后被判刑的平均时间长度; Tottime为此人在年龄达到18岁后在1986年以前被送进监狱的总次数; Ptime86为1986年坐牢的月数; Qemp86为此人在1986年合法就业的季度数。
计量经济学导论
13
渐进偏误
渐进偏误的方向与遗漏变量偏误的方向类似。 两者的区别在于,渐进偏误使用总体方差和协 方差,遗漏变量偏误则基于样本对应量(以x 的样本值为条件) 不一致性是大样本问题,即使增加数据量,不 一致性问题仍然存在。 如果X1与X2不相关,则为不一致估计量;如 果相关,则为一致估计量。
s2
2 j
SST j 1 R
r
n i 1
s2
2 ij
n 2 2 ˆ b j b j N 0, s rij i 1 ˆ b N 0, s 2 a 2 n b j j j
n 2 1 2 a j p lim n rij i 1
b pcnv b ptime86 b qem86 u narr86 b 0 1 4 5
0 1 pcnv 2 avgsen 3totime 4 ptime86 5qem86 v u Ru2 0.0015, LM 2725 0.0015 4.09 4.61 q ,10%, x2 ,
n
计量经济学导论
8
OLS的一致性
在高斯-马尔科夫假定下,OLS估计值是一致 且无偏的。 类似的,我们可以像无偏性一样证明一致性, 为此需要引入概率极限。
计量经济学导论
9
简单回归中证明一致性
x
ˆ x x y b i1 1 i 1
i1
b 0 xi1 x1 b1 xi1 x1 xi1 xi1 x1 ui
1 ^ 1
^
计量经济导论
12
不一致性的推导
与遗漏变量偏误的推导类似,渐进偏误推导如下:
p lim b1 b1 cov(x, u) / var(x)
^
T rue model: y b 0 b1 x1 b 2 x2 v You think: y b 0 b1 x1 u, so that ~ u b 2 x2 v and, plimb1 b1 b 2 where Covx1 , x2 Var x1
计量经济学导论
11
不一致性的推导
b1 的不一致(有时也粗略地称为渐近偏误)为:
^
p lim b1 b1 cov(x, u) / var(x)
^
因为Var(x)>0,所以,若x与u正相关,则 b 的 不一致就为正,而若x与u负相关,则 b 的不 一致为负。如果x与u之间的协方差相对于X的 方差很小,那么这种不一致就可以忽略。
10
n
x1
1
2
x
i1
x1
2
计量经济学导论
一个较弱的假定
为了得到无偏性,我们需要零条件均值假设 E(u|x1, x2,…,xk) = 0→x的任意函数都与u无关 为了得到一致性,我们仅需要较弱的假定:零 均值和零相关:E(u) = 0 ,Cov(xj,u) = 0, for j = 1, 2, …, k. →每一个xj都与u无关。 不满足上述条件,OLS是有偏和不一致的。
b x ... b x u yb 0 1 1 k q k q , and regress Now take the residuals, u on x1 , x2 ,..., xk (i.e. all the variables) u LM nRu2 , where Ru2 is from this reg