双变量区间估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

bˆ 2
b2
( ) b 2
+
tc 2,
* Se
n-2
bˆ 2
Stata得到的t值
H0: b2= 0 H1: b2 0
0.5091 - 0 t=
0.0357
Se(β^2)
RSS
SEE= s^
单尾t检验
我们也可假定: 1. 计算:
H0 : bˆ 2 0.3 H1 : bˆ2 > 0.3
t
=
bˆ 2 - b2
单尾t检验的判断标准
决定准则
第5步: 如t > tc ==> 拒绝 H0
右尾
如 t < tc ==> 不拒绝 H0
右尾
左尾
0 tc < t
t < -tc 0
(如 t < - tc ==> 拒绝H0 )
(如 t > - tc ==> 不拒绝 H0 )
左尾
双尾t检验
1. H0 : bˆ 2 = b2 H1 : bˆ 2 b2
表述出假设
2. 计算
t
=
bˆ 2 - b2
Se(bˆ 2)
3. 查t表得临界值:
t
c
, n-2
2
双尾t检验
4. 比较 t 和 tc
决定准则:
5. If t > tc or -t < - tc , 故拒绝 Ho or | t | > | tc |
接受域
拒绝域
拒绝域
( ) b 2 -
t
c
* Se
2, n-2
构造 bi 的置信区间
t
=
bˆ2 - b2 Se (bˆ 2)
t=
估计值 – 实际参数 估计量的标准误
t
=
(bˆ2
-
b2)

x2
使用t来构造b2的区间
或者是其他需要对比的值
SEE
构造 bi 的置信区间
运用t分布构造的 b2 区间:
Pr
-
t
c
t*
t
c
=1-
, n-2
, n-2
2
2
其中
±t
c
是双尾下的t的临界值
Se (bˆ 2)
t = 0.5091 - 0.3 = 0.2091 = 5.857 0.0357 0.0357
单尾t检验
2. 查表 得
tc 0.05, 8
t
c =1.860
0.05, 8
= 0.05
3. 比较t 和临界标准 t值
t
=
5.857
>
tc 0.05 , 8
= 1.860
\ reject H 0
▪ p值与显著性水平关系,如果要选定 ,那 么,当p值小于或等于 时,则在水平上拒 绝原假设。反之,不拒绝原假设。
回归分析与方差分析
▪ 在回归分析中,我们推出了下式
TSS=ESS+RSS
▪ 总平方和TSS的自由度为n-1;解释平方和的 自由度为1;残差平方和的自由度为n-2
▪ 考虑显著检验问题
F = ESS /1 = RSS /(n - 2)
(2) 来自于显著检验的方法:
比较t值和临界t值:
t
=
bˆ 2 Se
- b2
(bˆ2)
=
0.5091 - 0.3 = 0.0357
0.2091 0.0357
= 5.857
tc0.025, 8 = 2.306
,
t
=5.857>
t
c
0.025
,
8
=
2.306
==> reject H0
这意味着b2 不等于 0.3
- 1.96
<
bˆ 2 - b 2 Se ( bˆ2)
<
1 .96
构造 bi 的置信区间
bˆ 2
-
1.96*
Se(bˆ
)
2
<
b2
<
bˆ 2
+
1.96
*
Se(bˆ 2
)
bˆ2±1.96*Se(bˆ2)
事实上, s2 是不可知的, 我们不得不使
用无偏估计量
sˆ 2
=

2 i
n-2
RSS
运用t分布来替代标准正态分布.
“接受” 或 “拒绝”
接受原假设: 我们能够说的是基于样本我们不能拒绝; 我
们不能说原假设是毫无疑问的.
因此 “接受” Ho , 我们应该意识到另一个 假设可能和数据是协调的.所以统计的结论 “不拒绝”优于“接受”
“零”原假设与“2-t”法则
▪ 检验某一个变量对于因变量的解释能力,或 变量的显著性,这一问题就表述为对应的系 数是否可约束为零,即为H0:b2=0,即零原 假设或简称为零假设。
检验显著性水平的方法: 单尾t检验规则
第1步:
H0 : bˆ 2 b2 (H0 : bˆ 2 b2) H1 : bˆ 2 > b2 (H1 : bˆ 2 < b2)
表述出假设
第2步:
t*
=
bˆ 2 Se
- b2
(bˆ 2)
第3步: 查t值表
寻找临界值
计算t*值
tc , n-2
第4步: 比较 tc 和t*
▪ 零假设检验有一常用的法则(“2-t”法则):如 果自由度大于或等于20,显著性水平为.05, 则所计算的t的绝对值超过2时,应拒绝零假 设 H0:b2=0
显著性水平
▪ 通常选定的显著性水平 ,其实质含义为犯 第I类错误的概率,所谓第I类错误是指,在 原假设为真时,拒绝这一正确的原假设,即 去真。而对应的取伪的概率即为犯第II类错 误的概率,即接受了错误的假设的概率。
单尾t检验
H0 : bˆ 2 b*2 H1 : bˆ 2 < b*2
“ 左尾检验的判断准则”
If
t
<
-
tc , df
=>
拒绝 H0
左尾
b^
b*
b*- tc Se(b^)
双尾t检验
假设我们假定
H0 :b 2 = 0.3
H1 : b
观察的
2
0.3
bˆ2
和真实的b2一致吗 ?
(1) 置信水平: 95% 置信水平是 (0.4268, 0.5914) 不包括真实的b2. b2 不等于 0.3
OLS估计量属性
bˆ 1 和 bˆ 2 是正态分布的
(n
- 2 ) sˆ 2
s2
~
x2 (n -2 )
假设检验和置信区间
f (bˆ ) 2
密 度
OLS估计量的可信度有多大 ?
b1距b^1 有多近? b2 距b^2有多近?
估计的 ^b2 落入区间
真实值
bˆ - d 2
b 2
bˆ + d 2
bˆ 2
,
8 (0.0357
)
0.5091 ± 2.306 x 0.0357
0.5091 ±0.0823
d
(0.4268 , 0.5914 )
90% 的置信区间:
0.5091
±t
c 0.05
, 8 (0.0357 )
0.5091 1.860(0.0357)
0.5091 0.0664
d
(0.4427, 0.5755)
F 0 1.0
Nonnegative values only
Ka-fu Wong © 2003
Chap 10- 5
正态分布检验--JB检验:
▪ JB正态性检验是基于偏态和峰态,所谓偏态 是对分布的对称性而言,因为正态分布是对 称的,故偏态为0,F分布不对称,故偏态不 为0
▪ 正式地,偏态S定义为
S
是显2著, n -水2 平
2
(n-2) 是自由度 (两变量情况下).
构造 bi 的置信区间
因此
( )
Pr
tc 0.05
, n-2
bˆ 2
-
b 2
Se
bˆ 2
tc 0.05 , n - 2
= 0.90
Pr(
-tc 0.025,
n-2
(b^2-
b2)/Se(b^2)
tc 0.025,
n-2
)
=
实际估计的 b2 可能落入该区间

E(bˆ 2
)
=b
2
2
构造 bi 的置信区间
f (Z)
转换成标准正态分布
O
Z
=
bˆ 2 - b2
Se(bˆ 2)
构造 bi 的置信区间
假设实际的 s2可知,运用正态分布来对b2作
出判断
~ Z
=
bˆ 2 - b 2
Se (bˆ 2 )
N (0,1)
= (ˆb2 - b2 )
=
[E态分布检验--JB检验(续):
▪ 而峰态是对分布的高尖而言,峰态K定义为
K = E(X - )4 [E(X - )2 ]2
▪ 正态分布的峰态为3,大于3的为尖峰态,小 于3的为扁峰态。
▪ 正态JB检验为
JB
=
S2 n[
+
(K
- 3)2
]
~
2 (2)
6 24
bˆ 2
&
Se
bˆ 2
从估计结果查得
b2 95%水平得置信区间:
( ) bˆ2
±tc
0.025,
n-2
*Se bˆ2
假定 bˆ2 = 0.5091, n = 10, Se( bˆ2 ) = 0.0357,
95% 的置信区间:
bˆ 2
±t
c
2,
n-2
*
Se(
bˆ 2 )
0.5091
±t
c 0.025
x2
s
事实上是不可观察的
构造 bi 的置信区间
假设:
95% 2.5%
- 1.96
0
接受域
2.5% 1.96
构造 bi 的置信区间
Pr (- 1.96 < Z < 1.96 ) = 0.95
Pr - 1.96 < bˆ 2 - b2 < 1.96 = 0.95 Se (bˆ 2)
95% 置信区间:
0.10
构造 bi 的置信区间
假设:
u i ~ N(O, s2u )
( ) bˆ1
~
N
s b , 2
1
bˆ 1
( ) bˆ 2
~
N
s b , 2 2 bˆ 2
Var(u) =su2
E(u) = O
s2 bˆ 1
=
s
2
x2 i
n
x
2 i
s2 bˆ 2
=
s2 xi2
构造 bi 的置信区间
f (bˆ ) 2
0.95
整理,
( ( ) ( )) Pr
bˆ 2
tc 0.05
,
n-2
* Se
bˆ b bˆ + tc * Se
2
2
2 0.05 , n - 2
bˆ 2
= 0.90
因此 b2 90%水平的置信区间:
( ) bˆ 2
±tc 0.05 ,
n-2
* Se
bˆ 2
( ) tc 0.05, n-2
从t表查得
F分布图
The F-Distribution, F(m,n)
Not symmetric (skewed to the right)
Each member of the family is determined by two parameters: the numerator degrees of freedom (m) and the denominator degrees of freedom (n).
随机区间 (置信区间)
假设检验和置信区间
bbˆˆ22
+
d 称置信下限 d称置信上限
(bˆ2 -d)和(bˆ2 +d)之间区间称为随机区间
(置信区间)
0.99
Pr( bˆ2-d < b2 < bˆ 2+d ) = (1-)
0.95 0.90
(1-) 是置信系数: (0< <1)
也称显著水平.
0.01 0.05
▪ 所谓检验势(power of the test)定义为1- Pr.(犯第II类错误),这是目前在仿真实验中 所使用的概念,它主要用在计量经济学的理 论研究中, 以此评价所构造的统计量的检验 能力.
精确显著性水平:p值
▪ 计量经济学软件中,目前广泛使用精确的概 率值,它表示所设定的原假设可被拒绝的最 低的显著性水平
第五章
双变量回归:区间估计和假设检验
OLS估计值在多大程度上可靠?
双变量下OLS估计量的性质
bˆ 1
1. 无偏估计
bˆ sˆ 2 2
E(bˆ1) = b1
E(bˆ 2)=b2
[ ( )] 2. 最小方差
Se
bˆ1
2
=
x n x2
×s 2
[Se(bˆ 2)]2
=
s2 bˆ 2
=
s2 x
2
3. 推论: 随n 变大, 估计更精确
bˆ22
uˆi2
xi2 /(n -
2)
=
bˆ22 sˆ 2
xi2
回归分析与方差分析(续)
▪ 在扰动为正态分布且在H0:b2=0之下,统计 量F服从F分布,其第一自由度为1,第二自 由度为n-2
▪ 对于双变量回归模型,显著性H0:b2=0 检 验F与t检验互为补充,其关系为t 2 = F
▪ 但对于多元回归模型,F检验是检验模型是 否显著的统计量。
相关文档
最新文档