第五章 区间估计与假设检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
31
预测
u 样本回归函数的一个用途是“预测”或“预报” 对应于给定X的未来的Y值。
u 包括两种预测: u 1、均值预测(mean prediction) u 2、个值预测(individual prediction)
32
均值预测(mean prediction)
∑ Yˆ0
~
N
(
β1
+
β
2X
0,
σ
2[
~
t(n − 2)
所以有,Pr(−t α/ 2
≤
βˆ2
−
β
* 2
se(βˆ2 )
≤
tα /2 )
=1−α
β*2的置信系数为1− α的置信区间为:[βˆ2 − t α/ 2se(βˆ2 ), βˆ2 + tα /2se(βˆ2 )]
决策规则 :在H0假设条件下,根据样本数据计算置信区
间,如果 β*2落入置信区间,则不拒绝 H0,相 反,如 果β*2
u 在实践中 ,通常不考虑 β ,而仅仅重点考虑α ,依据 α值来 判断是否接受和拒绝原假设。
u 在任一个定的样本大小 ,两类错误之间存在一种替代关系 。
6
两类错误之:弃真
u 1、H0:海底只有一棵针。
u 进行抽样试验— — 下海捞针 u 检验统计量— — 是否捞到针 。 结果 :捞 到 针 u 统计推断 — — 一次试验捞了上来, 小概率事件发生 , 拒绝 H0。
u 单尾(侧)检验:一般适用于有很强的先验信息的 时候。
u 置信区间和t统计量的构造过程与双侧是完全相同。
u 不同之处: u t统计量: 临界值不同— t α和 ± t α /2
u 置信区间 :区间上、下限不同 [0, β*2 + t αse(βˆ2 )]和[ β*2 − tα / 2se(βˆ2 ), β*2 + t α/ 2se(βˆ2 )]
第五章 双变量回归:区间 估计与假设检验
暨南大学金融系 朱滔
第五章 区间估计与假设检验
u 预备知识 u 置信区间 u 假设检验 u 预测
1
2
预备知识
u 虚拟假设(原假设)H0 u 对立假设(备择假设)H1 u 第I类错误 u 第II类错误
H0和H1
问题:某一给定的观测或发现是否与某一声称的假设(stated
对立假设可以是简单的或复合的。例如, H1:β2=1 是一个简单假设,
但是 H1:β2≠1 则是一个复合假设。
3
方法:有显著性检验和置信区间两种方法。
4
假设检验中的两类错误
u 第一类错误:拒绝真实-弃真; u 第二类错误:接受错误-纳伪。
决策
拒绝 不拒绝
自然状态 H0是对的 H0是错的 I类错误
II类错误
27
σ2检验的显著性(χ2检验)
σˆ2 σ2
(n
− 2) ~
χ2(n
− 2)
H0:σ 2 = σ *2 ;H1:σ 2 ≠ σ *2 。
构造
σ2
显著水平为
α的置信区间:
[(n
−
2)
σˆ2 χ2
α/ 2
, (n
−
2)
σˆ2 χ2
1−α / 2
]
检验 σ2 的检验值σ *2 是否在此区间内,在则接受,不在就拒绝。
假定:地海底真的只有一棵针 。犯“弃真”错误了。
u 2、此时犯了“弃真”的错误,但是犯弃真错误的可能性, 事先已经控制— — 只有显著水平α(小概率)那么大。
u 在本例中 , 显著性水平 α等 于: 针的面积/大海的面积 。
u 3、所以拒绝不仅是坚决的, 而且犯弃真错误的概率(冒
险率— 风险是事先控制的)也很小=α。所得结论的可靠性
u 在解决具体问题时,设定H0通常三条原则:
u H0代表一种久已存在的状态 ,H1则反映新问题 。 u 样本观测值显示所支持的结论 ,应作为H1。 u 尽量使后果严重的错误成为第一类错误,如 :
1、“有病当作无病”;2、“无病当作有病 ” 两种错误相比,1比较严重,因此将有病作为维护的原
假设:H0:有病;H1:无病。
28
选择显著性水平
u 选择显著性水平α
u 是人为设定的 u 1%,5%,10%
u 精确的显著性水平:P值
u 原假设可被拒绝的最低显著性水平
H0 : β2 = β*2; H1 : β2 ≠ β*2
|
t
|=|
βˆ2 − β2 se(βˆ2 )
|=|
βˆ2 − β*2 se(βˆ2 )
|=
t
α/
时的
2
α,就是
χ2 1 −α
/
2
≤χ2
≤
χ
2 α
/
2
)
=1−α
得,
σ2 显著水平为α的置信区间为:
[(n
−
2)
σˆ2 χ2
α/2
,
(n
−
2)
σˆ2 χ2
1−α
/2
]
即:Pr[(n − 2) σˆ2 ≤ σ 2 ≤ (n − 2) σˆ2 ] = 1−α
χ2 α /2
χ2 1−α / 2
19
什么是假设检验?
u 统计推断:假设检验 u 假设检验就是要设计出一种检验程序,以便
u 你认为改善现在的小股东利益得不到保护的情况, 有什 么样的方法可以解决目前的问题?
22
u H0:基金无罪
u 检验统计量— 股民提供基金操纵股市的证据 。
u 只有在提供了确凿的操纵证据后,方才拒绝 H0。 u 面临的问题:小股东无力提供证据( 小概率事件不会发
生),H0难以被拒绝 。
u 可能的解决办法 :
= 1- α
7
两类错误之:纳伪
u H0:某某( 高考考生)= 大学生 (优秀青年)
u 进行抽样试验— — 参加高考 u 检验统计量— — 考试总分。 结 果: 高分数(超常发挥) u 统计推断 — — 接 受H0 。
假定:某某实际上是很差的学生。
u 此时犯了“纳伪”的错误。 仅当不拒绝 H0才会犯纳伪错误 u 某某进入高校, 招生工作犯了纳伪错误 u 而且,进行统计推断时 ,没有事先控制纳伪的概率β,
=
V a r(Y0
−Yˆ0)
=
E (Y0
−Yˆ0)2
=
σ
2 [1 +
1 n
+
(
X0
−X xi2
)2
]
同样可以构造t统计量:
5
u 通常假定第I类错误比第II类错误严重 ,因此 ,通常将犯I类 错误的概率控制在非常低的水平上( 10%,5%,1%) 。
u 我们把犯第I类错误的概率记为α, 并称为显著性水平 (Level of significance )。将犯第 II类错误的概率记为β,并 把不犯第II类错误的概率1- β称为检验的功效(power of the test)。
⇔统计量是统计上显著的
临界域
1-α接受域
临界域
⇔拒绝
H 0
假设⇔Pr(t)<α(P
值小)。
- tα /2
O
tα/2
t
决策规则 :在H0假设条件下,构造t统计量,根据样本数
据计算t值,如果|t|落入临界域,则拒绝H0,相反,如果|t|
落入接受域,则不拒绝 H0。
25
置信区间法 VS. t检验
26
关于单尾检验和双侧检验
10
区间估计
u 在建立正是概念前的例子
u 消费-收入函数中的MPC。我们是用样本MPC的 均值来估计总体MPC的均值,但由于抽样的波 动,对于每一个不同的样本其估计值都是不同 的,因此,需要思考这样一个问题:
u 通过样本得到的估计值 ,在多大程度上接近真实值 ?
u 估计值本身也是随机的 ,并且在正态性假设的前提 下,估计值服从正态分布,因此,我们不能完全信赖 点估计量,而是要围绕点估计量构造一个区间,试图 在一定的水平下 ,能够让构造的区间包含真实的估计 值。
落入置信区间之外,则拒绝H0 。
24
假设检验:显著性检验法(t检验)
H 0: β 2
=
β
* 2
;H1
:
β
2
≠
β
* 2
。
计算 t = βˆ2 − β 2 = βˆ2 − β 2
se(βˆ2 )
σˆ2
/
∑
x2 i
比较 |t |与tα :
2
|t |>tα (t 值大)⇔
2
“统计量的值落入 临界域 上
13
回归系数β1和β2的置信区间
14
回归系数β1和β2的置信区间
u β2的显著水平为α的置信区间为:
[βˆ2 − tα se( βˆ2 ), βˆ2 + tα se(βˆ2 )]
2
2
置信区间的宽度与估计量的 标准误成正比。标准越小,对
真值估计的不确定性越小,因此,估计量的标准误喻为估
计量的精度(Precision)。
21
基金黑幕
u 思考与讨论
u 问题背景 u 前几年我国证券投资基金被认为具有能力和动机操纵市
场,导致小股东利益受到剥削 ,自然有一些小股民会状 告基金公司,试图通过法律渠道保护自身利益,但常常 面临证据不足的问题。 如果把法官判定基金是否有罪的 问题看作是假设检验的问题,那么法官事实上假定了:
u 基金有罪 ? u 基金无罪 ?
u 同样,β1显著水平为α的置信区间为:
[βˆ1 − tα se(βˆ1 ), βˆ1 + tα se(βˆ1 )]
15
2
2
例子
16
17
18
σ2的置信区间
在正态性的假设下,变量 χ 2 = (n − 2) σˆ2 σ2
服从自由度为 n-2 的χ 2 分布。故可以用其来建立 σ2 的置信区间。
由 Pr(
30
关于置信区间法与显著性检验法
u 总体而言:置信区间法优于显著性检验法。
u 但是,必须指出的是,这里的优于事实上更多的 是指置信区间为研究提供了更多的信息(关于系 数大小和分布范围的信息),即参数的置信区 间。
u 就判断系数是否显著这一点而言,在同一样本、 相同H0和H1情况下,两者并无什么区别。
ቤተ መጻሕፍቲ ባይዱ
hypothesis)相符?此处用“相符”一词表示观测的值与假设的值
“足够相近”,因而我们不拒绝所声称的假设。
虚拟假设(Null hypothesis ):一种信以为真的、意在维护的或理
论上的假设,并用 H0 表示。
与之对立的假设称为 对立假设(alternative hypothesis),记为 H1。
u 假设检验的基本思想:反证法— — 小概率事件在一 次实验中不大可能出现。
u 一个例子: H0:海底只有一棵针 H1:海底不只一棵针
u 进行抽样试验— — 下海捞针(构造的小概率事件) u 检验统计量— — 是否捞到针
u 结果 1: 捞到针(小概率事件发生) 。 统计推断: 拒绝 H0 。 u 结果 2: 未捞到针( 小概率事件未发生)。 统计推断: 不拒绝H 0。
P值。
29
统计显著性与实际显著性
u 统计显著性:
u 从计量的角度来判断, 我们是否拒绝或者不拒绝原假设的问题。
u 经济上的显著性 :
u 试图强调的是, 研究结论在实际应用中是否非常的重要, 或者说具 有 非 常 强 的 影 响 力 。关 心 的 是 估 计 量 的 大 小 问 题。
u 要义:不要把统计上的显著性和实际上或经济上的显著性混 同起来。当样本含量变得非常大时,统计显著性变得并不重 要。而是否具有经济意义(经济显著性)变成了至关重要的 问题。
11
置信区间
12
置信区间的含义
u 置信区间并不表示β2落入区间的概率是1 -α。 而是说构造 的区间包含β2的概率为1-α。
u 置信区间是随机区间, 一个样本对应一个 βˆ2 ,βˆ2 本身也是
随机变量。
u 由于置信区间是随机的 ,那么所谓置信区间 包含β2的概率 为1-α,其涵义是在多次重复抽样的样本中,所构造的置信 区间也非常多(比如100个),平均而言,这些区间将有 100(1-α)个区间包含真实的β2 。
u 假定 :基金有罪 ( 有罪推断 代 替 无罪推断 ) u 辨方举证 ( 代替 谁主张罪举证)
23
假设检验:置信区间法
H0 : β2 = β*2 ; H1 : β2 ≠ β*2
构造β*2的置信区间(显著性水平α):
在H0条件下:t =
βˆ2 −β2 se(βˆ2 )
=
βˆ2 − β*2 se(βˆ2 )
因此无法度量犯纳伪的可能性 。也就不能给出不拒绝H0 (录取进大学)的可靠性(1- β )。
8
不拒绝H0是无可奈何
u 就一次试验而言,不拒绝H0是无可奈 何,不能以接受H0作为我们研究的结 论。欲证明H0成立必须继续抽样、继续 检验。
u 不拒绝H0 VS. 接受H0
9
关于设定H0与H1的一些问题
u H0在假设检验中通常处于,被保护的地位,不致于 轻易被否定。往往把久已存在的状态作为原假设, 而对立假设则反映新问题。
1 n
+
(
X0
− X2 x2
)
])
i
将未知σ 2的代为它的无偏估计量σˆ2,可以推知统计量:
t
=
Yˆ0 − ( β1 + β2 se(Yˆ0)
X 0
)
~
t(n
−2)
33
个值预测(individual prediction)
在个值预测中我们关心的是uˆ0 = Y0 − Yˆ0的分布,
∑ V a r(uˆ0 )
决定:拒绝或者不拒绝一个原假设。
u 显著性检验法 u 置信区间法
u 为了检验虚拟假设(即检验其真实性 ),通常利用样本信息 以获得所需的检验统计量,这个统计量常常就是未知参数的 点估计量,然后,根据推导得出的检验统计量的抽样或者概 率分布,利用置信区间法或显著性检验方法去检验虚拟假 设。
20
假设检验的基本思路
预测
u 样本回归函数的一个用途是“预测”或“预报” 对应于给定X的未来的Y值。
u 包括两种预测: u 1、均值预测(mean prediction) u 2、个值预测(individual prediction)
32
均值预测(mean prediction)
∑ Yˆ0
~
N
(
β1
+
β
2X
0,
σ
2[
~
t(n − 2)
所以有,Pr(−t α/ 2
≤
βˆ2
−
β
* 2
se(βˆ2 )
≤
tα /2 )
=1−α
β*2的置信系数为1− α的置信区间为:[βˆ2 − t α/ 2se(βˆ2 ), βˆ2 + tα /2se(βˆ2 )]
决策规则 :在H0假设条件下,根据样本数据计算置信区
间,如果 β*2落入置信区间,则不拒绝 H0,相 反,如 果β*2
u 在实践中 ,通常不考虑 β ,而仅仅重点考虑α ,依据 α值来 判断是否接受和拒绝原假设。
u 在任一个定的样本大小 ,两类错误之间存在一种替代关系 。
6
两类错误之:弃真
u 1、H0:海底只有一棵针。
u 进行抽样试验— — 下海捞针 u 检验统计量— — 是否捞到针 。 结果 :捞 到 针 u 统计推断 — — 一次试验捞了上来, 小概率事件发生 , 拒绝 H0。
u 单尾(侧)检验:一般适用于有很强的先验信息的 时候。
u 置信区间和t统计量的构造过程与双侧是完全相同。
u 不同之处: u t统计量: 临界值不同— t α和 ± t α /2
u 置信区间 :区间上、下限不同 [0, β*2 + t αse(βˆ2 )]和[ β*2 − tα / 2se(βˆ2 ), β*2 + t α/ 2se(βˆ2 )]
第五章 双变量回归:区间 估计与假设检验
暨南大学金融系 朱滔
第五章 区间估计与假设检验
u 预备知识 u 置信区间 u 假设检验 u 预测
1
2
预备知识
u 虚拟假设(原假设)H0 u 对立假设(备择假设)H1 u 第I类错误 u 第II类错误
H0和H1
问题:某一给定的观测或发现是否与某一声称的假设(stated
对立假设可以是简单的或复合的。例如, H1:β2=1 是一个简单假设,
但是 H1:β2≠1 则是一个复合假设。
3
方法:有显著性检验和置信区间两种方法。
4
假设检验中的两类错误
u 第一类错误:拒绝真实-弃真; u 第二类错误:接受错误-纳伪。
决策
拒绝 不拒绝
自然状态 H0是对的 H0是错的 I类错误
II类错误
27
σ2检验的显著性(χ2检验)
σˆ2 σ2
(n
− 2) ~
χ2(n
− 2)
H0:σ 2 = σ *2 ;H1:σ 2 ≠ σ *2 。
构造
σ2
显著水平为
α的置信区间:
[(n
−
2)
σˆ2 χ2
α/ 2
, (n
−
2)
σˆ2 χ2
1−α / 2
]
检验 σ2 的检验值σ *2 是否在此区间内,在则接受,不在就拒绝。
假定:地海底真的只有一棵针 。犯“弃真”错误了。
u 2、此时犯了“弃真”的错误,但是犯弃真错误的可能性, 事先已经控制— — 只有显著水平α(小概率)那么大。
u 在本例中 , 显著性水平 α等 于: 针的面积/大海的面积 。
u 3、所以拒绝不仅是坚决的, 而且犯弃真错误的概率(冒
险率— 风险是事先控制的)也很小=α。所得结论的可靠性
u 在解决具体问题时,设定H0通常三条原则:
u H0代表一种久已存在的状态 ,H1则反映新问题 。 u 样本观测值显示所支持的结论 ,应作为H1。 u 尽量使后果严重的错误成为第一类错误,如 :
1、“有病当作无病”;2、“无病当作有病 ” 两种错误相比,1比较严重,因此将有病作为维护的原
假设:H0:有病;H1:无病。
28
选择显著性水平
u 选择显著性水平α
u 是人为设定的 u 1%,5%,10%
u 精确的显著性水平:P值
u 原假设可被拒绝的最低显著性水平
H0 : β2 = β*2; H1 : β2 ≠ β*2
|
t
|=|
βˆ2 − β2 se(βˆ2 )
|=|
βˆ2 − β*2 se(βˆ2 )
|=
t
α/
时的
2
α,就是
χ2 1 −α
/
2
≤χ2
≤
χ
2 α
/
2
)
=1−α
得,
σ2 显著水平为α的置信区间为:
[(n
−
2)
σˆ2 χ2
α/2
,
(n
−
2)
σˆ2 χ2
1−α
/2
]
即:Pr[(n − 2) σˆ2 ≤ σ 2 ≤ (n − 2) σˆ2 ] = 1−α
χ2 α /2
χ2 1−α / 2
19
什么是假设检验?
u 统计推断:假设检验 u 假设检验就是要设计出一种检验程序,以便
u 你认为改善现在的小股东利益得不到保护的情况, 有什 么样的方法可以解决目前的问题?
22
u H0:基金无罪
u 检验统计量— 股民提供基金操纵股市的证据 。
u 只有在提供了确凿的操纵证据后,方才拒绝 H0。 u 面临的问题:小股东无力提供证据( 小概率事件不会发
生),H0难以被拒绝 。
u 可能的解决办法 :
= 1- α
7
两类错误之:纳伪
u H0:某某( 高考考生)= 大学生 (优秀青年)
u 进行抽样试验— — 参加高考 u 检验统计量— — 考试总分。 结 果: 高分数(超常发挥) u 统计推断 — — 接 受H0 。
假定:某某实际上是很差的学生。
u 此时犯了“纳伪”的错误。 仅当不拒绝 H0才会犯纳伪错误 u 某某进入高校, 招生工作犯了纳伪错误 u 而且,进行统计推断时 ,没有事先控制纳伪的概率β,
=
V a r(Y0
−Yˆ0)
=
E (Y0
−Yˆ0)2
=
σ
2 [1 +
1 n
+
(
X0
−X xi2
)2
]
同样可以构造t统计量:
5
u 通常假定第I类错误比第II类错误严重 ,因此 ,通常将犯I类 错误的概率控制在非常低的水平上( 10%,5%,1%) 。
u 我们把犯第I类错误的概率记为α, 并称为显著性水平 (Level of significance )。将犯第 II类错误的概率记为β,并 把不犯第II类错误的概率1- β称为检验的功效(power of the test)。
⇔统计量是统计上显著的
临界域
1-α接受域
临界域
⇔拒绝
H 0
假设⇔Pr(t)<α(P
值小)。
- tα /2
O
tα/2
t
决策规则 :在H0假设条件下,构造t统计量,根据样本数
据计算t值,如果|t|落入临界域,则拒绝H0,相反,如果|t|
落入接受域,则不拒绝 H0。
25
置信区间法 VS. t检验
26
关于单尾检验和双侧检验
10
区间估计
u 在建立正是概念前的例子
u 消费-收入函数中的MPC。我们是用样本MPC的 均值来估计总体MPC的均值,但由于抽样的波 动,对于每一个不同的样本其估计值都是不同 的,因此,需要思考这样一个问题:
u 通过样本得到的估计值 ,在多大程度上接近真实值 ?
u 估计值本身也是随机的 ,并且在正态性假设的前提 下,估计值服从正态分布,因此,我们不能完全信赖 点估计量,而是要围绕点估计量构造一个区间,试图 在一定的水平下 ,能够让构造的区间包含真实的估计 值。
落入置信区间之外,则拒绝H0 。
24
假设检验:显著性检验法(t检验)
H 0: β 2
=
β
* 2
;H1
:
β
2
≠
β
* 2
。
计算 t = βˆ2 − β 2 = βˆ2 − β 2
se(βˆ2 )
σˆ2
/
∑
x2 i
比较 |t |与tα :
2
|t |>tα (t 值大)⇔
2
“统计量的值落入 临界域 上
13
回归系数β1和β2的置信区间
14
回归系数β1和β2的置信区间
u β2的显著水平为α的置信区间为:
[βˆ2 − tα se( βˆ2 ), βˆ2 + tα se(βˆ2 )]
2
2
置信区间的宽度与估计量的 标准误成正比。标准越小,对
真值估计的不确定性越小,因此,估计量的标准误喻为估
计量的精度(Precision)。
21
基金黑幕
u 思考与讨论
u 问题背景 u 前几年我国证券投资基金被认为具有能力和动机操纵市
场,导致小股东利益受到剥削 ,自然有一些小股民会状 告基金公司,试图通过法律渠道保护自身利益,但常常 面临证据不足的问题。 如果把法官判定基金是否有罪的 问题看作是假设检验的问题,那么法官事实上假定了:
u 基金有罪 ? u 基金无罪 ?
u 同样,β1显著水平为α的置信区间为:
[βˆ1 − tα se(βˆ1 ), βˆ1 + tα se(βˆ1 )]
15
2
2
例子
16
17
18
σ2的置信区间
在正态性的假设下,变量 χ 2 = (n − 2) σˆ2 σ2
服从自由度为 n-2 的χ 2 分布。故可以用其来建立 σ2 的置信区间。
由 Pr(
30
关于置信区间法与显著性检验法
u 总体而言:置信区间法优于显著性检验法。
u 但是,必须指出的是,这里的优于事实上更多的 是指置信区间为研究提供了更多的信息(关于系 数大小和分布范围的信息),即参数的置信区 间。
u 就判断系数是否显著这一点而言,在同一样本、 相同H0和H1情况下,两者并无什么区别。
ቤተ መጻሕፍቲ ባይዱ
hypothesis)相符?此处用“相符”一词表示观测的值与假设的值
“足够相近”,因而我们不拒绝所声称的假设。
虚拟假设(Null hypothesis ):一种信以为真的、意在维护的或理
论上的假设,并用 H0 表示。
与之对立的假设称为 对立假设(alternative hypothesis),记为 H1。
u 假设检验的基本思想:反证法— — 小概率事件在一 次实验中不大可能出现。
u 一个例子: H0:海底只有一棵针 H1:海底不只一棵针
u 进行抽样试验— — 下海捞针(构造的小概率事件) u 检验统计量— — 是否捞到针
u 结果 1: 捞到针(小概率事件发生) 。 统计推断: 拒绝 H0 。 u 结果 2: 未捞到针( 小概率事件未发生)。 统计推断: 不拒绝H 0。
P值。
29
统计显著性与实际显著性
u 统计显著性:
u 从计量的角度来判断, 我们是否拒绝或者不拒绝原假设的问题。
u 经济上的显著性 :
u 试图强调的是, 研究结论在实际应用中是否非常的重要, 或者说具 有 非 常 强 的 影 响 力 。关 心 的 是 估 计 量 的 大 小 问 题。
u 要义:不要把统计上的显著性和实际上或经济上的显著性混 同起来。当样本含量变得非常大时,统计显著性变得并不重 要。而是否具有经济意义(经济显著性)变成了至关重要的 问题。
11
置信区间
12
置信区间的含义
u 置信区间并不表示β2落入区间的概率是1 -α。 而是说构造 的区间包含β2的概率为1-α。
u 置信区间是随机区间, 一个样本对应一个 βˆ2 ,βˆ2 本身也是
随机变量。
u 由于置信区间是随机的 ,那么所谓置信区间 包含β2的概率 为1-α,其涵义是在多次重复抽样的样本中,所构造的置信 区间也非常多(比如100个),平均而言,这些区间将有 100(1-α)个区间包含真实的β2 。
u 假定 :基金有罪 ( 有罪推断 代 替 无罪推断 ) u 辨方举证 ( 代替 谁主张罪举证)
23
假设检验:置信区间法
H0 : β2 = β*2 ; H1 : β2 ≠ β*2
构造β*2的置信区间(显著性水平α):
在H0条件下:t =
βˆ2 −β2 se(βˆ2 )
=
βˆ2 − β*2 se(βˆ2 )
因此无法度量犯纳伪的可能性 。也就不能给出不拒绝H0 (录取进大学)的可靠性(1- β )。
8
不拒绝H0是无可奈何
u 就一次试验而言,不拒绝H0是无可奈 何,不能以接受H0作为我们研究的结 论。欲证明H0成立必须继续抽样、继续 检验。
u 不拒绝H0 VS. 接受H0
9
关于设定H0与H1的一些问题
u H0在假设检验中通常处于,被保护的地位,不致于 轻易被否定。往往把久已存在的状态作为原假设, 而对立假设则反映新问题。
1 n
+
(
X0
− X2 x2
)
])
i
将未知σ 2的代为它的无偏估计量σˆ2,可以推知统计量:
t
=
Yˆ0 − ( β1 + β2 se(Yˆ0)
X 0
)
~
t(n
−2)
33
个值预测(individual prediction)
在个值预测中我们关心的是uˆ0 = Y0 − Yˆ0的分布,
∑ V a r(uˆ0 )
决定:拒绝或者不拒绝一个原假设。
u 显著性检验法 u 置信区间法
u 为了检验虚拟假设(即检验其真实性 ),通常利用样本信息 以获得所需的检验统计量,这个统计量常常就是未知参数的 点估计量,然后,根据推导得出的检验统计量的抽样或者概 率分布,利用置信区间法或显著性检验方法去检验虚拟假 设。
20
假设检验的基本思路