假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2

X 68 3.6 / 8
1.96 可以确定拒绝域为
( , 67.118 ) 与 ( 68.882 , + ) 因此,接受域为(67.118, 68.882)
STATISTICS
66 P ( 67.118 X 68.882 66 )
68.88 66 67.12 66 0.45 0.45 (6.4) (2.49) 1 0.9936 0.0064 0.0853
69 P ( 67.12 X 68.88 69 )
0.3936 0.6177
( 0 , 1 )
STATISTICS
当样本容量确定后,犯两类错误的 概率不可能同时减少. 证 设 X ~ N ( , 02 ) 在水平 给定下,检验假设
由此可见,当 n 固定时
1) 若
2) 若
z z z z
证毕.
STATISTICS
2 注 当 1 时 X ~ N ( 1 , 0 / n )
X 1 从而 X ~ N ( 0 , 1) 0 / n

1 (1 ) 1 P( X z1 ) P( X z1 ) ( z1 ) ( z )
STATISTICS
假设检验的内容
参数检验 (§9.2) 非参数检验 总体均值, 均值差的检验 总体方差, 方差比的检验 分布拟合检验(§9.3) 符号检验 秩和检验
假设检验的理论依据
假设检验所以可行,其理论背景为实际
推断原理,即“小概率原理”
STATISTICS
某产品出厂检验规定: 次品率p不 超过4%才能出厂. 现从一万件产品中任意 抽查12件发现3件次品, 问该批产品能否出 厂?若抽查结果发现1件次品, 问能否出厂? p 0.04 代入 p 0.04, 解 假设 3 3 9 P 12 (3) C12 p (1 p) 0.0097 0.01 这是 小概率事件 , 一般在一次试验中 是不会发生的, 现一次试验竟然发生, 故认 为原假设不成立, 即该批产品次品率p 0.04 则该批产品不能出厂.
正确 第二类错误
(取伪)
正确
犯第一类错误的概率通常记为 犯第二类错误的概率通常记为
STATISTICS
任何检验方法都不能完全排除犯错 误的可能性.理想的检验方法应使犯两类 错误的概率都很小,但在样本容量给定的 情形下,不可能使两者都很小,降低一个, 往往使另一个增大.
假设检验的指导思想是控制犯第一类
STATISTICS
9.1 假设检验的基本概念
何为假设检验?
假设检验是指施加于一个或多个总体 的概率分布或参数的假设. 所作的假设可 以是正确的, 也可以是错误的. 为判断所作的假设是否正确, 从总体 中抽取样本, 根据样本的取值, 按一定的 原则进行检验, 然后, 作出接受或拒绝所 作假设的决定.
若原假设正确, 则
STATISTICS
X X 0 z z n n X 0 P z —— 小概率事件 n ,)显著性水平不超过 故取拒绝域 ( 0 z n
H0: = 68
STATISTICS
由引例2可见,在给定的前提下, 接受还是拒绝原假设完全取决于样本 值, 因此所作检验可能导致以下两类 错误的产生:
第一类错误 第二类错误
弃真错误 取伪错误
STATISTICS
假设检验的两类错误
拒绝 H0
第一类错误
(弃真)
所作判断 接受 H0 真实情况
H0 为真 H0 为假
2
69.18 69 66.82 69 0.6 0.6 (0.3) (3.63) 0.6179 0.0002 0.6177
取伪的概率较大.
STATISTICS
0.12 0.1 0.08 0.06
/2
0.04 0.02 60 62.5 65 67.5 70 72.5 75
因此,可以确定一个常数c ,使得
X 68 P c 3.6 / 6 例如,取 = 0.05,则
2

c z z0.025 1.96
STATISTICS

X 68 3.6 / 6
1.96
X 69.18 或 X 66.824
称 X 的取值区间 ( 66.824 , 69.18 ) 为检验的接受域 (实际上没理由拒绝), 而区间( ,66.824 ) 与 ( 69.18 , + ) 为检验的拒绝域 现x 68.5落入接受域,则接受原假设
错误的概率不超过, 然后,若有必要,通
过增大样本容量的方法来减少 .
STATISTICS
引例2 中,犯第一类错误的概率 P(拒绝H0|H0为真)
P ( X 66.824 X 69.18 ) 0.05
若H0为真, 则 X ~ N (68 , 3.62 / 36) 所以,拒绝 H0 的概率为, 又称为显 著性水平, 越大,犯第一类错误的概 率越大, 即越显著.
STATISTICS
当原假设H0 : = 0 = 68 为真时, X 0 取较大值的概率较小
当备择假设 H1: > 68 为真时, X 0 取较大值的概率较大
X 0 z 给定显著性水平,根据 P n
可确定拒绝域
STATISTICS º
注 1 一般,作假设检验时,先控制犯第一 类错误的概率,在此基础上使 尽量 地小.要降低 一般要增大样本容量. 当H0不真时,参数值越接近真值, 越大. 注 2º 备择假设可以是单侧,也可以双侧. 引例2中的备择假设是双侧的.若根据以 往生产情况,0=68.现采用了新工艺,关 心的是新工艺能否提高螺钉强度,越大 越好.此时, 可作如下的假设检验: 原假设 H0 : = 68; 备择假设 H1 : > 68
x ( 0 z , ) n
STATISTICS
因而, 接受域 x ( , 0 z ) n
称这种检验为右边检验. 另外,可设 原假设
X ~ N ( ,

H0: 68 备择假设 H1: > 68
2
n
) , E( X )
X P z n
1
1
1
0
n
0
0
n
n
STATISTICS
k
0 n
z
( z
x2 2
1 0
0
n
)
1 又 2 e dx ( z ) (见注) 1 0 n z z 即 z z ( 1 0 )
z
0
n
0
P(V V )
根据样本值计算,并作出相应的判断.
STATISTICS
某厂生产的螺钉,按标准强度为 68/mm2, 而实际生产的强度X 服N(,3.62 ). 若E(X)==68,则认为这批螺钉符合要求,否 则认为不符合要求.为此提出如下假设: H0 : = 68 称为原假设或零假设 原假设的对立面: H1 : 68 称为备择假设 现从生产的螺钉中抽取容量为36的样 x 68.5 本,其均值为 x 68.5 ,问原假设是否正确 ?
???????hh此时犯第二类错误的概率为此时犯第二类错误的概率为0接受hhp??01xph????xp???证设给定下检验假设20x0伪kk?10???????kxp??0111??????????kxph001011nnh?????001nk??????znk0?001nz???????2?122??z?zdxex?????????1?0?又??00110???????z?z?z?z???????nz?zz?z即即见注0?n由此可见当n固定时???2若???1若?????????????z?z?z?z证毕
出厂检验问题的数学模型
x 1 x
对总体X ~ f ( x ; p) p (1 p) , x 0,1 提出假设
H 0 : p 0.04 ;
要求利用样本观察值
H1 : p 0.04
( xi 3 or 1 )
i 1 12
( x1 , x2 , , x12 )
对提供的信息作出接受 H 0 (可出厂) , 还 是接受 H1 (不准出厂) 的判断.
STATISTICS
假设检验步骤(三部曲)
根据实际问题所关心的内容,建立H0与H1
在H0为真时,选择合适的统计量V,由H1确 定拒绝域形式
给定显著性水平,其对应的拒绝域 双侧检验 (V V1 ) (V V ) 其中 (V V1 ) 左边检验

2

2
右边检验
(V V )
引例1
STATISTICS
P 12 (1) C p (1 p) 0.306 0.3
1 12 1 11
这不是小概率事件,没理由拒绝原假设, 从而接受原假设, 即该批产品可以出厂. 注
1 直接算 0.083 0.04 12
若不采用假设检验, 按理也不能够出厂.
STATISTICS
但现不知 的真值,只知 0 = 68
STATISTICS
注 3º 关于零假设与备择假设的选取 H0与H1地位应平等,但在控制犯第一类 错误的概率 的原则下,使得采取拒 绝H0 的决策变得较慎重,即H0 得到特 别的保护.
因而,通常把有把握的、有经验的结论 作为原假设,或者尽可能使后果严重的 错误成为第一类错误.
2
69.18 66 66.82 66 0.6 0.6
(5.3) (1.37) 1 0.9147 0.0853
STATISTICS

69, n 36, X ~ N (69,3.6 / 36) 69 P ( 66.82 X 69.18 69 )
命题
H0 : 0 ; H1 : 1 0
此时犯第二类错误的概率为
P( 接受H 0 H 0 伪 ) P( X 0 k 1 )
PH ( X 0 k ) PH ( X 1 k ( 1 0 )) X 1 k ( 1 0 ) k ( 1 0 ) ) PH ( ) (
/2
H0 真
0.12 0.1 0.08 0.06 0.04 0.02

H0 不真
67.5 70 72.5 75 77.5 80 82.5
STATISTICS
现增大样本容量,取n = 64, = 66,则
2
X ~ N (66,3.6 / 64) 仍取=0.05,则 c z z 0.025 1.96
引例2
STATISTICS
3.6 若原假设正确, 则 X ~ N (68 , ) 36 因而 E ( X ) 68 ,即 X 偏离68不应该太远,
2
偏离较远是小概率事件,由于
X 68 ~ N (0,1) 3.6 / 6

X 68 3.6 6
取较大值是小概率事件.
STATISTICS
规定为小概率事件的概率大小,通常取 = 0.05, 0.01,…
STATISTICS
下面计算犯第二类错误的概率
=P(接受H0|H0不真) H0不真,即 68,可能小于68,也可能大于 68, 的大小取决于 的真值的大小.

66, n 36, X ~ N (66,3.6 / 36) 66 P( 66.82 X 69.18 66 )
相关文档
最新文档