北交大-统计学-第四章 假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

于是可以选定一个适当的正数k,
x − µ0 当观察值 x 满足 ≥ k时, 拒绝假设 H 0 , σ/ n x − µ0 反之 , 当观察值 x 满足 < k时, 接受假设 H 0 . σ/ n X − µ0 当H 0为真时 Z = ~ N (0,1), σ/ n 检验统计量 根据小概率原理
X − µ0 因而当 H 0为真, 即µ = µ 0时, ≥ k 是一个 σ/ n 小概率事件 ,
注:在样本量一定的条件下,不可能找到一个使α , β 都减小的检验。
例:设总体 X ~ N ( µ , σ 2 ),σ 2为已知, X 1 , , X n为
样本,考虑检验
H 0 : µ = µ0 v . s . H1 : µ = µ1 ( µ 0 < µ1 )
选取X为检验统计量, X ~ N ( µ ,
确定检验统计量 T后,根据原假设 H 0与备选假设 确定拒绝域 W。
常用的拒绝域形式: (1)单侧拒绝域
W = {( x1 , , x n ) : T ( x1 , , x n ) ≥ c }

W = {( x1 , , x n ) : T ( x1 , , x n ) ≤ c }
(2)双侧拒绝域
概率性质的反证法的根据: 小概率事件在一次试验中几乎是不可能发生的。 在假设检验中,我们作出接受 H 0或拒绝 H 0 的决 策,并不等于我们证明了原假设 H 0正确或错误,而 只是根据样本所提供的信息以一定的可靠程度认为 H 0 是正确或错误。
实例 某车间用一台包装机包装葡萄糖, 包得的 袋装糖净重是一个随机变量, 它服从正态分布. 当机器正常时, 其均值为0.5公斤, 标准差为 0.015公斤.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(公 斤): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 分析:
用 µ 和 σ 分别表示这一天袋
装糖重总体 X 的均值和标准差 ,
由长期实践可知, 标准差较稳定, 设 σ = 0.015,
则 X ~ N ( µ , 0.0152 ), 其中 µ 未知.
问题: 根据样本值判断 µ = 0.5 还是 µ ≠ 0.5 . 提出两个对立假设H 0 : µ = µ 0 = 0.5 和 H 1 : µ ≠ µ 0 . 再利用已知样本作出判断是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判断是接受H0, 则 µ = µ 0 , 即认为机器工作是正常的, 否则, 认为是不正常的.
(1) H 0 : µ = µ 0
v . s . H1 : µ ≠ µ 0
(双侧检验)
( 2) H 0 : µ = µ 0 H 0 : µ ≤ µ0 (3) H 0 : µ = µ 0 H 0 : µ ≥ µ0
v .s . H1 : µ > µ 0 v .s . H1 : µ > µ 0 v . s . H1 : µ < µ 0 v . s . H1 : µ < µ 0
问当日生产是否正常
θ = 110.
例3:某建筑材料,其抗断强度的分布以往一直服从 正态分布,现改变配料方案,希望确定新产品 的抗断强度 X 是否仍服从正态分布. 这类问题称为假设检验,有两个共同特点:
(1) 先根据实际问题的要求 提出一个关于随机 变量的一种论断,称为 统计假设,记为 H 0
H0 : p ≤ 0.01
如果( x1 , , x n ) ∈ W,则认为 H 0不成立;
如果( x1 , , x n ) ∈ W ,则认为 H 0成立。
(三)选定适当的显著水平 α ,并求出临界值。 (四)根据样本观测值确定是否拒绝 H 0 .
由样本值 ( x1 , , x n )算得T ( x1 , , x n ),把它与临界值 相比较,若 ( x1 , , x n ) ∈ W,则拒绝 H 0,否则接受 H 0。
三、两类错误
检验的结果与真实情况可能吻合也可能不吻合, 因此检验是可能犯错误的。 第一类错误:
H 0 : θ ∈ Θ 0 H 1 : θ ∈ Θ1
H 0为真但由于随机性样本 观测值落在拒绝域 W中,从而拒绝 H 0。 拒真概率 α = P(拒绝H 0 | H 0为真) = Pθ ( X ∈ W ) θ ∈ Θ 0
由于要检验的假设涉及总体均值, 故可借助于样本 均值来判断.
因为 X 是 µ 的无偏估计量 , 所以若 H 0 为真 , 则 | x − µ 0 | 不应太大 , X − µ0 ~ N (0,1), 当H 0为真时 , σ/ n | x − µ0 | 衡量 | x − µ 0 | 的大小可归结为衡量 的大小, σ/ n
第二类错误:
Байду номын сангаас
H 0不真但由于随机性样本 观测值落在接受域 W 中,从而接受 H 0。
受伪概率
β = P(接受H 0 | H1为真) = Pθ ( X ∈ W ) θ ∈ Θ1
假设检验的两类错误 真实情况 (未知) H0为真 H0不真 所 作 接受H0 正确 犯第II类错误 决 策 拒绝H0 正确
犯第I类错误
W = {( x1 , , x n ) : T ( x1 , , x n ) ≤ c1或T ( x1 , , x n ) ≥ c2 }

W = {( x1 , , x n ) :| T ( x1 , , x n ) |≥ c }
其中临界值 c1 , c2和c待定。
当拒绝域确定了,检验的判断准则也确定了
取给定的常数 α,通常 α总是取得很小 , 一般取
α = 0.01, α = 0.05, 满足
| X - µ0 | ≥ k H 0为真 = α p σ n
由标准正态分布分位点的定义得 k = u1−α / 2 ,
当 x − µ0 ≥ u1−α / 2时, 拒绝H 0 , x − µ0 < u1−α / 2时, 接受H 0 .
第四章 假设检验
统计假设检验的基本任务 根据样本所提供的信息,对未知总体分布的 某些方面(如总体均值、方差、分布本身等 等)的假设作出合理的判断。
主要内容

假设检验的基本概念 一个正态总体均值与方差的检验 两个正态总体均值与方差的检验 分布拟合检验 χ 2拟合检验法
独立性检验
§4.1 假设检验的基本概念
当α减小时, k变大,必导致 β 变大; 当β 减小时, k变小,必导致 α变大.
定义2: 对检验问题
H 0 : θ ∈ Θ0
v . s . H1 : θ ∈ Θ1
如果一个检验满足对任 意θ ∈ Θ 0,都有
g(θ ) = Pθ ( X ∈ W ) ≤ α θ ∈ Θ 0
则称该检验是显著性水 平为α的显著性检验, 简称水平为 α的检验。 说明:
X − µ1 k + ( µ 0 − µ1 ) ≤ β ( µ ) = Pµ1 { X − µ 0 ≤ k } = Pµ1 σ σ n n
k + ( µ 0 − µ1 ) , = Φ σ n
k α ( µ ) = 1 − Φ σ n
一、假设检验问题
例1:假定按国家规定,某种产品的次品率不得超过 1%,现从一批产品中随机抽出200件,经检查 发现有3件次品,试问:这批产品是否次品率 符合国家标准。 问题:根据抽样的结果来判断是否 p ≤ 0.01.
某厂生产的合金强度服 从正态分布 N (θ ,16),其中 例 2: θ的设计值为110( pa ),某天从生产中随机取 出25块 合金,测得强度值为 x1 , , x 25,其均值 x = 108,
(右侧检验)
(左侧检验)
其中 µ 0为常数。
现讨论 H 0 : µ = µ 0
v . s . H1 : µ > µ 0
对于正态总体, X是µ的UMVUE。若 X − µ 0比较大,则 应该认定 H 0为真时出现了小概率事 件,应该拒绝 H 0。
H 0 : 有病; H1:无病。
§4.2 一个正态总体均值和方差的 检验
总体X ~ N ( µ , σ ),X 1 , , X n为X的样本, x1 , , x n
2
为观测值。
一、方差 σ 2 已知时均值 µ 的假设检验
当σ 为已知时,在给定显著 性水平 α下,关于 µ
2
的检验问题有以下三种 :
以上所采取的检验法是符合小概率原理的.
由于通常 α总是取得很小 , 一般取 α = 0.01, α = 0.05,
X − µ0 因而当 H 0为真, 即µ = µ 0时, ≥ u1−α / 2 是一个 σ/ n 小概率事件 ,
在假设检验中,数 α 称为显著性水平.
拒绝域:使原假设被拒绝的样本观测值所在的区域。
H 0 : θ = 110
H 0 : X ~ N ( µ , σ 2 ).
(2) 抽取样本和集中样本的有关信息,要求对假设 H 0 的真伪进行判断,称为检验假设,最后对假 设 H 0作出拒绝或接受的决策。 假设检验问题的分类: 1. 参数假设检验:
若总体的分布函数 F ( x;θ1 , , θ k )或概率函数 p( x;θ1 , , θ k ) 已知,参数未知,假设 H 0针对未知参数提出并要 求检验。
控制α并制约 β ,通常选择 α = 0.01 / 0.05 / 0.1。
四、假设检验的基本步骤
(一) 建立假设:提出原假设 H 0 和备选假设 H1 . (二) 构造检验统计量与确定拒绝域的形式
分布密度 P ( x , θ )的表达式为已知时,通 常以θ的 ˆ为基础构造一个检验统 计量 极大似然估计 θ T = T ( X 1 , , X n ),并且在 H 0成立的条件下,确 定T的精确分布或渐近分布 。
待定正数。
σ2
n
)。
拒绝域形式 W = {( x1 , , x n ) : x − µ 0 ≥ k }, k为适当大的
k k X − µ0 ≥ = 1 − Φ α ( µ ) = Pµ0 { X − µ 0 ≥ k } = Pµ0 , σ σ σ n n n
2. 非参数假设检验 若总体的分布函数或概率函数为未知,假设 H 0 针对 总体的分布,分布的特征或总体的数字特征而提出 并要求检验。
H 0 表示原来的假设,称为原假设或零假设。
所考察的问题的反面称为备择假设或对立假设, 记为 H1 .
二、假设检验的基本原理
概率性质的反证法: 为了检验原假设 H 0是否正确,先假定H 0为正确,看 由此能推出什么结果,如果导致一个不合理现象出 现,则表明“假设 H 0 为正确”是错误的,拒绝原假 设 H 0;否则,则接受原假设 H 0 。
说明: 在实际问题中,只能控制第一类错误的最大 概率 α ,那么选择哪个假设作为原假设 H 0 ,就要 视具体问题的目的和要求而定。
H1 反映 (1)原假设 H 0 代表一种久已存在的状态, 一种变化。
(2)相比较来说,原假设 H 0 要比 H1 简单。 (3)尽量使后果严重的错误成为第一类错误。 例如: “有病当作无病”会危害病人健康; “无病当作有病”会浪费一些药品。 两种错误相比较,前者后果严重,应把它作为第 一类错误。据此所建立的假设应该是
拒真概率 α 和受伪概率 β 可用同一个函数表示。
定义1: 设检验问题
H 0 : θ ∈ Θ0
v . s . H1 : θ ∈ Θ1
的拒绝域为 W,则样本观测值 X落在拒绝域 W 内的概率称为该检验的 势函数,记为
g(θ ) = Pθ ( X ∈ W ) θ ∈ Θ 0 Θ1 .
显然,
θ ∈ Θ0 α (θ ) g (θ ) = 1 − β (θ ) θ ∈ Θ1
σ/ n
σ/ n
假设检验过程如下:
在实例中若取定 α = 0.05,
则 k = u1−α / 2 = u0.975 = 1.96,
又已知 n = 9, σ = 0.015, x − µ0 由样本算得 x = 0.511, 即有 = 2.2 > 1.96, σ/ n
于是拒绝假设H0, 认为包装机工作不正常.
相关文档
最新文档