第七章 假设检验(基础教育)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章 假设检验
一、教材说明
本章主要介绍统计假设检验的基本概念和基本思想、正态总体参数的统计假设的显著性检验方法.。

1、本章的教学目的与要求
(1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤;
(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;
(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;
(6)使学生灵活运用所学知识解决实际问题。

2、本章的重点与难点
本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定。

二、教学内容
下面主要分3节来讲解本章的主要内容。

§7.1 假设检验的基本概念
对总体分布或分布中的某些参数作出假设,然后利用样本的观测值所提供的信息,运用数理统计的分析方法,检验这种假设是否成立,从而决定接受或拒绝“假设”,这一统计推断过程,称为假设检验。

1.引例
我们先举一个简单的实例来说明假设检验的基本思想及推理方法.
例1:某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布.且知标准差为0.015千克.当机器正常时, 其均值为0.5千克,某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克):
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 分析:用μ和σ分别表示这一天袋装糖重总体X 的均值和标准差,则)015.0,(~2
μN X ,其中μ未知。

问题: 已知总体2(,)X
N μσ,且00.015,σσ==根据样本值判断0.5μ=还是
0.5μ≠。

提出两个对立假设00:0.5H μμ==(原假设或零假设)和 10:H μμ≠(备择假设).再利用已知样本作出判断是接受假设0H ( 拒绝假设1H ) , 还是拒绝假设0H (接受假设
1H ). 如果作出的判断是接受0H , 则0μμ=即认为机器工作是正常的, 否则, 认为是不
正常的.
因为X 是μ的无偏估计量,所以,若0H 为真,则0μ-x 不应太大,
0~(0,1)/X N n
σ,
衡量0μ-x 0/X n
σ的大小。

于是可以选定一个适当的正数k ,当观察
值x 0
0/X k n
σ-≥时,拒绝假设0H ;反之,当观察值x 满足
时k n
X <-/0
σμ,接受假设
0H 。

因为当0H 为真时,0
0~(0,1)/U N n
σ=
,由标准正态分布分位点的定义得:
/2,k u α= 0
/20/2000,,, .//x x u H u H n
n
ααμμσσ--≥<当
时拒绝时接受
假设检验过程如下: 在实例中,
(1)若取定 0.05, α=则/20.025 1.96,k u u α===我们有
00||
(|| 1.96)(
1.96)0.05./X P U P n
μσ->=>=
又已知0 9, 0.015, n σ==由样本算得 0.511, x =即有0
0 2.2 1.96,
/x n
μσ-=>于是根据小概率事件实际不可能性原理,拒绝假设0H , 认为包装机工作不正常. (2)若取定 0.01, α=则/20.005 2.58,k u u α===0
0 2.2 2.58, /x n
μσ-=<于是接
受假设0H , 认为包装机工作正常.
注:上述α称为显著性水平.此例表明假设检验的结论与选取的显著性水平α有密切的关系.所以,必须说明假设检验的结论是在怎样的显著水平α下作出的. 2.假设检验的基本思想及推理方法 1)假设检验基本思想
(1) 在假设检验中,提出要求检验的假设,称为原假设或零假设,记为0H ,原假设如
果不成立,就要接受另一个假设,这另一个假设称为备择假设或对立假设,记为1H 。

(2) 假设检验的依据——小概率原理:小概率事件在一次试验中实际上不会发生。

(3) 假设检验的思路是概率性质的反证法。

即首先假设成立,然后根据一次抽样所得的
样本值得信息,若导致小概率事件发生,则拒绝原假设,否则接受原假设。

(4) 假设检验可能犯的两类错误:
① 第一类错误(弃真错误):即假设0H 为真而被拒绝,记为α,即
00{|}P H H α=拒绝为真。

② 第二类错误(存伪错误):假设0H 不真而被接受,记为β,即
00{|}P H H β=接受不真。

③ 当样本容量n 一定时,,αβ不可能同时减少,在实际工作中总是控制α适当的小。

2)假设检验的程序
对任何实际问题进行假设检验,其程序一般为五步,即: ⑴根据题意提出零假设0H (或相应备选假设1H )。

⑵构造样本统计量并确定其分布;
⑶给定显著性水平α,查表确定临界值,从而得出接受域和拒绝域; ⑷由样本观测值计算出统计量的值;
⑸作出判断:若统计量的值落入拒绝域则拒绝0H ,若统计量的值落入接受域则接受0H 。

3)假设检验的主要方法
U 检验法、t 检验法、2χ检验法、F 检验法。

例2 已知某产品使用寿命X 服从正态分布,要求平均使用寿命不低于1000小时,现从一批这种产品中随机抽出25只,测得平均使用寿命为950小时,样本方差为100小时。

则可用( )
① t--检验法 ②2
χ--检验法 ③Z--检验法 ④F--检验法 解 选①
例3 假设检验时,只减少样本容量,犯两类错误的概率( ) ①都增大 ②都减少
③不变 ④一个增大,一个减少 解 选①
例4 正态总体()n X X X N X ,,,,,~212
σμ为样本,,11
∑==n
i i X n X 假设检验
()为已知数02
2
0:σσσ≤H ,在显著性水平α下,则当()
20
1
2
2
σ
χ∑=-=
n
i i
x x ( )时拒绝0H
①()221;n αχ≥- ②()2
121n αχ-≤-
③()2
1n αχ≤
- ④()21n αχ≥-
解 由于当0H 成立时,
*2
*2
2
2
(1)(1),n S n S σσ--≤

*2
22
(1)(1)n S n χσ--,故
*2
*2
2
222
(1)(1)(
(1))(
(1))n S n S P n P n ααχχασ
σ
--≥-≤≥-=,于是选④
§7.2 单个正态总体的假设检验
⑴22
00X :N(μ,σ),σ已知,检验假设H :μ=μ
U 检验法:
①001000H H μμμμμμμμ≠><:= (:或或)
②统计量0
00(0,1)()/U N H n
σ-
=
成立时。

③给出2
2
{}P U u u αααα>=,,查正表定.
④ 由样本值12n x x x (,,,) 计算u 的值
⑤ 判断:若/2||u u α>0,则拒绝H
(这是对双侧检验提出的U 检验法步骤,若是单侧可仿比)
(2)22
00X ∼N(μ,σ),σ未知,检验假设H :μ=μ
t 检验法:
①001000H H μμμμμμμμ≠><:= (:或或)
②00*
(1)()/T t n H S n
-
=
-成立时。

③给出2
2
{(1)}(1).P T t n t n αααα>-=-,,查t 分布表定
④由样本值计算T 的值.
⑤判断:若00
2
2
(1),(1),t t n H H t n αα≥--则拒绝,否则接受(若是单侧可查t 表定 同样得出拒绝域).
(3)2222
00(,),H X
N μσσσσ未知,检验假设:=
①2222
000H σσσ
σ≠1:=(H :) ②*2
221
02
2
(1)(1)()i n S
n H χχσσ=-=
=
-∑
n
-
2
i
(X -X )成立时。

③给出22
22
12
2
{(1)}{(1)}2
P n P n ααα
αχχχχ-
<-=>-=,,查2χ分布表定2
2
(1)
n αχ-及2
12
(1).n α
χ
-
-
④由样本值计算2
χ的值 ⑥ 判断:若2
2220012
2
(1)(1)n n H H ααχχχχ->
-<-或,则拒绝,反之则接受. (一)已知方差
例5 设某产品的某项质量指标服从正态分布,已知它的标准差150σ=,现从一批产品中随机地抽取26个,测得该项指标的平均值为1637。

问能否认为这批产品的该项指标值为1600(0.05α=) ?
解 (1)提出原假设: H 0:μ=1600,H 1:μ≠1600; (2)选取统计量0
X U n
σ=
(3)对于给定的显著性水平0.05α= ,查标准正态分布表
0.0252
1.96u u α==
(4)计算统计量观察值
1.258150
26
x u n
μσ-=
=

(5)结论 12
1.258 1.96u u
α
-
=<=接受原假设H 0
即不能否定这批产品该项指标为1600。

(二)未知方差,检验00μμ=:H
例6某厂生产乐器用合金弦线,其抗拉强度服从均值为10560(kg/2
cm )的正态分布。


从一批产品中抽取10根测得其抗拉强度(单位:kg/2
cm )为: 10512 10623 10668 10554 10776 10707 10557 10581 10666 10670
⑴对显著性水平α=0.05,问这批产品的抗拉强度有无显著变化? ⑵对显著性水平α=0.01,结果如何?(已知
()()()()0.050.0250.010.0059 1.833,9 2.262,9 2.821,9 3.250t t t t ====)
解 ①假设检验10560,10560:10≠=μμ:对H H ②方差未知时,检验数学期望选用统计量
()*2
20
0*
1
1,~1()1n i i X T n H T T n S
x x n S μ=-=
-=--∑在成立时,其中 ③对给定样本值,计算得()4.1063110670106231015210
1
11=+++=
=∑= n i i x n x ()2
2222211159044
*10512106701010631.419
9
n i i s x nx n =⎛⎫=-=++-⋅=
⎪-⎝⎭∑ 所以,统计量的样本值0*
2.78859044910
x t n
μ-=
==⋅ ④当显著性水平α=0.05时,拒绝域为()0.0259 2.262T t ≥=,
02.788 2.262,0.05,t H α=>=这里落入拒绝域,所以在不应接受即认为抗拉强度
有显著变化。

当显著性水平α=0.01时,拒绝域为 0.005||(9) 3.250T t ≥=,即认为这批产品的抗拉强度无显著性变化。

例7已知某种元件的寿命服从正态分布,要求该元件的平均寿命不低于1000 小时,现从这批元件中随机抽取25 只,测得平均寿命 980X =小时 标准差65s =小时 试在显著水平0.05α= 下,确定这批元件是否合格
(附表0.900.950.975(24) 1.138,(24) 1.171,(24) 2.064t t t ===)
分析 元件是否合格,应通过寿命低于1000 小时来判断(1000≥小时都合格),这里对总体均值的单测检验, 2
σ未知,用 t -检验法
解 ①提出检验假设0010:1000,:1000H H μμμμ==<=
②选取统计量 0
*
X T n
μ-=
,当 0H 成立时~(1)T t n - ③由样本观测值,计算统计量所取的值。

这里*
980,65x s == 得
9801000
1.5386525
t -=
=-
④对显著水平0.05α= 拒绝域(临界域)10.95(1)(24) 1.711t t n t α-≤--=-=- 因为0.95(24) 1.711t t >-=- ,未落入拒绝域,应接受0H ,否定1H :即认为这批元
件合格。

(三)未知均值,检验2
020:σσ=H
例5 某工厂生产的铜丝折断力(单位:斤)服从正态分布(
)2
8
,μN ,某日随机抽取了10根进行
折断力检验,测得平均折断力为57.5斤,样本方差为68.16,在05.0=α下,检验2
208:=σH 对()()()
7.29,023.199,8:2
025.02975.0221==≠χχσH
解 用-2χ检验法,检验统计量为20
22
σχn nS =
对05.0,10==αn 拒绝域为:
()()023.19912
0975.02212==-≥-χχχαn 或
()()7.2912
0975.0222==-≤χχαn x
有样本观察值,计算得65.10816
.68102
2
=⋅=
χ 因为()()()
()023.19,7.29,965.102
975.02025.02=∈=χχχ所以接受0H 。

例6 某种导线,要求其电阻的标准差不得超过0.005(欧姆)。

今在生产的一批导线中取样品9根,测得s=0.007(欧姆),设总体为正态分布,问在水平05.0=α下能认为这种导线的标准差显著地偏大吗?(()()5.178,507.1582
975.02
95.0==χχ)
分析 凡方差“大于”、“不低于”、“偏大”、“偏小”等问题,均属于方差的单侧检验问题,
其假设的提出有两种方式:有的书提出原假设2
020:σσ=H 和备择假设
()()()
2
2
20
2
0102022
21,:σ
σσσσσσσ≤≥或:原假设;有的书只提出是对立假设与或H H H H (注意原假设含有等
号),本教材按前者讲述。

解 用2
χ--检验法
①检验假设22021220200005.0:005.0:===σσσσ H H H ,:
②选用统计量()()1~,1220
2
22
--=n H s n χχσχ
成立时,当。

③由样本观察值,计算统计量所取值为2
χ=2
2
005
.0007.0*)19(-=15.68 ④对a= 0.05,由已知)8(95
.02
χ
=15.507,拒绝域)8()1(995.02
122χχχ=-≥-n a =15.507。

这里68.152
=χ>15.507故拒绝0H ,接受1H :即认为这批导线的标准差显著的偏大。

§7.3 两个正态总体的假设检验
(1)22
12012H σσμμ=,已知,检验假设:
U 检验法:
①01212H μμμμ=≠1:(H :) ②02
21
2
1
2
(0,1),()U N H n n σ
σ
--
=
+
成立时。

③给出2
αα,查正态表定u
④由样本值
1212n n x x x y y (,,,),(y ,,,) 计算U 的值
⑤作出判断:若002
u u H H α≥则拒绝,反之接受.
(2)2212012H σσσσμμ=22
12,未知,但=,检验假设:
t 检验法:
①0121121212H H μμμμμμμμ><:= (:=或或) ②121212012
(2)
(2)()n n n n T t n n H n n --
+-=
+-++*2
*211
22
成立时(n -1)S (n -1)S。

③④⑤同前
(3)22
120112,(:)H H μμσσσσ≠2212,未知,检验假设:=
F 检验法:
①22
0112(:)H H σσσσ≠2212:= ②*2*2
12
120/(1,1)()F S S F n n H =--成立时
(一) 已知21σ及2
2σ,检验假设210:μμ=H
例1 由累积资料知道甲,乙两矿的含灰率服从X ~N (5.7,1μ),Y ~N (6.2,2μ)。

现从两矿中各取几个试件,分析其含灰率为:
甲矿:24.3 20.8 23.7 21.3 17.4(%) 乙矿:18.2 16.9 20.2 16.7(%) 问:甲乙两矿所采煤的含灰率的数学期望1μ和2μ有无显著性水平差异?(显著性水平
a=0.10).(64.1,28.195.090.0==Z Z )
解 已知21σ及2
2σ,假设检验210:μμ=H ,用Z ~检验法。

①提出零假设210:μμ=H ,对211:μμ≠H ②选取统计量2
22
1
21
21)
(n n y x Z σ
σ
μμ+
---=
,当0H 成立时,Z ~N (0.1)
③对显著性水平a=0.10,由64.195.0=Z =1.64,确定临界域64.12
1==-a Z Z
④计算统计量Z 的 观察值。

18,5.21==Y X 于是
39.24
6
.255.7185.212
22
1
21
=+-=
+
-=
n n y
x Z σ
σ
由于Z =2.39> 1.64,故拒绝0H ,即可以认为1μ和2μ有显著性差异。

(二) 未知,但2
221σσ=,假设检验210:μμ=H
例2 某物品在处理前与处理后抽样分析含脂率(%)如下: 处理前x :0.19 0.18 0.21 0.30 0.41 0.12 0.17
处理后y :0.13 0.15 0.07 0.24 0.19 0.06 0.08 0.12
设含脂率分别服从正态分布N(211,σμ),N(2
22,σμ),对显著性水平a=0.05,试问:处理前后的平均含脂率有无显著性差异?(145.2)14(,160.2)13(975.0975.0==t t )
分析 首先需要F-检验法验证二总体方差是否有显著性差异,在无显著性差异(视为相等)的条件下,然后利用T-检验法在检验二总体均值是否有显著性差异。

解(1)利用F-检验法检验二总体方差有无显著性差异。

①检验假设2
2
21122210:,:σσσσ≠=H H ②选用统计量22
222
12
1σσS S F =,当0H :成立时,)1,1(~21--n n F F
③对给定显著性水平a=0.05,有F-分布表得临界值,
175.070
.51
)7,6(1)7,6(,12.5)7,6(2
2
2
1====-
a a a F F F
④计算统计量F 的样本观察值
∑∑====
==12
11
2
113.01,24.01n i n i i
i Y
n Y X n X
32
1
121
10*58.7)(111
-==--=∑n i i X X n S 31
2222
10*9.3)(112-==--=∑n i i Y Y n S 故)12.5,175.0(93.122
2
1∈==S S F ,接受0H ,认为二总体方差无显著性差异。

(2)利用T-检验法检验二总体均值有无显著性差异。

①检验假设221210:,:μμμμ≠=H H ②选取统计量
)
2(~11)
()(21-++---=
n m t n
m S y x T w
μμ2
121212
2
221121)
2()1()1()
(n n n n n n S n S n Y X T +-+-+----=
μμ
0H 成立时,)2(~21-+n n T
③对给定显著性水平a=0.05,得拒绝域160.2)13(975.0=≥t T ④计算统计量T 的观测值
849.2967.6*269
.011
.08713*8*710*9.3*710*5.7*613
.024.0)2()()1(3
32121212
212211==++-=
+-++--=
---n n n n n n S n S n Y X t
由于160.2)13(849.2975.0=>=t t 。

故拒绝0H ,接受1H 。

即处理后含脂率有显著差异。

(三) 均值未知,检验假设2
2210:σσ=H
例3 某一橡胶配方中,原用氧化锌5g ,现减为1g ,若分别用两种配方做一批实验,5g 配方测9个值,得橡胶伸长率的样本差是86.632
1=S ;1g 配方测3个值,橡胶伸长率的样本差是8.2362
2=S 。

设橡胶伸长率遵从正态分布,问两种配方的伸长率的总体标准差有无显著差异?(a=0.10)(39.3)8,9(,23.3)9,8(95.095.0==F F )
分析 两种配方的伸长率的总体标准差有无显著差异,是通过样本值去判断2
221σσ=是否成立,是均值未知的两个总体方差是否相等的检验,5g 配方和1g 配方记为
),(~),,(~2
22211σμσμN Y N X
解 ①检验假设2221122210:,:σσσσ≠=H H
②选取统计量22
22212
1σσS S F =,当0H 成立时)1,1(~21222
1--=n n F S S F
③对显著性水平a=0.10由题设295.039
.31
)8,9(1)9,8(,23.3)9,8(95.005.095.0====F F F 。

故拒绝域为[][]+∞⋃,23.3295.0,0 ④计算统计量F 的样本观察值
2697.08
.23686.632221===S S F
由于F=0.2697)23.3,295.0(∉,即F 落入拒绝域,应拒绝0H ,接受1H ,即在σ=0.10下
认为两个总体的方差是不等的。

注:若将显著性水平改为a=0.02,此时
91.5)8,9()8,9(,47.5)9,8()9,8(99.02
199.02
1====-
-
F F
F F
a a
此时拒绝域
[]
[][][)+∞⋃=+∞⋃⎥⎦⎤
⎢⎣⎡=+∞⋃⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡+∞⋃⎥⎦⎤⎢⎣⎡-,47.5169.0,0,47.591.51,0,)8,9(1,0),9,8()9,8(,099.099
.0212F F F F a a
样本观察值F=0.2697未落入拒绝域,故接受0H ,即认为两种配方总体方差无显著差异,说明显著性水平越小,否定零假设越困难。

(四) 均值未知,检验假设2
2210:σσ≤H
例4 有甲乙两车床生产同一型号的滚珠,根据已有经验可以认为,这两台车床生产的滚珠都服从正态分布,问题是要比较台车床生产的滚珠的直径的方差。

现在从这两台车床的产品中分别抽取8个和9个,经计算得甲X =15.01,乙X =14.99,2
甲S =0.0955,2
乙S =0.0261,对显著性水平a=0.05,试问:乙车床产品的方差是否比甲车床的小?
(90.4)7,8(,53.4)8,7(,73.3)7,8(,50.3)8,7(975.0975.095.095.0====f f f f )
分析 由题意,是验证2
2乙甲σσ<是否成立,而单边检验所提假设含等号,故此题可假设为2
20:乙甲σσ≤H
解 利用F-检验法检验两总体方差比。

①检验假设220:乙甲σσ≤H ,221:乙甲σσ>H
②选取统计量22乙

S
S F =
,第一自由度是7,第二自由度是8的F-分布
③由题知)8,7(95.0f =3.50,故拒绝域为[)+∞,50.3 ④统计量F 的样本观察值
694.30261
.00955
.022==
=

甲S S F
由于f=3.659 >3.50,故应拒绝0H ,接受1H 。

即乙车床产品的直径的方差比甲车床的小。

二、两个正态总体均值差的检验
设m x x x ,,,21 是来自总体X 服从),(2
11σμN 的样本,n y y y ,,,21 是来自总体Y 服从),(2
22σμN 的样本,且两样本相互独立,考虑如下的三种检验:
0:0:211210>-≤-μμμμH vs H (1)
0:0
:211210<-≥-μμμμH vs H (2)
0:0:211210≠-=-μμμμH vs H (3)
主要分两种情况讨论。

1、12,σσ已知时的两样本的检验
此时21μμ-的估计y x -的分布完全已知,),(~22
2
121n
m
N y x σσμμ+
--,由此可
采用U 检验法,检验统计量为
n
m
y
x U 22
21
σ
σ
+
-=
在21μμ=时,)1,0(~22
21
N n
m
y
x U σ
σ
+
-=。

检验的拒绝域取决于备择假设的形式。

上述三
对假设检验的拒绝域分布为:
};{1α-≥=U U U W
};{αU U U W <=
};{2

-
≥=U
U U W
2、σσσ==21但未知时的两样本t —检验
在22
2
21σσσ==未知时,类似于单个正态总体方差未知时均值的检验,我们仍用2
σ的无偏估计代替2σ,而此时可以证明2
σ的无偏估计为:
2)1()1(])()([212212
122-+-+-=
-+--+=∑∑==n m S n S m y y x x n m S y x n i i m i i w
于是有
)2(~11)
()(21-++---=
n m t n
m S y x T w
μμ
从而检验统计量为
n
m S y x T w
11+-=
在021=-μμ时,)2(~11-++-=
n m t n
m S y x T w。

上述三对假设检验的拒绝域分布为:
)}2(;{1-+≥=-n m t T T W α )}2(;{-+≤=n m t T T W α
)}2(;{2
1-+≥=-
n m t
T T W α
例7.2.3 某厂铸造车间为提高铸件的耐磨性而试制了一种镍合金铸件以取代铜合金铸件,从两种铸件中各抽取一个容量分别为8和9的样本,测得其硬度(一种耐磨性指标)为:
镍合金 76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34
铜合金 73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61 根据专业经验,硬度服从正态分布,且方差保持不变,试在显著性水平=α0.05下判断镍合金的硬度是否有明显提高? 解 略。

综上,关于两个正态总体均值差的假设检验问题可汇总成如下的表: 条 件 原假设0H
备择假设
1H
检验统计量 及其分布
拒绝域
2
1σσ
已 知 2
1μμ≤
21μμ>
)1,0(~22
21
N n
m
y
x U σ
σ
+
-=
α-≥1U U
2
1μμ≥
2
1μμ<
αU U ≤
0μμ=
0μμ≠
2

-
≥U
U
2
1σσ=
2
1μμ≤
21μμ>
)2(1-+≥-n m t T α。

相关文档
最新文档