第67讲 正态总体均值的假设检验(3)
正态总体均值的假设检验

上一段中, H0:μ=μ0 ; H1: μ≠μ0 的对立假设为H1:μ≠μ0 ,该假设称为双边对立假设。
2. 单边检验 H0: μ=μ0; H1: μ>μ0而现在要处理的对立假设为 H1: μ>μ0, 称为右边对立假设。
类似地,H0: μ=μ0; H1: μ<μ0 中的对立假设H1: μ<μ0,假设称为左边对立假设。
右边对立假设和左边对立假设统称为单边对立假设,其检验为单边检验。
例如:工厂生产的某产品的数量指标服从正态分布,均值为μ0 ;采用新技术或新配方后,产品质量指标还服从正态分布,但均值为µ。
我们想了解“µ是否显著地大于μ”,即产品的质量指标是否显著地增加了。
8.2.2 两个正态总体N(µ1, σ12) 和N(µ2, σ22)均值的比较在应用上,经常会遇到两个正态总体均值的比较问题。
例如:比较甲、乙两厂生产的某种产品的质量。
将两厂生产的产品的质量指标分别看成正态总体N(µ1, σ12) 和N(µ2, σ22)。
比较它们的产品质量指标的问题,就变为比较这两个正态总体的均值µ1和µ2的的问题。
上面,我们假定 σ12=σ22。
当然,这是个不得已而强加上去的条件,因为如果不加此条件,就无法使用简单易行的 t 检验。
在实用中,只要我们有理由认为σ12和σ22相差不是太大,往往就可使用上述方法。
通常是:如果方差比检验未被拒绝(见下节), 就认为σ12和σ22相差不是太大。
J 说明小结本讲首先介绍假设检验的基本概念;然后讨论正态总体均值的各种假设检验问题,给出了检验的拒绝域及相关例题。
正态总体均值与方差的假设检验

(1) σ1 = σ 2 = σ (未知),这一情形问题的一般提法是:
设 ( X1, X 2 , , X n1 ) 为来自 N (µ1,σ 2 ) 的样本, (Y1,Y2 , ,Yn2 ) 为来自 N (µ2 ,σ 2 ) 的样
+ (n2
−
1)S
∗2 2n2
n1n2 (n1 + n2 − 2) n1 + n2
在H0成立的条件下, T =
(X −Y)
(n1
− 1)S1∗n21
+
(n2
−
1)S
∗2 2n2
n1n2 (n1 + n2 n1 + n2
−
2)
~ t(n1
+ n2
−
2)
3°
给定显著性水平
α
(0
<
α
≤
0.05)
,
⎧ P⎨
平均成绩为 66.5 分,修正的标准差为 15 分. 问:在显著水平 0.05 下,是否可以认为这次考
试全体考生的平均成绩为 70 分? 解 设该次考试的学生成绩为 X,则 X ~ N (µ,σ 2 ) ,
1° 提出假设: H0: µ = 70 ; H1: µ ≠ 70 由于σ 2 未知,所以用 t 检验法.
拒绝域:W = {(x1, x2 , , xn1 ; y1, y2 , , yn2 ) : u ≥ 1.96}. 4° 由样本值: n1 = n2 = 5, x = 24.4, y = 27 计算U的观察值 u0 .
u0 =
(x − y) = 24.4 − 27 = −1.612
第二节-正态总体均值和方差的假设检验PPT课件

根据第六章定理三知,
当 H 0 为,真 X S/ n 时 0~t(n1 ),
P { 当 H 0为 ,拒 真 H 0 } 绝 P0 X S/n0 k ,
10
得 kt/2(n 1 ),
拒绝 t域 x s/n 0为 t/2(n1).
上述利用 t 统计量得出的检验法称为t 检验法.
故接H受 0,认为金属棒的 无平 显均 著. 长 变
12
例3 某种电子元件的寿命X(以小时计)服从正态
分布, , 2 均为未知. 现测得16只元件的寿命如
下: 152981002112223471972964 223261262851042964081570 问是否有理由认为元件的平均寿命大于225(小时)?
P 2 0 2 (n 1 2 )S 2 (n 0 1 2 )k . (因2 为 0 2 )
要 P { H 0 为 使 ,拒 H 真 0 } 绝 ,
只需 P 2 0 2 令 (n 1 2 )S 2(n 0 1 2 )k .
因(为 n 12)S2~2(n1),所(以 n01 2)k 2(n1),
拒绝域 x的 0k,(形 k待 式 ).定
由标准正态分布的分布函数(•) 的单调性可知,
P {拒H 绝 0|H 0为} 真 P 0(x 0 k )
4
P 0 x /n 00 /k n
1(0/k)n0(/ 0n k)0
0
(/0nk)/ kn,
因此 P { 拒 要 H 0|绝 H 0 控 为 } 制 真 ,
件都尽可能做到相同.先采用标准方法炼一炉, 然
后用建议的新方法炼一炉, 以后交替进行, 各炼了
10炉, 其得率分别为(1)标准方法: 78.1, 72.4, 76.2,
正态总体均值的假设检验讲义PPT(39张)

一、单个总体均值 的检验
二、两个总体均值差的检验(t 检验) 三、基于成对数据的检验(t 检验) 四、小结
一、单个总体 N(,2)均值 的检验
1 . 2为,关 已的 于 知 (Z 检 检 )验 验
在上节中讨论过体 正N态(总 ,2)
当 2为已 ,关 知 于 时 0的检验 : 问题
1.9 0 1.6 0 1.8 0 1.5 0 1.7 0 1.2 0 1.7 0 假定切割的长度服从正态分布, 且标准差没有变
化, 试问该机工作是否正常? (0.05 )
解 因X 为 ~N (,2),0.15,
要检验假设
H 0:1.5 0, H 1:1.5 0,
n15, x1.04,80.0,5
(1)假设检 H0:验 0,H1:0; (2)假设检 H0:验 0,H1:0; (3)假设检 H0:验 0,H1:0.
讨论中都是H利 0 为用真时服N(从 0,1)分布
的统计Z量X0 来确定拒绝,这 域种 的 / n
检验法称 Z检 为验.法
一个有用的结论
解 设该次考试的学生为 成X绩, 0.0,5
则 X ~N (,2)样 , 本均X值 ,样为 本标准 S, 差
需检验假设: H 0 : 7 ,0 H 1 : 7 .0
因为 2未知 , 故采t用 检验,法 当H0为真, 时
统t 计 X 0 量 X 7~ 0 t(n 1 ), S /nS /n 查表 8-1 知拒绝域为 tX S/7n0 t/2(n1), 由 n 3 ,X 6 6 . 5 ,S 6 1 ,t 0 . 0 5 ( 3 2 ) 5 2 5 . 0,3
S/ n
当观察 t 值 xs/n0 过分大时 H0,就拒绝
§正态总体均值的假设检验

1 , 2 , 2 未知,
问新操作方法是否会增加钢的得率? (α=0.05)
解:
H 0 : 1 2 0,
n1 10, n2 10,
H 1 : 1 2 0
2 s1
x 76.23,
3.325,
y 79.43,
2 s2 2.225,
2 2 ( n 1 ) s ( n 1 ) s 2 1 2 2 sw 1 2.775, n1 n2 2
H1 : 0
(2) 选取检验统计量
X 0 Z n
在 H 0 成立的条件下, Z ~ N (0,1) (3) 给定的显著性水平α ,查正态分布表得临界值 z
2
P{ Z z 2 }
(4) 计算检验统计量与临界值比较;
(5) 拒绝域
x 0 z 2 , n
(1) 提出假设
H0 : 0 ,
H1 : 0
(2) 选取检验统计量
X 0 t S n
在 H 0 成立的条件下, t ~ t ( n 1) (3) 给定的显著性水平α ,找临界值
t 2 (n 1)
使
P{ t t 2 ( n 1)}
x 0 t 2 ( n 1), 下结论. s n
解:设两种方法处理后的羊皮含脂率分别为X 和Y,
X ~ N ( 1 , 2 ), Y ~ N ( 2 , 2 )
x 16.375, y 14.857,
sw 2.945,
H 0 : 1 2 0, H1 : 1 2 0
在H0成立下,
X Y T ~ t ( n1 n2 2) 1 1 SW n1 n2
正态总体均值的假设检验

假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
3.大样本单个正态总体均值的检验
设总体为 X ,它的分布是任意的,方差 2 未知, X1 ,X2 , ,Xn 为 来自总体 X 的样本,H0 : 0( 0 已知).当样本容量 n 很大( n 30 )
时,无论总体是否服从正态分布,统计量 t X 0 都近似服从正态分 S/ n
解 依题意,建立假设 由于 2 未知,故选取统计量
H0 : 0 72,H1 : 72 . t X 0 , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | | t |
x 0
s/ n
t
/
2
(n
1)
.
又知 n 26,x 74.2,s 6.2,查表得 t /2 (25) t0.025 (25) 2.06 ,则有 | t | x 0 74.2 72 1.81 2.06 , s/ n 6.2/ 26
解 依题意,建立假设 由于 2 未知,取检验统计量
H0 : 0.8,H1 : 0.8 .
t X 0 ~ t(n 1) , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | t x 0 s/ n
t (n 1) .
又知 n 16 ,x 0.92,s 0.32 ,查表得 t0.05 (16 1) t0.05 (15) 1.75,则有 t x 0 0.92 0.8 1.50 1.75 , s/ n 0.32/ 16
假设检验 H0 : 0 ,H1 : 0 的拒绝域为 W {t | t t (n 1)}.
(7-8) (7-9)
假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
假设检验 正态总体均值的假设检验

拒绝域 |u|为 u/2,
临界点 u/2及 为 u/2.
.
11
3. 两类错误及记号
假设检验是根据样本的信息并依据小概率原 理,作出接受还是拒绝H0的判断。由于样本具有 随机性,因而假设检验所作出的结论有可能是错 误的. 这种错误有两类:
(1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称做第一类错误, 又叫弃
第八章 假 设 检 验
第1节 假设检验
一、假设检验的基本原理 二、假设检验的相关概念 三、假设检验的一般步骤
.
1
一、假设检验的基本原理
在总体的分布函数完全未知或只知其形式、 但不知其参数的情况下, 为了推断总体的某些性 质, 提出某些关于总体的假设.
例如, 提出总体服从泊松分布的假设;
又如 ,对于正态总体 期提 望出 等 0的 数 于学
1.9 0 1.6 0 1.8 0 1.5 0 1.7 0 1.2 0 1.7 0 假定切割的长度X服从正态分布, 且标准差没有 变化, 试问该机工作是否正常?
解 X~N(,2),0.15,
1.提出假设
H0:1.0 5, H 1:1.0 5,
.
17
2.求统计量值
n15, X 10.48, 则 uX01.048 1.05 0.51,6
下面结合实例来说明假设检验的基本思想.
.
3
实例 某车间用一台包装机包装葡萄糖, 包得的 袋装糖重是一个随机变量, 它服从正态分布.当 机器正常时, 其均值为0.5公斤, 标准差为0.015 公斤.某日开工后为检验包装机是否正常, 随机 地抽取它所包装的糖9袋, 称得净重为(公斤): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
正态总体均值的假设检验.

2/6
设 X1 , X 2 , , Xn 为总体 X ~ N ( , 2 )的样本 , , 2均未知. 试在显著性水平 下,检验假设 H0 : 0 , H1 : 0 ( 0已知 ) X 是 的 MLE 及无偏估计,故当 H0 成立时, X 0 的值应偏 小于零 ,否则便要拒绝 H0 . 统计量 单边检验问题 在临界点 0 处有 单边 t 检验法 X 0 ~ t (n 1) 故由
S/ n 又当 H0为真时 X 0 ~ t (n 1) S/ n
t 检验法
故由
| X 0 | P t / 2 (n 1) 0 S/ n
求得 H0的拒绝域为
| X 0 | S t / 2 (n 1) . n
第八章 假设检验
§2 正态总体均值的假设检验
§2 正态总体均值的假设检验
1/6
设 X1 , X 2 , , Xn 为总体 X ~ N ( , 2 )的样本 , , 2均未知. 试在显著性水平 下,检验假设 H0 : 0 , H1 : 0 ( 0 已知 ) X , S 2分别是 , 2的无偏估计,故当 H0 为真时, | X 0 | 统计量双边检验问题 的值应偏小,否则便要拒绝 H0 .
S/ n
P X 0 t (n 1) 0 S/ n
求得 H0的拒绝域为 X 0 t (n 1) 或 X S t (n 1) . 0 S
/ n
n 第八章 假设检验
§2 正态总体均值的假设检验 某种元件的寿命 X ~ N ( , 2 ), , 2 均未知.现测得 16只元件的寿命(小时)如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170 问能否认为元件的平均寿命大于225(小时)? ( 0.05) 依题意,要检验假设 为什么会提出“平均寿命大于225小时”的问题 在样本观察值中,有7个数据值远大于225, 采用单边 t 检验法 ,求得 H0 的拒绝域是 有3个数据值接近 225 S t (n 1) 225 43.269 268.269 X x 241 0 225 n (15) 1.7531, s 98.7259 其中 n 16, t0.05实际问题需要 怎样提假设 x 241 268.269 不拒绝 H0 H 0: 0 225, H1: 0 即认为元件的平均寿命不大于225(小时). H 0: 0 225, H1: 0 H 0: 0 225, H1: 第八章 0 假设检验
正态总体均值与方差的假设检验

2°
取检验统计量:
T
=
X−
S
∗ n
µ0 n
在H0成立的条件下, T
=
X − µ0
S
∗ n
n
~ t(n − 1)
3°
给定显著性水平
α
(0
<
α
≤
0.05)
,
⎧ P⎨
T
⎫ ≥ tα (n − 1)⎬ = α
⎩
2
⎭
查表可得临界值 t α (n − 1). 拒绝域:W = {(x1, x2 , , xn ) : t ≥ tα (n − 1)}.
2
, xn ) : u ≥ uα }.
2
α
y = ϕ(x)
α
2
2
−uα O uα
x
2
2
4° 由样本值计算U的观察值 u0 .
5° 作判断:若 u0 ∈W,则拒绝 H0;否则, 若 u0 ∈ W,则接受H0.
例 7.4 某工厂生产的铜丝的折断力(单位:N)服从正态分布N(µ, 82). 某日抽取 10 根铜 丝, 进行折断力试验, 测得结果如下:
578, 572, 570, 568, 572, 570, 572, 596, 584, 570 若已知µ=576, 问是否可以认为该日生产的铜丝合格(α=0.10)? 解 1° 假设: H0: µ = 576 ; H1: µ ≠ 576
2° 取检验统计量: U = X − 576 8 10
在H0成立的条件下,U = X − 576 ~ N (0,1) 8 10
2
拒绝域:W = {(x1, x2 ,
, xn1 ; y1, y2 ,
, yn2 ) :
正态总体均值的假设检验

于是
x
0
/n
0.516
z0.05
1.645,
故接受 H0 , 认为该机工作正常.
2. 2为未知, 关于 的检验( t 检验)
设总体 X ~ N (, 2 ), 其中, 2 未知, 显著性水平为 .
求检验问题 H0 : 0 , H1 : 0 的拒绝域.
设 X1 , X2 ,, Xn 为来自总体 X 的样本,
正态总体均值的假设检验
一、单个总体均值 的检验
二、两个总体均值差的检验(t 检验) 三、基于成对数据的检验(t 检验)
一、单个总体N(, 2)均值 的检验
1. 2 为已知, 关于 的检验( Z 检验)
在正态总体 N(, 2) 讨论中
当
2为已知时,
关于
的检验问题
0
:
(1) 假设检验 H0 : 0 , H1 : 0 ; (2) 假设检验 H0 : 0 , H1 : 0 ; (3) 假设检验 H0 : 0 , H1 : 0 .
设两样本独立. 注意两总体的方差相等. 又设 X ,Y 分别是总体的样本均值, S12 , S22 是样本方
差, 1, 2 , 2 均为未知,
求检验问题 H0 : 1 2 , H1 : 1 2 ( 为已知常数)的拒绝域.
取显著性水平为 .
引入 t 统计量作为检验统计量:
t
(X Sw
11 n1 n2
k
得 k t / 2 (n1 n2 2).
故拒绝域为
t
(x sw
y)
11 n1 n2
t / 2 (n1
n2
2).
关于均值差的其它两个检验问题的拒绝域见表
8.1, 常用 0 的情况.
正态总体均值的假设检验

拒绝域为 u u u0.05 1.645 .
现在 u x 0 41.25 40 3.125 1.645 , / n 2 / 25
即 u 的取值落在拒绝域中,所以在显著性水
平 = 0.05下拒绝 H0,接受 H1,即认为这
2
2 0
2 0
H0:
,H1:
.
其中
为已知常数.检验统计量
T
1
2 0
n
(Xi )2
i 1
~ 2 (n) .
对于给定的显著性水平 ,拒绝域为
t 12 / 2 (n) 或
t
2
/
2
(n)
.
上述检验的统计量服从 2 分布,称此种检
验为 2 检验,类似地可以进行单边检验(见表
右边检验的拒绝域为 t k ,左边检验的拒绝域为 t k .
例2 某工厂生产的固体燃料推进器的燃烧率
服从正态分布 N (, 2 ), 40cm / s , 2cm/ s ,
现在用新方法生产了一批推进器,从中抽取 n=25 只,测得样本均值为 x 41.25cm / s .设在新方
二、两类错误
由于检验法则是依据样本作出的,因此假设 检验的结果可能犯两类错误:
第一类错误:当原假设H0为真时,作出的决 定却是拒绝H0,犯这类错误的概率记为 ,即
P{拒绝H0|H0为真}= . 第二类错误:当原假设H0不正确时,作出的决定却是接受H0,犯这类错 误的概率记为 ,即
P{接受H0|H0不正确} = .
在H0成立时,检验统计量
对于正态总体均值的假设-PPT精品文档

0 0
|X | 0 P t ( n 1 ) 0 真} P { | 0 拒绝 HH Sn / 2 0 /
决策一和决策二的可信度哪个高 一般说成“不拒绝 H 0 ”
真} P { |H 接受 H 1 0
第八章
假设检验
§4 置信区间与假设检验之间的关系
H
0
H : ,H : 0 0 0 1
n 0 1 2
考虑显著性水平为 的双边假设检验问题 则 有 反之 ,若 H的接受域是 Θ 0 即有 特别有
1 2
P { } 1 ( X , X , , X ) ( X , X , , X )
n
由 的任意性即有 这说明 0 H 的拒绝域是 0
P { ( ) ( ) } P { ( X , X ,, X ) ( X , X ,, X ) | } 1 n 0 n 0 0 0 12 12
假设检验
P { (, X XX ,, ) X XX ,, ) } 1 n n 1 2 1 2 或 (, (, X XX ,, ) (, X XX ,, ) n n 0 0 1 2 1 2 这说明 的置信水平为 1 的置信区间是 ( , ).
§4 置信区间与假设检验之间的关系 对于正态总体均值的假设
H : 0 0 , H : 0 0 5 1 0
t/2(n 1 )
1/3
0 采用 Leabharlann 检验法求得 H 的拒绝域是 | X0 |
S/ n | s t ( n 1 ) , 则拒绝 H 若 | x 0 /2 n st ( 1 ) , 则接受 H 若 | x 0| /2 n n
正态总体均值的检验

12
m
2 2
n
∴拒绝域为
X Y
2 1
m
2 2
n
(2)方差12=22 =2 ,但2未知的情况 根据定理
X Y
1
2
∴当H0:1= 2 为真时,
1 1 S m n
~tm n 2
X Y ~tm n 2 1 1 S m n
欲考察一项新技术对提高产品质量是否 有效。 我们把新技术实施前后生产的产品质 量指标分别看成一个正态总体N(1,12)和 N(2,22)。这时,我们所考察的问题,就 归结为检验这两个正态总体的均值1和2 是否相等的问题。
设X1,X2,,Xm与Y1,Y2,,Yn分别为来自正 态总体N(1,12)和N(2,22)的样本,且两 个样本独立。考虑检验假设:
2 2
则拒绝原假设;否则接受原假设。
例4 某炼铁厂的铁水含碳量X在正常情况下 服从正态分布,现对工艺进行了某些改进, 从中抽取5炉铁水测得含碳量如下: 4.421,4.052,4.357,4.287,4.683, 据此是否可判断新工艺炼出的铁水含碳量的 方差仍为0.1082(=0.05)?
解:这是一个均值未知,正态总体的方差 检验,用2检验法。
§3.2 正态总体参数的假设检验
一、正态总体均值的检验 (I) H0:μ=μ0 H1:μ≠μ0
设X1,X2, ,Xn为来自总体N(,2)的样本, 对以上假设的显著性水平为的假设检验。.
方差2已知的情况(检验法) 构造统计量
X 0 ~N (0,1) / n
X 0 P Z / 2 / n 即P X 0 Z / 2 ( / n )
总体均值的假设检验

总体均值的假设检验一、正态总体均值的检验设n X X X ,,, 21为总体),(2σμN 的一个容量为n 的样本. 1.方差2σ已知,μ的检验——u 检验法. 当202σσ=已知时,假设检验问题:0100μμμμ≠=:;:H H . 选择检验统计量nX U /00σμ-=,当0H 成立时,)1,0(~N U .给定显著性水平α,由标准正态分布分位点的定义, 有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ,这种利用服从正态分布的检验统计量的检验方法称为u 检验法.有时我们只关心总体的均值是否增大(或减小).比如,经过工艺改革后,产品的质量(如材料的强度)比以前是否提高,此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ,还是大于0μ,即检验假设 0100μμμμ>≤:;:H H . 可以证明,在显著性水平α下,上述假设检验问题和检验假设0100μμμμ>=:;:H H 有相同的拒绝域,因此,遇到形如00μμ≤:H 的检验问题,可归结为后一个假设检验问题讨论. 类似地,形如0100μμμμ<≥:;:H H 的检验问题, 可归结为检验假设 0100μμμμ<=:;:H H .这都是单边检验问题.给定显著性水平α,求得的临界值点是上α分位点或上α-1分位点.例1 某厂生产的某种钢索的断裂强度X 服从),(2σμN ,其中40=σ(kg/cm 2),现从这批钢索中抽取容量为9的样本,测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2),设总体方差不变,问在1.00=α下,能否认为这批钢索质量有显著提高?解 依题意,检验假设0100μμμμ>≤:;:H H , 由于40=σ已知,选择检验统计量nX U /0σμ-=因为0H 中的μ全部都比1H 中的μ要小,从直观上看,当0H 成立时,X 的取值x 不应比μ大很多,若偏差0μ-x 过大,则拒绝0H 而接受1H .因为 0100μμμμ>=:;:H H 的拒绝域为}{αu U W >=, 故在显著性水平1.00=α下原假设的拒绝域为}{}{0nu X u U W σμαα+>=>=.本题中,9=n ,40=σ,200=-μx ,33.201.0=u , 计算U 的值33.25.1/0<=-=nx u σμ因此在显著性水平1.00=α下不能拒绝0H ,即认为这批钢索质量没有显著提高.2.方差2σ未知,μ的检验——t 检验法. 检验假设0100μμμμ≠=:;:H H .因为2σ未知,而样本方差2S 是总体方差2σ的无偏估计量,用S 代替σ. 选择检验统计量 nS X T /0μ-=,当0H 成立时,)1(~-n t T .给定显著性水平α,由t 分布分位点的定义, 有αα=->)}1(|{|2/n t T P ,故拒绝域)}1({)}1({)}1(|{|2/2/2/->--<=->=n t T n t T n t T W ααα , 这种利用服从t 分布的检验统计量的检验方法称为t 检验法.例2 某切割机工作正常时,切割每段金属棒的平均长度为10.5cm .今在某段时间内随机地抽取15段进行测量,其结果如下(cm):10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间内该机工作是否正常(5.00=α)?假设金属棒长度服从正态分布.解 依题意,检验假设0100.510μμμμ≠==:;:H H , 由于2σ未知,故选择检验统计量nS X T /0μ-=.在0H 下,)1(~-n t T ,15=n .给定显著性水平5.00=α,查t 分布表, 得临界值1448.2)14()1(025.02/==-t n t α,故拒绝域)}1(|{|2/->=n t T W α.由已知条件可得48.102.15715111=⨯==∑=n i i x n x056.0784.0141)(11122=⨯=--=∑=n i ix x n s 故2366.0=s .计算统计量的值3274.015/2366.05.1048.10/0-=-=-=ns x t μ因为)1(||2/-<n t t α,所以接受0H ,认为切割机工作正常.例3 设木材的小头直径),(~2σμN X ,12≥μcm 为合格,今抽出12根测得小头直径的样本均值为2.11=x cm ,样本方差为44.12=s cm 2,问该批木材是否合格(5.00=α)?解 依题意,检验假设010012μμμμ<=≥:;:H H ,选择检验统计量nS X T /0μ-=.在假设0100μμμμ<=:;:H H 下,)1(~-n t T ,12=n .给定显著性水平5.00=α,查t 分布表,得临界值7959.1)11()1(05.0==-t n t α,故拒绝域)}1({--<=n t T W α,也是假设010012μμμμ<=≥:;:H H 的拒绝域. 由于2.11=x ,44.12=s ,计算统计量的值3094.212/44.1122.11/0-=-=-=ns x t μ因为)1(--<n t t α,故拒绝0H ,认为该批木材是不合格的. 二、正态总体方差的检验——2χ检验法设n X X X ,,, 21为来自总体),(2σμN 的一个样本,检验假设 20212020σσσσ≠=:;:H H .1.均值μ已知. 因为)1,0(~N X i σμ-,n i ,,2,1 =,则选取检验统计量∑∑==-=⎪⎪⎭⎫ ⎝⎛-=ni ini i XX 12201202)(1μσσμχ.当0H 成立时,)(~22n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=><-))}(())({(22/222/12n n P ,故得拒绝域)}({)}({22/222/12n n W ααχχχχ><=- .2.均值μ未知.因为X 是总体均值μ的无偏估计量,用X 代替μ.选择检验统计量202122)1(σσχS n XX ni i -=⎪⎪⎭⎫ ⎝⎛-=∑=. 当0H 成立时,)1(~22-n χχ,给定显著性水平α,由2χ分布表分位点的定义,有αχχχχαα=->-<-))}1(())1({(22/222/12n n P故得拒绝域)}1({)}1({22/222/12->-<=-n n W ααχχχχ .类似地,在μ已知和μ未知时,可以求出检验假设20212020σσσσ>≤:;:H H 和20212020σσσσ<≥:;:H H的拒绝域.例如,在μ未知时,检验假设2020σσ≤:H 的拒绝域为)}1({22->=n W αχχ.上述检验所用的检验统计量均服从2χ分布,称这种检验方法为2χ检验法例4 某无线电厂生产的一种高频管,其中一指标服从正态分布),(2σμN ,今从一批产品中抽取8只管子,测得指标数据:68 43 70 65 55 56 60 72(1) 总体均值60=μ时,检验228=σ(取5.00=α); (2) 总体均值μ未知时,检验228=σ(取5.00=α). 解 本题是在显著性水平5.00=α下,检验假设2021220208σσσσ≠==:;:H H ,这里8=n .(1) 60=μ已知时临界值35.517)8()(2025.022/==χχαn ,80.12)8()(2975.022/1==-χχαn ,而检验统计量的值359.10663641)(811222=⨯=-=∑=ni i x μχ, 由于)()(22/222/1n n ααχχχ<<-,故接受0H .(2) μ未知时临界值13.016)7()1(2025.022/==-χχαn ,90.61)7()1(2975.022/1==--χχαn ,而125.614898111=⨯==∑=n i i x n x ,875.652)()1(122=-=-∑=ni i x x s n ,检验统计量的值2012.1075.86526412=⨯=χ, 由于)1()1(22/222/1-<<--n n ααχχχ,故接受0H .§8.3 两个正态总体参数的假设检验设121n X X X ,,, 为总体),(~112σμN X 的一个样本,221n Y Y Y ,,, 为总体),(~222σμN Y 的一个样本.∑==1111n i i X n X 和∑==2121n i iYn Y 分别是两个样本的样本均值,∑=--=112121)(11n i i X X n S 和∑=--=212222)(11n i i Y Y n S 是相应的两个样本方差.设这两个样本相互独立..一、两个正态总体均值的检验考虑检验假设 211210μμμμ≠=:;:H H . 1.方差21σ与22σ已知——u 检验法. 选取 22212121)()(n n Y X U σσμμ+---=.当0H 成立时,检验统计量)1,0(~222121N n n YX U σσ+-=.给定显著性水平α,由标准正态分布表分位点的定义,有αα=>}|{|2/u U P ,故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= .例1 设从甲乙两场所生产的钢丝总体X ,Y 中各取50束作拉力强度试验,得1208=x ,1282=y ,已知801=σ,942=σ,请问两厂钢丝的抗拉强度是否有显著差别(5.00=α)?解 本题是在显著性水平5.00=α下, 检验假设211210μμμμ≠=:;:H H , 这里5021==n n .选取检验统计量222121n n YX U σσ+-=.给定显著性水平05.0=α,查标准正态分布表,得临界值96.1025.02/==u u α,故拒绝域}|{|2/αu U W >=.由于1208=x ,1282=y ,801=σ,942=σ, 计算检验统计量的值2392.450/)(2221-=+-=σσy x u .由于2/||αu u >,故拒绝0H ,认为两厂钢丝的抗拉强度有显著差别. 2.方差21σ与22σ未知,但2221σσ=——t 检验法.选取 212111)()(n n S Y X T w+---=μμ.这里2)1()1(21222211-+-+-=n n S n S n S w .当0H 成立时,检验统计量)2(~112121-++-=n n t n n S Y X T w.给定显著性水平α,由t 分布表分位点的定义, 有αα=-+>)}2(|{|212/n n t T P ,故拒绝域)}2({)}2({212/212/-+>-+-<=n n t T n n t T W αα .例2 某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量有无显著差异?解 检验假设211210μμμμ≠=:;:H H ,这里621==n n ..525=x ,67.625=y ,7386.21=s ,3267.32=s ,0469.3=w s . 选取检验统计量2111n n S Y X T w+-=.给定显著性水平5.00=α,查t 分布表,得临界值2281.2)10()2(025.0212/==-+t n n t α,故拒绝域)}2(|{|212/-+>=n n t T W α.计算统计量的值0949.00469.33)667.255.25(1121-=⨯-=+-=n n s y x t w.由于)2(||212/-+<n n t t α,故接受0H ,认为两种香烟的尼古丁含量无显著差异. 二、两个正态总体方差的检验——F 检验法 考虑检验假设 2221122210σσσσ≠=:;:H H . 1.均值1μ与2μ已知.因为)(~)(11212121211n Xn i iχμσχ∑=-=,)(~)(12212222222n Yn i iχμσχ∑=-=,选取221222211211222121/)(1/)(1//21σμσμχχ∑∑==--==n i i n i i Y n X n n n F . 当0H 成立时,检验统计量),(~)(1)(1211222121121n n F Y n X n F n i i n i i ∑∑==--=μμ.给定显著性水平α,由F 分布分位点的定义,有ααα=><-))},(()),({(212/212/1n n F F n n F F P , 故得拒绝域)},({)},({212/212/1n n F F n n F F W αα><=- . 2.均值1μ与2μ未知.因为)1(~)1()(112212111221211--=-=∑=n S n X X n i i χσσχ,)1(~)1()(122222221222222--=-=∑=n S n Y Yn i iχσσχ,选取22222121222121//)1/()1/(σσχχS S n n F =--=.当0H 成立时,检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,由F 分布分位点的定义,有ααα=-->--<-))}1,1(())1,1({(212/212/1n n F F n n F F P , 故得拒绝域)}1,1({)}1,1({212/212/1-->--<=-n n F F n n F F W αα .例3某烟厂生产两种香烟,独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数,分别测得:甲种香烟:25 28 23 26 29 22 乙种香烟:28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差,在显著性水平5.00=α下,判断两种香烟的尼古丁含量的方差是否相等? 解 考虑检验假设2221122210σσσσ≠=:;:H H . 由于两个正态总体的均值都未知,选取检验统计量)1,1(~212221--=n n F S S F .给定显著性水平α,查F 分布表,得两个临界值:15.7)5,5()1,1(025.0212/==--F n n F α1399.015.71)5,5(1)5,5()1,1(025.0975.0212/1====---F F n n F α,故得拒绝域}15.7{}1399.0{><=F F W . 计算统计量的值6777.03267.37386.2222221===s s F .由于15.71399.0<<F , 故接受0H ,认为两种香烟的尼古丁含量的方差也无显著差异.§8.4 非正态总体参数的大样本检验本节讨论一般总体参数的检验.设总体X 的均值为μ,方差为2σ, n X X X ,,, 21为总体X 的一个样本.由中心极限定理可知,当样本容量n 足够大时,nX U /σμ-=近似地服从标准正态分布.因此,我们可以用正态分布去近似.如果对均值μ进行检验,方差2σ未知时,可以用样本方差2S 代替2σ;如果对方差2σ进行检验,均值μ未知时,可以用样本均值X 代替μ.下面举两个例子.例1 设某段高速公路上汽车限速为104.6km/h ,现检验85辆汽车的样本,测出的平均车速为106.7km/h ,已知总体标准差为.413=σ km/h ,但不知总体是否服从正态分布.在显著性水平50.0=α下,试检验高速公路上的汽车是否比限制速度104.6km/h 显著地快?解 依题意,检验假设0100.6104μμμμ>=≤:;:H H , 由于.413=σ已知,n =85足够大, 选择检验统计量nX U /0σμ-=近似地服从)10(,N .其拒绝域}{αu U W >=,其中65.105.0==u u α. 计算U 的值449.4185/4.136.1047.106=-=u ,由于αu u <,因此接受0H ,没有理由认为高速公路上的汽车比限制速度104.6km/h 显著地快.例2 为比较甲乙两种小麦植株的高度(单位:cm),分别抽得甲、乙小麦各100穗,在相同条件下进行高度测定,算得甲乙小麦样本均值和样本方差分别为28=x ,8.3521=s ,26=y ,3.3222=s ,问这两种小麦的株高有无显著差异(50.0=α)?解 依题意,检验假设 211210μμμμ≠=:;:H H , 选取 22212121)()(n n Y X U σσμμ+---=,这里两个方差用样本方差代替.当0H 成立时, 检验统计量 222121n Sn S Y X U +-=近似地服从)1,0(N .给定显著性水平05.0=α,查附表3,得临界值96.1025.02/==u u α, 得拒绝域}|{|2/αu U W >=.计算U 的值4236.21003.328.352628=+-=u ,由于αu u >,因此拒绝0H ,认为这两种小麦的株高有显著差异.当总体服从(0-1)分布),1(p b 时,由于只有一个参数p ,总体均值p 和方差)1(p p -均只与p 有关,这时对参数p 进行假设检验时,检验统计量可以直接用样本和参数p 表示出来.例3 某厂有一批产品须经检验后方可出厂.按规定二级品率不得超过10%,从中随机抽取100件产品进行检查,发现有二级品14件,问这批产品是否可以出厂(50.0=α)?解 这里n =100,14.0=x .检验假设01001.0p p H p p H >=≤:;:, 选取检验统计量 np p p X U )1(000--=,U 近似地服从)1,0(N .由显著性水平50.0=α,可以得到拒绝域}{αu U W >=,其中65.105.0==u u α,计算U 的值333.31100.90.10.104.10=⨯-=u ,由于αu u <,因此接受0H ,认为这批产品二级品率没有超过10%,可以出厂.§8.5 分布的拟合检验前几节的检验都是参数的检验.实际问题中,有时需要对分布作出假设,进行检验.本节只介绍一种分布的检验方法——皮尔逊2χ检验法,它只适合于大样本的情形,一般要求样本容量50≥n .设总体X 的分布函数为)(x F ,)(0x F 为一个已知的分布函数,n X X X ,,, 21为总体X 的一个样本,我们来检验关于总体分布的假设)()()()(0100x F x F H x F x F H ≠=:;:.一、基本原理2χ检验法的基本思想是:将随机试验的所有可能结果的全体分成k 个两两互不相容的事件k A A A ,,, 21,在n 次试验中,将i A 发生的次数i f 叫做i A 发生的频数,如果0H 为真,则由大数定律,在n 次试验中(n 足够大),i A (k i ,,, 21=)出现的实际频率nf i与理论频率)(i i A P p =(可由分布函数)(0x F 算出)不应相差很大.基于这种想法,皮尔逊构造了统计量∑=-=ki i i i np np f 122)(χ或∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 其中i p ˆ是由)(ˆ0x F 计算出来的理论频率,)(ˆ0x F 是)(0x F 中未知参数估计出后的分布函数,并证明了如下定理:定理1 若n 足够大,当0H 成立时,统计量2χ总是近似地服从自由度为1--r k 的2χ分布,其中r 是已知的分布函数)(0x F 中未知参数的个数.直观上看,2χ值表示实际观测结果与理论期望结果的相对差异的总和,当它的取值大于临界值时,应拒绝0H . 二、检验步骤如果)(0x F 为不带有未知参数的已知分布,皮尔逊2χ检验法的具体步骤如下: (1) 将总体X 的值域划分成k 个不交的区间i A (k i ,,, 21=),使得每个区间包含的理论频数满足5≥i np ,否则将区间适当调整; (2) 在0H 成立时,计算各理论频率即概率i p 的值:)()()(100--==i i i i y F y F A P p ,k i ,,, 21=.这里1-i y 与i y 为区间i A 的端点,即](1i i i y y A ,-=;(3) 数出i A 中含有样本值的个数,即i A 的频数i f ,并计算统计量∑=-=ki ii i np np f 122)(χ 的值2χ;(4) 由2χ分布,对于给定的显著性水平α,找出临界值)1(2-k αχ; (5) 判断:若)1(22->k αχχ,则拒绝0H ,否则可接受0H . 如果总体X 是离散型的,则假设0H 相当于假设总体X 的概率分布00}{i i p x X P H ==:, ,,21=i .如果总体X 是连续型的,则假设0H 相当于)()(00x f x f H =:,这里)(x f 为总体的概率密度.例1 至1984年底,南京市开办有奖储蓄以来,13期兑奖号码中诸数码的频数汇总如表8.1:表8.1试检验器械或操作方法是否有问题(50.0=α).解 设抽取的数码为X ,它可能的取值为0~9,如果检验器械或操作方法没有问题,则0~9出现是等可能的,即检验假设 1010=i p H :,9210,,,, =i ,这里}{i X P p i ==. 依题意知k =10,令}{i A i =,9210,,,, =i ,n =350,则理论频数35=i np .57.61935688)(922==-=∑=i i i i np np f χ给定显著性水平5.00=α,查2χ分布表,得临界值9.16)9()1(205.02==-χχαk .由于19.675>16.9,故拒绝0H ,即认为器械或操作方法有问题.如果)(0x F 为带有未知参数的已知分布,未知参数为r θθθ,,, 21,这时用这r 个未知参数的极大似然估计量r θθθˆˆˆ21,,, 来代替)(0x F 中的参数r θθθ,,, 21,得到分布函数)(ˆ0x F ,然后建立统计量∑=-=ki i i i p n p n f 122ˆ)ˆ(χ, 这里i p ˆ是由)(ˆ0x F 计算出来的理论频率,再用以上检验步骤进行检验,但此时检验统计量2χ近似服从)1(2--r k χ分布(这里k >r +1).例2 某高校对100名新生的身高(厘米)做了检查,把测得的100个数据按由大到小的顺序排列,相同的数合并得表8.2:表8.2试问,在显著性水平5.00=α下是否可以认为学生身高X 服从正态分布? 解 这里n =100,我们来检验假设222)(021)(σμσπ--=x ex f H :,+∞<<∞-x ,这里)(x f 为正态分布),(2σμN 的概率密度,设其分布函数为)(x F ,μ与0>σ为未知参数.先求μ与2σ的极大似然估计值μˆ,2ˆσ: 33.1661ˆ1==∑=n i i x n μ, 06.28)ˆ(1ˆ212=-=∑=μσn i i x n . 设服从正态分布)ˆ,ˆ(2σμN 的随机变量为Y ,分布函数为)(ˆy F .按照分组要求,每个小区间的理论频数i pn ˆ不应小于5,因此我们将数据分成了7个组,使得每组的实际频数不小于5,各计算结果如下表8.3所示.表8.3中第3列i pˆ的计算如下: )(ˆ)(ˆ}{ˆ11---=≤<=i i i i i y F y F y Y y P p ,7210,,,, =i , 例如,}06.2833.1665.164ˆˆ06.2833.1665.161{}5.1645.161{ˆ3-≤-<-=≤<=σμY P Y P p1837.0)911.0()345.0(=-Φ--Φ=.给定显著性水平5.00=α,查2χ分布表,得临界值488.9)4()127()1(205.0205.02==--=--χχχαr k .由于1.8843<9.488,故接受0H ,即认为学生身高服从正态分布.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
概率论与数理统计
主讲:四川大学
四川大学1
§8.2 正态总体均值的假设检验
四川大学3
第67讲正态总体均值的假设检验(3)
两个正态总体的情形
四川大学
四川大学4
四川大学
正态总体均值的假设检验
(一)单个正态总体均值的假设检验
(前两讲)
(二)两个正态总体均值的假设检验
四川大学四川大学5
四川大学
6
现在来讲两个正态总体均值的假设检验(二)两个正态总体均值的假设检验1. 两个正态总体的方差已知,关于均值的检验(Z 检验)
分两种情况:
2. 两个正态总体的方差未知,关于均值的检验(t 检验)四川大学
四川大学
四川大学
7
1. 两个正态总体的方差已知,关于均值的检验(Z 检验)设211
~(,)X N μσ222
~(,)Y N μσ其中
12,μμ未知
2212
,σσ已知
我们想知道两个正态总体的均值是否有显著差别?
或者一个均值是否显著大于另一个均值?建立假设:012:H μμ=112
:H μμ≠012:0H μμ-=112:0
H μμ-≠等价于:
四川大学
四川大学
21
2. 两个正态总体的方差未知,但相等,关于均值的检验(t 检验)设211
~(,)X N μσ222
~(,)
Y N μσ其中12,μμ也未知
2221
2
σσσ
==未知
我们想知道两个正态总体的均值是否有显著差别?或者一个均值是否显著大于另一个均值?建立假设:012
:H μμ=112:H μμ≠012:0H μμ-=112:0
H μμ-≠或:四川大学四川大学
例7 为了比较磷肥对玉米产量的影响,某作物试验区把18块条件相同的土地分成甲、乙两组,甲组土地施磷肥,乙组土地不施磷肥。
玉米收割后统计两组土地的亩产量(单位:10kg)甲组:55 64 62 63 59 62 61 56 59
乙组:51 60 55 54 55 52 61 50 52
设两组土地的玉米亩产量都服从方差相同的正态分布。
问在显著性水平α=0.1之下,施用磷肥是否有利于玉米产量的显著增加?四川大学
四川大学39
四川大学
40
为了比较磷肥对玉米产量的影响,某作物试验区把18块条件相同的土地分成甲、乙两组,甲组土地施磷肥,乙组土地不施磷肥。
玉米收割后统计两组土地的亩产量(单位:10kg)
甲组:55 64 62 63 59 62 61 56 59乙组:51 60 55 54 55 52 61 50 52
设两组土地的玉米亩产量都服从方差相同的正态分布。
问在显著性水平α=0.1之下,施用磷肥是否有利于玉米产量的显著增加?
解用X , Y 分别表示甲, 乙两组土地的玉米亩产量,则2
1~(,)X N μσ2
2~(,)
Y N μσ其中
2
12
,,μμσ均未知。
四川大学
四川大学
43
甲组:55 64 62 63 59 62 61 56 59乙组:51 60 55 54 55 52 61 50 52
四川大学
44
甲组:55 64 62 63 59 62 61 56 59乙组:51 60 55 54 55 52 61 50 52。