19 第七章2-单正态总体的假设检验
正态总体方差的假设检验
方差的计算方法
简单方差
适用于数据量较小,且数据间相互独立的情况。
加权方差
适用于数据量较大,且数据间存在相关关系的 情况,需要考虑到每个数据点的重要程度。
配对样本方差检验
总结词
配对样本方差检验用于比较两个相关样本的方差是否相同。
详细描述
在配对样本方差检验中,我们首先需要设定一个零假设,即两个相关样本的方差无显著差异。然后, 通过计算检验统计量(如Wilcoxon秩和统计量或Stevens' Z统计量),我们可以评估零假设是否被拒 绝。如果零假设被拒绝,则可以得出两个相关样本方差不相同的结论。
方差齐性检验的目的是为了后续 的方差分析提供前提条件,确保 各组数据具有可比性。
方差分析
方差分析(ANOVA)是
1
用来比较多个正态总体均
值的差异是否显著的统计
方法。
4
方差分析的结果通常以p值 表示,若p值小于显著性水 平(如0.05),则认为各组 均值存在显著差异。
2
方差分析的前提条件是各
组数据具有方差齐性和正
正态总体方差假设检验的未来发展
改进假设检验方法
结合其他统计方法
结合其他统计方法,如贝叶斯推断、机器学习等, 可以更全面地分析数据和推断总体特征。
针对正态总体方差假设检验的局限性,未来 研究可以探索更灵活、适应性更强的检验方 法。
拓展应用领域
正态总体方差假设检验的应用领域可以进一 步拓展,特别是在大数据和复杂数据分析方 面。
数学表达式
正态总体的假设检验
n
(Xi μ)2
P { i1
σ
2 0
χ
2 1
α 2
(
n)}
P{
i 1
σ
2 0
χ
2
α
(
n)}
α
2
所以拒绝域为: W
{
χ2
χ
2 1
α 2
(
n)
,χ
2
χ
2
α
(n)
}
2
2. μ未知时,总体方差σ2的假设检验 χ2 检验法
类型 原假设 备择假设
H0
H1
检验统计量
双边 检验
σ2
σ
2 0
σ2
得s=0.007欧姆.设总体服从正态分布,参数均未知,
问在显著性水平α=0.05下,能否认为这批导线的
标准差显著地偏大?
解: s2 0.0072 0.0052
原假设 H 0 : σ 2 0.0052,备择假设 H1 : σ 2 0.0052
检验统计量: χ 2 (n 1)S 2
σ2
拒绝域:
第二节 正态总体的假设检验
一、单一正态总体均值μ的假设检验
二、单一正态总体方差σ2的假设检验 三、两个正态总体均值的假设检验 四、两个正态总体方差的假设检验
一、单一正态总体均值μ的假设检验
设总体X~N (, 2). X1 , X2 , … , Xn是取自X的样本,
样本均值 X样,本方差S2
1.已知
T t(α n 1)
例1. 设某次考试的考生的成绩服从正态分布,从中随
机地抽取36位考生的成绩,算得平均成绩为66.5分,标 准差为15分,问在显著性水平0.05下,是否可以认为在 这次考试中全体考生的平均成绩为70分?
单个正态总体的假设检验
计算统计量 Z 的观察值
z0
x 0
n
.
(8.3)
如果:( a ) | z0 |> zα/2,则在显著性水平 α 下,拒绝原假设 H0
(接受备择假设H1),所以| z 0|> zα/2 便是 H0 的拒绝域。
( b ) | z0 | z /2 ,则在显著性水平 α 下,接受原假设 H0,认
=0.05 下 否 定 H0 , 即 不 能 认 为 这 批 产 品 的 平 均 抗 断 强 度 是
32.50kg·cm-2。
把上面的检验过程加以概括,得到了关于方差已知的正态总体期
望值 μ 的检验步骤:
( a )提出待检验的假设 H0 :μ = μ0; H1:μ ≠ μ0。
( b )构造统计量 Z ,并计算其观察值 z0 :
1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?
这里假设测量值 X 服从 X ~ N ( μ , σ2) 分布。
解
①问题是要检验
提出假设 H0 :μ = μ0=1227; H1:μ ≠ μ0。
由于
σ2
未知( 即仪器的精度不知道 ),我们选取统计量 T
当 H0 为真时,T ~ t ( n -1) ,T 的观察值为
X
X 0
N ( , ) ,
n
Z
n
X 0
n
N (0,1) ,
(8.2)
作为此假设检验的统计量,显然当假设 H0 为真(即μ = μ0正确)
时, Z ~ N ( 0 , 1),所以对于给定的显著性水平 α ,可求出 zα/2,
使
P{| Z | z 2 } .
见图8-3,即
假设检验
本的取值,按一定原则进行检验,然后作出接受或拒绝所作假设
的决定. 参数假设检验:对总体分布中参数做假设。 分类: 分布假设检验:对总体分布做假设。
假设检验的过程
提出假设
我认为人口的平 均年龄是50岁
作出决策 拒绝假设
别无选择!
总体
抽取随机样本
均值 x = 20
一、引例
X 68 可以确定一个常数c 使得 P c 3.6 / 6
取 0.05,则
c z z0.025 1.96
2
X 68 1.96 由 3 .6 6
X 69.18或 X 66.824
即区间( ,66.824 )与( 69.18 , + )为检验的拒绝域
2 设 X 1 , , X n是取自正态总体 N , 的一个样本, 其中 , 2 都是未知参数。
具体步骤:
(1)先考虑假设检验问题
H 0 : 0
H1 : 0
(2)选择检验统计量,在此处,由于, 2 未知,所以用总
1 n ( X i X ) 2 来代替,则采用 体方差 2 的无偏估计 S n 1 i 1
这是小概率事件 ,一般在一次试验中是不会发生的, 现一 次试验竟然发生, 故认为原假设不成立, 即该批产品次品 率 p 0.04 , 则该批产品不能出厂.
1 P (1) C12 p1 (1 p)11 0.306 0.3 12
这不是小概率事件,没理由拒绝原假设,而接受原假设, 即该批产品可以出厂. 注1 直接算 1 / 12 0.083 0.04
0.01 0.05,0.1 ,
第七章假设检验
引言
结论:企图肯定什么事情很难, 结论:企图肯定什么事情很难,而否定就容 易得多。 还记得上次那个例子吗? 易得多。 (还记得上次那个例子吗?两个人 住一起,其中有一个人病了, 住一起,其中有一个人病了,另一个人天天 给他熬药还端到他床前,三个月过去了, 给他熬药还端到他床前,三个月过去了,突 然有一天那个人忙得很, 然有一天那个人忙得很,把药熬好了就对卧 病在床的人说,你自己去喝吧, 病在床的人说,你自己去喝吧,卧病的人心 里想: 这个人怎么这么坏呢? 里想:“这个人怎么这么坏呢?”,他倒忘 了这个人对他的好, 了这个人对他的好,记住一个人的好总比记 住一个人的坏好,有时候想想, 住一个人的坏好,有时候想想,老师就像端 药的人,学生就是喝药的人,良药苦口, 药的人,学生就是喝药的人,良药苦口,我 也许一直是你们背后说你们的那个烂人, 也许一直是你们背后说你们的那个烂人,老 师也是弱势群体啊!!) 师也是弱势群体啊!!)
α
H 0 : µ ≤ 2% ↔ H 1 : µ > 2%
5-10
二、两种类型的错误
两类错误发生的概率 α与β之间是此消彼长的关系 接受
H0
拒绝
H0
H0
真实
判断正确 (1-α) ) 取伪错误( 取伪错误(第二类 错误或β 错误或 错误)
弃真错误( 弃真错误(第一 类错误或α 类错误或 错误 ) 判断正确 (1-β) )
第七章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 卡方检验
参数估计是利用样本信息推断未知的总体参数, 参数估计是利用样本信息推断未知的总体参数, 而假设检验是先对总体参数提出一个假设, 而假设检验是先对总体参数提出一个假设,然后利 用样本信息判断这一假设是否成立。 用样本信息判断这一假设是否成立。
7-2 正态总体均值与方差的假设检验
要检验假设 H 0 : 10.5, H1 : 10.5,
n 15,
x 10.48,
2
0.05,
x 0 10.48 10.5 0.516, 则 / n 0.15 / 15
查表得 u0.05 1.645,
H1 : 0 10
x 9.2
s 1.6
x 0 9.2 10 于是 T 3.54 2.01 t0.025 49 s n 1.6 50
故在 0.05 的水平下,丰产林的树高与10米的差异 有统计意义。(拒绝原假设)
例7 某车间生产某种化学纤维的强度服从正态分布,且原来
单边检验
2
得H0 的拒绝域为:
2 n 1 S 2 0
12 n
或
2 n 1 S 2 0
2 n
作业
• 习题七:3,5,9,12.
• 复习第七章(可做习题七之1~13题) • 复习5~7章,准备课堂测验
例5 P160 8 从某批矿砂中,抽取容量为 5 的一个样本,测得其 含镍量为(单位:%) 3.25 3.27 3.24 3.26 3.24 设测量值服从正态分布,问在 这批矿砂的含镍量为 3.25 ?
例1 某切割机在正常工作时, 切割每段金属棒的平 均长度为10.5cm, 标准差是0.15cm, 今从一批产品中 随机的抽取15段进行测量, 其结果如下(单位:cm) 10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7 假定切割的长度X服从正态分布, 且标准差没有 变化, 试问该机工作是否正常? ( 0.1) 解
第七章 假设检验
参数估计
7-3
假设检验
经济、管理类 基础课程
统计学
学习目标
1. 了解假设检验的基本思想 2. 掌握假设检验的步骤 3. 能对实际问题作假设检验 4. 利用P - 值进行假设检验
7-4
经济、管理类 基础课程
统计学
一. 二. 三. 四. 五.
第一节 假设检验的一般问题
假设检验的概念 假设检验的步骤 假设检验中的小概率原理 假设检验中的两类错误 双侧检验和单侧检验
7 - 20
经济、管理类 基础课程
统计学
假设检验中的两类错误
(决策风险)
7 - 21
经济、管理类 基础课程
统计学
假设检验中的两类错误
1. 第一类错误(弃真错误)
原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 原假设为假时接受原假设 第二类错误的概率为(Beta)
拒绝域 /2
接受域 H0值 样本统计量
临界值
7 - 32
临界值
经济、管理类 基础课程
双侧检验
(显著性水平与拒绝域 )
置信水平 拒绝域 1- /2 接受域
统计学
抽样分布
拒绝域
/2
临界值
7 - 33
H0值
临界值
样本统计量
经济、管理类 基础课程
双侧检验
(显著性水平与拒绝域 )
置信水平 拒绝域 1- 接受域 H0值 样本统计量 /2
7 - 37
属于研究中的假设 建立的原假设与备择假设应为 H0: 2% H1: 2%
经济、管理类 基础课程
单侧检验
(原假设与备择假设的确定)
第七章 假设检验
4、不原意相信“牢外面的人一定是好人”
未发现犯罪不意味着就是好人
注:有证据可以放心定性坏人,断定好人要慎重
4 December 2010
宁波工程学院
理学院
第七章 假设检验
第15页 15页
三、选择显著性水平
假设检验中关键的小概率事件发生的概率α 称为该检验的显著性水平,简称水平。 注:按照小概率事件原理进行统计推断自然 可能犯错误。错误拒绝原假设 H 0 的概率为 α 。正确拒绝原假设 H 0 的可信度为1-α
宁波工程学院
理学院
第七章 假设检验
第7页
问题分析(续)
(5) 对于随机试验中参数的假设检验问题称为 参数假设检验问题 否则称为非参数假设检验问题。例如:后 面的聪明检验。 (6) 由样本去推断总体,判断差异是由总体 由样本去推断总体,判断差异是 变异引起,还是由于随机误差引起。这就 变异引起,还是由于随机误差引起。这就 是假设检验要解决的问题 (7) 参数估计和假设检验是二种不同的统计推断
4 December 2010
宁波工程学院
理学院
第七章 假设检验
第23页 23页
显著性水平a 和拒绝域(左侧检验 )
H0成立时的抽样分布 拒绝H0 置信水平
α
1-α
0
临界值
4 December 2010
观察到的样本统计量
宁波工程学院 理学院
第七章 假设检验
第24页 24页
显著性水平a和拒绝域(右侧检验 )
4 December 2010
宁波工程学院
理学院
第七章 假设检验
第8页
通俗的例子(1)
实例:箱子中有黑球和白球,总数100个,但 不知黑球白球各多少个。现提出假设H0:“箱 子中有99个白球或白球占绝大部分”,暂时设 H0正确,那么从箱子中任取一球,得黑球的概 率为0.01或很小,是一小概率事件。 检验:今取一球,居然取到黑球,自然会使人 对H0的正确性产生怀疑,从而否定H0。也就是 说箱中不止1个黑球。 问题:如果取到的是白球,说明什么?
第7章 假设检验
(x)
n
0.01,u 2.33,
1
由样本值算得 U 2.51,
O
u
x
U 2.51 2.33 , 否定 H0 ,
即可以认为新生产织物比过去的织物强力有明显提高.
二、 2未知时关于 的假设检验
0
H 0下
N (0, 1) ,
n
(3) 对给定的显著性水平,查表得 u / 2;
(4) 由样本值算得 u 的值;
U 检验法
如果 | u | u 2 ,则拒绝H0 ;否则, 不能拒绝H0 . 20
例 已知滚珠直径服从正态分布,现随机地从一批滚珠中抽
取6个,测得其直径为14.70,15.21,14.90,14.91,15.32, 15.32(mm)。假设滚珠直径总体分布的方差为0.05,问
23
单侧检验 右侧检验
(x)
(1) H0 : 0 , H1 : 0
(2) 检验统计量 U X 0
1
n
O
u
x
(3) 对给定的显著性水平 ,查表得 u ;
(4) 由样本值算得 U 的值;
如果 U u ,则拒绝H0 ;否则, 不能拒绝H0 .
类似可得,若要检验假设 H0 : 0 ,
24
要同时降低两类错误的概率 , ,或者要在 不变的条件下降低 ,需要增加样本容量.
假设检验的另一个关键的问题是如何根据问题 的需要来合理地提出原假设和备择假设.由以上的讨 论知,在显著性检验问题中,若没有非常充足的理由, 原假设是不能轻易拒绝的,因此原假设是受到保护的 假设. 一般地我们总是将被拒绝时导致的后果更严 重的假设作为原假设.
11
罐装可乐的容量按标准应在350毫升和360毫升之
7-2正态总体参数的检验
一、单个正态总体均值的检验 二、两个正态总体均值差的检验 三、正态总体方差的检验
同上节) 标准要求长度是32.5毫米 毫米. 例2(同上节 某工厂生产的一种螺钉 标准要求长度是 同上节 某工厂生产的一种螺钉,标准要求长度是 毫米
实际生产的产品,其长度 假定服从正态分布N( σ 未知, 实际生产的产品,其长度X 假定服从正态分布 µ,σ2 ) ,σ2 未知, 现从该厂生产的一批产品中抽取6件 得尺寸数据如下: 现从该厂生产的一批产品中抽取 件, 得尺寸数据如下
(1)与(4); (2)与(5)的拒绝域形式相同 与 的拒绝域形式相同. 与 的拒绝域形式相同
一、单个正态总体均值的检验
是来自N( σ 的样本 的样本, 设x1,…,xn是来自 µ,σ2)的样本 关于µ的三种检验问题是 (µ0是个已知数 是个已知数)
(1) H0 : µ ≤ µ0 vs H1 : µ > µ0 (2) H0 : µ ≥ µ0 vs H1 : µ < µ0 (3) H0 : µ = µ0 vs H1 : µ ≠ µ0
对于检验问题 对于检验问题
(2) H0 : µ ≥ µ0 vs H1 : µ < µ0
x − µ0
仍选用u统计量 u = 选用 统计量 相应的拒绝域的形式为: 相应的拒绝域的形式为
取显著性水平为α 取显著性水平为α,使c满足 P 0 (u ≤ c) = α 满足 µ
由于μ = μ 0时,u ~ N(0,1),故 c = uα,如图 故 , 因此拒绝域为: 因此拒绝域为 或等价地: 或等价地 φ(x)
检 H0 : µ = µ0 vs H1 : µ ≠ µ0 验
x − µ0 s/ n
接受域为: 接受域为
正态总体方差的假设检验
解 依题意需检验假设
由于 未知,故检验统计量
H0
: 2
2 0
82
,H1 : 2
82
.
2 (n 1)S 2 ~ 2 (n 1) .
2 0
已知 n 8, s2 93.268 ,代入公式得
2
(8 1) 93.268 82
10.201 2
.
ห้องสมุดไป่ตู้
又显著性水平 0.05 ,查表得
2 1
/2
(n
1)
概率论与数理统计
假设检验
正态总体方差的假设检验
1.1 单个正态总体方差的检验
设总体 X ~ N( , 2 ) , , 2 均未知,X 1 ,X2 , ,Xn 为来自总体 X 的样本,现检验假设
H0
: 2
2 0
,H1
: 2
2 0
,
其中
2 0
为已知常数.
由于 S 2
是 2 的无偏估计,当 H0
为真时,比值 s2
解 依题意需检验假设
H0
:12
2 2
,H1 :12
2 2
.
由于 1 ,2 未知,故检验统计量
F
S12 S22
~
F (m 1,n 1) .
经计算得 s12 0.885 7 ,s22 0.828 6 ,故检验统计量的观测值为
F
s12 s22
0.885 7 0.828 6
1.07 .
假设检验
又 m 1 7,n 1 7 , 0.05 ,查表得
2 1
/
2
(n
1)]
[ 2
2/2 (n 1)]} ,
则 H0 的拒绝域为
正态总体的均值和方差的假设检验课件PPT
(4)统 计 量 观 察 值 : u(xy)/ 1 22 21301252.5
n 1 n 2 6080 30 40
( 5 ) |u | 2 .5 1 .9 6 , 拒 绝 原 假 设 H 0 .
0.42, 0.08, 0.12, 0.30 , 0.27
处理后: 0.15, 0.13, 0.00, 0.07, 0.24,
0.19, 0.04, 0.08, 0.20, 0.12 假定处理前后含脂率都服从正态分布,且相互独立, 方差相等.问处理前后含脂率的均值有无显著差异
( = 0.05)?
解 以X表示物品在处理前的含脂率,Y表示物品在 处理后的含脂率,且 X ~ N ( μ 1 ,σ 1 2 )Y , ~ N ( μ 2 ,σ 2 2 )
1 假 H 0 : μ μ 0 设 , H 1 : μ μ 0 ; 2° 取检验统计量
T X0 ~t(n1);
Sn / n
(当H0为真)时
3° 给定显著水平 ( 0< < 1)
P |T | t /2 ( n 1 ) ,查表 t /2 ( n 1 可 ).
拒绝域: W1 = { (x1,x2,∙∙∙,xn)| |t | t /2 (n-1)};
(4) 由样本值计算U的观测值为
ux800977080032.25;
40
40
(5)判断:由 |u|2.251.9,6故拒绝原假设H0,即
不能认为这批钢索的断裂强度为 800 Mpa .
2. σ2为未知 μ的 ,检 关 t检 验 于 验 (法)
设 X 1 ,X 2 ,,X n 是来自 N (μ ,正 σ 2)的 态 一 总 其μ 中 ,σ2未知,检 α, 验检 水 μ的 验 平 步为 骤
第七章 假设检验
5.9
7.5
方差分析:单因素方差分析
SUMMARY 组
职员家庭 工人家庭 农民家庭
计数 4 4 4
求和 32
25.6 24.8
平均
方差
8 1.766667
6.4
0.94
6.2
1
方差分析
差异源
SS
组间
7.786667
组内
11.12
总计
18.90667
df
MS
F
P-value F crit
2 3.893333 3.151079 0.091771 4.256492
Z x1 x2
S12
S
2 2
n1 n2
H0、H1 (1) H0:μ1 = μ2
H1:μ1 ≠ μ2 (2) H0:μ1 = μ2
H1:μ1 > μ2
(3) H0:μ1 = μ2 H1:μ1 < μ2
拒绝域
2
2
Z 0 Z z
2
2
z 0 Z
z Z 0
条件 检验条件量
np≥5 nq≥5
Z p1 p2 pq pq n1 n2
p
n1
p1
n2
p2
n1 n2
(1) H0:P1=P2 H1:P1 ≠P2
(2) H0: P1 ≤P2 H1:P1 > P2
(3) H0:P1 ≥P2 H1:P1 <P2
拒绝域
2
2
Z 0 Z z
2
2
z 0 Z
2 1 (n1)
条件 检验条件量
第二节单正态总体的假设检验
P{|T |k }
查 t 分布表得 kt / 2t0.025(8) 2.306,从而拒绝域
为 | t | 2.306. (4) 因为 x 49.9, s2 0.29, 所以
| t | x 50 0.56 2.036,| t | 0.56 2.036, s/ n
故应接受 H0 , 即以为包装机工作正常.
由此即得拒绝域为
u
x
0
/n
u / 2 ,
即
W (,u / 2 ) (u / 2 ,).
根据一次抽样后得到旳样本观察值 x1, x2 ,, xn 计 算出 U旳观察值 u, 若 u u / 2 , 则拒绝原假设 H0 ,
即以为总体均值与0 有明显差别;
若 u u / 2 , 则接受原假设 H0 , 即以为总体均值与
S/ n 故选用 T 作为检验统计量,记其观察值 t. 因为 X
是 旳无偏估计量,S 2是 2 旳无偏估计量, 当 H0
成立时,t 不应太大,当 H1 成立时,t 有偏大旳趋
势, 故拒绝域形式为
t x 0 k
s/ n
( k 待定).
对于给定旳明显性水平 , 查分布表得
k t / 2(n 1), 使 P{T t / 2(n 1)} ,
使
P{ 2
2 1
/
2
(
n
1)
或
2
2
/
2
(
n
1)}
,
由此即得拒绝域为
2
n1
2 0
s
2
2 1
/
2
(
n
1)
或
2
n1
2 0
s
2
2 1
概率论与数理统计(理工类第四版)吴赣昌主编课后习题答案第七章
写在前面:由于答案是一个个复制到word中,比较耗时耗力,故下载收取5分,希望需要的朋友给予理解和支持!PS:网上有一些没经我同意就将我的答案整合、转换成pdf,放在文库里的,虽然是免费的,但是窃取了我的劳动成果,希望有心的朋友支持我一下,下载我的原版答案。
第七章假设检验7.1 假设检验的基本概念习题1样本容量n确定后,在一个假设检验中,给定显著水平为α,设此第二类错误的概率为β,则必有(). (A)α+β=1;(B)α+β>1;(C)α+β<1;(D)α+β<2.解答:应选(D).当样本容量n确定后,α,β不能同时都很小,即α变小时,β变大;而β变小时,α变大.理论上,自然希望犯这两类错误的概率都很小,但α,β的大小关系不能确定,并且这两类错误不能同时发生,即α=1且β=1不会发生,故选(D).习题2设总体X∼N(μ,σ2),其中σ2已知,若要检验μ,需用统计量U=X¯-μ0σ/n.(1)若对单边检验,统计假设为H0:μ=μ0(μ0已知),H1:μ>μ0,则拒绝区间为;(2)若单边假设为H0:μ=μ0,H1:μ<μ0,则拒绝区间为(给定显著性水平为α,样本均值为X¯,样本容量为n,且可记u1-α为标准正态分布的(1-α)分位数).解答:应填(1)U>u1-α;(2)U<uα.由单侧检验及拒绝的概念即可得到.习题3如何理解假设检验所作出的“拒绝原假设H0”和“接受原假设H0”的判断?解答:拒绝H0是有说服力的,接受H0是没有充分说服力的. 因为假设检验的方法是概率性质的反证法,作为反证法就是必然要“推出矛盾”,才能得出“拒绝H0”的结论,这是有说服力的,如果“推不出矛盾”,这时只能说“目前还找不到拒绝H0的充分理由”,因此“不拒绝H0”或“接受H0”,这并没有肯定H0一定成立. 由于样本观察值是随机的,因此拒绝H0,不意味着H0是假的,接受H0也不意味着H0是真的,都存在着错误决策的可能.当原假设H0为真,而作出了拒绝H0的判断,这类决策错误称为第一类错误,又叫弃真错误,显然犯这类错误的概率为前述的小概率α:α=P(拒绝H0|H0为真);而原假设H0不真,却作出接受H0的判断,称这类错误为第二类错误,又称取伪错误,它发生的概率β为β=P(接受H0|H0不真).习题4犯第一类错误的概率α与犯第二类错误的概率β之间有何关系?解答:一般来说,当样本容量固定时,若减少犯一类错误的概率,则犯另一类错误的概率往往会增大.要它们同时减少,只有增加样本容量n.在实际问题中,总是控制犯第一类错误的概率α而使犯第二类错误的概率尽可能小.α的大小视具体实际问题而定,通常取α=0.05,0.005等值.习题5在假设检验中,如何理解指定的显著水平α?解答:我们希望所作的检验犯两类错误的概率尽可能都小,但实际上这是不可能的. 当样本容量n固定时,一般地,减少犯其中一个错误的概率就会增加犯另一个错误的概率. 因此,通常的作法是只要求犯第一类错误的概率不大于指定的显著水平α,因而根据小概率原理,最终结论为拒绝H0较为可靠,而最终判断力接受H0则不大可靠,其原因是不知道犯第二类错误的概率β究竟有多少,且α小,β就大,所以通常用“H0相容”,“不拒绝H0”等词语来代替“接受H0”,而“不拒绝H0”还包含有再进一步作抽样检验的意思.习题6在假设检验中,如何确定原假设H0和备择假设H1?解答:在实际中,通常把那些需要着重考虑的假设视为原假设H0,而与之对应的假设视为备择假设H1.(1)如果问题是要决定新方案是否比原方案好,往往将原方案取假设,而将新方案取为备择假设;(2)若提出一个假设,检验的目的仅仅是为了判断这个假设是否成立,这时直接取此假设为原假设H0即可.习题7假设检验的基本步骤有哪些?解答:根据反证法的思想和小概率原理,可将假设检验的步骤归纳如下:(1)根据问题的要求,提出原理假设H0和备择假设H1.(2)根据检验对象,构造检验统计量T(X1,X2,⋯,Xn),使当H0为真时,T有确定的分布.(3)由给定的显著水平α,查统计量T所服从的分布表,定出临界值λ,使P(∣T∣>λ)=α,或P(T>λ1)=P(T<λ2)=α/2,从而求出H0的拒绝域:∣T∣>λ或T>λ1,T<λ2.(4)由样本观察值计算统计量T的观察值t.(5)作出判断,将t的值与临界值比较大小作出结论:当t∈拒绝域量时,则拒绝H0,否则,不拒绝H0,即认为在显著水平α下,H0与实际情况差异不显著.习题8假设检验与区间估计有何异同?解答:假设检验与区间估计的提法虽不同,但解决问题的途径是相通的. 参数θ的置信水平为1-α的置信区间对应于双边假设检验在显著性水平α下的接受域;参数θ的置信水平为1-α的单侧置信区对应于单边假设检验在显著性水平α下的接受域.在总体的分布已知的条件下,假设检验与区间估计是从不同的角度回答同一个问题. 假设检验是判别原假设H0是否成立,而区间估计解决的是“多少”(或范围),前者是定性的,后者是定量的.习题9某天开工时,需检验自动包装工作是否正常. 根据以往的经验,其装包的质量在正常情况下服从正态分布N(100,1.52)(单位:kg).现抽测了9包,其质量为:99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.0,100.5.问这天包装机工作是否正常?将这一问题化为假设检验问题. 写出假设检验的步骤(α=0.05).解答:(1)提出假设检验问题H0:μ=100,H1:μ≠100;(2)选取检验统计量U:U=X¯-1001.59,H0成立时, U∼N(0,1);(3)α=0.05,uα/2=1.96,拒绝域W={∣u∣>1.96};(4)x¯≈99.97,∣u∣=0.06.因∣u∣<uα/2=1.96,故接受H0,认为包装机工作正常.习题10设总体X∼N(μ,1),X1,X2,⋯,Xn是取自X的样本. 对于假设检验H0:μ=0,H1:μ≠0,取显著水平α,拒绝域为W={∣u∣>uα/2},其中u=nX¯,求:(1)当H0成立时, 犯第一类错误的概率α0;(2)当H0不成立时(若μ≠0),犯第二类错误的概率β.解答:(1)X∼N(μ,1),X¯∼N(μ,1/n),故nX¯=u∼N(0,1).α0=P{∣u∣>uα/2∣μ=0}=1-P{-uα/2≤u≤uα/2}=1-[Φ(uα/2)-Φ(-uα/2)]=1-[(1-α2)-α2]=α,即犯第一类错误的概率是显著水平α.(2)当H0不成立,即μ≠0时,犯第二类错误的概率为β=P{∣u∣≤uα/2∣E(X)=μ}=P{-uα/2≤u≤uα/2∣E(X)=μ}=P{-uα/2≤nX¯≤uα/2∣E(X)=μ}=P{-uα/2-nμ≤n(X¯-μ)≤uα/2-nμ∣E(X)=μ}=Φ(uα/2-nμ)-Φ(-uα/2-nμ).注1当μ→+∞或μ→-∞时,β→0.由此可见,当实际均值μ偏离原假设较大时,犯第二类错误的概率很小,检验效果较好.注2当μ≠0但接近于0时,β≈1-α.因α很小,故犯第二类错误的概率很大,检验效果较差.7.2 单正态总体的假设检验习题1已知某炼铁厂铁水含碳量服从正态分布N(4.55,0.1082).现在测定了9炉铁水,其平均含碳量为4.484.如果估计方差没有变化,可否认为现在生产的铁水平均含碳量仍为4.55(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=4.55,H1:μ≠4.55.由于σ2=0.1082已知,所以可选取统计量U=X¯-4.550.108/9,在H0成立的条件下,U∼N(0,1),且此检验问题的拒绝域为∣U∣=∣X¯-4.550.108/9∣>uα/2,这里u=4.484-4.550.108/9≈-1.833,uα/2=1.96.显然∣u∣=1.833<1.96=uα/2.说明U没有落在拒绝域中,从而接受H0,即认为现在生产之铁水平均含碳量仍为4.55.习题2要求一种元件平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时. 已知该种元件寿命服从标准差为σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合格?设总体均值为μ,μ未知,即需检验假设H0:μ≥1000,H1:μ<1000.解答:检验假设H0:μ≥1000,H1:μ<1000.这是单边假设检验问题. 由于方差σ2=0.05,故用u检验法. 对于显著性水平α=0.05,拒绝域为W={X¯-1000σ/n<-uα.查标准正态分布表,得u0.05=1.645.又知n=25,x¯=950,故可计算出x¯-1000σ/n=950-1000100/25=-2.5.因为-2.5<-1.645,故在α=0.05下拒绝H0,认为这批元件不合格.习题3打包机装糖入包,每包标准重为100kg.每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg).某日开工后,测得9包糖重如下(单位:kg):99.398.7100.5101.298.399.799.5102.1100.5打包机装糖的包得服从正态分布,问该天打包机工作是否正常(α=0.05)?解答:本问题是在α=0.05下检验假设H0:μ=100,H1:μ≠100.由于σ2未知,所以可选取统计量T=X¯-100S/n,在H0成立的条件下,T∼t(n-1),且此检验问题的拒绝域为∣T∣=∣X¯-100S/n∣>tα/2(n-1),这里t=x¯-100s/n≈99.978-1001.2122/9≈-0.0544,t0.025(8)=2.306.显然∣t∣=0.0544<2.306=t0.025(8),即t未落在拒绝域中,从而接受H0,即可以认为该天打包工作正常.习题4机器包装食盐,假设每袋盐的净重服从正态分布,规定每袋标准含量为500g,标准差不得超过10g.某天开工后,随机抽取9袋,测得净重如下(单位:g):497,507,510,475,515,484,488,524,491,试在显著性水平α=0.05下检验假设:H0:μ=500,H1:μ≠500.解答:x¯=499,s≈16.031,n=9,t=(x¯-μ0)sn=499-50016.0319=-0.1871,α=0.05,t0.025(8)=2.306.因∣t∣<t0.025(8),故接受H0,认为该天每袋平均质量可视为500g.习题5从清凉饮料自动售货机,随机抽样36杯,其平均含量为219(mL),标准差为14.2mL,在α=0.05的显著性水平下,试检验假设:H0:μ=μ0=222,H1:μ<μ0=222.解答:设总体X∼N(μ,σ2),X代表自动售货机售出的清凉饮料含量,检验假设H0:μ=μ0=222(mL),H1:μ<222(mL).由α=0.05,n=36,查表得t0.05(36-1)=1.6896,拒绝域为W={t=x¯-μ0s/n<-tα(n-1).计算t值并判断:t=219-22214.2/36≈-1.27>-1.6896,习题6某种导线的电阻服从正态分布N(μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s=0.008Ω,对于α=0.05,能否认为这批导线电阻的标准差仍为0.005?解答:本问题是在α=0.05下检验假设H0:σ2=0.0052,H1:σ2≠0.0052.选取统计量χ2=n-1σ2S2,在H0成立的条件下,χ2∼χ2(n-1),且此检验问题的拒绝域为χ2>χα/22(n-1)或χ2<χ1-α/22(n-1).这里χ2=9-10.0052s2=80.0052×0.0082=20.48,χ0.9752(8)=2.18,χ0.0252(8)=17.5.显然χ2落在拒绝域中,从而拒绝H0,即不能认为这批导线电阻的标准差仍为0.005.习题7某厂生产的铜丝,要求其折断力的方差不超过16N2.今从某日生产的铜丝中随机抽取容量为9的样本,测得其折断力如下(单位:N):289,286,285,286,285,284,285,286,298,292设总体服从正态分布,问该日生产的铜线的折断力的方差是否符合标准(α=0.05)?解答:检验问题为H0:σ2≤16,H1:σ2>16,n=9,s2≈20.3611,χ2=8×s216≈10.181,α=0.05,χ0.052(8)=15.507.因χ2<χ0.052(8)=15.507,故接受H0,可认为铜丝的折断力的方差不超过16N2.习题8过去经验显示,高三学生完成标准考试的时间为一正态变量,其标准差为6min.若随机样本为20位学生,其标准差为s=4.51,试在显著性水平α=0.05下,检验假设:H0:σ≥6,H1:σ<6.解答:H0:σ≥6,H1:σ<6.α=0.05,n-1=19,s=4.51,χ0.952(19)=10.117.拒绝域为W={χ2<10.117}.计算χ2值χ2=(20-1)×4.51262≈10.74.因为10.74>10.117,故接受H0,认为σ≥6.习题9测定某种溶液中的水分,它的10个测定值给出s=0.037%,设测定值总体服从正态分布,σ2为总体方差,σ2未知,试在α=0.05水平下检验假设:H0:σ≥0.04%,H1:σ<0.04%.解答:在α=0.05下,拒绝域为W={(n-1)S2σ02<χ1-α2(9).查χ2分布表得χ0.952(9)=3.325.计算得(n-1)s2σ02=(10-1)×(0.037\per)2(0.04\per)2≈7.7006>3.325,未落入拒绝域,故接受H0.sw=(5-1)×(1.971)2+(4-1)×(1.167)25+4-2≈1.674.查表得t0.005(7)=1.895.算得t=2.86-2.075-01.67415+14≈0.699<1.895.因为0.699<1.895,故不拒绝H0,认为此药无效.习题3据现在的推测,矮个子的人比高个子的人寿命要长一些.下面给出美国31个自然死亡的总统的寿命,将他们分为矮个子与高个子2类,列表如下:矮个子总统8579679080高个子总统6853637088746466606078716790737177725778675663648365假设2个寿命总体均服从正态分布且方差相等,试问这些数据是否符合上述推陈出推测(α=0.05)?解答:设μ1,μ2分别为矮个子与高个子总统的平均寿命,则检验问题为H0:μ1≤μ2,H1:μ1>μ2,n1=5,x¯=80.2,s1≈8.585,n2=26,y¯≈69.15,s2≈9.315,sw=4×8.5852+9.315229≈9.218,n1n2n1+n2≈2.048,t=(80.2-69.15)9.218×2.048≈2.455,α=0.05,t0.05(29)=1.6991,因t>t0.05(29)=1.6991,故拒绝H0,认为矮个子总统的寿命比高个子总统寿命长.习题4在20世纪70年代后期人们发现,酿造啤酒时,在麦芽干燥过程中形成致癌物质亚硝基二甲胺(NDMA).到了20世纪80年代初期,人们开发了一种新的麦芽干燥过程,下面给出了分别在新、老两种过程中形成的NDMA含量(以10亿份中的份数计):故拒绝H0,认为新、老过程中形成的NDMA平均含量差大于2.习题5有两台车床生产同一种型号的滚珠. 根据过去的经验,可以认为这两台车床生产的滚珠的直径都服从正态分布. 现要比较两台车床所生产滚珠的直径的方差,分别抽出8个和9个样品,测得滚珠的直径如下(单位:mm).甲车床xi:15.014.515.215.514.815.115.214.8乙车床yi:15.215.014.815.215.015.014.815.114.8问乙车床产品的方差是否比甲车床的小(α=0.05)?解答:以X,Y分别表示甲,乙二车床产品直径.X∼N(μ1,σ12),Y∼N(μ2,σ22),X,Y独立. 检验假设H0:σ12=σ22,H1:σ22<σ22.用F检验法, 在H0成立时F=S12S22∼F(n1-1,n2-1).由已知数据算得x¯≈15.01,y¯≈14.99,s12≈0.0955,s22≈0.0261,n1=8,n2=9,α=0.05.拒绝域为Rα={F>Fα(n1-1,n2-1)}.查F分布表得F0.05(8-1,9-1)=3.50.计算F值F=s12/s22=0.0955/0.0261≈3.66.因为3.66>3.50,故应否定H0,即认为乙车床产品的直径的方差比甲车床的小.习题6某灯泡厂采用一项新工艺的前后,分别抽取10个灯泡进行寿命试验. 计算得到:采用新工艺前灯泡寿命的样本均值为2460小时. 样本标准差为56小时;采用新工艺后灯泡寿命的样本均值为2550小时,样本标准差为48小时. 设灯泡的寿命服从正态分布,是否可以认为采用新工艺后灯泡的平均寿命有显著提高(α=0.01)?解答:(1)检验假设H0:σ12=σ22,H1:σ12≠σ22.应选取检验统计量F=S12/S22,若H0真, 则F∼F(m-1,n-1);对于给定的检验水平α=0.01,查自由度为(9,9)的F分布表得F0.005(9,9)=6.54;已知m=n=10,s1=56,s2=48,由此得统计量F的观察值为F=562/482≈1.36;因为F<F0.005(9,9),所以接受原假设H0,即可认为这两个总体的方差无显著差异.(2)检验假设H0′:μ1=μ2,H1′:μ1<μ2.按上述关于双总体方差的假设检验的结论知这两个总体的方差未知但相等,σ12=σ22,所以应选取检验统计量:T=X¯-Y¯(m-1)S12+(n-1)S22m+n-2(1m+1n),若H0′真,则T∼t(m+n-2);对给定的检验水平α=0.01,查自由度为m+n-2=18的t分布表得临界值计算t值t=z¯-0sz/n=-0.1-00.141/5≈-1.59>-2.776,故接受H0:μz=0,即在α=0.05下,认为两种分析方法所得的均值结果相同.7.4 关于一般总体数学期望的假设检验习题1设两总体X,Y分别服从泊松分布P(λ1),P(λ2),给定显著性水平α,试设计一个检验统计量,使之能确定检验H0:λ1=λ2,H1:λ1≠λ2的拒绝域,并说明设计的理论依据.解答:因非正态总体,故宜用大样统计,设X¯=1n1∑i=1n1Xi,S12=1n1-1∑i=1n1(Xi-X¯)2;Y¯=1n2∑i=1n2Yi,S22=1n2-1∑i=1n2(Yi-Y¯)2.\because(X¯-Y¯)-(λ1-λ2)S12n1+S22n2→N(0,1)∴可选用样本函数u=(X¯-Y¯)-(λ1-λ2)S12n1+S22n2作为拒绝域的检验统计量.习题2设某段高速公路上汽车限制速度为104.6km/h,现检验n=85辆汽车的样本,测出平均车速为x¯=106.7km/h,已知总体标准差为σ=13.4km/h,但不知总体是否服从正态分布. 在显著性水平α=0.05下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快?解答:设高速公路上的车速为随机变量X,近似有X∼N(μ,σ2),σ=13.4km/h,要检验假设H0:μ=μ0=104.6,H1:μ>104.6.α=0.05,n=85,uα=u0.05=1.645.拒绝域W={u=x¯-μ0σ/n>uα.由x¯=106.7,σ=13.4,μ0=104.6,n=85得u=106.7-104.613.4/85≈1.44<1.645.因为1.44<1.645,所以接受H0,即要α=0.05显著性水平下,没有明显的证据说明汽车行驶快于限制速度.习题3某药品广告上声称该药品对某种疾病和治愈率为90%,一家医院对该种药品临床使用120例,治愈85人,问该药品广告是否真实(α=0.02)?解答:设该药品对某种疾病的治愈率为p,随机变量X为X={1,临床者使用该药品治愈0,反之则X∼b(1,p),问题该归结为检验假设:H0:p=0.9,H1:p≠0.9.由于n=120足够大,可以用u检验法,所给样值(x1,x2,⋯,x120)中有85个1,35个0,所以x¯=1120∑i=1120xi=1120∑i=1851=85120≈0.71,又p0=0.9,以之代入统计量U得U的观察值为∣u∣=∣0.71-0.9∣0.9×0.1120=6.94>u0.01=2.33,故拒绝H0,即认为该药品不真实.习题4一位中学校长在报纸上看到这样的报道:“这一城市的初中学生平均每周看8小时电视.”她认为她所领导的学校,学生看电视时间明显小于该数字. 为此,她向她的学校的100名初中学生作了调查,得知平均每周看电视的时间x¯=6.5小时,样本标准差为s=2小时,问是否可以认为这位校长的看法是对的(α=0.05)?解答:检验假设H0:μ=8,H1:μ<8.由于n=100,所以T=X¯-μS/n近似服从N(0,1)分布,α=0.05,u0.05=1.645.又知x¯=6.5,s=2,故计算得t=6.5-82/100=-7.5,否定域W={X¯-8S/n<-u0.05.因为-7.5<-1.645,故否定H0,认为这位校长的看法是对的.习题5已知某种电子元件的使用寿命X(h)服从指数分布e(λ),抽查100个元件,得样本均值x¯=950(h),能否认为参数λ=0.001(α=0.05)?解答:由题意知X∼e(λ),E(X)=1/λ,D(X)=1/λ2,故当n充分大时u=x¯-1/λ1nλ=(x¯-1λ)λn=(λx¯-1)n(0,1).现在检验问题为H0:λ=0.001,H1:λ≠0.001,样本值u=(0.001×950-1)×100=0.5,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即可认为参数λ=0.001(即元件平均合适用寿命为1000h).习题6某产品的次品率为0.17,现对此产品进行新工艺试验,从中抽取400检查,发现次品56件,能否认为这项新工艺显著地影响产品质量(α=0.05)?解答:检验问题为H0:p=0.17,H1:p≠0.17,由题意知⌢p=mn=56400=0.14,u=(⌢p-p0)p0q0n=0.14-0.170.17×0.83×400≈-1.597,α=0.05,u0.025=1.96.因∣u∣<u0.025=1.96,故接受H0,即认为新工艺没有显著地影响产品质量.习题7某厂生产了一大批产品,按规定次品率p≤0.05才能出厂,否则不能出厂,现从产品中随机抽查50件,发现有4件次品,问该批产品能否出厂(α=0.05)?解答:问题归结为在α=0.05下,检验假设H0:p≤0.05,H1:p>0.05.这是一个单侧检验问题,用u检验法,H0的拒绝域为U=X¯-p0p0(1-p0)n>uα.已知n=50,p0=0.05,x¯=450=0.08,代入U的表达式得u=0.08-0.050.05×0.9550≈0.97<uα=u0.05=1.645,故接受H0,即认为这批产品可以出厂.习题8从选区A中抽取300名选民的选票,从选区B中抽取200名选民的选票,在这两组选票中,分别有168票和96票支持所提候选人,试在显著水平α=0.05下,检验两个选区之间对候选人的支持是否存在差异. 解答:这是两个比率的比较问题,待检假设为H0:p1=p2,H1:p1≠p2.由题设知n=300,μn=168,m=200,μm=96,p1 =168320=0.56,p2 =96200=0.48,p=μn+μmm+n=264500=0.528.U0∼=p1 -p2 p(1-p)(1n+1m)=0.56-0.480.528×0.472×1120≈1.755,由P{∣U∼∣>1.96}=α=0.05,得拒绝域∣U∼∣>1.96,因为U0∼=1.755<1.96,故接受H0,即两个选区之间无显著差异.7.5 分布拟合检验Ai k概率pi npi频数fi(fi-npi)2(fi-npi)2npiA001/108085250.3125A111/108093169 2.1125A221/108084160.2A331/10807910.0125A441/10807840.05A551/108069121 1.5125A661/108074360.45A771/10807181 1.0125A881/108091121 1.5125A991/108076160.2∑18007.375由于当H0为真时,χ2=∑i=0k(fi-npi)2npi∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r).这里χ2=7.375,查表知χ0.052(10-1-0)=χ0.052(9)=16.9,显然χ2=7.375<16.9=χ0.052(9),即χ2未落在拒绝域中,所以接受H0,即认为这个正20面体是由均匀材料制面的.习题2根据观察到的数据疵点数0 1 2 3 4 5 6频数fi 14 27 26 20 7 3 3检验整批零件上的疵点数是否服从泊松分布(α=0.05).解答:设X表示整批零件上的疵点数,则本问题是在α=0.05下检验假设H0:P{X=i}=λie-λi!,i=0,1,2,⋯.由于在H0中参数λ未具体给出,所以先估计λ的值. 由极大似然估计法得λ =x¯=1100(0×14+1×27+2×26+3×20+4×7+5×3+6×3)=2.将试验的所有可能结果分为7个互不相容的事件A0,A1,⋯,A7, 当H0成立时,P{X=i}有估计值p0=P{X=0}=e-2≈0.135335,p1=P{X=1}=2e-2≈0.27067,p2=P{X=2}=2e2≈0.270671,p3=P{X=3}≈0.180447,p4=P{X=4}=2/3e-2≈0.090224,p5=P{X=5}=4/15e-2≈0.036089, p6=P{X=6}=4/45e-2≈0.0120298. 列表如下:Ai k 概率pi npi 频数fi (fi-npi)2 (fi-npi)2npiA0 A1 A2 A3 A4 A5 A6 0 1 2 3 4 5 6 0.1353350.270671 0.270671 0.180447 0.090224 0.036089 0.0120298 13.5335 27.0671 27.0672 18.0447 9.02243.60891.2029813.83428 14 27 26 2073313 0.2176 0.0045 1.1387 3.8232 0.6960 0.01608 0.000166 0.04207 0.2118740.050310∑1000.3205当H0为真时,χ2=∑i=0k(fi-npi)2npi ∼χ2(k-1-r),且此检验问题的拒绝域为χ2≥χα2(k-1-r), 这里χ2=0.3205, 查表知χ0.052(5-1-1)=χ0.052(3)=7.815. 显然 χ2=0.3205<7.815=χ0.052(3).即χ2未落在拒绝域中,接受H0, 故可认为整批零件上的疵点数服从泊松分布.习题3检查了一本书的100页,记录各页中印刷错误的个数,其结果为错误个数fi123456 ≥7含fi 个错误的页数 36 4019221问能否认为一页的印刷错误个数服从泊松分布(取α=0.05)? 解答:检验假设H0: 一页的印刷错误个数X 服从泊松分布, P{X=i}=λie -λi!,i=0,1,2,⋯.H0 不成立. 先估计未知参数λλ =x¯=1/100(0×36+1×40+2×19+3×2+4×0+5×2+6×1)=1. 在H0成立下p =P{X=i}=(λ )ie -λ i !=e-1i!,i=0,1,2,⋯. 用χ2检验法χ2=∑i=1k(fi -np )2np ∼χ2(k -r-1). 本题中r=1, 其中fi 为频数. H0的拒绝域为 Rα={χ2>χα2(k -r-1)}. 列表计算如下:n=100, 对每个{X=i}计算 p ,np ,fi -np ,(fi -np )2/(np )(i=1,2,⋯,7). 要求每一个np ≥5.计算χ2值χ2=0.0170+0.2801+0.0202+1.1423=1.4596.习题6下表记录了2880个婴儿的出生时刻:试问婴儿的出生时刻是否服从均匀分布U[0,24](显著性水平α=0.05)?解答:原假设H0:F0(x), 由F0(x)算得pi=F0(i)-F0(i-1)=124,npi=2880×124=120 (i=1,2,⋯,24),于是χ2=∑i=124(fi-npi)2npi≈40.47,对α=0.05, 自由度n-1=23, 查χ2-分布表,得χα2(n-1)=35.17,因为χ2=40.47>35.17, 所以拒绝H0, 即可以认为婴儿出生时刻不服从均匀分布U[0,24].总习题解答习题1下面列出的是某工厂随机选取的20只部件的装配时间(min):9.8,10.4,10.6,9.6,9.7,9.9,10.9,11.1,9.6,10.2,10.3,9.6,9.9,11.2,10.6,9.8,10.5,10.1,10.5,9.7.设装配时间的总体服从正态分布N(μ,σ2),μ,σ2均未知,是否可以认为装配时间的均值显著地大于10(取α=0.05)?解答:检验假设H0:μ≤μ0=10,H1:μ>10.已知n=20,α=0.05,由数据算得x¯=10.2,s≈0.5099.因σ2未知,故用t检验法,拒绝域为W={X¯-μ0S/n>tα(n-1).计算得x¯-μ0s/n=10.2-100.5099/20≈1.7541.查t分布表得t0.05(19)=1.7291.因为1.7541>1.7291,故拒绝H0,可以认为装配时间的均值显著地大于10.习题2某地早稻收割根据长势估计平均亩产为310kg,收割时,随机抽取了10块,测出每块的实际亩产量为x1,x2,⋯,x10,计算得x¯=110∑i=110xi=320.如果已知早稻亩产量X服从正态分布N(μ,144),显著性水平α=0.05,试问所估产量是否正确?解答:这是一个正态分布总体,方差已知,对期望的假设检验问题,如果估计正确,则应有μ=310,因此我们先将问题表示成两个假设:①H0:μ=310,H1:μ≠310.接下来就要分析样本值来确定是接受H0,还是接受H1.当H0为真时,统计量②U=X¯-31012/10∼N(0,1),从而有③P{∣U∣>1.96}=0.05,拒绝域为(-∞,-1.96)∪(1.96,+∞).④计算U0=∣320-310∣12/n≈2.64>1.96,即拒绝H0,也就是有理由不相信H0是真的,故认为估产310kg不正确.习题3设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,样本标准差为15分,问在显著水平0.05下,是否可认为这次考试全体考生的平均成绩为70分?并给出检验过程.(1)设这次考试全体考生的平均成绩X∼N(μ,σ2),则待检验假设H0:μ=70,备择假设H1:μ≠70;(2)在H0成立条件下选择统计量T=X¯-μ0S/n∼t(n-1);(3)在显著性水平0.05下,查t分布表,找出临界值tα/2(n-1)=t0.025(35)=2.0301,则拒绝域为(-∞,-2.0301)∪(2.0301,+∞);(4)计算t=∣66.5-70∣15/36=1.4∈(-2.0301,2.0301),故接受H0,因此可认为这次考试全体考生的平均成绩为70分.习题4设有来自正态总体的容量为100的样本,样本均值x¯=2.7,μ,σ2均未知,而∑i=1n(xi-x¯)2=225,在α=0.05水平下,检验下列假设(1)H0:μ=3,H1:μ≠3;(2)H0:σ2=2.5,H1:σ2≠2.5.解答:(1)由题意知n=100,x¯=2.7,s=199×225≈1.508,t=(2.7-3)1.508×100≈-1.9894,α=0.05,t0.025(99)≈t0.025(100)=1.984.因∣t∣=1.9894>t0.025(99)=1.984,故拒绝H0,即认为μ≠3.(2)由题意知χ2=∑i=1n(x1-x¯)22.5=2252.5=90,α=0.05,χ0.0252(99)≈χ0.0252(100)=129.56,χ0.9752(99)≈χ0.9752(100)=74.22,因χ0.9752(99)<χ2=90<χ0.0252(99),故接受H0,即可以认为σ2=2.5.习题5设某大学的男生体重X为正态总体,X∼N(μ,σ2),欲检验假设:H0:μ=68kg,H1:μ>68kg.已知σ=5,取显著性水平α=0.05,若当真正均值为69kg时,犯第二类错误的概率不超过β=0.05,求所需样本大小.解答:由第一类、第二类错误及分位数的定义,易于证明:对于某个给定的δ>0(∣μ-μ0∣≥δ),样本容量n应满足:n≥(uα+uβ)2σ2δ2.因为α=β=0.05,故uα=uβ=1.645,对其对立假设μ=69而言,取δ=1,则n=(uα+uβ)2σ2δ2=(1.645+1.645)2×251≈270.6,故取n=271.某装置的平均工作温度据制造厂家称不高于190∘C.今从一个由16台装置构成的随机样本测得工作温度的平均值和标准差分别为195∘C和8∘C,根据这些数据能否说明平均工作温度比制造厂所说的要高?(设α=0.05,并假设工作温度近似服从正态分布.)解答:设X为工作温度,则X∼N(μ,σ2).①待检假设H0:μ≤190,备择假设H1:μ>190;②在H0成立条件下,选择统计量T=X¯-μ0S/n≈t(n-1);③在显著性水平0.05下,查t分布表,找出临界值tα(n-1)=t0.05(15)=1.75,拒绝域为(1.75,+∞);④计算t=X¯-μ0S/n=195-1908/16=2.5>1.75,所以否定原假设H0,说明平均工作温度比制造厂所说的要高.习题7电工器材厂生产一批保险丝,抽取10根试验其熔断时间,结果为42657578715957685455假设熔断时间服从正态分布,能否认为整批保险丝的熔断时间的方差不大于80(α=0.05)?解答:①待检假设H0:σ2≤80,备择假设H1:σ2>80;②在H0成立时,选取统计量χ2=(n-1)S2σ02∼χ2(n-1);③由α=0.05,n-1=9,查χ2分布表,χα2(n-1)=χ0.052(9)=16.919;④计算样本值:x¯=110(42+65+75+78+71+59+57+68+54+55)=62.4,s2=19∑i=110(xi-x¯)2≈121.8,χ2=9×121.880≈13.7∈(0,16.919).故接受原假设H0即在α=0.05下,可认为整批保险丝的熔断时间的方差不大于80.习题8某系学生可以被允许选修3学分有实验物理课和4学分无实验物理课,11名学生选3学分的课,考试平均分数为85分,标准差为4.7分;17名学生选4学分的课,考试平均分数为79分,标准差为6.1分. 假定两总体近似服从方差相同的正态分布,试在显著性水平α=0.05下检验实验课程是否能使平均分数增加8分?解答:设有实验的课程考分X1∼N(μ1,σ12),无实验的课程考分X2∼N(μ2-σ22).假定σ12=σ22=σ2未知,检验假设H0:μ1-μ2=8,H1:μ1-μ2≠8.由题意知,选用t检验统计量,则拒绝域为W={∣x1¯-x2¯-(μ1-μ2)sw1n1+1n2∣>tα/2(n1+n2-2),其中sw2=(n1-1)s12+(n2-1)s22n1+n2-2.由x1¯=85,x2¯=79,n1=11,n2=17,s1=4.7,s2=6.1,算出sw=(11-1)×4.72+(17-1)×6.1211+17-2≈5.603.从而算出t值为t=85-79-85.603111+117≈-0.92,由α=0.05,查表得t0.025(11+17-2)=t0.025(25)=2.056,因为∣t∣=0.92<2.056,故接受H0,认为μ1-μ2=8.习题9某校从经常参加体育锻炼的男生中随机地选出50名,测得平均身高174.34厘米;从不经常参加体育锻炼的男生中随机地选50名,测得平均身高172.42厘米. 统计资料表明两种男生的身高都服从正态分布,其标准差分别为5.35厘米和6.11厘米,问该校经常参加锻炼的男生是否比不常参加锻炼的男生平均身高要高些(α=0.05)?解答:设X,Y分别表示常锻炼和不常锻炼男生的身高,由题设X∼N(μ1,5.352),Y∼N(μ2,6.112).①待检假设H0:μ1≤μ2,备择假设H1:μ1>μ2;②选取统计量U=X¯-Y¯σ12n+σ22m∼(H0成立)N(0,1);③对于α=0.05,查标准正态分布表,uα=u0.05=1.64;则拒绝域为(1.64,+∞);④计算u=174.34-172.425.35250+6.11250≈1.67>1.64,故否定原假设H0,即表明经常体育锻炼的男生平均身高比不经常体育锻炼的男生平均身高高些.习题10在漂白工艺中要改变温度对针织品断裂强力的影响,在两种不同温度下分别作了8次试验,测得断裂强力的数据如下(单位:kg):70∘C:20.818.819.820.921.519.521.021.280∘C:17.720.320.018.819.020.120.219.1判断两种温度下的强力有无差别(断裂强力可认为服从正态分布α=0.05)?解答:(1)本问题是在α=0.05下检验假设μ1=μ2,为此需要先检验σ12=σ22是否成立.H01:σ12=σ22,H11:σ12≠σ22.选取统计量F=S12S22,在H01成立的条件下,F∼F(n1-1,n2-1),且此检验问题的拒绝域为F>Fα/2(n1-1,n2-1)或F<F1-α/2(n1-1,n2-1).这里F=s12s22≈0.90550.8286≈1.0928,F0.025(7,7)=4.99,F0.975(7,7)=1F0.025(7,7)=14.99≈0.2004.显然F0.975(7,7)=0.2004<1.0928<4.99=F0.025(7,7).说明F未落在拒绝域中,从而接受H01,即认为两温度下的强力的方差没有显著变化,亦即σ12=σ22. (2)再检验假设H0ʹ:μ1=μ2,H0ʹ:μ1≠μ2,在H0ʹ成立的条件下,T=X1¯-X2¯(n1-1)S12+(n2-1)S22n1+n2-21n1+1n2∼t(n1+n2-2),且此检验问题的拒绝域为∣T∣>tα/2(n1+n2-2),这里T≈20.4-19.47×0.9055+7×0.82868+8-218+18≈2.148,显然∣T∣=2.148>2.145=t0.025(14).说明T落在拒绝域中,从而拒绝H0,即认为两种温度下的断裂强力有显著差别.习题11一出租车公司欲检验装配哪一种轮胎省油,以12部装有Ⅰ型轮胎的车辆进行预定的测试. 在不变换驾驶员的情况下,将这12部车辆换装Ⅱ型轮并重复测试,其汽油耗量如下表所示(单位:km/L).汽车编号i123456789101112Ⅰ型胎(xi)4.24.76.67.06.74.55.76.07.44.96.15.2Ⅱ型胎(yi)4.14.96.26.96.84.45.75.86.94.76.04.9假定两总体均服从正态分布,试在α=0.025的显著性水平下,检验安装Ⅰ型轮胎是否要双安装Ⅱ型轮胎省油?解答:设两种轮胎汽油消耗量之差为随机变量D,则取值为zi=xi-yi=0.1,-0.2,0.4,0.1,-0.1,0.1,0,0.2,0.5,0.2,0.1,0.3.设Z∼N(μz,σz2),σz2未知. 若消耗油相同,则μz=0;若Ⅰ型比Ⅱ型轮胎省油,则μz>0,于是检验假设H0:μz=0,H1:μz>0.由题意知z¯≈0.142,s≈0.198,n-1=12-1=11.α=0.025,查t分布表得t0.025(11)=2.201.所以,拒绝域为W={t>2.201}.由于样本值t=z¯-0s/n=0.142-00.198/12≈2.48>2.201,故拒绝H0:μz=0,即说明Ⅰ型轮胎省油.习题12有两台机器生产金属部件,分别在两台机器所生产的部件中各取一容量n1=60,n2=40的样本,测得部件重量(以kg计)的样本方差分别为s12=15.46,s22=9.66. 设两样本相互独立,两总体分别服从分布N(μ1,σ12),N(μ2,σ22).μi,σi2(i=1,2)均未知,试在α=0.05水平下检验假设H0:σ12≤σ22,H1:σ12>σ22.解答:在α=0.05下,检验假设H0:σ12≤σ22,H1:σ12>σ22,经计算p=1100×10(45+2×17+3×4+4×1+5×1)=1/10,故检验假设为H0:X∼B(10,1/10),即p =P{X=i}=C10i(1/10)i(9/10)10-i,i=0,1,2,⋯,10.为了使np ≥5,将xi≥3合并,于是k=4,r=1.计算χ2的观察值,计算结果如下表:[200,300) [300,+∞)435843.466.9-0.4-8.90.0041.184∑300300 1.8631其中理论概率pi=p{ti≤T≤ti+1}=∫titi+1f(t)dt(i=1,2,3),p4=1-∑i=13pi,例如p1=P{T<100}=∫01000.005e-0.005tdt=1-e-0.5≈0.393.由k=4,未知参数个数r=0,查表知χα2(k-r-1)=χ0.052(3)=7.815.因χ2=1.8631<χ0.052(3)=7.815.故接受H0,即可认为灯泡的寿命服从该指数分布.习题16关于正态总体X∼N(μ,1)的数学期望有如下二者必居其一的假设,H0:μ=0,H1:μ=1.考虑检验规则:当X¯≥0.98时否定假设H0接受H1,其中X¯=(X1+⋯+X4)/4,而X1,⋯,X4是来自总体X的简单随机样本,试求检验的两类错误概率α和β.解答:易见,在假设“H0:μ=0”成立的条件下,X¯∼N(0,1/4),2X¯∼N(0,1);在假设“H1:μ=1”成立的条件下,X¯∼N(1,1/4),2(X¯-1)∼N(0,1).因此,由定义得α=P{X¯≥0.98∣μ=0}=P{2X¯≥1.96∣μ=0}=0.025,β=P{X¯<0.98∣μ=1}=P{2(X¯-1)<-0.04∣μ=1}=0.4840.习题17考察某城市购买A公司牛奶的比例,作假设H0:p=0.6,H1:p<0.6,随机抽取50个家属,设x为其中购买A公司牛奶的家庭数,拒绝域W={x≤24}.(1)H0成立时,求第一类错误的α;(2)H1成立且p=0.4时,求第二类错误的β(0.4);又当p=0.5时,求第二类错误的β(0.5).解答:由定义知(1)α=P{x≤24∣p=0.6}=Φ(24-50×0.650×0.6×0.4)≈Φ(-1.73)=1-Φ(1.73)=1-0.9528=0.0418.(2)β(0.4)=P{x>24∣p=0.4}=1-Φ(24-50×0.450×0.4×0.6)≈1-Φ(1.15)=1-0.8749=0.1251;。
第七章假设检验
第七章 假设检验一、教材说明本章主要讲假设检验的基本思想与概念、正态总体参数的假设检验这2节的内容. 1、本章的教学目的与要求(1)使学生了解假设检验的基本概念; (2)使学生了解假设检验的基本思想; (3)使学生掌握假设检验的基本步骤;(4)使学生会计算检验的两类错误,搞清楚两类错误的关系;(5)使学生掌握正态总体参数的假设检验,主要是检验统计量及其分布,检验拒绝域的确定;(6)使学生灵活运用所学知识解决实际问题. 2、本章的重点与难点本章的重点是正态总体参数的各种假设检验中的检验统计量及其分布,难点是假设检验拒绝域的确定.二、教学内容下面主要分2节来讲解本章的主要内容.§7.1 假设检验的基本思想与概念教学目的:要求学生了解假设检验的基本思想,理解假设检验的基本概念,认识假设检验问题,熟悉假设检验的基本步骤.教学重点:基本概念,假设检验的基本步骤. 教学难点:基本概念的理解.教学内容:本节内容包括假设检验的基本概念,假设检验的基本步骤. 7.1.1 假设检验的基本概念1.统计假设、原假设、备择假设把任意一个有关未知分布的假设统称为统计假设,简称假设.例7.1.1 某厂生产的合金强度服从正态分布)16,(θN ,其中θ的设计值为不低于110(Pa ),为保证质量,该厂每天都要对生产情况做例行检查,以判断生产是否正常进行,即该合金的平均强度不低于110(Pa ),某天从生产中随机抽取25块合金,测得强度值为2521,,,x x x ,其均值为)(108Pa x =,问当时生产是否正常?如果生产是正常进行的,则合金平均强度不低于110(Pa ),而合金强度服从)16,(θN ,故平均强度110≥θ,如果生产不正常,则110<θ.现在的问题是据样本得到的信息来判断110≥θ还是110<θ,此问题不是参数估计问题,而是一假设检验问题.这样对未知参数,提出两个对立的假设:称110:0≥θH 为原假设,110:1<θH 为备择假设.通常将不应轻易加以否定的假设做为原假设,以0H 记,当0H 被拒绝时而接受的假设称为备择假设,用1H 表示.2.参数假设、非参数假设参数假设:总体分布类型已知,对分布中的未知参数的假设. 非参数假设:不同于参数假设的其他假设(包括对母体分布函数的类型及分布的某些特征的假设).我们的任务就是根据样本得到的信息,在原假设0H 与备择假设1H 两者中做出一个判断:拒绝还是接受0H .7.1.2 假设检验的基本步骤1、建立假设依据实际问题建立一对假设,例7.1.1的假设为110:110:10<≥θθH vsH2、选择检验统计量,给出拒绝域形式在0H 与1H 两者中做出一个选择,也即完成一次判断,必须建立一个检验法则,而由样本对原假设进行判断总是通过一个统计量完成的,该统计量称为检验统计量.一般而言,检验统计量的选择应该使在0H 、1H 分别成立时,统计量的值有较大差异,从而能够做出判断.在例7.1.1中,样本均值x 就是一个很好的检验统计量,它是总体参数θ的无偏估计.样本均值x 愈大,意味着总体均值θ也大;样本均值愈小,意味着总体均值θ也小.由于样本的随机性,只有当x 小到一定程度,则应认为原假设0H 不正确.故在样本均值x 的取值中有一个临界值C (待定),使得当C x ≤时,认为0H 不正确,也即拒绝0H ,此时称}:{C x x W ≤=为该检验的拒绝域,当C x >时,认为0H 正确,则接受0H ,对应的}:{C x x W >=为该检验的接受域.一般地,使原假设0H 被拒绝的样本观测值所在区域称为拒绝域,记为W ,从而规定:当W x x n ∈),,(1 时,拒绝0H ;当W x x n ∈),,(1 时 ,接受0H .从而一个拒绝域W 唯一确定一个法则.3、选择显著性水平 α 通常=α0.05,0.01,0.1.4、给出拒绝域W利用统计量),,(1n x x T ,使得01),,((H W x x T P n ∈ 为真)α=5、做判断将样本观测值代入检验统计量,看该统计量的值是否落入拒绝域W ,当W x x T n ∈),,(1 时,拒绝0H ,当W x x T n ∉),,(1 时,接受0H .三、假设检验的两类错误与势函数 1、两类错误对给出的拒绝域W ,由于样本的随机性,我们做出的判断不可能100%正确,它可能会犯两类错误:第一:0H 为真时,W x x n ∈),,(1 ,从而拒绝0H .这种错误称为第一类错误,其发生的概率称为犯第一类错误的概率或拒真概率,通常记为α,即α=P (拒绝0H 0H 为真)=01),,((H W x x T P n ∈ 为真)=01],),,[(Θ∈∈θθW x x P n第二:在0H 不真时,W x x n ∈),,(1 ,从而接受0H .这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或受伪概率,通常记为β,即β=P (接受0H 0H 不真)=01),,((H W x x T P n ∈ 不真)=111],),,[(1]),,[(Θ∈∈-=∈θθθW x x P W x x P n n2、势函数定义7.1.1 设检验问题1100::Θ∈Θ∈θθH vs H 的拒绝域为W ,则样本观测值),,(1n x x 落入拒绝域W 内的概率称为该检验的势函数,即101],),,[()(Θ⋃Θ=Θ∈∈=θθθW x x P g n其中10,ΘΘ是参数空间两个互不相交的子集. 注 由以上α、β及势函数的定义知⎩⎨⎧Θ∈-Θ∈=10),(1),()(θθβθθαθg3、两类错误的关系对例7.1.1,}:{c x x W ≤=,故)4()44(][)(θθθθθ-Φ=-≤-=≤=c c c x P c x P g ,从而犯两类错误的概率)(θα,)(θβ分别为:0),54()(Θ∈-Φ=θθθαc1),54(1)(Θ∈-Φ-=θθθβc从而当α减少时,c 也减少,而c 的减少必导致β的增大;当β减少时,c 会增大,而c 的增大必导致α的增大,故得到两类错误的关系:(1)在样本容量n 一定时,α、β不能同时小,α的增大必导致β的减少;α的减少必导致β的增大;(2)要使α、β同时小,则必须n 充分大,但这又是不现实的.为此,采用折中的方法:控制α,使β尽量小,但有时这样的检验也不存在,从而我们只控制α,而不管β,此时求拒绝域W 只涉及原假设0H ,而不管备择假设1H .4、水平为α的显著性检验 定义7.1.2 对检验问题1100::Θ∈Θ∈θθH vs H ,如果一个检验满足对任意的0Θ∈θ,都有αθ≤)(g则称该检验是显著性水平为α的显著性检验,简称水平为α的检验. 在例7.1.1 取=α0.05,则110≥∀θ有05.0)54()(≤-Φ=θθc g ,由于)(θg 是θ的减函数,故只须05.0)54110()110(=-Φ=c g ,即05.0)]110(45[=-Φc从而684.108645.18.0110645.1)110(4595.0)]110(45[=⨯-=⇒=-⇒=-Φc c c 拒绝域为}684.108:{≤=x x W ,又因为684.108108<=x ,所以拒绝0H ,认为该日生产不正常.§7.2 正态总体参数假设检验教学目的:理解和掌握单个以及两个正态总体均值的假设检验的方法与思想,掌握正态总体方差检验的方法.教学重点:检验方法的掌握,检验方法思想的理解. 教学难点:检验方法的掌握.教学内容:本节内容包括单个正态总体均值的假设检验,两个正态总体均值差的检验,正态总体方差的检验.参数假设检验常见的有三种基本形式 (1)0010::H vs H θθθθ≤>(2)0010::<H vs H θθθθ≥ (3)0010:=:H vs H θθθθ≠一般来说,对这三种假设采取的检验统计量是相同的,差别在拒绝域上.当备择假设1H 在原假设0H 一侧时的检验称为单侧检验,当备择假设1H 分散在原假设0H 两侧时的检验称为双侧检验.(1),(2)是单侧检验,(3)是双侧检验.7.2.1 单个正态总体均值的假设检验设n x x x ,,,21 是来自正态总体),(2σμN 的样本,对均值μ考虑如下的检验: 0100::μμμμ>≤H vs H (1) 0100::μμμμ<≥H vs H (2) 0100::μμμμ≠=H vs H (3)一 2σ已知时的u 检验对单侧检验(1),由于x 是μ的无偏估计,选取统计量u=故当样本均值x 不超过设定均值0μ时,应接受0H ,而当样本均值x 超过设定均值0μ时,应拒绝0H ,但由于样本的随机性,x 比0μ大一点就拒绝0H 似乎不当,只有当x 比0μ大到一定程度时拒绝0H 才是恰当的.故存在临界值c ,拒绝域12{(,,,);}n W x x x u c =≥ ,常简记为{}u c ≥.若要求水平为α,则c 应满足0()=P u c μα≥,因为21~(,)x N nμσ,故0μμ=时~(0,1)x u N =知1c u α-=,所以拒绝域1{;}W u u u α-=≥.该检验用的检验统计量是u 统计量,一般称为u 检验. 易验证1{;}W u u u α-=≥是检验0100::μμμμ>≤H vs H 的显著性水平为α的检验.类似地对0100::μμμμ<≥H vs H 的显著性水平为α的拒绝域{;}W u u u α=<;0100::μμμμ≠=H vs H 的显著性水平为α的拒绝域12{;}W u u u α-=≥.例7.2.1 从甲地发送一个讯号到乙地,设乙地接受到的讯号值是一个服从正态分布)2.0,(2μN 的随机变量,其中μ为甲地发送的真实讯号值.现甲地重复发送同一讯号5次,乙地接受到的讯号值为8.05 8.15 8.2 8.1 8.25设接受方有理由猜测甲地发送的讯号值为8,问能否接受该猜测?=α0.05 分析 此时正态分布的方差已知,对均值进行检验,利用U —检验. 解 总体2~(,0.2)X N μ ,待检验的原假设0H 与备择假设分别为1H :01:8:8H vs H μμ=≠.这是一个双侧检验问题,检验的拒绝域为12{;}u u uα-≥,取0.975=0.05,=1.96u α,计算得=8.15,15-8)/0.2=1.68x u ,u 值未落入拒绝域内,故不能拒绝原假设,及接受原假设,可认为猜测成立.2、σ未知时的t 检验若2σ未知,则上述的随机变量x u =不再是统计量,自然我们要用2σ的无偏估计2211()1n ii s x x n ==--∑代替2σ,此时有0()x t s μ-=,且0μμ=时~(1)t t n =-,类似于2σ已知时均值μ的检验问题的讨论得到:0100::μμμμ>≤H vs H 的水平为α的拒绝域为1{;(1)}W t t t n α-=≥- 0100::μμμμ<≥H vs H 的水平为α的拒绝域为{;(1)}W t t t n α=≤-0100::μμμμ≠=H vs H 的水平为α的拒绝域为12{;(1)}W t t tn α-=≥-例7.2.2 某厂生产的某种铝材的长度服从正态分布,其均值设定为240cm ,现从该厂抽取5件产品,测得其长度为(单位:cm )239.7 239.6 239 240 239.2试判断该厂此类铝材的长度是否满足设定要求?=α0.05分析 此时正态分布的方差未知,对均值进行检验,利用T —检验. 解 略.综上,关于单个正态总体均值的假设检验问题可汇总成如下的表:7.2.2 两个正态总体均值差的检验设m x x x ,,,21 是来自总体X 服从),(211σμN 的样本,n y y y ,,,21 是来自总体Y 服从),(222σμN 的样本,且两样本相互独立,考虑如下的三种检验:0:0:211210>-≤-μμμμH vs H (1)0:0:211210<-≥-μμμμH vs H (2)0:0:211210≠-=-μμμμH vs H (3)主要分两种情况讨论.12,σσ已知时的两样本u 检验此时21μμ-的估计y x -的分布完全已知,),(~222121nmN y x σσμμ+--,由此可采用u 检验法,检验统计量为x yu =在21μμ=时,~(0,1)x yu N =.检验的拒绝域取决于备择假设的形式.上述三对假设检验的拒绝域分布为:1{;}W u u u α-=≥ {;}W u u u α=<12{;}W u u uα-=≥σσσ==21但未知时的两样本t 检验在22221σσσ==未知时,类似于单个正态总体方差未知时均值的检验,我们仍用2σ的无偏估计代替2σ,而此时可以证明2σ的无偏估计为:2222211(1)(1)1[()()]22m n x y wi i i i m s n s s x x y y m n m n ==-+-=-+-=+-+-∑∑ 于是有~(2)x y t t m n =+-从而检验统计量为x yt =在021=-μμ时,)2(~11-++-=n m t nm S y x T w.上述三对假设检验的拒绝域分布为:1{;(2)}W t t t m n α-=≥+-{;(2)}W t t t m n α=≤+-12{;(2)}W t t tm n α-=≥+-例7.2.3 某厂铸造车间为提高铸件的耐磨性而试制了一种镍合金铸件以取代铜合金铸件,从两种铸件中各抽取一个容量分别为8和9的样本,测得其硬度(一种耐磨性指标)为:镍合金 76.43 76.21 73.58 69.69 65.29 70.83 82.75 72.34铜合金 73.66 64.27 69.34 71.37 69.77 68.12 67.27 68.07 62.61 根据专业经验,硬度服从正态分布,且方差保持不变,试在显著性水平=α0.05下判断镍合金的硬度是否有明显提高? 解 略.一、 单个正态总体方差的2χ检验设总体),(~2σμN X ,n x x x ,,,21 是来自该总体的样本,对方差2σ考虑如下的三种检验:221220::σσσσ>≤H vs H (1) 221220::σσσσ<≥H vs H (2)2212020::σσσσ≠=H vs H (3)1、均值μ未知时方差的检验由于μ未知,2211()1n ii s x x n ==--∑是2σ的无偏估计,且202σσ=有)1(~)1(22022--=n S n χσχ对于显著性水平α,对应上述三种假设检验的拒绝域分布为:2221{;(1)}W n αχχχ-=≥- 222{;(1)}W n αχχχ=≤-22212{;(1)W n αχχχ-=≥-或222(1)}n αχχ≤-例7.2.4 某类钢板每块的重量X 服从正态分布,其一项质量指标是钢板重量的方差不得超过0.0162kg .现从某天生产的钢板中随机抽取25块,得其样本方差2S =0.0252kg .问该天生产的钢板重量的方差是否满足要求?=α0.05.解 略.2、均值μ已知时方差的检验此时,检验统计量取为20212)(σμχ∑=-=ni ix,且220σσ=时)(~)(220212n xni iχσμχ∑=-=故对均值μ已知时方差的三种检验,我们只需将均值μ未知时方差的三种检验中2χ—分布的自由度变一下就可得到检验的拒绝域.)二 两个正态总体方差比的F 检验设m x x x ,,,21 是来自总体X 服从),(211σμN 的样本,n y y y ,,,21 是来自总体Y 服从),(222σμN 的样本,且两样本相互独立,考虑如下的三种检验:2221122210::σσσσ>≤H vs H (1) 2221122210::σσσσ<≥H vs H (2) 2221122210::σσσσ≠=H vs H (3) 此处21,μμ均未知,22,x y s s 分别表示总体X 、Y 的样本方差,易知221()x E s σ=,222()yE s σ= 从而建立检验统计量22xys F s =当2212σσ=时,22~(1,1)xys F F m n s =--,此时,上述三个检验的拒绝域分别为:)}1,1(;{1--≥=-n m F F F W α )}1,1(:{--≤=n m F F F W α)1,1(:{21--≥=-n m FF F W α或)}1,1(2--≤n m F F α例7.2.5 甲、乙两台机床加工零件,零件的直径服从正态分布,总体方差反映了加工的精度,为比较两台机床的加工精度有无区别,现从各自加工的零件中分别抽取7件产品和8件产品,测得直径为:X (机床甲) 16.2 16.4 15.8 15.5 16.7 15.6 15.8Y (机床乙) 15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0 取 =α0.05. 解 略.)1)1§7.3 其他分布参数的假设检验教学目的:了解指数分布参数的假设检验,比例的检验,大样本检验,会解决简单的实际问题.教学重点:对于检验方法的理解. 教学难点:解决简单的实际问题.教学内容:本节内容包括指数分布参数的假设检验,比例p 的检验,大样本检验,检验的p 值.7.3.1 指数分布参数的假设检验设n x x x ,,,21 是来自指数分布1()Exp θ的样本,现考虑关于θ的如下检验问题:0010::H vs H θθθθ≤>,拒绝域的自然形式是={}W x c ≥,下面讨论x 的分布.考虑θ的充分统计量x ,在0=θθ时,0=1=~(,1)ni i nx x Ga n θ∑,由咖玛分布的性质可知2202=~(2)nxn χχθ,于是可用2χ作为检验统计量并利用2(2)n χ的分位数建立检验的拒绝域221-={(2n)}W αχχ≥.类似可得,对关于θ的另两种检验问题:0010::<H vs H θθθθ≥, 0010:=:H vs H θθθθ≠检验统计量仍是2χ,拒绝域分别是22={(2n)}W αχχ≤,22221-22={(2n)(2n)}W ααχχχχ≤≥或.例7.3.1 设我们要检验某种元件的平均寿命不小于6000h ,假定元件寿命为指数分布,现取5个元件投入试验,观测到如下5个失效时间(h ) 395 4094 119 11572 6133 解:这是一个假设检验问题,检验的假设为 01:6000:<6000H vs H θθ≥经计算=4462.6x ,故检验的统计量为201044626===7.43776000xχθ, 若取=0.05α,查表得20.05(10)=3.94χ,由于220.05>(10)χχ,故接受原假设,可以认为平均寿命不低于6000h.7.3.2 比例p 的检验比例p 可看做某时间发生的概率,即看作二点分布(1,)b p 中的参数.作n 次独立重复试验,以x 记该事件发生的次数,则~(n,)x b p . 现考虑如下单边假设检验问题 0010::H p p vs H p p ≤>,找一个0c ,使得00--0000==+1(1-)>>(1-)nni n ii n i i c i c n n p p p p i i α⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭∑∑,0=+1c c 可得水平为α的检验.对检验问题0010::<H p p vs H p p ≥,检验的拒绝域为={x }W c ≤,c 为满足-00=0(1-)ci n ii n p p i α⎛⎫≤ ⎪⎝⎭∑的最大正整数. 对检验问题0010:=:H p p vs H p p ≠,检验的拒绝域为12={x x c }W c ≤≥或,1c 为满足1-00=0(1-)2c i n i i n p p i α⎛⎫≤ ⎪⎝⎭∑的最大正整数,2c 为满足2-00=c (1-)2ni n i i n p p i α⎛⎫≤ ⎪⎝⎭∑的最小正整数.例7.3.2 某厂生产的产品优质品率一直保持在40%,近期对该厂生产的该类产品抽检20件,其中优质品7件,在=0.05α下能否认为优质品率仍保持在40%?解:这是一个假设检验问题,以p 表示优质品率,以x 表示20件产品中的优质品数,则~(20,)x b p ,待检验的原假设为01:=0.4:0.4H p vs H p ≠,拒绝域为12={x x c }W c ≤≥或,下求1c ,2c .由于(3)=0.0160<0.P x P x ≤≤,故取1=3c ,又由于(11)=0.0565>0.025>(12)=0.0210P x P x ≥≥,故取2=12c ,拒绝域为={x 3x 12}W ≤≥或由于观测值没有落入拒绝域,故接受原假设.7.3.2 大样本检验设12,,,n x x x 是来自某总体的样本,该总体均值为θ,方差为θ的函数,记为2σθ(),则对下列三类假设检验问题:(1)0010::H vs H θθθθ≤>; (2)0010::<H vs H θθθθ≥, (3)0010:=:H vs H θθθθ≠.在样本容量n 充分大时,利用中心极限定理2~(,()/n)x N θσθ故在0=θθ时.可采用检验统计量(0,1)u N,对应上述三类假设检验问题的拒绝域分别为1-={u}W uα≥,={u}W uα≤,1-2={}W u uα≥.例7.3.3例7.3.47.3.4 检验的p值例7.3.5 略从例7.3.5可以看到,对同一个假设检验问题,若取不同的显著水平α,会得到不同的结论,0.0179是能用观测值2.10做出“拒绝H”的最小的显著性水平,这就是p值.定义7.3.1 在一个假设检验问题中,利用观测值能够做出拒绝原假设的最小显著性水平称为检验的p值.引进检验的p值的概念有如下好处:(1)它比较客观,避免了事先确定显著水平.(2)由检验的p知与人们心目中的显著性水平α进行比较可以很容易做出检验的结论:如果pα≥,则在显著性水平α下拒绝H;如果<pα,则在显著性水平α下应接受H.例7.3.6 设nxxx,,,21是来自(1,)bθ的样本,要检验如下假设0010::H vs Hθθθθ≤>设检验的显著性水平为α,则检验的拒绝域为={}iW x c≥∑,在得到观测值0=i x t∑后,计算={}ip P x tθ≥∑,就是检验的p值.例如,00=40,=0.1,=8n tθ,则40397334040=1-0.9-0.10.9--0.10.9=0.0419 17p⎛⎫⎛⎫⨯⨯⎪ ⎪⎝⎭⎝⎭,若取=0.05α,则>pα,应拒绝原假设.例7.3.7 略§7.4 分布拟合检验教学目的:了解有限离散总体分布的拟合检验、列联表的独立性检验和正态性检验.教学重点:列联表的独立性检验和正态性检验.教学难点:解决简单的实际问题.教学内容:本节内容包括总体分布只取有限个值的情况,列联表的独立性检验.正态性检验.前面讨论的检验问题都是在总体分布形式已知的前提下对分布的参数建立假设并进行检验,它们都属于参数假设检验问题.这一节我们对总体分布的形式建立假设并进行检验,这一类检验问题统称为分布的拟合检验,属于非参数假设检验.7.4.1 总体分布只取有限个值的情况设总体X 可以分成k 类,记为12,,,k A A A ,现对该总体做了n 次观测,k 个类出现的频数分别为12,n ,,n k n ,且=1=ki i n n ∑,要检验的假设为0:P(A )=,=1,2,,.i i H p i k (7.4.1)=1=1,p0.ki ii p ≥∑其备择假设是(7.4.1)诸等式不全成立.下面我们分两种情况讨论7.4.1的检验问题. 一 诸i p 均已知如果0H 成立,则对每一类i A ,其频率in n与概率i p 应较接近.据此,选用检验统计量22=1(-)=ni i i i n np np χ∑,可证明在0H 成立时,对充分大的n ,2χ近似服从自由度为-1n 的2χ分布.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={(-1)}W k αχχ≥. 例7.4.1 二 诸i p 不完全已知诸i p =1,2,,.i k 可由(<)r r k 个未知参数1,,r θθ 确定,即1=),i=1,k.i i r p p θθ (,, 为对假设(7.4.1)做检验,由样本给出诸i θ,=1,2,,r.i 的最大似然估计^^1,,r θθ ,再给出诸i p ,=1,2,,.i k 的最大似然估计^^^1=),r i i p p θθ (,,取检验统计量 ^22^=1(-)=ki i i in n p n p χ∑,可证明2χ近似服从自由度为k-r-1的2χ分布.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={(--1)}W k r αχχ≥.例7.4.27.4.2 列联表的独立性列联表是将观测数据按两个或更多属性(定性变量)分类时所列出的频数表. 一般,若总体中的个体可按两个属性,A B 分类, A 有r 个类1,,r A A , B 有c 个类1,,B c B ,从总体中抽取大小为n 的样本,设其中有ij n 个个体既属于A 类,又属于B 类,ij n 称为频数,将r c ⨯个ij n 排列为一个r 行c 列的二维列联表,简称r c ⨯表.对二维列联表,提出假设“,A B 两属性独立”,即0:=p p ,=1,2,,r,j=1,2, c.ij i j H p i 取检验统计量^22^=1=1(-)=rcij ij i j ijn n p n p χ∑∑,则在原假设成立时,2χ近似服从自由度为-(+-2)-1=(-1)(-1)rc r c r c 的2χ分布,其中^ij p 是ij p 的最大似然估计.因此,对给定的显著性水平0<<1)αα(,该检验的拒绝域为221-={((-1)(c-1))}W r αχχ≥. 例7.4.37.4.3 正态性检验用来判断总体分布是否为正态分布的检验方法称为正态性检验. 一正态概率纸概率纸是一种具有特殊刻度的坐标纸.使用这种坐标纸即可以很快判断总体分布的类型又能粗略地估计总体的参数,是检验总体分布的一种简单工具.正态概率纸是一张刻有直角坐标的图纸,它的横坐标轴的刻度是均匀的,表示观察值,纵坐标轴的刻度是不均匀的,表示概率,具体的刻度是按标准正态分布换算出来的,即在普通的直角坐标xot 的纵坐标轴(t 轴)上原坐标为t 的点刻度为du et u t2221)(-∞-⎰=Φπ,例如纵轴上,原坐标为1处的刻度为8413.0)1(=Φ,原坐标为2处的刻度为9772.0)2(=Φ,原坐标为-1处的刻度为1587.0)1(=-Φ,但习惯上,在正态概率纸上的纵坐标轴上标明的数字是换算出的刻度的100倍,又由于x 是在+∞∞-~取值,概率不可能为0,也不可能为1,故一般概率纸的纵轴的刻度都是从99.99~01.0.例7.4.4 随机选取10个零件,测得其直径与标准尺寸的偏差如下: 9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 利用正态概率纸作正态性检验的步骤如下:1. 首先把样本观察值按从小到大的次序排列:(n)(2)(1)x x x ≤≤≤ 9.6 9.810.1 10.2 11.1具体数据为 7.2 8.2 8.6 8.8 9.42. 对每一个i ,计算修正的频率n ,,2,1i ),25.0n /()375.0i (F i=+-=结果为12345F =0.061F =0.159F =0.256F =0.354F =0.451 ,,,,,678910F =0.549F =0.646F =0.743F =0.841F =0.939 ,,,,3. 将点n ,,2,1i ),F ,x (i (i)=逐一点在正态概率纸上 4. 判断若诸点在一条直线附近,则认为该样本来自正态总体;若诸点明显不在一条直线附近,则认为该样本不是来自正态分布总体.如果从正态概率纸上确认总体是非正态分布时,可对原始数据进行变换后再在正态概率纸上描点,若变换后的点在正态概率纸上近似在一条直线附近,则可认为变换后的数据来自正态分布,这样的变换称为正态性变换.常用的正态性变换有:对数变换,倒数变换和根号变换.例7.4.5 利用对数变换二 夏皮洛-威尔克检验夏皮洛-威尔克检验也简称W 检验,这个检验当850n ≤≤时可以使用,过小样本对偏离正态分布的检验不太有效.W 检验是建立在次序统计量的基础上,将n 个独立观测值按非降次序排列,记为(1)(2)(n)x ,x ,,x ,检验统计量为2=1=122=1=1[(-)(-)]=(-)(-)n ni i i i n niii i a a x x W a a x x ∑∑∑∑,系数12,,,n a a a 在样本容量为n 时有特定的值,可查附表.系数12,,,n a a a 还具有性质:+1-=-,=1,2,,[]2i n i n a a i2=1=1=0,=1n ni ii i a a∑∑故可将统计量简化为[]22(+1-)()=12()=1[(-)]=(-)n i n i i i ni i a x x W xx ∑∑,可以证明,在原假设成立,即总体分布为正态分布时,W 的值应该接近1,因此在显著性水平α下,如果统计量W 的值小于其α分位数,则拒绝原假设,即拒绝域为{}W W α≤. 例7.4.6 略。
正态总体参数假设检验
嘉兴学院
第七章 假设检验
第18页
7.2.2 两个正态总体均值差的检验 检验 法 u检 验 t检 验 条 件 原假 设 备择 假设 检验统 计量 拒绝域
已 知
未 知
嘉兴学院
16 July 2012
第七章 假设检验
第19页
大样 本检 u验 近似 t检 验
未知 m,n充 分大 未知 m,n不 很大
16 July 2012
嘉兴学院
第七章 假设检验
第4页
(a)
16 July 2012
(b)
(c)
嘉兴学院
第七章 假设检验
第5页
该检验用 u 检验统计量,故称为u 检验。 下面以 由 为例说明: 可推出具体的拒绝域为
该检验的势函数是 的函数,它可用正态分布 写出,具体为
16 July 2012
16 July 2012
16.2 16.4 15.8 15.5 16.7 15.6 15.8 15.9 16.0 16.4 16.1 16.5 15.8 15.7 15.0
嘉兴学院
第七章 假设检验
第30页
这是两正态总体方差之比的双侧假设检验问题, 待检假设为 此处 m=7,n=8,经计算
于是 查表知 ,若取 =0.05,
通常 , 均未知,记 , 分别是由 算得的 的无偏估计和由 算得的 的无偏估计.
16 July 2012
嘉兴学院
第七章 假设检验
第28页
可建立检验统计量: 三种检验问题对应的拒绝域依次为
或
16 July 2012
}。
嘉兴学院
第七章 假设检验
第29页
例7.2.5 甲、乙两台机床加工某种零件,零件 的直径服从正态分布,总体方差反映了加工 精度,为比较两台机床的加工精度有无差别, 现从各自加工的零件中分别抽取7件产品和8 件产品,测得其直径为 X (机 床甲) Y (机 床乙)
统计学第四版第7章假设检验(简)总结
~ 2 n 1
2 n 1 s 当H 为真时,统计量 2
2 n 1 s 20 10.0042 2 统计量的值 31.92
2
0.0025
2 0.10, 查 2分布表得 02.05 ( 19) 30.14, 0 19 10.12 .95
假设检验分为两类:参数检验、非参数检验/自
由分布检验
2
例1
消费者协会接到消费者投诉,指控品牌纸包装饮
料存在容量不足,有欺骗消费者之嫌。包装上标 明的容量为250毫升。消费者协会从市场上随机抽 取50盒该品牌纸包装饮品,测试发现平均含量为 248毫升,小于250毫升。这是生产中正常的波动, 还是厂商的有意行为?消费者协会能否根据该样 本数据,判定饮料厂商欺骗了消费者呢?
提出原假设和备择假设→根据抽样分布,计算样本统 计量→选择显著性水平α ,查表确定临界值→判断并 得出结论。
8
第一步:确定原假设与备择假设
: =255;
:
≠250
原假设H0:通常是研究者 想收集证据予以反对的假 设,也称为零假设
备择假设H1:通常是研究 者想收集证据予以支持的 假设,也称为研究假设。
3
例2
一种罐装饮料采用自动生产线生产,每罐
的容量是255ml,标准差为5ml。为检验每罐
容量是否符合要求,质检人员在某天生产
的饮料中随意抽取了40罐进行检验,测得每
罐平均容量为255.8ml。检验该天生产的饮
料容量是否符合标准要求。
4
例3
根据过去大量资料,某厂生产的产品的使
用寿命服从正态分布N(1020,1002)。现
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U
X 0
n
N (0,1)
(3)对于给定的显著性水平α=0.05 ,查标准正态分布表 u u0.025 1.96 W1 (, u ) (u , )
2
(4)计算统计量观察值
x 0 1637 1600 u 1.258 n 150 26
2
2
(5)结论 u 1.258 u 1.96
当μ= μ0时,统计量U服从标准正态分布N(0,1)。对 于给定的显著性水平α,有
(1) H0:μ= μ0,H1:μ≠μ0;检验规则为 当 当
U | X 0 |
n
u 时,拒绝H0
2
U
| X 0 |
μ≤μ0,H1:μ>μ0;检验规则为 X 0 当 U u 时,拒绝H0 n X 0 当 U u 时,接受H0 n
选取统计量
2
(n 1) S 2
2
当H0为真时,服从自由度为n-1的χ2分布。对于给
定的显著性水平α,有
(1) H0:σ2=σ02,H1:σ2≠σ02 ;检验规则为
2 2 或 当 (n 1) (n 1) 时,拒绝H0
2
2
1
2
2
当
2 2 (n 1) 2 (n 1) 时,接受H0 1 2 2
7.2 正态总体下参数的假设检验
一、单个正态总体下参数的假设检验 对于一个正态总体均值的检验,常见的有 以下三种类型:
(1) H0:μ= μ0,H1:μ≠μ0;
(2) H0:μ≤ μ0,H1:μ>μ0;
双边假设检验
(3) H0:μ≥ μ0,H1:μ<μ0;
单边假设检验
1、总体方差σ2已知,正态总体的均值检验 X 0 U 构造检验统计量 n
X 0 对于给定的显著性水平α=0.05 , S n t (n 1) t0.025 (8) 2.3060
2
2 S 12.5 x 21 (4)由题意,计算得到样本均值和样本方差分别为 x 0 21 18 2.55 计算统计量观察值 t S n 12.5 9 (5)由于 t 2.55 t (n 1) 2.3060 所以拒绝原假设H0,而接受H1,
(3) H0:μ≥ μ0,H1:μ<μ0;检验规则为 当 T 当 T
X 0 S n t (n 1) 时,拒绝H0
X 0 S n
t (n 1) 时,接受H0
例7.6 某地区青少年犯罪年龄构成服从正态分布,现随机抽取9 名罪犯,其年龄如下: 22,17,19,25,25,18,16,23,24 试以95%的概率判断犯罪青少年的平均年龄是否为18岁。 解 (1)提出原假设: H0:μ=18,H1:μ≠18; (2)选取统计量 T (3)查t分布表得
(3) H0:μ≥μ0,H1:μ<μ0;检验规则为 当 U 当 U
X 0
n
u 时,拒绝H0
X 0
n
u 时,接受H0
例7.4 设某产品的某项质量指标服从正态分布,已知它的标准差 σ=150,现从一批产品中随机地抽取26个,测得该项指标的平均 值为1637。问能否认为这批产品的该项指标值为1600(α=0.05) ? 解 (1)提出原假设: H0:μ=1600,H1:μ≠1600; (2)选取统计量
即认为这批罐头细菌含量大于62.0,质量不符合标准。
3、正态总体方差的检验
常见的正态总体方差的假设检验有以下三种类 型: (1) H0:σ2=σ02,H1:σ2≠σ02 ; (2) H0:σ2≤σ02,H1:σ2>σ02; (3) H0:σ2≥σ02,H1:σ2<σ02。 单边假设检验 双边假设检验
(1) H0:μ= μ0,H1:μ≠μ0;检验规则为
当 T 当 T
| X 0 | S n t (n 1) 时,拒绝H0
2
| X 0 | S n
t (n 1) 时,接受H0
2
(2) H0:μ≤ μ0,H1:μ>μ0;检验规则为 X 0 当 T t (n 1) 时,拒绝H0 S n X 0 当 T t (n 1) 时,接受H0 S n
(3)查χ2分布表得
2 2 (n 1) 0.01 (19) 36.191
(4)由题意,S=0.015,计算统计量观察值
2
(n 1) S 2
2
(20 1) 0.0152 42.75 2 0.01
2 (5)由于 2 42.75 (n 1) 36.191所以拒绝原假设H0,而接受H1,
即认为这批玻璃花瓶折射率的标准差显著地超过了标准,该超市 应该拒绝接受这批花瓶。
(2) H0:σ2≤σ02,H1:σ2>σ02;检验规则为
当 当
2 2 (n 1)
时,拒绝H0 时,接受H0
2 2 (n 1)
(3) H0:σ2≥σ02,H1:σ2<σ02;检验规则为 当 当
2
2 1
(n 1) 时,拒绝H0
2 12 (n 1) 时,接受H0
即能以95%的把握推断该地区青少年犯罪的平均年龄不是18岁。
2
例7.7 食品罐头的细菌含量按规定标准不能大于62.0,现从一批罐 头中抽取9个,检验其细菌含量,经计算得样本均值为62.5,样本 标准差为0.3。问这批罐头的质量是否完全符合标准(α=0.05 )? (设罐头的细菌含量服从正态分布 ) 解 (1)由题意建立假设: H0:μ≤62.0,H1:μ>62.0; (2)选取统计量T
(5)由于 u 2 u 1.65 所以拒绝原假设H0,而接受H1, 即说明用新方法所需时间比用老方法所需时间短。
2、总体方差σ2未知,正态总体的均值检验
由于总体方差σ2未知,故选取统计量
X 0 T S n
当μ= μ0时,统计量T服从自由度为n-1的t分布。对
于给定的显著性水平α,有
2
接受原假设H0
即不能否定这批产品该项指标为1600。
例7.5 完成生产线上某件工作的平均时间不少于15.5分钟,标准 差为3分钟。对随机抽取的9名职工讲授一种新方法,训练期结束 后,9名职工完成此项工作的平均时间为13.5分钟。这个结果是 否说明用新方法所需时间比用老方法所需时间短?设α=0.05,并 假定完成这件工作的时间服从正态分布。 解(单边检验问题)(1)提出原假设H0:μ≥15.5,H1μ<15.5;
例7.8一家超市从生产玻璃器皿的厂家订购了一批玻璃花瓶,要 求其折射率的标准差不能超过0.01。货到后,随机抽出一个容量 为20的花瓶的样本进行检查,发现样本折射率的标准差为0.015。 试问在α=0.01的条件下,该超市应该是接受还是拒绝这批玻璃花 瓶? 解 (1)由题意建立假设: H0:σ2≤0.012,H1:σ2>0.012 2 ( n 1 ) S 对于给定的显著性水平α=0.01 , (2)选取统计量 2 2
X 0 对于给定的显著性水平α=0.05 , S n (3)查t分布表得 t (n 1) t0.05 (8) 1.8595
(4)由题意, x 62 .5 S 0.3 计算统计量观察值 x 0 62.5 62.0 t 5 S n 0.3 9 (5)由于
t 5 t (n 1) 1.8595 所以拒绝原假设H0,而接受H1,
X 0 (2)选取统计量 U n
(3)查标准正态分布表
对于给定的显著性水平α=0.05 ,
W1 (, 1.645)
u u0.05 1.645,
(4)计算统计量观察值 x 0 13.5 15.5 u 2 n 3 9
已知n=9,σ=3,
x 13.5