09概统8假设检验

合集下载

概率论第八章 假设检验

概率论第八章  假设检验

S 0.3
t
计算统计量观察值
x 0 62.5 62.0 5 S n 0.3 9
由于
t 5 t (n 1) 1.8595
所以拒绝原假设H0,而接受H1,
即认为这批罐头细菌含量大于62.0,质量不符合标准。
2、区间估计与假设检验的关系
抽样估计与假设检验都是统计推断的重要内容。参数 估计是根据样本统计量估计总体参数的真值;假设 检验是根据样本统计量来检验对总体参数的先验假 设是否成立。
备择假设H1:μ≠48,
例7.2中,H0:μ1= μ2, H1:μ1≠ μ2
例7.3中,H0:X~N(μ,σ2),H1:X不服从正态分 布
问题:设总体X~N(μ,σ2),已知其中σ=σ0, (x1,x2,…,xn)是X的样本,要检验 H0:μ=μ0,(μ0是一个已知常数) ,H1:μ≠ μ0
1、检验方法 总体X~N(μ,σ2) ,要检验μ是否为μ0,而μ是未知的.我们知道μ的无 X ,样本均值 X 的大小在一定程度上反映了 偏估计是 μ的大小,因此,当H0为真时,即μ=μ0时, X 的观察值 x 与μ0的偏差 | x 0 | 一般不应太大。如果 | x 0 | 过分大, 我们就应怀疑假设H0的正确性并拒绝H0,而| x 0 | 的大小, | x 0 | 可归结为统计量 的大小。 0 n
解:提出假设: H0: = 1000 H1: 1000 已知:n = 16,σ=50,
例7.2 为了研究饮酒对工作能力的影响,任选19名工人分 成两组,一组工人工作前饮一杯酒,一组工人工作前不饮 酒,让他们每人做一件同样的工作,测得他们的完工时间 (单位:分钟)如下: 饮酒者 30 46 51 34 48 45 39 61 58 67

第8 假设检验(共80张PPT)

第8 假设检验(共80张PPT)
第 8 章 假设检验
8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。

由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。

概率论与数理统计第八章假设检验

概率论与数理统计第八章假设检验

较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用表示. 如假 H 0:设 0,小概率 P {X 事 0u 件 } 为
查找 0 .9得 5 表分 中 xz0 位 .0 51 .6 点 4现 5 x010.4 6 1301 5 7.4 6 10
当Zz时拒H绝 0,Z
x0
1071.42.78 81
z
1.645
n
在 拒 绝 域,拒 内绝H0 ,接 受H1,即 抗 拉 强 度 提
(另:P182 例2 Z检验,单侧)
第二节 正态总体均值的假设 检验
单个正态总体 均值的检验 两个正态总体均值差的检验 小结
一、单个总体 N ( , 2 ) 参数的检验 设 X ~ N ( 总 ,2 ) 样 ; ( X 体 1 ,X 2 , 本 ,X n )
1.2已知, 未知,检 验
(1)检H 验 0:0;备 择H 1 检 :验 0 检 验, 水双 平侧 检 验
假设进行 即判 判假 断 断 H 设 0:0;备择H 假 1:设 0
小概率 :样 事本 件 X 与 均 是所 值假设 0相的 X 差 期 0 望
不能,若 太相 大差太 H 0 大则拒绝
小概P 率 {X 事 0件 u}
u 是 2
所选取合适U 的的 2统 分 计位 量点
2
1
P{X0u}x0u为拒绝 2 区域
z z 0 . 0 , 2 ( z 0 . 0 5 ) 2 P ( Z 5 z 0 . 0 ) 2 1 5 P ( Z z 0 . 0 ) 2 1 5 0 . 0 0 . 2 95 7 2 分位点的定义

概率论第八章假设检验

概率论第八章假设检验
概率论第八章假设检验
8.1假设检验的基本思想与步骤
数理统计的主要任务是从样本出发,对总体的分布 作出推断。作推断的方法,主要有两种,一种是上一章 讲的参数估计,另一种是假设检验。
例7.1 某厂生产合金钢,其抗拉强度X(单位:kg/mm2) 可以认为服从正态分布N(μ,σ2)。据厂方说,抗拉强度的 平均值μ=48。现抽查5件样品,测得抗拉强度为
②.区间估计立足于大概率,通常以较大的把握程度(
置信水平)1-α去保证总体参数的置信区间。而假设
检验立足于小概率,通常是给定很小的显著性水平
α202去1/2/4检验对总体1 参数的先验假设是否成立。
19
(2)区间估计与假设检验的联系
①.区间估计与假设检验都是根据样本信息对总 体参数进行推断,都是以抽样分布为理论依据 ,都是建立在概率基础上的推断,推断结果都 有一定的可信程度或风险。
其平均重量为991克。已
知这种产品重量服从标
准差为50克的正态分布
。试确定这批产品的包
装 重 量 是 否 合 格 ? (α=
0.05)
2021/2/4
1
双侧检验!
香 脆 蛋 卷 22
用置信区间进行检验(例题分析)
解:提出假设:
置信区间为
H0: = 1000
H1: 1000
已知:n = 16,σ=50,
2
即能以95%的把握推断该地区青少年犯罪的平均年龄不是18岁。
2021/2/4
1
17
例7.7 食品罐头的细菌含量按规定标准必须小于62.0,现从一批罐 头中抽取9个,检验其细菌含量,经计算得样本均值为62.5,样本 标准差为0.3。问这批罐头的质量是否完全符合标准(α=0.05 )? (设罐头的细菌含量服从正态分布 )

大学课件概率论第8章假设检验

大学课件概率论第8章假设检验

:
2
2 0
.
(2)找统计量。
2 1 n
2 0 i1
Xi X
2 ~ 2
n 1
3求临界值。
对给定的 0.05,查自由度为n 1 4
的 2分布表得
2 1
n
1
2 0.975
4
11.143
2
2
n
1
2 0.025
4
0.484
2
(4)求观察值
x 1 1.32 1.55 1.36 1.40 1.44 1.414
112.82
1.1362
t txx00 112.8 112.6 0.4657
SSn* / nn 1.136 / 7
5作出判断,因为 t 0.4657 2.447,所以接受H0,
即用热敏电阻测温仪间接测量温度可以认为无系统偏差。
表8.1 单个正态总体均值的假设检验的拒绝域
(显著性水平为 )
112.0,113.4,111.2,114.5,112.5,112.9,113.6 而用某种精确方法测量温度的真值μ0=112.6,现问 用热敏电阻测温仪间接测量温度有无系统偏差?设 显著性水平α=0.05。
解: (1)提出假设,H0:μ=μ0=112.6
(2)找统计量。
t X 0 ~ t(n 1)
对给定的显著水平 0 1,由t分布表查得
临界值,使
P
t
t1- 2
4、求观察值
根据所给的样本算出统 计量t的观察值t1。
5、作出判断
若 t1
t1
,则接受H

0
2
若 t1
t1,则拒绝H

0
2
这种检验方法称为t检验法。

概率论与数理统计第八章假设检验

概率论与数理统计第八章假设检验
当总体分布函数完全未知或只知其形式、但 不知其参数的情况,为推断总体的性质,提出 某些关于总体的假设。
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.

《概率论与数理统计》第八章1假设检验的基本概念

《概率论与数理统计》第八章1假设检验的基本概念
单侧检验 H0 : 0 1000, H1 : 1000
2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .

以,原假
设H
不正确
0

对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量

概率论与数理统计第八章假设检验习题解答

概率论与数理统计第八章假设检验习题解答

1.[一]某批矿砂的5个样品中的镍含量,经测定为(%)3.25 3.27 3.24 3.26 3.24。

设测定值总体服从正态分布,问在α = 0.01下能否接受假设:这批矿砂的含镍量的均值为3.25.解:设测定值总体X~N (μ,σ 2),μ,σ 2均未知步骤:(1)提出假设检验H 0:μ=3.25; H 1:μ≠3.25 (2)选取检验统计量为)1(~25.3--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α(4)n=5, α = 0.01,由计算知01304.0)(11,252.3512=--==å=i iX Xn S x查表t 0.005(4)=4.6041, )1(343.0501304.025.3252.3||2-<=-=n t t α(5)故在α = 0.01下,接受假设H 02.[二] 如果一个矩形的宽度ω与长度l 的比618.0)15(21»-=l ω,这样的矩形称为黄金矩形。

这种尺寸的矩形使人们看上去有良好的感觉。

现代建筑构件(如窗架)、工艺品(如图片镜框)、甚至司机的执照、商业的信用卡等常常都是采用黄金矩型。

下面列出某工艺品工厂随机取的20个矩形的宽度与长度的比值。

设这一工厂生产的矩形的宽度与长短的比值总体服从正态分布,其均值为μ,试检验假设(取α = 0.05)H 0:μ = 0.618H 1:μ≠0.6180.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933. 解:步骤:(1)H 0:μ = 0.618; H 1:μ≠0.618 (2)选取检验统计量为)1(~618.0--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α (4)n=20 α = 0.05,计算知0925.0)(11,6605.01121=--===åå==ni ini ix xn S xnx ,)1(055.2200925.0618.06605.0||,0930.2)1(22-<=-==-n t t n t αα(5)故在α = 0.05下,接受H 0,认为这批矩形的宽度和长度的比值为0.6183.[三] 要求一种元件使用寿命不得低于1000小时,今从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时,已知这种元件寿命服从标准差为σ =100小时的正态分布。

统计学 第8章 假设检验 教学课件ppt

统计学 第8章  假设检验 教学课件ppt
2. 一般来说,发生哪一类错误的后果更为严重,就应 该首要控制哪类错误发生的概率。但由于犯第Ι类错 误的概率是可以由研究者控制的,因此在假设检验 中,人们往往先控制第Ι类错误的发生概率
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。

统计学第8章假设检验

统计学第8章假设检验

市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。

自考-概率论与数理统计 第八章 假设检验

自考-概率论与数理统计 第八章  假设检验

双侧检验与单侧检验 (假设的形式)
研究的问题
假设 双侧检验 左侧检验 右侧检验
H0 H1
= 0 ≠0
0 < 0
0 > 0
双侧检验
(原假设与备择假设的确定)
1. 2.
3.

双侧检验属于决策中的假设检验。也就是说, 不论是拒绝 H0 还是接受 H0 ,我们都必需采 取相应的行动措施 例如,某种零件的尺寸,要求其平均长度为 10厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为 H0: 10 H1: 10
必是原假设不成立.
| X 10 | 的大小可以用来检验原假设是否成立.
合理的思路是找出一个界限K,
当 | X 10 | K 时,我们就接受原假设 H0. 当 | X 10 | K 时,我们就拒绝原假设 H0.
这里的问题是,我们如何确定常数K呢 细致的分析:
由于
X 要作出某种判断,必须从样 本(X1,X2,...,Xn)出发制定一个法则,一旦样本观察 值(x1,x2,...,xn)确定,可利用所构造的法则作出判断: 拒绝H0还是拒绝H1.这种法则称为H0对H1的一个检验 法则,简称为一个检验法则,或一个检验.
• 检验法则本质上就是把样本空间划分为两个互不相 交的子集C和C*,使得当样本(X1,X2,...,Xn)的观察值 (x1,x2,...,xn)∈C时,将拒绝原假设H0,若(x1,x2,...,xn)∈C*, 则接受原假设.这样的划分构成一个准则,称样本空间 的子集C为检验的临界域(或拒绝域).
小概率事件在一次实验中发生了,故假设不合情理, 即:否定原假设,简便方法测得均值有系统偏差.
8.1.2统计假设的概念

概率论与数理统计第八章 假设检验

概率论与数理统计第八章 假设检验

第八章假设检验第一节概述统计推断中的另一类重要问题是假设检验(Hypothesis testing).当总体的分布函数未知,或只知其形式而不知道它的参数的情况时,我们常需要判断总体是否具有我们所感兴趣的某些特性.这样,我们就提出某些关于总体分布或关于总体参数的假设,然后根据样本对所提出的假设作出判断:是接受还是拒绝.这就是本章所要讨论的假设检验问题.我们先从下面的例子来说明假设检验的一般提法.例8.1某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X服从正态分布N(μ,σ2).根据长期的经验知其标准差σ=0.015(kg).为检验某台包装机的工作是否正常;随机抽取包装的奶粉9袋,称得净重(单位:kg)为0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524问该包装机的工作是否正常?由于长期实践表明标准差比较稳定,于是我们假设X~N(μ,0.0152).如果奶粉重量X 的均值μ等于0.5kg,我们说包装机的工作是正常的.于是提出假设:H0:μ=μ0=0.5;H1:μ≠μ0=0.5.这样的假设叫统计假设.1.统计假设关于总体X的分布(或随机事件之概率)的各种论断叫统计假设,简称假设,用“H”表示,例如:(1)对于检验某个总体X的分布,可以提出假设:H0:X服从正态分布,H1: X不服从正态分布.H0:X服从泊松分布,H1: X不服从泊松分布.(2)对于总体X的分布的参数,若检验均值,可以提出假设:H0:μ=μ0;H1:μ≠μ0.H0:μ≤μ0;H1:μ>μ0.若检验标准差,可提出假设:H0:σ=σ0;H1:σ≠σ0.H0:σ≥σ0;H1:σ<σ0.这里μ0,σ0是已知数,而μ=E(X),σ2=D(X)是未知参数.上面对于总体X的每个论断,我们都提出了两个互相对立的(统计)假设:H0和H1,显然,H0与H1只有一个成立,或H0真H1假,或H0假H1真,其中假设H0,称为原假设(Original hypothesis)(又叫零假设、基本假设),而H1称为H0的对立假设(又叫备择假设).在处理实际问题时,通常把希望得到的陈述视为备择假设,而把这一陈述的否定作为原假设.例如在上例中,H0:μ=μ0=0.5为原假设,它的对立假设是H1:μ≠μ0=0.5.统计假设提出之后,我们关心的是它的真伪.所谓对假设H0的检验,就是根据来自总体的样本,按照一定的规则对H0作出判断:是接受,还是拒绝,这个用来对假设作出判断的规则叫做检验准则,简称检验,如何对统计假设进行检验呢?我们结合上例来说明假设检验的基本思想和做法.2.假设检验的基本思想 在例8.1中所提假设是H 0:μ=μ0=0.5(备择假设H 1:μ≠μ0).由于要检验的假设涉及总体均值μ,故首先想到是否可借助样本均值这一统计量来进行判断.从抽样的结果来看,样本均值x =19(0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524)=0.5110,与μ=0.5之间有差异.对于与μ0之间的差异可以有两种不同的解释.(1) 统计假设H 0是正确的,即μ=μ0=0.5,只是由于抽样的随机性造成了与μ0之间的差异;(2) 统计假设H 0是不正确的,即μ≠μ0=0.5,由于系统误差,也就是包装机工作不正常,造成了与μ0之间的差异.对于这两种解释到底哪一种比较合理呢?为了回答这个问题,我们适当选择一个小正数α(α=0.1,0.05等),叫做显著性水平(Level of significance).在假设H0成立的条件下,确定统计量X -μ0的临界值αλ,使得事件{|X -μ0|>αλ}为小概率事件,即P{|X -μ0|>αλ}=α.(8.1)例如,取定显著性水平α=0.05.现在来确定临界值λ0.05.因为X ~N (μ,σ2),当H 0:μ=μ0=0.5为真时,有X ~N (μ0,σ2),于是2011~,n i i X X N n n σμ=⎛⎫= ⎪⎝⎭∑,ZX X =N (0,1),所以 P {|Z |>z α/2}=α.由(8.1)式,有P Z ⎧>⎨⎩=α,因此22,z z αααλ==λ0.05=z 0.0250.015/3=0.0098. 故有P {|X -μ0|>0.0098}=0.05.因为α=0.05很小,根据实际推断原理,即“小概率事件在一次试验中几乎是不可能发生的”原理,我们认为当H 0为真时,事件{|X -μ0|>0.0098}是小概率事件,实际上是不可能发生的.现在抽样的结果是|x -μ0|=|0.5110-0.5|=0.0110>0.0098.也就是说,小概率事件{|X -μ0|>0.0098}居然在一次抽样中发生了,这说明抽样得到的结果与假设H 0不相符,因而不能不使人怀疑假设H 0的正确性,所以在显著性水平α=0.05下, 我们拒绝H 0,接受H 1,即认为这一天包装机的工作是不正常的.通过上例的分析,我们知道假设检验的基本思想是小概率事件原理,检验的基本步骤是: (1) 根据实际问题的要求,提出原假设H 0及备择假设H 1;(2) 选取适当的显著性水平α(通常α=0.10,0.05等)以及样本容量n ;(3) 构造检验用的统计量U ,当H 0为真时,U 的分布要已知,找出临界值αλ使P {|U |>αλ}=α.我们称|U |>αλ所确定的区域为H 0的拒绝域(Rejection region),记作W ; (4) 取样,根据样本观察值,计算统计量U 的观察值U 0;(5) 作出判断,将U 的观察值U 0与临界值αλ比较,若U 0落入拒绝域W 内,则拒绝H 0接受H 1;否则就说H 0相容(接受H 0).3.两类错误由于我们是根据样本作出接受H 0或拒绝H 0的决定,而样本具有随机性,因此在进行判断时,我们可能会犯两个方面的错误:一类错误是,当H 0为真时,而样本的观察值U 0落入拒绝域W 中,按给定的法则,我们拒绝了H 0,这种错误称为第一类错误.其发生的概率称为犯第一类错误的概率或称弃真概率,通常记为α,即P {拒绝H 0|H 0为真}=α;另一种错误是,当H 0不真时,而样本的观察值落入拒绝域W 之外,按给定的检验法则,我们却接受了H 0.这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或取伪概率,通常记为β,即P {接受H 0|H 0不真}=β.显然这里的α就是检验的显著性水平.总体与样本各种情况的搭配见表8-1.表8-1对给定的一对H 0和H 1,总可以找到许多拒绝域W .当然我们希望寻找这样的拒绝域W ,使得犯两类错误的概率α与β都很小.但是在样本容量n 固定时,要使α与β都很小是不可能的,一般情形下,减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的关系犹如区间估计问题中置信水平与置信区间的长度的关系那样.通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平α(0<α<1),而使犯第二类错误的概率也尽可能地小.具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于α,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验.在一般情况下,显著性检验法则是较容易找到的,我们将在以下各节中详细讨论.在实际问题中,要确定一个检验问题的原假设,一方面要根据问题要求检验的是什么,另一方面要使原假设尽量简单,这是因为在下面将讲到的检验法中,必须要了解某统计量在原假设成立时的精确分布或渐近分布.下面各节中,我们先介绍正态总体下参数的几种显著性检验,再介绍总体分布函数的假设检验.第二节 单个正态总体的假设检验1.单个正态总体数学期望的假设检验(1) σ2已知关于μ的假设检验(Z 检验法(Z -test)) 设总体X ~N (μ,σ2),方差σ2已知,检验假设H 0:μ=μ0;H 1:μ≠μ0 (μ0为已知常数) 由X ~N (μ,n σ)X N (0,1), 我们选取ZX (8.2)作为此假设检验的统计量,显然当假设H 0为真(即μ=μ0正确)时,Z ~N (0,1),所以对于给定的显著性水平α,可求z α/2使P {|Z |>z α/2}=α,见图8-1,即P {Z <-z α/2}+P {Z >z α/2}=α.从而有P {Z >z α/2}=α/2, P {Z ≤z α/2}=1-α/2.图8-1利用概率1-α/2,反查标准正态分布函数表,得双侧α分位点(即临界值)z α/2. 另一方面,利用样本观察值x 1,x 2,…,x n 计算统计量Z 的观察值z 0x (8.3)如果:(a )|z 0|>z α/2,则在显著性水平α下,拒绝原假设H 0(接受备择假设H 1),所以|z 0|>z α/2便是H0的拒绝域.(b ) |z 0|≤z α/2,则在显著性水平α下,接受原假设H 0,认为H 0正确.这里我们是利用H0为真时服从N (0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为Z 检验法(或称U 检验法).例8.1中所用的方法就是Z 检验法.为了熟悉这类假设检验的具体作法,现在我们再举一例.例8.2 根据长期经验和资料的分析,某砖厂生产的砖的“抗断强度”X 服从正态分布,方差σ2=1.21.从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg ·cm -2):32.56 29.66 31.64 30.00 31.87 31.03检验这批砖的平均抗断强度为32.50kg ·cm -2是否成立(取α=0.05,并假设砖的抗断强度的方差不会有什么变化)?解 ① 提出假设H 0:μ=μ0=32.50;H 1:μ≠μ0. ② 选取统计量ZX ,若H 0为真,则Z ~N (0,1).③ 对给定的显著性水平α=0.05,求z α/2使P {|Z |>z α/2}=α,这里z σ/2=z 0.025=1.96.④ 计算统计量Z 的观察值:|z 0| ≈3.05.⑤ 判断:由于|z 0|=3.05>z 0.025=1.96,所以在显著性水平α=0.05下否定H 0,即不能认为这批产品的平均抗断强度是32.50 kg ·cm -2.把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值μ的检验步骤: (a ) 提出待检验的假设H 0:μ=μ0;H 1:μ≠μ0. (b ) 构造统计量Z ,并计算其观察值z 0:ZX ,z 0x(c ) 对给定的显著性水平α,根据P {|Z |>z α/2}=α,P {Z >z α/2}=α/2,P {Z ≤z α/2}=1-α/2查标准正态分布表,得双侧α分位点z α/2. (d ) 作出判断:根据H 0的拒绝域 若|z 0|>z α/2,则拒绝H 0,接受H 1; 若|z 0|≤z α/2,则接受H 0.(2) 方差σ2未知,检验μ(t 检验法(t -test)) 设总体X ~N (μ,σ2),方差σ2未知,检验H 0:μ=μ0;H 1:μ≠μ0.由于σ2X 便不是统计量,这时我们自然想到用σ2的无偏估计量——样本方差S 2代替σ2,由于X t (n -1),故选取样本的函数tX (8.4)图8-2作为统计量,当H 0为真(μ=μ0)时t ~t (n -1),对给定的检验显著性水平α,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2,见图8-2,直接查t 分布表,得t 分布分位点t α/2(n -1).利用样本观察值,计算统计量t 的观察值t 0x 因而原假设H0的拒绝域为|t 0|>t α/2(n -1). (8.5)所以,若|t 0|>t α/2(n -1),则拒绝H 0,接受H 1;若|t 0|≤t α/2(n -1),则接受原假设H 0.上述利用t 统计量得出的检验法称为t 检验法.在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题.例8.3 用某仪器间接测量温度,重复5次,所得的数据是1250°,1265°,1245°,1260°,1275°,而用别的精确办法测得温度为1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?这里假设测量值X 服从N (μ,σ2)分布. 解 问题是要检验H 0:μ=μ0=1277;H 1:μ≠μ0.由于σ2未知(即仪器的精度不知道),我们选取统计量tX .当H 0为真时,t ~t (n -1),t 的观察值为|t 0|185.399-==>3.对于给定的检验水平α=0.05,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2, P {t >t 0.025(4)}=0.025,查t 分布表得双侧α分位点t α/2(n -1)=t 0.025(4)=2.776.因为|t 0|>3>t 0.025(4)=2.776,故应拒绝H 0,认为该仪器间接测量有系统偏差.(3) 双边检验与单边检验上面讨论的假设检验中,H 0为μ=μ0,而备择假设H 1:μ≠μ0意思是μ可能大于μ0,也可能小于μ0,称为双边备择假设,而称形如H 0:μ=μ0,H 1:μ≠μ0的假设检验为双边检验.有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H 0:μ=μ0;H 1:μ>μ0. (8.6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8.6)的假设检验,称为右边检验,类似地,有时我们需要检验假设H 0:μ=μ0;H 1:μ<μ0. (8.7)形如(8.7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验.下面来讨论单边检验的拒绝域. 设总体X ~N (μ,σ2),σ2为已知,x 1,x 2,…,x n 是来自X 的样本观察值.给定显著性水平α,我们先求检验问题H 0:μ=μ0;H 1:μ>μ0.的拒绝域.取检验统计量ZX ,当H 0为真时,Z 不应太大,而在H 1为真时,由于X 是μ的无偏估计,当μ偏大时,X 也偏大,从而Z 往往偏大,因此拒绝域的形式为ZX ≥k ,k 待定.因为当H 0X ~N (0,1),由P {拒绝H 0|H 0为真}=PX k ⎫≥⎬⎭=α得k =z α,故拒绝域为ZX ≥z α. (8.8)类似地,左边检验问题H 0:μ=μ0;H 1:μ<μ0.的拒绝域为ZX ≤-z α. 8.9)例8.4 从甲地发送一个信号到乙地,设发送的信号值为μ,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N (0,22),从而乙地接到的信号值是一个服从正态分布N (μ,22)的随机变量.设甲地发送某信号5次,乙地收到的信号值为: 8.4 10.5 9.1 9.6 9.9由以往经验,信号值为8,于是乙方猜测甲地发送的信号值为8,能否接受这种猜测?取α=0.05.解 按题意需检验假设H 0:μ=8;H 1:μ>8.这是右边检验问题,其拒绝域如(8.8)式所示, 即 Z =X ≥z 0.05=1.645.而现在z 0=1.68>1.645,所以拒绝H 0,认为发出的信号值μ>8.2.单个正态总体方差的假设检验(2χ检验法(2χ-test)) (1) 双边检验设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2=σ02;H 1:σ2≠σ2.其中σ02为已知常数.由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值22S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时2χ=220(1)n S σ-~2χ(n -1). (8.10)所以对于给定的显著性水平α有(图8-3)图8-3P {21/2αχ-(n -1)≤2χ≤2/2αχ(n -1)}=1-α. (8.11)对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2/2αχ(n -1).由(8.11)知,H 0的接受域是21/2αχ- (n -1)≤2χ≤2/2αχ (n -1); (8.12)H 0的拒绝域为2χ<21/2αχ-(n -1)或2χ>2/2αχ(n -1). (8.13)这种用服从2χ分布的统计量对个单正态总体方差进行假设检验的方法,称为2χ检验法. 例8.5 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?解 本题要求在α=0.02下检验假设H 0:σ2=5000;H 1:σ2≠5000.现在n =26,2/2αχ(n -1)=20.01(25)χ=44.314,21/2αχ- (n -1)= 20.99(25)χ=11.524,σ02=5000.由(8.13)拒绝域为2σ>44.314或220(1)n s σ-<11.524由观察值s 2=9200得22(1)n s σ-=46>44.314,所以拒绝H 0,认为这批电池寿命的波动性较以往有显著的变化.(2) 单边检验(右检验或左检验) 设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2≤σ02;H 1:σ2>σ02.(右检验)由于X ~N (μ,σ2),故随机变量*2χ=22(1)n S σ-~2χ(n -1).当H 0为真时,统计量2χ=22(1)n S σ-≤*2χ.对于显著性水平α,有P {*2χ>2αχ(n -1)}=α图8-4(图8-4).于是有P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α.可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:2χ=22(1)n S σ->2αχ(n -1)(右检验). (8.14)类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ2的拒绝域为2χ<21αχ-(n -1)(左检验). (8.15) 例8.6 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02. (2) 选取统计量2χ=22(1)n S σ-.*2χ=22(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ(3) 对于显著性水平α=0.05,查2χ分布表得21αχ-(n -1)=20.95(24)χ=13.848,当H 0为真时,P {2χ<21αχ- (n -1)}≤P 2212(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭=α. 故拒绝域为2χ<21αχ- (n -1)=13.848.(4) 根据样本观察值计算2χ的观察值2χ=220(1)240.000660.0012n s σ-⨯==13.2.(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后生产的零件直径的方差小于革新前生产的零件直径的方差.最后我们指出,以上讨论的是在均值未知的情况下,对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为2χ=2120()nii Xμσ=-∑.当σ2=σ2为真时,2χ~2χ(n ).关于单个正态总体的假设检验可列表8-2.表8-2注:上表中H0中的不等号改成等号,所得的拒绝域不变.第三节两个正态总体的假设检验上一节介绍了单个正态总体的数学期望与方差的检验问题,在实际工作中还常碰到两个正态总体的比较问题.1.两正态总体数学期望假设检验(1)方差已知,关于数学期望的假设检验(Z检验法)设X~N(μ1,σ12),Y~N(μ2,σ22),且X,Y相互独立,σ12与σ22已知,要检验的是H0:μ1=μ2;H1:μ1≠μ2.(双边检验)怎样寻找检验用的统计量呢?从总体X 与Y 中分别抽取容量为n 1,n 2的样本X 1,X 2,…,1n X 及Y 1,Y 2,…,2n Y ,由于2111~,X N n σμ⎛⎫ ⎪⎝⎭,2222~,Y N n σμ⎛⎫⎪⎝⎭,E (X -Y )=E (X )-E (Y )=μ1-μ2, D (X -Y )=D (X )+D (Y )=221212n n σσ+,故随机变量X -Y 也服从正态分布,即X -Y ~N (μ1-μ2,221212n n σσ+).从而X Y ~N (0,1).于是我们按如下步骤判断.(a ) 选取统计量 ZX Y , (8.16)当H 0为真时,Z ~N (0,1).(b ) 对于给定的显著性水平α,查标准正态分布表求z α/2使P {|Z |>z α/2}=α,或P {Z ≤z α/2}=1-α/2. (8.17) (c ) 由两个样本观察值计算Z 的观察值z 0:z 0x y .(d ) 作出判断:若|z 0|>z α/2,则拒绝假设H 0,接受H 1; 若|z 0|≤z α/2,则与H 0相容,可以接受H 0.例8.7 A ,B 两台车床加工同一种轴,现在要测量轴的椭圆度.设A 车床加工的轴的椭圆度X ~N (μ1,σ12),B 车床加工的轴的椭圆度Y ~N (μ2,σ22),且σ12=0.0006(mm 2),σ22=0.0038(mm 2),现从A ,B 两台车床加工的轴中分别测量了n 1=200,n 2=150根轴的椭圆度,并计算得样本均值分别为=0.081(mm),=0.060(mm).试问这两台车床加工的轴的椭圆度是否有显著性差异?(给定α=0.05)解 ① 提出假设H 0:μ1=μ2;H 1:μ1≠μ2. ② 选取统计量ZX Y ,在H 0为真时,Z ~N (0,1).③ 给定α=0.05,因为是双边检验,α/2=0.025.P {|Z |>z α/2}=0.05, P {Z >z α/2}=0.025,P {Z ≤z α/2}=1-0.025=0.975.查标准正态分布表,得z α/2=z 0.025=1.96.④ 计算统计量Z 的观察值zz 0x y =.⑤ 作判断:由于|z 0|=3.95>1.96=z α/2,故拒绝H 0,即在显著性水平α=0.05下,认为两台车床加工的轴的椭圆度有显著差异.用Z 检验法对两正态总体的均值作假设检验时,必须知道总体的方差,但在许多实际问题中总体方差σ12与σ22往往是未知的,这时只能用如下的t 检验法.(2) 方差σ12,σ22未知,关于均值的假设检验(t 检验法) 设两正态总体X 与Y 相互独立,X ~N (μ1,σ12),Y ~N (μ2,σ22),σ12,σ22未知,但知σ12=σ22,检验假设H 0:μ1=μ2;H 1:μ1≠μ2.(双边检验) 从总体X ,Y 中分别抽取样本X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y ,则随机变量tX Y μμ---t (n 1+n 2-2),式中S w 2=22112212(1)(1)2n S n S n n -+-+-,S 12,S 22分别是X 与Y 的样本方差.当假设H 0为真时,统计量t ~t (n 1+n 2-2). (8.18)对给定的显著性水平α,查t 分布得t α/2(n 1+n 2-2),使得P {|t |>t α/2(n 1+n 2-2)}=α. (8.19)再由样本观察值计算t 的观察值t 0x y(8.20)最后作出判断:若|t 0|>t α/2(n 1+n 2-2),则拒绝H 0; 若|t 0|≤t α/2(n 1+n 2-2),则接受H 0.例8.8 在一台自动车床上加工直径为2.050毫米的轴,现在每相隔两小时,各取容量都为10的样本,所得数据列表如表8-3所示.12是未知常数.问这台自动车床的工作是否稳定?(取α=0.01)解 这里实际上是已知σ12=σ22=σ2,但σ2未知的情况下检验假设H 0:μ1=μ2;H 1:μ1≠μ2.我们用t 检验法,由样本观察值算得:x =2.063, y =2.059,s 12=0.00000956, s 22=0.00000489,s w 2=2212990.0000860.0000441010218s s ⨯+⨯+=+-=0.0000072.由(8.20)式计算得t 0=3.3.对于α=0.01,查自由度为18的t 分布表得t 0.005(18)=2.878.由于|t 0|=3.3>t 0.005(18)=2.878,于是拒绝原假设H 0:μ1=μ2.这说明两个样本在生产上是有差异的,可能这台自动车床受时间的影响而生产不稳定.2. 两正态总体方差的假设检验(F 检验法(F -test )) (1) 双边检验设两正态总体X ~N (μ1,σ12),Y ~N (μ2,σ22),X 与Y 独立,X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y 分别是来自这两个总体的样本,且μ1与μ2未知.现在要检验假设H 0:σ12=σ22;H 1:σ12≠σ22.在原假设H 0成立下,两个样本方差的比应该在1附近随机地摆动,所以这个比不能太大又不能太小.于是我们选取统计量F =2122S S . (8.21) 显然,只有当F 接近1时,才认为有σ12=σ22.由于随机变量F *=22112222//S S σσ ~F (n 1-1,n 2-1),所以当假设H 0:σ12=σ22成立时,统计量F =2122S S ~F (n 1-1,n 2-1). 对于给定的显著性水平α,可以由F 分布表求得临界值12a F-(n 1-1,n 2-1)与F α/2(n 1-1,n 2-1)使得 P { 12a F-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1)}=1-α(图8-5),由此可知H 0的接受区域是12aF-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1);而H 0的拒绝域为F <12a F-(n 1-1,n 2-1),或 F >F α/2(n 1-1,n 2-1).然后,根据样本观察值计算统计量F 的观察值,若F 的观察值落在拒绝域中,则拒绝H 0,接受H 1;若F 的观察值落在接受域中,则接受H 0.图8-5例8.9 在例8.8中我们认为两个总体的方差σ12=σ22,它们是否真的相等呢?为此我们来检验假设H 0:σ12=σ22(给定α=0.1).解 这里n 1=n 2=10,s 12=0.00000956,s 22=0.00000489,于是统计量F 的观察值为F =0.00000956/0.00000489=1.95.查F 分布表得F α/2(n 1-1,n 2-1)=F 0.05(9,9)=3.18,F 1-α/2(n 1-1,n 2-1)=F 0.95(9,9)=1/F 0.05(9,9)=1/3.18.由样本观察值算出的F 满足F 0.95(9,9)=1/3.18<F =1.95<3.18=F 0.05(9,9).可见它不落入拒绝域,因此不能拒绝原假设H 0:σ12=σ22,从而认为两个总体的方差无显著差异.注意:在μ1与μ2已知时,要检验假设H 0:σ12=σ22,其检验方法类同均值未知的情况,此时所采用的检验统计量是:F =12211122121()1()n i i n i i X n Y n μμ==--∑∑~F (n 1,n 2). 其拒绝域参看表8-4.表8-4(2) 单边检验可作类似的讨论,限于篇幅,这里不作介绍了.第四节总体分布函数的假设检验上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的χ检验法.假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2χ检验法是在总体的分布为未知时,根据样本值x1,x2,…,x n来检验关于总体所谓2分布的假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x)(8.22)的一种方法(这里的备择假设H1可不必写出).注意,若总体X为离散型,则假设(8.22)相当于H0:总体X的分布律为P{X=x i}=p i,i=1,2,…;(8.23)若总体X为连续型,则假设(8.22)相当于H0:总体X的概率密度为f(x). (8.24)在用2χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.2χ检验法的基本思想与方法如下:(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1ki i A ==Ω,A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率if n与概率ˆi p往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下ˆii f p n-的值应该比较小,基于这种想法,皮尔逊使用 2χ=21ˆ()ˆki i i if npnp =-∑ (8.25) 作为检验H 0的统计量,并证明了如下的定理.定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2χ分布,其中r 是被估计的参数的个数.(3) 对于给定的检验水平α,查表确定临界值2(1)k r αχ--使P {2χ>2(1)k r αχ--)}=α,从而得到H 0的拒绝域为2χ>2(1)k r αχ--).(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2(1)k r αχ--比较.(5) 作结论:若2χ>2(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.i =0.05)?解 由题意首先提出假设:H 0:总体X 服从泊松分布.P {X =i }=!e ii λλ-,i =0,1,2,…,这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得03614061ˆ+70100x λ⨯+⨯++⨯⨯===1.将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计111ˆˆ{}!!e e i p P X i i i --====,i =0,1,2,….例如10ˆˆ{0},e pP X -=== 11ˆˆ{1},e pP X -=== 12ˆˆ{2},2e pP X -=== ………………166701ˆˆˆ{7}11.!e i i i pP X p i -===≥=-=-∑∑ 计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故24221ˆ()~(411).ˆi i i i f npnp χχ=-=--∑计算结果为2χ=1.460(表8-6).因为220.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布. 表8-68-7).n =61ii f=∑=200.要求在给定的检验水平α=0.05下检验假设H 0:抗压强度X ~N (μ,σ2).解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.由第七章知,μ与σ2的极大似然估计值为ˆx μ=, 2211ˆ()ni i x x n σ==-∑. 设*i x 为第i 组的组中值,我们有*1195102052624514200i ii x x f n ⨯+⨯++⨯==∑=221,{}2*222211ˆ()(26)10(16)262414200i ii x x f n σ=-=-⨯+-⨯++⨯∑=152,ˆσ=12.33. 原假设H 0改写成X 是正态N (221,12.332)分布,计算每个区间的理论概率值{}11ˆ()()i i i i i pP a X a μμΦΦ--=≤<=-, i =1,2,…,6, 其中ˆi i a xμσ-=, 22()i t i t μμ--∞=e d Φ. 为了计算出统计量2χ之值,我们把需要进行的计算列表如下(表8-8).表8-8从上面计算得出2χ的观察值为1.35.在检验水平α=0.05下,查自由度m =6-2-1=3的2χ分布表,得到临界值20.05(3)χ=7.815.由于2χ=1.35<7.815=20.05(3)χ,不能拒绝原假设,所以认为混凝土制件的抗压强度的分布是正态分布N (221,152).小 结有关总体分布的未知参数或未知分布形式的种种论断叫做统计假设.一般统计假设分为原假设H 0(在实际问题中至关重要的假设)及与原假设H 0对立假设即是备择假设H 1.假设检验就是人们根据样本提供的信息作出“接受H 0、拒绝H 1”或“拒绝H 0、接受H 1”的判断.假设检验的思想是小概率原理,即小概率事件在一次试验中几乎不会发生.这种原理是人们处理实际问题中公认的原则.由于样本的随机性,当H 0为真时,我们可能会作出拒绝H 0、接受H 1的错误判断(弃当样本容量n 固定时,我们无法同时控制犯二类错误,即减小犯第一类错误的概率,就会增大犯第二类错误的概率,反之亦然.在假设检验中我们主要控制(减小)犯第一类错误的概率.使P {拒绝H 0|H 0为真}≤α,其中α很小.(0<α<1),α称为检验的显著性水平,这种只对犯第一类错误的概率加以控制而不考虑犯第二类错误的概率的检验称为显著性假设检验.单个、两个正态总体的均值、方差的假设检验是本章重点问题,读者需掌握Z 检验法、2χ检验法、t 检验法等.这些检验法中原假设H 0备择假设H 1及H 0的拒绝域分别见表8-2、表8-4.重要术语及主题原假设 备择假设 检验统计量 单边检验 双边检验 显著性水平 拒绝域 显著性检验 一个正态总体的参数的检验 两个正态总体均值差、方差比的检验 总体分布函数的假设检验习 题 八1. 已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N (4.55,0.1082).现在测了5炉铁水,其含碳量(%)分别为4.28 4.40 4.42 4.35 4.37问若标准差不改变,总体平均值有无显著性变化(α=0.05)? 2.某种矿砂的5个样品中的含镍量(%)经测定为:3.24 3.26 3.24 3.27 3.25设含镍量服从正态分布,问在α=0.01下能否接收假设:这批矿砂的含镍量为3.25. 3.在正常状态下,某种牌子的香烟一支平均1.1克,若从这种香烟堆中任取36支作为样本;测得样本均值为1.008(克),样本方差s 2=0.1(克2).问这堆香烟是否处于正常状态.已知香烟(支)的重量(克)近似服从正态分布(取α=0.05).4.某公司宣称由他们生产的某种型号的电池其平均寿命为21.5小时,标准差为2.9小时.在实验室测试了该公司生产的6只电池,得到它们的寿命(以小时计)为19,18,20,22,16,25,问这些结果是否表明这种电池的平均寿命比该公司宣称的平均寿命要短?设电池寿命近似地服从正态分布(取α=0.05).5.测量某种溶液中的水分,从它的10个测定值得出x =0.452(%),s =0.037(%).设测定值总体为正态,μ为总体均值,σ为总体标准差,试在水平α=0.05下检验. (1) H 0:μ=0.5(%);H 1:μ<0.5(%).(2)0H ':σ=0.04(%);1H ':σ<0.04(%). 6.某种导线的电阻服从正态分布N (μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s =0.008欧.对于α=0.05,能否认为这批导线电阻的标准差仍为0.005? 7.有两批棉纱,为比较其断裂强度,从中各取一个样本,测试得到: 第一批棉纱样本:n 1=200,x =0.532kg, s 1=0.218kg ; 第二批棉纱样本:n 2=200,x =0.57kg, s 2=0.176kg .设两强度总体服从正态分布,方差未知但相等,两批强度均值有无显著差异?(α=0.05) 8.两位化验员A ,B 对一种矿砂的含铁量各自独立地用同一方法做了5次分析,得到样本方差分别为0.4322(%2)与0.5006(%2).若A ,B 所得的测定值的总体都是正态分布,其方差分别为σA 2,σB 2,试在水平α=0.05下检验方差齐性的假设H 0:σA 2=σB 2; H 1:σA 2≠σB 2.9.在π的前800位小数的数字中,0,1,…,9相应的出现了74,92,83,79,80,73,77,75,76,91次.试用2χ检验法检验假设H 0:P (X =0)=P (X =1)=P (X =2)=…=P (X =9)=1/10,其中X 为π的小数中所出现的数字,α=0.10.10.在一副扑克牌(52张)中任意抽3张,记录3张牌中含红桃的张数,放回,然后再任抽。

统计学:第8章 假设检验

统计学:第8章  假设检验
(第四版)
由例8.16可以看出:当将原假设和备择假设交换,检验得到的最终结果 不一定相同。对假设的设定没有固定统一的标准。一般遵循的原则是:
(1)把传统的、被大多数人 所认可的观点或结论放在原假设,意为, 在没有充分证明其错误时,总是被认定为正确的。
(2)将新的、可能的、猜测的假设放在备择假设。 (3)将研究者关注的(要证明的)结论放在备择假设,这样,如果通 过假设检验作出拒绝零假设而选择备择假设的判断,会使检验的结论更具 说服力(拒绝原假设时是有充分的理由的,而接受原假设是在没有充分理 由拒绝它时才作出的决定)。 (4)容易构造统计量的角度来设置原假设和备择假设,因为原假设和 备择假设设置的不同可能会导致使用的统计量不同。
8 - 27
统计学
STATISTICS
(第四版)
右单侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平 拒绝域
1 -

H0值
临界值
样本统计量
8 - 28
统计学
STATISTICS
(第四版)
右单侧检验举例(1)
【例8.16】某批发商欲从厂家购进一批灯泡,根据 合同规定灯泡的使用寿命平均高于1000小时。
建立的原假设与备择假设应为
H0: 10 H1: 10
8 - 20
统计学
STATISTICS
(第四版)
双侧检验
(显著性水平与拒绝域 )
抽样分布
拒绝域
置信水平 拒绝域
/2
1 -
/2
临界值
H0值
临界值
样本统计量
8 - 21
统计学
STATISTICS
(第四版)
左单侧检验 (定义)

概率论第8章假设检验

概率论第8章假设检验
现在用新方法生产了一批推进器。从中随机取 n=25只,测得燃烧率的样本均值为
x41 .25 cm /s.
设在新方法下总体均方差仍为 2cm/s,问这批推 进器的燃烧率是否较以往生产的推进器的燃烧率
有显著的提高?取显著性水平 0.05.
数理统计
解:提出假设: H 0: 0 4H 0 1: 0
取统计量
数理统计
例2(医疗领域)为了检验某种新疗法是否比传统 疗法更有效,对40名患者进行实验。把病人分 成两组,每组20人,第一组采用新疗法,第二 组采用传统疗法。从治疗结果表中,我们能否
认为新疗法比传统疗法更有效?即第一组的康
复人数比第二组多的原因是因为新疗法效果更
好,还是由随机因素引起的?
疗法 新疗法 传统疗法
第八章
数理统计
假设检验
一、假设检验的基本思想和方法
数理统计
在本节中,我们将讨论不同于参数估计的另一 类重要的统计推断问题. 这就是根据样本的信息检验 关于总体的某个假设是否正确.
这类问题称作假设检验问题 .
数理统计
例1:罐装可乐的标准容量是355毫升
生产流水线上罐装可 乐不断地封装,然后装箱 外运. 怎么知道这批罐装 可乐的容量是否合格呢?
数理统计
第四步:
将样本值代入算出统计量 t 的实测值,
| t |=2.997<4.0322
没有落入
拒绝域
故不能拒绝H0 ,即认为是合格品。
这并不意味着H0一定对,只是差异还不 够显著, 不足以否定H0 .
数理统计
三、假设检验的两类错误
假设检验会不会犯错误呢? 由于作出结论的依据是下述
小概率原理
不是一定不发生
数理统计

概率统计简明教程 第八章 假设检验

概率统计简明教程 第八章 假设检验

255第八章 假设检验统计推断的另一个问题是假设检验,即在总体的分布未知或总体的分布形式已知但参数未知的情况下,为推断总体的某些性质,提出关于总体的某种假设,然后根据抽样得到的样本观测值,运用统计分析的方法,对所提的假设作出接受还是拒绝的决策,这一决策的过程称之为假设检验.假设检验分为参数假设检验和非参数假设检验,仅涉及总体分布的未知参数的假设检验称为参数假设检验,不同于参数假设检验的称作非参数假设检验.本章介绍假设检验的基本概念以及正态总体参数的显著性检验.§1 假设检验的基本概念1.1假设检验的思想与方法下面我们通过例子说明假设检验的基本思想和方法. 例1.1 某化肥厂用自动打包机包装化肥,其均值为100kg,根据经验知每包净重X (单位: kg)服从正态分布,标准差为1 kg.某日为检验自动打包机工作是否正常,随机地抽取9包,重量如下:99.3, 98.7, 100.5, 101.2, 98.3, 99.7, 99.5, 102.1, 100.5 试问这一天自动打包机工作是否正常?本例的问题是如何根据样本值来判断自动打包机是否工作正常,即要看总体均值μ是否为100kg.为此,我们给出假设0:100H μ=现用样本值来检验假设0H 是否成立, 0H 成立意味着自动打包机工作正常,否则认为自动打包机工作不正常.在假设检验问题中,我们把与总体有关的假设称之为统计假设,把待检验的假设称之为原假设,记为0H ,与原假设0H 相对应的假设称为备择假设,记为1H .本例中的备择假设为1:100H μ≠.用样本值来检验假设0H 成立,称为接受0H (即拒绝1H ),否则称为接受1H (即拒绝0H ).如何检验0:100H μ=成立与否?我们知道,样本均值X 是μ的无偏256估计,自然地希望用X 这一统计量来进行判断,在0H 为真的条件下,X 的观测值x 应在100附近,即100x -比较小,也就是说,要选取一个适当的常数k ,使得k ⎫≥⎬⎭是一个小概率事件.我们称这样的小概率为显著性水平,记为()01αα<<.一般地,α取0.10,0.05,0.01等.注意到当0H 为真时,统计量()0,1.X U N =(1.1)对于给定的显著性水平α,令 {}P U k P k α⎫≥=≥=⎬⎭, (1.2)于是/2k u α=.设统计量X U =的观测值为x u =,如果/2u u α≥,则意味着概率为α的小概率事件发生了,根据实际推断原理(一个小概率事件在一次试验中几乎不可能发生),我们拒绝0H ,否则接受0H . 在本例中,若取α=0.05, /20.025 1.96u u α==,0.6 1.96μ===<,因此,接受原假设0H ,即自动打包机工作正常.从本例中可以看出, 假设检验的基本思想是:为验证原假设0H 是否成立,我们首先假定0H 是成立的,然后在0H 成立的条件下,利用观测到的样本提供的信息,如果能导致一个不合理的现象出现,即一个概率很小的事件在一次试验中发生了,我们有理由认为事先的假定是不正确的, 从而拒绝2570H ,因为实际推断原理认为,一个小概率事件在一次试验中是几乎不可能发生的.如果没有出现不合理的现象,则样本提供的信息并不能否定事先假定的正确性, 从而我们没有理由拒绝0H ,即接受0H .为了利用提供的信息,我们需要适当地构造一个统计量,称之为检验统计量,如 例1.1的检验统计量是X U =.利用检验统计量,我们可以确定一个由小概率事件对应的检验统计量的取值范围,称这一范围为假设检验的拒绝域,记为W ,如例1.1的拒绝域为{}/2W u αμ=≥.当u W ∈时,我们拒绝0H .当u W ∉时, 接受0H .1.2 假设检验的两类错误由于假设检验是依据实际推断原理和一个样本值作出判断的,因此,所作的判断可以会出现错误.如原假设0H 客观上是真的,我们仍有可能以α的概率作出拒绝0H 的判断,从而犯了“弃真”的错误,这种错误称为第一类错误, 犯这个错误的概率不超过给定的显著性水平α,为简单起见,记{}00P H H α=拒绝成立. (1.3)另外,当原假设0H 客观上是假的,由于随机性而接受0H ,这就犯了“取伪”的错误,这种错误称为第二类错误. 犯第二类错误的概率记为b ,即{}01P H H β=接受成立. (1.4)在检验一个假设时,人们总是希望犯这两类错误的概率都尽量小.但当样本容量n 确定后,不可能同时做到犯这两类错误的概率都很小,因此, 通常我们的做法是利用事前给定的显著性水平α来限制第一类错误,力求使犯第二类错误的概率b 尽量小,这类假设检验称为显著性检验.为明确起见,我们把两类错误列于表8.1中258表8.1 假设检验的两类错误1.3 假设检验的步骤从例1.1中可以看出假设检验的一般步骤为:(1)根据实际问题提出原假设0H 和备择假设1H ; (2)确定检验统计量Z ;(3)对于给定的显著性水平α,并在0H 为真的假定下利用检验统计量确定拒绝域W ;(4)由样本值算出检验统计量的观测值z ,当z W ∈时,拒绝0H .当z W ∉时, 接受0H .需要说明的是:原假设和备择假设的建立主要根据具体问题来决定.通常把没有把握不能轻易肯定的命题作为备择假设,而把没有充分理由不能轻易否定的命题作为原假设.在对参数θ的假设检验中,形如00:H θθ=,10:H θθ≠的假设检验称为双边检验.在实际问题中,有些被检验的参数,如电子元件的寿命越大越好,而一些指标如原材料的消耗越低越好,因此,需要讨论如下形式的假设检验:00:H θθ≤, 10:H θθ> (1.5)或00:H θθ≥, 10:H θθ< (1.6)我们称(1.5)为右边检验, (1.6)为左边检验; 左边检验和右边检验统称为单边检验.259§2 单个正态总体的均值与方差的假设检验设12,,,n X X X 是来自正态总体()2,N μσ的一个样本, 样本均值为X ,样本方差为2S .2.1 单个正态总体均值的假设检验1.2σ已知时,关于μ的假设检验 为检验假设00:H μμ=, 10:H μμ≠. 构造检验统计量X U =(0,1)U N . (2.1)当0H 为真时, 检验统计量U的观测值x u =,故对给定的显著性水平α,令/2P u αα⎫≥=⎬⎭得拒绝域为{}/2W u u α=≥. (2.2)当U 的观测值满足/2u u α≥,则拒绝0H ,即认为均值μ与0μ有显著差异;否则接受0H ,即认为μ与0μ无显著差异. 对假设00:H μμ≤, 10:H μμ>. 取检验统计量为X U =(2.3)260可得此假设检验的拒绝域为{}W u u α=≥ . (2.4)类似地,我们可得假设检验00:H μμ≥, 10:H μμ< 的拒绝域为{}W u u α=≤-.(2.5) 在上述检验中,我们都用到统计量X U =来确定检验的拒绝域,这种方法称为U 检验.例 2.1 设某厂生产的一种电子元件的寿命(单位:小时)(,40000)X N μ ,从过去较长一段时间的生产情况来看,此电子元件的平均寿命不超过1500小时,现在采用新工艺后,在所生产的电子元件中抽取25只,测得平均寿命x =1675小时.问采用新工艺后,电子元件的寿命是否有显著提高(显著性水平α=0.05)?解: 建立假设0:1500H μ≤, 1:1500H μ>.已知,25,200n σ==, x =1675, α=0.05,0.05 1.645u u α==,U 的观测值为0.054.375 1.645x u u ==>=,因此,拒绝0H ,接受1H ,即认为采用新工艺后,电子元件的寿命有显著提高.2.2σ未知时,关于μ的假设检验作单个总体均值的U 检验,要求总体标准差已知,但在实际应用中,2σ往往并不知道,我们自然想到用2σ的无偏估计2S代替它,构造检验统计量为()1XT t n=-. (2.6)考虑假设00:Hμμ=,10:Hμμ≠.对给定的显著性水平α,有()/21P t nαα⎫≥-=⎬⎭,(2.7)因此,检验的拒绝域为(){}/21W t t nα=≥-. (2.8)当检验统计量T的观测值xt=()/21t t nα≥-,则拒绝H,即认为均值μ与μ有显著差异,否则接受H,即认为μ与μ无显著差异.类似地,假设检验00:Hμμ≥,10:Hμμ<的拒绝域为(){}1W t t nα=≤--. (2.9)假设检验00:Hμμ≤,10:Hμμ>的拒绝域为(){}1W t t nα=≥-. (2.10)称上述检验方法为t检验.例2.2 健康成年男子脉搏平均为72次/分,高考体检时,某校参加体检的26名男生的脉搏平均为74.2次/分,标准差为6.2次/分,问此26名男生每分钟脉搏次数与一般成年男子有无显著差异 (α=0.05) ?解:建立假设:72Hμ=,1:72Hμ≠.261262已知26,74.2, 6.2n x s ===, α=0.05,()()/20.0252525 2.06t t α==, 计算T的观测值: 1.81x t ==,由于 |1.81|<2.06 ,故接受0H ,即认为此26名男生每分钟脉搏次数与一般成年男子无显著差别.2.2 单个正态总体方差的假设检验1. μ已知时,关于2σ的假设检验为检验假设2200:H σσ=, 2210:H σσ≠.选取检验统计量为()222211()nii Xn χμχσ==-∑ ,(2.11) 当0H 为真时, 检验统计量2χ不应偏大或偏小,即对给定显著性水平α,有()(){}2212P k k χχα≤⋃≥=.一般地,取()()2211/22/2,k n k n ααχχ-==,其拒绝域为()(){}22221/2/2W n n ααχχχχ-=≤≥或.类似地,我们可以讨论左边检验2200:H σσ≥, 2210:H σσ< 和右边检验2200:H σσ≤, 2210:H σσ> 的拒绝域(见表8.2).2. μ未知时,关于2σ的假设检验 欲检验假设2200:H σσ=, 2210:H σσ≠. 选取检验统计量为263()()222211n S n χχσ-=- (2.12) 当0H 为真时, 检验统计量2χ不应偏大或偏小,即对给定显著性水平α,有()(){}2212P k k χχα≤⋃≥=.一般地,取()()2211/22/21,1k n k n ααχχ-=-=-.因此,拒绝域为()(){}22221/2/211W n n ααχχχχ-=≤-≥-或 (2.13)以上的检验方法称为2χ检验.例 2.3 某厂生产一种电子产品,此产品的某个指标服从正态分布()2,N μσ,现从中抽取容量为8n =的一个样本,测得样本均值61.125x =,样本方差293.268s =.取显著性水平0.05α=,试就60μ=和μ未知这两种情况检验假设228σ=. 解: 检验假设222201:8,:8H H σσ=≠.(1) μ未知,取()2221n S χσ-=为检验统计量,由293.268s =,算出()228193.26810.20128χ-⨯==,又()()221/20.97517 1.690n αχχ--==和()()22/20.0251716.013n αχχ-==,即10.2012不在拒绝域内,故接受220:8H σ=.(2) μ已知,取222101()ni i X χμσ==-∑为检验统计量. ()()221/20.97582,180n αχχ-==,()()22/20.025817.535n αχχ==,264注意到,2222111()(()())()()n nniii i i i x xx x x x n x μμμ===-=-+-=-+-∑∑∑和221()(1)nii x x n s =-=-∑.由61.125x =和293.268s =,可算出检验统计量的观测值为822211(60)10.32818i i x χ==-=∑,即它不在拒绝域内,故接受220:8H σ=.§3 两个正态总体均值差与方差比的假设检验设()211,X N μσ ,()222,Y N μσ ,从总体X 和Y 中,分别独立地取出样本12,,,n X X X 和12,,,m Y Y Y ,样本均值依次记为X 和Y ,样本方差依次记为21S 和22S .3.1 两个正态总体均值差的假设检验1. 21σ与22σ已知时, 关于12μμ-的假设检验现检验假设012:H μμδ-=, 112:H μμδ-≠. 由第六章定理2.2可知,在0H 成立的条件下,检验统计量()0,1X Y U N =. (3.1)给定显著性水平α,令/2P u αα⎫⎪≥=⎬⎪⎭,可得拒绝域为{}/2W αμμ=≥. (3.2)常用的情况是0δ=,即原假设为012:H μμ=.265例3.1 某苗圃采用两种育苗方案作育苗试验,已知苗高服从正态分布.在两组育苗试验中,苗高的标准差分别为1218,20σσ==.现都取60株苗作为样本,测得样本均值分别为59.34x =厘米和49.16y =厘米.取显著性水平为0.05α=,试判断这两种育苗方案对育苗的高度有无显著性影响.解:建立假设012:H μμ=, 112:H μμ≠. 由题中给出的数据,我们算出统计量X YU =的观测值为2.93u ==另, 0.05α=,/20.025 1.96u u α==,因 2.93 1.96u =>,故拒绝012:H μμ=,认为这两种育苗方案对育苗的高度有显著性影响.2. 21σ与22σ未知但22212σσσ==时, 关于12μμ-的假设检验现检验假设012:H μμδ-=, 112:H μμδ-≠.由第六章定理4.2可知,在0H 成立的条件下,检验统计量()2X Y T t n m =+- ,(3.3) 其中, ()()22122112wn S m S Sn m -+-=+-.给定显著性水平α,使得(){}/22P T t n m αα≥+-=.得到拒绝域为(){}/22W t t n m α=≥+- . (3.4)266类似地,我们可得关于12μμ-的单边假设检验的拒绝域(见表8.2). 例 3.2 在针织品漂白工艺中,要考虑温度对针织品断裂强力的影响,为比较70℃和80℃的影响有无显著性差异.在这两个温度下,分别重复做了8次试验,得到断裂强力的数据如下(单位:牛顿)70℃: 20.5, 18.8, 19.8, 20.9, 21.5, 21.0, 21.2, 19.5 80℃: 17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.2, 19.1由长期生产的数据可知, 针织品断裂强力服从正态分布,且方差不变,问这两种温度的断裂强力有无显著差异(显著性水平0.05α=). 解:设X ,Y 分别表示70℃和80℃的断裂强力,因此()21,X N μσ ,()22,Y N μσ .建立假设012:H μμ=, 112:H μμ≠.取X YT =为检验统计量,8n m ==,由题中给出的数据可以计算:20.4,19.4,0.928w x y s ===,检验统计量的观测值为 2.16x yt ==.又()()/20.025214 2.1450t n m t α+-==,因2.16>2.1450,故拒绝原假设,即认为这两种温度的断裂强力有显著差异.3.2 两个正态总体方差比的假设检验1. 1μ和2μ已知时,检验假设2222012112:,:H H σσσσ=≠现检验假设2222012112:,:H H σσσσ=≠.由第六章的定理5.1可知,在0H 成立的条件下取检验统计量267211221()(,)()ni i mi i m X F F n m n Y μμ==-=-∑∑ , (3.5)给定显著性水平α,使()(){}12P F k F k α≤⋃≥=.一般地,取()()11/22/2,,,k F n m k F n m αα-==,注意到()()1/2/21,,F n m F m n αα-=.因此拒绝域为()()/2/21,,W F F F n m F m n αα⎧⎫⎪⎪=≤≥⎨⎬⎪⎪⎩⎭或 . (3.6)2. 1μ和2μ未知时,检验假设2222012112:,:H H σσσσ=≠ 现检验假设2222012112:,:H H σσσσ=≠.由第六章的定理5.2可知,在0H 成立的条件下取检验统计量2122(1,1)S F F n m S =-- , (3.7)给定显著性水平α,使()(){}12P F k F k α≤⋃≥=.一般地,取()()11/22/21,1,1,1k F n m k F n m αα-=--=--.拒绝域为 ()()/2/211,11,1W F F F n m F m n αα⎧⎫⎪⎪=≤≥--⎨⎬--⎪⎪⎩⎭或. (3.8)上述检验方法称为F 检验.例3.3 根据本节例3.2的数据,检验70℃和80℃时针织品断裂强力的方差是否相等(显著性水平为0.05α=)?解:建立假设2222012112:,:H H σσσσ=≠.268由数据,检验统计量的观测值为21220.8857 1.070.8286s F s ===,又()()/20.0251,17,7 4.99,F n m F α--==()()/20.0251110.201,17,7 4.99F m n F α==≈--,显然有()()210.02520.025210.20 1.07 4.997,77,7s F F s =<=<=,因此,接受0H ,即认为70℃和80℃时针织品断裂强力的方差是相等的.表8.2 正态总体参数的显著性检验列表(显著性水平为α)269270习题八1.在正常情况下,某炼钢厂的铁水含碳量(%)2(4.55,)X N σ .一日测得5炉铁水含碳量如下:4.48,4.40,4.42,4.45,4.47在显著性水平0.05α=下,试问该日铁水含碳量得均值是否有明显变化. 2.根据某地环境保护法规定,倾入河流的废物中某种有毒化学物质含量不得超过3ppm.该地区环保组织对某厂连日倾入河流的废物中该物质的含量的记录为:115,,x x .经计算得知15148ii x==∑, 1521156.26i i x ==∑.试判断该厂是否符合环保法的规定.(该有毒化学物质含量X 服从正态分布) 3.某厂生产需用玻璃纸作包装,按规定供应商供应的玻璃纸的横向延伸率不应低于65.已知该指标服从正态分布2(,)N μσ, 5.5σ=.从近期来货中抽查了100个样品,得样本均值55.06x =,试问在0.05α=水平上能否接受这批玻璃纸?4.某纺织厂进行轻浆试验,根据长期正常生产的累积资料,知道该厂单台271布机的经纱断头率(每小时平均断经根数)的数学期望为9.73根,标准差为1.60根.现在把经纱上浆率降低20%,抽取200台布机进行试验,结果平均每台布机的经纱断头率为9.89根,如果认为上浆率降低后均方差不变,问断头率是否受到显著影响(显著水平α=0.05)?5. 某厂用自动包装机装箱,在正常情况下,每箱重量服从正态分布2(100,)N σ.某日开工后,随机抽查10箱,重量如下(单位:斤):99.3,98.9,100.5,100.1,99.9,99.7,100.0,100.2,99.5,100.9.问包装机工作是否正常,即该日每箱重量的数学期望与100是否有显著差异?(显著性水平α=0.05) 6.某自动机床加工套筒的直径X 服从正态分布.现从加工的这批套筒中任取5个,测得直径分别为15,,x x (单位m μ:),经计算得到51124ii x==∑, 5213139i i x ==∑.试问这批套筒直径的方差与规定的27σ=有无显著差别?(显著性水平0.01α=)7.甲、乙两台机床同时独立地加工某种轴,轴的直径分别服从正态分布211(,)N μσ、222(,)N μσ(12,μμ未知).今从甲机床加工的轴中随机地任取6根,测量它们的直径为16,,x x ,从乙机床加工的轴中随机地任取9根,测量它们的直径为19,,y y ,经计算得知:61204.6ii x==∑, 6216978.9i i x ==∑91370.8ii y==∑ 92115280.2i i y ==∑问在显著性水平0.05α=下,两台机床加工的轴的直径方差是否有显著差异?8.某维尼龙厂根据长期正常生产积累的资料知道所生产的维尼龙纤度服从正态分布,它的标准差为0.048.某日随机抽取5根纤维,测得其纤度为1.32,1.55,1.36,1.40,1.44.问该日所生产得维尼龙纤度的均方差是否有显著变化(显著性水平α=0.1)?9.某项考试要求成绩的标准为12,先从考试成绩单中任意抽出15份,计算样本标准差为16,设成绩服从正态分布,问此次考试的标准差是否符合要求(显著性水平α=0.05)?10.某卷烟厂生产甲、乙两种香烟,分别对他们的尼古丁含量(单位:毫克)作了六次测定,获得样本观察值为:甲:25,28,23,26,29,22;乙:28,23,30,25,21,27.假定这两种烟的尼古丁含量都服从正态分布,且方差相等,试问这两种香烟的尼古丁平均含量有无显著差异(显著性水平α=0.05,)?对这两种香烟的尼古丁含量,检验它们的方差有无显著差异(显著性水平α=0.1)?【提供者:路磊】272。

概率统计第八章假设检验精要

概率统计第八章假设检验精要
(a)2已知
由上节的讨论可知,在H0成立的条件下,选用检 验统计量 X 0 Z ~N (0,1 ) / n 对给定的检验水平,查正态分布表得临界值z/2, 再由样本值具体计算统计量Z的观察值z并与z/2比 较 ,若|z|≥z/2 ,则拒绝H0,接受H1;若|z|< z/2 , 则接受H0。这种检验法常称为Z检验法。
接受 H ,即灯泡寿命与 1000 无显著差异。 0
2.方差的检验 设总体X~N(,2),均未知,(X1,X2,…,Xn) 来自总体X的样本,要求进行的检验(设显著性水平为 >0)为
原假设H0:
由于
2
2 2 = 0 ,备择假设H1: 2 ≠ 0。
n 1 2 2 S ( X X ) i n 1i 1
解:原假设H0: = 0,备择假设H1: ≠ 0。 由1=0.05及2=0.01,查正态分布表,得临界值 z1/2 = z0.025=1.96,z2/2 = z0.005=2.58。而
|x | |26 . 56 26 | 0 |z | 2 . 15 / n 2 . 6 / 100
以上两例都是实际问题中常见的假设检验问题。 我们把问题中涉及到的假设称为原假设或称待检假 设,一般用H0表示。而把与原假设对立的断言称为备 择假设,记为H1。
如例1,若原假设为H0:= 0=4.55,则备择假设
为H1:≠4.55。
若例2的原假设为H0:X服从正态分布,则备择假设
为H1:X不服从正态分布。
情况下,这一点是办不到的。因为当减小时,就
增大;反之,当减小时,就增大。
那么,如何处理这一问题呢?
事实上,在处理实际问题中,一般地,对原假 设H0,我们都是经过充分考虑的情况下建立的,或 者认为犯弃真错误会造成严重的后果。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)基本思想:先对总体的参数或分布函数的表达式做出某
种假设,然后找出一个在假设成立条件下出现可能性甚小
的(条件)小概率事件。如果试验或抽样的结果使该小概率
事件出现了,这与小概率原理相违背,表明原来的假设有问
题,应予以否定,即拒绝这个假设。若该小概率事件在一次 试验或抽样中并未出现,就没有理由否定这个假设,表明试 验或抽样结果支持这个假设,这时称假设与实验结果是相 容的,或者说可以接受原来的假设。
0
| Z | z
2
| T | t (n 1)
2
0
= 0
0
0
Z z
Z z
T t (n 1)
T t ( n 1)
例3 设某次考试的考生成绩服从正态分布,从中随机 地抽取36位考生的成绩,算得平均成绩为66.5分,样本标 准差为15分,问在显著性水平α=0.05下,是否可以认为这 次考试全体考生的平均成绩为70分?
第八章

假设检验
内容提要
我们知道,数理统计的基本任务是根 据对样本的考察来对总体的某些情况作 出判断。对总体X的概率分布或分布参数 做某种“假设”,然后根据抽样得到的样 本观察值,运用数理统计的分析方法,检 验这种“假设”是否正确,从而决定拒绝 或接受“假设”,这就是我们要讨论的假 设检验问题。
大 纲 要 求
i 1
2
0.2106,
问是否可以认为新工艺炼
出的铁水含量的方差仍为0.1122?(α=0.05) 解:(1)H0: σ2 = 0.1122; H1: σ2 ≠ 0.1122
否定域
接受域
t1 / 2 (n 1)X
否定域
单正态总体均值假设检验列表如下:对照
对照P208
总体方差 已知 检验统计量 X 0 Z
2
总体方差 未知 检验统计量
2
T
X 0
S n
H0
H1
n
( Z 检验)
( T 检验)
在显著性水平 下的 H 0 的拒绝条件
0
一、理解假设检验的基本思想 .
二、掌握假设检验的基本步骤 .
三、了解假设检验可能产生的两类错误 . 四、掌握单个正态总体的均值与方差的假设检验 . 五、了解两个正态总体的均值与方差的假设检验 .




§8.1 (假设检验)概述 §8.2 正态总体参数(均值、方差)的 假设检验
§8.1 (假设检验)概述
f(x) α/2 α/2
1 2 ( n 1) 2 2 2 1 ( n 1) 2
λ1
否定域 接受域
λ2
X
否定域
例4 .
某炼铁厂铁水含碳量在正常情况下服从正态分布,
7
现对操作工艺进行了改变,从中抽取7炉铁水的试样测得
X 4.36,
( xi X )
σ2=0.05,技术革新后,抽查6个样品测得重量为(单位: 克) 14.7,15.1,14.8, 15.0,15.2,14.6,已知方差不变,问平均重量
是否仍为15?(α=0.05)
分析:σ2已知,μ的假设检验
解:(1) H0:μ=μ0=15; H1:μ≠15,
U X
(2)选择包含μ的分布已知统计量:
第一类错误
(弃真)
正确
犯第一类错误的概率通常记为 犯第二类错误的概率通常记为
任何检验方法都不能完全排除犯错 误的可能性。理想的检验方法应使犯两类 错误的概率都很小,但在样本容量给定的 情形下,不可能使两者都很小,降低一个, 往往使另一个增大。
假设检验的指导思想是控制犯第一类
错误的概率不超过, 然后,若有必要,通
的假设检验,称为右边检验。
左边检验和右边检验统称为单边检验。
6. 假设检验的一般步骤 第一步 提出待检验的原假设 H 0和对立假设 H1;
第二步 选择检验统计量,并找出在假设成立条 件下,该统计量所服从的概率分布;
第三步 根据所要求的显著性水平α 和所选取的统 计量,查概率分布临界值表,确定临界值与否定域;

2
( n 1) S
2

2
~ ( n 1)
2
(3)由给定α,查
1 2 ( n 1) 2 2 2 1 ( n 1) 2
2
得接受域为λ1< <λ2
(4)将样本观测值代入
2

2
,
若λ1< <λ2,接受原假设;
否则,拒绝原假设。
(u

2
1
) 1

2
(4)将样本观测值代入U,
若|U|> u1-α/2,否定原假设; |U|≤u1-α/2,接受原假 设。
φ(x)
P(|U|<u1-α/2)=1-α
U检验
α/2
- u1-α/2 u1-α/2
α/2
X
否定域
接受域
否定域
双侧假设检验
例1 .
由经验知某零件重量X~N(μ,σ2),其中μ=15,
非参数假设检验:

例X~F(x),F(x)未知 假设 F(x)=F0(x)
假设检验的内容
参数检验 (§8.2) 非参数检验 总体均值, 均值差的检验 总体方差, 方差比的检验 分布拟合检验(§8.5) 符号检验 秩和检验§8.5
假设检验的理论依据
假设检验之所以可行,其理论背景为 实际推断原理,即“小概率原理”。
第四步 将样本观察值代入所构造的检验统计量 中,计算出该统计量的值,若该值落入否定域,则拒绝 原假设H ,否则接受原假设 H 0
0
§8.2 正态总体参数的假设检验
一. 关于正态总体均值
0
的假设检验。
2 0
二. 关于正态总体方差

2

的假设检验。
一.σ2已知,μ的假设检验:(H0:μ=μ0, μ≥μ0, μ≤μ0)
分析:设考生成绩X~N(μ,σ2),σ2未知,μ的假设检验 解(1) H0:μ=μ0=70; H1:μ≠70, (2)选择包含μ的分布已知统计量:
T ~ X S/ n
(3)α=0.05,查表得t1-α/2(n-1)=t0.975(35)=2.03, 所以否定域为|T|> 2.03, (4)将样本观测值代入
| T || X S/ n ||
66.5 70 15 / 36
| 1.4 <2.0301
故接受原假设。即可以认为考生平均成绩为70。
三. 未知期望μ,σ2的(双侧)假设检验: ( 2 检验) (1)提出原假设和备择假设: H0: σ2 = σ02; H1: σ2 ≠ σ02 (2)选择包含σ2的分布已知函数:
过增大样本容量的方法来减少 。
4.
显著性水平与否定域(拒绝域)
小概率原理中,关于“小概率”的值通常根据 实际问题的要求而定,如取α=0.1,0.05,0.01等, α为检验的显著性水平(检验水平)。 在假设检验过程中,使得小概率事件出现的统 计量的取值范围称为该假设检验的否定域(拒绝域),
否定域的边界称为该假设检验的临界值。
另一方面,当原假设不成立时,却作出接受原假设的结论, 造成犯“取伪”的错误,称为第二类错误。 一般用 表示犯第二类错误的概率。
当样本容量 n 一定时, 小, 就大,反之, 小, 就大。
假设检验的两类错误
所作判断 接受 H0 真实情况
H0 为真 H0 为假
正确 第二类错误
(取伪)
拒绝 H0
(2)选择包含μ的分布已知函数:
T ~ X S/ n
~ t( n 1 )
(3)由给定α,查t1-α/2(n-1),得否定域为|T|> t1-α/2(n-1);
(4)将样本观测值代入T, 若|T|>t1-α/2(n-1),否定原 假设; |T|≤t1-α/2(n-1),接受原假设.
f(x) α/2 α/2
(4)将样本观测值代入U, 若U>u1-α, 否定原假设; U≤u1-α, 设。 接受原假
P(U>u1-α)≤α
φ(x)
(u1 ) 1
α u1-α 接受域 否定域 X
单侧假设检验
二.σ2未知,μ的假设检验: (T检验)
(1)提出原假设和备择假设: H0:μ=μ0; H1:μ≠μ0,
φ(x)
P(|U|<u1-α/2)=1-a α/2
- u1-α/2 u1-α/2
α/2
X
否定域
接受域
否定域
注意: 否定域的大小,依赖于显著性水平的取值,
一般说来,显著性水平越高,即α越小,否定域也越 小, 这时原假设就越难否定。
5.假设与对立假设

原假设 备择假设
H0
H1
统计假设通常用字母“ H ”表示。如果关于总体有两 个二者必居其一的假设,习惯上把其中的一个称作原假 设(基本假设、零假设)用 H0表示,而把另一个假设称作 对立假设(备择假设)用 H1表示。
假设 H0:μ=23, 若H0成立,则
U X
~ N ( ,2 )
2
,
/ n
~ N (0,1)
即: 若取α=0.05,则P{|U|>u1-α/2}=α, P{|U|>1.96}=0.05
在假设成立的条件下,|U|>1.96为概率很小事件,一般认为: 小概率事件在一次实验中是不会发生的, 将样本观测值代入U得
统计检验(假设检验)
在许多实际研究中,都有需要做出检验的问 题。如:某批产品能否出厂?某生产线工作是否 正常?某人是否患有某种疾病?某种新药的治疗 效果是否提高了?发生事故是否与星期几有关? 某次水平考试是否正常?等等,都需要做出检验。
相关文档
最新文档