第八章 假设检验-案例分析

合集下载

第8 假设检验(共80张PPT)

第8 假设检验(共80张PPT)
第 8 章 假设检验
8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。

概率论与数理统计--第八章 假设检验(8.1--8.3)

概率论与数理统计--第八章 假设检验(8.1--8.3)
犯第二类错误的概率记为
假设检验中的两类错误 <决策结果>
H0: 无罪
假设检验就好像一场审判过程
陪审团审判
H0 检验
裁决 无罪
实际情况
无罪
有罪
正确
错误
决策
实际情况 H0为真 H0为假
未拒绝H0
正确决策
第Ⅱ类错
误( )
有罪
错误
正确
拒绝H0
第Ⅰ类错
误( )
正确决策
说明 当样本容量 n 一定时, 若减少犯第一类错误
如在前面实例中给定显著性水平的样本是来自总体为已知设总体左边检验的拒绝域为右边检验的拒绝域为提出原假设根据实际问题的要求cm25cm40取显著水平烧率有显著的提高以往生产的推进器的燃推进器的燃烧率是否较问用新方法生产的法下总体均方差仍为设在新方得燃烧率的样本均值为从正态分布推进器的燃烧率服某工厂生产的固体燃料下拒绝故在显著性水平根据题意需要检验假设40假设检验的基本原理相关概念和一般步骤
利用t检验法检验具有相同方差的两正态总 体均值差的假设.
设X1,X2,,Xn为来自正态N总 (1体 ,2) 的样,本 Y1,Y2,,Yn为来自正态N总 (2体 ,2)的
样本 ,且设两样本. 独 注意 立两总体的方. 差相
又设 X,Y分别是总体,的 S12,样 S22是 本样 均本 值
方,差 1,2,2均为,未知
检验问题的拒绝域为
x 0 n
z 2
n15, x1.04,80.0,5 z0.0251.96,
x0 10.4810.50.5161.96 n 0.15 15
故接受 H0,认为该机工作 . 正常
2 .2 为,未 关 的 知 于(检 t检 )验 验

假设检验案例

假设检验案例

案例在单个总体参数的检验中,用到的检验统计量主要有3个:Z统计量、t统计量和x2统计量。

Z统计量、t统计量常用于均值的检验。

x2统计量常用于方差的检验。

例1某地区20户家庭年收入数据为例进行均值的检验,20户家庭的年收入的原始数据见excel(第八章案例)。

(1)提出原假设和备择假设H 0:μ=15(2)计算样本个数count 。

单元格D2=“COUNT(A2:A21)”(3)计算样本均值average 。

单元格D3=“AVERAGE(A2:A21)”D4单元格输入公式“=(D3-15)/SQRT(16)/SQRT(D2)”,相当于z 值的计算公式nx /_σµ−Z<-1.96或Z>1.96rs,P值来判断是否接受原假设P=2*(1-D5)总体方差未知的情况下,对均值进行检验计算样本方差。

在D4单元格中输入函数“=VAR(A2:A21)例2一家百货公司的管理者打算为公司的信用卡客户安装一套新的账单系统。

在进行了全面的财务分析后,她发现只有当平均每人每月的账单上的消费超过170元时,安装这个新系统才可以收回成本。

抽取了400个人的每月账单构成随机样本,它们的平均数是178元。

这个管理者知道账单大致服从标准差为65元的正态分布。

H0:μ≤170(不安装新系统)H1:μ>170(安装新系统)α1 1 --αμ=170 拒绝域α1 1 --α的值:=175.62L x −μ=170 拒绝域α1 1 --αμ=0 拒绝域α1 1 --α因为2.46>1.645,所以拒绝原假设,我们有足够的证据可推断每月账单均值大于170元。

近年来,很多公司在长途电话业务上和A公司竞争。

这些公司在广告上的费率明显低于A公司,从而有人认为客户账单上的花费也要少。

然后他抽取了100个客户的随机样本,用竞争对手在广告中所引用的费率重新计算了这些客户的话费账单。

假定总体的标准差和A公司的一样,在5%的置信水平下,我们能否认为A公司与其他竞争者的账单有区别。

大学课件概率论第8章假设检验

大学课件概率论第8章假设检验

:
2
2 0
.
(2)找统计量。
2 1 n
2 0 i1
Xi X
2 ~ 2
n 1
3求临界值。
对给定的 0.05,查自由度为n 1 4
的 2分布表得
2 1
n
1
2 0.975
4
11.143
2
2
n
1
2 0.025
4
0.484
2
(4)求观察值
x 1 1.32 1.55 1.36 1.40 1.44 1.414
112.82
1.1362
t txx00 112.8 112.6 0.4657
SSn* / nn 1.136 / 7
5作出判断,因为 t 0.4657 2.447,所以接受H0,
即用热敏电阻测温仪间接测量温度可以认为无系统偏差。
表8.1 单个正态总体均值的假设检验的拒绝域
(显著性水平为 )
112.0,113.4,111.2,114.5,112.5,112.9,113.6 而用某种精确方法测量温度的真值μ0=112.6,现问 用热敏电阻测温仪间接测量温度有无系统偏差?设 显著性水平α=0.05。
解: (1)提出假设,H0:μ=μ0=112.6
(2)找统计量。
t X 0 ~ t(n 1)
对给定的显著水平 0 1,由t分布表查得
临界值,使
P
t
t1- 2
4、求观察值
根据所给的样本算出统 计量t的观察值t1。
5、作出判断
若 t1
t1
,则接受H

0
2
若 t1
t1,则拒绝H

0
2
这种检验方法称为t检验法。

第八章 假设检验

第八章  假设检验
2
(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?

假设检验的任务与基本原理及实例分析

假设检验的任务与基本原理及实例分析
1、分类及基本任务 参数检验:在总体分布类型已知的的前提下对总体参数及有关性质 进行判断。 非参数检验:总体分布的类型部分或全部未知,检验的目的是作出 一般性的推断,如分布的类型,两变量是否独立,分布是否相同等。
9
问题的提出
❖ 对总体分布中的某些未知参数或分布的形式作某种 假设,然后通过抽取的样本,对假设的正确性进行 判断的问题,称为假设检验问题.
❖ 问这种化肥对小麦产量是否有显著影响? ❖ 用ξ与η分别表示在一块土地上施肥与未施肥情况下
小N(麦a2,的σ2产)分量布.,如那果么已问知题它就们是分检别验服假从设N(“a1a,σ11=)与a2”是 否成立?
12
❖ 例3 认为某电话交换台在某段时间接到的呼叫次数ξ 服从泊松分布,是否正确,如何判断.
Y 是否服从正态分布等。
3
引例1 生产流水线上的袋装糖果的重量服从正态 分布,按规定袋装糖果的重量的均值应为0.5(千克) 。一批袋装糖果出厂前进行抽样检查,抽查了5袋, 质量分别为:0.497,0.506,0.518,0.498,0.511。 问这一批袋装糖果是否合格?
可该例关心的问题归结为一个理论问题:总体分布
样.为查表方便起见,常选取α=0.1,0.05,0.01
等等.
30
三、假设检验的一般步骤
1) 根据实际问题的要求,提出原假设 H0 和备择假设 H1. 原假设也称为零假设,是我们要进行检验的 对象。
2) 建立检验统计量 T。检验统计量是样本的函数,要求不带有任何未知参数。
3) 确定 H0 的否定域(拒绝域) X 0 ,以 X 0 为拒绝域的检验称为检验 X 0 ,对原假设 H0 作出否定或不
❖ 今后,把对总体的分布所作的假设用H0表示,并称 为原假设或零假设(null hypothesis).

概率与数理统计第8章--假设检验与方差分析

概率与数理统计第8章--假设检验与方差分析

第8章假设检验与方差分析【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。

尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以元报收后停牌。

2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至元。

此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与 600μg组,及安慰剂组与εPA-44 900μg组之间,HBeAg/抗HBe 血清转换在统计意义上均无差异”。

通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg 组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。

有关数据如表所示:表乙肝新疫苗的应答率注:εP A-44为治疗用(合成肽)乙型肝炎疫苗简称。

上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”为什么说这个结论表示乙肝新疫苗无效什么叫“在统计意义上无差异”如何根据样本数据作出统计意义上有无差异的判断解答这些问题就需要本章所要介绍的假设检验。

现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。

例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。

这些分析研究都离不开假设检验或方差分析。

假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。

本教材介绍假设检验与方差分析的基本原理和一些基本方法。

假设检验讲义

假设检验讲义

假设检验讲义(总16页) -本页仅作为预览文档封面,使用时请删除本页-第八章假设检验内容介绍本章主要介绍统计假设检验的基本思想和概念以及参数的假设检验,并简单介绍非参数的统计假设检验的一些方法.内容讲解§假设检验的基本思想和概念1.引例例题1.P167例8-1味精厂用一台包装机包装味精,已知袋装味精的重量(单位:公斤)X~N(μ,),机器正常时,其均值μ=公斤.某日开工后随机抽取9袋袋装味精,其净重分别为,,,,,,,,,问这台包装机工作是否正常?【答疑编号】分析:从上述数据可知,9袋味精没有一袋与包装上标明的公斤相同,这是一种普遍现象.造成这种差异不外乎有两种原因:一是偶然因素造成的差异称为随机误差,属于正常误差;二是由于条件因素造成的误差,称为条件误差,属于不正常的误差。

为了检验包装机是否正常,在数理统计中给出了假设检验的方法。

解:已知袋装味精重X~N(μ,),假设现在包装机工作正常,提出如下假设:H0:μ=μ0=,H1:μ≠μ0,这是两个对立的假设,让我们通过抽样进行检验,从中选取其一,作出决策.从总体中抽取容量为n的样本,其均值为是μ的一个无偏估计.易知,当很小时,认定H0为真,反之,很大时,我们有理由怀疑H0为真而拒绝H0,接受H1.如何求出大、小的临界值下面讨论之.为了确定临界值,给定一个小数α(0<α<1).由于H0为真时,~,与区间估计类似,考虑,查表可得临界值.显然,事件是一个小概率事件,在一次试验中几乎不可能发生.我们只需计算的值,与临界值比较大小,若,说明上述小概率事件没有发生,我们接受H0,反之说明,小概率事件居然发生了,与“小概率事件在一次试验中几乎不可能发生”相矛盾,于是拒绝H0,接受H1,认为这台包装机工作不正常.2.统计假设检验中的一些基本概念(1)参数检验与非参数检验如果需要检验的量仅仅涉及总体分布的未知参数,则称之为参数检验.这是本章讲解的主要内容;如果涉及分布函数形式等时,则称之为非参数检验.(2)原假设与备择假设引例中的假设H0,即正常情况下放弃H0是小概率事件,则称H0为原假设或零假设;与之相对立的是假设H1,称之为备择假设.两个假设有且仅有一个为真.(3)检验统计量引例中的,称为检验统计量.对样本数据进行加工并用来判断是否接受原假设的统计量称为检验统计量.检验统计量应满足:①必须与统计假设有关;②当H0为真时,检验统计量的分布是已知的.(4)显着水平假设检验的基本理论根据是小概率原理,即小概率事件在一次试验中几乎不可能发生,根据这一原理,如果小概率事件不发生,则接受原假设,否则拒绝原假设。

第八章假设检验详解演示文稿

第八章假设检验详解演示文稿
1. 陈述原假设和备择假设
2. 从所研究的总体中抽出一个随机样本
3. 确定一个适当的检验统计量,并利用样本数据 算出其具体数值
4. 确定一个适当的显著性水平,并计算出其临界值, 指定拒绝域
5. 将统计量的值与临界值进行比较,作出决策
统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策
人 的 回 答 是 36.1 37.1 36.6 36.5 36.7
37oC , 这 似 乎 37.1 36.2 36.3 37.5 36.9
已经成了一种 共识。下面是
37.0
36.7
36.9
37.0
37.1
一 个 研 究 人 员 36.6 37.2 36.4 36.6 37.3
测 量 的 50 个 健 36.1 37.1 37.0 36.6 36.9
255.8ml。取显著性水平=0.05 ,检验该天生产
的饮料容量是否符合标准要求?
双侧检验
第三十九页,共97页。
总体均值的检验( 2 已知)
(例题分析-大样本)
❖ H0 : = 255 ❖ H1 : 255 ❖ = 0.05
❖ n = 40 ❖ 临界值(c):
拒绝 H0
0.025
拒绝 H0
0.025
➢ 因此提出“不应该再把37oC作为正常人体温的一 个有任何特定意义的概念”
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
第四页,共97页。
假设检验
假设检验的基本原理
怎样提出假设?
怎样做出决策? 怎样表述决策结果?
第五页,共97页。
第八章假设检验详 解演示文稿

第八章假设检验与方差分析(1)

第八章假设检验与方差分析(1)

一般说,哪一类错误带来的后果越严重、 危害越大,就应该作为首要的控制目标.
在假设检验中,一般都首先控制第一类错 误,也即控制α.
• 大家都遵守这个原则,讨论问题比较方便; • 最主要的原因是:原假设是什么非常明确,而
备择假设往往是模糊的。
26
确定α时应考虑的因素
视两类错误所产生的后果轻重而定
35
H 0 : 1000 H 1 : 1000
Z X ~ N ( 0 ,1 ) n
由=0.05 查标准正态分布表得临界值 Z / 2 Z 0 .025 1 .96
X 1050 1000
Z0
2.5
n 100 / 25
因为 Z0 2.5 Z /2 1.96故拒绝原假设,接受备 择假设,即这批电子元件的使用寿命有显 著性差异。
• 判断是否合理的依据统计上的小概率原理,
并非严格的逻辑证明。
6
假设检验中的小概率原理
• 小概率事件:发生概率很小的随机事件 • 小概率原理:小概率事件在一次试验(观察)
中几乎不可能发生。
• 什么样的概率才算小概率? • 研究者事先确定(根据决策的风险或要求的
把握程度来决定),没有统一的界定标准。
设检验的统计量为ξ,c是计算得出的检验
统计量的值。
• 左侧检验时,P值= P{ξ c } • 右侧检验时,P值= P{ξ c }
双侧检验中,P值=单侧P值的2倍。即:
P值=2P{ξ≥c },当 c 在右侧时;
或: P值=2P{ξ≤c },当 c 在左侧时。
19
利用 P 值进行决策 若p-值 ,不能拒绝 H0 若p-值 < , 拒绝 H0
• 当犯第一类错误的后果严重时,则希望尽可能不犯第一

第8章 假设检验

第8章  假设检验
例 一种摄影药品被其制造商声称其贮藏寿命是均值180天、 标准差不多于10天的正态分布。某位使用者担心标准差可 能超过10天。他随机选取12个样品并测试,得到样本标准 差为14天。根据样本有充分证据证明标准差大于10天吗?
例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k

)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:

第八章 假设检验

第八章  假设检验

§3 平均数差异的显著性检验
1.2相关样本的平均数差异检验 相关样本:同一组被试进行前后两次实验或 测验所得到的两个样本。 例8-7 某幼儿园在入园时对49名儿童进行了比 奈智力测验(σ=16),结果平均智商为 106,一年后再对同组被试施测,结果平均 智商为110,已知两次测验结果的相关系数 r=0.74,问能否说随着年龄增长与一年的 教育,儿童智商有了显著提高。
第八章 假设检验
假设检验的一般原理 平均数差异的显著性检验 方差、相关系数、比率的显著性检验
§1 假设检验的原理
1 假设与假设检验 例8-1 某班级进行比奈智力测验,结果 =110,已知比奈测验 的常模μ0 =100,σ0=16 ,问该班智力水平(不是这一次测验 的结果)是否确实与常模水平有差异。 1.1研究假设 H1 : μ1 ≠ μ0 (又称为备择假设) 若以μ1表示该班多次比奈智力测验的总平均,则本题检验的目 的是要证实μ1 ≠ μ0 ,就得到研究假设。 1.2虚无假设 由于H1的真实性不能直接被证实,需建立与之对立的假设H0 : μ1 = μ0 ,又称为原假设、零假设。而H0能直接被证实。
§6 两比率差异的显著性检验
检验步骤: ① 建立原假设和备择假设 H0 : p1 =p2 H1 :p1 ≠p2 ②选择如下统计量: ③决策。
§6 两比率差异的显著性检验
例甲乙两校某年毕业生考 校别 取及未考取大学的人 数见下表,问两校升 学比例有无显著差异? 甲 考取大 未考取 学(人)大学 (人)
§5 相关系数差异的显著性检验
检验步骤: ① 建立原假设和备择假设 H0 : ρ 1 ≤ρ 2 H1 :ρ 1 >ρ 2 ②将r1 和 r2进行费舍Zr转换 ③选择如下统计量: ④决策。
§5 相关系数差异的显著性检验

概率论与数理统计第八章 假设检验

概率论与数理统计第八章 假设检验

第八章假设检验第一节概述统计推断中的另一类重要问题是假设检验(Hypothesis testing).当总体的分布函数未知,或只知其形式而不知道它的参数的情况时,我们常需要判断总体是否具有我们所感兴趣的某些特性.这样,我们就提出某些关于总体分布或关于总体参数的假设,然后根据样本对所提出的假设作出判断:是接受还是拒绝.这就是本章所要讨论的假设检验问题.我们先从下面的例子来说明假设检验的一般提法.例8.1某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X服从正态分布N(μ,σ2).根据长期的经验知其标准差σ=0.015(kg).为检验某台包装机的工作是否正常;随机抽取包装的奶粉9袋,称得净重(单位:kg)为0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524问该包装机的工作是否正常?由于长期实践表明标准差比较稳定,于是我们假设X~N(μ,0.0152).如果奶粉重量X 的均值μ等于0.5kg,我们说包装机的工作是正常的.于是提出假设:H0:μ=μ0=0.5;H1:μ≠μ0=0.5.这样的假设叫统计假设.1.统计假设关于总体X的分布(或随机事件之概率)的各种论断叫统计假设,简称假设,用“H”表示,例如:(1)对于检验某个总体X的分布,可以提出假设:H0:X服从正态分布,H1: X不服从正态分布.H0:X服从泊松分布,H1: X不服从泊松分布.(2)对于总体X的分布的参数,若检验均值,可以提出假设:H0:μ=μ0;H1:μ≠μ0.H0:μ≤μ0;H1:μ>μ0.若检验标准差,可提出假设:H0:σ=σ0;H1:σ≠σ0.H0:σ≥σ0;H1:σ<σ0.这里μ0,σ0是已知数,而μ=E(X),σ2=D(X)是未知参数.上面对于总体X的每个论断,我们都提出了两个互相对立的(统计)假设:H0和H1,显然,H0与H1只有一个成立,或H0真H1假,或H0假H1真,其中假设H0,称为原假设(Original hypothesis)(又叫零假设、基本假设),而H1称为H0的对立假设(又叫备择假设).在处理实际问题时,通常把希望得到的陈述视为备择假设,而把这一陈述的否定作为原假设.例如在上例中,H0:μ=μ0=0.5为原假设,它的对立假设是H1:μ≠μ0=0.5.统计假设提出之后,我们关心的是它的真伪.所谓对假设H0的检验,就是根据来自总体的样本,按照一定的规则对H0作出判断:是接受,还是拒绝,这个用来对假设作出判断的规则叫做检验准则,简称检验,如何对统计假设进行检验呢?我们结合上例来说明假设检验的基本思想和做法.2.假设检验的基本思想 在例8.1中所提假设是H 0:μ=μ0=0.5(备择假设H 1:μ≠μ0).由于要检验的假设涉及总体均值μ,故首先想到是否可借助样本均值这一统计量来进行判断.从抽样的结果来看,样本均值x =19(0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524)=0.5110,与μ=0.5之间有差异.对于与μ0之间的差异可以有两种不同的解释.(1) 统计假设H 0是正确的,即μ=μ0=0.5,只是由于抽样的随机性造成了与μ0之间的差异;(2) 统计假设H 0是不正确的,即μ≠μ0=0.5,由于系统误差,也就是包装机工作不正常,造成了与μ0之间的差异.对于这两种解释到底哪一种比较合理呢?为了回答这个问题,我们适当选择一个小正数α(α=0.1,0.05等),叫做显著性水平(Level of significance).在假设H0成立的条件下,确定统计量X -μ0的临界值αλ,使得事件{|X -μ0|>αλ}为小概率事件,即P{|X -μ0|>αλ}=α.(8.1)例如,取定显著性水平α=0.05.现在来确定临界值λ0.05.因为X ~N (μ,σ2),当H 0:μ=μ0=0.5为真时,有X ~N (μ0,σ2),于是2011~,n i i X X N n n σμ=⎛⎫= ⎪⎝⎭∑,ZX X =N (0,1),所以 P {|Z |>z α/2}=α.由(8.1)式,有P Z ⎧>⎨⎩=α,因此22,z z αααλ==λ0.05=z 0.0250.015/3=0.0098. 故有P {|X -μ0|>0.0098}=0.05.因为α=0.05很小,根据实际推断原理,即“小概率事件在一次试验中几乎是不可能发生的”原理,我们认为当H 0为真时,事件{|X -μ0|>0.0098}是小概率事件,实际上是不可能发生的.现在抽样的结果是|x -μ0|=|0.5110-0.5|=0.0110>0.0098.也就是说,小概率事件{|X -μ0|>0.0098}居然在一次抽样中发生了,这说明抽样得到的结果与假设H 0不相符,因而不能不使人怀疑假设H 0的正确性,所以在显著性水平α=0.05下, 我们拒绝H 0,接受H 1,即认为这一天包装机的工作是不正常的.通过上例的分析,我们知道假设检验的基本思想是小概率事件原理,检验的基本步骤是: (1) 根据实际问题的要求,提出原假设H 0及备择假设H 1;(2) 选取适当的显著性水平α(通常α=0.10,0.05等)以及样本容量n ;(3) 构造检验用的统计量U ,当H 0为真时,U 的分布要已知,找出临界值αλ使P {|U |>αλ}=α.我们称|U |>αλ所确定的区域为H 0的拒绝域(Rejection region),记作W ; (4) 取样,根据样本观察值,计算统计量U 的观察值U 0;(5) 作出判断,将U 的观察值U 0与临界值αλ比较,若U 0落入拒绝域W 内,则拒绝H 0接受H 1;否则就说H 0相容(接受H 0).3.两类错误由于我们是根据样本作出接受H 0或拒绝H 0的决定,而样本具有随机性,因此在进行判断时,我们可能会犯两个方面的错误:一类错误是,当H 0为真时,而样本的观察值U 0落入拒绝域W 中,按给定的法则,我们拒绝了H 0,这种错误称为第一类错误.其发生的概率称为犯第一类错误的概率或称弃真概率,通常记为α,即P {拒绝H 0|H 0为真}=α;另一种错误是,当H 0不真时,而样本的观察值落入拒绝域W 之外,按给定的检验法则,我们却接受了H 0.这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或取伪概率,通常记为β,即P {接受H 0|H 0不真}=β.显然这里的α就是检验的显著性水平.总体与样本各种情况的搭配见表8-1.表8-1对给定的一对H 0和H 1,总可以找到许多拒绝域W .当然我们希望寻找这样的拒绝域W ,使得犯两类错误的概率α与β都很小.但是在样本容量n 固定时,要使α与β都很小是不可能的,一般情形下,减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的关系犹如区间估计问题中置信水平与置信区间的长度的关系那样.通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平α(0<α<1),而使犯第二类错误的概率也尽可能地小.具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于α,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验.在一般情况下,显著性检验法则是较容易找到的,我们将在以下各节中详细讨论.在实际问题中,要确定一个检验问题的原假设,一方面要根据问题要求检验的是什么,另一方面要使原假设尽量简单,这是因为在下面将讲到的检验法中,必须要了解某统计量在原假设成立时的精确分布或渐近分布.下面各节中,我们先介绍正态总体下参数的几种显著性检验,再介绍总体分布函数的假设检验.第二节 单个正态总体的假设检验1.单个正态总体数学期望的假设检验(1) σ2已知关于μ的假设检验(Z 检验法(Z -test)) 设总体X ~N (μ,σ2),方差σ2已知,检验假设H 0:μ=μ0;H 1:μ≠μ0 (μ0为已知常数) 由X ~N (μ,n σ)X N (0,1), 我们选取ZX (8.2)作为此假设检验的统计量,显然当假设H 0为真(即μ=μ0正确)时,Z ~N (0,1),所以对于给定的显著性水平α,可求z α/2使P {|Z |>z α/2}=α,见图8-1,即P {Z <-z α/2}+P {Z >z α/2}=α.从而有P {Z >z α/2}=α/2, P {Z ≤z α/2}=1-α/2.图8-1利用概率1-α/2,反查标准正态分布函数表,得双侧α分位点(即临界值)z α/2. 另一方面,利用样本观察值x 1,x 2,…,x n 计算统计量Z 的观察值z 0x (8.3)如果:(a )|z 0|>z α/2,则在显著性水平α下,拒绝原假设H 0(接受备择假设H 1),所以|z 0|>z α/2便是H0的拒绝域.(b ) |z 0|≤z α/2,则在显著性水平α下,接受原假设H 0,认为H 0正确.这里我们是利用H0为真时服从N (0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为Z 检验法(或称U 检验法).例8.1中所用的方法就是Z 检验法.为了熟悉这类假设检验的具体作法,现在我们再举一例.例8.2 根据长期经验和资料的分析,某砖厂生产的砖的“抗断强度”X 服从正态分布,方差σ2=1.21.从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg ·cm -2):32.56 29.66 31.64 30.00 31.87 31.03检验这批砖的平均抗断强度为32.50kg ·cm -2是否成立(取α=0.05,并假设砖的抗断强度的方差不会有什么变化)?解 ① 提出假设H 0:μ=μ0=32.50;H 1:μ≠μ0. ② 选取统计量ZX ,若H 0为真,则Z ~N (0,1).③ 对给定的显著性水平α=0.05,求z α/2使P {|Z |>z α/2}=α,这里z σ/2=z 0.025=1.96.④ 计算统计量Z 的观察值:|z 0| ≈3.05.⑤ 判断:由于|z 0|=3.05>z 0.025=1.96,所以在显著性水平α=0.05下否定H 0,即不能认为这批产品的平均抗断强度是32.50 kg ·cm -2.把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值μ的检验步骤: (a ) 提出待检验的假设H 0:μ=μ0;H 1:μ≠μ0. (b ) 构造统计量Z ,并计算其观察值z 0:ZX ,z 0x(c ) 对给定的显著性水平α,根据P {|Z |>z α/2}=α,P {Z >z α/2}=α/2,P {Z ≤z α/2}=1-α/2查标准正态分布表,得双侧α分位点z α/2. (d ) 作出判断:根据H 0的拒绝域 若|z 0|>z α/2,则拒绝H 0,接受H 1; 若|z 0|≤z α/2,则接受H 0.(2) 方差σ2未知,检验μ(t 检验法(t -test)) 设总体X ~N (μ,σ2),方差σ2未知,检验H 0:μ=μ0;H 1:μ≠μ0.由于σ2X 便不是统计量,这时我们自然想到用σ2的无偏估计量——样本方差S 2代替σ2,由于X t (n -1),故选取样本的函数tX (8.4)图8-2作为统计量,当H 0为真(μ=μ0)时t ~t (n -1),对给定的检验显著性水平α,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2,见图8-2,直接查t 分布表,得t 分布分位点t α/2(n -1).利用样本观察值,计算统计量t 的观察值t 0x 因而原假设H0的拒绝域为|t 0|>t α/2(n -1). (8.5)所以,若|t 0|>t α/2(n -1),则拒绝H 0,接受H 1;若|t 0|≤t α/2(n -1),则接受原假设H 0.上述利用t 统计量得出的检验法称为t 检验法.在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题.例8.3 用某仪器间接测量温度,重复5次,所得的数据是1250°,1265°,1245°,1260°,1275°,而用别的精确办法测得温度为1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?这里假设测量值X 服从N (μ,σ2)分布. 解 问题是要检验H 0:μ=μ0=1277;H 1:μ≠μ0.由于σ2未知(即仪器的精度不知道),我们选取统计量tX .当H 0为真时,t ~t (n -1),t 的观察值为|t 0|185.399-==>3.对于给定的检验水平α=0.05,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2, P {t >t 0.025(4)}=0.025,查t 分布表得双侧α分位点t α/2(n -1)=t 0.025(4)=2.776.因为|t 0|>3>t 0.025(4)=2.776,故应拒绝H 0,认为该仪器间接测量有系统偏差.(3) 双边检验与单边检验上面讨论的假设检验中,H 0为μ=μ0,而备择假设H 1:μ≠μ0意思是μ可能大于μ0,也可能小于μ0,称为双边备择假设,而称形如H 0:μ=μ0,H 1:μ≠μ0的假设检验为双边检验.有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H 0:μ=μ0;H 1:μ>μ0. (8.6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8.6)的假设检验,称为右边检验,类似地,有时我们需要检验假设H 0:μ=μ0;H 1:μ<μ0. (8.7)形如(8.7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验.下面来讨论单边检验的拒绝域. 设总体X ~N (μ,σ2),σ2为已知,x 1,x 2,…,x n 是来自X 的样本观察值.给定显著性水平α,我们先求检验问题H 0:μ=μ0;H 1:μ>μ0.的拒绝域.取检验统计量ZX ,当H 0为真时,Z 不应太大,而在H 1为真时,由于X 是μ的无偏估计,当μ偏大时,X 也偏大,从而Z 往往偏大,因此拒绝域的形式为ZX ≥k ,k 待定.因为当H 0X ~N (0,1),由P {拒绝H 0|H 0为真}=PX k ⎫≥⎬⎭=α得k =z α,故拒绝域为ZX ≥z α. (8.8)类似地,左边检验问题H 0:μ=μ0;H 1:μ<μ0.的拒绝域为ZX ≤-z α. 8.9)例8.4 从甲地发送一个信号到乙地,设发送的信号值为μ,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N (0,22),从而乙地接到的信号值是一个服从正态分布N (μ,22)的随机变量.设甲地发送某信号5次,乙地收到的信号值为: 8.4 10.5 9.1 9.6 9.9由以往经验,信号值为8,于是乙方猜测甲地发送的信号值为8,能否接受这种猜测?取α=0.05.解 按题意需检验假设H 0:μ=8;H 1:μ>8.这是右边检验问题,其拒绝域如(8.8)式所示, 即 Z =X ≥z 0.05=1.645.而现在z 0=1.68>1.645,所以拒绝H 0,认为发出的信号值μ>8.2.单个正态总体方差的假设检验(2χ检验法(2χ-test)) (1) 双边检验设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2=σ02;H 1:σ2≠σ2.其中σ02为已知常数.由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值22S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时2χ=220(1)n S σ-~2χ(n -1). (8.10)所以对于给定的显著性水平α有(图8-3)图8-3P {21/2αχ-(n -1)≤2χ≤2/2αχ(n -1)}=1-α. (8.11)对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2/2αχ(n -1).由(8.11)知,H 0的接受域是21/2αχ- (n -1)≤2χ≤2/2αχ (n -1); (8.12)H 0的拒绝域为2χ<21/2αχ-(n -1)或2χ>2/2αχ(n -1). (8.13)这种用服从2χ分布的统计量对个单正态总体方差进行假设检验的方法,称为2χ检验法. 例8.5 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?解 本题要求在α=0.02下检验假设H 0:σ2=5000;H 1:σ2≠5000.现在n =26,2/2αχ(n -1)=20.01(25)χ=44.314,21/2αχ- (n -1)= 20.99(25)χ=11.524,σ02=5000.由(8.13)拒绝域为2σ>44.314或220(1)n s σ-<11.524由观察值s 2=9200得22(1)n s σ-=46>44.314,所以拒绝H 0,认为这批电池寿命的波动性较以往有显著的变化.(2) 单边检验(右检验或左检验) 设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2≤σ02;H 1:σ2>σ02.(右检验)由于X ~N (μ,σ2),故随机变量*2χ=22(1)n S σ-~2χ(n -1).当H 0为真时,统计量2χ=22(1)n S σ-≤*2χ.对于显著性水平α,有P {*2χ>2αχ(n -1)}=α图8-4(图8-4).于是有P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α.可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:2χ=22(1)n S σ->2αχ(n -1)(右检验). (8.14)类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ2的拒绝域为2χ<21αχ-(n -1)(左检验). (8.15) 例8.6 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02. (2) 选取统计量2χ=22(1)n S σ-.*2χ=22(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ(3) 对于显著性水平α=0.05,查2χ分布表得21αχ-(n -1)=20.95(24)χ=13.848,当H 0为真时,P {2χ<21αχ- (n -1)}≤P 2212(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭=α. 故拒绝域为2χ<21αχ- (n -1)=13.848.(4) 根据样本观察值计算2χ的观察值2χ=220(1)240.000660.0012n s σ-⨯==13.2.(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后生产的零件直径的方差小于革新前生产的零件直径的方差.最后我们指出,以上讨论的是在均值未知的情况下,对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为2χ=2120()nii Xμσ=-∑.当σ2=σ2为真时,2χ~2χ(n ).关于单个正态总体的假设检验可列表8-2.表8-2注:上表中H0中的不等号改成等号,所得的拒绝域不变.第三节两个正态总体的假设检验上一节介绍了单个正态总体的数学期望与方差的检验问题,在实际工作中还常碰到两个正态总体的比较问题.1.两正态总体数学期望假设检验(1)方差已知,关于数学期望的假设检验(Z检验法)设X~N(μ1,σ12),Y~N(μ2,σ22),且X,Y相互独立,σ12与σ22已知,要检验的是H0:μ1=μ2;H1:μ1≠μ2.(双边检验)怎样寻找检验用的统计量呢?从总体X 与Y 中分别抽取容量为n 1,n 2的样本X 1,X 2,…,1n X 及Y 1,Y 2,…,2n Y ,由于2111~,X N n σμ⎛⎫ ⎪⎝⎭,2222~,Y N n σμ⎛⎫⎪⎝⎭,E (X -Y )=E (X )-E (Y )=μ1-μ2, D (X -Y )=D (X )+D (Y )=221212n n σσ+,故随机变量X -Y 也服从正态分布,即X -Y ~N (μ1-μ2,221212n n σσ+).从而X Y ~N (0,1).于是我们按如下步骤判断.(a ) 选取统计量 ZX Y , (8.16)当H 0为真时,Z ~N (0,1).(b ) 对于给定的显著性水平α,查标准正态分布表求z α/2使P {|Z |>z α/2}=α,或P {Z ≤z α/2}=1-α/2. (8.17) (c ) 由两个样本观察值计算Z 的观察值z 0:z 0x y .(d ) 作出判断:若|z 0|>z α/2,则拒绝假设H 0,接受H 1; 若|z 0|≤z α/2,则与H 0相容,可以接受H 0.例8.7 A ,B 两台车床加工同一种轴,现在要测量轴的椭圆度.设A 车床加工的轴的椭圆度X ~N (μ1,σ12),B 车床加工的轴的椭圆度Y ~N (μ2,σ22),且σ12=0.0006(mm 2),σ22=0.0038(mm 2),现从A ,B 两台车床加工的轴中分别测量了n 1=200,n 2=150根轴的椭圆度,并计算得样本均值分别为=0.081(mm),=0.060(mm).试问这两台车床加工的轴的椭圆度是否有显著性差异?(给定α=0.05)解 ① 提出假设H 0:μ1=μ2;H 1:μ1≠μ2. ② 选取统计量ZX Y ,在H 0为真时,Z ~N (0,1).③ 给定α=0.05,因为是双边检验,α/2=0.025.P {|Z |>z α/2}=0.05, P {Z >z α/2}=0.025,P {Z ≤z α/2}=1-0.025=0.975.查标准正态分布表,得z α/2=z 0.025=1.96.④ 计算统计量Z 的观察值zz 0x y =.⑤ 作判断:由于|z 0|=3.95>1.96=z α/2,故拒绝H 0,即在显著性水平α=0.05下,认为两台车床加工的轴的椭圆度有显著差异.用Z 检验法对两正态总体的均值作假设检验时,必须知道总体的方差,但在许多实际问题中总体方差σ12与σ22往往是未知的,这时只能用如下的t 检验法.(2) 方差σ12,σ22未知,关于均值的假设检验(t 检验法) 设两正态总体X 与Y 相互独立,X ~N (μ1,σ12),Y ~N (μ2,σ22),σ12,σ22未知,但知σ12=σ22,检验假设H 0:μ1=μ2;H 1:μ1≠μ2.(双边检验) 从总体X ,Y 中分别抽取样本X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y ,则随机变量tX Y μμ---t (n 1+n 2-2),式中S w 2=22112212(1)(1)2n S n S n n -+-+-,S 12,S 22分别是X 与Y 的样本方差.当假设H 0为真时,统计量t ~t (n 1+n 2-2). (8.18)对给定的显著性水平α,查t 分布得t α/2(n 1+n 2-2),使得P {|t |>t α/2(n 1+n 2-2)}=α. (8.19)再由样本观察值计算t 的观察值t 0x y(8.20)最后作出判断:若|t 0|>t α/2(n 1+n 2-2),则拒绝H 0; 若|t 0|≤t α/2(n 1+n 2-2),则接受H 0.例8.8 在一台自动车床上加工直径为2.050毫米的轴,现在每相隔两小时,各取容量都为10的样本,所得数据列表如表8-3所示.12是未知常数.问这台自动车床的工作是否稳定?(取α=0.01)解 这里实际上是已知σ12=σ22=σ2,但σ2未知的情况下检验假设H 0:μ1=μ2;H 1:μ1≠μ2.我们用t 检验法,由样本观察值算得:x =2.063, y =2.059,s 12=0.00000956, s 22=0.00000489,s w 2=2212990.0000860.0000441010218s s ⨯+⨯+=+-=0.0000072.由(8.20)式计算得t 0=3.3.对于α=0.01,查自由度为18的t 分布表得t 0.005(18)=2.878.由于|t 0|=3.3>t 0.005(18)=2.878,于是拒绝原假设H 0:μ1=μ2.这说明两个样本在生产上是有差异的,可能这台自动车床受时间的影响而生产不稳定.2. 两正态总体方差的假设检验(F 检验法(F -test )) (1) 双边检验设两正态总体X ~N (μ1,σ12),Y ~N (μ2,σ22),X 与Y 独立,X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y 分别是来自这两个总体的样本,且μ1与μ2未知.现在要检验假设H 0:σ12=σ22;H 1:σ12≠σ22.在原假设H 0成立下,两个样本方差的比应该在1附近随机地摆动,所以这个比不能太大又不能太小.于是我们选取统计量F =2122S S . (8.21) 显然,只有当F 接近1时,才认为有σ12=σ22.由于随机变量F *=22112222//S S σσ ~F (n 1-1,n 2-1),所以当假设H 0:σ12=σ22成立时,统计量F =2122S S ~F (n 1-1,n 2-1). 对于给定的显著性水平α,可以由F 分布表求得临界值12a F-(n 1-1,n 2-1)与F α/2(n 1-1,n 2-1)使得 P { 12a F-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1)}=1-α(图8-5),由此可知H 0的接受区域是12aF-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1);而H 0的拒绝域为F <12a F-(n 1-1,n 2-1),或 F >F α/2(n 1-1,n 2-1).然后,根据样本观察值计算统计量F 的观察值,若F 的观察值落在拒绝域中,则拒绝H 0,接受H 1;若F 的观察值落在接受域中,则接受H 0.图8-5例8.9 在例8.8中我们认为两个总体的方差σ12=σ22,它们是否真的相等呢?为此我们来检验假设H 0:σ12=σ22(给定α=0.1).解 这里n 1=n 2=10,s 12=0.00000956,s 22=0.00000489,于是统计量F 的观察值为F =0.00000956/0.00000489=1.95.查F 分布表得F α/2(n 1-1,n 2-1)=F 0.05(9,9)=3.18,F 1-α/2(n 1-1,n 2-1)=F 0.95(9,9)=1/F 0.05(9,9)=1/3.18.由样本观察值算出的F 满足F 0.95(9,9)=1/3.18<F =1.95<3.18=F 0.05(9,9).可见它不落入拒绝域,因此不能拒绝原假设H 0:σ12=σ22,从而认为两个总体的方差无显著差异.注意:在μ1与μ2已知时,要检验假设H 0:σ12=σ22,其检验方法类同均值未知的情况,此时所采用的检验统计量是:F =12211122121()1()n i i n i i X n Y n μμ==--∑∑~F (n 1,n 2). 其拒绝域参看表8-4.表8-4(2) 单边检验可作类似的讨论,限于篇幅,这里不作介绍了.第四节总体分布函数的假设检验上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的χ检验法.假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2χ检验法是在总体的分布为未知时,根据样本值x1,x2,…,x n来检验关于总体所谓2分布的假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x)(8.22)的一种方法(这里的备择假设H1可不必写出).注意,若总体X为离散型,则假设(8.22)相当于H0:总体X的分布律为P{X=x i}=p i,i=1,2,…;(8.23)若总体X为连续型,则假设(8.22)相当于H0:总体X的概率密度为f(x). (8.24)在用2χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.2χ检验法的基本思想与方法如下:(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1ki i A ==Ω,A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率if n与概率ˆi p往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下ˆii f p n-的值应该比较小,基于这种想法,皮尔逊使用 2χ=21ˆ()ˆki i i if npnp =-∑ (8.25) 作为检验H 0的统计量,并证明了如下的定理.定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2χ分布,其中r 是被估计的参数的个数.(3) 对于给定的检验水平α,查表确定临界值2(1)k r αχ--使P {2χ>2(1)k r αχ--)}=α,从而得到H 0的拒绝域为2χ>2(1)k r αχ--).(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2(1)k r αχ--比较.(5) 作结论:若2χ>2(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.i =0.05)?解 由题意首先提出假设:H 0:总体X 服从泊松分布.P {X =i }=!e ii λλ-,i =0,1,2,…,这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得03614061ˆ+70100x λ⨯+⨯++⨯⨯===1.将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计111ˆˆ{}!!e e i p P X i i i --====,i =0,1,2,….例如10ˆˆ{0},e pP X -=== 11ˆˆ{1},e pP X -=== 12ˆˆ{2},2e pP X -=== ………………166701ˆˆˆ{7}11.!e i i i pP X p i -===≥=-=-∑∑ 计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故24221ˆ()~(411).ˆi i i i f npnp χχ=-=--∑计算结果为2χ=1.460(表8-6).因为220.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布. 表8-68-7).n =61ii f=∑=200.要求在给定的检验水平α=0.05下检验假设H 0:抗压强度X ~N (μ,σ2).解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.由第七章知,μ与σ2的极大似然估计值为ˆx μ=, 2211ˆ()ni i x x n σ==-∑. 设*i x 为第i 组的组中值,我们有*1195102052624514200i ii x x f n ⨯+⨯++⨯==∑=221,{}2*222211ˆ()(26)10(16)262414200i ii x x f n σ=-=-⨯+-⨯++⨯∑=152,ˆσ=12.33. 原假设H 0改写成X 是正态N (221,12.332)分布,计算每个区间的理论概率值{}11ˆ()()i i i i i pP a X a μμΦΦ--=≤<=-, i =1,2,…,6, 其中ˆi i a xμσ-=, 22()i t i t μμ--∞=e d Φ. 为了计算出统计量2χ之值,我们把需要进行的计算列表如下(表8-8).表8-8从上面计算得出2χ的观察值为1.35.在检验水平α=0.05下,查自由度m =6-2-1=3的2χ分布表,得到临界值20.05(3)χ=7.815.由于2χ=1.35<7.815=20.05(3)χ,不能拒绝原假设,所以认为混凝土制件的抗压强度的分布是正态分布N (221,152).小 结有关总体分布的未知参数或未知分布形式的种种论断叫做统计假设.一般统计假设分为原假设H 0(在实际问题中至关重要的假设)及与原假设H 0对立假设即是备择假设H 1.假设检验就是人们根据样本提供的信息作出“接受H 0、拒绝H 1”或“拒绝H 0、接受H 1”的判断.假设检验的思想是小概率原理,即小概率事件在一次试验中几乎不会发生.这种原理是人们处理实际问题中公认的原则.由于样本的随机性,当H 0为真时,我们可能会作出拒绝H 0、接受H 1的错误判断(弃当样本容量n 固定时,我们无法同时控制犯二类错误,即减小犯第一类错误的概率,就会增大犯第二类错误的概率,反之亦然.在假设检验中我们主要控制(减小)犯第一类错误的概率.使P {拒绝H 0|H 0为真}≤α,其中α很小.(0<α<1),α称为检验的显著性水平,这种只对犯第一类错误的概率加以控制而不考虑犯第二类错误的概率的检验称为显著性假设检验.单个、两个正态总体的均值、方差的假设检验是本章重点问题,读者需掌握Z 检验法、2χ检验法、t 检验法等.这些检验法中原假设H 0备择假设H 1及H 0的拒绝域分别见表8-2、表8-4.重要术语及主题原假设 备择假设 检验统计量 单边检验 双边检验 显著性水平 拒绝域 显著性检验 一个正态总体的参数的检验 两个正态总体均值差、方差比的检验 总体分布函数的假设检验习 题 八1. 已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N (4.55,0.1082).现在测了5炉铁水,其含碳量(%)分别为4.28 4.40 4.42 4.35 4.37问若标准差不改变,总体平均值有无显著性变化(α=0.05)? 2.某种矿砂的5个样品中的含镍量(%)经测定为:3.24 3.26 3.24 3.27 3.25设含镍量服从正态分布,问在α=0.01下能否接收假设:这批矿砂的含镍量为3.25. 3.在正常状态下,某种牌子的香烟一支平均1.1克,若从这种香烟堆中任取36支作为样本;测得样本均值为1.008(克),样本方差s 2=0.1(克2).问这堆香烟是否处于正常状态.已知香烟(支)的重量(克)近似服从正态分布(取α=0.05).4.某公司宣称由他们生产的某种型号的电池其平均寿命为21.5小时,标准差为2.9小时.在实验室测试了该公司生产的6只电池,得到它们的寿命(以小时计)为19,18,20,22,16,25,问这些结果是否表明这种电池的平均寿命比该公司宣称的平均寿命要短?设电池寿命近似地服从正态分布(取α=0.05).5.测量某种溶液中的水分,从它的10个测定值得出x =0.452(%),s =0.037(%).设测定值总体为正态,μ为总体均值,σ为总体标准差,试在水平α=0.05下检验. (1) H 0:μ=0.5(%);H 1:μ<0.5(%).(2)0H ':σ=0.04(%);1H ':σ<0.04(%). 6.某种导线的电阻服从正态分布N (μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s =0.008欧.对于α=0.05,能否认为这批导线电阻的标准差仍为0.005? 7.有两批棉纱,为比较其断裂强度,从中各取一个样本,测试得到: 第一批棉纱样本:n 1=200,x =0.532kg, s 1=0.218kg ; 第二批棉纱样本:n 2=200,x =0.57kg, s 2=0.176kg .设两强度总体服从正态分布,方差未知但相等,两批强度均值有无显著差异?(α=0.05) 8.两位化验员A ,B 对一种矿砂的含铁量各自独立地用同一方法做了5次分析,得到样本方差分别为0.4322(%2)与0.5006(%2).若A ,B 所得的测定值的总体都是正态分布,其方差分别为σA 2,σB 2,试在水平α=0.05下检验方差齐性的假设H 0:σA 2=σB 2; H 1:σA 2≠σB 2.9.在π的前800位小数的数字中,0,1,…,9相应的出现了74,92,83,79,80,73,77,75,76,91次.试用2χ检验法检验假设H 0:P (X =0)=P (X =1)=P (X =2)=…=P (X =9)=1/10,其中X 为π的小数中所出现的数字,α=0.10.10.在一副扑克牌(52张)中任意抽3张,记录3张牌中含红桃的张数,放回,然后再任抽。

第八章假设检验_0

第八章假设检验_0

第八章假设检验作为统计推断的重要组成部分,假设检验也称为显著性检验,就是对所估计的总体先提出一个假设,然后再根据样本信息来检验对总体所做的假设是否成立。

假设检验可分为参数检验和非参数检验,对总体分布中未知参数的假设检验称为参数检验,而对未知分布函数的类型或其某些特征提出的假设称为非参数检验。

第一节假设检验概述在实际生活中,许多事例都可以归结为假设检验问题。

为了便于理解,下面我们结合具体实例来说明假设检验的思想方法。

例8.1 某厂生产中药地黄丸,药丸的重量服从正态分布N( , 2),按规定每丸的标准重量为10克。

根据以往经验得知,生产药丸的标准差为 3.2克。

现从一批药丸中随机抽取100个,其平均重量为9.6克,试问这批药丸重量是否符合标准?从直观上来看,这批药丸重量不符合标准,两者差异显著。

但能否仅凭100个药丸的平均重量比标准重量小0.4克,而立即得出这批药丸不符合标准的结论呢?从统计学上来看,这样得出的结论是不可靠的。

这是因为,差异可能是这批药丸品质所造成的,也可能是由于抽样的随机性所造成的。

如果我们再随机抽取100个药丸进行检测重量,又可得到一个样本资料。

由于抽样误差的随机性,样本平均数(100个药丸的平均重量)就不一定是9.6克。

那么,我们对样本进行分析时,必须判断样本的差异是抽样误差造成的,还是因本质不同而引起的。

如何区分两类性质的差异?怎样通过样本来推断总体?这正是假设检验要解决的问题。

在假设检验中,先要根据问题的需要建立检验假设,假设有两种,一种是原假设或零假设,用H0表示,通常就是将要进行检验的假设;另一种是备择假设- 1 -或对立假设,用H1表示,是原假设H0相对立的假设。

例8.1中,如果将该批药丸的重量记作总体X,该问题就是检验总体X的均值 的变化情况。

那么,可以设原假设H0: 10( 0),即认为这批药丸重量是符合标准的;而备择假设,即认为这批药丸重量是符合标准的 10( 0),即认为这批药丸重量不H1:10( 0)符合标准的。

第八章假设检验

第八章假设检验

§8.2 正态总体均值的假设检验
(一) 单个总体N( , 2)均值的假设检验
iid
~ 设X1,,X n N(, 2 ),给定检验水平,由观
测值 x1,,xn检验假设H0: 0;H1: 0。
1、2已知的情形--Z检验
对于假设H0:=0,H1:0, 构造统计量
Z X μ0 H0真 X μ ~N(0,1)
H0:0,H1:u<u0
的水平为的拒绝域
例1 设某厂生产一种灯管, 其寿命X~ N(, 2002), 由
以往经验知平均寿命 小于1500小时, 现采用新工
艺后, 在所生产的灯管中抽取25只, 测得平均寿命
1675小时, 问采用新工艺后, 灯管寿命是否有显著提
高。(=0.05)
解: 由题意,可提出假设 H0 : 1500 , H1 : 1500
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512
该机器是否正常?
(一) 问题的提出
设X1,X2,… ,Xn是来自总体 X~ F(x;)的 一个样本,参数∈Θ未知, 由样本观测值x1, …, xn
检验假设
H0:=0,H1:≠0 称H0为原假设, H1为备选假设。
布, 取 =0.05 )?
解: 由题意,可提出假设
H0:=112.6,H1:112.6
当H
真时
0
:
T
X S
0
n
~ t(n 1),
由P{|T|t0.025(n 1)} =0.05, 得水平=0.05的拒
绝域为|T|t0.025(6)=2.4469,
而此处 | T
|
112.8 112.6 1.135 7

第八章假设检验分析

第八章假设检验分析
H0 : 2
H : 2
8
建立零假设和备择假设总结:
STAT
设 表0示在零假设和备择假设中考虑的某一特定数
值。一般来说,对总体均值的假设检验采取下面的
三种形式之一:
检验
H0 H1
: :
0 0
右侧检验
H0 H1
: :
0 0
双侧检验
9
统计假设的检验:
2
实践中的统计
STAT
为此,随机抽取了15辆A2型汽车做试验,测得15辆汽 车的每百公里耗油量的数据如下表:
15辆汽车每百公里耗油量(单位:升)
8.50 8.75 8.33 8.21 8.52 8.30 8.31 8.19 8.40 8.86 8.41 8.01 8.20 8.26 8.39
其平均数为8.377。对此数据,技术部经理认为可以肯 定改进后的汽车更省油。
11
第二节 第一类和第二类错误
STAT
第一类错误: 拒绝正确的原假设,简称“拒真”; 第二类错误 :接受错误的原假设,简称“纳伪”
如下所示:
总体情况
结论
接受H0 拒绝H0
H0正确 正确结论
第一类错误
H0错误 第二类错误
正确结论
我们把两类错误发生的概率表示如下: α——第一类错误发生的概率; β——第二类错误发生的概率;
基本假设
备择假设:H1 备择假设
5
第一节 零假设和备择假设
STAT
一、对研究性假设的检验 如我们前面的案例就可以看成是一个研究性假设
的例子。 研究性假设是:改进后的车型更节油,即平均油
耗低于8.48升。 通常,研究性假设作为备择假设。
则上例中我们可建立如下的零假设和备择假设:

第八章 假设检验

第八章 假设检验

• 单尾检验 • σ2已知 • 总体正态 • Z检验
例9-1
① 建立假设 Ho : X 0 Ha : X 0
② 求检验值
均数标准误:
SEX
S n 1
20 4 26 1
t值 t X 180 175 1.25
SEX
4
③ 比较决策
df n 1 26 1 25
SEDX
错误
Ho: 1=2
Z
-1.96σ
0
1.96σ

(二)II 型错误(Type II Error)
定义:Ho不正确时,因检验值落入接受区
而未拒绝Ho所犯的错误。
错误
Z 1 2
SEDX
Z
-1.96σ
0
Ha: 1≠2
1.96σ

(三)两类错误的关系与控制
1、关系
α减小,β必然增大; β减小, α必然增大。

Dk X1k X 2k
n21, X 21 n22 , X 22

n2k , X 2k
检验时需考虑的因素
样本性质如何? σ12、σ22已知否? 方差一致否?
(一)相关样本的标准误
σ12、σ22未知
SEDX
S12 S22 2rS1S2 n 1
σ12、σ22已知
SEDX

五、统计决策的两类错误
I型()错误 决策时的几种逻辑情况 ①Ho为真,拒绝了Ho。 ②Ho为真,接受了Ho。
③Ho不真,接受了Ho。
④Ho不真,拒绝了Ho。 II型()错误

(一)I 型错误(Type I Error)
定义:Ho正确时,因检验值落入拒绝区而 未接受Ho所犯的错误。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(25 1)0.866 20.8 1
在 = 0.05的水平上不拒绝H0 不能认为该机器的性能未达到 设计要求
0 12.40
39.36
2
1.4 -0.9 -0.5 -0.2 -0.6
-0.6 1.3 0 -1.9 1.1
绿色
健康饮品
例题分析
H0: 2 = 1 H1: 2 1 = 0.05 df = 25 - 1 = 24 临界值(s):
/2 =.05
统计量: 2 ( n 1 ) s 2 2 0
决策: 结论:
双侧检验
例题分析
H0: = 0.081 H1: 0.081 = 0.05 n = 200 检验统计量:
z
x 0

n

0.076 0.081 0.025 200
2.83
临界值(s):
拒绝 H0
.025
决策:
在 = 0.05的水平上拒绝H0
拒绝 H0
.025
结论:
结论:
-1.96
0
1.96
Z
该市老年人口比重为14.7%
【例7.7】某厂商生产出一种新 0.3 -0.4 -0.7 型的饮料装瓶机器,按设计要 求 , 该 机 器 装 一 瓶 一 升 -0.3 -1.5 0.6 1 (1000cm3) 的 饮 料 误 差 上 下 不 -1.3 0.7 超过1cm3。如果达到设计要求 -0.6 0.7 -1.5 ,表明机器的稳定性非常好。 -0.5 1 -0.2 现从该机器装完的产品中随机 抽取25瓶,分别进行测定(用样 本减1000cm3),得到如下结果 绿色 。检验该机器的性能是否达到 健康饮品 设计要求 (=0.05) 双侧检验
0
1.645
Z
【例8.3】某电子元件批量生产 的质量标准为平均使用寿命 1200 小时。某厂宣称他们采用 一种新工艺生产的元件质量大 大超过规定标准。为了进行验 证,随机抽取了 100 件作为样 本,测得平均使用寿命 1245 小 时,标准差 300 小时。能否说 该厂生产的电子元件质量显著 地高于规定标准? (=0.05)
双侧检验
(例题分析)
H0: P= 14.7% H1: P 14.7% = 0.05 n = 400 临界值(s):
拒绝 H0
.025
检验统计量:
z 0.1425 0.147 0.147 (1 0.147) 400 0.254
拒绝 H0
.025
决策:
在 = 0.05的水平上不拒绝H0
ห้องสมุดไป่ตู้单侧检验
例题分析
H0: 1200 H1: >1200 = 0.05 n = 100 临界值(s):
拒绝域 0.05
检验统计量:
z
x 0

n

1245 1200 300 100
1.5
决策:
在 = 0.05的水平上不拒绝H0
结论:
不能认为该厂生产的元件寿命 显著地高于1200小时
案例分析
【例8.1】某机床厂加工一种零件,根据经验知 道,该厂加工零件的椭圆度近似服从正态分布 ,其总体均值为 0=0.081mm ,总体标准差为 = 0.025 。今换一种新机床进行加工,抽取 n=200 个 零 件 进 行 检 验 , 得 到 的 椭 圆 度 为 0.076mm。试问新机床加工零件的椭圆度的均 值与以前有无显著差异?(=0.05)
例题分析
H0: 40000 H1: < 40000 = 0.05 df = 20 - 1 = 19 临界值(s):
拒绝域 .05
检验统计量:
t x 0 s n 41000 40000 5000 20
0.894
决策:
在 = 0.05的水平上不拒绝H0
结论:
t
不能认为制造商的产品同他所 说的标准不相符
拒绝 H0
.025
检验统计量:
t
x 0 s n

5.3 5 0.6 10
3.16
决策:
在 = 0.05的水平上拒绝H0
.025
拒绝 H0
结论:
说明该机器的性能不好
-2.262
0
2.262
t
【例 8.5】 一个汽车轮胎制造商
单侧检验!
声称,某一等级的轮胎的平均寿 命在一定的汽车重量和正常行驶 条件下大于 40000 公里,对一个 由 20 个轮胎组成的随机样本作了 试验,测得平均值为 41000 公里 ,标准差为 5000 公里。已知轮胎 寿命的公里数服从正态分布,我 们能否根据这些数据作出结论, 该制造商的产品同他所说的标准 相符?( = 0.05)
单侧检验
例题分析
H0: 1020 H1: > 1020 = 0.05 n = 16 临界值(s):
拒绝域 0.05
检验统计量:
z
x 0

n

1080 1020 100 14
2.4
决策:
在 = 0.05的水平上拒绝H0
结论:
有证据表明这批灯泡的使用 寿命有显著提高
-1.7291 0
【例 8.6】 一项统计结果声称
,某市老年人口(年龄在65岁 以上)的比重为 14.7% ,该市 老年人口研究会为了检验该项 统 计 是 否 可 靠 , 随机 抽 选 了 400 名居民,发现其中有 57 人 年龄在65岁以上。调查结果是 否支持该市老年人口比重为 14.7%的看法?(= 0.05)
0
1.645
Z
【例8.4】某机器制造出的
肥皂厚度为5cm,今欲了解 机器性能是否良好,随机 抽取 10 块肥皂为样本,测 得平均厚度为5.3cm,标准 差为 0.3cm ,试以 0.05 的显 著性水平检验机器性能良 好的假设。
双侧检验
(例题分析)
H0: = 5 H1: 5 = 0.05 df = 10 - 1 = 9 临界值(s):
有证据表明新机床加工的零件 的椭圆度与以前有显著差异
-1.96
0
1.96
Z
【例8.2】根据过去大量资料
,某厂生产的灯泡的使用寿 命 服 从 正 态 分 布 N~(1020 , 1002) 。现从最近生产的一批 产品中随机抽取 16 只,测得 样本平均寿命为 1080 小时。 试在 0.05 的显著性水平下判 断这批产品的使用寿命是否 有显著提高?(=0.05)
相关文档
最新文档