概率论与数理统计 假设检验
概率论与数理统计课件:假设检验
假设检验
首页 返回 退出
五、假设检验的两类错误
由于样本具有随机性,因此,当我们利用样本判断时, 可能会犯两类错误:
所作决策
真实情况
(未知)
样本未落入拒绝域 样本落入拒绝域
接受H0
拒绝H0
H0为真
正确
第一类错误
H0不真
第二类错误
正确
第一类(弃真): 第二类(取伪):
假设检验
P{拒绝H0|H0为真}= , P{接受H0|H0不真}= .
(α=0.05)
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
Z X 0 ~ N (0,1) / n
假设检验
首页 返回 退出
解:正态总体X~N(μ,σ2),已知σ=2
要检验的假设为
H0 : 40, H1 : 40
选择检验统计量
由样本数据计算,得 x 100.104 计算统计量Z的观测值,得
Z 100.104 100 0.658 1.96 0.5 / 10
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
要检验的假设为
H0 : 100, H1 : 100
(2)未知σ2 ,选择检验统计量
没有落入 拒绝域
结论:不拒绝原假设,认为内径的值符合设计要求.
假设检验
首页 返回 退出
例2 某厂生产的固体燃料推进器的燃烧率服从正态分 布X~N(40,22),现在采用技术研发部设计的新方法 生产了一批推进器,随机测试25只,测得燃烧率的 样本均值为 x 41.25 ,假设在新方法下σ=2,问用 新方法生产的推进器的燃烧率是否有显著的提高?
概率论与数理统计(8)假设检验
概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计-假设检验
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
概率论与数理统计第八章假设检验
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用表示. 如假 H 0:设 0,小概率 P {X 事 0u 件 } 为
查找 0 .9得 5 表分 中 xz0 位 .0 51 .6 点 4现 5 x010.4 6 1301 5 7.4 6 10
当Zz时拒H绝 0,Z
x0
1071.42.78 81
z
1.645
n
在 拒 绝 域,拒 内绝H0 ,接 受H1,即 抗 拉 强 度 提
(另:P182 例2 Z检验,单侧)
第二节 正态总体均值的假设 检验
单个正态总体 均值的检验 两个正态总体均值差的检验 小结
一、单个总体 N ( , 2 ) 参数的检验 设 X ~ N ( 总 ,2 ) 样 ; ( X 体 1 ,X 2 , 本 ,X n )
1.2已知, 未知,检 验
(1)检H 验 0:0;备 择H 1 检 :验 0 检 验, 水双 平侧 检 验
假设进行 即判 判假 断 断 H 设 0:0;备择H 假 1:设 0
小概率 :样 事本 件 X 与 均 是所 值假设 0相的 X 差 期 0 望
不能,若 太相 大差太 H 0 大则拒绝
小概P 率 {X 事 0件 u}
u 是 2
所选取合适U 的的 2统 分 计位 量点
2
1
P{X0u}x0u为拒绝 2 区域
z z 0 . 0 , 2 ( z 0 . 0 5 ) 2 P ( Z 5 z 0 . 0 ) 2 1 5 P ( Z z 0 . 0 ) 2 1 5 0 . 0 0 . 2 95 7 2 分位点的定义
《概率论与数理统计》第七章假设检验.
《概率论与数理统计》第七章假设检验.第七章假设检验学习⽬标知识⽬标:理解假设检验的基本概念⼩概率原理;掌握假设检验的⽅法和步骤。
能⼒⽬标:能够作正态总体均值、⽐例的假设检验和两个正态总体的均值、⽐例之差的假设检验。
参数估计和假设检验是统计推断的两种形式,它们都是利⽤样本对总体进⾏某种推断,然⽽推断的⾓度不同。
参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。
⽽在假设检验中,则是预先对总体参数的取值提出⼀个假设,然后利⽤样本数据检验这个假设是否成⽴,如果成⽴,我们就接受这个假设,如果不成⽴就拒绝原假设。
当然由于样本的随机性,这种推断只能具有⼀定的可靠性。
本章介绍假设检验的基本概念,以及假设检验的⼀般步骤,然后重点介绍常⽤的参数检验⽅法。
由于篇幅的限制,⾮参数假设检验在这⾥就不作介绍了。
第⼀节假设检验的⼀般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误⼀、假设检验的基本概念(⼀)原假设和备择假设为了对假设检验的基本概念有⼀个直观的认识,不妨先看下⾯的例⼦。
例7.1 某⼚⽣产⼀种⽇光灯管,其寿命X 服从正态分布)200 ,(2µN ,从过去的⽣产经验看,灯管的平均寿命为1550=µ⼩时,。
现在采⽤新⼯艺后,在所⽣产的新灯管中抽取25只,测其平均寿命为1650⼩时。
问采⽤新⼯艺后,灯管的寿命是否有显著提⾼?这是⼀个均值的检验问题。
灯管的寿命有没有显著变化呢?这有两种可能:⼀种是没有什么变化。
即新⼯艺对均值没有影响,采⽤新⼯艺后,X 仍然服从)200 ,1550(2N 。
另⼀种情况可能是,新⼯艺的确使均值发⽣了显著性变化。
这样,1650=X 和15500=µ之间的差异就只能认为是采⽤新⼯艺的关系。
究竟是哪种情况与实际情况相符合,这需要作检验。
假如给定显著性⽔平05.0=α。
在上⾯的例⼦中,我们可以把涉及到的两种情况⽤统计假设的形式表⽰出来。
概率论和数理统计 假设检验
检验统计量T
X 0 S n
~ t ( n 1) —t检验法
H1 : ≠ 0 H1 : > 0 H1 : < 0
T t ( n 1);
2
T t ( n 1) T t ( n 1)
要问:两总体的均值是否有显著的差别? 应设 H0:1=2,H1: 1≠2——双边检验 要问:总体X的均值是否显著比总体Y的均值大? 应设 H0:1 ≤ 2,H1:1——单边检验 2
四、方法的步骤
13
回顾引例的解题过程 1、根据问题的要求,提出假设H0和备择假设H1。
(它的分布应不含任何未知参数,而且可以查出或算出它的分位点。)
原假设 8
二、常用的术语
备择假设
解: 今假设H0 :=0=0.5, 且记H1 :≠0=0.5,
由于X~N(0, 2),故 X ~ N ( 0 , 2 n) 当H0为真时, X 0 检验统计量 进而: U ~ N (0,1) 检 n 验 水 对于给定的 =0.05, 有
U X Y
21
1
n1
2
2 2
~
N (0,1)
n2
作为检验统计量——U检验法。 两总体X与Y的方差 12、22未知,但12=22= 2,用
T S X Y 1 1 n1 n2 ~ t ( n1 n2 2)
拒绝域
双侧检验的拒绝域取在两侧; 单边检验的拒绝域中不等式的取向与备择假设H1中不 等式的取向完全一致。
例2 在正常情况下,某工厂生产的灯泡的寿命X服从正态分布,今
测得10个灯泡寿命为: 19 1490,1440,1680,1610,1500,1750,1550,1420,1800,1580 问能否认为该工厂生产的灯泡寿命 0=1600 (=0.05)?
概率论与数理统计:假设检验
教学内容一、引入新课:假设检验能解决什么问题呢?它能解决的问题分为两大类,第一类是参数假设检验,如果总体的分布已知,但是某个参数未知,对未知参数进行检验称为参数假设检验。
第二类是非参数假设检验,这时总体的分布未知,对未知分布的类型提出假设并检验,这时非参数假设检验。
二、讲授新课:1、假设检验的基本原理:假设检验的基本过程是,对于一个统计模型,先提出一个假设,然后根据抽取的样本对假设进行检验,然后做出接受或者拒绝假设的决策。
下面通过一个例子具体地看一下假设检验的基本原理。
在一次社交聚会中,一位女士宣称,她能区分熬好的咖啡中是先加的奶还是先加的糖,并当场试验,结果8杯中判断正确7杯,问这位女士真的具有这样的鉴别能力吗?解:假设该女士不具备鉴别能力,也就是她的判断是会乱猜的,因此,每杯咖啡猜正确的概率为21。
那么,8杯中猜对7杯的以上的概率可以利用古典概型的方法计算出来,其值为0.0352这个值较小,我们认为是小概率事件。
又因为一般认为在一次试验中,小概率事件是不可能发生的,但是这个事件发生了,从而产生了矛盾。
因此,认为是假设错误,拒绝假设,也就是该女士应该是具有鉴别咖啡的能力的。
这个问题的解决就是经历了,假设、检验、决策这三个环节。
其中假设就是女士不具备鉴别能力。
检验就是在假设的条件下,计算出发生事件的概率,发现这个概率是个小概率事件,在一次试验中不可能发生。
所以,最后的决策是拒绝假设。
(1)假设检验的推理依据:小概事件在一次试验中几乎不可能发生。
因此给出小概率事件的标准记为α,一般为发生概率小于为0.05或0.01,称为叫小概率事件。
(2)假设检验的基本思想是具有概率性质的反证法。
2、假设检验的例题:例 1 某单位新购进一台设备进行测试,已知该设备的误差服从正态分布,方差为0.01,正常情况下,系统误差为0,现在实际测试16次,误差值为x1,…,xn, 计算得出样本均值为0.072,问,能否认为该设备工作正常?首先,看看本题的已知条件:机器正常时,均值0=μ,方差为0.01,抽取的样本均值为0.072,样本容量为16,最后给出小概率的标准05.0=α,这也是小概率事件的标准,也就是事件的概率小于0.05是小概率事件,否则就不是小概率事件。
概率论和数理统计假设检验
05
非参数假设检验
Wilcoxon秩和检验
总结词
用于检验两个独立样本是否来自同一 分布,特别是当样本量较小或总体分 布未知时。
详细描述
Wilcoxon秩和检验通过将每个样本的 观测值替换为其在所有观测值中的秩, 然后比较两组的秩和来进行检验。如 果两个样本来自同一分布,则它们的 秩和应该接近相等。
THANKS
感谢观看
确定检验水准
根据研究目的和样本量等因素,确定检验 水准,如α和β。
计算统计量
根据数据和选择的统计方法,计算出相应 的统计量。
选择合适的统计方法
根据数据类型和假设,选择合适的统计方 法进行检验。
单侧与双侧检验
单侧检验
只考虑一个方向的假设检验,如只考虑增加或只考虑减少。
双侧检验
同时考虑两个方向的假设检验,即同时考虑增加和减少。
检验效能
检验效能是指假设检验能够正确拒绝一个错误假设的能力。在给定样本大小的情况下,提高检验效能 可以提高假设检验的准确性。
假设检验的误用与避免
误用
假设检验的误用通常包括不恰当的假设、错 误的解读、过度推断等。这些错误可能导致 错误的结论,影响科学研究的可靠性和有效 性。
避免方法
为了避免假设检验的误用,研究者应确保假 设合理、解读准确,并避免过度推断。同时, 应采用多种方法进行验证,以提高研究的可 靠性和准确性。
方差齐性检验
01
方差齐性检验
用于检验两组数据或多个组数据的方差是否具有齐性。常 见的方差齐性检验方法包括Bartlett检验、Levene检验等 。
02
总结词
方差齐性检验是假设检验中的重要步骤,它有助于判断不 同组数据之间是否存在显著差异。
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
概率论与数理统计教案假设检验
概率论与数理统计教案-假设检验第一章:假设检验概述1.1 假设检验的定义与作用引导学生理解假设检验的基本概念解释假设检验在统计学中的重要性1.2 假设检验的基本步骤介绍假设检验的基本步骤,包括建立假设、选择显著性水平、计算检验统计量、确定决策规则和给出结论1.3 假设检验的类型解释单样本假设检验、两样本假设检验和方差分析等不同类型的假设检验第二章:单样本假设检验2.1 单样本Z检验介绍单样本Z检验的适用场景和条件解释Z检验的计算方法和步骤2.2 单样本t检验介绍单样本t检验的适用场景和条件解释t检验的计算方法和步骤2.3 单样本秩和检验介绍单样本秩和检验的适用场景和条件解释秩和检验的计算方法和步骤第三章:两样本假设检验3.1 两样本t检验介绍两样本t检验的适用场景和条件解释两样本t检验的计算方法和步骤3.2 两样本秩和检验介绍两样本秩和检验的适用场景和条件解释两样本秩和检验的计算方法和步骤3.3 配对样本t检验介绍配对样本t检验的适用场景和条件解释配对样本t检验的计算方法和步骤第四章:方差分析4.1 方差分析的适用场景和条件解释方差分析的适用场景和条件,包括完全随机设计、随机区组设计和析因设计等4.2 方差分析的计算方法介绍方差分析的计算方法,包括总平方和、组间平方和和组内平方和的计算4.3 方差分析的判断准则解释F检验的判断准则和显著性水平的确定第五章:假设检验的扩展5.1 非参数检验介绍非参数检验的概念和适用场景解释非参数检验的计算方法和步骤5.2 假设检验的优化方法介绍自助法和贝叶斯方法等假设检验的优化方法5.3 假设检验的软件应用介绍使用统计软件进行假设检验的方法和技巧第六章:卡方检验6.1 卡方检验的基本概念介绍卡方检验的定义和作用解释卡方检验在分类数据分析中的应用6.2 拟合优度检验解释拟合优度检验的概念和计算方法举例说明拟合优度检验在实际中的应用6.3 独立性检验解释独立性检验的概念和计算方法举例说明独立性检验在实际中的应用第七章:诊断性统计与效果量分析7.1 诊断性统计的概念介绍诊断性统计的定义和作用解释诊断性统计在教学评估中的应用7.2 效果量的计算方法介绍效果量的定义和计算方法解释不同效果量指标的含义和应用7.3 效果量分析的实际应用举例说明效果量分析在教学研究中的具体应用第八章:多重比较与事后检验8.1 多重比较的概念介绍多重比较的定义和作用解释多重比较在实验数据分析中的应用8.2 事后检验的方法介绍事后检验的概念和计算方法解释不同事后检验方法的原理和应用8.3 多重比较与事后检验的实际应用举例说明多重比较与事后检验在实际研究中的应用第九章:贝叶斯统计与贝叶斯推断9.1 贝叶斯统计的基本概念介绍贝叶斯统计的定义和特点解释贝叶斯统计与经典统计的区别9.2 贝叶斯推断的计算方法介绍贝叶斯推断的计算方法和步骤解释贝叶斯推断在实际中的应用9.3 贝叶斯统计软件应用介绍使用贝叶斯统计软件进行数据分析的方法和技巧第十章:假设检验的综合应用与案例分析10.1 假设检验在医学研究中的应用举例说明假设检验在医学研究中的具体应用10.2 假设检验在社会科学研究中的应用举例说明假设检验在社会科学研究中的具体应用10.3 假设检验在商业数据分析中的应用举例说明假设检验在商业数据分析中的具体应用重点和难点解析重点环节1:假设检验的定义与作用假设检验是统计学中的核心内容,理解其定义和作用对于后续的学习至关重要。
概率论与数理统计参数假设检验
μ=μ0=70
显然统计量的值t = -1.4在接受域内,所以接受H0,即可以认 为全体考生平均分为70分.
《概率统计》
返回
下页
结束
例2. 一种元件,要求使用寿命不得低于1000小时,现在从一批这种元件中随 机抽取25件,测得其使用寿命的平均值为950小时,已知该元件寿命服从标准 差σ=100小时的正态分布,试在显著性水平α=0.05下确定这批元件是否合 格.
| U |> u , U> uα , U<- uα
2
时拒绝H0,认为μ1与μ2有显著差异.
《概率统计》
返回
下页
结束
2、
2 1
,
2 2
均未知,但
2 1
=
2 2
时(t 检验)
当H0成立时,选统计量 t (n11)S12(X n2 Y1)S2 2(11)~t(n1n22)
n1n22
n1 n2
由样本计算出 t 值且对应于 α 查得临界值:
由样本观察值计 算统计量的值
第五步,作出统计推断.
统计量的值在接受域 内,则接受H0 ;在拒
绝域内,则拒绝H0
《概率统计》
返回
下页
结束
§8.2 正态总体均值的检验
一、单个正态总体均值μ的假设检验
设 X ~N(μ , σ2 ), X1,X2,…,Xn; μ0为已知数.
H0 : μ= μ0 ,
H1 : μ≠ μ0 (双侧)
结束
二、两个正态总体均值差的假设检验
设 X ~ N (μ1,σ12)
记 n X s2
1
1
则
2
X
~
N(1 ,
1
n
)
自考-概率论与数理统计 第八章 假设检验
双侧检验与单侧检验 (假设的形式)
研究的问题
假设 双侧检验 左侧检验 右侧检验
H0 H1
= 0 ≠0
0 < 0
0 > 0
双侧检验
(原假设与备择假设的确定)
1. 2.
3.
•
双侧检验属于决策中的假设检验。也就是说, 不论是拒绝 H0 还是接受 H0 ,我们都必需采 取相应的行动措施 例如,某种零件的尺寸,要求其平均长度为 10厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为 H0: 10 H1: 10
必是原假设不成立.
| X 10 | 的大小可以用来检验原假设是否成立.
合理的思路是找出一个界限K,
当 | X 10 | K 时,我们就接受原假设 H0. 当 | X 10 | K 时,我们就拒绝原假设 H0.
这里的问题是,我们如何确定常数K呢 细致的分析:
由于
X 要作出某种判断,必须从样 本(X1,X2,...,Xn)出发制定一个法则,一旦样本观察 值(x1,x2,...,xn)确定,可利用所构造的法则作出判断: 拒绝H0还是拒绝H1.这种法则称为H0对H1的一个检验 法则,简称为一个检验法则,或一个检验.
• 检验法则本质上就是把样本空间划分为两个互不相 交的子集C和C*,使得当样本(X1,X2,...,Xn)的观察值 (x1,x2,...,xn)∈C时,将拒绝原假设H0,若(x1,x2,...,xn)∈C*, 则接受原假设.这样的划分构成一个准则,称样本空间 的子集C为检验的临界域(或拒绝域).
小概率事件在一次实验中发生了,故假设不合情理, 即:否定原假设,简便方法测得均值有系统偏差.
8.1.2统计假设的概念
概率论与数理统计教案假设检验
概率论与数理统计教案-假设检验一、教学目标1. 理解假设检验的基本概念和原理;2. 学会使用假设检验方法对样本数据进行推断;3. 掌握假设检验的类型、步骤和判断准则;4. 能够运用假设检验解决实际问题。
二、教学内容1. 假设检验的基本概念和原理假设检验的定义假设检验的目的是什么假设检验的基本原理2. 假设检验的类型单样本检验双样本检验配对样本检验3. 假设检验的步骤建立假设选择检验统计量确定显著性水平计算检验统计量的值做出判断4. 假设检验的判断准则拒绝域和接受域检验的拒绝准则检验的接受准则5. 假设检验的应用实例应用假设检验解决实际问题实例分析与解答三、教学方法1. 讲授法:讲解假设检验的基本概念、原理、类型、步骤和判断准则;2. 案例分析法:分析实际问题,引导学生运用假设检验方法解决问题;3. 互动教学法:提问、讨论、解答学生提出的问题,促进学生理解和掌握知识;4. 练习法:布置课后作业,让学生巩固所学知识,提高运用能力。
四、教学准备1. 教案、教材、课件等教学资源;2. 投影仪、电脑等教学设备;3. 课后作业及答案。
五、教学过程1. 导入新课:回顾上一节课的内容,引入假设检验的基本概念和原理;2. 讲解假设检验的基本概念和原理,阐述其目的是什么;3. 讲解假设检验的类型,引导学生了解各种类型的假设检验;4. 讲解假设检验的步骤,让学生掌握进行假设检验的方法;5. 讲解假设检验的判断准则,使学生明白如何做出判断;6. 分析实际问题,引导学生运用假设检验方法解决问题;7. 布置课后作业,让学生巩固所学知识;8. 课堂小结,总结本节课的主要内容和知识点。
教学反思:在教学过程中,要注意引导学生理解和掌握假设检验的基本概念、原理和步骤,并通过实际问题让学生学会运用假设检验方法。
要关注学生的学习反馈,及时解答他们提出的问题,提高他们的学习兴趣和积极性。
六、教学评估1. 评估方式:课后作业、课堂练习、小组讨论、个人报告2. 评估内容:学生对假设检验基本概念的理解学生对假设检验类型和步骤的掌握学生对假设检验判断准则的应用学生解决实际问题的能力七、课后作业1. 完成教材后的练习题2. 选择一个实际问题,运用假设检验方法进行分析和解答3. 总结本节课的主要内容和知识点,写下自己的学习心得八、课堂练习1. 例题解析:分析教材中的例题,理解假设检验的步骤和判断准则2. 小组讨论:分组讨论课后作业中的问题,共同解决问题,交流学习心得3. 个人报告:选取一个实际问题,进行假设检验的分析和解题过程报告九、教学拓展1. 假设检验的扩展知识:学习其他类型的假设检验方法,如非参数检验、方差分析等2. 实际应用案例:搜集更多的实际问题,进行假设检验的分析和解答3. 软件操作实践:学习使用统计软件进行假设检验,提高数据分析能力十、教学计划1. 下一节课内容预告:介绍假设检验的扩展知识和实际应用案例2. 学习任务布置:预习下一节课的内容,准备相关问题和建议3. 课后自学计划:鼓励学生自主学习,深入了解假设检验的方法和应用教学反思:在完成本节课的教学后,要关注学生的学习情况,及时解答他们提出的问题,并提供必要的辅导。
概率论与数理统计第6章 假设检验
42
43
44
6.5 非正态总体下参数检验的大样本方法
前面我们介绍的是在正态总体情况下的参数检验, 但实际问题中还会遇到在非正态总体且是小样本情况下 的参数检验问题,这类问题中还可能有对总体的分布也 不清楚而要进行参数检验的,这就更难了.若求出了该总 体的精确分布,但能否查到相应的分位数也不易解决.要 进行这样的参数检验,一般的做法就是采用大样本抽样, 应用中心极限定理及正态总体下的检验理论来处理,下 面就此问题作一些简介.
11
作用,故实际问题中确定原假设应是很慎重的.在应 用中有可能对同一问题若提出了不同的原假设,而得出 了完全不同的结论,检验结果都不否定各给的原假设H0, 出现矛盾,这就要看你是要“保护”哪一个来取原假设. 一般将有把握的、不愿轻易被否定的事情作为原假设, 而将把握性不大、不能轻易肯定的事情作为备择假设.
4
6.1.3 犯两类错误问题
5
6
7
8
6.1.4 显著性检验——小概率原则 针对涉及的这些问题,在选择检验时,有一些不同 的处理方法,本书介绍奈曼(Neyman)和皮尔逊 (Pearson)原则(另有α水平最大功效检验、序贯检验 等本书不介绍).这个原则是考虑将样本容量n固定,使 犯第一类错误的概率α很小,即让α受到控制,使原假设 得到保护,不至于轻易被否定,在此原则下再适当考虑 犯第二类错误概率β的大小,这种检验称为α水平下的显 著性检验.此检验法具体的就是使犯第一类错误概率α不 超过某一给定的常数α0(0<α0<1),α0是
18
19
20
21
22
23
24
6.2.2 双正态总体均值的检验——U检验或T检验
25
26
27
6.2.3 双正态总体方差未知时均值检验的近似解法 上面我们讨论的是两个正态总体方差已知或者未知 但相等情况下均值的检验,在一些实际问题中关于方差 的情况不清楚时,要比较两总体的均值,应如何进行? 下面介绍两种近似解法,这里“近似”之意是指,所得 到的检验的显著水平未必严格地等于给定的α,而只是 近似等于. (1)当n1,n2都充分大时,应用大样本理论可知
概率论与数理统计第八章 假设检验
第八章假设检验第一节概述统计推断中的另一类重要问题是假设检验(Hypothesis testing).当总体的分布函数未知,或只知其形式而不知道它的参数的情况时,我们常需要判断总体是否具有我们所感兴趣的某些特性.这样,我们就提出某些关于总体分布或关于总体参数的假设,然后根据样本对所提出的假设作出判断:是接受还是拒绝.这就是本章所要讨论的假设检验问题.我们先从下面的例子来说明假设检验的一般提法.例8.1某工厂用包装机包装奶粉,额定标准为每袋净重0.5kg.设包装机称得奶粉重量X服从正态分布N(μ,σ2).根据长期的经验知其标准差σ=0.015(kg).为检验某台包装机的工作是否正常;随机抽取包装的奶粉9袋,称得净重(单位:kg)为0.499 0.515 0.508 0.512 0.4980.515 0.516 0.513 0.524问该包装机的工作是否正常?由于长期实践表明标准差比较稳定,于是我们假设X~N(μ,0.0152).如果奶粉重量X 的均值μ等于0.5kg,我们说包装机的工作是正常的.于是提出假设:H0:μ=μ0=0.5;H1:μ≠μ0=0.5.这样的假设叫统计假设.1.统计假设关于总体X的分布(或随机事件之概率)的各种论断叫统计假设,简称假设,用“H”表示,例如:(1)对于检验某个总体X的分布,可以提出假设:H0:X服从正态分布,H1: X不服从正态分布.H0:X服从泊松分布,H1: X不服从泊松分布.(2)对于总体X的分布的参数,若检验均值,可以提出假设:H0:μ=μ0;H1:μ≠μ0.H0:μ≤μ0;H1:μ>μ0.若检验标准差,可提出假设:H0:σ=σ0;H1:σ≠σ0.H0:σ≥σ0;H1:σ<σ0.这里μ0,σ0是已知数,而μ=E(X),σ2=D(X)是未知参数.上面对于总体X的每个论断,我们都提出了两个互相对立的(统计)假设:H0和H1,显然,H0与H1只有一个成立,或H0真H1假,或H0假H1真,其中假设H0,称为原假设(Original hypothesis)(又叫零假设、基本假设),而H1称为H0的对立假设(又叫备择假设).在处理实际问题时,通常把希望得到的陈述视为备择假设,而把这一陈述的否定作为原假设.例如在上例中,H0:μ=μ0=0.5为原假设,它的对立假设是H1:μ≠μ0=0.5.统计假设提出之后,我们关心的是它的真伪.所谓对假设H0的检验,就是根据来自总体的样本,按照一定的规则对H0作出判断:是接受,还是拒绝,这个用来对假设作出判断的规则叫做检验准则,简称检验,如何对统计假设进行检验呢?我们结合上例来说明假设检验的基本思想和做法.2.假设检验的基本思想 在例8.1中所提假设是H 0:μ=μ0=0.5(备择假设H 1:μ≠μ0).由于要检验的假设涉及总体均值μ,故首先想到是否可借助样本均值这一统计量来进行判断.从抽样的结果来看,样本均值x =19(0.499+0.515+0.508+0.512+0.498+0.515+0.516+0.513+0.524)=0.5110,与μ=0.5之间有差异.对于与μ0之间的差异可以有两种不同的解释.(1) 统计假设H 0是正确的,即μ=μ0=0.5,只是由于抽样的随机性造成了与μ0之间的差异;(2) 统计假设H 0是不正确的,即μ≠μ0=0.5,由于系统误差,也就是包装机工作不正常,造成了与μ0之间的差异.对于这两种解释到底哪一种比较合理呢?为了回答这个问题,我们适当选择一个小正数α(α=0.1,0.05等),叫做显著性水平(Level of significance).在假设H0成立的条件下,确定统计量X -μ0的临界值αλ,使得事件{|X -μ0|>αλ}为小概率事件,即P{|X -μ0|>αλ}=α.(8.1)例如,取定显著性水平α=0.05.现在来确定临界值λ0.05.因为X ~N (μ,σ2),当H 0:μ=μ0=0.5为真时,有X ~N (μ0,σ2),于是2011~,n i i X X N n n σμ=⎛⎫= ⎪⎝⎭∑,ZX X =N (0,1),所以 P {|Z |>z α/2}=α.由(8.1)式,有P Z ⎧>⎨⎩=α,因此22,z z αααλ==λ0.05=z 0.0250.015/3=0.0098. 故有P {|X -μ0|>0.0098}=0.05.因为α=0.05很小,根据实际推断原理,即“小概率事件在一次试验中几乎是不可能发生的”原理,我们认为当H 0为真时,事件{|X -μ0|>0.0098}是小概率事件,实际上是不可能发生的.现在抽样的结果是|x -μ0|=|0.5110-0.5|=0.0110>0.0098.也就是说,小概率事件{|X -μ0|>0.0098}居然在一次抽样中发生了,这说明抽样得到的结果与假设H 0不相符,因而不能不使人怀疑假设H 0的正确性,所以在显著性水平α=0.05下, 我们拒绝H 0,接受H 1,即认为这一天包装机的工作是不正常的.通过上例的分析,我们知道假设检验的基本思想是小概率事件原理,检验的基本步骤是: (1) 根据实际问题的要求,提出原假设H 0及备择假设H 1;(2) 选取适当的显著性水平α(通常α=0.10,0.05等)以及样本容量n ;(3) 构造检验用的统计量U ,当H 0为真时,U 的分布要已知,找出临界值αλ使P {|U |>αλ}=α.我们称|U |>αλ所确定的区域为H 0的拒绝域(Rejection region),记作W ; (4) 取样,根据样本观察值,计算统计量U 的观察值U 0;(5) 作出判断,将U 的观察值U 0与临界值αλ比较,若U 0落入拒绝域W 内,则拒绝H 0接受H 1;否则就说H 0相容(接受H 0).3.两类错误由于我们是根据样本作出接受H 0或拒绝H 0的决定,而样本具有随机性,因此在进行判断时,我们可能会犯两个方面的错误:一类错误是,当H 0为真时,而样本的观察值U 0落入拒绝域W 中,按给定的法则,我们拒绝了H 0,这种错误称为第一类错误.其发生的概率称为犯第一类错误的概率或称弃真概率,通常记为α,即P {拒绝H 0|H 0为真}=α;另一种错误是,当H 0不真时,而样本的观察值落入拒绝域W 之外,按给定的检验法则,我们却接受了H 0.这种错误称为第二类错误,其发生的概率称为犯第二类错误的概率或取伪概率,通常记为β,即P {接受H 0|H 0不真}=β.显然这里的α就是检验的显著性水平.总体与样本各种情况的搭配见表8-1.表8-1对给定的一对H 0和H 1,总可以找到许多拒绝域W .当然我们希望寻找这样的拒绝域W ,使得犯两类错误的概率α与β都很小.但是在样本容量n 固定时,要使α与β都很小是不可能的,一般情形下,减小犯其中一类错误的概率,会增加犯另一类错误的概率,它们之间的关系犹如区间估计问题中置信水平与置信区间的长度的关系那样.通常的做法是控制犯第一类错误的概率不超过某个事先指定的显著性水平α(0<α<1),而使犯第二类错误的概率也尽可能地小.具体实行这个原则会有许多困难,因而有时把这个原则简化成只要求犯第一类错误的概率等于α,称这类假设检验问题为显著性检验问题,相应的检验为显著性检验.在一般情况下,显著性检验法则是较容易找到的,我们将在以下各节中详细讨论.在实际问题中,要确定一个检验问题的原假设,一方面要根据问题要求检验的是什么,另一方面要使原假设尽量简单,这是因为在下面将讲到的检验法中,必须要了解某统计量在原假设成立时的精确分布或渐近分布.下面各节中,我们先介绍正态总体下参数的几种显著性检验,再介绍总体分布函数的假设检验.第二节 单个正态总体的假设检验1.单个正态总体数学期望的假设检验(1) σ2已知关于μ的假设检验(Z 检验法(Z -test)) 设总体X ~N (μ,σ2),方差σ2已知,检验假设H 0:μ=μ0;H 1:μ≠μ0 (μ0为已知常数) 由X ~N (μ,n σ)X N (0,1), 我们选取ZX (8.2)作为此假设检验的统计量,显然当假设H 0为真(即μ=μ0正确)时,Z ~N (0,1),所以对于给定的显著性水平α,可求z α/2使P {|Z |>z α/2}=α,见图8-1,即P {Z <-z α/2}+P {Z >z α/2}=α.从而有P {Z >z α/2}=α/2, P {Z ≤z α/2}=1-α/2.图8-1利用概率1-α/2,反查标准正态分布函数表,得双侧α分位点(即临界值)z α/2. 另一方面,利用样本观察值x 1,x 2,…,x n 计算统计量Z 的观察值z 0x (8.3)如果:(a )|z 0|>z α/2,则在显著性水平α下,拒绝原假设H 0(接受备择假设H 1),所以|z 0|>z α/2便是H0的拒绝域.(b ) |z 0|≤z α/2,则在显著性水平α下,接受原假设H 0,认为H 0正确.这里我们是利用H0为真时服从N (0,1)分布的统计量Z 来确定拒绝域的,这种检验法称为Z 检验法(或称U 检验法).例8.1中所用的方法就是Z 检验法.为了熟悉这类假设检验的具体作法,现在我们再举一例.例8.2 根据长期经验和资料的分析,某砖厂生产的砖的“抗断强度”X 服从正态分布,方差σ2=1.21.从该厂产品中随机抽取6块,测得抗断强度如下(单位:kg ·cm -2):32.56 29.66 31.64 30.00 31.87 31.03检验这批砖的平均抗断强度为32.50kg ·cm -2是否成立(取α=0.05,并假设砖的抗断强度的方差不会有什么变化)?解 ① 提出假设H 0:μ=μ0=32.50;H 1:μ≠μ0. ② 选取统计量ZX ,若H 0为真,则Z ~N (0,1).③ 对给定的显著性水平α=0.05,求z α/2使P {|Z |>z α/2}=α,这里z σ/2=z 0.025=1.96.④ 计算统计量Z 的观察值:|z 0| ≈3.05.⑤ 判断:由于|z 0|=3.05>z 0.025=1.96,所以在显著性水平α=0.05下否定H 0,即不能认为这批产品的平均抗断强度是32.50 kg ·cm -2.把上面的检验过程加以概括,得到了关于方差已知的正态总体期望值μ的检验步骤: (a ) 提出待检验的假设H 0:μ=μ0;H 1:μ≠μ0. (b ) 构造统计量Z ,并计算其观察值z 0:ZX ,z 0x(c ) 对给定的显著性水平α,根据P {|Z |>z α/2}=α,P {Z >z α/2}=α/2,P {Z ≤z α/2}=1-α/2查标准正态分布表,得双侧α分位点z α/2. (d ) 作出判断:根据H 0的拒绝域 若|z 0|>z α/2,则拒绝H 0,接受H 1; 若|z 0|≤z α/2,则接受H 0.(2) 方差σ2未知,检验μ(t 检验法(t -test)) 设总体X ~N (μ,σ2),方差σ2未知,检验H 0:μ=μ0;H 1:μ≠μ0.由于σ2X 便不是统计量,这时我们自然想到用σ2的无偏估计量——样本方差S 2代替σ2,由于X t (n -1),故选取样本的函数tX (8.4)图8-2作为统计量,当H 0为真(μ=μ0)时t ~t (n -1),对给定的检验显著性水平α,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2,见图8-2,直接查t 分布表,得t 分布分位点t α/2(n -1).利用样本观察值,计算统计量t 的观察值t 0x 因而原假设H0的拒绝域为|t 0|>t α/2(n -1). (8.5)所以,若|t 0|>t α/2(n -1),则拒绝H 0,接受H 1;若|t 0|≤t α/2(n -1),则接受原假设H 0.上述利用t 统计量得出的检验法称为t 检验法.在实际中,正态总体的方差常为未知,所以我们常用t 检验法来检验关于正态总体均值的问题.例8.3 用某仪器间接测量温度,重复5次,所得的数据是1250°,1265°,1245°,1260°,1275°,而用别的精确办法测得温度为1277°(可看作温度的真值),试问此仪器间接测量有无系统偏差?这里假设测量值X 服从N (μ,σ2)分布. 解 问题是要检验H 0:μ=μ0=1277;H 1:μ≠μ0.由于σ2未知(即仪器的精度不知道),我们选取统计量tX .当H 0为真时,t ~t (n -1),t 的观察值为|t 0|185.399-==>3.对于给定的检验水平α=0.05,由P {|t |>t α/2(n -1)}=α, P {t >t α/2(n -1)}=α/2, P {t >t 0.025(4)}=0.025,查t 分布表得双侧α分位点t α/2(n -1)=t 0.025(4)=2.776.因为|t 0|>3>t 0.025(4)=2.776,故应拒绝H 0,认为该仪器间接测量有系统偏差.(3) 双边检验与单边检验上面讨论的假设检验中,H 0为μ=μ0,而备择假设H 1:μ≠μ0意思是μ可能大于μ0,也可能小于μ0,称为双边备择假设,而称形如H 0:μ=μ0,H 1:μ≠μ0的假设检验为双边检验.有时我们只关心总体均值是否增大,例如,试验新工艺以提高材料的强度,这时所考虑的总体的均值应该越大越好,如果我们能判断在新工艺下总体均值较以往正常生产的大,则可考虑采用新工艺.此时,我们需要检验假设H 0:μ=μ0;H 1:μ>μ0. (8.6)(我们在这里作了不言而喻的假定,即新工艺不可能比旧的更差),形如(8.6)的假设检验,称为右边检验,类似地,有时我们需要检验假设H 0:μ=μ0;H 1:μ<μ0. (8.7)形如(8.7)的假设检验,称为左边检验,右边检验与左边检验统称为单边检验.下面来讨论单边检验的拒绝域. 设总体X ~N (μ,σ2),σ2为已知,x 1,x 2,…,x n 是来自X 的样本观察值.给定显著性水平α,我们先求检验问题H 0:μ=μ0;H 1:μ>μ0.的拒绝域.取检验统计量ZX ,当H 0为真时,Z 不应太大,而在H 1为真时,由于X 是μ的无偏估计,当μ偏大时,X 也偏大,从而Z 往往偏大,因此拒绝域的形式为ZX ≥k ,k 待定.因为当H 0X ~N (0,1),由P {拒绝H 0|H 0为真}=PX k ⎫≥⎬⎭=α得k =z α,故拒绝域为ZX ≥z α. (8.8)类似地,左边检验问题H 0:μ=μ0;H 1:μ<μ0.的拒绝域为ZX ≤-z α. 8.9)例8.4 从甲地发送一个信号到乙地,设发送的信号值为μ,由于信号传送时有噪声迭加到信号上,这个噪声是随机的,它服从正态分布N (0,22),从而乙地接到的信号值是一个服从正态分布N (μ,22)的随机变量.设甲地发送某信号5次,乙地收到的信号值为: 8.4 10.5 9.1 9.6 9.9由以往经验,信号值为8,于是乙方猜测甲地发送的信号值为8,能否接受这种猜测?取α=0.05.解 按题意需检验假设H 0:μ=8;H 1:μ>8.这是右边检验问题,其拒绝域如(8.8)式所示, 即 Z =X ≥z 0.05=1.645.而现在z 0=1.68>1.645,所以拒绝H 0,认为发出的信号值μ>8.2.单个正态总体方差的假设检验(2χ检验法(2χ-test)) (1) 双边检验设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2=σ02;H 1:σ2≠σ2.其中σ02为已知常数.由于样本方差S 2是σ2的无偏估计,当H 0为真时,比值22S σ一般来说应在1附近摆动,而不应过分大于1或过分小于1,由第六章知当H 0为真时2χ=220(1)n S σ-~2χ(n -1). (8.10)所以对于给定的显著性水平α有(图8-3)图8-3P {21/2αχ-(n -1)≤2χ≤2/2αχ(n -1)}=1-α. (8.11)对于给定的α,查2χ分布表可求得2χ分布分位点21/2αχ-(n -1)与2/2αχ(n -1).由(8.11)知,H 0的接受域是21/2αχ- (n -1)≤2χ≤2/2αχ (n -1); (8.12)H 0的拒绝域为2χ<21/2αχ-(n -1)或2χ>2/2αχ(n -1). (8.13)这种用服从2χ分布的统计量对个单正态总体方差进行假设检验的方法,称为2χ检验法. 例8.5 某厂生产的某种型号的电池,其寿命长期以来服从方差σ2=5000(小时2)的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动性有所改变,现随机抽取26只电池,测得其寿命的样本方差s 2=9200(小时2).问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化(取α=0.02)?解 本题要求在α=0.02下检验假设H 0:σ2=5000;H 1:σ2≠5000.现在n =26,2/2αχ(n -1)=20.01(25)χ=44.314,21/2αχ- (n -1)= 20.99(25)χ=11.524,σ02=5000.由(8.13)拒绝域为2σ>44.314或220(1)n s σ-<11.524由观察值s 2=9200得22(1)n s σ-=46>44.314,所以拒绝H 0,认为这批电池寿命的波动性较以往有显著的变化.(2) 单边检验(右检验或左检验) 设总体X ~N (μ,σ2),μ未知,检验假设H 0:σ2≤σ02;H 1:σ2>σ02.(右检验)由于X ~N (μ,σ2),故随机变量*2χ=22(1)n S σ-~2χ(n -1).当H 0为真时,统计量2χ=22(1)n S σ-≤*2χ.对于显著性水平α,有P {*2χ>2αχ(n -1)}=α图8-4(图8-4).于是有P {2χ>2αχ(n -1)}≤P {*2χ>2αχ(n -1)}=α.可见,当α很小时,{2χ>2αχ(n -1)}是小概率事件,在一次的抽样中认为不可能发生,所以H 0的拒绝域是:2χ=22(1)n S σ->2αχ(n -1)(右检验). (8.14)类似地,可得左检验假设H 0:σ2≥σ02,H 1:σ2<σ2的拒绝域为2χ<21αχ-(n -1)(左检验). (8.15) 例8.6 今进行某项工艺革新,从革新后的产品中抽取25个零件,测量其直径,计算得样本方差为s 2=0.00066,已知革新前零件直径的方差σ2=0.0012,设零件直径服从正态分布,问革新后生产的零件直径的方差是否显著减小?(α=0.05)解 (1) 提出假设H 0:σ2≥σ02=0.0012;H 1:σ2<σ02. (2) 选取统计量2χ=22(1)n S σ-.*2χ=22(1)n S σ-~2χ(n -1),且当H 0为真时,*2χ≤2χ(3) 对于显著性水平α=0.05,查2χ分布表得21αχ-(n -1)=20.95(24)χ=13.848,当H 0为真时,P {2χ<21αχ- (n -1)}≤P 2212(1)(1)n S n αχσ-⎧⎫-<-⎨⎬⎩⎭=α. 故拒绝域为2χ<21αχ- (n -1)=13.848.(4) 根据样本观察值计算2χ的观察值2χ=220(1)240.000660.0012n s σ-⨯==13.2.(5) 作判断:由于2χ=13.2<21αχ- (n -1)=13.848,即2χ落入拒绝域中,所以拒绝H 0:σ2≥σ02,即认为革新后生产的零件直径的方差小于革新前生产的零件直径的方差.最后我们指出,以上讨论的是在均值未知的情况下,对方差的假设检验,这种情况在实际问题中较多.至于均值已知的情况下,对方差的假设检验,其方法类似,只是所选的统计量为2χ=2120()nii Xμσ=-∑.当σ2=σ2为真时,2χ~2χ(n ).关于单个正态总体的假设检验可列表8-2.表8-2注:上表中H0中的不等号改成等号,所得的拒绝域不变.第三节两个正态总体的假设检验上一节介绍了单个正态总体的数学期望与方差的检验问题,在实际工作中还常碰到两个正态总体的比较问题.1.两正态总体数学期望假设检验(1)方差已知,关于数学期望的假设检验(Z检验法)设X~N(μ1,σ12),Y~N(μ2,σ22),且X,Y相互独立,σ12与σ22已知,要检验的是H0:μ1=μ2;H1:μ1≠μ2.(双边检验)怎样寻找检验用的统计量呢?从总体X 与Y 中分别抽取容量为n 1,n 2的样本X 1,X 2,…,1n X 及Y 1,Y 2,…,2n Y ,由于2111~,X N n σμ⎛⎫ ⎪⎝⎭,2222~,Y N n σμ⎛⎫⎪⎝⎭,E (X -Y )=E (X )-E (Y )=μ1-μ2, D (X -Y )=D (X )+D (Y )=221212n n σσ+,故随机变量X -Y 也服从正态分布,即X -Y ~N (μ1-μ2,221212n n σσ+).从而X Y ~N (0,1).于是我们按如下步骤判断.(a ) 选取统计量 ZX Y , (8.16)当H 0为真时,Z ~N (0,1).(b ) 对于给定的显著性水平α,查标准正态分布表求z α/2使P {|Z |>z α/2}=α,或P {Z ≤z α/2}=1-α/2. (8.17) (c ) 由两个样本观察值计算Z 的观察值z 0:z 0x y .(d ) 作出判断:若|z 0|>z α/2,则拒绝假设H 0,接受H 1; 若|z 0|≤z α/2,则与H 0相容,可以接受H 0.例8.7 A ,B 两台车床加工同一种轴,现在要测量轴的椭圆度.设A 车床加工的轴的椭圆度X ~N (μ1,σ12),B 车床加工的轴的椭圆度Y ~N (μ2,σ22),且σ12=0.0006(mm 2),σ22=0.0038(mm 2),现从A ,B 两台车床加工的轴中分别测量了n 1=200,n 2=150根轴的椭圆度,并计算得样本均值分别为=0.081(mm),=0.060(mm).试问这两台车床加工的轴的椭圆度是否有显著性差异?(给定α=0.05)解 ① 提出假设H 0:μ1=μ2;H 1:μ1≠μ2. ② 选取统计量ZX Y ,在H 0为真时,Z ~N (0,1).③ 给定α=0.05,因为是双边检验,α/2=0.025.P {|Z |>z α/2}=0.05, P {Z >z α/2}=0.025,P {Z ≤z α/2}=1-0.025=0.975.查标准正态分布表,得z α/2=z 0.025=1.96.④ 计算统计量Z 的观察值zz 0x y =.⑤ 作判断:由于|z 0|=3.95>1.96=z α/2,故拒绝H 0,即在显著性水平α=0.05下,认为两台车床加工的轴的椭圆度有显著差异.用Z 检验法对两正态总体的均值作假设检验时,必须知道总体的方差,但在许多实际问题中总体方差σ12与σ22往往是未知的,这时只能用如下的t 检验法.(2) 方差σ12,σ22未知,关于均值的假设检验(t 检验法) 设两正态总体X 与Y 相互独立,X ~N (μ1,σ12),Y ~N (μ2,σ22),σ12,σ22未知,但知σ12=σ22,检验假设H 0:μ1=μ2;H 1:μ1≠μ2.(双边检验) 从总体X ,Y 中分别抽取样本X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y ,则随机变量tX Y μμ---t (n 1+n 2-2),式中S w 2=22112212(1)(1)2n S n S n n -+-+-,S 12,S 22分别是X 与Y 的样本方差.当假设H 0为真时,统计量t ~t (n 1+n 2-2). (8.18)对给定的显著性水平α,查t 分布得t α/2(n 1+n 2-2),使得P {|t |>t α/2(n 1+n 2-2)}=α. (8.19)再由样本观察值计算t 的观察值t 0x y(8.20)最后作出判断:若|t 0|>t α/2(n 1+n 2-2),则拒绝H 0; 若|t 0|≤t α/2(n 1+n 2-2),则接受H 0.例8.8 在一台自动车床上加工直径为2.050毫米的轴,现在每相隔两小时,各取容量都为10的样本,所得数据列表如表8-3所示.12是未知常数.问这台自动车床的工作是否稳定?(取α=0.01)解 这里实际上是已知σ12=σ22=σ2,但σ2未知的情况下检验假设H 0:μ1=μ2;H 1:μ1≠μ2.我们用t 检验法,由样本观察值算得:x =2.063, y =2.059,s 12=0.00000956, s 22=0.00000489,s w 2=2212990.0000860.0000441010218s s ⨯+⨯+=+-=0.0000072.由(8.20)式计算得t 0=3.3.对于α=0.01,查自由度为18的t 分布表得t 0.005(18)=2.878.由于|t 0|=3.3>t 0.005(18)=2.878,于是拒绝原假设H 0:μ1=μ2.这说明两个样本在生产上是有差异的,可能这台自动车床受时间的影响而生产不稳定.2. 两正态总体方差的假设检验(F 检验法(F -test )) (1) 双边检验设两正态总体X ~N (μ1,σ12),Y ~N (μ2,σ22),X 与Y 独立,X 1,X 2,…,1n X 与Y 1,Y 2,…,2n Y 分别是来自这两个总体的样本,且μ1与μ2未知.现在要检验假设H 0:σ12=σ22;H 1:σ12≠σ22.在原假设H 0成立下,两个样本方差的比应该在1附近随机地摆动,所以这个比不能太大又不能太小.于是我们选取统计量F =2122S S . (8.21) 显然,只有当F 接近1时,才认为有σ12=σ22.由于随机变量F *=22112222//S S σσ ~F (n 1-1,n 2-1),所以当假设H 0:σ12=σ22成立时,统计量F =2122S S ~F (n 1-1,n 2-1). 对于给定的显著性水平α,可以由F 分布表求得临界值12a F-(n 1-1,n 2-1)与F α/2(n 1-1,n 2-1)使得 P { 12a F-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1)}=1-α(图8-5),由此可知H 0的接受区域是12aF-(n 1-1,n 2-1)≤F ≤F α/2(n 1-1,n 2-1);而H 0的拒绝域为F <12a F-(n 1-1,n 2-1),或 F >F α/2(n 1-1,n 2-1).然后,根据样本观察值计算统计量F 的观察值,若F 的观察值落在拒绝域中,则拒绝H 0,接受H 1;若F 的观察值落在接受域中,则接受H 0.图8-5例8.9 在例8.8中我们认为两个总体的方差σ12=σ22,它们是否真的相等呢?为此我们来检验假设H 0:σ12=σ22(给定α=0.1).解 这里n 1=n 2=10,s 12=0.00000956,s 22=0.00000489,于是统计量F 的观察值为F =0.00000956/0.00000489=1.95.查F 分布表得F α/2(n 1-1,n 2-1)=F 0.05(9,9)=3.18,F 1-α/2(n 1-1,n 2-1)=F 0.95(9,9)=1/F 0.05(9,9)=1/3.18.由样本观察值算出的F 满足F 0.95(9,9)=1/3.18<F =1.95<3.18=F 0.05(9,9).可见它不落入拒绝域,因此不能拒绝原假设H 0:σ12=σ22,从而认为两个总体的方差无显著差异.注意:在μ1与μ2已知时,要检验假设H 0:σ12=σ22,其检验方法类同均值未知的情况,此时所采用的检验统计量是:F =12211122121()1()n i i n i i X n Y n μμ==--∑∑~F (n 1,n 2). 其拒绝域参看表8-4.表8-4(2) 单边检验可作类似的讨论,限于篇幅,这里不作介绍了.第四节总体分布函数的假设检验上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的χ检验法.假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2χ检验法是在总体的分布为未知时,根据样本值x1,x2,…,x n来检验关于总体所谓2分布的假设H0:总体X的分布函数为F(x);H1:总体X的分布函数不是F(x)(8.22)的一种方法(这里的备择假设H1可不必写出).注意,若总体X为离散型,则假设(8.22)相当于H0:总体X的分布律为P{X=x i}=p i,i=1,2,…;(8.23)若总体X为连续型,则假设(8.22)相当于H0:总体X的概率密度为f(x). (8.24)在用2χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.2χ检验法的基本思想与方法如下:(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1ki i A ==Ω,A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率if n与概率ˆi p往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下ˆii f p n-的值应该比较小,基于这种想法,皮尔逊使用 2χ=21ˆ()ˆki i i if npnp =-∑ (8.25) 作为检验H 0的统计量,并证明了如下的定理.定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2χ分布,其中r 是被估计的参数的个数.(3) 对于给定的检验水平α,查表确定临界值2(1)k r αχ--使P {2χ>2(1)k r αχ--)}=α,从而得到H 0的拒绝域为2χ>2(1)k r αχ--).(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2(1)k r αχ--比较.(5) 作结论:若2χ>2(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.i =0.05)?解 由题意首先提出假设:H 0:总体X 服从泊松分布.P {X =i }=!e ii λλ-,i =0,1,2,…,这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得03614061ˆ+70100x λ⨯+⨯++⨯⨯===1.将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计111ˆˆ{}!!e e i p P X i i i --====,i =0,1,2,….例如10ˆˆ{0},e pP X -=== 11ˆˆ{1},e pP X -=== 12ˆˆ{2},2e pP X -=== ………………166701ˆˆˆ{7}11.!e i i i pP X p i -===≥=-=-∑∑ 计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故24221ˆ()~(411).ˆi i i i f npnp χχ=-=--∑计算结果为2χ=1.460(表8-6).因为220.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布. 表8-68-7).n =61ii f=∑=200.要求在给定的检验水平α=0.05下检验假设H 0:抗压强度X ~N (μ,σ2).解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.由第七章知,μ与σ2的极大似然估计值为ˆx μ=, 2211ˆ()ni i x x n σ==-∑. 设*i x 为第i 组的组中值,我们有*1195102052624514200i ii x x f n ⨯+⨯++⨯==∑=221,{}2*222211ˆ()(26)10(16)262414200i ii x x f n σ=-=-⨯+-⨯++⨯∑=152,ˆσ=12.33. 原假设H 0改写成X 是正态N (221,12.332)分布,计算每个区间的理论概率值{}11ˆ()()i i i i i pP a X a μμΦΦ--=≤<=-, i =1,2,…,6, 其中ˆi i a xμσ-=, 22()i t i t μμ--∞=e d Φ. 为了计算出统计量2χ之值,我们把需要进行的计算列表如下(表8-8).表8-8从上面计算得出2χ的观察值为1.35.在检验水平α=0.05下,查自由度m =6-2-1=3的2χ分布表,得到临界值20.05(3)χ=7.815.由于2χ=1.35<7.815=20.05(3)χ,不能拒绝原假设,所以认为混凝土制件的抗压强度的分布是正态分布N (221,152).小 结有关总体分布的未知参数或未知分布形式的种种论断叫做统计假设.一般统计假设分为原假设H 0(在实际问题中至关重要的假设)及与原假设H 0对立假设即是备择假设H 1.假设检验就是人们根据样本提供的信息作出“接受H 0、拒绝H 1”或“拒绝H 0、接受H 1”的判断.假设检验的思想是小概率原理,即小概率事件在一次试验中几乎不会发生.这种原理是人们处理实际问题中公认的原则.由于样本的随机性,当H 0为真时,我们可能会作出拒绝H 0、接受H 1的错误判断(弃当样本容量n 固定时,我们无法同时控制犯二类错误,即减小犯第一类错误的概率,就会增大犯第二类错误的概率,反之亦然.在假设检验中我们主要控制(减小)犯第一类错误的概率.使P {拒绝H 0|H 0为真}≤α,其中α很小.(0<α<1),α称为检验的显著性水平,这种只对犯第一类错误的概率加以控制而不考虑犯第二类错误的概率的检验称为显著性假设检验.单个、两个正态总体的均值、方差的假设检验是本章重点问题,读者需掌握Z 检验法、2χ检验法、t 检验法等.这些检验法中原假设H 0备择假设H 1及H 0的拒绝域分别见表8-2、表8-4.重要术语及主题原假设 备择假设 检验统计量 单边检验 双边检验 显著性水平 拒绝域 显著性检验 一个正态总体的参数的检验 两个正态总体均值差、方差比的检验 总体分布函数的假设检验习 题 八1. 已知某炼铁厂的铁水含碳量在正常情况下服从正态分布N (4.55,0.1082).现在测了5炉铁水,其含碳量(%)分别为4.28 4.40 4.42 4.35 4.37问若标准差不改变,总体平均值有无显著性变化(α=0.05)? 2.某种矿砂的5个样品中的含镍量(%)经测定为:3.24 3.26 3.24 3.27 3.25设含镍量服从正态分布,问在α=0.01下能否接收假设:这批矿砂的含镍量为3.25. 3.在正常状态下,某种牌子的香烟一支平均1.1克,若从这种香烟堆中任取36支作为样本;测得样本均值为1.008(克),样本方差s 2=0.1(克2).问这堆香烟是否处于正常状态.已知香烟(支)的重量(克)近似服从正态分布(取α=0.05).4.某公司宣称由他们生产的某种型号的电池其平均寿命为21.5小时,标准差为2.9小时.在实验室测试了该公司生产的6只电池,得到它们的寿命(以小时计)为19,18,20,22,16,25,问这些结果是否表明这种电池的平均寿命比该公司宣称的平均寿命要短?设电池寿命近似地服从正态分布(取α=0.05).5.测量某种溶液中的水分,从它的10个测定值得出x =0.452(%),s =0.037(%).设测定值总体为正态,μ为总体均值,σ为总体标准差,试在水平α=0.05下检验. (1) H 0:μ=0.5(%);H 1:μ<0.5(%).(2)0H ':σ=0.04(%);1H ':σ<0.04(%). 6.某种导线的电阻服从正态分布N (μ,0.0052).今从新生产的一批导线中抽取9根,测其电阻,得s =0.008欧.对于α=0.05,能否认为这批导线电阻的标准差仍为0.005? 7.有两批棉纱,为比较其断裂强度,从中各取一个样本,测试得到: 第一批棉纱样本:n 1=200,x =0.532kg, s 1=0.218kg ; 第二批棉纱样本:n 2=200,x =0.57kg, s 2=0.176kg .设两强度总体服从正态分布,方差未知但相等,两批强度均值有无显著差异?(α=0.05) 8.两位化验员A ,B 对一种矿砂的含铁量各自独立地用同一方法做了5次分析,得到样本方差分别为0.4322(%2)与0.5006(%2).若A ,B 所得的测定值的总体都是正态分布,其方差分别为σA 2,σB 2,试在水平α=0.05下检验方差齐性的假设H 0:σA 2=σB 2; H 1:σA 2≠σB 2.9.在π的前800位小数的数字中,0,1,…,9相应的出现了74,92,83,79,80,73,77,75,76,91次.试用2χ检验法检验假设H 0:P (X =0)=P (X =1)=P (X =2)=…=P (X =9)=1/10,其中X 为π的小数中所出现的数字,α=0.10.10.在一副扑克牌(52张)中任意抽3张,记录3张牌中含红桃的张数,放回,然后再任抽。
概率论与数理统计课件09 假设检验
检验水平 .
第二类错误:原假设H0不符合实际情况, 而检验结果却接受
了H0, 称为取伪错误,犯第二类错误的概率记为 .
9
假设检验可能犯的两种错误
(4)根据样本资料计算统计量 2 (n 1)S 2 值; 0
(5)判别是接受H 0 , 还是拒绝H 0 .
15
一个正态总体的假设检验
5. 未知期望,检验假设H0 : 0
(1)提出零假设H0 : 0;
(2)当H0为真时,统计量 2
(n 1)S 2
~
2 (n 1)
且 (n 1)S 2 (n 1)S 2
第九章 假设检验
1. 假设检验的基本概念 2. 假设检验可能犯的两种错误 3. 单正态总体参数的假设检验 4. 两个正态总体参数的假设检验 5. 总体分布的假设检验
1
假设检验的基本概念
统计假设的概念
关于总体(或代表某个总体的随机变量)的各种 论断、设想、推测或者“猜测”称为统计假设,记 为H. 统计假设的提出, 可基于实际知识或经验, 也可基于理论知识或判断.
参数假设:关于总体分布的参数的假设.
非参数假设:假设不能由有限个参数来表达.
(2)简单假设与复合假设
简单假设: 假设H完全确定总体的分布.
复合假设: 假设H不能完全确定总体的分布.
(3) 基本假设与对立假设
关于总体有两个必居其一的假设H0和H1, 要么H0成立而H1不成 立; 要么H0不成立而H1成立. 此时我们把其中一个假设称为基本假 设(或零假设),而中一个假设称为对立假设(或备选假设)
概率论与数理统计 假设检验
当Tail=0时,备择假设为“ 当Tail=1时,备择假设为“
00
”; ”;
当Tail=-1时,备择假设为“ 0 ”;
当H=0表示接受原假设; 当H=1表示拒绝原假设。
例 1、某切割机正常工作时,切割的金属棒的长度服从正态分布 N(100, 4) . 从该切割机切割的一批金属棒中随机抽取 15 根,测得它们的长度(单 位:mm)如下: 97 102 105 112 99 103 102 94 100 95 105 98 102 100 103. 假设总体方差不变,试检验该切割机工作是否正常,即总体均值是否等于
所以拒绝原假设,即平均寿命有显著差异。
算法
1、定义参数,mean,mu,n,alpha,model分别代表样本
均值,总体均值,样本容量,显著性水平,检验模式包括 :左侧,双侧,右侧
2、根据检验模式定义出拒绝域;
3、根据上述参数计算
sample (mean mu) s/ n
4、判断sample是否在第2步定义的拒绝域,如果 在就拒绝原假设返回值0,否则返回值1.
假设:
H0 : 0, H0 : 0, H0 : 0,
H1 : 0 . H1 : 0 H1 : 0
ztest函数 调用格式: h = ztest(x,m,sigma) h = ztest(...,alpha) h = ztest(...,alpha,tail) h = ztest(...,alpha,tail,dim) [h,p] = ztest(...) [h,p,ci] = ztest(...) [h,p,ci,zval] = ztest(...)
[h,p,ci,stats] = ttest(...)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
H1 : 0 . H1 : 0 H1 : 0
h = ttest(...,alpha)
h = ttest(...,alpha,tail) h = ttest(...,alpha,tail,dim) [h,p] = ttest(...) [h,p,ci] = ttest(...)
· [h, sig]=ttest(x, m, alpha, tail) · h=ttest(x, m) · h=ttest(x, m, alphal) · [h, sig, ci]=ttest(x, m, alpha, tail) 命令[h, sig, ci]=ttest(x, m, alpha, tail)表示在给定显著水平为alpha 的基础上进 行t 假设检验, 检验正态分布样本x 的均值是否为给出的m, m 的缺省值是0. 返 回的h 值等于1 表示在显著水平为alpha 时拒绝原假设; 返回的h 值等于0 表示 在显著水平为alpha 时不拒绝原假设. 返回的 sig 表示在x 的均值等于m 的原假 设下较大或者统计意义下较大的概率值.ci 返回一个置信度为 100(1-alpha)% 的均值的置信区间.
(1) 已知:
设 x1 , x2 ,, xn 是来自正态总体X的一个简单随机样
1 n 本,样本均值为 x xi ,根据单个总体的抽样分布结 n i 1
论,选用统计量
z
x 0
(2) 未知:
选用统计量:
n
~ N (0,1)
t
x 0 s/ n
~ t (n 1)
假设
4、判断sample是否在第2步定义的拒绝域,如果 在就拒绝原假设返回值0,否则返回值1. 5、根据第四步结果做出结论,0拒绝原假设,1接 受原假设。
2 2 , 当两个正态总体均服从正态分布且方差 1 2 未知但相 等时,进行两个总体均值之差的检验采用统计量。
选用统计量: T
X Y Sw 1 1 m n
二、总体标准差未知时的单个正态总体均值的t检验
ttest函数
总体:X ~ N (, 2 )
样本:X1 , X 2 ,, X n
调用格式: h = ttest(x) h = ttest(x,m) h = ttest(x,y)
假设: H 0 : 0 , H 0 : 0 , H 0 : 0 ,
原假设 备择假设
双侧检验
H0 : = 0 H1 : ≠0
单侧检验
左侧检验
H0 : 0 H1 : < 0
右侧检验
H0 : 0 H1 : > 0
双侧检验
抽样分布
拒绝H0 置信水平
拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
抽样分布
拒绝H0
置信水平
(2) (3)
Z
x - 0
/ n
1960 2000 100 / 120
=-4.382
拒绝域 z z1
z1 = -2.33 (4) z z1
所以拒绝原假设,即电子元件的质量不符合标准。
算法
1、定义参数,mean,mu,sigma,n,alpha,model分别代 表样本均值,总体均值,标准差,样本容量,显著性水平 ,检验模式包括:左侧,双侧,右侧 2、根据检验模式定义出拒绝域; (mean mu ) sample 3、根据上述参数计算 sigma / n
% 定义样本观测值向量 >> x = [49.4 50.5 50.7 51.7 49.8 47.9 49.2 51.4 48.9]; % 调用ttest函数作总体均值的双侧检验, % 返回变量h,检验的p值,均值的置信区间muci,结构体变量stats >> [h,p,muci,stats] = ttest(x,50,0.05)
例2 某电子元器件生产厂对一批产品进行检测,使用寿命不 低于2000小时为合格品。该电子元器件的使用寿命服从正态 分别,标准差为100小时。从该批产品中随机抽取了120个产 品进行检测,测得样本均值为1960小时,在 0.01 的显著 性水平下检验该批电子元器件的质量是否符合要求。
0 2000, 100, 解:由题意总体服从正态分布, 样本均值 x 1960 ,样本容量 n 120. (1) H 0 : 2000 2000 H1 :
· [h,sig]=ztest(x,m,sigma,alpha,tail) · h=ztest(x,m,sigma) · h=ztest(x,m,sigma,alpha) · [h,sig,ci]=ztest(x,m,sigma,alpha,tail) 命令[h,sig,ci]=ztest(x,m,sigma,alpha,tail)表示通过tail 指定值控制可选择假 设的类型, 以显著性水平为alpha 检验, 标准差为sigma 的正态分布样本x 的 均值是否为m. 返回值h=l表示在显著性水平为alpha 时拒绝原假设; h=0 表 示在显著水平为alpha 时不拒绝原假设. 返回值sig 为Z 的样本数据在x 的均 值为 m 的原假设下较大或者在统计意义下较大的概率值. ci 返回置信度为100(1-alpha)%的真实均值的置信区间.zBiblioteka x 0s
n
未知:
t
x 0 n
z z1 / 2
拒绝域
z z1 t t1
拒绝H0
z z1 t t1
t t1 / 2
P值决策
P
一、总体标准差已知时的单个正态总体均值的U检验
2 总体:X ~ N (, 0 )
ztest函数 调用格式:
我认为这种新药的疗效 比原有的药物更有效!
2
构造假设 总体
选择统计量并计算
确定
作出决策
作出决策
拒绝假设 别无选择!
提出假设
我认为人口的平 均年龄是50岁
均值 x = 20
抽取随机样 本
1. 问题背景 假设检验是统计推断的基本问题之一, 主要是确定关于样本总体特征的判断是否合理. 其基本思想是, 按照一定的规则(即检验准则), 根据样本信息对所做出的原假设H0 判断 是否成立, 以决定是接受还是否定原假设H0. 假设检验的判断和结论是根据样本做出的, 故具有“概率性”, 从而要犯判断上的错误——弃真错误和取伪错误. 假设检验分为参 数假设检验和总体分布假设检验两类. 由样本数据来做出拒绝和接受原假设的判断, 计算量是相当大的. 下面我们用MATLAB 软件来解决这一问题. 2. 实验目的与要求 (1) 掌握 MATLAB 工具箱中关于假设检验的有关操作命令; (2) 熟练掌握对单个正态总体均值、方差的假设检验; (3) 掌握对两个正态总体均值、方差有关的假设检验; (4) 掌握两个未知总体分布类型对均值是否相等的假设检验; (5) 掌握对单个总体是否服从正态分布的假设检验; (6) 掌握对单个总体是否服从指定的理论分布的假设检验.
>> x = [97 102 105 112 99 103 102 94 100 95 105 98 102 100 103]; % 调用ztest函数作总体均值的双侧检验, % 返回变量h,检验的p值,均值的置信区间muci,检验统计量的观测值zval >> [h,p,muci,zval] = ztest(x,100,2,0.05) % 调用ztest函数作总体均值的单侧检验 >> [h,p,muci,zval] = ztest(x,100,2,0.05,'right')
求解参数假设检验问题的步骤: (1) 根据问题提出合理的原假设H0和备择假设H1 ; (2) 给定显著性水平α, 一般取较小的正数, 如 0.05,0.01 等; (3) 选取合适的检验统计量及确定拒绝域的形式; (4) 令P{当H0为真拒绝H0}<= α , 求拒绝域; (5) 由样本观察值计算检验统计量的值, 并做出决策: 拒绝H0或接受H0.
样本:X1 , X 2 ,, X n
h = ztest(x,m,sigma) h = ztest(...,alpha)
假设: H 0 : 0 , H 0 : 0 , H 0 : 0 ,
H1 : 0 . H1 : 0 H1 : 0
h = ztest(...,alpha,tail)
1-
临界值
0
样本统计量 观察到的样本统计量
抽样分布
置信水平 拒绝H0 1-
0
临界值
样本统计量
观察到的样本统计量
假设 假设形式
双侧检验
左侧检验
右侧检验
H0 : =0 H1 : 0
H0 : 0 H1 : <0
H0 : 0 H1 : >0
已知:
统计量
例4 某电视机厂采用了新的生产技术生产显像管,质监部门 随机抽取了 20 个样本,测得样本的平均寿命为 31850 小时, 样本标准差1300小时。已知,在采用了新技术前生产的显像 管的平均寿命为 3 万小时,显像管的寿命服从正态分布,问: 在 的显著性水平下,问:新技术采用前与采用后生 产的显像管的平均寿命是否有显著差异。 0.05
当Tail=0时,备择假设为“ 0 ”; 当Tail=1时,备择假设为“ 0 ”; 当Tail=-1时,备择假设为“ 0 ”; 当H=0表示接受原假设; 当H=1表示拒绝原假设。
例 1、某切割机正常工作时,切割的金属棒的长度服从正态分布 N (100, 4) . 从该切割机切割的一批金属棒中随机抽取 15 根,测得它们的长度(单 位:mm)如下: 97 102 105 112 99 103 102 94 100 95 105 98 102 100 103. 假设总体方差不变,试检验该切割机工作是否正常,即总体均值是否等于 100mm?取显著性水平 0.05 .