8.1假设检验
假设检验的基本思想
例1 已知某炼铁厂的铁水含碳量X在某种工艺条 件下服从正态分布N(4.55,0.1082)。现改变了工艺条 件,又测了五炉铁水,其含碳量分别为: 4.28,4.40,4.42,4.35,4.37。 , , , , 。 根据以往的经验,总体的方差σ2= 0.1082一般不会改变。 试问工艺改变后,铁水含碳量的均值有无改变? 显然,这里需要解决的问题是,如何根据样本判 断现在冶炼的铁水的含碳量是服从≠4.55的正态分布 呢?还是与过去一样仍然服从 =4.55的正态分布呢? 若是前者,可以认为新工艺对铁水的含碳量有显著的 影响;若是后者,则认为新工艺对铁水的含碳量没有 显著影响。通常,选择其中之一作为假设后,再利用 样本检验假设的真伪。
以上两例都是科技领域中常见的假设检验问题。 我们把问题中涉及到的假设称为原假设或称待检 假设,一般用H0表示。而把与原假设对立的断言称为 备择假设,记为H1。 如例1,若原假设为H0:= 0=4.55,则备择假设 为H1:≠4.55。 若例2的原假设为H0:X服从正态分布,则备择 假设为H1:X不服从正态分布。
自然,我们希望一个假设检验所作的判断犯这 两类错误的概率都很小。事实上,在样本容量n固 定的情况下,这一点是办不到的。因为当α减小时, β就增大;反之,当β减小时,就α增大。 那么,如何处理这一问题呢? 事实上,在处理实际问题中,对原假设H0, 我们都是经过充分考虑的情况下建立的,或者认 为犯弃真错误会造成严重的后果。
二、 假设检验的基本思想
假设检验的一般提法是:在给定备择假设H1下, 利用样本对原假设H0作出判断,若拒绝原假设H0, 那就意味着接受备择假设H1,否则,就接受原假设 H0。 换句话说,假设检验就是要在原假设H0和备择假 设H1中作出拒绝哪一个和接受哪一个的判断。究竟 如何作出判断呢?对一个统计假设进行检验的依据 是所谓小概率原理,即 概率很小的事件在一次试验中是几乎不可能发生
概率论与数理统计-假设检验
14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
8.1 假设检验与小概率原理
一个小概率事件(发生的概率为 一个小概率事件(发生的概率为 α ) 小概率事件 。
( X − µ0 ) n P …u α = α 。 即 1− σ0 2 u 现在 n = 100 ,x = 1.978 , 0 = 0.1, = 0.05, α = u0.975 =1.96 。 σ α
常称为显著性水平, 【 注】 小概率事件发生的概率 α 常称为显著性水平 , 0.01。 一般取 α 为 0.05 或 0.01。
信息系 刘康泽
三、假设检验的基本思想
假设样本是从原总体中抽取的, 假设样本是从原总体中抽取的,在此假设下构造 一个小概率事件。若假设成立, 一个小概率事件。若假设成立,则小概率事件一般是 不会发生的,但在一次抽样中, 不会发生的,但在一次抽样中,如果小概率事件居然 就发生了,则有理由怀疑假设的正确性,此时拒绝接 就发生了,则有理由怀疑假设的正确性, 受这个假设;而一次抽样中小概率事件没有发生, 受这个假设;而一次抽样中小概率事件没有发生,则 没有理由怀疑假设的正确性,于是接受这个假设, 没有理由怀疑假设的正确性,于是接受这个假设,认 为样本仍来源于原总体。 为样本仍来源于原总体。
由于事先对这批产品次品率的情况一无所知。 目前所关 由于事先对这批产品次品率的情况一无所知。 心的问题是: 心的问题是:如何根据样本的次品率 4/50 推断整批产品的 次品率是否超过了 5%。
习题第8章
第8章 假设检验本章教学基本要求1.理解显著性假设检验的基本思想,了解其检验过程中产生的两种错误。
2.掌握单个正态总体的均值和方差的假设检验方法。
8.1 假设检验的基本概念主要知识归纳1 显著性假设检验的基本思想与基本步骤:(1)提出假设0H 称为原假设,同时也可提出其对立假设1H ,也叫做备择假设,检验的目的就是接受或是拒绝0H .(2) 假定原假设成立,选择合适的统计量并确定其分布.(3) 给定一个小概率α,α称为显著性水平,规定小概率事件是不可能事件. (4)依据样本计算,如果使得小概率事件发生则拒绝原假设,否则接受原假设. 2 两种错误: 如果原假设正确,而拒绝了它,则检验方案犯了“弃真”错误,称为第一类错误. 犯第一类错误的概率恰好就是小概率事件发生的概率α,即{}0H H P α=为真拒绝;而如果原假设本来是错误的,按照检验方案,由于样本观察随即特性导致最终接受了它,此时检验方案犯了“取伪”错误,称为第二类错误.记其概率为β,即{}0H H P β=为假接受. 8.2 单个正态总体参数假设检验一 主要知识归纳设总体),(~2σμN X ,n X X X ,,,21 为总体的样本,2,S X 分别为样本均值与样本方差,给定显著性水平α,1.提出假设00:μμ=H ,01:μμ≠H若2σ已知, 选取统计量nX Z /0σμ-=,则参数μ的拒绝域为:2Z Z α=≥;若2σ未知,选取统计量nS X T /0μ-=,则参数μ的拒绝域为:)1(/20-≥-=n t nS X T αμ2.当μ未知,提出假设2020:σσ=H ,2021:σσ≠H选取统计量2022)1(σχS n -=,则2σ拒绝域为⎭⎬⎫⎩⎨⎧->⎭⎬⎫⎩⎨⎧-<-)1()1(2222212n n ααχχχχ 二 基础练习1.设总体),,(~2σμN X 12,,,n X X X 为来自总体的样本,当μ和2σ未知时,则(1)检验假设00:μμ=H ;(2)检验假设2020:σσ=H 应选择怎样的统计量?2.打包机装糖入包,每包的标准重量为100kg ,每天开工后,要检验所装糖包的总体期望值是否合乎标准(100kg )。
概率论与数理统计第八章假设检验
为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
8.1 假设检验的基本思想与步骤
如在工件直径的假设检验问题中,设α1 < α2 < α3, 对不同的分位数
电子科技大学
假设检验基本思想
(x)
显著性水 平α3下拒
绝H0
- u1 - u2- u3
u3 u2 u1
显著性水平α2下接受H0
α1 < α2 < α3
电子科技大学
假设检验基本思想
注2 在确定H0的拒绝域时应遵循有利准则: 将检验统计量对H0有利的取值区域确定为接受 域,对H1成立有利的区域作为拒绝域. 如在工件直径假设检验问题中
1.提出原假设:根据实际问题提出原假设
H0和备选假设H1;
电子科技大学
假设检验基本思想
2. 建立检验统计量:寻找参数的一个良好 估计量,据此建立一个不带任何未知参数的统
计量U作为检验统计量,并在H0成立的条件下,
确定U的分布(或近似分布);
2
3.确定H0的否定域:根据实际问题选定显
著性水平α,依据检验统计量的分布与H0的内
给定α,H1的否定域为:
x
-
0
-
0
n
uα
例中
x
-
2
-0.022
-
0
n
u0.05
-0.0165
拒绝H0,即认为新工艺使工件直径偏小.
大样本假设检验例
电子科技大学
假设检验基本思想
四、两类错误 1)假设检验的主要依据是“小概率事件原 理”,而小概率事件并非绝对不发生. 2)假设检验方法是依据样本去推断总体,样 本只是总体的一个局部,不能完全反映整体 特性.
统计学 第8章 假设检验 教学课件ppt
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
假设检验的习题及详解包括典型考研真题
§假设检验基本题型Ⅰ 有关检验统计量和两类错误的题型【例8.1】u 检验、t 检验都是关于 的假设检验.当 已知时,用u 检验;当 未知时,用t 检验.【分析】 由u 检验、t 检验的概念可知,u 检验、t 检验都是关于均值的假设检验,当方差2σ为已知时,用u 检验;当方差2σ为未知时,用t 检验. 【例8.2】设总体2(,)XN u σ,2,u σ未知,12,,,n x x x 是来自该总体的样本,记11ni i x x n ==∑,21()ni i Q x x ==-∑,则对假设检验0010::H u u H u u =↔≠使用的t 统计量t = (用,x Q 表示);其拒绝域w = . 【分析】2σ未知,对u 的检验使用t 检验,检验统计量为(1)x t t n ==-对双边检验0010::H u u H u u =↔≠,其拒绝域为2{||(1)}w t t n α=>-.【例8.3】设总体211(,)XN u σ,总体222(,)Y N u σ,其中2212,σσ未知,设112,,,n x x x 是来自总体X 的样本,212,,,n y y y 是来自总体Y 的样本,两样本独立,则对于假设检验012112::H u u H u u =↔≠,使用的统计量为 ,它服从的分布为 .【分析】记1111n i i x x n ==∑,2121n i i y y n ==∑,因两样本独立,故,x y 相互独立,从而在0H 成立下,()0E x y -=,221212()()()D x y D x D y n n σσ+=+=+,故构造检验统计量(0,1)x yu N =.【例8.4】设总体2(,)XN u σ,u 未知,12,,,n x x x 是来自该总体的样本,样本方差为2S ,对2201:16:16H H σσ≥↔<,其检验统计量为 ,拒绝域为 .【分析】u 未知,对2σ的检验使用2χ检验,又由题设知,假设为单边检验,故统计量为222(1)(1)16n S n χχ-=-,从而拒绝域为221{(1)}n αχχ-<-.【例8.5】某青工以往的记录是:平均每加工100个零件,由60个是一等品,今年考核他,在他加工零件中随机抽取100件,发现有70个是一等品,这个成绩是否说明该青工的技术水平有了显著性的提高(取0.05α=)?对此问题,假设检验问题应设为 【 】()A 01:0.6:0.6H p H p ≥↔<. ()B 01:0.6:0.6H p H p ≤↔>. ()C 01:0.6:0.6H p H p =↔≠. ()D 01:0.6:0.6H p H p ≠↔=.【分析】一般地,选取问题的对立事件为原假设.在本题中,需考察青工的技术水平是否有了显著性的提高,故选取原假设为0:0.6H p ≤,相应的,对立假设为1:0.6H p >,故选()B .【例8.6】某厂生产一种螺钉,标准要求长度是68mm ,实际生产的产品,其长度服从2(,3.6)N u ,考察假设检验问题01:68:68H u H u =↔≠.设x 为样本均值,按下列方式进行假设检验:当|68|1x ->时,拒绝原假设0H ;当|68|1x -≤时,接受原假设0H . (1)当样本容量36n =时,求犯第一类错误的概率α; (2)当样本容量64n =时,求犯第一类错误的概率α;(3)当0H 不成立时(设70u =),又64n =时,按上述检验法,求犯第二类错误的概率β. 【解】(1)当36n =时,223.6(,)(,0.6)36xN u N u =,000{|68|1|}{67|}{69|}P x H P x H P x H α=->=<+>成立成立成立67686968()[1()]( 1.67)[1(1.67)]0.60.6--=Φ+-Φ=Φ-+-Φ 2[1(1.67)]2[10.99575]0.095=-Φ=-=.(2)当64n =时,223.6(,)(,0.45)64xN u N u =000{|68|1|}{67|}{69|}P x H P x H P x H α=->=<+>成立成立成立67686968()[1()]0.450.45--=Φ+-Φ 2[1(2.22)]2[10.9868]0.0264=-Φ=-=.(3)当64n =,又70u =时,2(70,0.45)xN ,这时犯第二类错误的概率(70){|68|1|70}{6769|70}P x u P x u β=-≤==≤≤=69706770()()( 2.22)( 6.67)0.450.45--=Φ-Φ=Φ--Φ- (6.67)(2.22)10.98680.0132=Φ-Φ=-=.【评注】01(1)(2)的计算结果表明:当n 增大时,可减小犯第一类错误的概率α;02 当64n =,66u =时,同样可计算得到(66)0.0132β=.03 当64n =,68.5u =时,2(68.5,0.45)xN ,则(68.5){6769|68.5}P x u β=≤≤= 6968.56768.5()()(1.11)( 3.33)0.450.45--=Φ-Φ=Φ-Φ-0.8665[10.9995]0.8660=--=.这表明:当原假设0H 不成立时,参数真值越接近于原假设下的值时,β的值就越大. 【例8.7】设总体2(,)XN u σ,12,,,n x x x 是来自该总体的样本,对于检验01:0:0H u H u ≤↔>,取显著性水平α,拒绝域为:{}w u u α=>,其中u =,求:(1)当0H 成立时,求犯第一类错误的概率()u α; (2)当0H 不成立时,求犯第二类错误的概率()u β. 【解】(1)当0H 成立时,0u ≤,则(){|0}|0}u P u u u P u u ααα=>≤=>≤()|0}1()(0)P x u u u u u αα=->≤=-Φ≤因0u ≤,故()()1u u αααΦ≥Φ=-,从而()1()1(1)u u αααα≤-Φ=--=,即犯第一类错误的概率不大于α.(2)(){|0}()|0}u P u u u P x u u u ααβ=≤>=-≤>()(0)u u α=Φ>因0u >,故当u →+∞时,()0u β→,即u 与假设0H 偏离越大,犯第二类错误的概率越小;而当0u +→时,()1u βα→-,即当u 为正值且接近0时,犯第二类错误的概率接近1α-.基本题型Ⅱ 单个正态总体的假设检验【例8.8】某天开工时,需检验自动包装机工作是否正常,根据以往的经验,其包装的质量在正常情况下服从正态分布2(100,1.5)N (单位:kg ),先抽测了9包,其质量为: 99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.0,100.5 问这天包装机工作是否正常?【分析】 关键是将这一问题转化为假设检验问题.因检验包装机工作是否正常,化为数学问题应为双边检验01:100:100H u H u =↔≠.【解】由题意,提出假设检验问题:01:100:100H u H u =↔≠, 选取检验统计量(0,1)x u N =当0.05α=时,0.02521.96u u α==,又20.04 1.96u u α==<=,即接受原假设0H ,认为包装机工作正常.【例8.9】已知某种元件的寿命服从正态分布,要求该元件的平均寿命不低于1000h ,现从这批元件中随机抽取25知,测得平均寿命980X h =,标准差65S h =,试在水平0.05α=下,确定这批元件是否合格.【解】由题意,2σ未知,在水平0.05α=下检验假设0010:1000:1000H u u H u u ==↔<=属于单边(左边)t 检验.构造检验统计量 (1)x t t n =-,其中25,65,980n S X h ===,查t 分布表可得:0.05(1)(251) 1.7109t n t α-=-=,又0.05|| 1.538(24) 1.7109x t t ===<=.即接受原假设0H ,认为这批元件是合格的.【例8.10】某厂生产的一中电池,其寿命长期以来服从方差225000()σ=小时的正态分布,现有一批这种电池,从生产的情况来看,寿命的波动性有所改变,现随机地抽取26只电池,测得寿命的样本方差229200()S =小时,问根据这一数据能否推断这批电池寿命的波动性较以往有显著性的变化(取0.02α=).【解】 检验假设2201:5000:5000H H σσ=↔≠,选取统计量2222(1)(1)n S n χχσ-=-,由0.02α=,26n =,查2χ分布表可得220.012(1)(25)44.314n αχχ-==,220.0912(1)(25)11.524n αχχ--==, 又统计量2220.012(1)46(25)44.314n S χχσ-==>=,故拒绝原假设0H ,即认为这批电池寿命的波动性较以往有显著性的变化.【例8.11】 某种导线,要求其电阻的标准不得超过0.005(欧姆),今在生产的一批导线中取样品9根,测得0.007S =(欧姆),设总体为正态分布,问在水平0.05α=下,能否认为这批导线的标准差显著性地偏大?【解】本题属于总体均值未知,正态总体方差的单边检验问题0010:0.005:0.005H H σσσσ==↔>=选取统计量2222(1)(1)n S n χχσ-=-当0.05α=,9n =时,查2χ分布表可得:220.05(1)(8)15.507n αχχ-==,又题设0.007S =,则统计量22220.0522(1)80.00715.68(8)15.5070.005n S χχσ-⨯===>=. 故拒绝原假设0H ,认为这批导线的标准差显著性地偏大.【例8.12】 机器自动包装食盐,设每袋盐的净重服从正态分布,规定每袋盐的标准重量为500克,标准差不超过10克.某天开工以后,为了检查机器工作是否正常,从已包装好的食盐中随机抽取9袋,测得其重量(克)为:497,507,510,475,484,488,524,491,515问这天自动包装机工作是否正常(显著性水平0.05α=)? 【解】 设每袋盐重量为随机变量X ,则2(,)XN u σ,为了检查机器是否工作正常,需检验假设:01:500H u =及202:100H σ≤.下面现检验假设0111:500:500H u H u =↔≠ 由于2σ未知,故构造统计量(1)x t t n =-由于0.05α=,查t 分布表可得0.0252(1)(8) 2.306t n t α-==,又由题设计算可得499,16.03X S ==,故统计量取值0.025||0.187(8) 2.306x t t ===<=即接受原假设01H ,认为机器包装食盐的均值为500克,没产生系统误差.下面在检验假设220212:100:100H H σσ≤↔>选取统计量2222(1)(1)n S n χχσ-=-,由于0.05α=,查2χ分布表可得220.05(1)(8)15.5n αχχ-==,而统计量2220.052(1)20.56(8)15.5n S χχσ-==>=,故拒绝原假设02H ,接受12H ,即认为其标准差超过了10克.由上可知,这天机器自动包装食盐,虽没有产生系统误差,但生产不够稳定(方差偏大),从而认为这天自动包装机工作不正常.基本题型Ⅲ 两个正态总体的假设检验【例8.13】 下表给出了两个文学家马克·吐温(Mark Twain )的8偏小品文以及斯诺·特格拉斯(Snodgrass )的10偏小品文中由3格字母组成的词比例.马克·吐温: 0.225,0.262,0.217,0.240,0.230,0.229,0.235,0.217斯诺·特格拉斯:0.209,0.205,0.196,0.210,0.202,0.207,0.224,0.223,0.220,0.201 设两组数据分别来自正态分布,且两总体方差相等,两样本相互独立,问两个作家所写的小品文中包含由3格字母组成的词的比例是否有显著性的差异(0.05α=)?【分析】首先应注意题中的“比例”即“均值”的含义,因而本题应属于未知方差,却知其相等的两正态母体,考虑它们的均值是否相等的问题.【解】设题中两正态母体分别记为,X Y ,其均值分别为12,u u ,因而检验问题如下:012112::H u u H u u =↔≠选取统计量(2)X Y T t n m =+-,其中8,10n m ==,()()22122112wn S m S Sn m -+-=+-,在0.05α=时,查t 分布表可得()()/20.025216 2.1199t n m t α+-==由题设样本数据计算可得22120.2319,0.2097,0.00021,0.00009X Y S S ====,0.119w S ===.从而t统计量值为()0.025|| 3.964316 2.1199X Y T t ===>=,因而拒绝原假设0H ,认为两个作家所写的小品文中包含由3格字母组成的词的比例有显著性的差异.【例8.14】据专家推测:矮个子的人比高个子的人的寿命要长一些,下面给出了美国31个自然死亡的总统的寿命.矮个子(身高小于5英尺8英寸)总统 Modison Van Buren B.Harrison J.Adams J.Q.Adams 身高 5’4” 5’6” 5’6” 5’7” 5’7” 寿命 85 79 67 90 80高个子(身高大于5英尺8英寸)总统 W.Harrison Plok Tayler Crant Hayes Truman Fillmore Pierce A.Johson 身高 5’8” 5’8” 5’8”5’8.5” 5’8.5” 5’9” 5’9” 5’10” 5’10” 寿命 68 53 65 63 70 88 74 64 66 总统 T.Roosevelt Coolidge Eisenhower Cleveland Wilson Hoover Monroe Tyler 身高 5’10” 5’10” 5’10” 5’11” 5’11” 5’11” 6’ 6’ 寿命 60 60 78 71 67 90 73 71 总统 Buchanan Taft Harding Jaskon Washington Arthur F.Roosevelt 身高 6’ 6’ 6’ 6’1” 6’2” 6’2” 6’2” 寿命77 72 57 78 67 56 63设两个寿命总体均为正态分布且方差相等,试问以上数据是否符合上述推测(0.05α=)? 【解】设矮个子总统寿命为X ,高个子总统寿命为Y ,需检验012112::H u u H u u =↔>.由于22212σσσ==未知,故选用统计量(2)X Y T t n m =+-,其中5,26n m ==,()()22122112wn S m S Sn m -+-=+-.由题设样本数据可得80.2,69.15,X Y ==22124294.8,252183.215S S ==,故()()221221185.4492wn S m S Sn m -+-==+-,从而统计量|| 2.448X Y T ==,又当0.05α=时,查t 分布表可得()()0.05229 1.6991t n m t α+-==,即()0.05|| 2.44829 1.6991T t =>=,故拒绝原假设0H ,即推测是正确的,认为矮个子的人比高个子的人的寿命要长一些 【例8.15】总体21(,)XN u σ,22(,)Y N u σ,112,,,n x x x 与212,,,n y y y 分别时来自总体,X Y 的样本,试讨论检验问题012112::H u u H u u δδ-≤↔->.【解】取统计量12(2)X Y T t n n =+-,其中()()221122212112wn S n S S n n -+-=+-, 则检验统计量为X Y T =,当1H 成立时,t 有偏大的趋势,故取拒绝域为12{(2)}w t t n n α=>+-.【例8.16】甲乙相邻地段各取了50块和25块岩心进行磁化率测定,算出两样本标准差分别是210.0139S =,220.0053S =,问甲乙两段的标准差是否有显著性差异(0.05α=)?【解】作假设001:H σσ=,由题设有250211501500.0139()0.01425014949i i S X X =⨯⨯-===-∑, 252221521520.0053()0.00545215151ii S Y Y =⨯⨯-===-∑ 从而统计量21112222(1)0.01422.630.0054(1)n S n F n S n -===-,当0.05α=,查F 分布表可得0.0252(501,521)(501,521) 1.7494F F α--=--=,0.97512(501,521)(501,521)0.5698FF α---=--=,因为0.0252.63(49,51) 1.7494F F =>=,故拒绝原假设0H ,即认为甲乙两段的标准差有显著性差异.【例8.17】在集中教育开课前对学员进行了测试,过来一段时间后,又对学员进行了与前一次同样程度的考查,目的是了解上次的学员与这次学员的考试分类是否有显著性差别(0.05α=),从上次与这次学员的考试中随机抽取12份考试成绩,如下表考试次数 考分 合计平均分 (1) 80.5,91.0,81.0,85.0,70.0,86.0,69.5,74.0,72.5,83.0,69.0,78.5940 78.5 (2)76.0,90.0,91.5,73.0,64.5,77.5,81.0,83.5,86.0,78.5,85.0,96080.073.5【解】此为双正态总体的假设检验,两总体均值未知,先检验假设2222012112::H H σσσσ=↔≠.选取统计量211222(1,1)S F F n n S =--,由题设可计算得221253.15,60.23S S ==,则统计量212253.150.882560.23S F S ===,取0.05α=,查F 分布表可得0.0252(11,11)(11,11) 3.43F F α==,0.97510.02521(11,11)(11,11)0.2915(11,11)FF F α-===.由于122(11,11)0.8825(11,11) 3.43FF F αα-<=<=,故在0.05α=下,接受0H ,即认为两次考试中学员的成绩的方差相等. 再假设012112::H u u H u u =↔≠.构造统计量12(2)X YT t n n =+-,其中()()221122212112wn S n S S n n -+-=+-,1212,12n n ==.由样本数据可得78.5,80.0,X Y ==221253.1515,60.2273S S ==,故()()2211222121156.68942wn S n S Sn n -+-==+-,从而统计量||0.488X Y T ==,在0.05α=下,查t 分布表可得()()120.0252222 2.0739t n n t α+-==.由于()0.025||0.48822 2.0739T t =<=,即认为两次考试中学员的平均成绩相等,从而认为两次考试中学员的成绩无显著性差异.基本题型Ⅳ 非正态总体参数假设检验【例8.18】某产品的次品率为0.17,现对此产品进行了新工艺试验,从中抽取400件检查,发现次品56间,能否认为这项新工艺显著性地影响产品质量(0.05α=)? 【解】检验问题01:0.17:0.17H p H p =↔≠由题设可知56ˆ0.14400m pn ===,构造统计量 1.597u ===-,当0.05α=时,查正态分布表可得0.025 1.96u =,因为0.025|| 1.96u u <=,故接受原假设0H ,认为新工艺显著性地影响产品质量.【评注】本题的理论依据时中心极限定理:当n 充分大时,在0H 成立时,u =(0,1)N 分布.【例8.19】 已知某种电子元件的使用寿命X 服从指数分布()E λ,现抽查100个元件,得样本均值950()x h =,能否认为参数0.01λ=(0.05α=)? 【解】由题设()XE λ,故211,EX DX λλ==,当n 充分大时,1((0,1)1x u x N λλ-==-,现在检验问题01:0.001:0.001H H λλ=↔≠,则((0.0019501)0.5u x λ=-=⨯-=,当0.05α=时,查正态分布表可得0.025 1.96u =,因为0.025|| 1.96u u <=,故接受原假设0H ,认为参数0.01λ=.【评注】总体()X F x ,2,EX u DX σ==,则当n充分大时,u =从(0,1)N 分布.【例8.20】对某干洗公司去除污点的比例做下列假设检验01:0.7:0.9H p H p =↔=,选出100个污点,设其中去除的污点数为x ,拒绝域为{82}w x =>. (1)当0.7p =时,求犯第一类错误的概率α; (2)当0.9p =时,求犯第二类错误的概率β. 【解】(1)由题设有{82|0.7}1P x p α=>==-Φ1(2.62)10.99560.0044=-Φ=-=.(2){82|0.9}P x p β=≤==Φ( 2.67)1(2.67)10.99620.0038=Φ-=-Φ=-=.【评注】从计算分析,这一检验法的α,β皆很小,是较好的检验.§历年考研真题评析1、【98.1.4】设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,计算得到平均成绩为66.5,标准差为15分,问在显著性水平0.05下,是否可以认为这次考试全体考生平均成绩为70分?并给出检验过程.【解】设该次考试的考生成绩为X ,则2(,)XN ,设X 为从总体X 抽取的样本容量为n 的样本均值,S 为样本标准差,根据题意建立假设001:70;:70H H .选取统计量 07036X X TnSS在70时,2(70,),(35)X T t .选取拒绝域{||}R T ,其中满足{||}0.05P T ,即{||}0.95P T .即0.975(35) 2.0301t . 由036,66.5,70,15n xs 可以计算得统计量T 的值|66.570|||361.42.030115T .因此不能拒绝0H ,即在显著性水平0.05下可以认为全体考生的平均成绩为70分.§习题全解1、在正常情况下,某炼钢厂的铁水含碳量(%)2(4.55,)XN σ.一日测得5炉铁水含碳量如下:4.48,4.40,4.42,4.45,4.47在显著性水平0.05α=下,试问该日铁水含碳量得均值是否有明显变化. 【解】设铁水含碳量作为总体X ,则2(4.55,)XN σ,从中选取容量为5的样本,测得24.444,0.0011X S ==.由题意,设原假设为0: 4.55H u = 构造检验统计量 ||(4)X u t t S -=,则7.051t ==在显著性水平0.05α=下,查表可得0.97512(4)(4) 2.77647.051tt α-==<,拒绝原假设0H ,即认为有显著性变化.2、根据某地环境保护法规定,倾入河流的废物中某种有毒化学物质含量不得超过3ppm.该地区环保组织对某厂连日倾入河流的废物中该物质的含量的记录为:115,,x x .经计算得15148ii x==∑, 1521156.26i i x ==∑.试判断该厂是否符合环保法的规定.(该有毒化学物质含量X 服从正态分布)【解】设有毒化学物质含量作为总体X ,则2(,)XN u σ,从中选取容量为15的样本,测得1511 3.215i i X x ===∑,22221111()()0.1911n ni i i i S x x x nx n n ===-=-=--∑∑.由题意,设原假设为0:3H u <,备择假设为1:3H u >.构造检验统计量(14)X t t =,则 1.777t ==,在显著性水平0.05α=下,查表可得10.95(14)(14) 1.7613 1.777t t α-==<,即拒绝原假设0H ,接受备择假设1H ,认为该厂不符合环保的规定.3、某厂生产需用玻璃纸作包装,按规定供应商供应的玻璃纸的横向延伸率不应低于65.已知该指标服从正态分布2(,)N μσ, 5.5σ=.从近期来货中抽查了100个样品,得样本均值55.06x =,试问在0.05α=水平上能否接受这批玻璃纸? 【解】设玻璃纸的横向延伸率为总体X ,则2(,5.5)XN u ,从中选取容量为100的样本,测得55.06x =.由题意,设原假设为0:65H u >,备择假设为1:65H u <.构造检验统计量||(0,1)X u U N σ-=,则|55.0665|18.07275.5U -==在显著性水平0.05α=下,查表可得10.95 1.644918.0727U U α-==<,即拒绝原假设0H ,接受备择假设1H ,不能接受该批玻璃纸..4、某纺织厂进行轻浆试验,根据长期正常生产的累积资料,知道该厂单台布机的经纱断头率(每小时平均断经根数)的数学期望为9.73根,标准差为1.60根.现在把经纱上浆率降低20%,抽取200台布机进行试验,结果平均每台布机的经纱断头率为9.89根,如果认为上浆率降低后均方差不变,问断头率是否受到显著影响(显著水平α=0.05)?【解】设经纱断头率为总体X ,则9.73u EX ==, 1.6σ==,从中选取容量为200的样本,测得9.89x =.由题意,设原假设为0:9.73H u =,备择假设为1:9.73H u ≠. 构造检验统计量(0,1)X U N =,则 1.4142U ==在显著性水平0.05α=下,查表可得0.975121.96 1.4142UU α-==>,即接受原假设0H ,认为断头率没有受到显著影响.5、某厂用自动包装机装箱,在正常情况下,每箱重量服从正态分布2(100,)N σ.某日开工后,随机抽查10箱,重量如下(单位:斤):99.3,98.9,100.5,100.1,99.9,99.7,100.0,100.2,99.5,100.9.问包装机工作是否正常,即该日每箱重量的数学期望与100是否有显著差异?(显著性水平α=0.05) 【解】设每箱重量为总体X ,则2(100,)XN σ,从中选取容量为10的样本,测得99.9x =,20.34S =.由题意,设原假设为0:100H u =,备择假设为1:100H u ≠.构造检验统计量||(9)X u t t S -=,则0.5423t ==,在显著性水平0.05α=下,查表可得0.97512(9)(9) 2.26220.5423tt α-==>,即接受原假设0H ,认为每箱重量无显著差异.6、某自动机床加工套筒的直径X 服从正态分布.现从加工的这批套筒中任取5个,测得直径分别为15,,x x (单位m μ:),经计算得到51124ii x==∑, 5213139i i x ==∑.试问这批套筒直径的方差与规定的27σ=有无显著差别?(显著性水平0.01α=) 【解】设这批套筒直径为总体X ,则2(,)XN u σ,从中选取容量为5的样本,测得151124.815i i X x ===∑,22221111()()15.9511n ni i i i S x x x nx n n ===-=-=--∑∑. 由题意,设原假设为20:7H σ=,备择假设为21:7H σ≠.构造检验统计量2222(1)(4)n S χχσ-=,则2415.959.11437χ⨯==,在显著性水平0.01α=下,查表可得220.99512(4)(4)14.86αχχ-==,220.0052(4)(4)0.2070αχχ==,从而222122(4)(4)ααχχχ-<<. 即接受原假设0H ,认为这批套筒直径的方差与规定的27σ=无显著差别.7、甲、乙两台机床同时独立地加工某种轴,轴的直径分别服从正态分布211(,)N μσ、222(,)N μσ(12,μμ未知).今从甲机床加工的轴中随机地任取6根,测量它们的直径为16,,x x ,从乙机床加工的轴中随机地任取9根,测量它们的直径为19,,y y ,经计算得知:61204.6ii x==∑, 6216978.9i i x ==∑,91370.8i i y ==∑,92115280.2i i y ==∑.问在显著性水平0.05α=下,两台机床加工的轴的直径方差是否有显著差异? 【解】设两台机床加工的轴的直径分别为总体,X Y ,则211(,)XN μσ、222(,)YN μσ,从总体X 中选取容量为6的样本,测得61134.16i i X x ===∑222211111()()0.40811n ni i i i S x x x nx n n ===-=-=--∑∑. 从总体Y 中选取容量为9的样本,测得91141.29i i Y y ===∑222221111()()0.40511n ni i i i S y y y ny n n ===-=-=--∑∑ 由题意,设原假设为22012:H σσ=,备择假设为22112:H σσ≠.构造检验统计量2122(5,8)S F F S =,则0.4081.0070.405F ==,在显著性水平0.05α=下,查表可得0.97512(5,8)(5,8) 6.76FF α-==,0.0252(5,8)(5,8)0.1479F F α==,从而122(5,8)(5,8)F F Fαα-<<.即接受原假设0H ,认为两台机床加工的轴的直径方差无显著差异.8、某维尼龙厂根据长期正常生产积累的资料知道所生产的维尼龙纤度服从正态分布,它的标准差为0.048.某日随机抽取5根纤维,测得其纤度为1.32,1.55,1.36,1.40,1.44.问该日所生产得维尼龙纤度的均方差是否有显著变化(显著性水平α=0.1)? 【解】设维尼龙纤度为总体X ,则2(,0.048)XN u ,从中选取容量为5的样本,测得511 1.4145i i X x ===∑,2211()0.00781n i i S x x n ==-=-∑.由题意,设原假设为0:0.048H σ=,备择假设为1:0.048H σ≠.构造检验统计量2222(1)(4)n S χχσ-=,则2240.007813.542(0.048)χ⨯==在显著性水平0.1α=下,查表可得220.9512(4)(4)9.487713.542αχχ-==<.即拒绝原假设0H ,认为维尼龙纤度的均方差有显著变化.9、某项考试要求成绩的标准差为12,先从考试成绩单中任意抽出15份,计算样本标准差为16,设成绩服从正态分布,问此次考试的标准差是否符合要求(显著性水平α=0.05)? 【解】 设考试成绩为总体X ,则2(,12)XN u ,从中选取容量为15的样本,测得16S =.由题意,设原假设为0:12H σ=,备择假设为1:12H σ≠. 构造检验统计量2222(1)(14)n S χχσ-=,则222141619.055612χ⨯==.在显著性水平0.05α=下,查表可得220.97512(14)(14)26.1189αχχ-==,220.0252(14)(14) 5.6287αχχ==,从而222122(14)(14)ααχχχ-<<.即接受原假设0H ,认为此次考试的标准差符合要求.10、某卷烟厂生产甲、乙两种香烟,分别对他们的尼古丁含量(单位:毫克)作了六次测定,获得样本观察值为:甲:25,28,23,26,29,22; 乙:28,23,30,25,21,27.假定这两种烟的尼古丁含量都服从正态分布,且方差相等,试问这两种香烟的尼古丁平均含量有无显著差异(显著性水平α=0.05,)?对这两种香烟的尼古丁含量,检验它们的方差有无显著差异(显著性水平α=0.1)?【解】设这两种烟的尼古丁含量分别为总体,X Y ,则211(,)X N μσ、222(,)Y N μσ,从中均选取容量为6的样本,测得61125.56i i X x ===∑,22111()7.51n i i S x x n ==-=-∑, 61125.66676i i Y y ===∑,22211()11.06671n i i S y y n ==-=-∑, 由题意,在方差相等时,设原假设为012:H u u =,备择假设为112:H u u ≠.构造检验统计量12(2)X Y t t n n =+-,其中222112212(1)(1)9.2834(2)wn S n S S n n -+-==+-.则0.0948t ==,在显著性水平0.05α=下,查表可得120.97512(2)(10) 2.22810.0948tn n t α-+-==>.即接受原假设0H ,认为这两种香烟的尼古丁平均含量无显著差异.由题意,在方差待定时,设原假设为22012:H σσ=,备择假设为22112:H σσ≠.构造检验统计量2122(5,5)S F F S =,则7.50.677711.0667F ==,在显著性水平0.1α=下,查表可得0.9512(5,8)(5,5) 5.0503FF α-==,0.052(5,8)(5,5)0.1980F F α==,由122(5,5)(5,5)F F Fαα-<<.即接受原假设0H ,认为它们的方差无显著差异.§同步自测题及参考答案一、选择题1、关于检验水平α的设定,下列叙述错误的是 【 】()A α的选取本质上是个实际问题,而非数学问题. ()B 在检验实施之前, α应是事先给定的,不可擅自改动.()C α即为检验结果犯第一类错误的最大概率. ()D 为了得到所希望的结论,可随时对α的值进行修正.2、关于检验的拒绝域W,置信水平a ,及所谓的“小概率事件”,下列叙述错误的是 【 】()A a 的值即是对究竟多大概率才算“小”概率的量化描述. ()B 事件021|),,,{(H W X X X n ∈ 为真}即为一个小概率事件.()C 设W 是样本空间的某个子集,指事件}|),,,{(021为真H W X X X n ∈ . ()D 确定恰当的W 是任何检验的本质问题.3、设总体22),,(~σσμN X 未知,通过样本n X X X ,,,21 检验假设00:μμ=H ,此问题拒绝域形式为 【 】()A }C >. ()B }/100{C n S X <-. ()C }10/100{C S X >- . ()D }{C X >.4、设n X X X ,,,21 为来自总体2(,)N μσ的样本,若μ未知, 100:20≤σH ,21:100,H 0.05a ,关于此检验问题,下列不正确的是 【 】()A 检验统计量为100)(12∑=-ni iX X. ()B 在0H 成立时,)1(~100)1(22--n x S n . ()C 拒绝域不是双边的. ()D 拒绝域可以形如})({12∑=>-ni i k X X .5、设总体服从正态分布2(,3)XN μ,12,,,n x x x 是X 的一组样本,在显著性水平0.05α=下,假设“总体均值等于75”拒绝域为12{,,,:74.0275.98}n w x x x x x =<⋃>,则样本容量n = 【 】()A 36. ()B 64. ()C 25. ()D 81.二、填空题1、为了校正试用的普通天平,把在该天平上称量为100克的10个试样在计量标准天平上进行称量,得如下结果:99.3, 98.7, 100.5, 101,2, 98.399.7 99.5 102.1 100.5, 99.2 假设在天平上称量的结果服从正态分布,为检验普通天平与标准天平有无显著差异,0H为 .2、设样本2521,,,X X X 来自总体μμ),9,(N 未知,对于检验0010::H H μμμμ=↔= 取拒绝域形如k X ≥-0μ,若取05.0=a ,则k 值为 .3、设12,,,n x x x 是正态总体2(,)XN μσ的一组样本.现在需要在显著性水平0.05α=下检验假设2200:H σσ=.如果已知常数u ,则0H 的拒绝域1w =______________;如果未知常数u ,则0H 的拒绝域2w =______________.4、在一个假设检验问题中令0H 是原假设,1H 时备择假设,则犯第一类错误的概率{______________}P ,犯第二类错误的概率{______________}P .三、解答题1、某批矿砂的5个样本中的镍含量,经测定为(%)3.25,3.27,3.24,3.26,3.24设测定值总体服从正态分布,问在0.01α=下,能否接受假设:这批矿砂的含量的均值为3.25.2、已知精料养鸡时,经若干天鸡的平均重量为4公斤.今对一批鸡改用粗料饲养,同时改善饲养方法,经同样长的饲养期后随机抽取10只,的其数据如下:3.7,3.8,4.1,3.9,4.6,4.7,5.0,4.5,4.3,3.8已知同一批鸡的重量X 服从正态分布,试推断:这一批鸡的平均重量是否显著性提高.试就0.01α=和0.05α=分别推断.3、测定某种溶液中的水份,它的10个测定值给出0.037%S =,设测定值总体为正态分布,2σ为总体方差,试在水平0.05α=下检验假设01:0.04%:0.04%H H σσ=↔<.4、在70年代后期,人们发现在酿造啤酒时,在麦芽干燥过程中形成致癌物质亚硝基二甲胺(NDMA ).到了80年代初期开发了一种新的麦芽干燥过程,下面给出了在新老两种干燥过程中形成的NDMA 的含量(以10亿份中的份数计)老过程 6,4,5,5,6,5,5,6,4,6,7,4 新过程2,1,2,2,1,0,3,2,1,0,1,3设两样本分别来自正态总体,且两总体的方差相等,两样本独立,分别以12,u u 记对应于老、新过程的总体均值,试检验假设(0.05α=)0111:2:2H u u H u u -=↔->.5、检验了26匹马,测得每100毫升的血清中,所含的无机磷平均为3.29毫升,标准差为0.27毫升;又检验了18头羊,每100毫升血清中汗无机磷平均值为3.96毫升,标准差为0.40毫升.设马和羊的血清中含无机磷的量均服从正态分布,试问在显著性水平0.05α=条件下,马和羊的血清中无机磷的含量有无显著性差异?6、某种产品的次品率原为0.1,对这种产品进行新工艺试验,抽取200件发现了13件次品,能否认为这项新工艺显著性地降低了产品的次品率(0.05α=)?7、设n X X X ,,,21 为总体(,4)XN a 的样本,已知对假设01:1: 2.5H a H a =↔=,0H 的拒绝域为{2}w X =>.(1)当9u =时,求犯两类错误的概率α和β; (2)证明:当n →∞时,0α→,0β→.同步自测题参考答案 一、选择题1.()D .2. ()C .3. ()C .4. ()B .5. ()A . 二、填空题1.100=μ.2. 1.176.3. 222210.0250.97522110011{()()()()}nniii i w x u n x u n χχσσ===->⋃-<∑∑;222220.0250.975220(1)(1){(1)(1)}n S n S w n n χχσσ--=>-⋃<- .4.10{|}P H H 接受成立,01{|}P H H 接受成立.三、解答题 1、接受0H .2、0.01α=时,显著性提高;0.05α=时,没有显著性提高 .3、 接受0H .4、拒绝0H ,接受1H .5、方差无显著性差异,均值有显著性差异,故有显著性差异.6、 拒绝0H .7、(1)0.0668α=,0.2266β=,(2)102α=-Φ→,(04β=Φ-→()n →∞.。
假设检验的基本思想
㈡ 检验的逻辑过程 例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得 平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生 的平均成绩为70分? 要点: 某考试 (所有) 成绩是总体, 任意抽取的36人的成绩为 样本. 欲通过样本信息推断总体分布中的 m 是否为70分? 检验依据: 小概率事件在一次试验中一般不发生,若发生了,则认为
② 选择统计量
③ 确定拒绝域
选统计量 U
X m
/
~ N ( 0 ,1) .
n
由 P { | U | u a } a 0 .0 5, 查 表 得 拒 绝 域 为
2
U< -1.96 或 U>1.96 . ④ 计算统计量的值 统 计 量 的 值 为
U x m
完整解答…
/
75 70 20 / 6 1 .5 . n
《概率统计》 返回 下页 结束
例3. 设某考试成绩X~N(m , 202), 从中任抽36人的成绩, 算得 平均分为75, 问在显著性水平a = 0.05下, 是否可以认为全体考生 的平均成绩为70分? 检验过程(形而下): ① H0: m =m0=70, 即总体X~N(70 , 202), 从而知
一、假设检验的基本思想 例1. 设某厂生产一种灯管, 其寿命 X~N (m , 200 2), 原来灯管
的平均寿命为m = 1500小时. 现在采用新工艺后, 在所生产的灯管 中抽取25只, 测得平均寿命为1675小时. 问采用新工艺后, 灯管寿
命是否有显著提高 ?
问题表现为:判断 m >1500 ? 例2. 某种农作物的农药残留量 X 是否服从正态分布 ?
§8.1假设检验的基本概念
第八章 假设检验统计推断的另一类重要问题是假设检验. 在总体分布未知或虽知其类型但含有未知参数的时候, 为推断总体的某些未知特性, 提出某些关于总体的假设. 我们要根据样本所提供的信息以及运用适当的统计量, 对提出的假设作出接受或拒绝的决策, 假设检验是作出这一决策的过程.⎩⎨⎧非参数假设检验参数假设检验假设检验 参数假设检验针对总体分布函数中的未知参数提出的假设进行检验, 后者针对总体分布函数形式或类型的假设进行检验, 本章主要讨论单参数假设检验问题.§8.1假设检验的基本概念一、问题的提出设一箱中有红白两种颜色的球共100个, 甲说这里有98个白球, 乙从箱中任取一个, 发现是红球, 问甲的说法是否正确?先做假设0H :箱中却有98个白球。
如果假设0H 正确,则从箱中任取一个球是红球的概率只有0.02,是小概率事件。
通常认为在一次随机试验中,概率小的事件不易发生,因此,若乙从箱中任取一个,发现是白球,则没有理由怀疑假设0H 的正确。
今乙从箱中任取一个,发现是红球,即“小概率事件”竟然在一次试验中发生了,故有理由假设0H ,即甲的说法不正确例1 某食品厂用自动装罐机装罐头食品,每罐的标准重量为500克,设罐重是服从正态分布的随机变量,根据多年的观测结果,其标准差10=σ克,每隔一段时间要检测机器工作是否正常,现从中抽取10罐,测得平均重量为507克,问这段时间机器工作是否正常?以X 表示罐头的重量,则),(~2σμN X ,这里100==σσ克已知,μ未知,根据样本均值507=x 克来判断500=μ还是500≠μ.为此,我们提出假设 50000==μμ:H 01μμ≠:H这是两个对立的假设.我们要给出一个合理的法则,根据这一法则,利用已知样本作出判断是接受假设0H ,还是拒绝假设0H .如果作出判断是接受0H ,则认为0μμ=,即认为机器工作是正常的,否则认为机器工作是不正常的. 这里称假设0H 为原假设或零假设,对原假设0H 作出拒绝或接受的判断,称为对0H 作出显著性检验,而备选的假设1H 称为备择假设.有备择假设的假设检验问题就是在原假设0H 和备择假设1H 中作出拒绝哪一个、接受哪一个的判断.二、假设检验的基本思想例1中的问题化为检验问题0100μμμμ≠=:;:H H ,其中5000=μ.设n X X X ,,, 21为总体的一个样本,若0H 成立,它就是来自总体),(020σμN 的一个样本,此时,样本均值),(~0n N X 20σμ,从而统计量)1,0(~/00N n X U σμ-=.对很小的正数α,有αα=>}|{|2/u U P .这里我们构造了一个小概率事件}|{|2/αu U >,这意味着当0H 成立时,对一次抽样的结果,事件}|{|2/αu U >发生的概率只有α.如果经过一次抽样,这个小概率事件发生了,根据“小概率事件在一次试验中是几乎不可能发生的”的小概率事件原理,我们就有理由怀疑原来所做出的假设0H 的正确性,因而否定原假设0H .反之,如果经过一次抽样,小概率事件没有发生,我们就没有理由拒绝0H ,只能接受0H .这里称由2/||αu U >确定的区域为拒绝域,记为W ,即}|{|2/αu U W >=.拒绝域的边界点称为临界点.在例1中,若取5.00=α,则96.12/=αu ,样本均值507=x ,此时U 的取值96.12136.210/10|500507|>=-=u ,即小概率事件发生了,于是我们拒绝0H ,认为机器工作不正常.如上所述,在假设检验中要给定一个很小的数α,把概率不超过α的小概率事件认为是实际不可能事件,α越小,否定原假设就越有说服力,这个α称为显著性水平.对于不同的问题,显著性水平可以选取不一样的值.为方便起见,常取的值是0.1,0.05,0.01等.注意:假设检验的基本思想实质上是带有某种概率性质的反证法. 为了检验一个假设0H 是否正确, 首先假定该假设0H 正确, 然后根据样本对假设0H 作出接受或拒绝的决策. 如果样本观察值导致了不合理的现象的发生, 就应拒绝假设0H , 否则应接受假设0H .假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则, 即小概率事件在一次试验中是几乎不发生的. 但概率小到什么程度才能算作“小概率事件”, 显然, “小概率事件”的概率越小,否定原假设0H 就越有说服力. 常记这个概率值为)10(<<αα,称为检验的显著性水平. 对不同的问题, 检验的显著性水平α不一定相同, 但一般应取为较小的值, 如0.1,0.05或0.01等.三、假设检验的两类错误第一类错误是“弃真”的错误:当假设0H 正确时, 小概率事件也有可能发生, 此时我们会拒绝假设0H , 因而犯了“弃真”的错误, 称此为第一类错误. 犯第一类错误的概率恰好就是“小概率事件”发生的概率α, 即P {拒绝0H |0H 为真}=α.在例1中,犯第一类错误的概率为α.第二类错误是“取伪”的错误:若假设0H 不正确, 但一次抽样检验结果, 未发生不合理结果, 这时我们会接受0H , 因而犯了“取伪”的错误,称此为第二类错误. 记β为犯第二类错误的概率, 即P {接受0H |0H 不真}=β.理论上, 自然希望犯这两类错误的概率都很小。
第8章 假设检验
关于建立假设的几点认识:
❖ 1.原假设和备择假设是一个完备事件组,且相互对 立,即必有一个成立,而且只有一个成立。
❖ 2.在假设检验中,通常将符号≤ ≥ =放在原假设上。 ❖ 3. 不同的研究者出于不同的研究目的或角度,可能
根据计算的检验统计 量与临界值进行比较, 得出拒绝或不拒绝原 假设的结论
检验统计量与拒绝域
拒绝原假设的检验统计量的所有可能取 值的集合,称为拒绝域。
若 绝对值Z临界值,拒绝原假设
拒绝域的大小与我们事先选定的显著性 水平有关。
根据选定的显著性水平确定的拒绝域的 边界值,称为临界值。
选定的显著性水平后,查阅书后的附表 就可以得到具体的临界值,将检验统计 量与之比较,就可以作出拒绝或接受原 假设的决策。
H0 H1
研究的问题 双侧检验 左侧检验 右侧检验
= 0
8.1.4 用P 值进行假设检验
❖ P 值是一个概率值(194页) 左侧检验时,P值为曲线左边小于等于检
验统计量部分的面积
右侧检验时,P值为曲线右边大于等于检
验统计量部分的面积
双侧检验时P值为曲线两边大于等于或小于 等于检验统计量部分的面积检验统计量部
什么是原假设?
1. 待检验的假设,又称“0假设”
为什么叫0 假设?
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0 例如, H0: 3190(克)
什么是备择假设?
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设,总 是有不等号: , 或
第八讲假设检验.
S X=SEX= n n 1
Sn1
例8.4 学生的学习成绩与教师的教学方法有关。
某校一教师采用了一种他认为新式有效的教学
方法。经过一学年的教学后,从该教师所教班
级中随机抽取了6名学生的考试成绩,分别为
48.5, 49.0, 53.5, 49.5,56.0, 52.5, 而在该学年考试
中,全年级的总平均分数为52.0, 试分析采用这
0
n
3、指定检验中的显著性水平;
用样本推断H0是否正确,必有犯错误的可能。
原假设H0正确,而被我们拒绝,犯这种错误
的概率用表示。把称为假设检验中的显著 性水平( Significant level), 即决策中的风险。显 著性水平就是指当原假设正确时人们却把它拒 绝了的概率或风险。
通常取=0.05或=0.01或=0.001, 那么, 接受
•假设检验的目的在于检验差异,所以,又叫 差异的显著性检验
2、确定适当的检验统计量 用于假设检验问题的统计量称为检验统计量。与参数 估计相同,需要考虑: •总体是否正态分布; •大样本还是小样本; •总体方差已知还是未知。
由于本例中总体正态,样本容量大于等于30, 所以检验统计量为Z分布。
Z=
X- 0
以认为受过良好早期教 育的儿童智力高于一般 水平。
8.2.2 总体正态分布,总体方差未知的均值检验
Z统计量中包含已知参数2,当总体方差2未知 时,不能选择Z统计量。这时需要用样本方差S2 代替2,检验统计量
X 0 t S n
服从自由度df=n-1的t分布,此时的检验叫做t 检验。而不是Z检验。标准误为:
例8.1 某校一个班进行比奈智力测验, X =110, 班级人数 n=50, 该测验常模0=100, 0=16。该班智力水平1(不是这一 次测验结果)是否与常模水平有显著差异?
§8.1假设检验的基本概念(上)
上面的推导过程反映了一般假设检验的思想方法。
假设检验又称显著性检验,其中 称Z X 0 为检验统计量;
0 n
称z/2为临界值; 称W={|z|z/2}为(原假设H0的)拒绝域。
当样本观察值代入检验统计量,小概率事件发生了, 则样本观察值所落入的区域就是(原假设H0的)拒绝域, 此时拒绝H0成立,从而接受H1成立。 当样本观察值代入检验统计量,小概率事件没有发生, 则不拒绝(或接受)H0成立。此时样本观察值所落入的 区域就是(原假设H0的)接受域。
第八章 假设检验
§8.1 假设检验的基本概念 §8.2 正态总体下参数的假设检验
【导言】在上一章,我们讨论了求未知参数的点估计和
区间估计的方法。但这并不能解决完总体中有关未知
参数的基本问题。在第六章,我们曾提出判断电器平 均寿命是否有“>5万小时” 的问题。解决这样问题的
方法是数理统计的另一个基本内容,称为假设检验。
Z X 0 0 n
凑分布
的相对大小一致,从而就是判断Z取值的相对大小。
这就需要一个临界值,以判断|Z|取值的相对大小。
下面来寻求这样一个临界值。
我们取一个很小的正数,比如=0.01, =0.05, 称为
(x)
显著性水平,并且假定H0成立,此时有
Z X 0 ~ N (0,1), 0 n
/2 -z/2
这个问题的一般形式是:当总体X~N(, 02),其中02
已知,取得样本X1, X2, …, Xn及其观测值x1, …, xn后,
要判断H0: =0,H1: 0中哪一个成立.
这时我们掌握的数据是:x=508,这与0=500有差异。
一般情形下,x500,但是它与500是否足够地接近是
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8.1 假设检验的基本概念
真实情况
判
断
接 受 H0 拒绝 H 0 H 0 成立 判断正确 第一类错误 H 1 成立 第二类错误 判断正确
犯第一类错误的概率为 P (拒绝 H 0 H 0 为真)= 这个概率是小概率,也称为检验水平。 犯第二类错误的概率为 P (拒绝 H 0 H 0为真)= ( 2) ( 1)
确定该统计量的分布;
(3)确定 H 0的拒绝域;在给定显著性水平 0 1 的条件下,查统计量所服从的分布表, 求出临界值,从而确定拒绝域 W ; (4)推断:由样本观察值算出统计量的观察值, H0 若落在拒绝域W 中,则拒绝 ,否则接受 H0
第八章 假设检验
三、假设检验中的两类错误
第八章 假设检验
一. 假设检验的基本概念
对一个样本进行考察,从而决定它是否合理
地 被认为与假设相符,这一过程叫做假设检验。 例1 抛掷一枚硬币100次,“正面出现”了40次 ,能否认为这枚硬币是均匀的?
设用X描述抛掷一枚硬币的试验。 就是要检验X是否服从p=1/2的0-1分布。
8.1 假设检验的基本概念
例2 从2006年的新生儿中随机抽取20个,测得其 平均体重为3240g,样本标准差为300g。而根据 过去统计资料,新生儿平均体重为3200g。问现 在与过去的新生儿体重有无显著差异(假定新生 儿体重服从正态分布)?
把所有2006年的新生儿体重视为一个总体, 用X表示。 问题就是判断 EX=3200是否成立?
第一类错误 (弃真) 当原假设H0成立时,在此前提下,使用样本构成的小 概率事件,在一次试验中也有可能发生,这时按照假 设检验的基本方法因该拒绝原假设H0 ,从而犯了“以 真为假”的错误,称这种错误为第一类错误。
第二类错误 (取伪)
原假设H0本来不成立,但结果却是接受H0 ,从而犯 了“以假为真”的错误,称为第二类错误.
8.1 假设检验的基本概念
我们当然希望犯这两类错误的概率都很
小,但当 H 0、 H 1给定,样本容量 n 固定时, 这是办不到的。只有增大样本容量 n ,才能 使 , 都变得小些。
8.1 假设检验的基本概念
H0 : 0.700%;
H1 : 0.700%。
2 0 . 030 , 若 H 0为真,则 样本均值 X ~ N 0 . 700 , 25 X 0.700 故有 U ~ N 0 , 1 . 0.006
பைடு நூலகம்
H1,称H1为备择假设。
8.1 假设检验的基本概念
下例说明假设检验的基本原理及步骤: 例3 某炼铁石生产的生铁含硅量服从正态 分布。由过去大量的数据算得含硅量平均值为 0. 7(%),均方差为0.030(%)。现在炼铁厂原料
有了改变,从改变原料后的生产记录中随机地
抽取n=25的样本,算得平均含硅量x 0.670% 均方差 没有改变,问生铁含硅量有无显著变 化?
0.670 0.700 u 25 5 由于 u 5 1.96, 0.030
故拒绝 H 0 。认为原料改变后,生铁的含
硅量有显著变化。
8.1 假设检验的基本概念
综上所述,我们可以得出进行假设检验的步骤: (1)提出原假设 H 0 及备择假设 H 1 ; (2)构造检验统计量,在 H 0 为真的条件下,
对于给定的 0 1 ,查正态分布 表的分位数 u1 ,使
2
P U u1 .
2
例如,取 0.05 ,查得 u1 2 0.975 1.96 P U u0.975 0.05. 使
8.1 假设检验的基本概念
例1 中,n 25 , x 0.670(%) ,
第八章 假设检验
第八章 假设检验
概述
上一章介绍了对总体中未知参数的估计方法,本章 将介绍统计推断中另一类重要问题——假设检验。 任何一个有关随机变量未知分布的假设称为统计假 设或简称假设。这里的“假设”只是一个设想,至于 它是否成立,在建立假设时并不知道,还需进行考察。 对一个样本进行考察,从而决定它是否合理地 被认为与假设相符,这一过程叫做假设检验。检验是 一种决定规则,它具有一定的程序,通过它来对假设 成立与否作出判断。
第八章 假设检验
这种作为检验对象的假设称为原假设,通常 用H0表示。 例2中, H0: EX=3200
本章内容:检验假设H0成立与否。
实际推断原理: 概率很小的随机事件(通常以≤0.05的概率为 小概率)在一次试验中实际上几乎是不发生的。
8.1 假设检验的基本概念
二. 假设检验的基本原理步骤
先假定所要检验的假设H0成立,在此前提下, 根据给定的值,使用样本构造概率为的小概率 事件。然后,根据一次试验的结果,即样本观测值, 看上述小概率事件在此试验中是否发生。如 果发生,我们就否定H0;否则就接受H0 。 称为显著性水平或检验水平,通常=0.05或0.01。 H0的反面记为H1,若否定H0,就意味着接受