第8章 假设检验(1)
第8章假设检验测试答案
第八章假设检验1。
A 2。
A 3。
B 4。
D 5。
C 6. A1。
某厂生产的化纤纤度服从正态分布,纤维的纤度的标准均值为1.40。
某天测得25根纤维的纤度的均值,检验与原来设计的标准均值相比是否有所变化,要求的显著性水平为,则下列正确的假设形式是().A. :μ=1.40,:μ≠1。
40 B. : μ≤1.40,:μ>1.40 C. :μ<1。
40,:μ≥1。
40 D. :μ≥1。
40,:μ<1.40 2。
某一贫困地区估计营养不良人数高达20%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为()。
A。
:π≤0。
2,:π>0。
2 B。
:π=0。
2,:π≠0.2 C. :π≥0.3,:π<0。
3 D. :π≥0.3,:π<0。
33.一项新的减肥计划声称:在计划实施的第一周内,参加者的体重平均至少可以减轻8磅。
随机抽取40位参加该项计划的样本,结果显示:样本的体重平均减少7磅,标准差为3.2磅,则其原假设和备择假设是()。
A。
:μ≤8,: μ>8B. :μ≥8,:μ<8C. :μ≤7,:μ>7D。
:μ≥7,:μ<74。
在假设检验中,不拒绝原假设意味着( )。
A。
原假设肯定是正确的B。
原假设肯定是错误的C。
没有证据证明原假设是正确的D。
没有证据证明原假设是错误的5。
在假设检验中,原假设和备择假设()。
A. 都有可能成立B. 都有可能不成立C. 只有一个成立而且必有一个成立D. 原假设一定成立,备择假设不一定成立6.在假设检验中,第一类错误是指( )。
A。
当原假设正确时拒绝原假设B. 当原假设错误时拒绝原假设C. 当备择假设正确时拒绝备择假设D。
当备择假设不正确时未拒绝备择假设7. B 8. C 9. B 10。
A 11。
D 12。
C7.在假设检验中,第二类错误是指()。
A。
当原假设正确时拒绝原假设B. 当原假设错误时未拒绝原假设C。
当备择假设正确时未拒绝备择假设D. 当备择假设不正确时拒绝备择假设8。
第八章假设检验练习题1设总体为来自该总体的一个样本记则检验
第八章 假设检验练习题1.设总体都未知其中22,),,(~σμσμN X .n x x x ,,,21 为来自该总体的一个样本.记∑∑==-==n i i n i i x x Q x n x 1221)(,1.则检验假设 00:μμ=H 01:μμ≠H 所使用的统计量=t (用Q x ,表示);其拒绝域=C .2.设总体都未知其中22,),,(~σμσμN X .n x x x ,,,21 为来自该总体的一个样本.记∑∑==--==n i i n i i x x n s x n x 1221)(11,1.则 (1)检验假设 2:0≤μH 2:1>μH 所使用的统计量=t (用s x ,表示);其拒绝域=C .(2)检验假设 2:0≥μH 2:1<μH 所使用的统计量=t (用s x ,表示);其拒绝域=C .3.设总体都未知其中22,),,(~σμσμN X .n x x x ,,,21 为来自该总体的一个样本.记∑=--=n i i x x n s 122)(11为其样本方差.则检验假设 16:20≥σH 16:21<σH 所使用的统计量=2χ ;其拒绝域=C .4.设21,,,,,,2121n n y y y x x x 和分别为来自正态总体),(21σμN 和),(22σμN 的两个独立样本,2221,s s 分别为这两个样本的样本方差.则检验假设 1:210≥-μμH 1:211<-μμH 所使用的统计量=t ;其拒绝域=C .5.设21,,,,,,2121n n y y y x x x 和分别为来自正态总体),(211σμN 和),(222σμN 的两个独立样本,2221,s s 分别为这两个样本的样本方差.则检验假设 1:22210=σσH 1:22211≠σσH 所使用的统计量=F ;其拒绝域=C .6.设总体都未知其中22,),,(~σμσμN X .n x x x ,,,21 为来自该总体的一个样本.其样本均值为x ,样本方差为2s ,显著性水平为α.则检验问题00:μμ=H 01:μμ≠H 的拒绝域C 应为 ( ).(A)⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≥-)1()(20n t n s x αμ; (B)⎭⎬⎫⎩⎨⎧-≥-)1()(0n t n s x αμ; (C)⎭⎬⎫⎩⎨⎧--≤-)1()(0n t n s x αμ; (D)⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧-≤-)1()(20n t n s x αμ. 7.设总体都未知其中22,),,(~σμσμN X .n x x x ,,,21 为来自该总体的一个样本.其样本方差为2s ,显著性水平为α.则检验问题5:20≤σH 5:21>σH检验统计量应为( ). (A)5)1(2s n -; (B)5)1(2s n +; (C)5)1(2s n -; (D)5)1(2s n +. 8.设一台机床加工轴的椭圆度服从正态分布):)(02.0,09.0(2mm N 单位.机床经调整后随机取16根轴测量其椭圆度,经计算得mm x 08.0=.问调整后机床加工轴的平均椭圆度是否有显著变化)05.0(=α?对此检验问题应提出的假设为( ).(A)09.0:0=μH 09.0:1<μH ; (B)09.0:0≥μH 09.0:1<μH ;(C)09.0:0≤μH 09.0:1>μH ; (D)09.0:0=μH 09.0:1≠μH .9.在假设检验中,设0H 为原假设,则犯第一类错误的情况为( ).(A)0H 不真,接受0H ;(B)0H 真,拒绝0H ;(C)0H 不真,拒绝0H ;(D)0H 真,接受0H .10.某厂生产的某种型号的电机,其寿命长期以来服从方差2250=σ的正态分布.现有一批这种电机,从它的生产情况来看,寿命的波动性有所变化.现随机地取26只电机,测出其寿命的样本方差28002=s .问能否认为这批电机的寿命的波动性较以往显著地偏大)05.0(=α对此检验问题应提出的假设为( ).(A)22050:=σH 22150:≠σH (B)22050:≥σH 22150:<σH ;(C)22050:≤σH 22150:>σH ; (D)22050:=σH 22150:<σH .11.在假设检验中,显著性水平α表示 ( ).(A)0H 为真,但接受0H 的概率; (B)0H 为真,但拒绝0H 的概率;(C)0H 不真,但接受0H 的概率; (D)假设0H 的可信度.12.下列论断正确的是( ).(A)第一类错误的概率是{}0H P 拒绝;(B)第一类错误与第二类错误的概率之和为1;(C)给定显著性水平α,当样本容量n 增大时,两类错误的概率都减小;(D)样本容量n 固定,增大显著性水平α,则第二类错误的概率减小.13.设总体),(~211σμN X ,总体),(~222σμN Y ,检验假设22210:σσ=H 22211:σσ≠H ,05.0=α.今分别从X 中抽取容量为13的样本, 从Y 中抽取容量为10的样本,求得样本方差93.31,4.1182221==s s ,则正确的检验方法和结论是( ).(A)用2χ检验法,临界值283.10)21(,479.35)21(2975.02025.0==χχ,拒绝0H ; (B)用F 检验法,临界值291.0)9,12(,87.3)9,12(975.0025.0==F F ,拒绝0H ;(C)用F 检验法,临界值291.0)9,12(,87.3)9,12(975.0025.0==F F ,接受0H ;(D)用F 检验法,临界值357.0)9,12(,07.3)9,12(95.005.0==F F ,接受0H .14.对正态总体的数学期望μ进行假设检验,如果在显著性水平05.0下接受00:μμ=H ,那么在在显著性水平0.01下,下列结论正确的是 ( ).(A)必接受0H ;(B)可能接受,可能拒绝0H ;(C)必拒绝0H ;(D)不接受,也不拒绝0H .15.自动装袋机装出的每袋重量服从正态分布,规定每袋重量的方差不超过a ,为了检验自动装袋机的生产是否准确,对它生产的产品进行抽样检查,取零假设a H ≤20:σ,显著性水平05.0=α,则下列命题正确的是 ( ).(A)如果生产正常,则检验结果也认为生产正常的概率等于95%;(B)如果生产不正常,则检验结果也认为生产不正常的概率等于95%;(C)如果检验的结果认为生产正常,则生产确实正常的概率等于95%;(D) 如果检验的结果认为生产不正常,则生产确实不正常的概率等于95%.16.设某种药品中有效成分的含量服从正态分布),(2σμN ,原工艺生产的产品中有效成分的平均含量为a ,现在用新工艺试制了一批产品,测其有效成分的含量,以检验新工艺是否真的提高了有效成分的含量.要求当新工艺没有提高有效成分含量时,误认为新工艺提高了有效成分的含量的概率不超过5%,那么应取零假设0H 及显著性水平α是 ( ).(A)01.0,:0=≤αμa H ; (B)05.0,:0=≥αμa H ;(C)05.0,:0=≤αμa H ; (D)01.0,:0=≥αμa H .。
《概率论与数理统计》第八章1假设检验的基本概念
2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
第8章 假设检验
ˆ H0 : 0 ˆ H :
0 0
备择
假设
研究者想收集证据予以支持的假设。
1. 与原假设对立的假设 2. 总是有, 或 3. 表示为 H1
例如:
ˆ H0 : 0 ˆ H0 : 0 ˆ H :
0 0
ˆ H1 : 0 ˆ H1 : 0 ˆ H :
拒绝 H0
.025
拒绝 H0
.025
t
ta
2 . 262 /2
-2.262
0
2.262
t
不拒绝原假设,没有证据表明该供 货商提供的配件是不符合要求的。
二、总体比例的检验
大样本
p ~ N(,
(1 )
n
)
设假设的总体比例为0,总体比例的检验统计量为:
z
p 0
0 (1 0 )
拒绝 H0
.025
拒绝 H0
.025
-1.96
0
1.96
Z
由于是双侧检验,拒绝域在左右两侧,所以临界值为:
z za / 2 1.96
在显著性水平a=0.05上不拒绝原假设,表明样本提供的证据还 不足以推翻原假设,因此,没有证据表明该天生产的饮料不符
合标准要求。
【例】某批发商欲从生产厂家购进一批灯泡,根据 合同规定,灯泡的使用寿命平均不能低于1000小时。 已知灯泡使用寿命服从正态分布,标准差为20小时。 在总体中随机抽取100只灯泡,测得样本均值为960 小时。批发商是否应该购买这批灯泡? (a=0.05)
n
假设
双侧检验
左侧检验
右侧检验
假设形式
H0 : 0 H1 : 0
统计学 第8章 假设检验 教学课件ppt
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
统计学第8章假设检验
市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。
管理定量分析课程第8章:假设检验
判决
无罪 有罪
陪审团审判
真实的情况
无罪
有罪
判决正确
判决错误
判决错误
判决正确
结论
未拒绝原假设 拒绝原假设
假设检验 总体参数的实际情况
原假设为真 备择假设为真 结论正确 第二类错误 第一类错误 结论正确
11
假设检验中犯Ⅰ型错误的概率,称为显著性水平(level of significance),即指当零假设实际上是正确时,检验统计量落
7
又如:教育部要检验2012年录取的大学新生平均身高是否 达到了170cm标准,这样需要提出原假设(H0):2012
年大学新生(总体)的平均身高(µ )是170cm。为了检
验这个假设是否正确,需要根据随机取样的原则,从2012 年的大学新生总体中选取样本并计算样本的平均高度,以 此来检验原假设的正确性。
8
假设检验一般分为参数假设检验和非参数假设检验两种类型。参 数假设检验对变量的要求较为严格,适合于等距变量和比率变量 ,非参数假设检验对变量的要求较为自由,既适合于等距变量和 比率变量,也适用于类别变量和顺序变量。
变量测量层次
分类(nominal)变 量
数学性(interval)变量
4
一、假设与假设检验
假设是科学研究中广泛应用的方法,它是根据已知理 论与事实对研究对象所作的假定性说明。统计学中的 假设一般专指用统计学术语对总体参数所做的假定性 说明。在进行任何一项研究时,都需要根据已有的理 论和经验事先对研究结果作出一种预想的假设。这种 假设叫科学假设,在统计学上称为研究假设。对这种 研究假设进行证实或证伪的过程叫假设检验。
非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式。
第8章 假设检验
例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k
设
)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:
第8章 平均数的假设检验
重点
• 根据样本平均数的抽样分布,可以对总体 平均数进行差异显著性检验,需考虑总体 方差是否已知,总体是否服从正态分布, 是大样本还是小样本等问题。
• 根据两个独立样本平均数之差的抽样分布, 可以检验两个总体的平均数有无显著差异, 需考虑两总体的方差是否已知,两总体是 否服从正态分布,方差是否齐性,是大样 本还是小样本等问题。
• 显著性水平和可靠性程度(置信水平)之间 的关系是:两者之和为1。
双侧检验与单侧检验
• 双侧检验(two-tailed test,twosided test):将α等分为左右两个部分,
左右两边各设置一个拒绝域,中间是接受域。 每个拒绝域相应的概率为α/2. 零假设为无显著 差异的情况;
• 单侧检验(one-tailed test):要么将与α
– 备择假设(alternative hypothesis,或称 研究假设、对立假设),用H1表示。
假设检验是从零假设出发,视其被拒绝的概 率,从而得出决断。
假设检验的步骤
• 2.确定适当的检验统计量并计算其值
• 确定检验统计量时,要根据抽样分布做出 选择。不同类型的问题涉及到的抽样分布 不同,要选择不同的检验统计量。
假设检验的基本思想
设(X1,X2,…,Xn)
是抽自正态分布总体 X~N(μ, σ2)的一个容 量为n的简单随机样 本,则其样本均值也 是一个正态分布随机 变量,且有
E(X) X
D(
X
)
2 X
2
n
X ~ N(, 2 )
n
Z X ~ N (0,12 ) / n
假设检验
第8章 假设检验
数理统计
问题归结为对差异作定量的分析,以确定其性质 问题归结为对差异作定量的分析,以确定其性质. 差异可能是由抽样的随机性引起的, 差异可能是由抽样的随机性引起的,称为 “抽样误差”或 随机误差 抽样误差” 抽样误差 这种误差反映偶然、 这种误差反映偶然、非本质的因素所引起的随机 波动. 波动
数理统计
数理统计
P{| U |> u 2} =α α
也就是说,“ 也就是说 是一个小概率事件. | U |> u 2 ”是一个小概率事件 α
故我们可以取拒绝域为:
W: | U |> uα 2 :
如果由样本值算得该统计量的实测值落入区域 W,则拒绝 0 ;否则,不能拒绝 0 . 否则,不能拒绝H ,则拒绝H
假设检验会不会犯错误呢? 假设检验会不会犯错误呢? 由于作出结论的依据是下述 小概率原理 不是一定不发生
小概率事件在一次试验中基本上不会发生 小概率事件在一次试验中基本上不会发生 . 基本上
数理统计
如果H0成立,但统计量的实测值落入否定 如果 成立, 从而作出否定H 的结论,那就犯了“ 域,从而作出否定 0的结论,那就犯了“以真 为假” 为假”的错误 . 如果H0不成立,但统计量的实测值未落 如果 不成立, 入否定域,从而没有作出否定H 的结论, 入否定域,从而没有作出否定 0的结论,即 接受了错误的H 那就犯了“以假为真” 接受了错误的 0,那就犯了“以假为真”的 错误 .
α 取得很小,则拒绝域 取得很小,
很小的情况下H 如果在 α 很小的情况下 0 仍被拒绝了, 仍被拒绝了,则说明实际情 况很可能与之有显著差异. 况很可能与之有显著差异 基于这个理由, 时拒绝H 基于这个理由,人们常把 α = 0.05 时拒绝 0称为 显著的 时拒绝H 称为是高度 是显著的,而把在 α = 0.01 时拒绝 0称为是高度 显著的 显著的.
概率统计课件8.1
X 10 Z
/2
(0.1/ 10)
取c Z /2 (0.1/ 10)
现在我们就得到检验准则如下:
当 X 10 c时 我们就拒绝原假设
H0:μ=10.
而当 X 10 c时 我们就接受原假设 H0:μ=10.
第8章
§8.1 假设检验的基本思想与步骤
第9页
(II)道理 我们的原假设是 H0:μ=10 由上面分析,当H0成立时,有:
P X 10 Z /2 (0.1/ 10)
∵相当小.这就是说:如果H0这个假设是正确的话, 检验统计量落入拒绝域就是一个发生的概率很小的事件. 过去我们提到过,通常认为:小概率事件在一次试验 中基本上是不会发生的. (我们把它称做实际推断原理.)
其中c Z /2 (0.1/ 10)
6
第8章
§8.1 假设检验的基本思想与步骤
第7页
X 10 称为检验统计量. 0.1 / 10 X 10 Z / 2 (0.1 / 10 ) X 10 也即 Z / 2 称为该检验的拒绝域 0.1 / 10
用以上检验准则处理我们的问题.
那么如果小概率事件发生了,即:
X 10 计算得 X 10.05 1.581 0.1/ 10
0.05 查表得Z / 2 1.96
∴接受原假设 H0:μ=10.
7
第8章
§8.1 假设检验的基本思想与步骤
第8页
假设检验的基本思想
假设检验的基本思想实质上是带有某种概率性质 的反证法。为了检验一个假设H0是否正确,首先假设 该假设H0正确,然后根据抽取到的样本对假设H0作出 接受或拒绝的决策。如果样本观察值导致了不合理的 现象发生,就应拒绝假设H0 ,否则应接受假设H0 。 假设检验中所谓的“不合理”,并非逻辑中的绝 对矛盾,而是基于人们在实践中广泛采用的原则,即 小概率事件在一次实验中是几乎不发生的。但概率到 什么程度才能算作“小概率事件”,显然,“小概率 事件”的概率越小,否定原假设H0就越有说服力。常 记这个概率值为α(0<α<1),称为检验的显著性水平。 对不同的问题,检验的显著性水平α不一定相同,但一 般应取为较小的值,如0.1、0.05或0.01等 8
假设检验
检验的基本原理
第8章 假设检验 4
在前例这个假设就是:生产过程是正常的,或者说不合格品率不超过0.01。 但估计问题,在收集数据之前并不对参数真值进行假设,这是两者的重要差别。 此外,估计问题的结论是定量的,而检验问题的回答是定性的。
也即,回答观察的数据与假设的差异只是由随机性引起的呢?还是反映了 总体的真实差异?即关于总体的假设仍然成立呢?还是不再成立?
同济大学数学系 & 人民邮电出版社
目录/Contents
8.1 检验的基本原理 8.2 正态总体参数的假设检验 8.3 拟合优度检验
第8章 假设检验 24
目录/Contents
第8章 假设检验 25
8.2 正态总体参数的假设检验
一、单正态总体均值的假设检验 二、单正态总体方差的假设检验 三、两个正态总体均值差的假设检验 四、两个正态总体方差比的假设检验
同济大学数学系 & 人民邮电出版社
一、单正态总体均值的假设检验
第8章 假设检验 28
(1) 方差 2 已知时的均值 检验
首先,建立原假设 H0 和备择假设 H1,设 H0 : =0 H1 : 0
其次, 估计 ˆ =X;
然后,构造检验统计量:Z X 0
n H0成立 ~N (0,1)
接着,给出拒绝域的构造形式:W Z c
油量 X ~ N(, 9),请问在显著性水平 0.05 假定下,能否接受耗油量低29mpg的
假设;若显著性水平为 0.1,则结论又有会有变化吗?
同济大学数学系 & 人民邮电出版社
五、 p值和 p值检验法
解
建立假设 H0 : 29 H1 : 29
给出未知参数 的估计值 ˆ =x 28 ,
假设检验习题及答案
第8章 假设检验一、填空题1、 对正态总体的数学期望μ进行假设检验,如果在显著性水平0.05下,接受假设00:μμ=H ,那么在显著性水平0.01下,必然接受0H 。
2、在对总体参数的假设检验中,若给定显著性水平为α,则犯第一类错误的概率是α。
3、设总体),(N ~X 2σμ,样本n 21X ,X ,X ,2σ未知,则00:H μ=μ,01:H μ<μ的拒绝域为 )}1(/{0--<-n t n S X αμ,其中显著性水平为α。
4、设n 21X ,X ,X 是来自正态总体),(N 2σμ的简单随机样本,其中2,σμ未知,记∑==n 1i i X n 1X ,则假设0:H 0=μ的t 检验使用统计量=T Qn n X )1(- .二、计算题1、某食品厂用自动装罐机装罐头食品,规定标准重量为250克,标准差不超过3克时机器工作 为正常,每天定时检验机器情况,现抽取16罐,测得平均重量252=X 克,样本标准差4=S 克,假定罐头重量服从正态分布,试问该机器工作是否正常?解:设重量),(~2σμN X 05.016==αn 4252==S X(1)检验假设250:0=μH 250:1≠μH ,因为2σ未知,在0H 成立下,)15(~/250t n S X T -=拒绝域为)}15(|{|025.0t T >,查表得1315.2)5(025.0=≠t由样本值算得1315.22<=T ,故接受0H(2)检验假设9:20=σH 9:201>σH 因为μ未知,选统计量2022)1(σS n x -= 在0H 成立条件下,2x 服从)15(2x 分布,拒绝域为)}15({205.02x x >,查表得996.24)15(205.0=x , 现算得966.24667.26916152>=⨯=x ?拒绝0H ,综合(1)和(2)得,以为机器工作不正常2、一种电子元件,要求其使用寿命不得低于1000小时,现在从一批这种元件中随机抽取25件,测得其寿命平均值为950小时,已知该种元件寿命服从标准差100=σ小时正态分布,试在显著性水平0.05下确定这批产品是否合格.解:设元件寿命),(~2σμN X ,2σ已知10002=σ,05.0,950,25===αX n检验假设1000:0=μH 1000:1<μH在2σ已知条件下,设统计量)1,0(~/1000N n X σμ-=拒绝域为}{05.0μμ<,查表得645.195.005.0-=-=μμ 而645.15.2205025/1001000950-<-=-=-=μ 拒绝假设0H 选择备择假设1H ,所以以为这批产品不合格.3. 对 显 著 水 平 α, 检 验假 设 H 0 ; μ = μ0, H 1 ; μ ≠ μ0, 问当 μ0, μ, α一 定 时 , 增大样本量 n 必 能 使 犯 第 二 类 错 误 概 率 β 减 少 对 吗 ?并 说 明 理由 。
第8章 假设检验
关于建立假设的几点认识:
❖ 1.原假设和备择假设是一个完备事件组,且相互对 立,即必有一个成立,而且只有一个成立。
❖ 2.在假设检验中,通常将符号≤ ≥ =放在原假设上。 ❖ 3. 不同的研究者出于不同的研究目的或角度,可能
根据计算的检验统计 量与临界值进行比较, 得出拒绝或不拒绝原 假设的结论
检验统计量与拒绝域
拒绝原假设的检验统计量的所有可能取 值的集合,称为拒绝域。
若 绝对值Z临界值,拒绝原假设
拒绝域的大小与我们事先选定的显著性 水平有关。
根据选定的显著性水平确定的拒绝域的 边界值,称为临界值。
选定的显著性水平后,查阅书后的附表 就可以得到具体的临界值,将检验统计 量与之比较,就可以作出拒绝或接受原 假设的决策。
H0 H1
研究的问题 双侧检验 左侧检验 右侧检验
= 0
8.1.4 用P 值进行假设检验
❖ P 值是一个概率值(194页) 左侧检验时,P值为曲线左边小于等于检
验统计量部分的面积
右侧检验时,P值为曲线右边大于等于检
验统计量部分的面积
双侧检验时P值为曲线两边大于等于或小于 等于检验统计量部分的面积检验统计量部
什么是原假设?
1. 待检验的假设,又称“0假设”
为什么叫0 假设?
2. 研究者想收集证据予以反对的假设
3. 总是有等号 , 或
4. 表示为 H0 例如, H0: 3190(克)
什么是备择假设?
1. 与原假设对立的假设,也称“研究假设”
2. 研究者想收集证据予以支持的假设,总 是有不等号: , 或
假设检验的基本概念.ppt
这样,原假设不会被轻易拒绝,一旦结果为拒绝 原假设,其结果也是可以信赖的,而且我们还知道此
时犯第一类错误的概率不超过;
如果结果为不能拒绝原假设,考虑到原假设为以 往的经验,做出接受原假设的推断也是比较合理的.
8.1.4 假设检验的步骤
因此,假设检验问题可能会犯如下两类错误:
第一类错误(“弃真”):实际情况是H0成立,而检验 的结果表明H0不成立,拒绝了H0.
第二类错误(“取伪”):实际情况是H0不成立,H1成 立,而检验的结果表明H0成立,接受了H0. 下面我们来研究一下犯这两类错误的概率.
8.1.3 假设检验的两类错误
犯第一类错误的概率:
没有足够的理由拒绝H0,应认可H0.
8.1.2 假设检验的基本思想
看来,是否拒绝 H0的关键是看U
因此
x 0
/ n
z
2
X
/
0
n
的取值是否满足
称
x 0
/ n
z
2 即{|
U
|
z/2}称为H0的拒绝域.
称–z/2和z/2为H0的拒绝域的临界点(值).
称 U X 0 为检验统计量.
/ n
0.499 0.515 0.508 0.512 0.498 0.515 0.516 0.513 0.524
问这台包装机工作是否正常? 通过分析知道: 要检验包装机工作是否正常,就是要检验总体均值
= 0.5kg是否成立.
Hale Waihona Puke 8.1.1 假设检验的思想方法
具体思路是:
首先提出两个对立的假设:
H0: = 0.5
假设检验第1讲
例 1: 某产品旳出厂检验要求: 次品率 p 不超出 4%才干出厂. 现从一万件产品中任意抽查12件 发觉3件次品, 问该批产品能否出厂?若抽查成 果发觉1件次品, 问能否出厂?
解: 先作一种假设。H0 : p 0.04
我们称H0是原假设或零假设.
再作一种备择假设
H1 : p 0.04
在H0成立时
要有效降低犯错误旳概率, 只好增长观察数据, 或在可能旳情况下提升数据旳质量,这相当于降 低数据旳样本方差.
例4 :第一类错误与第二类错误旳比较 一种有20数年教龄旳教师声称他上课历来不
“点名”. 怎样鉴定他讲旳话是真实旳?
确立原假设H0: 他没有点过名。 然后再调查H0是否为真. 当调查了他教过旳3个班, 都说他没有点过名, 这时假如认可H0, 犯错误旳概率还是较大旳. 当调查了他教过旳10个班, 都说他没有点过名, 这时认可H0 犯错误旳概率会明显降低。
于是, 我们判断正确旳概率是1-0.043=95.7%
假设检验中旳基本概念和检验思想 (1) 根据问题旳背景, 提出原假设
H0: p=0.35, 及其备择假设
H1: p>0.35.
(2) 在H0 成立旳假设下, 计算观察数据出现旳概 率P.
➢ 假如P很小(一般用0.05衡量), 就应该否定H0, 认可 H1;
如 = 0.05。拟定一种常数 c , 使得
X 68
P
3.6 6
c
则
c
z 2
z0.025
1.96
X 68 由 3.6 1.96
6
于是检验旳拒绝域为
X 69.18 或 X 66.824
W { X 69.18 or X 66.824} 现根据样本观察值,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
值应以较大的概率出现在0的附近,因此对 不利的小概率事件是 的值出现在远离0的地方。即 大于某个较大的
数,或小于某个较小的数。这一小概率事件对应的否定域为
满足
.构造这一否定域利用了 的概率密度曲线两侧尾部面积(图 7-1),故称具有这种形式的否定域的
检验为双侧检验(Two-sidedtest)。
图 8-1 40 给定显著性水平,在例 7.4中 =0.01,查出临界值 =-2.575,
上述的这一推断,实际上就是假设检验的全部过程。它一般包含了这么几步:提出假设,抽样,并对样本进行加
工(构造统计量),定出一个合理性界限,得出假设是否合理的结论。为了便于操作,我们将结合例 7.3,把这一过程
步骤表述得更加形式化一点。这里要说明一点的是所谓“小概率事件”。究竟多大概率为小概率事件?在一个问题中,通
.
30 求出在 下,统计量 的分布,构造对 不利的小概率事件:
易知,在 下,即如果此人是完全随机地摸球的话,统计量 服从二项分布B(10,1/2).其分布列为
,
.那么此人摸到的绿球数应该在平均数 5个附近,所以对 不利的小概率事件是:“绿
球数 大于某个较大的数,或小于某个较小的数。”在此问题中,若此 不成立,即此人作弊的话,不可能故意少摸
被视为对 不利的小概率事件,它在一次试验中是不应该发生的,
现在
居然发生了,只能认为 是不成立的,即 :“此人作弊”成立。
这一推断过程,也是假设检验的一般步骤,在这些步骤中,关键的技术问题是确定一个适当的用以检验假设的统计 量,这个统计量至少应该满足在 成立的情况下,其抽样分布易于计算(查到)。当然还应该尽量满足一些优良性条
=- =2.575.
50 从 的值判断小概率事件是否发生,并由此得出接受或拒绝 的结论。对于例 7.4,因为在 20中算出的 值,
绿球,因此只需考虑事件“ 大于某个较大的数”,这个数常称为临界值,即某个分位数。
40 给定显著性水平 ,确定临界值:
即取一数
使得P{ >
}= .如取 =0.01,由分布列算出:
.
对于这种离散型概率分布,不一定能取到
.取最接近的 ,使当 成立时,
,因此
.即该小概率
事件是
.
50 得出结论:
已算得
,即
发生了,而
:此人未作弊; :此人作弊。
这 里 称 为 原 假 设 (Nullhypothesis), 称 为 备 选 假 设 (Alternativehypothesis)或 对 立 假 设 (Opposite
hypothe造统计量,并由样本算出其具体值:
统计量取为 10次模球中摸中绿球的个数 .由抽样结果算出
C1.对 :
,
C2.对 C3.对
: :
C4.对 :
对于正态参数检验,我们也将针对不同情况,采用形式与上述随机变量
完全一样的统计量
,来作为检验统
计量。但这里需要说明的是,作为区间估计中的
与检验中的
是有所不同的,第一,
中含有待估的未
知参数 ,因此,它不是统计量,只是一般的随机变量;而
中的参数 为一已知数,因此它是统计量。第二,
无论是参数检验还是非参数检验,其原理和步骤都有共同的地方,我们将通过下面的例子来阐述假设检验的一般
原理和步骤。 Example8.3 据报载,某商店为搞促销,对购买一定数额商品的顾客给予一次摸球中奖的机会,规定从装有红、
绿两色球各10个的暗箱中连续摸10次(摸后放回),若 10次都是摸得绿球,则中大奖。某人按规则去摸10次, 皆为绿球,商店认定此人作弊,拒付大奖,此人不服,最后引出官司。
还有一类问题实际上很难用参数估计的方法去解决。
Example8.2 某研究所推出一种感冒特效新药,为证明其疗效,选择 200名患者为志愿者。将他们均分为两组,
分别不服药或服药,观察三日后痊愈的情况,得出下列数据。
是否痊愈 服何种药
痊愈者 未痊愈者 合计
未服药者
48
52 100
服药者
56
44 100
合计
种方法验收。他们认为,由于抽样是随机的,在这次抽样中,次品的频率超过3%,不等于说这批产品的次品率 (概
率)超过了3%.就如同说掷一枚钱币,正反两面出现的概率各为1/2,但若掷两次钱币,不见得正、反面正好各出现一
次一样。就是说,即使该批货的次品率为3%,仍有很大的概率使得在抽检43件货物时出现2个以上的次品,因此需
检验的参数来说应该是“较好”的,这一点与参数的区间估计很相似。在正态总体参数的区间估计中,我们正好也是讨论 了上述四种情形的置信区间。在区间估计中,我们曾提到过,构造参数 的置信区间的关键一步是从 的点估计出发, 构造一个分布已知的含未知参数 的随机变量 ( ),针对四种情况,当时我们构造的 ( )分别是
我们在此并不关心此人是否真正作弊,也不关心官司的最后结果,但从统计的观点看,商店的怀疑是有道理的。
因为,如果此人摸球完全是随机的,则要正好在 10次摸球中均摸到绿球的概率为
,这是一个很小的数,
一个统计的基本原理是在一次试验中所发生的事件不应该是小概率事件。现在既然这样小概率的事件发生了,就应当
推测出此人摸球不是随机的,换句话说有作弊之嫌。
常是指定一个正数
,认为概率不超过 的事件是在一次试验中不会发生的事件,这个 称为显著性水平
(Levelofsignificance)。对于实际问题应根据不同的需要和侧重,指定不同的显著性水平。但为了制表方便,通常可
选取 =0.01,0.05,0.10等。
下面我们用假设检验的语言来模拟商店的推断: 10 提出假设:
假设检验也可分为参数检验(Parametrictest)和非参数检验(Nonparametrictest)。当总体分布形式已知,只对某 些参数做出假设,进而做出的检验为参数检验;对其它假设做出的检验为非参数检验。如例 7.1中,总体是两点分布,
只需对参数 做出假设检验,这是参数检验问题,而例 7.2则是非参数检验的问题。与估计问题稍不同的是,一般来 说非参数检验同参数检验一样,在实际中经常要用到,因此,我们准备花一定的篇幅分别加以介绍。
生的两类错误。 2、 了解单个和两个正态总体的均值与方差的假设检验。 3、 了解总体分布假设的 检验法。
假设检验的基本思想、基本步骤及假设检验可能产生的两类错误。
教学内容
§8.1 假设检验思想概述(SummaryofHypothesisTestIdea)
前一章讲了对总体参数的估计问题,即是对样本进行适当的加工,以推断出参数的值(或置信区间)。本章介绍 的假设检验,是另一大类统计推断问题。它是先假设总体具有某种特征(例如总体的参数为多少),然后再通过对样本 的加工,即构造统计量,推断出假设的结论是否合理。从纯粹逻辑上考虑,似乎对参数的估计与对参数的检验不应有 实质性的差别,犹如说:“求某方程的根”与“验证某数是否是某方程的根”这两个问题不会得出矛盾的结论一样。但从统 计的角度看估计和检验,这两种统计推断是不同的,它们不是简单的“计算”和“验算”的关系。假设检验有它独特的统计 思想,也就是说引入假设检验是完全必要的。我们来考虑下面的例子。
, 已知,需检验 ,由前所述,用 检验法。我们仿照例 7.3的步骤
来解这个问题。 Solution 10 提出假设(已有,略)。 20 构造统计量。此问题属情形C1.的u检验,故用统计量
并计算其具体值。在例 7.4中
30 易知,在 成立的条件下; 服从正态分布
,因此根据正态分布的特点,在 成立的条件下, 的
对于正态总体,其参数无非是两个:期望 和方差 ,如果加上两总体的参数比较,概括起来,对参数的假设一
般只有如下四种情形:(ⅰ)对 ,(ⅱ)对 ,(ⅲ)对
,(ⅳ)对
.其中情形(i)、(ⅲ)又分
为 (或
)已知和未知的两种情况。下面我们将分别予以讨论。如前所提到的,对于设计一个检验,关键是
构造一个统计量
,它需满足的一个必要条件是在 成立时,分布为已知(有表可查),同时它对于需要
}.最后的检验即是判断所给
的样本是否落在 内,或者是
是否成立。因此,从这个意义上可以说设计一个检验,本质上就是找到一个恰当
的否定域 ,使得在 下,它的概率
今后我们总是把统计检验中提到的“小概率事件”视为与否定域 是等价的概念。另外,称 的余集
为的
接受域。
§8.2 正态总体参数检验(ParameterTestofNormalCollectivity)
要用别的方法。如果百货商店也希望在维护自己利益的前提下,不轻易地失去一个有信誉的货源,也会同意采用别的
更合理的方法。事实上,对于这类问题,通常就是采用假设检验的方法。具体来说就是先假设次品率
,然后
从抽样的结果来说明
这一假设是否合理。注意,这里用的是“合理”一词,而不是“正确”,粗略地说就是“认为
”能否说得过去。具体如何做,下面再说。
的分布是已知的,这是因为其中的 与总体中的参数 是相一致的;而
布才已知。除此之外,它们的分布形式是完全一样的。
上述统计量
在 成立时通常有4种分布:
的分布则需在假设总体参数 明确时分
D1.
情形 C1.、C3.中,
;
D2.分布情形,C1.、C3.中,
;
D3. 分布,情形 C2.; D4. 分布,情形 C4. 我们分别称以它们为检验统计量的检验为 的具体问题和检验的方法。
Example8.1 某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平,定出质量标准,即若次品
率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件检验,发现有次品2件,问应如何处理这批货物?
如果双方商定用点估计方法作为验收方法,显然2/43>3%,这批货物是要被拒收的。但是厂家有理由反对用这