数理统计--第八章假设检验
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
统计学-第八章 假设检验

假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
《概率论与数理统计》课件第八章 假设检验

《概率论与数理统计》第八章1假设检验的基本概念

2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
第八章 假设检验

x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
概率论与数理统计第八章假设检验习题解答

1.[一]某批矿砂的5个样品中的镍含量,经测定为(%)3.25 3.27 3.24 3.26 3.24。
设测定值总体服从正态分布,问在α = 0.01下能否接受假设:这批矿砂的含镍量的均值为3.25.解:设测定值总体X~N (μ,σ 2),μ,σ 2均未知步骤:(1)提出假设检验H 0:μ=3.25; H 1:μ≠3.25 (2)选取检验统计量为)1(~25.3--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α(4)n=5, α = 0.01,由计算知01304.0)(11,252.3512=--==å=i iX Xn S x查表t 0.005(4)=4.6041, )1(343.0501304.025.3252.3||2-<=-=n t t α(5)故在α = 0.01下,接受假设H 02.[二] 如果一个矩形的宽度ω与长度l 的比618.0)15(21»-=l ω,这样的矩形称为黄金矩形。
这种尺寸的矩形使人们看上去有良好的感觉。
现代建筑构件(如窗架)、工艺品(如图片镜框)、甚至司机的执照、商业的信用卡等常常都是采用黄金矩型。
下面列出某工艺品工厂随机取的20个矩形的宽度与长度的比值。
设这一工厂生产的矩形的宽度与长短的比值总体服从正态分布,其均值为μ,试检验假设(取α = 0.05)H 0:μ = 0.618H 1:μ≠0.6180.693 0.749 0.654 0.670 0.662 0.672 0.615 0.606 0.690 0.628 0.668 0.611 0.606 0.609 0.601 0.553 0.570 0.844 0.576 0.933. 解:步骤:(1)H 0:μ = 0.618; H 1:μ≠0.618 (2)选取检验统计量为)1(~618.0--=n t nS X t(3)H 0的拒绝域为| t |≥).1(2-n t α (4)n=20 α = 0.05,计算知0925.0)(11,6605.01121=--===åå==ni ini ix xn S xnx ,)1(055.2200925.0618.06605.0||,0930.2)1(22-<=-==-n t t n t αα(5)故在α = 0.05下,接受H 0,认为这批矩形的宽度和长度的比值为0.6183.[三] 要求一种元件使用寿命不得低于1000小时,今从一批这种元件中随机抽取25件,测得其寿命的平均值为950小时,已知这种元件寿命服从标准差为σ =100小时的正态分布。
概论论与数理统计:第八章假设检验(浙大第四版)

χ2 =
(n − 1) s 2
σ 02
, 拒 绝 域 为 {χ >
2
2 χα (n − 1)} , 由
3
n = 9, s = 0.007, χ 02.05 (8) = 15.504 ,算得 χ 2 = 15.68 > 15.504, 因此拒绝原假设 H 0 ,即认
为这批导线的标准差显著地偏大. 6、解 设枪弹甲、乙的速度分别为 x, y ,并设 x ~ N ( μ1 , σ 1 ), y ~ N ( μ 2 , σ 2 ) .
x−y 1 1 + n1 n2
其中
2 sw =
2 (n1 − 1) s12 + (n2 − 1) s 2 n1 + n2 − 2
拒绝域为 C = ⎨| t |≥ t α (n1 + n 2 − 2)⎬ .
⎧ ⎩
⎫ ⎭
2
由于 n1 , n 2 很大,故有 t 0.025 (218) ≈ z 0.025 = 1.96 将 x = 2805, y = 2680, 以上数据代入上式 计算可得 | t |= 8.206 > 1.96 ,故拒绝原假设 H 0 ,可以认为两个总体的平均值有显著差异, 即 两种枪弹在速度方面有显著差异. 综上所述,两种枪弹在速度方面有显著差异但在均匀性方面没有显著差异. 7、解 设马克吐温与思诺特格拉斯的小品文中由 3 个字母组成的词的比例分别为 x, y ,并且 由题意可设 x ~ N ( μ1 , σ ) , y ~ N ( μ 2 , σ ) ,本题是在显著性水平 α = 0.05 下检验假设:
⎧ ⎩
⎫ ⎭
2
已 知 n1 = 8, n 2 = 10 , 查 表 得 t 0.025 (16) = 2.1199, , 经 计 算 得 , x = 0.2319, s1 = 0.01456,
概率与数理统计第8章--假设检验与方差分析

第8章假设检验与方差分析【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。
尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以元报收后停牌。
2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至元。
此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与 600μg组,及安慰剂组与εPA-44 900μg组之间,HBeAg/抗HBe 血清转换在统计意义上均无差异”。
通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg 组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。
有关数据如表所示:表乙肝新疫苗的应答率注:εP A-44为治疗用(合成肽)乙型肝炎疫苗简称。
上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”为什么说这个结论表示乙肝新疫苗无效什么叫“在统计意义上无差异”如何根据样本数据作出统计意义上有无差异的判断解答这些问题就需要本章所要介绍的假设检验。
现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。
例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。
这些分析研究都离不开假设检验或方差分析。
假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。
本教材介绍假设检验与方差分析的基本原理和一些基本方法。
概率论与数理统计第八章假设检验

对于(a)小概率P{X 0 u }
u是所选取合适的统计量 U 的分位点
1
单侧检验
P{ X 0 u } x 0 u为拒绝区域
其含义是依这样本x所推断的
小
概率
事
件H
发生
0
了
,
拒
绝H
0
u
拒绝
1
u 拒绝
对于(b)小概率P{X 0 u } (密度函数为对称时)
由 经 验 知 0.015公 斤 , 为 了 检 验 某 天 机器 工 作 是 否 正 常 , 抽 取其 所
包 装 的9袋 称 得 重 量 分 别 为0:.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.519; 问这天机器正常否?
现在另一天任然抽取9袋得样本均值x 0.511公斤,推断这天机器是否工作正常?
小 概 率 事 件 是: 样 本 均 值X与 所 假 设 的 期 望0相 差 X 0
不 能 太 大, 若 相 差 太 大 则 拒 绝H0
小概率事件P{ X 0 u }
u
是
2
所
选
取
合
适
的
统
计
量U
2
的
2
分
位
点
1
P{ X 0 u } x 0 u 为拒绝区域 2
较大、较小是一个相对的概念,合理的界限在何 处?应由什么原则来确定?
问题是:如何给出这个量的界限? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中基本上不会发生(若发 生了则认为假设是错 )
在假设检验中,称这个小概率为显著性水平,用 表示.
第8章 假设检验

例 孟德尔遗传理论断言,当两个品种的豆杂交时,圆的 和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的 频数将以比例9:3:3:1发生。在检验这个理论时,孟德 尔分别得到频数315、101、108、32、这些数据提供充分 证据拒绝该理论吗?
P PH0 | Z || z0 | 2PH0 Z | z0 | 2(1 (| z0 |))
(即z0代替了拒绝域式中的z 2 )
判断:当P小于显著水平时,拒绝原假设,
否则,接受: 0, H1 : 0 , 其中0是已知的常数
以X 作为的参考, 若H0为真,X比0大些,但
这个批次清漆的干燥时间构成的总体方差可设 2 0.36 而其均值是要求我们检验的!
经计算,现抽取的9个数据的平均值x 6.4小时,
现在的问题是,我们能否认为 "6.4 6.0 0" ?
即,接受以下哪个假设?
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
4
原假设 H0 : 0 6.0, 备择假设 H1 : 0 6.0
16
*另外方法:若给定显著性水平, 当原假设成立时
( 0),总体X ~ N (0, 2 ),因此,X ~ N (0, 2 n )
P0 ( X 0
k)
P 0
(
X
0
n
k
设
)
n
k
n z /2
k z/2 n
1
一般,H
的拒绝域写为:
数理统计 第八章 假设检验

量
渐近2 服从ik自1 (由fi度n为pni(pik)-21)的ik1 2nf分pi2i布. n
检验的拒绝域形为: W= 2 C
当显著性水平给定时,可得 C=2 (k 1).
12
如果根据所给的样本值 X1,X2, …,Xn算得
(2 n-1)
2 1
2 (n 1)
(n 1)S 2
2
t(n1 n2 2)
2 2 (n 1) (X Y ) (1 2 )
S 1 1 w n1 n2
t(n1 n2 2)
F1 2 (n1 1, n2 1)
F(n1 1,n2 1)
npi
近似服从 2(1)
按 0.05,查表得
2 0.05
(1)
3.841,拒绝域为
W= 2 3.841
这里,n=70+27=97, k=2,
实测频数为70,27.
理论频数为: np1=72.75, np2=24.25
由于统计量 2的实测值 2=0.4158<3.841,17
理论频数npˆi 217 149 51
12
3
22
战争次数x 实测频数 fi 概率估计 pˆi 理论频数npˆi
0
1
223 142
0.502 0.346
217 149
2 48 0.119 51
3 15 0.027
12
4
4
0.006
3
15
检验统计量的观察值为
2 k ( fi npi )2 k fi2 n
i 1
npi
i1 npˆi
《概率论与数理统计教学课件》8第八章—正态总体均值和方差的假设检验

真)
P1 2
(
x y
11
k)
k t (n1 n2 2)
sw
n1 n2
2
概率统计
在显著性水平 下, H0 的拒绝域:
x y
sw
11
t (n1 n2 2)
2
n1 n2
注:
当
2 1
2 2
2
未知时
检验假设
或
H0 : 1 -2 (或1 2 ), H0 : 1 2 (或1 2 ),
2
概率统计
所以拒绝H 0 ,可认为这两种轮胎的耐磨性有显著差异。
注: ▲ 用两种不同的方法得到了两种不同的结论,那么
究竟应该采取哪一个结论比较合理呢?
显然,应该采取第二种方法得出的结论是合理的
因为数据配对的方法是针对同一架飞机的,它是 排除了因飞机之间的试验条件的不同而对数据产 生的干扰,所以它是直接反映了这两种轮胎的耐 磨性的显著差异的情况,因此,应采取第二种方 法得出的结论,即可认为这两种轮胎的耐磨性有 显著差异。
概率统计
按单个正态总体中当 2 未知时,关于 的假设检验
的计算公式,可得 H0 的拒绝域为:
C { t t t (n 1)}
2
经计算 d 320 , s2 89425 ,
t
d s
320 2.83 89425
n
8
t (n 1) t0.05 (7) 2.365
2
2
因为: t 2.83 t0.05 (7) 2.365
为已知常数,显著水平为
概率统计
Q 检验统计量
(X Y)
~ N (0,1)
2 1
2 2
n1 n2
第8章 假设检验

数理统计
问题归结为对差异作定量的分析,以确定其性质 问题归结为对差异作定量的分析,以确定其性质. 差异可能是由抽样的随机性引起的, 差异可能是由抽样的随机性引起的,称为 “抽样误差”或 随机误差 抽样误差” 抽样误差 这种误差反映偶然、 这种误差反映偶然、非本质的因素所引起的随机 波动. 波动
数理统计
数理统计
P{| U |> u 2} =α α
也就是说,“ 也就是说 是一个小概率事件. | U |> u 2 ”是一个小概率事件 α
故我们可以取拒绝域为:
W: | U |> uα 2 :
如果由样本值算得该统计量的实测值落入区域 W,则拒绝 0 ;否则,不能拒绝 0 . 否则,不能拒绝H ,则拒绝H
假设检验会不会犯错误呢? 假设检验会不会犯错误呢? 由于作出结论的依据是下述 小概率原理 不是一定不发生
小概率事件在一次试验中基本上不会发生 小概率事件在一次试验中基本上不会发生 . 基本上
数理统计
如果H0成立,但统计量的实测值落入否定 如果 成立, 从而作出否定H 的结论,那就犯了“ 域,从而作出否定 0的结论,那就犯了“以真 为假” 为假”的错误 . 如果H0不成立,但统计量的实测值未落 如果 不成立, 入否定域,从而没有作出否定H 的结论, 入否定域,从而没有作出否定 0的结论,即 接受了错误的H 那就犯了“以假为真” 接受了错误的 0,那就犯了“以假为真”的 错误 .
α 取得很小,则拒绝域 取得很小,
很小的情况下H 如果在 α 很小的情况下 0 仍被拒绝了, 仍被拒绝了,则说明实际情 况很可能与之有显著差异. 况很可能与之有显著差异 基于这个理由, 时拒绝H 基于这个理由,人们常把 α = 0.05 时拒绝 0称为 显著的 时拒绝H 称为是高度 是显著的,而把在 α = 0.01 时拒绝 0称为是高度 显著的 显著的.
第八章假设检验

需要考虑因素
1. 总体方差是否已知
2. 总体分布是否正态
3. 样本容量大小
4. 双侧检验还是单侧检验 5. 右侧还是左侧
二、平均数的显著性检验的种类
• (一)总体正态分布,总体方差已知(Z)
• (二)总体正态,总体方差未知(t) • (三)总体非正态分布,大样本(Z′)
(一)总体正态分布,总体方差已知
H:1 0 新的教学法与原来的教学法无显著差异 0 H:1 0 新的教学法比原来的教学法差 0 H:1 0 新的教学法比原来的教学法好 0
假设检验的原理
• 费舍:“可以说,每一实验的存在,仅仅 是为了给事实一个反驳虚无假设的机会。”
二、假设检验中的小概率事件
• 样本统计量的值(随机事件)在其抽样分 布上出现的概率小于或等于事先规定的水 平,这时,就认为小概率事件发生了。
差异原因——误差
• 偶然误差:由于随机抽样引起的差异。
• 系统误差 :的确存在差异。
如何检验
Z X 0
X
N (0,1)
11 X 2.008 n 30 Z X 0
0
X
84 79 2.49 2.008
2
0.05, Z 0.05 1.96 0.01, Z 0.01 2.58
SE X
0
n
X 0 Z SE X
例1
• 某小学采用一种实验教材,使用一年以后, 随机抽取10名学生进行测试,得到平均成 绩82分。而过去使用旧教材的全体学生的 平均成绩为77分,标准差为5分,问实验教 材与旧教材的效果有无显著性差异?
例2
• 某地区统考数学,假设该统考数学成绩服 从正态分布,已知其总平均分为50分,标 准差为12分。从该地区随机选择一个班作 为样本,该班有学生50人,经计算该班平 均成绩为53分,试问该班成绩与总成绩的 差异是否显著。
第八章 假设检验

设某工厂生产了一大批电子元件, 设某工厂生产了一大批电子元件,其寿命假 定服从指数分布,参数θ的值( 定服从指数分布,参数θ的值(即整批产品的平均 寿命)是未知的。现假定这批产品的使用者认为: 寿命)是未知的。现假定这批产品的使用者认为: 只有在θ 这批产品合格。为此, 只有在θ ≥ θ0时,这批产品合格。为此,从这批产 品中抽出若干个,测得其寿命为x1, …,xn,要由此 品中抽出若干个,测得其寿命为 要由此 判断“ 是否成立。 判断“θ ≥ θ0”是否成立。 是否成立
χ2拟合检验法
& 提出原 假 设 H 0 : 总体 X的分布函数为 F ( x ) H 1 : 总体 X的分布函数不是 F ( x ) 构造检验统计量 L 将 X可能取值的全体分成 k个两两不相交的子集 A1, A2, Ak, 的个数, 以 f i 记样本观察值落在 Ai的个数,有 k n k f 2 fi χ 2 = ∑ ( − pi ) 2 = ∑ i − n ~ χ 2 ( k − 1) i = 1 pi i = 1 np i n 个未知参数, 若 F ( x )中含有 r个未知参数,则先用最 大似然估计法估计未知 参数 k f i2 2 χ = ∑ ∧ − n ~ χ 2 ( k − r − 1) i =1 n pi 拒绝域为 2 2 χ 2 ≥ χ α ( k − 1)或χ 2 ≥ χ α ( k − r − 1)
假设检验的基本思想: 假设检验的基本思想:
小概率事件在一次实验中很难发生。 小概率事件在一次实验中很难发生。
两类错误: 两类错误:
第一类错误:原假设是真的, 第一类错误:原假设是真的,却做出拒绝原假 设的决定; 设的决定; 第二类错误:原假设是假的, 第二类错误:原假设是假的,却做出接受原假 设的决定。 设的决定。
2014年自考 概率论与数理统计串讲讲义 第八章 假设检验

第八章 假设检验
1. 假设检验的基本思想:小概率事件在一次抽样中是几乎不可能发生的
例1 设总体X ~)1,(μN ,其中μ未知,n x x x ,,,21 为其样本
试在显著性水平α下检验假设
00:μμ=H ;01:μμ≠H
这里,α即为小概率事件的概率,当00:μμ=H 真时,n x n x u /1/00μσμ-=-=
~)1,0(N
则 αα=≥)(2/u u P
即事件)(2/αu u ≥即为小概率事件,当它发生时,即认为原假设0H 不真,从而接受对立假设01:μμ≠H
2. 两类错误
以例1为例,上述n x u /10
μ-=的取值完全由样本n x x ,,1 所决定,由于样本的随机性,
假设检验可能犯以下两类错误:
第一类错误:P =α(拒00H H 真),也即检验的显著性水平
第二类错误:P =β(接受00H H 不真)P =(接受10H H 真)
在样本容量n 固定时,βα,相互制约,当减小α时,β的值会增大,反之亦然。
3.正态总体),(2σμN 参数的假设检验
(1)首先要会判断所讨论问题是否为假设检验问题
例2 从一批灯泡中随机抽取50个,分别测得其寿命,算得其平均值1900=x (小时),样本标准差490=s (小时),问可否认为这批灯泡的平均寿命(μ)为2000小时。
分析:本题中虽然没说总体(寿命)服从什么分布,但由于样本容量50≥n ,可按正态总体处理,“可否认为平均寿命为2000小时”等价于作检验2000:0=μH
(2)检验问题主要是对提出的假设检验确定出检验的拒绝域,这可参考指定教材第八章正态总体检验一览表。
数理统计 (26)

由样本观测值可得: 由样本观测值可得:
s 0.844 F= = = 1.101 ∈ (0.248, 4.026) s 0.767
2 1 2 2
所以接受原假设,可认为两总体的方差相等 所以接受原假设,可认为两总体的方差相等.
(2) H 0 : 1 2 = 0 H : 1 2 ≠ 0 8-17
由样本观测值可得: 由样本观测值可得:
950 1000 z= = 2.5 < 1.645 100 / 5
所以拒绝原假设, 所以拒绝原假设,认为这批元件的寿命小 于1000小时,不合格。 小时,不合格。 小时
8-4
H 0 : ≤ 10
H1 : > 10
X 10 T= S / 20
成立时, 解: 在H0成立时,取
9 × 0.00037 2 χ2 = = 7.701 > 3.325 2 0.0004
所以接受原假设,总体的方差不小于 所以接受原假设,总体的方差不小于0.04%
8-15 解:
2 H 0 : σ 12 = σ 2
2 H1 : σ 12 ≠ σ 2
S12 成立时, 在H0成立时, F = 2 ~ F (7, 9) S1
| t |= | 0.231875 0.2097 | 7 × 0.000212 + 9 × 0.0000933 16
s12 = 0.000212
y = 0.2097, s2 2 = 0.0000933
1 1 + 8 10 = 3.878 > 2.1199
所以拒绝原假设,认为两者比例有显著差异 所以拒绝原假设,认为两者比例有显著差异.
x = 99.2, s12 = 0.8444
y = 98.9, s2 2 = 0.7667
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验
R } ,其概率就是检验水平α,通常我们取α=0.05,有时也
提出零假设 H0; 选择统计量 K; 对于检验水平α查表找分位数λ; 由样本值 x1 , x 2 , , x n 计算统计量之值 K;
将 K 与 进行比较,作出判断:当 | K 两类错误:
| (或 K ) 时否定 H ,否则认为 H 相容。
所以此检验问题的拒绝域为
x 0 sቤተ መጻሕፍቲ ባይዱ n
t (n 1) 。
2
由条件得到 n 9 , x 13.2, s 4.0,
t
x 10 s/ n
2.4> t 0.025 (8)=2.3060
(2)取检验统计量
2
(n 1) S 2
2
,则
2
(n 1) S 2
变小,则 变大。取定 要想使 变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际 情况而定。当我们宁可“以假为真” 、而不愿“以真当假”时,则应把α取得很小,如 0.01,甚至 0.001。 反之,则应把α取得大些。 例:原假设 H 0 不真时,作出接受 H 0 的决策,称为犯第 出拒绝 H 0 的决策,称为犯第
0 0
第一类错误:当 H0 为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定 H0。这时,我 们把客观上 H0 成立判为 H0 为不成立(即否定了真实的假设) ,称这种错误为“以真当假”的错误或第一类 错误,记 为犯此类错误的概率,即 P{否定 H0|H0 为真}= ; 此处的α恰好为检验水平。 第二类错误:当 H1 为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受 H0。这时,我 们把客观上 H0。不成立判为 H0 成立(即接受了不真实的假设) ,称这种错误为“以假当真”的错误或第二类 错误,记 为犯此类错误的概率,即 P{接受 H0|H1 为真}= 。 两类错误的关系: 人们当然希望犯两类错误的概率同时都很小。但是,当容量 n 一定时, 变小,则 变大;相反地,
2 (8)=15.507 x 0.05 2 (8)=17.535 x 0.025 2 (8)=2.180 x 0.975
t 0.025 (8)=2.3060 t0.05(8)=1.8595
t0.025(9)=1.8331 解 (1)取检验统计量
t
X 0 S/ n
,则它服从 t (n 1) ,
检验方差
2
2 0 是否成立需要利用( C
)
A 标准正态分布 C 自由度为 n 的 分布
2
B 自由度为 n-1 的 t 分布 D 自由度为 n-1 的 分布
2
设服用某种药物一定份量使病人每分钟脉搏增加的次数 X 近似服从正态分布 N (μ,σ2),均 值μ、 方差σ2 均未知, 今抽查 9 个病人, 测得每分钟增加脉搏的次数样本均值为 13.20, 样 本标准差为 4.0 (1) 试取α=0.05,检验假设 H0:μ=10 H1:μ 10; (2) 求σ的置信度为 0.95 的置信区间. 备用数据:x2 分布、t 分布的上侧α分位数
2
2 (n 1) ,从而
P{ P{
1 2
2
(n 1)
(n 1) S 2
2
2 (n 1)} 1 2
(n 1) S 2 (n 1) S 2 2 } 1 2 (n 1) 2 (n 1)
2 1 2
所以σ的置信度为 0.95 的置信区间为(2.701793,
0.0816 < t 0.01 (15) 2.947,
所以接受 H 0 , 即整批灯泡的平均使用寿命为 2000 小时.
0 / n
u u1 u u1 | t | t
1
2
(n 1)
未知
2
H 0 : 0 H 0 : 0
T
x 0 S/ n
t (n 1)
t t1 (n 1) t t1 (n 1)
例题:
.设总体
X ~ N ( , 2 ) ,且 已知,
《概率论与数理统计》
第八章
基本思想: 假设检验的统计思想是, 概率很小的事件在一次试验中可以认为基本上是不会发生的, 即小概率原理。 为了检验一个假设 H0 是否成立。 我们先假定 H0 是成立的。 如果根据这个假定导致了一个不合理的事件 发生,那就表明原来的假定 H0 是不正确的,我们拒绝接受 H0;如果由此没有导出不合理的现象,则不能拒 绝接受 H0,我们称 H0 是相容的。与 H0 相对的假设称为备择假设,用 H1 表示。 这里所说的小概率事件就是事件 {K 取 0.01 或 0.10。 基本步骤: 假设检验的基本步骤如下: (i) (ii) (iii) (iv)
7.66261).
2、 从一批灯泡中抽取 16 个灯泡的随机样本, 算得样本均值 x =1900 小时, 样本标准差 s=490 小时,以α=1%的水平,检验整批灯泡的平均使用寿命是否为 2000 小时? (附:t0.05(15)=2.131,t0.01(15)=2.947,t0.01(16)=2.921,t0.05(16)=2.120) 解 假设 H 0 : 0 2000 , H1 : 0 2000 , 取检验统计量
类错误,原假设 H 0 为真时,作
类错误.
单正态总体均值和方差的假设检验 条件 零假设 统计量 对应样本 函数分布 否定域(拒绝域)
H 0 : 0
已知
2
| u | u U x 0
N(0,1)
1
2
H 0 : 0 H 0 : 0 H 0 : 0
t
X 0 S/ n
~ t (n 1)s 490 ,则 t x 0 s/ n
X 0 S/ n
~ t (n 1) ,
所以此检验问题的拒绝域为
t (n 1) .
2
由条件 n 16 , x 1900 , s 490 , 得到
t1
x 10 s/ n