第八章__假设检验(分布拟合检验)

合集下载

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。

由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。

假设检验一般概念

假设检验一般概念

x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.

概率论与数理统计课件第八章假设检验01

概率论与数理统计课件第八章假设检验01
若抽查结果发现1件次品, 则在H0成立时
P C p (1 p) 0.306 0.3
1 1 12 11
这不是 小概率事件, 没理由拒绝原假设。在不 准备继续抽样的情况下,作出接受原假设的决 定, 即该批产品可以出厂.
5
例2: 一条新建的南北交通干线全长10公里.公路 穿过一个隧道(长度忽略不计),隧道南面3.5公里, 北面6.5公里. 在刚刚通车的一个月中, 隧道南 发生了3起交通事故, 而隧道北没有发生交通事 故,能否认为隧道南的路面更容易发生交通事故? 分析: 用p表示一起交通事故发生在隧道南的概 率.则p=0.35表示隧道南北的路面发生交通事故 的可能性相同.p>0.35表示隧道南的路面发生交 通事故的概率比隧道北的路面发生交通事故的 概率大. ------为了作出正确的判断, 先作一个假设
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大. 做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043. 于是, 我们判断正确的概率是1-0.043=95.7%
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设 H0: p=0.35, 及其备择假设 H1: p>0.35.
再作一个备择假设
H1 : p 0.04
在H0成立时
3 3 12 9
p 0.04 代入
4
P C p (1 p) 0.0097 0.01
这是 小概率事件, 一般在一次试验中是不会发 生的, 现一次试验竟然发生, 故可认为原假设不 成立, 即该批产品次品率p>0.04 , 则该批产品不 能出厂.

第八章 分布检验和拟合优度 检验

第八章  分布检验和拟合优度   检验



2
其中 n ( x) S ( x) F0 ( x) 在零假设下, W 2 ,U 2 的分布和F0 ( x)的分布无关. 注: nD2 2 和 U 2 的渐近分布一样; 4nD2 2 和 两个独立的 W 2 统计量的和的渐近分布一样.
关于正态分布的一些其他检验和相应的R程序


S ( x)
i
n
针对上面三种检验,检验统计量分别为 :
D sup x ( F0 ( x) S ( x)) D sup x F0 ( x) S ( x) D sup x ( S ( x) F0 ( x))
在零假设下,统计量D的分布对于一切连续分布F0 ( x) 是一样的
min i ni
分 时,Q趋于 (k 1)
2
例题
例8.3 某饭店想知道他的顾客用电话是否服从 Possion分布,在他们计算机上(n=908)获得一 个小时内打电话得数据:
打电话次数 相应的人数 0 1 2 3 490 334 68 16
15.04 15.36 14.57 14.53 15.57 14.69 15.37 14.66 14.52 15.41 15.34 14.28 15.01 14.76 14.38 15.87 13.66 14.97 15.29 14.95
按照设计要求,内径应该为15±0.2mm。 问题:检验一下这个数据是否来自均值为15,方差为0.04 的正态分布?
8.1 Kolmogrov-Smirnov单样本检验及一些正态性检验
设真实分布为F(x),假设问题:
F ( x) F0 ( x) H 0 : F ( x) F0 ( x) H1 : F ( x) F0 ( x) F ( x) F ( x) 0

第八章 假设检验

第八章 假设检验

广 东 工 业 大 学
上页
下页
返回
1、原假设与备择假设 H0 2、原理
H1
小概率原理:小概率事件在一次试验中是不太会发生的。 (1)提出假设 H 0 (2)在假设 H 0 成立的条件下,构造一个小概率事件A, (3)根据样本值判断:
若在这一次试验中小概率事件A发生了,则拒绝假设 H 0 ,
若在这一次试验中小概率事件A未发生,则接受假设 H 0 .
广 东 工 业 大 学
上页
下页
返回
显著性水平 3、接受域与拒绝域
P{ A} P{样本落入区域 } R
拒绝域: R 接受域: R 4、两类错误
第一类错误: 弃真
小概率
样本点落入R:拒绝 H 0
样本点落入 R : 接受 H 0
犯第一类错误的概率:
H 0 正确,但拒绝了它。
第二类错误: 采伪
工 业 大 学
上页
下页
返回
二、假设检验的思想方法 假设检验的基本思想实质上是带有某种概率性质的反证 法。为了检验一个假设是否正确,首先假设该假设正确,然 后根据抽取到的样本对假设作出接受或拒绝的决策。如果样 本观察值导致了不合理的现象发生,就应拒绝假设,否则应 该接受假设。
假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而 是基于人们的实践活动中广泛采用的原则,即小概率事件在一 次试验中是几乎不发生的。但概率小到什么程度才能算作“小 概率事件”?显然,“小概率事件”的概率越小,否定原假设 就越有说服力。 广
上页
广 东 工 业 大 学
下页
返回
例1 某砖厂生产的砖其抗拉强度X服从正态分布 N ( ,1.21) ,今从 该厂产品中随机抽取6块,测得其平均抗拉强度为31.13.试检验 这批砖的平均抗拉强度为32.5是否成立,取显著性水平 0.05. 解: 提出原假设 H 0 : 0 32.5 双边检验: 单边检验:

第八章拟合优度检验

第八章拟合优度检验

142 149 142 137 134 144 146 147 140 142
140 137 152 145
解 为粗略了解数据的分布情况,先画出直方图。
步骤如下: 1.找出数据的最小值、最大值为126、158,取区 间[124.5, 159.5],它能覆盖[126, 158]; 2.将区间[124.5, 159.5]等分为7个小区间,小区间的 长度Δ=(159.5-124.5)/7=5, Δ称为组距,小区 间的端点称为组限,建立下表:
Y 50 31 26
17
10
8
6
6
8
试检验相继两次地震间隔天数 X 服从指数分布.
解 所求问题为: 在水平 0.05下检验假设
H0 : X 的概率密度
f
(
x)
1
x
e
,
0,
x 0, x 0.
由于在 H0 中参数 未具体给出, 故先估计 .
由最大似然估计法得 ˆ x 2231 13.77,
A5 :19.5 x 24.5 10
A6 : 24.5 x 29.5 8
A7 : 29.5 x 34.5 6
A8 : 34.5 x 39.5 A9 : 39.5 x
6
8
pˆ i
npˆ i
fi2 / npˆi
0.2788 45.1656
55.3519
0.2196 35.5752
27.0132
A7 :154.5 x
npˆ i
0.73
4.36 5.09
14.72
26.21
23.61
11.22
3.15 14.37
fi2 / npˆi
4.91
6.79 41.55 24.40 10.02 =87.67

概率论与数理统计教案第八章

概率论与数理统计教案第八章
其中, 是已知常数.试求拒绝域 .
例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,

;
;
未知
;
当 时,

;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表

概率论GL8.3

概率论GL8.3
概 率 论 与 数 理 统 计
第八章 假设检验
§8.3 分布拟合检验
概 率 进行讨论的。在实际应用中,总体分布常常是未知的, 论 与 所以要对总体分布的假设进行检验,这就是分布拟合 数 2 检验法。 检验.本节仅介绍 理 统 计
上节中各检验法都是在总体分布形式为已知的前提下
8.3.1 离散型情形
26 11
0.194 0.163
19.4 16.3
6.6 -5.3
2.245 1.723
9
0.114 0.069
11.4 6.9
-2.4 2.1
0.505 0.639
概 率 论 与 数 理 统 计
9
2 1
2 1 0
0.036 0.017
0.007 0.003 0.002
3.6 1.7
0.7 0.3 0.2 6.2815 -0.5 0.0385
故在水平 0.05 下接受 H 0 ,即认为样本来自泊松分布,
也就是说认为理论上的结合是符合实际的。
概 率 论 与 数 理 统 计
例2 研究混凝土抗压强度 X 的分布,已测得 200 件混凝土试件的抗压强度以分组的形式列如下表 (1kgf=9.8N):
j
压强区间kgf/cm2 190~200 200~210 210~220 220~230 230~240 240~250
频率逐渐稳定在 p j 的附近,它们之间的差异,在统计意义 下将越来越小。
所以,样本中出现 j 的频数 n j 和理论频数 np j 之间
概 率 皮尔逊(Pearson)提出的使用统计量 论 r ( n np ) 2 与 j 2 j 数 np j j 1 理 一般来说, 统 来衡量实际频数 n j 与理论频数 np j 的差异程度。 计 若 H 0 为真,且实验的次数又是足够多的,则这种差异即 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2 0.05
(1)
=3.841
由于统计量 2的实测值
=2 0.4158<3.841,
未落入否定域.
故认为试验结果符合孟德尔的3:1理论.
这些试验及其它一些试验,都显 示孟德尔的3: 1理论与实际是符合的. 这本身就是统计方法在科学中的一项 重要应用.
用于客观地评价理论上的某个结论是否 与观察结果相符,以作为该理论是否站 得住脚的印证.
Σ
fi
pˆ i
npˆ i
50 0.2788 45.1656
npˆ i fi (npˆi fi )2 / npˆi
-4.8344 0.5175
31 0.2196 35.5752
ቤተ መጻሕፍቲ ባይዱ
4.5752 0.5884
26 0.1527 24.7374
-1.2626 0.0644
17 0.1062 17.2044
按 =0.05,自由度为4-1-1=2查 2 分布表得
2 0.05
(2)=5.991
由于统计量 2 的实测值
2=2.43<5.991,
未落入否定域.
故认为每年发生战争的次数X服从 参数为0.69的泊松分布.
例2. 我们以遗传学上的一项伟大发现为 例说明统计方法在研究自然界和人类社会的规 律性时,是起着积极的、主动的作用.
第八章 假设检验(续)
§4. 分布拟合检验
在前面的课程中,我们已经了解了假 设检验的基本思想,并讨论了当总体分布为 正态时,关于其中未知参数的假设检验问 题.
然而可能遇到这样的情形,总体服从何 种理论分布并不知道,要求我们直接对总体 分布提出一个假设 .
例1. 从1500到1931年的432年间,每年 爆发战争的次数可以看作一个随机变量,椐统 计,这432年间共爆发了299次战争, 数据如下:
在用2检验法 检验假设H0时,若在H0下 分布类型已知,但其参数未知,这时需要先 用极大似然估计法估计参数,然后作检验.
分布拟合的 2检验法 的基本原理和步 骤如下:
1. 将总体X的取值范围分成k个互不重迭的小 区间,记作A1, A2, …, Ak .
2.把落入第i个小区间Ai的样本值的个数记 作fi , 称为实测频数. 所有实测频数之和 f1+ f2+ …+ fk等于样本容量n.
0.2044 0.0024
10 0.0739 11.9718
1.9718 0.3248
8 0.0514 8.3268
0.3268 0.0126
6 0.0358 5.7996
-0.2004 0.0069
6 0.0248 4.0176 13.2192 -0.7808 0.0461 8 0.0568 9.2016
i 1
npi
是k个近似正态的变量的平方和.
这些变量之间存在着一个制约关系:
k pi ( fi npi ) 0
i 1
npi
故统计量 2渐近(k-1)个自由度的 2分布.
在F(x)尚未完全给定的情况下,每个未知 参数用相应的估计量代替,就相当于增加一个 制约条件,因此,自由度也随之减少一个.
若有r个未知参数需用相应的估计量来 代替,自由度就减少r个.
设,否则就认为差异不显著而接受原假设.
皮尔逊定理是在n无限增大时推导出来 的,因而在使用时要注意n要足够大,以及 npi 不太小这两个条件.
根据计算实践,要求n不小于50,以 及npi 都不小于 5. 否则应适当合并区间, 使npi满足这个要求 .
让我们回到开始的一个例子,检验每
年爆发战争次数分布是否服从泊松分布.
检验孟德尔的3:1理论: 提出假设H0: p1=3/4, p2=1/4 这里,n=70+27=97, k=2, 理论频数为: np1=72.75, np2=24.25 实测频数为70,27.
自由度为
统计量 2 2 ( fi npi )2 ~ 2 (1)
i 1
npi
k-1=1
按 =0.05,自由度为1,查 2 分布表得
8
而pˆ9 Pˆ( A9 ) 1 Pˆ( Ai ) 0.0568 i 1
于是可以得到下面的表:
i [ai,ai+1) 1 [0,4.5) 2 [4.5,9.5) 3 [9.5,14.5) 4 [14.5,19.5) 5 [19.5,24.5) 6 [24.5,29.5) 7 [29.5,34.5) 8 [34.5,39.5) 9 [39.5,+∞)
相应的估计量来代替,那么当 n 时,
统计量 2
分布.
的分布渐近 (k-r-1)个自由度的 2
为了便于理解,我们对定理作一 点直观的说明.
在理论分布F(x)完全给定的情况下,每个pi 都是确定的常数. 由棣莫佛-拉普拉斯中心极
限定理,当n充分大时,实测频数 fi 渐近正态,
因此
2 k ( fi npi )2
战争次数X 发生 X次战争的年数
0
223
1
142
2
48
3
15
4
4
在概率论中,大家对泊松分布产生的一 般条件已有所了解,容易想到,每年爆发战 争的次数,可以用一个泊松随机变量来近似 描述 . 也就是说,我们可以假设每年爆发战 争次数分布X近似泊松分布.
现在的问题是:
上面的数据能否证实X 具有 泊松分布的假设是正确的?
此时统计量 2渐近(k-r-1)个自由度的 2分布.
根据这个定理,对给定的显著性水平 ,
查 2分布表可得临界值 2 ,使得
P(
2
2
)
得拒绝域:
2
2
(k
1)
(不需估计参数)
2 2 (k r 1) (估计r 个参数)
如果根据所给的样本值 X1,X2, …,Xn算得
统计量 2的实测值落入拒绝域,则拒绝原假
奥地利生物学家孟德尔进行了长 达八年之久的豌豆杂交试验, 并根据 试验结果,运用他的数理知识, 发现了 遗传的基本规律.
孟德尔

黄色纯系
… 子一代 绿色纯系
子二代
根据他的理论,子二代中, 黄、绿之 比 近似为3:他1,的一组观察结果为:
黄70,绿27 近似为2.59:1,与理论值相近.
由于随机性,观察结果与 3:1 总有些差 距,因此有必要去考察某一大小的差异是否 已构成否定3:1理论的充分根据,这就是如 下的检验问题.
实测频数
0.58 0.31 0.18 0.01
0npˆ.ipˆ0i2 216.7 149.5 51.6 12.0
( fi n2p.1i )62 0.18
npi
3
0.37 6
0.251
14.16 1.623
2.43
将n pˆ i <5的组予以合并,即将发生3次及4次
战争的组归并为一组.
因H0所假设的理论分布中有一个未知 参数,故自由度为4-1-1=2.
提出假设H0: X服从参数为 的泊松分布
根据观察结果,得参数 的极大似然估计为
ˆ X =0.69
按参数为0.69的泊松分布,计算事件X=i 的 概率pi ,pi的估计是
pˆi e0.69 0.69i i !,i=0,1,2,3,4
将有关计算结果列表如下:
战争次数
fi 4
223
142 48 15
又如,某钟表厂对生产的钟进行精确性检查, 抽取100个钟作试验,拨准后隔24小时以后 进行检查,将每个钟的误差(快或慢)按秒 记录下来.
问该厂生产的钟的误差是否服从正态 分布?
解决这类问题的工具是英国统计学家 K.皮尔逊在1900年发表的一篇文章中引进
的所谓 2 检验法.
这是一项很重要的工作,不少人 把它视为近代统计学的开端.
6
6 8(1)
解:本例是检验假设
H0 :X的概率密度为
f
(
x
)
1
e
x
/
,
x
0
此处的参数θ未知,先利用极大似然估计求0出, θ的估计x为 0
将总体X可能取值的区间[0,∞)分为9个互不重叠的子区间 i=1,2,…,9。若为真,则X的分布函数是
ˆL 2231 /162 13.77
[ai ,ai1 ], 令 Ai {ai X ai1 },
Fˆ 0
(
x
)
1 0,
e
x
/
13.77
,
x0 x0
由此式得概率pi = P(Ai )的估计:
pˆi Pˆ ( Ai ) Pˆ ({ai X ai1} Fˆ0 (ai1) Fˆ0 (ai ) 例如: pˆ 2 Fˆ0 (a21) Fˆ0 (a2 ) Fˆ0 (9.5) Fˆ0 (4.5) 0.2196
一分公司 二分公司 三分公司 四分公司 合计
赞成该方案 68
75
57
79 279
反对该方案 32
75
33
31 141
合计
100 120
90
110 420
列边缘分布:列观察值的合计数的分布
别 4. 每种组合的观察频数用 fij 表示 5. 表中列出了行变量和列变量的所有可能的组
合 6. 一个 r 行 c 列的列联表称为 r c 列联表
列联表的结构
(2 2 列联表)
列(cj) 行 (ri)
i =1
i =2 合计
列( cj )
j =1
j =1
f11 f21 f11+ f21
f12 f22 f12+ f22
列联表分析 列联表的构造
列联表
(例题分析)
【例】一个集团公司在四个不同的地区设有分公司,现该集 团公司欲进行一项改革,此项改革可能涉及到各分公司的利 益,故采用抽样调查方式,从四个分公司共抽取420个样本 单位(人),了解职工对此项改革的看法,调查结果如下表
相关文档
最新文档