第3讲 假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
显著性检验的基本步骤: (1)根据实际问题作出假设H0与H1; (2)构造检验统计量(在H0真时其分布已知); (3)给定显著性水平的值, 参考H1, 令 P{拒绝H0| H0真}= , (连续型总体) P{拒绝H0| H0真}≤, (离散型总体) 求出拒绝域W; (4) 计算统计量的值, 若统计量W, 则拒绝 H0, 否则接受H0
2 2 1
W {
((r 1)(c 1))}
注:式中
ˆ i ni n , p ˆ j n j n p
故未知参数个数为r+c-2, 分布自由度为
rc-(r+c-2)-1= (r-1)(c-1)
2016/3/15 19
列联表:
例3.3.2 有一千人按性别和是否色盲分类如下:
ˆi np
ˆ i )2 ( ni np ˆi np
2 2 0.95 6 2 1 7.815 or p 0.417
0.68 0.21 0.00 0.30 0.52 1.15 2 2.84
15
【例】生成50个参数为2的poisson分布随机数x,试检 验数据是否服从poisson分布.
抗压强度区间 190 200 200 210 210 220 220 230 230 240 240 250
ˆi p
0.0386 0.1421 0.2810 0.2990 0.1711 0.0526
10 26 56 64 30 14
ni
7.72 28.42 56.20 59.80 34.23 10.53
p
(ni-pi)^2
…
提示:用hist(X,x)语句计算落在每个区间内的样本点数
17
二、列联表独立性检验
考虑二维总体(X,Y) , 将X的可能取值划分为r组:A1 ,, Ar Y的可能取值划分为c组 B1 , , Bc .记
P( X ,Y Ai B j ) pij ,i 1,
问色盲与性别是否有关?
21
解:
H 0 : pij pi p j
2 2 i 1 j 1
i, j; H1 : pij pi p j
some i, j
ˆ i p ˆ j )2 (np ˆ i p ˆ j ) 2 (nij np
1 2
由|U|=3.78>1.96,故拒绝H0,说明可以认为该 日铁水的平均含碳量显著异于4.55.但无法说 明是显著高于还是低于4.55.不合题意 若用右边检验, H0:=4.55;H1:>4.55, 则拒绝域为
U u0.95 1.645 由U=-3.78<-1.96,故接受H0,说明不能认为该日铁 水的平均含碳量显著高于4.55.但无法区分是等 于还是低于4.55.不合题意.
14
解:H 0 : X ~ N ( , 2 )
1 ˆx 195 10 205 26 ... 245 14 221 200 1 2 2 2 ˆ 195 221 10 ... 245 221 14 152.76 199
4.364 4.55 u 3.78 1.645 拒绝H0 0.11 5
H 0 : 4.55
得水平为的拒绝域为 U u0.05 1.645
这里
注:上题中,用双边检验或右边检验都是错误的. 若用双边检验, H0:=4.55;H1:4.55,则拒绝 域为 U u 1.96
2 i 1 j 1
pij pi p j。于是,记事件 X , Y Ai B j
r c
18
推论3.3.1 当X与Y独立时,
2
(n
i 1 j 1
r
c
ij
ˆ i p ˆ j ) (np ˆ i p ˆ j ) np
2
~
拒绝域为:
2
r 1 c 1
数据统计分析
第3讲 假设检验
主讲教师:陈萍 教授
e-mail:prob123@mail.njust.edu.cn
Βιβλιοθήκη Baidu
1
分布
第三章 假设检验
3.1 假设检验的基本概念
例3.1.1. 设某种产品的次品率为q,若规定次品率不能超过 2%,现随机抽取10个产品进行检验,其中含有1个次品,可 否认为这批产品合格? 求检验准则—10个产品中至少有几个次品则判断不合格? 例如,约定α=0.1(小概率),以X表示10个产品中的次品数, 思路1:假定q=2%, 记p=P{X1},若pα,则表明小概率事件 发生了,有理由认为q=2%的假定不合理,拒绝这批产品。 p=P{X1}称为“检验的p值”; 思路2:约定检验准则为“当Xk时,拒绝这批产品”。选取 k使P{Xk} α---显著性检验。
h=1拒绝原假设,h=0接受原假设; p—检验的p值,p<alpha拒绝原假设; Muci—均值的置信区间; stats—检验统计量值,自由度,样本标准差 tail:缺省--双边检验; „ right ‟“H1:>”; „left‟-”H1:<“。 Vartype—方差类型变量。‟equal‟,‟unequal‟
10
3.2 分布拟合检验
拟合优度检验----用于检验一批数据所来自 一、
2
的总体是否与某种理论分布相一致。
设样本 X 1 ,, X n 为来自总体 X的一个样本,要检验的假设 是:
H 0 : X ~ F0 ( x; )
其中 是k维未知参数向量。(若不含未知参数,则k=0)
11
检验步骤: (1) 把X 的取值范围分成 r 个区间:
x=poissrnd(2,50,1);lambda=poissfit(x); [h,p,stats]=chi2gof(x,'nbins',5,'cdf',{@poisscdf,lambda});
注:输入5表示初始分组数为5,默认显著性水平0.05 运行结果: h=0 (接受原假设); p=0.4634 (>0.05,接受原假设); stats = chi2stat: 1.5382; df: 2 (=4-1-1) edges: [4.9407e-324 1.2000 2.4000 3.6000 6.0000](最终分4组, 5个边界点) O: [17 14 12 7] (每组样本点数) E: [20.3003 13.5335 9.0224 7.1438] (每组理论频数)
k 0 时, 给出未知参数的极大似然估计,
ˆ) F (a ; ˆ) ˆ ( a X a ) F (a ; ˆi P p i 1 i i i 1
12
2 ˆ ( n np ) 2 2 i i ~ r k 1 定理3.3.1: ˆi np i 1 r
检验的拒绝域为:
2 12 r k 1
式中:r—分组数;k—未知参数个数。 补充:检验的功效:不犯第二类错误的概率;即:
Powre=P{拒绝H0 | H1为真}
课外练习*:
试通过模拟分析考察上述检验法的功效;
13
例3.3.1 为研究混凝土抗压强度的分布,抽取了200件混凝 土制件测定其抗压强度,经整理得频数分布表如下表。 试在水平 0.05 下检验抗压强度的分布是否为正态分布。
a0 a1 ar 1 ar
A1 (a0 , a1 ], A2 (a1 , a2 ],, Ar 1 (ar 2 , ar 1 ], Ar (ar 1 , ar ];
(2) 统计样本落入各区间的频数,分别记为 n1 , n2 ,, nr (要求 ni 5 ) (3)当 记
(三) 检验的两类错误 称 H0真而被拒绝的错误为第一类错误或弃真错误;
称 H0假而被接受的错误为第二类错误或取伪错误。
记 p(I)=p{拒绝H0| H0真}; P(II)=p {接受H0| H0假} 奈曼—皮尔逊 准则:
“在控制犯第一类错误的概率不超过指定值的
条件下, 尽量使犯第二类错误概率小”按这种 法则做出的检验称为“显著性检验”, 称为显 著性水平或检验水平。 4
2
(一)原假设与备择假设:H0:…;H1:… (二) 检验法则与拒绝域 假设检验的基本思想是”小概率准则”: 1.给定小概率α—显著性水平; 2.假定原假设成立,根据问题背景决定小概率事件 W—拒绝域; 3.若(x1, …, xn) 使事件W发生, 则拒绝H0;否则接受 H0。 这种从样本出发制定的,参考H1,判断是否拒绝H0 的法则称为H0对H1的一个检验法则, 简称检验法 3
5
例3.1.2 已知某炼铁厂的铁水含碳量在正常情况下服 从正态分布N(4.55,0.112).某日测得5炉铁水含碳量如 下: 4.28, 4.40, 4.42, 4.35, 4.37. 如果标准差不变,该日铁 水的平均含碳量是否显著偏低? (取 =0.05)
解:
H1 : 4.55 X 4.55 H 0下 U ~N( 0, 1) 0.11 5 由p{U u } α
例3.1.3设总体X服从参数为
的指数分布, X1, , Xn
为X的样本。
2 2 X ~ 2n ; i (1)证明 i 1 n
(2) 某元件寿命X服从上述指数分布,现从中抽取一 容量为n=16的样本,测得样本均值为5010小时, 试在水平 0.05 下检验假设:
(3) 求上述检验的p值。
16
课外作业:表“NCX2-42”中的数据第一列是总体X 的300个独立观察值,第2列是分组前端点ai,第3列 是分组后端点bi,试编写拟合优度检验程序,检验 假设: H : X ~ ,
0
要求:输入:原始数据X,分组数k,检验水平; 输出下表: ai bi ni pi
… … … …
H 0 : 1 2 ; H1 : 1 2
x=[8.6,7.9,9.3,10.7,11.2,11.4,9.8,9.5,10.1,8.5] y=[12.6,10.2,11.7,12.3,11.1,10.5,10.6,12.2] [h,p,muci,stats]=ttest2(x,y, 0.05,'left', 'equal') 运行结果:h =1,p = 0.0021; muci = -Inf -0.8129; stats = tstat: -3.3457; df: 16;sd:1.0712
9
【例】 某农场为试验磷肥与氮肥能否提高水稻收获 量,在若干块地上作试验,试验结果为,未施肥的 十块地的收获量各为8.6,7.9,9.3,10.7,11.2, 11.4,9.8,9.5,10.1,8.5(斤),而施过肥的八块 地的收获量各为12.6,10.2,11.7,12.3,11.1,10.5, 10.6,12.2,假定施肥前后产量方差相等,试在水平 5%下检验施肥后水稻的收获量有无显著提高?
c j 1 r
,r; j 1,
,r
,c
,c.
pi P( X Ai ) pij ,i 1,
p j P(Y B j ) pij , j 1,
i 1
当X与Y独立时,应有
发生的频率为
fij nij n ,则 pi p j fij 不应太大。
H 0 : 1 5000; H1 : 1 5000
(4) 若
1 5100 ,求检验犯第二类错误的概率。
例3-1-3解.doc
8
(5) 为使(3)的P(II)<0.1, n至少取多大?
U检验:[h,p,muci, stats]=ztest(x,mu0, sigma, alpha,tail); T检验:[h,p,muci, stats]=ttest(x,mu0, alpha,tail); 两总体T检验: [h,p,muci,stats]=ttest2(x,y, alpha,tail,vartype); 2检验:[h,p,varci,stats]=vartest(x, var0, alpha,tail); F检验:[h,p,varci,stats]=vartest(x, y, alpha,tail);