非参数假设检验补充例题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.7 11.5
36.0 27.3 14.2 32.1 52.0
38.0 17.3
21.0 6.1 26.5 21.3 44.5
28.0 22.6
+ + + +
-
+ + +
-
0
20.0 21.0 46.1
20.0 11.0 22.3
+ +
3
n+=14,n-=3,n0=3, n=17 问:两种测量方法是否有显著 差异?(α=0.10) 解:查表得 c=13,d=17-13=4 n+=14>13=c 拒绝原假设, 两种测量方法有显著差异.
16
2 j 1
7
n
j
np j np j
2
0.593
3.842 0.05
2 1
接受H0,即认为黄色豌豆与绿色豌豆 数目之比为3:1.
17
例3 某电话交换台一小时内接到用户呼叫次数 按照每分钟记录如下: 呼叫次数: 0 1 2 3 4 5 6 7 频数: 8 16 17 10 6 2 1 0 试问这个分布能否认为是泊松分布?(α=0.05)
其中n 1000, (0.01) 6.635 ,计算得
2 1
30
2 2 (nik )2 (n11 ) 2 (n12 ) 2 (n21 ) 2 (n22 ) 2 n 1 1000 1 n1 n 1 n1 n 2 n2 n 1 n2 n 2 i 1 k 1 ni n k 4422 382 5142 62 1000 1 480 956 480 44 520 956 520 44 1000 0.4257 0.0684 0.5315 0.0016 1 27.2
例5 某公司的考勤员试图证实星期 一的缺勤是其他工作日缺勤的两倍, 已经有三月的缺勤记录如下表所示? (α=0.05)
日期 星期 星期 星期 星期 星期 一 二 三 四 五 176 139 141 130
缺勤数 304
26
解:因为缺勤比例为2:1:1:1:1,因此 2 1 H 0 : P( X 1) , P( X i) , i 2, 3, 4, 5 6 6
1 H 0 : p j , j 1, 2, , 7 7 H1 : 事故的发生与星期有关
12
,7
列表计算如下
星期
实际频数 n j
一 二 36 23
概率 p j
1/7 1/7
理论频数 np j
34 34
三
四 五
29
31 34
1/7
1/7 1/7
34
34 34
六 日
总和
60 25
238
1/7 1/7
1
34 34
238
13
1 n n 7 j 7 2 26.941 1 j 1 n 7 2 12.592 6 0.05
2
拒绝H0,即事故发生可能性不同,的 确与星期有关
14
例2 孟德尔豌豆试验中,发现黄色豌豆有25个, 绿色豌豆有11个,试在显著性水平α=0.05下 检验黄色豌豆与绿色豌豆数目之比为3:1这个比例. 解:定义随机变量
9
1.82 1.24 1.65 1.92 1.01
1.12
1.80
1.20 1.70 1.95
- - +
1.02
1.23
+ - - -
- - -
10 11
0.90 1.40
0.97 1.52
6
解: n+=3,n-=8,n0=0, n=11 查表得 c=9,d=11-9=2 d=2< n+=3<c =9 接受原假设,两个化验室的测定结 果在显著性水平α=0.10下无显著性 差异
ni 57 203 383 525 532 408 273 139 45 27 10 6
23
解: 参数为的泊松分布为
k! 由原始数据算得的最大似然估计为 ˆ x 3.870
2 i 1 12
P( X k )
k
e
ˆi ni np ˆi np
2
12.8967 (0.05) 18.307
0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0158
合计 60
1.0000
60
0.5595
20
2
n
j
ˆj np ˆj np
2
0.5595
12.592
2 k r 1
0.05 0.05
2 6
7
例3 从生产线上随机抽取10根纤维 作强力测验,得数据如下: 140.6, 146.2, 150.3, 144.4, 128.1, 139.7, 134.1, 124.3, 147.9, 143.0 问纤维强度的中位数是否为140?
( 0.10)
8
解:
H 0 : m 140 ; H1 : m 140
符号检验的补充例题
1
例1 对同一种药用植物的有效成份,用 两种不同的测定方法,共测20对,结果如下: A
48.0
33.0
B
37.0
41.0
差的符号
37.5 48.0 42.5
40.0 42.0
23.4 17.0 31.5
40.0 31.0
+ - + + +
0
+
0
2
36.0
36.0
11.3 22.0
2 10
接受H0,认为观测数据服从 泊松分布
24
x= i
ni
pi
npi
ˆi ni np
2
ˆi / np
0 1 2 3 4 5 6 7 8 9 10
≥11
57 203 383 525 532 408 273 139 45 27 10 6
0.0209 0.0807 0.1562 0.2015 0.1950 0.1509 0.0973 0.0538 0.0260 0.0112 0.0043 0.0022
解:参数为 的泊松分布列为 i P{ X i} e , i 0,1, 2 i! 的最大似然估计为
ˆ2
18
ˆ 2代入计算p ˆ i 分别为 将
ˆi p
i ˆ
i!
e , i 0,1, 2,
ˆ
,6
ˆ7 p
i 7
i
i!
e
19
x= i 0 1 2 3 4 5 6
接受H0,可以认为星期一的缺勤是其 他工作日缺勤的两倍
27
独立性检验的补充例题
28
例1 有1000人按照性别与色盲分类如下
男 女 合计 正常 442 514 956 色盲 38 6 44 合计 480 520 1000
试在显著性水平0.01下检验色盲与性别 的关系? 解: 提出假设 H0:色盲与性别是相互独立的
4
例2 工厂有两个化验室,每天同时 从工厂的冷却水中取样,测定水中的
含氯量(ppm),下表是11天的记录,试
问两个化验室的测定结果在显著性水平 α=0.10下有无显著性差异?
5
日期 1
2 3
化验室A(xi) 化验室B(yi) 符号 1.15 1.00 +
1.86 0.76
1.90 0.90
4 5 6 7 8
54.5 210.5 407.4 525.5 508.6 393.5 253.8 140.3 67.8 29.2 11.2 5.7
0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0120 7.6673 0.1658 0.1286 0.0158
25
接受H0,即认为观测数据服从泊松分布
21
例4 卢瑟福在2608个相等时间间隔 (7.5秒)内观测了一放射性物质放射的
粒子数X,下表中的ni是观测到i个粒子
wenku.baidu.com
的时间间隔数(最后一项已经合并), 试检验观测数据是否服从泊松分布? α=0.05
22
x= i 0 1 2 3 4 5 6 7 8 9 10
≥11
29
检验统计量
L (nik ) 2 n 1 (1) i 1 k 1 ni n k
2 2 2 2
拒绝域
2 2 2 2 (nik ) W n 1 0.01 (1) i 1 k 1 ni n k
由于27.2>6.635,因此拒绝原假设, 表明色盲与性别有关系.
31
1,若豌豆为黄色, X 0,若豌豆为绿色.
记P{X 1} p1,P{X 0} p2,则提出如下假设
3 1 H 0 : p1 , p2 4 4
15
列表计算如下
豌豆颜色 黄色 绿色 总和
实际频数n j
概率p j
理论频数np j
25 11 36
3/4 1/4 1
27 9 36
缺点:
1.精度较差,未充分利用样本所提供的 信息 2.要求数据搭配成对
10
拟合优度检验的补充例题
11
例1 交通部门统计事故与星期的关系 得到 星期:一 二 三 四 五 六 日 次数:36 23 29 31 34 60 25 问事故发生的可能性是否相同?(α=0.05) 解:P X j p j , j 1, 2,
1 1 1 304 890 176 890 139 890 3 6 6 2 1 1 1 890 890 890 3 6 6
2 2 2 2 2
1 1 141 890 130 890 6 6 2 8.5542 9.488 4 0.05 1 1 890 890 6 6
≥7
ni 8 16 17 10 6 2 1 0
ˆi p
ˆi np
ˆ i / np ˆi ni np
2
0.13534 0.27067 0.27067 0.18045 0.09022 0.03609 0.01203 0.00453
8.1201 16.2402 16.2402 10.8268 5.4134 2.1654 0.7218 0.2720
-11.9, 3.0
作差数 xi 140 ,得 0.6, 6.2, 10.3, 4.4, -0.3, -5.9, -15.7, 7.9,
n 6, n 4, n n 10.
查符号检验表
c 9, d 1.
1 n 9
接受原假设.
9
优点:
1.简单、直观 2.不要求知道被检验量所服从的分布