4.3 百分数的假设检验汇总
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ p >p时取“-”;
<p时取
如果np<30,因0<p<1,所以n<30
0.5 0.5 ˆp ˆp p p n n tc sp ˆq ˆ p ˆ n
df n 1
例:有一批蔬菜种子的平均发芽率为0.85,现随机抽取500粒, 用种衣剂进行浸种处理,结果有445粒发芽, 检验种衣剂对种子发芽有无效果?
q 1 p 0.281
sp ˆ
ˆ2 1 p
1 1 p q( ) 0.119 n1 n2
0.5 0.5 ˆ1 p ˆ2 p n1 n2 tc 0.209 sp ˆ p ˆ
1 2
df=29+28-2=55
t 0.05(55) = 2.004, t c <t 0.05(55)
(1)假设
H0: p1=p2 即两块麦田锈病发病率没有显著差异。 HA: p1 ≠ p2
选取显著水平α=0.01
ˆ1 p x1 342 x2 313 ˆ 0.905 p2 0.790 n1 378 n2 396
(2)水平 (3)检验
x1 x 2 342 313 p 0.846 n1 n2 378 396
q 1 p 0.154
sp ˆ
ˆ2 1 p
1 1 p q( ) 0.026 n1 n2
ˆ1 p ˆ2 p u 4.423 sp ˆ p ˆ
1 2
u>2.58,P<0.01
(4)推断
在0.01显著水平上,否定H0,接受HA;
认为两块麦田锈病发病率有极显著差异,即地 势对小麦锈病的发生有极显著影响作用,低洼 地小麦锈病的发病率极显著高于高坡地。
分 析
(1)一个样本频率的假设检验; (2) np 和 nq > 30 ,无需连续矫正,用u检验;
(3)不知使用种衣剂的发芽率是高是低,用双尾检验。
(1)假设
H0:p=0.85
即用种衣剂浸种后的发芽率仍为0.85; HA:p≠0.85
(2)水平 (3)检验
选取显著水平α=0.05
x 445 ˆ p 0.89 n 500
(1)一个样本频率的假设检验;
由于n > 30,用u检验;
(3)只有孵化率≤ 0.80,才认为是不合格,故采用
单尾检验。
(1)假设
H0:p≤ 0.80,即该批种蛋不合格。
HA:p>0.80 选取显著水平α=0.05
x ˆ 0.78 p n
(2)水平 (3)检验
p pq / n 0.04 ˆ
例:某鱼场发生了药物中毒,
抽查甲池中的29尾鱼,有20尾死亡
抽查乙池中的28尾鱼,有21尾死亡
检验甲、乙两池发生药物中毒以后,鱼的死亡率 是否有显著性差异。 (1)2个样本频率的假设检验; 分 析 (2) 5 < np 和 nq < 30 ,需进行连续矫正, 因n1<30,n2<30,用t检验; (3)事先不知两池鱼的死亡率孰高孰低,用双尾检验。
u
ˆp p
p ˆ
ˆp ˆ np p np pq / n npq
2、当 5<np 或 nq<30时,需要进行连续性矫正,uc值为:
0.5 0.5 ˆ p) ˆp (p p ˆ np 0.5 np n n uc p p n p ˆ ˆ ˆ
ˆ p 其中“+”表示在 “+”。
0.5 ˆp p n 0.375 uc
p ˆ
uc <1.645,P>0.05 (4)推断 在0.05显著水平上,接受H0,否定HA;
认为这批种蛋不合格。
二、两个样本频率 的假设检验
ˆ2 ˆ1 和 p 适用范围:检验两个样本频率 p
差异的显著性。
一般假定两个样本的方差是相等的,即 p 2 p
产品
合格
不合格 发芽 不发芽 存活
合格率 发芽率
二 项 分 布
目标性 状
种子
害虫
死亡
结实 不结实 红花 白花
死亡率
植物
结实率
频 率 分 布
二项成 数
后代
性状比
频率的假设检验
当 np 或 nq<5
孵化小鸡的概率表 (p= 0.90 q=0.10)
概率函数 Cnxpxqn-x P(0) C50p0q5 C51p1q4 C52p2q3 P(1) P(2) P(x) 0.00001 0.00045 0.0081
0.5 0.5 ˆ1 p ˆ 2 ) ( p1 p2 ) (p n1 n2 uc sp ˆ p ˆ
1 2
在H0: p1 = p2下,
0.5 0.5 ˆ1 p ˆ2 p n1 n2 uc sp ˆ p ˆ
1 2
2、当 5 < np 或 nq < 30,需进行连续性矫正,
( pq) / n
未 ˆ 来估计。此时上式 知时,常以样本百分数 p 改写为: ˆ 1 p ˆ ˆq ˆ) / n q Sp = (p S p 称为样本成数标准误。
p也称为二项总体成数的标准误,当 p
样本频率的标准误 p ˆ
pq n
其中 q = 1-p
1、当 np 和 nq > 30,不需连续性矫正,则u值为:
p pq / n 0.016 ˆ
u
ˆp p
p ˆ
0.89 0.85 2.5 0.016
u >1.96,P<0.05 (4)推断 在0.05显著水平上,否定H0,接受HA;
认为种衣剂浸种能够显著提高蔬菜种子的发芽率。
例:规定种蛋的孵化率>0.80为合格,现对一批种蛋随 机抽取100枚进行孵化,结果有78枚孵出, 问这批种蛋是否合格? 分 析 (2) np 和 nq > 5 ,但nq <30,需要进行连续矫正,
(1)假设 H0: p1=p2
HA: p1 ≠ p2
即甲乙两池鱼的死亡率没有显著差异
(2)水平
(3)检验
选取显著水平α=0.05
ˆ1 p x1 20 x2 21 ˆ 0.690 p2 0.750 n1 29 n2 28
x1 x 2 20 21 p 0.719 n1 n2 29 28
由二项式
(p+q)n
展开式直接检验
P( x) Cnx p x qn x
P(3)
P(4) P(5)
C53p3q2
C54p4q1 C55p5q0
0.0729
0.32805 0.59049
P(0)或P(1)或P(2) < 0.05,差异显著;
P(3)或P(4)或P(5) > 0.05,差异不显著。
频率的假设检验
当 np 和 nq > 30
中心极限定 理
近似
正态分布
( u 检 验 )
死亡率 结实率 相状比
发芽率
频率的假设检验
当 5<np 或 nq<30
由于二项总体的百分数(频率)是由某一属性的个体 计算来的整数,所以是离散型的。当样本不太大时,把它 当作连续型的近似正态总体来处理,结果会有些出入,容 易发生第一类错误。补救的办法时仍按正态分布的假设检
例:研究地势对小麦锈病发病的影响 低洼地麦田378株,其中锈病株342株
高坡地麦田396株,其中锈病株313株
比较两块麦田锈病发病率是否有显著性差异。
分 析
(1)2个样本频率的假设检验; (2) np 和 nq > 30 ,无需连续矫正,用u检验; (3)事先不知两块麦田的锈病发病率孰高孰低, 用双尾检验。
2百度文库
2
样本频率的加权平均值
p 作为对p1和p2的估计,即:
1
2
n1 p1 n2 p2 x1 x 2 p n1 n2 n1 n2
x1 n1 p1 x2 n2 p2
q 1 p
sp ˆ
当n1= n2=n时
1
ˆ2 p
1 1 pq ( ) n1 n2
2 pq n
sp ˆ
验计算,但必须进行连续性矫正,即随机变量所落的区间
+0.5,如一个样本由 (np ˆ np 0.5 。 ˆ np) 矫正为 np
一、一个样本频率 的假设检验
ˆ 适用范围:检验一个样本频率(记为) p
和某一理论值或期望值p的差异显著性。
在二项分布中,事件A发生的频率 x/n称 为二项成数,即百分数或频率。则二项成数 的平均数和标准差分别为: p p
1
2
2
两个样本频率差数的标准误
sp ˆ
ˆ2 1 p
ˆ1 q ˆ1 p ˆ 2q ˆ2 p n1 n2
ˆ1 p
x1 n1
ˆ2 p
x2 n2
H0: p1 = p2= p,q1=q2=q
sp ˆ
1
ˆ2 p
1 1 pq( ) n1 n2
在总体p1和p2未知,假定 p p 条件下,可用两
如果n < 30 ,用t检验:
0.5 0.5 ˆ1 p ˆ 2 ) ( p1 p2 ) (p n1 n2 tc sp ˆ p ˆ
1 2
0.5 0.5 ˆ1 p ˆ2 p 在H0: p1 = p2下, n1 n2 tc sp ˆ p ˆ
1 2
df (n1 1) (n2 1) n1 n2 2
1
ˆ2 p
1、当 np 和 nq > 30,不需连续性矫正,用u检验:
ˆ1 p ˆ 2 ) ( p1 p2 ) (p u sp ˆ p ˆ
1 2
在H0: p1 = p2下,
ˆ1 p ˆ2 p u sp ˆ p ˆ
1 2
2、当 5 < np 或 nq < 30,需进行连续性矫正, 如果n > 30 ,用u检验:
(4)推断 在0.05显著水平上,接受H0,否定HA; 认为发生药物中毒后,甲、乙两鱼池鱼的死亡率 没有显著差异。