第七章 卡平方测验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 ( 26 - 34.7 - 0.5) ( 50-41.3 -0.5)2 2 c 41.3 34.7
( 200-208.7 -0.5)2 4.267 208.7 175.3
注意,最后要比实际资料多算一组。
查附表1得各组下限累积概率,列于第
5列(表7.2) 。
相邻两组累积概率之差为各组概率,列
于第6列(表7.2) 。
求各组理论次数列于第7列(表7.2) 。理论次数
少于5的组,应合并到5,以满足2测验的要求。
根据各组实际次数与理论次数计算2值。
因为理论次数受平均数 x 、标准差s、理论次
其步骤和方法是:
H0:两个变数相互独立,
HA:两个变数彼此相关。
确定显著水平 a0.05或0.01。 将资料按两向分组排列成r行、c列的 相依表(表7.3),在H0下计算每一组性状 的理论次数,求出2值。 按自由度df=(r-1)(c-1)查表进行2测验。
【例7.4 】为防治小麦散黑穗病,播种 前对小麦种子进行灭菌处理,以未灭 菌处理的为对照,得结果于表5.4。试 分析种子灭菌与否和散黑穗病病穗的 多少是否有关。
表7.4 种子灭菌与小麦散黑穗病发病的2×2相依表 种子灭菌 不灭菌 总数
发病穗数
未发病穗数 总数
26(34.7)
50(41.3) 76
184(175.3)
200(208.7) 384
210
250 460
2×2表的独立性测验
H0:种子灭菌与散黑穗病发病无关,
HA:种子灭菌与散黑穗病发病有关 显著水平 a0.05。
0.470
df=k-1=4-1=3,
由附表6查出20.05,3 7.815。
2<20.05,3 ,不能否定H0 ,认为豌豆
杂种F2代的分离是符合9:3:3:1的理论比
率。
【例7.2 】有一批水稻种子,规定发芽 率达80%合格,即发芽:不发芽=4:1。 随机抽200粒做发芽试验,发芽种子数 为150粒。这批水稻种子是否合格?
总数 538
山东
山西
37(105.5) 213(210.7) 239(172.8)
79( 84.4) 157(168.5) 155(138.1)
489
391
总数
306
611
501
1418
r×c 表的独立性测验
H0:抗寒性与原产地无关,HA:有关。 显著水平 a0.05。
在H0下计算与各观察次数相应的理论 次数于表7.8。
⑴ 2分布的取值范围为[0, 。 ⑵2分布的形状决定于自由度df。 (图7.1。 ⑶ 2分布曲线与横坐标轴所围成的面积等于1,即 P(0≤ 2 <+ f(02)d(2)=1
+
2 2 因此, 分布右尾从 到 的概率为 i
p( x x ) 1 F ( x )
2 2 2 (241-231.8) (190-116.1) (155-138.1) 2 =156.79 + + …+ 116.1 231.8 138.1
df=(3-1)(3-1)=4,由附表6查出20.05,4 9.49 。
C品种 健康株理论数=900×(599/900) ×(300/900)=199.7
病株理论数= 900×(301/900) ×(300/900)=100.3
2 2 2 (169 - 199.7) (248 - 199.7) (182 - 199.7) 2 199.7 199.7 199.7
df=k-1=2-1=1,由附表6查出20.05,1 3.84。
结论:c 2< 20.05,1 ,不能否定H0 ,
认为这批水稻种子是合格的。
【例7.3 】试测验100株湘菊梨单株产
量数据是否服从正态分布(表7.2)。
H0:服从正态分布;
HA:不服从正态分布。 显著水平 a0.05。
第七章
卡平方测验
第一节 卡平方测验的意义与原理
第二节 适合性测验
第三节 独立性测验
第一节 χ2检验的意义与原理 一、χ2检验的意义
表7.1 花色 红 白 总和
豌豆杂种F2代花色分离的观察次数与理论次数
实际次数(O) 理论次数(E) 705 224 929 696.75 232.25 929
(O-E) +8.25 -8.25 0
Fra Baidu bibliotek
x 61.014和 s5.7052分别估计和, 用
按
离差(ui:
xi-xui= s
将各组下限换算成标准正态
第一组下限u1=
47.01-61.014
5.7052 50.01-61.014 5.7052
=-2.45
第二组下限u2=
=-1.93,
其余类推,结果列于表7.2第4列(表7.2) 。
数等于实际次数这3个条件限制,所以自由度
df=k-3=7-3=4。
2 2 2 查附表6, 0.05 =9.49 ,实得 ,4 0.05,4,不
能否定H0,认为湘菊梨单株产量资料服从正态 分布。
第三节 独立性测验
独立性测验是测验两个变数之间是相
互独立还是彼此相关的统计方法,是
次数资料的一种相关研究。
假设 H0:合格,即发芽:不发芽=4:1 ,
HA:不合格。
显著水平 a0.05。
2c
( Oi-Ei -0.5)2 =Σ i 1 Ei
k
( 150-160 -0.5)2 ( 50-40 -0.5)2 =2.82 40 160
⑵ 确定显著水平
⑶ 计算2值
确定a0.05或0.01等。
由样本资料和理论假设计算
2 2值;根据自由度,由附表6查出a ,df 。
⑷ 推断,若χ2≤χ2α.df,则p>α,故接受H0; χ2≥χ2α.df ,则p<α,故否定H0,
卡平方测验均为一尾测验,且是右尾测验。
次数资料是间断性的,而卡平方分布 则是连续性分布,为了使间断性的计算结 果适合于连续性分布给出的概率,在计算 卡平方值x2时需注意以下问题: 任何一组性状的理论次数都必须大于5; 在自由度为1时需进行连续性矫正;
三、卡平方测验的连续性矫正
2是连续分布,而次数资料是间断性 的,由间断性资料计算的2值均有不同程
度偏大的趋势,尤其在df=1时偏差较大。 为此,需对2进行连续性矫正使之符合2 的理论分布:
x [
2 c
( O E 0.5) E
2
]
当df≥2时,可以不作连续性矫正。
第二节 适合性测验
(131-100.3)2 (52-100.3)2 (118-100.3)2 53.75 100.3 100.3 100.3
df=(2-1)(3-1)=2,
由附表6查出20.05,2 5.99。
F2代红花与白花的理论比例为3:1
实际观察次数与理论次数的符合程度
(O-E) (O-E)2
(O E ) 2 E
2
(O E ) 2 = E
于是将各差数平方除以相应的理
论次数再相加,记为χ2,即:
(O E ) E
2 2
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计量,χ2越小,表明实 际观察次数与理论次数越接近; χ2=0, 表示二者完全吻合;χ2越大,表示二者相 差越大。
312.75
a0.05。
2 2 2 2
(315-312.75) (101-104.25) (108-104.25) (32-34.75) 2 104.25 104.25 34.75
二、χ2分布与χ2测验
n个独立的正态离差u1、u2、…、un的平
方和则定义为2,即
2
u u
2 1
2 2
2 ... un
u2 i
i 1
n
2 ( x i )2
1
i 1
n
上式的的自由度df=n。
当用样本来计算时,因为∑(xi-)2需由 ( xi x ) 2 来估计,而
豌豆杂种F2代性状分离的观察次数与理论次数(n=556) 次数 黄子叶饱满 黄子叶皱缩 绿子叶饱满 绿子叶皱缩
实际次数(O)
理论次数(E)
315
312.75
101
104.25
108
104.25
32
34.75
假设 H0: F2代的分离符合9:3:3:1的理论比率,
HA: F2代的分离不符合9:3:3:1的理论比率。 显著水平
( 184-175.3 -0.5)2
df=(2-1)(2-1)=1,由附表6查出20.05,1 3.84
c220.05,1 ,否定H0 ,接受HA,种子灭
菌与散黑穗病发病有关。
【例7.5 】调查A、B、C三个大豆品种 病毒病发生情况,每个品种调查300株,
结果列于表7.6。试分析病毒病的发生
是否与品种有关。
表7.6 健株数 病株数 总数 大豆品种与病毒病发病情况的2×3相依表 A B C 52(100.3) 300 总数 599 301 900
182(199.7) 169(199.7) 248(199.7) 118(100.3) 131(100.3) 300 300
2×C 表的独立性测验
E11=460×(76/460)×(210/460)=34.7 同理,O12=184相应的理论次数为 E12=460×(384/460)×(210/460)=175.3 O21=50相应的理论次数为
E21=460×(76/460)×(250/460)=41.3
O22=200相应的理论次数为 E22=460×(384/460)×(250/460)=208.7
2 2 i 2
xi
f ( x 2 )d ( x 2 )
(图7.2)
各种自由度下右尾概率取a的临界
a,df值列于附表6,供测验时查用。
例如, df=10, a=0.05,
20.05,1018.31,表示
P( 2 > 18.310.05(图7.2)。
2测验的具体步骤为:
⑴ 提出无效假设与备择假设
H0:发病与品种无关, HA:发病与品种有关。 显著水平 a0.05
A品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3 B品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
根据2分布的概率值来判断实际次数与预期
理论次数是否符合的假设测验,称为适合性测
验(goodness test。
测验实际结果与理论比例是否符合; 测验产品质量是否合格; 测验实验结果是否符合某一理论分布;
【例7.1 】孟德尔将黄子叶饱满豌豆与 绿子叶皱缩豌豆杂交,F2代观察556 株,黄子叶饱满315株,黄子叶皱缩 101株,绿子叶饱满108株,绿子叶皱 缩32株。试测验F2代的分离是否符合 9:3:3:1的理论比率。
S2
故
2 ( x x ) i
n 1
2 2 ( x x ) ( n 1 ) S i
x2
( xi x ) 2
2
( n 1) S 2
2
此式中x2值的自由度为(n-1)
若从正态总体中抽取无数个样
本,就可形成2值的概率分布,称
为2分布。
2分布的特性有:
2 2
0.05,2 ,否定H0
,接受HA,
可以认为发病与品种有关。
【例7.6】研究1418个小麦品种原产地与 抗寒性的关系,结果见表7.8。分析小麦 品种的抗寒性与原产地是否有关。
表7.8 原产地 河北 小麦原产地与品种抗寒性的3×3相依表
抗寒性
极强 强 中和弱 190(116.1) 241(231.8) 107(190.1)