第六章卡平方检验

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

检验步骤 1、提出假设 H0：大豆花色F2分离符合3:1； HA：大豆花色F2分离不符合3:1。
2、计算理论次数
性状
紫花白花总和
实际观察次数（A）
理论次数（T）
1260
1237.5
390
412.5
1650
1650
3、计算
2 c
( A T 0.5 )2
2 c
T
(12601237.5 0.5 )2 (390 412.5 0.5 )2
种子灭菌
不灭菌
总数
发病穗数 26（34.7） 184（175.3）
210
未发病穗数 50（41.3） 200（208.7）
250
总数
76
384
460
H0:种子灭菌与散黑穗病发病无关， HA:种子灭菌与散黑穗病发病有关显著水平 a0.05 。
A11=26对应的理论次数 T11=460×(76/460)×(210/460)=34.7
3、计算 2
2 ( A T )2
T
(491 417.94)2 (76 139.31)2 (90 139.31)2 (86 46.44)2
417.94
139.31
139.31
46.44
92.3961
4、统计推断
当自由度df=3时，02.01(3) 11.34 ，因实际计算的 2
=92.71＞
c
34.7
41.3
( 184－175.3 －0.5)2 ( 200－208.7 －0.5)2
4.267
175.3
208.7
df=(2-1)(2-1)=1，由附表6查出20.05，1 3.84
c2 20.05，1 ，否定H0 ，接受HA，种子灭
菌与散黑穗病发病有关。
（二）2×c列联表的独立性检验
【例6.5 】调查A、B、C三个大豆品种病毒病发生情况，每个品种调查300株，结果列于表7.6。试分析病毒病的发生是否与品种有关。
2.27 0.9884
20.757
第一组下限u1=
47.01－61.014 5.7052
=-2.45
第二组下限u2=
50.01－61.014 5.7052
=-1.93，
其余类推，结果列于表6.3第5列。注意，
最后要比实际资料多算一组。
查附表1得各组下限累积概率，列于第 6列。
相邻两组累积概率之差为各组概率，列
花色
实际次数理论次数
(A)
(T)
(A-T)
红
705
696.75 +8.25
白
224
232.25 -8.25
总和
929
929
0
F2红花与白花理论比例为3：1 实际3.147:1
实际观察次数与理论次数的符合程度
(A-T) (A-T)2
(A T )2
T
2
( Ai Ti )2 Ti
1899年 K.Pearson发现由间断型次数资料定义的这种卡方值近似服从df=k-1 的连续型随机变量Χ2分布。
第六章 2 检验
第一节 χ2 统计数第二节适合性测验第三节独立性测验第四节方差同质性测验
对描述质量性状变异的次数资料的统计分析,除可用二项分布的正态接近法外,卡平方测验也可用于这类资料的统计分析。而且对于两种以上质量属性的次数资料，只有卡平方测验才能从整体上对其进行差异显著性测验。而用二项分布的正态接近法就会增加测验次数，增
于第7列。
求各组理论次数列于第8列。理论次数少于5
的组，应合并到 5，以满足2测验的要求。
根据各组实际次数与理论次数计算2值。
因为理论次数受平均数 x 、标准差s、总次数这3个条件限制，所以自由度df=k-3=7-3=4。
查附表7， 20.05，4 =9.49，实得2 20.05,4，
不能否定H0，认为湘菊梨单株产量资料服从正态分布。
100.3
100.3
100.3
df=(2-1)(3-1)=2，
由附表6查出20.05，2 5.99 。
2
2 0.05，2
，否定H0
，接受HA，
可以认为发病与品种有关。
(三) r×c列联表的独立性检验
【例6.6】观察不同密度下某玉米单交种每株穗数的空秆株、一穗株、双穗和三穗株分布情况，得结果于下表，检验穗数分布与密度是否有关？
离比例符合一对等位Байду номын сангаас因的遗传规律。
二、两对等位基因F2分离比率适合性检验
【例6.2 】两对等位基因控制的两对相对性状遗传，如果两对等位基因完全显性且无连锁，则 F2 的四种表现型在理论上应有 9:3:3:1 的比例。有一水稻遗传试验，以稃尖有色非糯品种与稃尖无色糯性品种杂交，其F2的观察结果为稃尖有色非糯491株（A1），稃尖有色糯稻76 株（A2），稃尖无色非糯90株（A3），稃尖无色糯稻86株（A4）。试检验实际观察结果是否符合9:3:3:1的理论比例。
度偏大的趋势，尤其在df=1时偏差较大。
为此，需对2进行连续性矫正使之符合2
的理论分布：
c2
k i1
(
Ai
Ti 0.5)2 Ti
当df≥2时，可以不作连续性矫正，但要
求各组理论次数不小于5。
第二节适合性测验
根据2分布的概率值来判断实际次数与预期
理论次数是否符合的假设测验，称为适合性测验(goodness test)。
的理论次数，求出2值。
按自由度df=(r-1)(c-1)查表进行2测验。
（一）2×2列联表的独立性检验
【例6.4 】为防治小麦散黑穗病，播种前对小麦种子进行灭菌处理，以未灭菌处理的为对照，得结果于表5.4。试分析种子灭菌与否和散黑穗病病穗的多少是否有关。
表7.4 种子灭菌与小麦散黑穗病发病的2×2相依表
2 0.01(3)
11.34
故p＜0.01，否定H
，
0
接受 HA ，
表明该水稻稃尖和糯性性状在F2的实际观察次数之比
极显著不符合9:3:3:1的理论比例。这一结果表明，
该两对等位基因并非完全显性、无连锁。
三、资料分布类型的适合性检验
【例6.3 】试测验100株湘菊梨单株产量数据是否服从正态分布。
A品种健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
B品种健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
0.0458
56.01～59.00 57.5 18 -0.88 0.1894 0.1738 17.4
0.0207
59.01～62.00 60.5 21 -0.35 0.3632 0.2043 20.4
62.01～65.00 63.5 17
0.17 0.5675 0.1905 19.1
0.0176 0.2309
A12=184相应的理论次数 T12=460×(384/460)×(210/460)=175.3
A21=50相应的理论次数为 T21=460×(76/460)×(250/460)=41.3
A22=200相应的理论次数为 T22=460×(384/460)×(250/460)=208.7
2 ( 26－34.7 －0.5)2 ( 50－41.3 －0.5)2
密度（千株/亩）
空秆株
一穗株
2
12
224
4
60
548
6
246 659
8
416 765
列总和T.j 734 2196
双穗和三穗株
76 39 28 47 190
行总和Ti.
312 647 933 1228
T·· 3120
1、提出假设
H 0 ：穗数分布与密度无关；
H A ：穗数分布与密度有关。
2、计算 2值
2 T
Ai2j
1
Ti T j
2 T
Ai2j
1
Ti T j
3120
122 312 734
602 647 734
...
282 933 190
472 1228 190
1
392.64
3、统计推断
由自由度df=6查临界
而实际 2 0.01(6)
16.，81
计算的
2 392 .64＞
1237.5
412.5
1.5644
4、统计推断
当自由度df=1时，查附表7得：实际计
算的
2 c
=1.5644＜
2 0.05(1)
3.84
，故p＞
0.05，不能否定 H0 ，表明实际观察次
数与理论次数差异不显著。可以认为大豆
花色在F2的分离结果符合3:1的理论比例，即大豆紫花与白花这一相对性状在F2的分
(i 1,2,...,k)
故χ2是度量实际观察次数与理论次数偏离程度的一个统计数。χ2越小，表明实际观察次数与理论次数越接近； χ2=0，表示二者完全吻合；χ2越大，表示二者相差越大。
三、卡平方连续性矫正
2是连续分布，而次数资料是间断性
的，由间断性资料计算的2值均有不同程
故p＜， 2 0.01(6)
16.81
0.01，否定 H0 接受 HA ，表明穗
数分布与密度极显著相关，即不同种植
密度的空秆株、一穗株、双穗和三穗株
的分布不相同，这里表现为随着种植密
表7.6 大豆品种与病毒病发病情况的2×3相依表
A
B
C
总数
健株数 182（199.7） 169（199.7）248（199.7） 599
病株数 118（100.3） 131（100.3） 52（100.3） 301
总数
300
300
300
900
H0：发病与品种无关， HA：发病与品种有关。显著水平 a0.05
1、提出假设 H0 ：实际观察次数之比符合9:3:3:1的
理论比例；
H A ：实际观察次数之比不符合9:3:3:1的
理论比例。
2、计算理论次数
稃尖有色非糯的理论次数：T1 =743×9/16=417.94 稃尖有色糯稻的理论次数：T2 =743×3/16=139.31 稃尖无色非糯的理论次数：T3 =743×3/16=139.31 稃尖无色糯稻的理论次数：T4 =743×1/16=46.44
H0：服从正态分布; HA：不服从正态分布。显著水平 a0.05 。
用 x61.014 和 s5.7052分别估计m和s，
按
ui=
xi-xs
将各组下限换算成标准正态
离差(ui)：
表6.2 100株湘菊梨单株产量拟合正态分布的适合性测验
组距
组中值实际次正态离累计概各组概理论次数 (Oi－Ei)2
大试验误差估计，降低推断可靠性。
主要内容及难点
1、学习怎样用χ2 分布对遗传分离比率是否适合孟德尔定律的适合性检验方法；
2、学习怎样用χ2 分布计算概率检验两个变数间的关系是独立还是相关。
难点：不同资料χ2 检验的自由度计算。
第一节 2 统计数
一、 2的统计意义
表6-1 豌豆杂交F2代花色分离的观察次数与理论次数
数Oi 差ui 率F(ui) 率Pi Ei= Pin
Ei
47.01～50.00 48.5 50.01～53.00 51.5
3 -2.45 0.0071 0.0197 2.0 6 -1.93 0.0268 0.0555 5.6
0.2579
53.01～56.00 54.5 10 -1.39 0.0823 0.1071 10.7
第三节独立性测验
独立性测验是根据次数资料判断两类因子是相互独立还是彼此相关的统计方法，是次数资料的一种相关研究。
其步骤和方法是：
H0：两个变数相互独立， HA：两个变数彼此相关。确定显著水平 a0.05或0.01。将资料按两向分组排列成r行、c列的相依表(表6.3)，在H0下计算每一组性状
C品种健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数= 900×(301/900) ×(300/900)=100.3
2 (182－199.7)2 (169－199.7)2 (248－199.7)2
199.7
199.7
199.7
(118－100.3)2 (131－100.3)2 (52－100.3)2 53.75
65.01～68.00 66.5 14
0.70 0.7580 0.1327 13.3
0.0368
68.01～71.00 69.5 71.01～74.00 72.5 74.01～77.00 75.5
7
1.23 0.8907 0.0692 6.9
4
1.75 0.9599 0.0285 2.9
0.1469
测验实际次数与理论次数是否符合；测验产品质量是否合格；测验实验结果是否符合某一理论分布；
一、一对等位基因F2分离比率适合性检验
【例6.1 】紫花大豆与白花大豆杂交F1全为紫花，F2出现分离，在F2中共观察1650株，
其中紫花1260株，白花390株。问这一结果是否符合孟德尔遗传分离定律的3:1比例？

第六章 卡平方检验

第六章卡平方检验