第六章 卡平方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检验步骤 1、提出假设 H0:大豆花色F2分离符合3:1; HA:大豆花色F2分离不符合3:1。
2、计算理论次数
性状
紫花 白花 总和
实际观察次数 (A)
理论次数(T)
1260
1237.5
390
412.5
1650
1650
3、计算
2 c
( A T 0.5 )2
2 c
T
(12601237.5 0.5 )2 (390 412.5 0.5 )2
种子灭菌
不灭菌
总数
发病穗数 26(34.7) 184(175.3)
210
未发病穗数 50(41.3) 200(208.7)
250
总数
76
384
460
H0:种子灭菌与散黑穗病发病无关, HA:种子灭菌与散黑穗病发病有关 显著水平 a0.05 。
A11=26对应的理论次数 T11=460×(76/460)×(210/460)=34.7
3、计算 2
2 ( A T )2
T
(491 417.94)2 (76 139.31)2 (90 139.31)2 (86 46.44)2
417.94
139.31
139.31
46.44
92.3961
4、统计推断
当自由度df=3时,02.01(3) 11.34 ,因实际计算的 2
=92.71>
c
34.7
41.3
( 184-175.3 -0.5)2 ( 200-208.7 -0.5)2
4.267
175.3
208.7
df=(2-1)(2-1)=1,由附表6查出20.05,1 3.84
c2 20.05,1 ,否定H0 ,接受HA,种子灭
菌与散黑穗病发病有关。
(二)2×c列联表的独立性检验
【例6.5 】调查A、B、C三个大豆品种 病毒病发生情况,每个品种调查300株, 结果列于表7.6。试分析病毒病的发生 是否与品种有关。
2.27 0.9884
20.757
第一组下限u1=
47.01-61.014 5.7052
=-2.45
第二组下限u2=
50.01-61.014 5.7052
=-1.93,
其余类推,结果列于表6.3第5列 。注意,
最后要比实际资料多算一组。
查附表1得各组下限累积概率,列于第 6列 。
相邻两组累积概率之差为各组概率,列
花色
实际次数 理论次数
(A)
(T)
(A-T)
红
705
696.75 +8.25
白
224
232.25 -8.25
总和
929
929
0
F2红花与白花理论比例为3:1 实际3.147:1
实际观察次数与理论次数的符合程度
(A-T) (A-T)2
(A T )2
T
2
( Ai Ti )2 Ti
1899年 K.Pearson发 现由间断型次 数资料定义的 这种卡方值近 似服从df=k-1 的连续型随机 变量Χ2分布。
第六章 2 检验
第一节 χ2 统计数 第二节 适合性测验 第三节 独立性测验 第四节 方差同质性测验
对描述质量性状变异的次数资料的 统计分析,除可用二项分布的正态接近法 外,卡平方测验也可用于这类资料的统计 分析。而且对于两种以上质量属性的次 数资料,只有卡平方测验才能从整体上 对其进行差异显著性测验。而用二项分 布的正态接近法就会增加测验次数,增
于第7列 。
求各组理论次数列于第8列 。理论次数少于5
的组,应合并到 5,以满足2测验的要求。
根据各组实际次数与理论次数计算2值。
因为理论次数受平均数 x 、标准差s、总次数 这3个条件限制,所以自由度df=k-3=7-3=4。
查附表7, 20.05,4 =9.49,实得2 20.05,4,
不能否定H0,认为湘菊梨单株产量资料服从正 态分布。
100.3
100.3
100.3
df=(2-1)(3-1)=2,
由附表6查出20.05,2 5.99 。
2
2 0.05,2
,否定H0
,接受HA,
可以认为发病与品种有关。
(三) r×c列联表的独立性检验
【例6.6】观察不同密度下某玉米单交种每 株穗数的空秆株、一穗株、双穗和三穗株 分布情况,得结果于下表,检验穗数分布 与密度是否有关?
离比例符合一对等位Байду номын сангаас因的遗传规律。
二、两对等位基因F2分离比率适合性检验
【例6.2 】 两对等位基因控制的两对相对性状 遗传,如果两对等位基因完全显性且无连锁, 则 F2 的 四 种 表 现 型 在 理 论 上 应 有 9:3:3:1 的 比 例。有一水稻遗传试验,以稃尖有色非糯品种 与稃尖无色糯性品种杂交,其F2的观察结果为 稃尖有色非糯491株(A1),稃尖有色糯稻76 株(A2),稃尖无色非糯90株(A3),稃尖 无色糯稻86株(A4)。试检验实际观察结果是 否符合9:3:3:1的理论比例。
度偏大的趋势,尤其在df=1时偏差较大。
为此,需对2进行连续性矫正使之符合2
的理论分布:
c2
k i1
(
Ai
Ti 0.5)2 Ti
当df≥2时,可以不作连续性矫正,但要
求各组理论次数不小于5。
第二节 适合性测验
根据2分布的概率值来判断实际次数与预期
理论次数是否符合的假设测验,称为适合性测 验(goodness test)。
的理论次数,求出2值。
按自由度df=(r-1)(c-1)查表进行2测验。
(一)2×2列联表的独立性检验
【例6.4 】为防治小麦散黑穗病,播种 前对小麦种子进行灭菌处理,以未灭 菌处理的为对照,得结果于表5.4。试 分析种子灭菌与否和散黑穗病病穗的 多少是否有关。
表7.4 种子灭菌与小麦散黑穗病发病的2×2相依表
2 0.01(3)
11.34
故p<0.01,否定H
,
0
接受 HA ,
表明该水稻稃尖和糯性性状在F2的实际观察次数之比
极显著不符合9:3:3:1的理论比例。这一结果表明,
该两对等位基因并非完全显性、无连锁。
三、资料分布类型的适合性检验
【例6.3 】试测验100株湘菊梨单株产 量数据是否服从正态分布。
A品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
B品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
0.0458
56.01~59.00 57.5 18 -0.88 0.1894 0.1738 17.4
0.0207
59.01~62.00 60.5 21 -0.35 0.3632 0.2043 20.4
62.01~65.00 63.5 17
0.17 0.5675 0.1905 19.1
0.0176 0.2309
A12=184相应的理论次数 T12=460×(384/460)×(210/460)=175.3
A21=50相应的理论次数为 T21=460×(76/460)×(250/460)=41.3
A22=200相应的理论次数为 T22=460×(384/460)×(250/460)=208.7
2 ( 26-34.7 -0.5)2 ( 50-41.3 -0.5)2
密度 (千株/亩)
空秆株
一穗株
2
12
224
4
60
548
6
246 659
8
416 765
列总和T.j 734 2196
双穗和 三穗株
76 39 28 47 190
行总和Ti.
312 647 933 1228
T·· 3120
1、 提出假设
H 0 :穗数分布与密度无关;
H A :穗数分布与密度有关。
2、计算 2值
2 T
Ai2j
1
Ti T j
2 T
Ai2j
1
Ti T j
3120
122 312 734
602 647 734
...
282 933 190
472 1228 190
1
392.64
3、统计推断
由自由度df=6查临界
而实际 2 0.01(6)
16.,81
计算的
2 392 .64>
1237.5
412.5
1.5644
4、统计推断
当自由度df=1时,查附表7得:实际计
算的
2 c
=1.5644<
2 0.05(1)
3.84
,故p>
0.05,不能否定 H0 ,表明实际观察次
数与理论次数差异不显著。可以认为大豆
花色在F2的分离结果符合3:1的理论比例, 即大豆紫花与白花这一相对性状在F2的分
(i 1,2,...,k)
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计数。χ2越小,表明实 际 观 察 次 数 与 理 论 次 数 越 接 近 ; χ2=0, 表示二者完全吻合;χ2越大,表示二者相 差越大。
三、卡平方连续性矫正
2是连续分布,而次数资料是间断性
的,由间断性资料计算的2值均有不同程
故p< , 2 0.01(6)
16.81
0.01,否定 H0 接受 HA ,表明穗
数分布与密度极显著相关,即不同种植
密度的空秆株、一穗株、双穗和三穗株
的分布不相同,这里表现为随着种植密
表7.6 大豆品种与病毒病发病情况的2×3相依表
A
B
C
总数
健株数 182(199.7) 169(199.7)248(199.7) 599
病株数 118(100.3) 131(100.3) 52(100.3) 301
总数
300
300
300
900
H0:发病与品种无关, HA:发病与品种有关。 显著水平 a0.05
1、提出假设 H0 :实际观察次数之比符合9:3:3:1的
理论比例;
H A :实际观察次数之比不符合9:3:3:1的
理论比例。
2、计算理论次数
稃尖有色非糯的理论次数:T1 =743×9/16=417.94 稃尖有色糯稻的理论次数:T2 =743×3/16=139.31 稃尖无色非糯的理论次数:T3 =743×3/16=139.31 稃尖无色糯稻的理论次数:T4 =743×1/16=46.44
H0:服从正态分布; HA:不服从正态分布。 显著水平 a0.05 。
用 x61.014 和 s5.7052分别估计m和s,
按
ui=
xi-xs
将各组下限换算成标准正态
离差(ui):
表6.2 100株湘菊梨单株产量拟合正态分布的适合性测验
组距
组中值 实际次 正态离 累计概 各组概 理论次数 (Oi-Ei)2
大试验误差估计,降低推断可靠性。
主要内容及难点
1、学习怎样用χ2 分布对遗传分离比率是 否适合孟德尔定律的适合性检验方法;
2、学习怎样用χ2 分布计算概率检验两个 变数间的关系是独立还是相关。
难点:不同资料χ2 检验的自由度计算。
第一节 2 统计数
一、 2的统计意义
表6-1 豌豆杂交F2代花色分离的观察次数与理论次数
数Oi 差ui 率F(ui) 率Pi Ei= Pin
Ei
47.01~50.00 48.5 50.01~53.00 51.5
3 -2.45 0.0071 0.0197 2.0 6 -1.93 0.0268 0.0555 5.6
0.2579
53.01~56.00 54.5 10 -1.39 0.0823 0.1071 10.7
第三节 独立性测验
独立性测验是根据次数资料判断两类 因子是相互独立还是彼此相关的统计 方法,是次数资料的一种相关研究。
其步骤和方法是:
H0:两个变数相互独立, HA:两个变数彼此相关。 确定显著水平 a0.05或0.01。 将资料按两向分组排列成r行、c列的 相依表(表6.3),在H0下计算每一组性状
C品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数= 900×(301/900) ×(300/900)=100.3
2 (182-199.7)2 (169-199.7)2 (248-199.7)2
199.7
199.7
199.7
(118-100.3)2 (131-100.3)2 (52-100.3)2 53.75
65.01~68.00 66.5 14
0.70 0.7580 0.1327 13.3
0.0368
68.01~71.00 69.5 71.01~74.00 72.5 74.01~77.00 75.5
7
1.23 0.8907 0.0692 6.9
4
1.75 0.9599 0.0285 2.9
0.1469
测验实际次数与理论次数是否符合; 测验产品质量是否合格; 测验实验结果是否符合某一理论分布;
一、一对等位基因F2分离比率适合性检验
【例6.1 】紫花大豆与白花大豆杂交F1全为 紫花,F2出现分离,在F2中共观察1650株,
其中紫花1260株,白花390株。问这一结果 是否符合孟德尔遗传分离定律的3:1比例?
2、计算理论次数
性状
紫花 白花 总和
实际观察次数 (A)
理论次数(T)
1260
1237.5
390
412.5
1650
1650
3、计算
2 c
( A T 0.5 )2
2 c
T
(12601237.5 0.5 )2 (390 412.5 0.5 )2
种子灭菌
不灭菌
总数
发病穗数 26(34.7) 184(175.3)
210
未发病穗数 50(41.3) 200(208.7)
250
总数
76
384
460
H0:种子灭菌与散黑穗病发病无关, HA:种子灭菌与散黑穗病发病有关 显著水平 a0.05 。
A11=26对应的理论次数 T11=460×(76/460)×(210/460)=34.7
3、计算 2
2 ( A T )2
T
(491 417.94)2 (76 139.31)2 (90 139.31)2 (86 46.44)2
417.94
139.31
139.31
46.44
92.3961
4、统计推断
当自由度df=3时,02.01(3) 11.34 ,因实际计算的 2
=92.71>
c
34.7
41.3
( 184-175.3 -0.5)2 ( 200-208.7 -0.5)2
4.267
175.3
208.7
df=(2-1)(2-1)=1,由附表6查出20.05,1 3.84
c2 20.05,1 ,否定H0 ,接受HA,种子灭
菌与散黑穗病发病有关。
(二)2×c列联表的独立性检验
【例6.5 】调查A、B、C三个大豆品种 病毒病发生情况,每个品种调查300株, 结果列于表7.6。试分析病毒病的发生 是否与品种有关。
2.27 0.9884
20.757
第一组下限u1=
47.01-61.014 5.7052
=-2.45
第二组下限u2=
50.01-61.014 5.7052
=-1.93,
其余类推,结果列于表6.3第5列 。注意,
最后要比实际资料多算一组。
查附表1得各组下限累积概率,列于第 6列 。
相邻两组累积概率之差为各组概率,列
花色
实际次数 理论次数
(A)
(T)
(A-T)
红
705
696.75 +8.25
白
224
232.25 -8.25
总和
929
929
0
F2红花与白花理论比例为3:1 实际3.147:1
实际观察次数与理论次数的符合程度
(A-T) (A-T)2
(A T )2
T
2
( Ai Ti )2 Ti
1899年 K.Pearson发 现由间断型次 数资料定义的 这种卡方值近 似服从df=k-1 的连续型随机 变量Χ2分布。
第六章 2 检验
第一节 χ2 统计数 第二节 适合性测验 第三节 独立性测验 第四节 方差同质性测验
对描述质量性状变异的次数资料的 统计分析,除可用二项分布的正态接近法 外,卡平方测验也可用于这类资料的统计 分析。而且对于两种以上质量属性的次 数资料,只有卡平方测验才能从整体上 对其进行差异显著性测验。而用二项分 布的正态接近法就会增加测验次数,增
于第7列 。
求各组理论次数列于第8列 。理论次数少于5
的组,应合并到 5,以满足2测验的要求。
根据各组实际次数与理论次数计算2值。
因为理论次数受平均数 x 、标准差s、总次数 这3个条件限制,所以自由度df=k-3=7-3=4。
查附表7, 20.05,4 =9.49,实得2 20.05,4,
不能否定H0,认为湘菊梨单株产量资料服从正 态分布。
100.3
100.3
100.3
df=(2-1)(3-1)=2,
由附表6查出20.05,2 5.99 。
2
2 0.05,2
,否定H0
,接受HA,
可以认为发病与品种有关。
(三) r×c列联表的独立性检验
【例6.6】观察不同密度下某玉米单交种每 株穗数的空秆株、一穗株、双穗和三穗株 分布情况,得结果于下表,检验穗数分布 与密度是否有关?
离比例符合一对等位Байду номын сангаас因的遗传规律。
二、两对等位基因F2分离比率适合性检验
【例6.2 】 两对等位基因控制的两对相对性状 遗传,如果两对等位基因完全显性且无连锁, 则 F2 的 四 种 表 现 型 在 理 论 上 应 有 9:3:3:1 的 比 例。有一水稻遗传试验,以稃尖有色非糯品种 与稃尖无色糯性品种杂交,其F2的观察结果为 稃尖有色非糯491株(A1),稃尖有色糯稻76 株(A2),稃尖无色非糯90株(A3),稃尖 无色糯稻86株(A4)。试检验实际观察结果是 否符合9:3:3:1的理论比例。
度偏大的趋势,尤其在df=1时偏差较大。
为此,需对2进行连续性矫正使之符合2
的理论分布:
c2
k i1
(
Ai
Ti 0.5)2 Ti
当df≥2时,可以不作连续性矫正,但要
求各组理论次数不小于5。
第二节 适合性测验
根据2分布的概率值来判断实际次数与预期
理论次数是否符合的假设测验,称为适合性测 验(goodness test)。
的理论次数,求出2值。
按自由度df=(r-1)(c-1)查表进行2测验。
(一)2×2列联表的独立性检验
【例6.4 】为防治小麦散黑穗病,播种 前对小麦种子进行灭菌处理,以未灭 菌处理的为对照,得结果于表5.4。试 分析种子灭菌与否和散黑穗病病穗的 多少是否有关。
表7.4 种子灭菌与小麦散黑穗病发病的2×2相依表
2 0.01(3)
11.34
故p<0.01,否定H
,
0
接受 HA ,
表明该水稻稃尖和糯性性状在F2的实际观察次数之比
极显著不符合9:3:3:1的理论比例。这一结果表明,
该两对等位基因并非完全显性、无连锁。
三、资料分布类型的适合性检验
【例6.3 】试测验100株湘菊梨单株产 量数据是否服从正态分布。
A品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
B品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
0.0458
56.01~59.00 57.5 18 -0.88 0.1894 0.1738 17.4
0.0207
59.01~62.00 60.5 21 -0.35 0.3632 0.2043 20.4
62.01~65.00 63.5 17
0.17 0.5675 0.1905 19.1
0.0176 0.2309
A12=184相应的理论次数 T12=460×(384/460)×(210/460)=175.3
A21=50相应的理论次数为 T21=460×(76/460)×(250/460)=41.3
A22=200相应的理论次数为 T22=460×(384/460)×(250/460)=208.7
2 ( 26-34.7 -0.5)2 ( 50-41.3 -0.5)2
密度 (千株/亩)
空秆株
一穗株
2
12
224
4
60
548
6
246 659
8
416 765
列总和T.j 734 2196
双穗和 三穗株
76 39 28 47 190
行总和Ti.
312 647 933 1228
T·· 3120
1、 提出假设
H 0 :穗数分布与密度无关;
H A :穗数分布与密度有关。
2、计算 2值
2 T
Ai2j
1
Ti T j
2 T
Ai2j
1
Ti T j
3120
122 312 734
602 647 734
...
282 933 190
472 1228 190
1
392.64
3、统计推断
由自由度df=6查临界
而实际 2 0.01(6)
16.,81
计算的
2 392 .64>
1237.5
412.5
1.5644
4、统计推断
当自由度df=1时,查附表7得:实际计
算的
2 c
=1.5644<
2 0.05(1)
3.84
,故p>
0.05,不能否定 H0 ,表明实际观察次
数与理论次数差异不显著。可以认为大豆
花色在F2的分离结果符合3:1的理论比例, 即大豆紫花与白花这一相对性状在F2的分
(i 1,2,...,k)
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计数。χ2越小,表明实 际 观 察 次 数 与 理 论 次 数 越 接 近 ; χ2=0, 表示二者完全吻合;χ2越大,表示二者相 差越大。
三、卡平方连续性矫正
2是连续分布,而次数资料是间断性
的,由间断性资料计算的2值均有不同程
故p< , 2 0.01(6)
16.81
0.01,否定 H0 接受 HA ,表明穗
数分布与密度极显著相关,即不同种植
密度的空秆株、一穗株、双穗和三穗株
的分布不相同,这里表现为随着种植密
表7.6 大豆品种与病毒病发病情况的2×3相依表
A
B
C
总数
健株数 182(199.7) 169(199.7)248(199.7) 599
病株数 118(100.3) 131(100.3) 52(100.3) 301
总数
300
300
300
900
H0:发病与品种无关, HA:发病与品种有关。 显著水平 a0.05
1、提出假设 H0 :实际观察次数之比符合9:3:3:1的
理论比例;
H A :实际观察次数之比不符合9:3:3:1的
理论比例。
2、计算理论次数
稃尖有色非糯的理论次数:T1 =743×9/16=417.94 稃尖有色糯稻的理论次数:T2 =743×3/16=139.31 稃尖无色非糯的理论次数:T3 =743×3/16=139.31 稃尖无色糯稻的理论次数:T4 =743×1/16=46.44
H0:服从正态分布; HA:不服从正态分布。 显著水平 a0.05 。
用 x61.014 和 s5.7052分别估计m和s,
按
ui=
xi-xs
将各组下限换算成标准正态
离差(ui):
表6.2 100株湘菊梨单株产量拟合正态分布的适合性测验
组距
组中值 实际次 正态离 累计概 各组概 理论次数 (Oi-Ei)2
大试验误差估计,降低推断可靠性。
主要内容及难点
1、学习怎样用χ2 分布对遗传分离比率是 否适合孟德尔定律的适合性检验方法;
2、学习怎样用χ2 分布计算概率检验两个 变数间的关系是独立还是相关。
难点:不同资料χ2 检验的自由度计算。
第一节 2 统计数
一、 2的统计意义
表6-1 豌豆杂交F2代花色分离的观察次数与理论次数
数Oi 差ui 率F(ui) 率Pi Ei= Pin
Ei
47.01~50.00 48.5 50.01~53.00 51.5
3 -2.45 0.0071 0.0197 2.0 6 -1.93 0.0268 0.0555 5.6
0.2579
53.01~56.00 54.5 10 -1.39 0.0823 0.1071 10.7
第三节 独立性测验
独立性测验是根据次数资料判断两类 因子是相互独立还是彼此相关的统计 方法,是次数资料的一种相关研究。
其步骤和方法是:
H0:两个变数相互独立, HA:两个变数彼此相关。 确定显著水平 a0.05或0.01。 将资料按两向分组排列成r行、c列的 相依表(表6.3),在H0下计算每一组性状
C品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数= 900×(301/900) ×(300/900)=100.3
2 (182-199.7)2 (169-199.7)2 (248-199.7)2
199.7
199.7
199.7
(118-100.3)2 (131-100.3)2 (52-100.3)2 53.75
65.01~68.00 66.5 14
0.70 0.7580 0.1327 13.3
0.0368
68.01~71.00 69.5 71.01~74.00 72.5 74.01~77.00 75.5
7
1.23 0.8907 0.0692 6.9
4
1.75 0.9599 0.0285 2.9
0.1469
测验实际次数与理论次数是否符合; 测验产品质量是否合格; 测验实验结果是否符合某一理论分布;
一、一对等位基因F2分离比率适合性检验
【例6.1 】紫花大豆与白花大豆杂交F1全为 紫花,F2出现分离,在F2中共观察1650株,
其中紫花1260株,白花390株。问这一结果 是否符合孟德尔遗传分离定律的3:1比例?