卡方检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

值不需要连续性矫正。
其理论数的计算仍为 E ij
i行总数 j列总数
总数
[例] 表5.11为不同灌溉方式下水稻叶片衰老情况的调
查资料。试测验稻叶衰老情况是否与灌溉方式有关。
表5.11 水稻在不同灌溉方式下叶片的衰老情况 灌溉方式 深 水 浅 水 湿 润 总 计 绿叶数 146 (140.69) 183 (180.26) 152 (160.04) 481 黄叶数 7 (8.78) 8 (11.24) 14 (9.98) 30 枯叶数 7 (10.53) 13 (13.49) 16 (11.98) 36 总 计 160 205 182 547
假设H0:两变数相互独立,即种子灭菌与否和散黑穗病
病穗多少无关;HA:两变数彼此相关。 显著水平 =0.05。 根据两变数相互独立的假定,算得各组格的理论次数。 如种子灭菌项的发病穗数O11=26,其理论次数
E11=(210×76)/460=34.7,即该组格的横行总和乘以纵行总
和再除以观察总次数(下同);同样可算得 O12=50 的 E12=(250×76)/460=41.3; O21=184的E21=(210×384)/460=175.3; O22=200的E22=(250×384)/460=208.7。
对于仅划分为两组(如显性与隐性)的资料,如检验其与 某种理论比率的适合性,则其 值皆可用下列简式求出
表5.4
测验两组资料与某种理论比率符合度的
公式 (|A-a|-1)2/n 1∶1
值公式
理论比率(显性∶隐性)
2∶1
3∶1 15∶1 9∶7 13∶3 r∶1
(|A-2a|-1.5)2/2n
(|A-3a|-2)2/3n (|A-15a|-8)2/15n (|7A-9a|-8)2/63n (|3A-13a|-8)2/63n [|A-ra|-(r+1)/2]2/rn
a21
aj1 ar1 C1
a22
aj2 ar2 C2

… … …
a2i
aji ari Ci
率。 显著水平 =0.05。 ,故在计算 值时
由于该资料只有k=2组, 需作连续性矫正。
查附表6,
。现
故应接
受H0,说明大豆花色这对性状是符合3∶1比率,即符合一对 等位基因的表型分离比例。
分离比例一类的适合性测验计算
过计算理论次数,而直接得出:
时,也可以不经
(5· 13)
其中,A和a分别为显性组和隐性组的实际观察次数; n=A+a,即总次数。本例资料代入(5.13)有:
[例]
两对等位基因遗传试验,如基因为独立分配,则
F2代的四种表现型在理论上应有9∶3∶3∶1的比率。有一 水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种 杂交,其F2代得表5.5结果。试检查实际结果是否符合 9∶3∶3∶1的理论比率。
表 F2代表型的观察次数和根据9∶3∶3∶1算出的理论次数 表现型
以上各个E值填于表5.7括号内。
以上各个E值代入

这里 实得
=(2-1)(2-1)=1,查附表4,
,现
,故P <0.05,应否定H0。即种子
灭菌与否和散黑穗病发病高低有相关,种子灭菌对防治小 麦散黑穗病有一定效果。
2×2表的独立性测验也可不经过计算理论次数而直接
得到 值。
表 2×2表的一般化形式
2×2列联表的一般形式
c1 r1 o11 c2 o12 总和 R1 =o11+ o12
r2
总和
o21
C1 =o11+ o21
o22
C2 =o12+ o22
R2=o21+ o22
T
检验程序
1、提出假设 H0:O-E=0;HA: O-E≠0 2、根据概率的乘法法则计算理论数:理论数的计算方 法——
此处
=(2-1)(3-1)=2。查附表6,
,现
,P<0.05,应否定H0,接受HA。即不 同物种Aph等位基因型频率有显著相关,或者说不同物种 的Aph等位基因型频率有显著差别。
2×C表独立性测验的值,也可直接由下式得到。
( i=1,2,3,…,c )
2×C表的一般化形式如表5.10。
表5.10 2×C表的一般化形式
花色 F2代实际株数 理论株数 (O) (E) O-E | O-E |-1/2 (|O-E|-1/2)2/E
紫色
白色 总数
208
81 289
216.75
72.25 289
-8.75
+8.75 0
8.25
8.25
0.3140
0.9420 1.2560
H0:大豆花色F2分离符合3∶1比率;HA:不符合3∶1比
H0:稻叶衰老情况与灌溉方式无关;HA:稻叶衰老情
况与灌溉方式有关。 取 =0.05。
根据H0的假定,计算各组格观察次数的相应理论次数: 如与146相应的E=(481×160)/547=140.69,
与183相应的E=(481×205)/547=180.26,……,
所得结果填于表7.11括号内。 根据 可得
(3)计算

查附表4,当

=3.84 ,实得
=0.2926小于
,所以接受H0。即认为观察次数和理
论次数相符,接受该玉米F1代花粉粒碘反应比率为1∶1的 假设。
[例] 大豆花色一对等位基因的遗传研究,在F2获得表7.3 所列分离株数。问这一资料的实际观察比例是否符合于3∶1 的理论比值。
表 大豆花色一对等位基因遗传的适合性测验
E ij
i行总数 j列总数
总数
3、检验统计量:
4、统计推断
[例] 调查经过种子灭菌处理与未经种子灭菌处理的小 麦发生散黑穗病的穗数,得相依表5.7,试分析种子灭菌 与否和散黑穗病穗多少是否有关。
表5.7 防治小麦散黑穗病的观察结果 处 理 项 目 种子灭菌 种子未灭菌 总 数 发 病 穗 数 26( 34.7) 184(175.3) 210 未发病穗数 50( 41.3) 200(208.7) 250 总 76 384 460 数
检验Oi与Ei的差异显著性,判断两者之间的不符合度
a、H0 :O-E=0;HA : O-E≠0(这里检验的不是参数, 而是判断观测数是否符合理论分布) b、确定显著水平
(Oi Ei) C、计算卡方值: Ei i 1
k 2 2 df
要求Ei=nPi不得小于5,若小于5,将尾区相邻的组合 并,直到合并后的组的Ei≥5,合并后再计算卡方值。 统计推断:
第五章 卡方检验
第一节 卡方检验的原理和方法
1、卡方检验的原理
应用理论值(expected value,E)与观测值 (observed value,O)之间的偏离程度来决定 卡方值的大小。
其中:Oi-观察次数
Ei-理论次数 k-观察值类型数(或状态数)
2、卡方检验的程序
将观测值分为k组 计算n次观测值中每组的观测数,记为Oi 根据变量的分布规律或概率运算法则,计算每组的理论 频率为Pi 计算每组的理论频数Ei
实际资料多于两组的
值通式则为:
(5· 15)
上式的mi为各项理论比率,ai为其对应的观察次数。 如本例,亦可由(5· 15)算得
与此一致。
也可转化为以下简式:
(5· 14)
上式中的a1、a2、a3、a4分别为9∶3∶3∶1比率中各项
表现型的实际观察次数,n为总次数。
前面的
=92.696,与此
=92.706略有差异,
第二节 适合性检验
用来检验观测数和依照某种假设或分布模型计算得到的理
论数之间一致性的一种统计假设检验。
一、适合性测验的步骤
1 .提出假设:
2.确定显著水平 3.检验计算: 求卡平方值 v≥2(即k ≥ 3)时
v=1(即k=2)时
4、依所得概率值的大小,接受或否定无效假设
在实际应用时,往往并不需要计算具体的概率值。 若实得 ≥ 时,则H0发生的概率小于等于 < 时,则H0被接受。 ,属
为1∶1,由此可以计得3437+3482=6916粒花粉中,蓝色
反应与非蓝色反应的理论次数应各为3459.5粒。设以O代 表观察次数,E代表理论次数,可将上列结果列成表
玉米花粉粒碘反应观察次数与理论次数
碘反应
观察次数(O) 理论次数(E)
O-E
(O-E)2/E
蓝色 非蓝色 总数
3437(O1) 3482(O2) 6919
(5· 17)
横行因素
纵 行 因 素
1 2 … i … c


1
2 总 计
a11
a21 C1
a12
a22 C2

… …
a1i
a2i CiFra Baidu bibliotek

… …
a1c
a2c Cc
R1
R2 n
三、r×c表的独立性测验
若横行分r 组,纵行分c 组,且r≥3,c≥3,则为r×c相 依表。 对r×c表作独立性测验时,其 =(r-1)(c-1),计求
小概率事件,H0便被否定; 若实得
例:玉米花粉粒中形成淀粉粒或糊精是一对相对性状。 淀粉粒遇碘呈蓝色反应,因而可以用碘试法直接观察花粉 粒的分离现象。某项实验观察淀粉质与非淀粉质玉米杂交 的F1代花粉粒,经碘处理后有3437粒呈蓝色反应,3482粒 呈非蓝色反应。根据遗传学理论可假设玉米花粉粒碘反应
豆、223份栽培大豆等位基因型的次数列于表5.9,试分
析大豆Aph等位酶的等位基因型频率是否因物种而不同。
表5.9 野生大豆和栽培大豆Aph等位酶的等位基因型次数分布
物 种 1 野生大豆 G.soja 栽培大豆 G.max 29(23.66) 22(27.34) 等 位 基 因 型 2 68(123.87) 199(143.13) 3 96(45.47) 2(52.53) 193 223 总 计
本例 现
=(3-1)(3-1)=4,查附表4, ,P>0.05, 故应接受H0,即不同
灌溉方式对水稻叶片的衰老情况没有显著影响。
r×c表的一般化形式如表5.12。
表5.12 r×c表的一般化形式
横行因素
1
纵 行 因 素 1 a11 2 a12 … … i a1i … … c a1c

R1

2
j r 总 计
观察次数(O) 稃尖有色 非糯 491 稃尖有色 糯稻 76 稃尖无色 非糯 90 稃尖无色 糯稻 86
总数
743
理论次数(E)
O -E
417.94
73.06
139.31
-63.31
139.31
-49.31
46.44
39.56
743
0
首先,按9∶3∶3∶1的理论比率算得各种表现型的理 论次数E, 如稃尖有色非糯稻 E=743×(9/16)=417.94,
3459.5(E1) 3459.5(E2) 6919
-22.5 +22.5 0
0.1463 0.1463 0.2926
此处要推论是否符合1∶1分离,只要看观察次数与理 论次数是否一致,故可用 测验:
(1)设立无效假设,即假设观察次数与理论次数的差 异由抽样误差所引起,即H0:花粉粒碘反应比例为1∶1 与HA:花粉粒碘反应比例不成1∶1。 (2)确定显著水平 =0.05。
系前者有较大计算误差之故。
第三节 独立性检验
范围:检验两个以上因子彼此之间是相互独立的还是 相互影响的一种统计分析方法。 方法:将数据列成列联表,也称列联表卡方检验。
根据处理及考察指标的多少分为不同的列联表:
一、2×2列联表的独立性测验
2×2列联表是指横行和纵行皆分为两组的资料。在 作独立性测验时,其 时需作连续性矫正。 =(2-1)(2-1)=1,故计算 值
a11 a21 C1
a12 a22 C2
R1 R2 n
(5· 16)
如本例各观察次数代入(5· 16)可得:
二、2×C表的独立性测验
2×C表是指横行分为两组,纵行分为C≥3组的相依表资
料。 在作独立性测验时,其 c≥3,故不需作连续性矫正。 =(2-1)(c-1)=c-1。由于
[例5.9] 进行大豆等位酶Aph的电泳分析,193份野生大


51
267
98
416
H0:等位基因型频率与物种无关;HA:两者有关,不
同物种等位基因型频率不同。 显著水平 =0.05。
根据H0算得各观察次数的相应理论次数: 如观察次数29的E=(193×51)/416=23.66,
观察次数22的E=(223×51)/416=27.34,…;
将其填于表7.9的括号内。 再代入 可得:
稃尖有色糯稻
E=743×(3/16)=139.31,…。
H0:稃尖和糯性性状在F2的分离符合9∶3∶3∶1; HA:不符合9∶3∶3∶1。 显著水平: =0.05。 然后计算 值
因本例共有k=4组,故df=k-1=3。查附表4,
,现实得
,所以否定
H0,接受HA,即该水稻稃尖和糯性性状在F2的实际结果 不符合9∶3∶3∶1的理论比率。 这一情况表明,该两对等位基因并非独立遗传, 而可能为连锁遗传。
相关文档
最新文档