生物统计学 第五章 卡方检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
适合性检验
遗传学中用以检验实际结果是否符合遗传规律
孟德尔分离规律
自由组合定律
样本的分布与理论分布是否相等
➢ 适合性检验的df由于受理论值的总和等于观 测值总和这一条件的约束,故df=n-1
例 有一鲤鱼遗传试验,以荷包红鲤(红色)与湘江野鲤(青灰 色)杂交,其F2代获得如下表所示的体色分离尾数,问这一资 料的实际观测值是否符合孟德尔一对等位基因的遗传规律,即 鲤鱼体色青:红=3:1
O-E
公羊
428
母羊
448
合计
876
438
-10
438
+10
876
0
➢ 由于差数之和正负相消,并不能反映实际观测 值与理论值相差的大Байду номын сангаас。
为了避免正、负相抵消的问题,可将实际观测值 与理论值的差数平方后再相加,也就是计算:
∑(O-E)2
(Oi Ei )2 值越大,观测值与理论值相差也就
越大,反之越小。
2 A 3a 22 208 381 22 1.256
3n
3 289
2 A 3a 22 208 381 22 1.256
3n
3 289
(4)查值表,进行推断
df =1
2 0.05
3.84
P>0.05
接受H0 ,即大豆花色F2分离符合3:1比率
对于资料组数多于两组的值,可通过下面简式
值之间的偏离程度。
➢ 实际观测值与理论推算值之间的偏离程度就决 定其χ2值的大小。
➢ 两值偏差越大, χ2值就越大,越不符合; ➢ 偏差越小,χ2值就越小,越趋于符合; ➢ 两值完全相等, χ2值就为0,表明理论值完全符
合。
876只羔羊性别调察
性别 观察值(O) 理论值(E)
O-E
公羊
428
母羊
448
性别 公羊 母羊 合计
876只羔羊性别调察
观测值(O)
理论值(E) O E
428
438
-10
448
438
+10
876
876
0
(O E)2 E
0.2283
0.2283
0.4566
2
(Oi Ei )2 Ei
χ2值就等于各组观测值和 理论值差的平方与理论值 之比,再求其和。
2
(Oi Ei )2 Ei
32
黄圆:黄皱:绿圆:绿皱= 9 :3 :3 :1 16 16 16 16
2 1
n
Oi2 pi
n
1 556
3152 9
1012 3
1082 3
322 1
556
0.470
16 16 16 16
χ2 =0.016+0.101+0.135+0.218=0.470
第五章 第一节 χ2检验的原理与方法 第二节 适合性检验 第三节 独立性检验
独立性检验 料之间是相互独立的或者是相互联系的假设检
验,通过假设所观测的各属性之间没有关联, 然后证明这种无关联的假设是否成立。
同质性检验 在连续型资料的假设检验中,对一个样本方差
的同质性检验,也需进行χ2 检验。
第五章 第一节 χ2检验的原理与方法 第二节 适合性检验 第三节 独立性检验
➢ χ2检验就是统计样本的实际观测值与理论推算
(Oi Ei )2 值越大,观测值与理论值相差也就
越大,反之越小。
Oi 9 Ei 6
Oi 49 Ei 46
将实际观测值与理论值的差数平方,即(O-E)
2,再用差数的平方除以相应的理论值,将之化
为相对数,从而来反映(O-E)2 的比重,最后
将各组求和,这个总和就是χ2 。
2
(Oi Ei )2 Ei
即Eij=Ri×Cj/T=行总数×列总数/总数
E11= R1 × C1/T=61.95 E21= R2 × C1/T=60.05
E12= R1 × C2/T=36.05 E22= R2 × C2/T=34.95
给药方式与给药效果的2×2列联表
给药方式 口服 注射 总数
有效 58(61.95) 64(60.05)
独立性检验 (independence test)
➢ 又叫列联表(contingency table)χ2检 验,它是研究两个或两个以上因子彼此之 间是独立还是相互影响的一类统计方法。
(一)2×2列联表的独立性检验
设A,B是一个随机试验中的两个事件,其中A可能出现r1 、 r2个结果,B可能出现c1、c2个结果,两因子相互作用形 成4格数,分别以O11 、O12 、O21 、O22表示,下表是2×2 列联表的一般形式
理论频数Ei=理论频率×总数
给药方式 口服 注射 总数
有效 58 64 122(C1)
无效 40 31 71(C2)
总数
98(R1) 95(R2) 193(T)
理论频数Ei=理论频率×总数 = 98/193 ×122/193 ×193 =(98 × 122)/193=61.95
有效率 59.2% 67.4%
χ2检验的注意事项
由于检验的对象-次数资料是间断性的,而χ2分 布是连续型的,检验计算所得的χ2值只是近似地 服从χ2分布,所以应用连续型的χ2分布的概率检 验间断性资料所得的χ2值就有一定的偏差。
由次数资料算得的χ2均有偏大的趋势,即概率偏 低。当df=1,尤其是小样本时,必须作连续性矫正。
黄圆
黄皱
绿圆
绿皱
实际观测数O 理论频数P 理论数E O-E (O-E)2/E
315 9/16 312.75 2.25 0.016
101 3/16 104.25 -3.25 0.101
108 3/16 104.25 3.75 0.135
32 1/16 34.75 -2.75 0.218
(1) H0 :豌豆F2分离符合9:3:3:1的自由组合规律; HA :豌豆F2分离不符合9:3:3:1的自由组合规律;
122(C1)
无效 40(36.05) 31(34.95)
71(C2)
总数
98(R1) 95(R2) 193(T)
给药方式 口服 注射 总数
有效 58(61.95) 64(60.05)
122(C1)
无效 40(36.05) 31(34.95)
71(C2)
总数
98(R1) 95(R2) 193(T)
离散型资料 总体分布未知
检验对象
总体参数或几个总体参 数之差
不是对总体参数而是对 总体分布的假设检验
χ2 检验的相关知识
三、χ2检验的用途 指对样本的理论数先通过一定的理论分布推算
适合性检验 出来,然后用实际观测值与理论数相比较,从
而得出实际观测值与理论数之间是否吻合。因 此又叫吻合度检验。 是指研究两个或两个以上的计数资料或属性资
(4)推断
确定自由度,df=(r-1)(c-1),查临界值 表,进行推断。
给药方式 口服 注射 总数
给药方式与给药效果的2×2列联表
有效 58 64 122(C1)
无效 40 31 71(C2)
总数
98(R1) 95(R2) 193(T)
有效率 59.2% 67.4%
1.H0 :给药方式与给药效果相互独立。 HA :给药方式与给药效果有关联。
可加性 非负值
随O和E而变化
χ2值与概率P成反比, χ2值越小,P值越大, 说明实际值与理论值之差越小,样本分布与假设的 理论分布越相一致;
χ2越大,P值越小,说明两者之差越大,样本 分布与假设理论分布越不一致。
1.提出无效假设H0
观测值与理论值的差异由抽样误差引起,即观 测值=理论值。备择假设HA :观测值与理论值 的差值不等于0,即观测值≠理论值
2.给出显著水平α=0.05
给药方式 口服 注射 总数
有效 58 64 122(C1)
无效 40 31 71(C2)
总数
98(R1) 95(R2) 193(T)
有效率 59.2% 67.4%
3.根据H0,运用概率乘法法则:事件A与事件B同时出 现的概率为:P(AB)=P(A)P(B)
口服与有效同时出现的理论频率=口服频率×有效 频率,即P(AB)=P(A)P(B)=98/193 ×122/193
否定H0 ,接受HA ,即鲤鱼体色F2分离不符合3:1比率。
在遗传学中,有许多显、隐性比率可以划分
为两组的资料,如欲测其与某种理论比率的
适合性,则χ2值可用下表中的简式进行计算:
理 论 比 率
显:隐
1:1
2 :1 3 :1
9:7
r :1
r :m
Aa
A a 12
n
A 2a 1.52
2n
第五章 χ2检验
χ2 检验的相关知识
一、χ2检验的定义
对样本的频数分布所来自的总体 分布是否服从某种理论分布或某 种假设分布所作的假设检验,即 根据样本的频数分布来推断总体 的分布。
χ2 检验的相关知识
二、χ2检验与连续型资料假设检验的区别
连续型资料假设检验 2检验
数据资料
连续型资料
所属总体 总体正态分布
红色理论数为: Ei =1602×1/4=400.5
2
2
( Oi Ei
0.5)2
(15031201.5 0.5)2 ( 99 400.5 0.5)2
301.63
i1
Ei
1201.5
400.5
(4)推断 查χ2值表,当df=1时,χ20.05 =3.84。 实得χ2c =301.63>χ20.05
行 列
c1
c2
总和
r1
r2
总和
O11
O12
R1= O11 + O12
O21
O22
R2= O21 + O22
C1= O11 + O21 C1= O12 + O22
T
(1)假设 (2)水平
无效假设H0 :事件A和事件B无关; HA :事件A和事件B有关联关系。
确定显著水平α
(3)检验 依据H0 ,推算出理论数,计算χ2值
两个比率比较的u (t) 检验,在观察例数 不足够大或拟对多个比率进行比较时,该 检验不适宜,因为直接对多个样本率作两 两间的u (t) 检验有可能加大第一类错误。
χ2检验的基本思想是检验实际频数与理论 频数的差别是否由抽样误差所此起的,也 是就是样本率(或样本构成比)来推断总 体率(或总体构成比)。
2.确定显著水平α 一般确定为0.05或0.01
3.计算样本的χ2值
2
(Oi Ei )2 Ei
df n 1
4.进行统计推断
2 2 2 2
χ2检验的注意事项
1、任何一组的理论次数Ei 都必须大于5,如果 Ei≤5,则需要合并理论组或增大样本容量以满 足Ei>5 2、在自由度=1时,需进行连续性矫正。
(2)取显著水平α =0.05 (3)计算统计数χ2值:
χ2 =0.016+0.101+0.135+0.218=0.470
(4)查临界值表,进行推断:
df =4-1=3
2 0.05
7.815
χ2< χ20.05
P>0.05
接受H0 ,即豌豆F2分离符合9:3:3:1的自由组合规律。
方法二
315
101 108
体色
鲤鱼遗传试验F2观测结果
青灰色
红色
总数
F2观测尾数
1503
99
1602
(1)假设
H0:鲤鱼体色F2分离符合3:1比率; HA:鲤鱼体色F2分离不符合3:1比率;
(2)水平
α=0.05
(3)检验 df= k-1 = 2-1 =1 需要连续性校正
在无效假设H0正确的前提下
青灰色的理论数为: Ei =1602×3/4=1201.5
A 3a 22
3n
7 A 9a 82
63n
A ra
r
1 2
2
rn
mA ra
r
m
2
2
rmn
χ2值
大豆花色遗传试验F2观测结果
例
花色
总数
F2观测株数
208
81
289
(1) H0 :大豆花色F2分离符合3:1比率; HA :大豆花色F2分离不符合3:1比率;
(2)取显著水平α =0.05 (3)计算统计数χ2值:
Yates(1934)提出了一个矫正公式
2 c
( Oi Ei 0.5)2 Ei
第五章
第一节 第二节
χ2检验的原理与方法 适合性检验
第三节
独立性检验
第二节:适合性检验
比较观测数与理论数是否符合的假设检验。 是对样本的理论值先通过一定的理论分布推
算出来,然后用实际观测值与理论值比较, 从而得出实际观测值与理论值之间是否吻合, 因此也称为吻合性检验或拟合度检验。
合计
876
438
-10
438
+10
876
0
要回答这个问题,首先需要确定一个统计量, 将其用来表示实际观测值与理论值偏离的程 度;然后判断这一偏离程度是否属于抽样误 差,即进行显著性检验。
判断实际观测值与理论值偏离的程度,最简 单的办法是求出实际观测值与理论值的差数。
876只羔羊性别调察
性别 观察值(O) 理论值(E)
进行计算:
2 1
n
Oi2 n pi
Oi -第 i 组的实际观测数 pi -第 i 组的理论比率 n-总次数
豌豆
F2代,共556粒
315
101 108
32
此结果是否符合自由组合规律
根据自由组合规律,理论分离比为:
黄圆:黄皱:绿圆:绿皱= 9 :3 :3 :1 16 16 16 16
方法一
豌豆杂交实验F2分离结果