03遗传学数据的统计学处理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三节、遗传学数据的统计学处理
一.概率的概念
概率(probability) P(A):A事件发生的概率。
二 .概率规则
1. 相乘定律: 独立事件: (independent events) P(A·B) = P(A) × P(B)
2.相加定律 互斥事件(matually exclusive events) P(A或B) = P(A) + P(B)
P
AA×Aa Bb×Bb cc×CC DD×dd Ee×Ee
↓
↓
↓
↓
↓
要求的基因型 AA
BB
Cc
Dd
ee
↓
↓
↓
↓
↓
概率 P = 1/2 × 1/4 × 1 × 1 × 1/4 = 1/32
要求的表型
A
↓
概率
P =1 ×
B
C
De
↓
↓↓↓
3/4 × 1 × 1 × 1/4 = 3/16
四 .二项分布和二项展开法
2、不对称分布
第一个 第二个 孩子 孩子
概率
分布
正常 正常 患儿 患儿
正常 患儿 正常 患儿
3/4×3/4=9/16 P(pp)=9/16 3/4×1/4=3/16 2P(pq)=6/16 3/4×1/4=3/16 1/4×1/4=1/16 P(qq)=1/16
3.计算单项概率
用于分析两对立事件(非此即彼)在多次试验中每种 事件组合发生的概率。设A、B为对立事件,P(A)=p, P(B)=q,可得: P(A+B)=p+q=1;设: n为试验次数; x :在n次试验中A事件出现的次数; n- x :在n次试验中B事件出现的次数;
三. 概率的计算和应用
1.棋盘法(Punnett square) 2.分枝法(branching process)
AAbbCc ×aaBbCc
AA×aa bb×Bb Cc×Cc × 1CC= 1AaBbCC
1Bb × 2Cc= 2AaBbCc
×
× 1cc= 1AaBbcc
Aa
×
× 1CC= 1AabbCC
E : 为预期值 O : 为观察值
(1) χ2测验应用于大样本 (2) 预期数不得小于5 (3) 所取数值不用百分比表示。
例:番茄杂交实验
P: 紫茎缺刻叶(AACC)×绿茎马铃薯叶(aacc)
↓
F1:
紫茎缺刻叶(AaCc)
↓ 表型 基因型 F2: 紫茎缺刻叶(A-C-) 紫茎马铃薯叶(A-cc) 绿茎缺刻叶(aaC-) 绿茎马铃薯(aacc)
总计
观察数(O) 期望值(E)
247
255.4
90
85.18385Fra bibliotek134
28.4
454
454
χ2 = ∑(Oi-Ei)2/Ei=1.71 df=4-1=3, χ2 <χ2 0.05=7.82,统计差异不显著,说明实验
结果符合自由组合定律,O与E的偏差是随机误差。
表 1-5 χ2 值的计算(紫花(Rr)×白花(rr))
1. 对称分布:
第一个 第二个 概率
孩子 孩子
男
男 1/2×1/2=1/4
男
女 1/2×1/2=1/4
女
男 1/2×1/2=1/4
女
女 1/2×1/2=1/4
分布
P(pp)=1/4 2P(pq) = 1/2
P(qq)=1/4
(p+q)2 = p2 + 2pq + q2 = 1/4 +1/2 +1/4, 分布是对称的。
组合公式: [n!/x! (n-x)!] pxqn-x
正常 白化 [n!/x! (n-x)!] pxqn-x
P
40 31 22 13 04
1×(3/4)4(1/4)0 4×(3/4)3(1/4)1 6×(3/4)2(1/4)2 4×(3/4)1(1/4)3 1×(3/4)0(1/4)4
81/256 108/256
40
200
紫
白
紫
白
观察值
30
10
110 90
预期值
20
20
100 100
差数
10
10
10
10
d2
100 100 100 100
d2/e
5
5
1
1
χ2=∑(d2/e)
10
2
查卡方表(表1-7): 自由度 N=2 – 1=1 当 X2=10 P< 0.01 有极显著差异,
结果不符合理论比。 当X2= 0.05< P < 0.30 无显著差异, 结果符合理论比。
54/256 12/256 1/256
五、适合度(goodness of fit)检验
1.统计的标准: P>0.05 结果与理论数无显著差异,实
得值符合理论值。 P<0.05 结果与理论数有显著差异,实
得值不符合理论值。 P<0.01 结果与理论数有极显著差异,
实得值非常不符合理论值。
2、χ2(Chi square method)测验
1bb × 2Cc= 2AabbCc
× 1cc = 1Aabbcc
Generation of the F2 trihybrid phenotypic ratio using the forked-line
method.
3.利用概率来计算 AA Bb cc DD Ee×Aa Bb CC dd Ee
一.概率的概念
概率(probability) P(A):A事件发生的概率。
二 .概率规则
1. 相乘定律: 独立事件: (independent events) P(A·B) = P(A) × P(B)
2.相加定律 互斥事件(matually exclusive events) P(A或B) = P(A) + P(B)
P
AA×Aa Bb×Bb cc×CC DD×dd Ee×Ee
↓
↓
↓
↓
↓
要求的基因型 AA
BB
Cc
Dd
ee
↓
↓
↓
↓
↓
概率 P = 1/2 × 1/4 × 1 × 1 × 1/4 = 1/32
要求的表型
A
↓
概率
P =1 ×
B
C
De
↓
↓↓↓
3/4 × 1 × 1 × 1/4 = 3/16
四 .二项分布和二项展开法
2、不对称分布
第一个 第二个 孩子 孩子
概率
分布
正常 正常 患儿 患儿
正常 患儿 正常 患儿
3/4×3/4=9/16 P(pp)=9/16 3/4×1/4=3/16 2P(pq)=6/16 3/4×1/4=3/16 1/4×1/4=1/16 P(qq)=1/16
3.计算单项概率
用于分析两对立事件(非此即彼)在多次试验中每种 事件组合发生的概率。设A、B为对立事件,P(A)=p, P(B)=q,可得: P(A+B)=p+q=1;设: n为试验次数; x :在n次试验中A事件出现的次数; n- x :在n次试验中B事件出现的次数;
三. 概率的计算和应用
1.棋盘法(Punnett square) 2.分枝法(branching process)
AAbbCc ×aaBbCc
AA×aa bb×Bb Cc×Cc × 1CC= 1AaBbCC
1Bb × 2Cc= 2AaBbCc
×
× 1cc= 1AaBbcc
Aa
×
× 1CC= 1AabbCC
E : 为预期值 O : 为观察值
(1) χ2测验应用于大样本 (2) 预期数不得小于5 (3) 所取数值不用百分比表示。
例:番茄杂交实验
P: 紫茎缺刻叶(AACC)×绿茎马铃薯叶(aacc)
↓
F1:
紫茎缺刻叶(AaCc)
↓ 表型 基因型 F2: 紫茎缺刻叶(A-C-) 紫茎马铃薯叶(A-cc) 绿茎缺刻叶(aaC-) 绿茎马铃薯(aacc)
总计
观察数(O) 期望值(E)
247
255.4
90
85.18385Fra bibliotek134
28.4
454
454
χ2 = ∑(Oi-Ei)2/Ei=1.71 df=4-1=3, χ2 <χ2 0.05=7.82,统计差异不显著,说明实验
结果符合自由组合定律,O与E的偏差是随机误差。
表 1-5 χ2 值的计算(紫花(Rr)×白花(rr))
1. 对称分布:
第一个 第二个 概率
孩子 孩子
男
男 1/2×1/2=1/4
男
女 1/2×1/2=1/4
女
男 1/2×1/2=1/4
女
女 1/2×1/2=1/4
分布
P(pp)=1/4 2P(pq) = 1/2
P(qq)=1/4
(p+q)2 = p2 + 2pq + q2 = 1/4 +1/2 +1/4, 分布是对称的。
组合公式: [n!/x! (n-x)!] pxqn-x
正常 白化 [n!/x! (n-x)!] pxqn-x
P
40 31 22 13 04
1×(3/4)4(1/4)0 4×(3/4)3(1/4)1 6×(3/4)2(1/4)2 4×(3/4)1(1/4)3 1×(3/4)0(1/4)4
81/256 108/256
40
200
紫
白
紫
白
观察值
30
10
110 90
预期值
20
20
100 100
差数
10
10
10
10
d2
100 100 100 100
d2/e
5
5
1
1
χ2=∑(d2/e)
10
2
查卡方表(表1-7): 自由度 N=2 – 1=1 当 X2=10 P< 0.01 有极显著差异,
结果不符合理论比。 当X2= 0.05< P < 0.30 无显著差异, 结果符合理论比。
54/256 12/256 1/256
五、适合度(goodness of fit)检验
1.统计的标准: P>0.05 结果与理论数无显著差异,实
得值符合理论值。 P<0.05 结果与理论数有显著差异,实
得值不符合理论值。 P<0.01 结果与理论数有极显著差异,
实得值非常不符合理论值。
2、χ2(Chi square method)测验
1bb × 2Cc= 2AabbCc
× 1cc = 1Aabbcc
Generation of the F2 trihybrid phenotypic ratio using the forked-line
method.
3.利用概率来计算 AA Bb cc DD Ee×Aa Bb CC dd Ee