统计学原理在遗传学中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表型 A
1/4 × 1
B C
×
1 × 1/4=1/32
D e
概率P= 1 ×
3/4 × 1
×
1 × 1/4=3/16
1.5.4 二项分布和二项展开法
1)对称分布 即一对性状各自发生的概率p和q相等。
以两个孩子的家庭为例,性别分布可有以下几种情况。
第一个孩子 男 男 女 女 第二个孩子 男 女 男 女 概率 1/2 ×1/2=1/4 1/2 ×1/2=1/4 1/2 ×1/2=1/4 1/2 ×1/2=1/4 分布 P(pp)=1/4
紫、缺 247 紫、马 90 绿、缺 83 绿、马 34 总计 454
O E
(O-E)2
255.4
0.28
85.1
0.28
85.1
0.05
28.4
1.10
454
E
1.71
df =4-1=3查2表知p>0.05,统计学上认为在5% 显著水准上差异不显著。
x
P 0.99 df
1 2
0.0201 0.115 0.297 0.554 2.558 0.00016 0.0039 0.103 0.352 0.711 1.145 3.940
1/16 YYRR 2/16 YYRr 1/16 YYrr
2/16 YyRR 4/16 YyRr 2/16 Yyrr 1/16 yyRR 2/16 yyRr 1/16 yyrr
2/4
Yy
¼ yy
表型及其比例分枝图
Yy×Yy
¾ 黄色
Rr×Rr
¾ 圆形
后代表型及其比例
9/16 黄圆 3/16 黄皱 3/16 绿圆 1/16 绿皱
第二步:根据自由度查表并判断
当df=1时,p=0.05, 20.05=3.84 (df=3时,p=0.05, 20.05=7.82)
2﹤ 20.05 2﹥ 20.05
观测值与理论值差异不显著 (符合理论比例)
观测值与理论值差异显著 (不符合理论比例)
x
P 0.99 df
1 2
0.0201 0.115 0.297 0.554 2.558 0.00016 0.0039 0.103 0.352 0.711 1.145 3.940
3)计算单项概率
若我们研究的不是其全部,而是某一项的概率,则 可用如下通式:
n!
r!(n-r)!
prqn-r
r:某事件(基因型或表现型)出现的次数 n-r:另一事件(基因型或表现型)出现的次数
例:白化基因携带者结婚生育的4个孩子中白化的频率分布 p为正常表型的概率=3/4,q为白化的概率=1/4,n为孩 子总数=4,(n—r)则为患儿数。
6.64
9.21 11.35 13.28 15.09
3
4 5 10
18.31
21.16
23.21
自由度:在各项预期值决定后,实得数中能自由变动的项数。 df= n-1(分离组数-1)
举例2:
如番茄紫茎缺刻叶(AACC)和绿茎马铃薯叶(aacc)杂交后产 生的F2代出现如下分离,其是否符合9:3:3:1的理论值?
举例1:
P ♀圆 × 皱♂
F1
圆
F2 圆 (5474株) 2.96 : 皱 (1850株) 1
约为3:1
第一步:计算2 值
O1=5474 O2=1850 E1=(5474+1850) ×3/4= E2=(5474+1850) ×1/4= 2 =(O-E)2/E =(O1- E1)2/ E1+(O2- E2)2/ E2=2.6
实例应用:
例1:在两对基因杂种YyRr的F2群体中, 试问三显性和一隐性基因个体出现的概 率是多少? 已知: n=4 r=3 n-r=1 p=1/2 q=1/2
n!
r!(n-r)!
Prqn-r
实例应用:
例2:在三对基因杂种YyRrCc的F2群体中, 试问两显性性状和一隐性性状个体出现 的概率是多少? 已知: n=3 r=2 n-r=1 p=3/4 q=1/4
1.5.5 2测验(chi-square method) 2 =(O-E)2/E
O:实际观测值 E:理论值
2:观测值偏离理论值的一个估值
统计的标准
P> 0.05,结果与理论数无显著差异,实得值符合 理论值;
P< 0.05,结果与理论数有显著差异,实得值不符 合理论值;
P< 0.01,结果与理论数有极显著差异,实得值非 常不符合理论值。
n!
r!(n-r)!
Prqn-r
实例应用:
例3:AaCc与aaCc杂交,产生五个后代, 其中三个A-C-, 两个aacc的概率是多少? 已知: n=5 r=3 n-r=2 P=? q=?
Prqn-r r!(n-r)!
n!
AaCc × aaCc
3/4C1/2A-
3/8A-C-
1/4cc
3/4C1/2aa 1/4cc 1/8aacc
正常
4 3 2 1 0
白化
0 1 2 3 4
n ! prqn-r r ! (n-r) !
P
81/256 108/256 54/256 12/256 1/256
1×(3/4)4×(1/4)0 4×(3/4)3×(1/4)1 6×(3/4)2×(1/4)2 4×(3/4)1×(1/4)3 1×(3/4)0×(1/4)4
¼ 皱缩 ¾ 圆形
¼ 绿色 ¼ 皱缩
3) 多对基因杂交概率的计算
五对基因的杂交组合AABbccDDEe ×AaBbCCddEe,求 后代中基因型为AABBCcDdee和表型为ABCDe的概率。 P AA×Aa Bb×Bb cc×CC DD×dd Ee×Ee BB Cc Dd ee
基因型 AA
概率P= 1/2 ×
2
表
0.10
2.71 4.61 6.25 7.78 9.24 15.99
差异显著 性标准
差异极显 著性标准
0.95 0.50
0.15 1.39 2.37 3.36 4.35 9.34
0.05
3.84
5.99 7.82 9.49 11.07
0.02
5.41
7.82 9.84 11.67 13.39
0.01
2
表
0.10
2.71 4.61 6.25 7.78 9.24 15.99
差异显著 性标准
差异极显 著性标准
0.95 0.50
0.15 1.39 2.37 3.36 4.35 9.34
0.05
3.84
5.99 7.82 9.49 11.07
0.02
5.41
7.82 9.84 11.67 13.39
0.01
6.64
9.21 11.35 13.28 15.09
3
4 5 10
18.31
21.16
23.21
自由度:在各项预期值决定后,实得数中能自由变动的项数。 df= n-1(分离组数-1)
1.5.2 概率原理
1) 乘法定律(Sum Rule)
独立事件A和B同时发生的概率等于各个事件发生 概率之乘积。
P (A· =P (A) ×P (B) B) 2) 加法定律(Product Rule) 两个互斥事件同时发生的概率是各个事件各自发 生的概率之和。 P (A或B)=P (A) +P (B)
1.5.3 概率的计算和应用
1) 棋盘法(punnet square)
♀
♂
1/4YR
1/4Yr
1/4yR 1/16YyRR
1/4yr 1/16YyRr
YR 1/4 yR 1/4 Yr 1/4 yr 1/4
1/16YYRR 1/16YYRr
1/16YyRR 1/16YYRr 1/16YyRr
1/16YyRr
1/16yyRR 1/16YyRr 1/16yyRr
wk.baidu.com
1/16yyRr 1/16Yyrr 1/16yyrr
1/16YYrr
1/16Yyrr
2) 分枝法(branching process)
Yy×Yy ¼YY Rr×Rr ¼ RR 2/4 Rr ¼ rr ¼ RR 2/4 Rr ¼ rr ¼ RR 2/4 Rr ¼ rr 后代基因型及其比例
第一个孩子 正常 正常 患儿 患儿 第二个孩子 正常 患儿 正常 患儿 概率 3/4 ×1/4=3/16 1/4 ×3/4=3/16 分布
3/4 ×3/4=9/16 P(pp)=9/16
2P(pq)=6/16
1/4 ×1/4=1/16 P(qq)=1/16
二项式公式的应用:
(p+q)n=pn+npn-1q+ n(n-1) n(n-1)(n-2) n Pn-2q2+ Pn-3q3+ ……+q 2! 3! P:某一事件出现的概率 q:另一事件出现的概率 n:估测其出现概率的事件数 P+q=1
1.5 统计学原理在遗传学中的应用
1.5.1 概率的概念
概率(probability)又称几率(chance):是指某事件未
发生前人们对该事件出现的可能性进行的一种估计。
P(A)=lim(nA/n)
频率:指某一事件已发生的情况。如人口出生率 的统计,升学率的统计等等。但某事件以往发生的 频率也可以作为对未来事件发生的可能性的估计。
2P(pq)=2/4
P(qq)=1/4
(p+q)2=p2+2pq+q2=1/4+1/2+1/4,分布是对称的。若研 究n个子女的家庭,则为:(p+q)n 分布也是对称的。
2)不对称分布
若一对性状各自发生的概率pq,则二项式分布不对称。 如隐性遗传病半乳糖血症,两个携带者婚配,只生两个子 女,表型正常和患病的分布是:
1/4 × 1
B C
×
1 × 1/4=1/32
D e
概率P= 1 ×
3/4 × 1
×
1 × 1/4=3/16
1.5.4 二项分布和二项展开法
1)对称分布 即一对性状各自发生的概率p和q相等。
以两个孩子的家庭为例,性别分布可有以下几种情况。
第一个孩子 男 男 女 女 第二个孩子 男 女 男 女 概率 1/2 ×1/2=1/4 1/2 ×1/2=1/4 1/2 ×1/2=1/4 1/2 ×1/2=1/4 分布 P(pp)=1/4
紫、缺 247 紫、马 90 绿、缺 83 绿、马 34 总计 454
O E
(O-E)2
255.4
0.28
85.1
0.28
85.1
0.05
28.4
1.10
454
E
1.71
df =4-1=3查2表知p>0.05,统计学上认为在5% 显著水准上差异不显著。
x
P 0.99 df
1 2
0.0201 0.115 0.297 0.554 2.558 0.00016 0.0039 0.103 0.352 0.711 1.145 3.940
1/16 YYRR 2/16 YYRr 1/16 YYrr
2/16 YyRR 4/16 YyRr 2/16 Yyrr 1/16 yyRR 2/16 yyRr 1/16 yyrr
2/4
Yy
¼ yy
表型及其比例分枝图
Yy×Yy
¾ 黄色
Rr×Rr
¾ 圆形
后代表型及其比例
9/16 黄圆 3/16 黄皱 3/16 绿圆 1/16 绿皱
第二步:根据自由度查表并判断
当df=1时,p=0.05, 20.05=3.84 (df=3时,p=0.05, 20.05=7.82)
2﹤ 20.05 2﹥ 20.05
观测值与理论值差异不显著 (符合理论比例)
观测值与理论值差异显著 (不符合理论比例)
x
P 0.99 df
1 2
0.0201 0.115 0.297 0.554 2.558 0.00016 0.0039 0.103 0.352 0.711 1.145 3.940
3)计算单项概率
若我们研究的不是其全部,而是某一项的概率,则 可用如下通式:
n!
r!(n-r)!
prqn-r
r:某事件(基因型或表现型)出现的次数 n-r:另一事件(基因型或表现型)出现的次数
例:白化基因携带者结婚生育的4个孩子中白化的频率分布 p为正常表型的概率=3/4,q为白化的概率=1/4,n为孩 子总数=4,(n—r)则为患儿数。
6.64
9.21 11.35 13.28 15.09
3
4 5 10
18.31
21.16
23.21
自由度:在各项预期值决定后,实得数中能自由变动的项数。 df= n-1(分离组数-1)
举例2:
如番茄紫茎缺刻叶(AACC)和绿茎马铃薯叶(aacc)杂交后产 生的F2代出现如下分离,其是否符合9:3:3:1的理论值?
举例1:
P ♀圆 × 皱♂
F1
圆
F2 圆 (5474株) 2.96 : 皱 (1850株) 1
约为3:1
第一步:计算2 值
O1=5474 O2=1850 E1=(5474+1850) ×3/4= E2=(5474+1850) ×1/4= 2 =(O-E)2/E =(O1- E1)2/ E1+(O2- E2)2/ E2=2.6
实例应用:
例1:在两对基因杂种YyRr的F2群体中, 试问三显性和一隐性基因个体出现的概 率是多少? 已知: n=4 r=3 n-r=1 p=1/2 q=1/2
n!
r!(n-r)!
Prqn-r
实例应用:
例2:在三对基因杂种YyRrCc的F2群体中, 试问两显性性状和一隐性性状个体出现 的概率是多少? 已知: n=3 r=2 n-r=1 p=3/4 q=1/4
1.5.5 2测验(chi-square method) 2 =(O-E)2/E
O:实际观测值 E:理论值
2:观测值偏离理论值的一个估值
统计的标准
P> 0.05,结果与理论数无显著差异,实得值符合 理论值;
P< 0.05,结果与理论数有显著差异,实得值不符 合理论值;
P< 0.01,结果与理论数有极显著差异,实得值非 常不符合理论值。
n!
r!(n-r)!
Prqn-r
实例应用:
例3:AaCc与aaCc杂交,产生五个后代, 其中三个A-C-, 两个aacc的概率是多少? 已知: n=5 r=3 n-r=2 P=? q=?
Prqn-r r!(n-r)!
n!
AaCc × aaCc
3/4C1/2A-
3/8A-C-
1/4cc
3/4C1/2aa 1/4cc 1/8aacc
正常
4 3 2 1 0
白化
0 1 2 3 4
n ! prqn-r r ! (n-r) !
P
81/256 108/256 54/256 12/256 1/256
1×(3/4)4×(1/4)0 4×(3/4)3×(1/4)1 6×(3/4)2×(1/4)2 4×(3/4)1×(1/4)3 1×(3/4)0×(1/4)4
¼ 皱缩 ¾ 圆形
¼ 绿色 ¼ 皱缩
3) 多对基因杂交概率的计算
五对基因的杂交组合AABbccDDEe ×AaBbCCddEe,求 后代中基因型为AABBCcDdee和表型为ABCDe的概率。 P AA×Aa Bb×Bb cc×CC DD×dd Ee×Ee BB Cc Dd ee
基因型 AA
概率P= 1/2 ×
2
表
0.10
2.71 4.61 6.25 7.78 9.24 15.99
差异显著 性标准
差异极显 著性标准
0.95 0.50
0.15 1.39 2.37 3.36 4.35 9.34
0.05
3.84
5.99 7.82 9.49 11.07
0.02
5.41
7.82 9.84 11.67 13.39
0.01
2
表
0.10
2.71 4.61 6.25 7.78 9.24 15.99
差异显著 性标准
差异极显 著性标准
0.95 0.50
0.15 1.39 2.37 3.36 4.35 9.34
0.05
3.84
5.99 7.82 9.49 11.07
0.02
5.41
7.82 9.84 11.67 13.39
0.01
6.64
9.21 11.35 13.28 15.09
3
4 5 10
18.31
21.16
23.21
自由度:在各项预期值决定后,实得数中能自由变动的项数。 df= n-1(分离组数-1)
1.5.2 概率原理
1) 乘法定律(Sum Rule)
独立事件A和B同时发生的概率等于各个事件发生 概率之乘积。
P (A· =P (A) ×P (B) B) 2) 加法定律(Product Rule) 两个互斥事件同时发生的概率是各个事件各自发 生的概率之和。 P (A或B)=P (A) +P (B)
1.5.3 概率的计算和应用
1) 棋盘法(punnet square)
♀
♂
1/4YR
1/4Yr
1/4yR 1/16YyRR
1/4yr 1/16YyRr
YR 1/4 yR 1/4 Yr 1/4 yr 1/4
1/16YYRR 1/16YYRr
1/16YyRR 1/16YYRr 1/16YyRr
1/16YyRr
1/16yyRR 1/16YyRr 1/16yyRr
wk.baidu.com
1/16yyRr 1/16Yyrr 1/16yyrr
1/16YYrr
1/16Yyrr
2) 分枝法(branching process)
Yy×Yy ¼YY Rr×Rr ¼ RR 2/4 Rr ¼ rr ¼ RR 2/4 Rr ¼ rr ¼ RR 2/4 Rr ¼ rr 后代基因型及其比例
第一个孩子 正常 正常 患儿 患儿 第二个孩子 正常 患儿 正常 患儿 概率 3/4 ×1/4=3/16 1/4 ×3/4=3/16 分布
3/4 ×3/4=9/16 P(pp)=9/16
2P(pq)=6/16
1/4 ×1/4=1/16 P(qq)=1/16
二项式公式的应用:
(p+q)n=pn+npn-1q+ n(n-1) n(n-1)(n-2) n Pn-2q2+ Pn-3q3+ ……+q 2! 3! P:某一事件出现的概率 q:另一事件出现的概率 n:估测其出现概率的事件数 P+q=1
1.5 统计学原理在遗传学中的应用
1.5.1 概率的概念
概率(probability)又称几率(chance):是指某事件未
发生前人们对该事件出现的可能性进行的一种估计。
P(A)=lim(nA/n)
频率:指某一事件已发生的情况。如人口出生率 的统计,升学率的统计等等。但某事件以往发生的 频率也可以作为对未来事件发生的可能性的估计。
2P(pq)=2/4
P(qq)=1/4
(p+q)2=p2+2pq+q2=1/4+1/2+1/4,分布是对称的。若研 究n个子女的家庭,则为:(p+q)n 分布也是对称的。
2)不对称分布
若一对性状各自发生的概率pq,则二项式分布不对称。 如隐性遗传病半乳糖血症,两个携带者婚配,只生两个子 女,表型正常和患病的分布是: