分子进化与系统发育分析报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分子进化研究的基础(假设)
❖ 核苷酸和氨基酸序列中含有生物进化历史的 全部信息。
分子进化研究的基础(理论)
❖ 在各种不同的发育谱系及足够大的进化时间 尺度中,许多序列的进化速率几乎是恒定不 变的。(分子钟理论, 1965 )
分子进化研究的基础(实际)
❖ 虽然很多时候仍然存在争议,但是分子进化 确实能阐述一些生物系统发生的内在规律。
异源基因或水平转移基因
(xenologous or horizontally transferred genes)
由某一个水平基因转移事件而得到的同源序列
2.进化分支图,进化树
Bacterium 1
Bacterium 2
Bacterium 3 Eukaryote 1 Eukaryote 2
Eukaryote 3
趣的问题的系统发育信号。 ❖ 8、样本序列是随机进化的。 ❖ 9、序列中的所有位点的进化都是随机的。 ❖ 10、序列中的每一个位点的进化都是独立的。
直系同源与旁系同源
❖ 直系同源(orthologs):同源的基因通过物种
形成的事件而产生,或源于不同物种的最近 的共同祖先的两个基因,或者两个物种中的
进化及遗传模型
❖ 1、序列有指定的来源并且正确无误。 ❖ 2、序列是同源的,而序列不是“paralog“的混合物。 ❖ 3、序列比对中,不同序列的同一个位点都是同源的 ❖ 4、在接受分析的一个序列组中,序列之间的系统发
育史是相同的。 ❖ 5、样本足以解决感兴趣的问题。
进化及遗传模型
❖ 6、样本序列之间的差异代表了感兴趣的宽组。 ❖ 7、样本序列之间的差异包含了足以解决感兴
Cladograms show branching order branch lengths are meaningless 进化分支图,只用分支 信息,无支长信息。
Eukaryote 4
Phylograms show
Bacterium 1
branch order and
Bacterium 2
branch lengths
系统发育树是什么?
对一组实际对象的世系关系的描述(如基 因,物种等)。
系统发育树: 术语
分支/世系
末端节点
A 代表最终分
B
类,可以是 物种,群体
C ,或者蛋白
祖先节点/
D
质、DNA、 RNA分子等
树根
内部节点/分歧点,该 E
分支可能的祖先结点
树只代表分支的拓扑结构
A BC D F G E†
D C F GA B E†
生物信息学
分子进化与系统发育分析
内容提要
❖ 分子进化分析介绍 ❖ 系统发育树重建方法 ❖ Phylip软件包在分子进化分析中的应用 ❖ PAUP*在分子进化分析中的应用 ❖ MEGA分子进化树分析软件
分子进化研究的目的
从物种的一些分子特性出发,从而了 解物种之间的生物系统发生的关系。
蛋白和核酸序列 通过序列同源性的比较进而了解基因的进 化以及生物系统发生的内在规律。
TRENDS in Genetics Vol.18 No.12 December 2002
http://tig.trends.co m 0168-9525/02/$ – see front matter © 2002 Elsevier Science Ltd. All rights reserved.
~3.58X1036 ~2.04X1038
Taxa增多,计算量急剧增加,因此,目前算法都为 优化算法,不能保证最优解
4.基因树,物种树
a Gene tree
b
A Species tree
B
c
D
We often assume that gene trees give us
species trees
系统发育树重建分析步骤
同一基因,一般具有相同的功能。 ❖ 并系同源(paralogs):同源基因在同一物种
中,通过至少一次基因复制的事件而产生。
paralogs orthologs
paralogs
orthologs
Erik L.L. Sonnhammer Orthology,paralogy and proposed classification for paralog subtypes
序列分歧度
分子钟理论
从一个分歧数据可以推测其他
y x
分歧时间
速率恒定的证据:血色素
中性理论
❖ “在生物分子层次上的进化改变不是由自然选择作 用于有利突变引起的,而是在连续的突变压之下由 选择中性或非常接近中性的突变的随机固定造成的, 中性突变是指对当前适应度无影响的突变。”
❖ 否认自然选择在生物进化中的作用,认为生物大分 子的进化的主要因素是机会和突变压力
以上两个概念代表了两个不同的进化事件 用于分子进化分析中的序列必须是直系同源 的,才能真实反映进化过程。
趋同进化的ຫໍສະໝຸດ Baidu因(Convergent evolution )
通过不同的进化途径获得相似的功能,或者功能替代物
(genes have converged function by separate evolutionary paths)
Bacterium 3
进化树,有分支和支长
Eukaryote 1
信息
Eukaryote 2
Eukaryote 3
Eukaryote 4
无根树,有根树,外围支
archaea archaea archaea
eukaryote
通过外围支 来确定树根
有根树
根
eukaryote
无根树
eukaryote
eukaryote
❖ 1. 理论基础为奥卡姆剃刀 (Ockham)原则:计算所需 替代数最小的那个拓扑结构,作为最优树
多序列比对(自动比对,手工比对) 建立取代模型(建树方法) 建立进化树 进化树评估
系统发育树重建的基本方法
❖ 1. 最大简约法 (maximum parsimony, MP) ❖ 2. 距离法 (distance) ❖ 3. 最大似然法 (maximum likelihood, ML)
最大简约法 (MP)
bacteria outgroup 外围支
archaea archaea archaea eukaryote eukaryote eukaryote eukaryote
无根树和有根树:潜在的数目
#Taxa
3 4 5 6 7 … 30
无根树
1 3 15 105 945
有根树
3 15 105 945 10,395