第七章分子系统发育分析进化树
第七章 系统发育与进化树
马尔萨斯
反达尔文学说-理论上
智慧设计理论 • 詹腓力 Philip Johnson • 《Darwin on Trial》 • 仅适用于生物种范围之内 • 能否制造新的物种? 复杂的器官如何进化而来?
• 英国天文学家 弗雷德.霍伊尔 • ……相当于一阵旋风吹到一片充满各种 破铜烂铁的废物堆之后, 突然组成了一架波 音747客机.
细胞色素C在不同物种间的差别
• 从序列保守性上可以用生物分子序列进行 进化树分析 • 从序列变异性分析其变异性是否跟时间相 关
分子钟!!!!!!!
• 某一蛋白在不同物种间的取代数与所研 究物种间的分歧时间接近正线性关系, 有很好的相关性,分子中这种恒速变异 成为“分子钟”
• 分子进化速率在不同种系中恒定
共同祖先进化
• • • • • 系统分类 生物地理 比较解剖 比较胚胎 古生物
共同祖先学说
• 第一,物种是可变的,生物是进化的。当时绝大 部分读了《物种起源》的生物学家都很快地接受 了这个事实,进化论从此取代神创论,成为生物 学研究的基石。即使是在当时,有关生物是否进 化的辩论,也主要是在生物学家和基督教传道士 之间,而不是在生物学界内部进行的。 • 第二,自然选择是生物进化的动力。当时的生物 学家对接受这一点犹豫不决,因为自然选择学说 在当时存在着几大难题。
进化树
• 在研究生物进化和系统分类中,常用一种类似 树状分支的图形来概括各种(类)生物之间的 亲缘关系,这种树状分支的图形成为系统发育 树(phylogenetic tree)。 • 通过比较生物大分子序列差异的数值构建的系 统树称为分子系统树(molecular phylogenetic tree)。
第四章 系统发育分析与进化树
什么是系统生物学?
分子系统发育分析课件
建树算法
总结词
建树算法是将序列比对结果转化为系统发育树的计算过程, 常用的算法有UPGMA、NJ、ML等。
详细描述
建树算法是将多个物种的基因序列进行比较,根据它们之间 的相似性和差异,构建出一个反映物种之间亲缘关系的进化 树。常用的建树算法包括UPGMA、NJ、ML等。
数据准备
整理相关分子序列数据,进行 预处理。
序列比对
采用适合的方法进行序列比对 ,确保数据准确性。
系统发育分析
基于比对后的数据,进行系统 发育分析。
结果展示与解读
生成系统发育树并解读其意义 。
软件应用案例
微生物系统发育分析
用于研究微生物种群间的进化关系。
古生物学研究
用于分析古生物化石中的分子信息,揭示生物演化历程。
算法优化与改进
算法效率和准确性
提高算法的运行速度和准确性,以处理大规模 数据集。
算法可扩展性
确保算法能够适应不断增长的数据量和复杂性 。
算法灵活性
提供更灵活的参数和选项,以满足不同研究需求。
应用领域的拓展
跨物种比较
01
将分子系统发育分析应用于不同物种的比较,以揭示物种间的
进化关系。
疾病机制研究
02
数据匿名化
对涉及个人隐私的数据进行适当 的匿名化处理,保护数据主体的 隐私权。
结果解读与发布
要点一
准确解读
对分子系统发育分析的结果进行准确解读,避免误导或夸 大其实际意义。
要点二
结果审查
对分析结果进行同行评审或专家审查,确保结果的可靠性 和准确性。
分子进化与系统发育
分子进化
• 1964年,Linus Pauling提出分子进化理论; • 从物种的一些分子特性出发,从而了解物种之间的 生物系统发生的关系。 • 发生在分子层面的进化过程:DNA, RNA和蛋白质分 子 • 基本假设:核苷酸和氨基酸序列中含有生物进化历 史的全部信息。
分子进化的模式
• DNA突变的模式:替代,插入,缺失,倒位;
分子进化与系统发育
——分子系统进化树
动物生态分子研究组
内容介绍
• 分子进化分析介绍 • 系统发育树构建方法
• 构建发育树的相关软件
• 文献——分子系统进化
一、分子进化分析
除非在进化的角度来观察,否则 任何生物学现象都将毫无意义。
—— 杜布赞斯基 (T.Dobzhansky,1900~1975)
研究生物进化历史的途径 • 1. 最确凿证据是:生物化石!—— 零 散、不完整 • 2.比较形态学、比较解剖学和生理学等: 确定大致的进化框架 —— 细节存很多 的争议
• 1. 理论基础为奥卡姆剃刀 (Ockham)原则:计算所需 替代数最小的那个拓扑结构,作为最优树 • 2. 在分析的序列位点上没有回复突变或平行突变, 且被检验的序列位点数很大的时候,最大简约法能够 推导获得一个很好的进化树 • 3. 优点:不需要在处理核苷酸或者氨基酸替代的时 候引入假设 (替代模型) • 4.缺点:分析序列上存在较多的回复突变或平行突变, 而被检验的序列位点数又比较少的时候,可能会给出 一个不合理的或者错误的进化树推导结果
相关软件
软件 说明
ClustalX
GeneDoc
图形化的多序列比对工具;构建N-J系统树 http://bips.u-strasbg.fr/fr/Documentation/ClustalX/
分子进化总结分析—系统发生树的构建要求
系统发育树构建的基本方法
Distance-based methods 基于距离的方法
Unweightedpair group method using arithmetic average (UPGMA) 非加权分组平均法 Minimum evolution(ME)最小进化方法 Neighbor joining(NJ)邻位归并法
打开软件clustalx
• CLUSTALX-是CLUSTAL多重序列比对程序的 Windows版本。Clustal X为进行多重序列和轮廓比 对和分析结果提供一个整体的环境。 序列将显示屏幕的窗口中。采用多色彩的模式可 以在比对中加亮保守区的特征。窗口上面的下拉 菜单可让你选择传统多重比对和轮廓比对需要的 所有选项。
分子进化分析—— 系统发生发育分析是研究物种进化和系统分类的一种 方法,研究对象为携带遗传信息的生物大分子序 列,采用特定的数理统计算法来计算生物间的生 物系统发生的关系。并用系统进化树来概括生物 间的这种亲缘关系。
2
分子系统发育分析
• 系统发育进化树( Phylogenetic tree) 用一种类似树状分支的图形来概括各种生物之间的亲缘关系。
• 名 称: Uncultured bacterium clone YU201H10 • 序列号: FJ694683 /FJ694514 • 文 献: TITLE Circumpolar synchrony in big river
bacterioplankton • 序列长度:353 • 相 似 比: 99% • 核酸序列 • 分类地位
• Clustalx比对结果是构建系统发育树的前提
具体步骤
• 根据需要,选定要比对的菌株及相应的序 列。将序列COPY至记事本
浅谈系统发育分析及进化树制作课件
THE FIRST LESSON OF THE SCHOOL YEAR
目录CONTENTS
• 系统发育分析简介 • 进化树基本概念 • 进化树的制作方法 • 系统发育分析的挑战与未来发展 • 实践案例分享 • 总结与展望
01
系统发育分析简介
定义与重要性
定义
系统发育分析是一种研究生物种群进化历程和亲缘关系的方法,通过比较不同 物种间的基因、蛋白质等分子序列差异,构建进化树来揭示生物的演化关系。
重复构建
为确保结果的稳定性,对同一数据集进行多次重复构 建进化树。
01
系统发育分析的挑 战与未来发展
当前面临的主要问题
数据获取与整合
系统发育分析需要大量的基因序 列数据,如何高效获取和整合这 些数据是一个挑战。
算法复杂度与计算
资源
随着数据量的增长,传统的系统 发育分析算法面临计算效率和资 源消耗的挑战。
物种间基因序列差
异
不同物种的基因序列存在较大差 异,如何准确识别和比较这些差 异是系统发育分析的关键。
未来发展方向与趋势
Байду номын сангаас
01
大数据技术的应用
利用大数据技术对海量基因序列 数据进行处理和分析,提高系统 发育分析的效率和准确性。
02
算法优化和并行计 算
通过算法优化和并行计算技术, 降低系统发育分析的计算复杂度 ,提高计算效率。
基于已知物种的进化关系 ,构建一棵假设树,常用 软件如RAxML。
贝叶斯法
基于贝叶斯统计理论,模 拟基因序列的进化过程, 常用软件如MrBayes。
参数设置与优化
模型选择
根据基因序列的特点选择合适的进化模型,如GTR、 GTR+I+G等。
生物信息学第七章分子进化与系统发育分析2
生物信息学第七章分子进化与系统发育分析(2)同义与非同义的核苷酸替代❒同义替代:编码区的DNA序列,核苷酸的改变不改变编码的氨基酸的组成❒非同义替代:核苷酸改变,从而改变编码氨基酸的组成❒计算方法:进化通径法Kimura两参数法采用密码子替代模型的最大似然法SdS❒Ka/Ks ~ 1: 中性进化❒Ka/Ks << 1: 阴性选择,净化选择❒Ka/Ks >> 1: 阳性选择,适应性进化❒多数基因为中性进化,约1%的基因受到阳性选择->决定物种形成、新功能的产生❒PAML, MEGA等工具:计算Ka/Ks及统计显著性进化通径法:Nei-Gojobori❒首先需要考虑:潜在的同义(S )和非同义位点数(N )❒基本假设:所有核苷酸的替代率相等❒用f i 表示某一个密码子第i 位的核苷酸上发生同义替代的比例;(i=1,2,3)❒所有密码子潜在的同义和非同义替代的位点数定义如下:,n=3-s∑==31i i f s潜在的同义和非同义位点数的估计❒例如对于Phe, 密码子TTT, 第三位T变成C时为同义替代,变成A/G为非同义替代❒因此:❒s=0+0+1/3❒n=3-1/3=8/3❒终止密码子忽略不计;如Cys的TGT, s=0.5整个序列的同义与非同义估计❒和N=3C-S; Sj 为第j 位密码子的s 值,C 为所有密码子的总数❒S+N=3C :所比较的核苷酸的总数∑==C j j S S 1S d 与N d 的计算:进化通径❒当一对密码子仅存在一个差异时,可以立即判断是同义还是非同义,进化通径只有一种可能;例如对于GTT(Val)和GTA(Val),s d =1,n d =0;而对于ATT(I)和ATG(M),s d =0,n d =1❒一对密码子存在两个差异时:两种进化通径(简约法,即最少需要)。
例如:比较TTT(Phe)和GTA(Val): (1) TTT(Phe)<->GTT(Val)<->GTA(Val)(2) TTT(Phe)<->TTA(Leu)<->GTA(Val)❒s d =1/2=0.5,n d =3/2=1.5❒同样,终止密码子不予考虑一对密码子存在三个差异时:六种进化通径。
分子进化分析讲解
—— 寻找这棵正确的树
+ 分子进化分析介绍 + 系统发育树重建方法 + 常用分子进化与系统发育分析的软件
选择数据(核酸/蛋白质,外围支) 多序列比对(自动比对,手工比对)
选择建树方法及取代模型 建立进化树 进化树评估
+ 从多重序列比对到构建进化树有多种算法, 可分两大类:
+ 基于距离的方法
– Tree 1长4,Tree 2& 3长2
+ 同理,综合所有信息位点:
– Tree 1长4,Tree 2长5,Tree 3长6
+ 计算结果:MP tree的最优结果为Tree 1
+ 又称距离矩阵法,首先通过各个物种之间的 比较,根据一定的假设(进化距离模型)推 导得出分类群之间的进化距离,构建一个进 化距离矩阵。进化树的构建则是基于这个矩 阵中的进计化算距序离列关的距系离,建立距离矩阵
– 首先通过各个序列之间的比较,根据一定的假 设(进化距离模型)推导出分类群之间的进化 距离,构建一个进化距离矩阵。进化树的构建 则是基于这个矩阵中的进化距离。
+ 基于特征的方法
– 不计算序列之间的距离,而是将序列中有差异 的位点作为单独的特征,并依据这些特征来建
+ 基于距离的方法
– 非加权分组平均法(UPGMA) – 最小近乎距离(ME) – 邻近法(NJ)
真细菌 真核生物
古生菌
随着距非洲距离越来越长, 遗传多样性的衰退程度, 正好沿着人类早期迁徙的 路线慢慢增大。
53个人的线粒体基因组 (16,587bp)
非洲人相对其他大陆上的 人类在基因上极为多样化
人类迁移的路线
一、系统发育树(Phylogenetic tree)
分子进化与系统发育分析PPT演示课件
eukaryote
eukaryote
bacteria outgroup 外围支
archaea archaea archaea
eukaryote eukaryote
eukaryote
22
eukaryote
无根树和有根树:潜在的数目
#Taxa
3 4 5 6 7 … 30
无根树
1 3 15 105 945
同一基因,一般具有相同的功能。 并系同源(paralogs):同源基因在同一物种
中,通过至少一次基因复制的
16
paralogs
orthologs
Erik L.L. Sonnhammer Orthology,paralogy and proposed classification for paralog subtypes
19
异源基因或水平转移基因
(xenologous or horizontally transferred genes)
由某一个水平基因转移事件而得到的同源序列
20
2.进化分支图,进化树
Bacterium 1
Bacterium 2
Bacterium 3 Eukaryote 1 Eukaryote 2
TRENDS in Genetics Vol.18 No.12 December 2002
http://tig.trends.co m 0168-9525/02/$ – see front matter © 2002 Elsevier 17 Science Ltd. All rights reserved.
有根树
3 15 105 945 10,395
~3.58X1036 ~2.04X1038
系统发育进化树作用-概述说明以及解释
系统发育进化树作用-概述说明以及解释1.引言1.1 概述系统发育进化树是生物学领域一个重要的概念和工具。
它通过对物种之间的遗传关系和演化历史进行系统分析和分类,构建出一颗树状结构,用以揭示物种之间的进化关系。
这种树状结构可以帮助我们更好地理解物种之间的演化历史以及它们之间的亲缘关系。
系统发育进化树的构建方法经历了长期的发展和完善,目前主要包括分子系统学和形态系统学两种方法。
分子系统学通过比对物种之间的DNA 或蛋白质序列,来推断它们之间的遗传关系;而形态系统学则是通过对物种的形态、生理学特征等进行比较和分类。
这些方法的结合可以更准确地揭示物种之间的演化关系。
系统发育进化树在生物学领域有着广泛的应用,不仅可以帮助我们解答物种起源、分化等基础科学问题,还可以指导生物分类学、生物地理学等实际应用领域的研究。
因此,系统发育进化树的建立和应用具有重要的理论和实践价值。
1.2 文章结构本文将分为三个主要部分来探讨系统发育进化树的作用。
首先,我们将在引言部分对本文的内容进行概述,介绍系统发育的基本概念以及文章的目的。
接下来,在正文部分,我们将详细介绍系统发育和进化树的构建方法,以及系统发育进化树在生物学研究中的应用。
最后,在结论部分,我们将强调系统发育进化树的重要性,并展望未来其在科学研究中的发展前景。
通过以上结构的安排,我们希望读者能够更全面地了解系统发育进化树的作用及其在生物学领域的重要性。
1.3 目的在本文中,我们的主要目的是探讨系统发育进化树在生物学研究中的重要作用。
我们将首先介绍系统发育的概念,探讨进化树的构建方法,然后详细讨论系统发育进化树在生物学领域中的应用。
通过对这些内容的分析和探讨,我们旨在揭示系统发育进化树在生物学研究中的重要性,为今后更深入的研究提供参考和启示。
同时,我们也将展望未来系统发育进化树在生物学领域的发展潜力,希望能为相关研究提供一定的借鉴和指导。
最终,我们将对本文进行总结,强调系统发育进化树在生物学研究中的重要性和必要性。
分子进化与系统发育
分子进化与系统发育分子进化与系统发育是现代生物学的重要研究领域之一。
它通过研究生物体内的分子结构和遗传信息,来揭示不同物种之间的亲缘关系和进化历程。
本文将介绍分子进化与系统发育的基本原理、研究方法和应用。
一、分子进化的基本原理分子进化是指物种内基因组或蛋白质组的遗传信息发生变化的过程。
在分子水平上,进化主要表现为DNA序列的突变和基因组结构的变化。
分子进化的基本原理主要包括以下几点:1. 遗传变异:遗传变异是生物进化的基础,是物种产生多样性的原因。
遗传变异可通过突变、基因重组和基因转移等途径实现。
2. 自然选择:自然选择是分子进化过程中的重要机制。
根据环境变化和适应性需求,具有更有利基因型的个体会在繁殖中获得更高的生存优势,从而逐渐在种群中占据主导地位。
3. 基因漂变:基因漂变是指随机性的基因频率变异,特别在小种群中影响较大。
基因漂变可以导致分子进化的随机性增加,进而导致遗传多样性的减少。
二、分子系统发育的基本原理分子系统发育是通过比较不同物种的DNA序列或蛋白质结构,构建物种间的进化关系树。
它基于分子进化的原理,通过计算相似性或差异性来推断物种的亲缘关系和进化历程。
分子系统发育的基本原理主要包括以下几点:1. 保守性进化:保守性进化是指在漫长的进化历程中,一些基因或蛋白质序列在物种间保持相对稳定的变化。
这些保守性的变化为系统发育提供了可比较的基础。
2. 数据分析:分子系统发育的关键步骤是对获得的分子数据进行分析。
常用的分析方法包括序列比对、构建进化树和计算进化速率等。
3. 进化树的构建:进化树是分子系统发育的主要结果之一。
它通过对不同物种之间的分子差异性进行比较和计算,来揭示它们的亲缘关系和共同祖先。
构建进化树的方法主要包括距离法、最大似然法和贝叶斯法等。
三、分子进化与系统发育的研究方法分子进化与系统发育的研究方法主要包括分子时钟、基因家族分析和基因组学等。
1. 分子时钟:分子时钟是一种基于分子进化速率的方法,用来估计物种的分化时间和进化速度。
分子进化与系统发育分析
2. 阴性选择,净化选择:DNA分子的同义
替代显著,较少改变蛋白质的氨基酸组成,其 原来的功能高度保守;
3. 中性进化:同义替代与非同义替代比例相
当,突变不好不坏,不改变或轻微改变蛋白质 的功能。
基因的编码区和非编码区
基因的DNA由编码区(Coding region)和 非编码区(Non-coding region)构成;
➢B. 非编码区:~100%的中性进化
编码区:密码子
1. 对于同义的密码子,第一位少部分可以允许不 同,例如,编码Ser的六个密码子:TCT, TCC, TCA, TCG, AGT, AGC
2. 第二位必须相同 3. 第三位绝大多数可以不同 近似随机; 4. 因此:
➢ A. 第一位:阴性进化占大部分,中性进化占小部分 ➢ B. 第二位:阴性进化 ➢ C. 第三位:阴性进化占小部分,中性进化占大部分
种可以相互替换;
(4)结构相似; (5)组织特异性与亚细胞分布相似。
鉴定直系同源的实际操作标准(practical criteria)为:
进化树分析
paralogs
orthologs
paralogs orthologs
Erik L.L, et al TRENDS in Genetics, 2002
异同源(xenology)
系统发育树术语
分支/世系 末端节点
A B C D
祖先节点/ 树根
内部节点/分歧点,该 分支可能的祖先结点
E
代表最终 分类,可 以是物种 ,群体, 或者蛋白 质、DNA、 RNA分子等
二、系统发育树重建分析步骤
多序列比对(自动比对,手工校正) 确定替换模型 建立进化树 进化树评估
2.1多序列比对
序列多重比对的结果反映了序列之间的相似性, 为系统发育树的构建提供了有价值的信息。为提 高模型估算的精确性,不仅需要选择合适的比对 方法和参数,还需要对后续比对结果进行合理修 正,从中提取有意义的数据集用于系统发育树的 构建。
单系类群 包含一个 祖先类群所有子裔, 存在共同祖先 并系类群 非单系类 群,存在共同祖先 复系类群 非单系类 群,不存在共同衍生 祖先
内类群 研究所涉及的 某一特定类群 外类群 不包括在 内类群中又与之有一 定关系 姐妹群 与某一类 群关系最为密切的类 群
无根树,有根树,外群
archaea archaea archaea eukaryote eukaryote eukaryote
经典系统发育学局限性
表型有时候会误导我们,表型相似并不总是反映 基因相似。关系很远的物种也能进化出相似的表 型,这是由趋同进化的过程造成的。 用表型来判定进化关系的另一个问题是,对于许 多生物体很难检测到可用来进行比较的表型特征。 比较关系较远的生物体,什么样的表型特征能用 来比较呢?
系统发育树:三种类型
第七章分子系统发育分析进化树
D C F GA B E†
系统进化树的概念
直系同源(orthol。
旁系同源(paralogs): 同源的基因是由于基因复制产生的。 用于分子进化分析中的序列必须是直系同源的,才能真实
反映进化过程。
旁系同源
直系同源
系统进化树的种类
Eukaryote 4
系统进化树的种类
——物种树、基因树
物种树:代表一个物种或 群体进化历史的系统进化 树,两个物种分歧的时间 为两个物种发生生殖隔离 的时间
基因树:由来自各个物种 的一个基因构建的系统进 化树(不完全等同于物种 树),表示基因分离的时 间。
基因分裂
基因分裂 基因分裂 物种分裂
关于分子钟的讨论和争议
1、对长期进化而言,不存在以恒定速率替换的生物大分子 一级结构;(基因功能的改变、基因数目的增加)
2、不存在通用的分子钟;
3、争议: 分子钟的准确性 中性理论(分子钟成立的基础)
第一节 生物进化的分子机制
分子途经研究生物进化的可行性 分子进化的模式 分子进化的特点 研究分子进化的作用
末端节点:代表最终分类, 可以是物种,群体,或者蛋 白质、DNA、RNA分子等
A
B
C
D 祖先节点/树根
内部节点/分歧点,该
E
分支可能的祖先节点
系统进化树的概念
进化树分支的图像称为进化的拓扑结构 理论上,一个DNA序列在物种形成或基因复制时,
分裂成两个子序列,因此系统进化树一般是二歧 的。
A BC D F G E†
氨基酸
例:血红蛋白分子的外区的功能要次于内区的功能,外区的进化速率 是内区进化速率的10倍。
核苷酸
例:DNA密码子的同义替代频率高于非同义替代频率;内含子上的核 苷酸替代频率较高。
进化树分析
二、系统发育树重建分析步骤
多序列比对(自动比对,手工校正) 确定替换模型 建立进化树 进化树评估
2.1多序列比对
序列多重比对的结果反映了序列之间的相似性, 为系统发育树的构建提供了有价值的信息。为提 高模型估算的精确性,不仅需要选择合适的比对 方法和参数,还需要对后续比对结果进行合理修 正,从中提取有意义的数据集用于系统发育树的 构建。
分子系统发育分析
一、分子进化的基本理论
系统发育(或种系发育、系统发生,phylogeny) 是指生物形成或进化的历史。 系统发育学(phylogenetics)研究物种之间的进化 关系,其基本思想是比较物种的特征,并认为特 征相似的物种在遗传学上接近。
一、分子进化的基本理论
系统发育学是进化生物学的一个重要研究领域, 系统发育分析早在达尔文时代就已经开始。从那 时起,科学家们就开始寻找物种的源头,分析物 种之间的进化关系,给各个物种分门别类。
一、分子进化的基本理论
所有的生物都可以追溯到共同的祖先,生物的产 生和分化就像树一样地生长、分叉,以树的形式 来表示生物之间的进化关系是非常自然的事。可 以用树中的各个分支点代表一类生物起源的相对 时间,两个分支点靠得越近,则对应的两群生物 进化关系越密切。
经典系统发育学
经典系统发育学 主要是物理或表型特征 如生物体的大小、颜色、触角个数 通过表型比较来推断生物体的基因型 (genotype),研究物种之间的进化关系
系统发育树:三种类型
分支图
Taxon B Taxon C Taxon A Taxon D
1 1
进化树
6
时间度量树
Taxon B Taxon B Taxon C Taxon A Taxon D
进化树制作
否
是
可分辨的相似?
否
距离法(NJ、UPGMA)
已有数据是否支持相应 的假设或预测?
最大似然法ML
Bioinformatics
Liaoning University
进化树的评估
• 对进化树的评估主要是采用自展分析 (bootstaping)法。这是对进化树重新取样的评估 方法,可以对距离法、简约法及其他建树方法构 建的进化树进行评估。
法,分别是:邻接法、最小进化法、最大
简约法、UPGMA。
Bioinformatics
Liaoning University
Bioinformatics
Liaoning University
• 以常用的邻接法为例,介绍操作过程: 选择邻接法,点击Neighbor-joinning弹出Analysis Preference参数设置窗口。在Options Summary 标签中的phylogeny test and options中选择用 Bootstrap进行测试,重复次数通常设为至少大 于100比较好,计算距离的替代模型substition Model选择泊松校验(possion Correction)设 置完成后点击Cumputer,进行计算。
• 贝叶斯的算法以MrBayes为代表,不过速度较慢。 一般的进化树分析中较少应用。
Bioinformatics
Liaoning University
Bioinformatics
Liaoning University
构建进化树的一般原则
• 1. 可靠的待分析数据 • 2. 准确的多序列比对 • 3. 选择合适的建树方法:
with arithmetic mean,平均连接聚类法)、 ME(Minimum Evolution,最小进化法)和 NJ(Neighbor-Joining,邻接法) • 基于特征的构建方法
系统发育分析
物种中的来源于复制所得,可能会进化出
新的与原来有关的功能。
Orthologs and Paralogs are two types of homologous sequences. Orthology describes genes in different species that derive from a common ancestor. Orthologous genes may or may not have the same function. Paralogy describes homologous genes within a single species that diverged by gene duplication.
相关概念:
所谓进化(evolution)是生物与其生存
环境相互作用过程中,其遗传系统随时间 发生一系列不可逆的改变,在大多数情况 下,导致生物表型改变和对生存环境的相 对适应。
系统发育(phylogeny)指的是研究各类生 物进化的历史。构建系统发育过程有助于通过 物种间隐含的种系关系揭示进化动力的实质。
通过系统发育分析所推断出来的进化关系一
般用分枝图表(进化树)来描述,这个进化树
就描述了同一谱系的进化关系,包括了分子进 化(基因树)、物种进化以及分子进化和物种 进化的综合。
A phylogenetic tree of beach beetles. Some branches have gone extinct in the past, while others represent species living today.
20世纪70年代以前,生物类群间的亲缘关系 主要是根据形态结构、生理生化、行为习性等 表型特征以及少量的化石资料来判断它们之间 的亲缘关系。
分子进化与系统发育分析
分子进化与系统发育分析转:系统发育学研究的是进化关系,系统发育分析就根据同源性状的分歧来推断或者评估这些进化关系。
通过系统发育分析所推断出来的进化关系一般用分枝图(进化树) 来描述,这个进化树描述了分子(基因树)、物种以及二者之间遗传关系的谱系。
由于“Glade”这个词(拥有共同祖先的同一谱系)在西腊文中的本意是分支,所以系统发育学有时被称为遗传分类学(cladistics) 。
在现代系统发育研究中,重点己不再是生物的形态学特征或其他特征,而是生物大分子尤其是序列,对序列的系统发育分析又称为分子系统学或分子系统发育研究。
它的发展得益于大量序列的测定和分析程序的完善。
比起许多其他实验性学科,分子系统学与其他进化研究一样有其局限,即系统发育的发生过程都是己经完成的历史,只能在拥有大量序列信息的基础上去推断过去曾经发生过什么,而不能再现。
由于系统发育分析不太可能拥有实验基础,至多是些模拟实验或者病毒实验:如何处理序列从中得到有用信息、如何用计算的办法得到可信的系统树、如何从有限的数据得到进化模式成为这个领域的研究热点。
1进化树构建构建进化树的方法包括两种:一类是基于序列类似性比较,主要是基于氨基酸/核酸相对突变率矩阵计算不同序列差异性积分作为它们的差异性量度而构建的进化树;另一类是在难以通过序列比较构建进化树的情况下,通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立的进化树。
2评估进化树和数据现在己经有一些程序可以用来评估数据中的系统发育信号和进化树的健壮性。
对于前者,最流行的方法是用数据信号和随机数据作对比实验(偏斜和排列实验):对于后者,可以对观察到的数据重新取样,进行进化树的支持实验(非参数自引导和对折方法)。
似然比例实验可以对取代模型和进化树都进行评估。
本文只阐述几个常用的方法:偏斜实验(Skewness Test):统计的临界值随着分类群数口的不同和序列中点的不同而不同,对随机数据集呈现的信号很敏感,可以用来决定系统发育信号是否保留着。
系统发育树名词解释
系统发育树名词解释系统发育树,也称系统发育学汇编(简称系统发育学),是一种以生物间发育关系作为最基本组成单位的、带有生物分类关系规律性及发育进程意义的概念图,它以演化进程为基础,在理解现存生物的结构和功能时起着依据作用。
据基因组数据分析进化树,即是描述当前生物类群之间的关系,可以从DNA、RNA或一些其它的分子标记,构建他们进化的树状模型,从而推断出当前的生物分类关系,以及演化的过程。
这一技术的基础是利用形态学或生物化学分子技术,确定样品之间的系统发育关系,并计算出当前生物种之间演化的过程。
根据系统发育树分析,我们可以分析出不同物种在演化过程中如何影响彼此及其他物种的进化趋势,也可以判断出一些特定物种的祖先和后代的演化差异及特点。
从技术上讲,系统发育树是一种以系统发展方向以及演化步骤为依据的分析方法,可以用于推断物种之间的演化关系、追溯物种历史演化路径以及解释物种结构、功能等方面的问题。
系统发育树也可以用于分析物种之间的演化关系、比较物种之间的演化进程,找到可能存在的演化模式,以及解释物种之间具有的共同特征。
使用系统发育树,还可以推测物种对环境变化的适应,以及对环境变化的影响。
系统发育树是以生物演化关系作为依据,推断出其相互之间的关系基础的一种系统发展图。
它的应用极为广泛,不仅限于研究物种的演化关系,还可以用于研究物种的形态特征、生理特征、生态关系以及环境背景的变化情况等。
总的来说,系统发育树的内涵是物种演化的一般性规律,是现代生物分类学的基础,许多研究都极为依赖它。
系统发育树可以用来记录物种演化可能性,以及推断其发育模式,为研究物种演化进程提供见解。
同时,它也可以用于研究物种及其形态特征的变化,以及环境的影响,从而为保护生物多样性和调节生态系统提供有力的技术支持。
系统发育树,将有助于我们深入理解物种发育进程,促进我们对生物多样性及其保护的认识,并有利于推动生物多样性的维护和保护。
分子系统发育分析
分子系统发育分析Molecular Phylogenetics 杨茜北京大学生命科学学院2011-01-09提纲2345案例:分析NADH1序列系统发育的基本概念系统发育树的构建方法系统发育分析的软件参考和推荐书目elines 51系统发育的相关概念系统发育学研究物种进化和系统分类系统发育分析推断或评估这些进化和分类关系系统发育树通过系统发育分析所推断出来的进化关系一般用分支图来描述系统发育(Phylogeny)系统发育分析是研究物种进化和系统分类的一种方法,其常用一种类似树状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形称为系统发育树。
系统发育树描述了同一谱系的进化关系,包括了分子进化、物种进化以及分子进化和物种进化的综合。
通过系统发育树,我们可以找到亲缘关系最近的物种或者基因,探索基因的功能,追溯基因的起源。
在现代系统发育学研究中,研究的重点已经不再是生物的形态学特征或者其他特性,而主要是序列信息。
虽然已有了大量的用于系统发育的算法、过程和计算机程序,但是这些方法的可靠性和实用性还是依赖于数据的结构和大小。
系统发育分析一般没有实验基础,因为系统发育的发生过程都是已经完成的历史,只能去推断或者评估,而无法重现。
系统发育分析的概念性步骤系统发育分析生物数据序列比对建立替代模型构建系统发育树评估系统发育树选择序列时的注意事项1.序列有指定的来源并且正确无误2.序列是同源的,即所有的序列都起源于同一祖先序列3.样本序列之间的差异包含了足以解决感兴趣的问题的信息位点。
4.样本序列是随机进化的。
5.序列中的每一个位点的进化都是独立的。
序列比对建立一个序列比对的基本步骤包括:选择合适的比对程序;然后从比对结果中提取数据。
至于如何提取有效数据,取决于所选择的建树程序如何处理容易引起歧义的比对区域和插入/删除序列(即所谓的indel或者gap)。
分析DNA序列的方法基本上仍然是通过碱基和密码子的替代来考察序列的差异;这个方法同样应用于对蛋白质序列的分析,但是由于氨基酸的生物化学多样性,我们必须引入更多的参数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于分子钟的讨论和争议
1、对长期进化而言,不存在以恒定速率替换的生物大分子 一级结构;(基因功能的改变、基因数目的增加)
2、不存在通用的分子钟;
3、争议: 分子钟的准确性 中性理论(分子钟成立的基础)
第一节 生物进化的分子机制
分子途经研究生物进化的可行性 分子进化的模式 分子进化的特点 研究分子进化的作用
分子途径研究生物进化的可行性
普适性
由4种核酸组成
分子水平的进化表现为:DNA序列的演化、氨基酸序列演化、 蛋白质结构及功能的演化
可比较性
比较不同物种的有关DNA序列
建立DNA序列的演化模型、氨基酸序列的演化模型
蛋白质结构的演化模型
基因组包含丰富的编码信息
与形态、性状包含的信息相比,基因组序列、蛋白质序 列包含更多、更复杂的信息结构
2、许多不同物种的多种同源大分子在相当长时间内的 平均进化速率近似恒定。
建立分子钟的大致步骤
1、选择所要比较的生物大分子种类
根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率 大小合适、分布范围能涵盖各待比较物种的生物大分子。
2、选择所要比较的物种,确定各比较组合及其所代表的进 化事件
最理想的方法:化石!—— 零散、不完整
引言
梦想走进现实:How?
比较形态学和比较生理学:确定大致的进化框架 —— 细节存很多的争议
引言
梦想走进现实:How?
第三种方案:分子进化
1964年,美国进化生物学家 E. Zuckerkandl和 量子化学家 Linus Pauling提出分子进化理论
分子进化的模式
1、核苷酸替代、插 入/缺失、重组 2、基因复制
基因变异
遗传漂变 自然选择
固定在生物个体 以及物种内
产生新的形态、性状
传递给后代
分子进化的模式
1. DNA突变:替代,插入,缺失,倒位
核苷酸替代:转换 (Transition) & 颠换 (Transversion)
2. 基因复制:多基因家族的产生以及伪基因的产生
基本假设 核酸和蛋白质序列中含有生物进化历史的全部信息
理论 分子进化速率恒定。 分子钟:物种的同源基因之间的差异程度与它们的共同祖先 的存在时间(即两者的分歧时间)有一定的数量关系。
发生在分子层面的进化过程:DNA, RNA和蛋白质分子
引言
分子钟成立的证据:
1、至少某些生物大分子(如珠蛋白)的进化速率在相 当长的地质时间内的相对稳定、均匀;
Inferred pairwise nucleotide substitutions among 17 mammal species from seven gene products, as estimated from protein studies, plotted against date of divergence, as estimated from the fossil record. The line is drawn from the origin through the oldest point (marsupial / placental divergence at 125 MYBP). The strong linear relationship suggests that molecular differences between pairs of species are proportional to the time of their separation, rather than the degree of organismal difference. Therefore, measures of genetic divergence can be used to date the time of divergence for species pairs for which no fossil data are available: genes function as Molecular Clocks. (from A. C. Wilson 1976)
缺失 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TAT TGC TGThr Tyr Cys -
ACC TAC TTT GCT G Thr Tyr Phe Ala
倒位 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TTT ATG CTG Thr Phe Met Leu
3、获得生物大分子一级结构的资料
4、获得有关的代表性进化事件发生的地质时间数据
5、通过比较大分子一级结构,选择合适的数学模型,计算 得到进化产生的分子差异d,通过回归分析等统计方法得到 大分子的进化速率r(t)
6、由此可以推断未知进化事件的发生时间
Example: Molecular clock for 17 mammal species
核苷酸替代:转换 & 颠换
1. 转换:嘌呤被嘌呤 替代,或者嘧啶被嘧 啶替代
2. 颠换:嘌呤被嘧啶 替代,或者嘧啶被嘌 呤替代
(2)基因复制:单个基因复制
重组 逆转录
(2)基因复制:染色体片段复制
狒狒 人
(2)基因复制:基因组复制
S. Cerevisiae (酿酒酵母) K. Waltii (克鲁雄酵母)
A. 单个基因复制 – 重组或者逆转录 B. 染色体片断复制 C. 基因组复制
(1) DNA突变
替代
插入
Thr Tyr Leu Leu
Thr Tyr Leu Leu
ACC TAT TTG CTG
ACC TAT TTG CTG
ACC TCT TTG CTG Thr Ser Leu o_zp@
本章内容
引言 生物进化的分子机制 系统进化树及其构建 分子系统发育分析软件及应用
引言
生物学家:We have a dream…
Tree of Life: 重建所有生物的进化历史并以系统树的形 式加以描述
引言
梦想走进现实:How?