系统发育树的构建练习

合集下载

系统发育树主要的四种构建方法

系统发育树主要的四种构建方法

系统发育树主要的四种构建方法系统发育树(PhylogeneticTree)是生物学中最重要的概念之一,代表着物种的演变和发展关系,因此在基因组学、进化生物学等领域被广泛使用。

系统发育树以树状结构来组织物种之间的关系,这种结构形象地描绘了物种发展演化脉络,以及物种之间的亲缘关系。

通常情况下,系统发育树构建通过收集系统发育记录内容,通过分析物种间的相似性和距离,将这些信息映射到一个空间,以构建一个描述系统发育关系的树状结构。

本文将介绍构建系统发育树的四种主要方法,并结合实例详细说明其原理、优缺点。

第一种方法是基于分支的构建方法。

该方法的原理是从物种之间的共有特性出发,基于一组物种形态上的关系构建树。

该方法对物种之间的亲缘关系比较友好,但是它忽略了物种之间的根源关系,无法从真实的物种演化关系中考虑更多的信息。

以拟南芥(Arabidopsis thaliana)为例,其系统发育树利用了分支的构建方法,以体内的形态特征(如叶片的外形)为基础,把它与附近的物种进行比较,得到了拟南芥系统发育树的结构。

第二种方法是基于遗传标志物的构建方法。

在这种方法中,研究者采集物种的遗传标志物,包括核酸序列和蛋白质序列等,然后从遗传标志物间的相似性出发,计算出物种之间的进化距离,最后构建系统发育树。

此外,通过分析核酸序列的变异情况,也可以得到更准确的系统发育树。

以海岸铃声花(Lobelia cardinalis)为例,在其系统发育树的构建中,研究者采集了它的核酸序列、蛋白质序列,并与附近的物种进行比较,分析其遗传标志物的相似性,从而得到了海岸铃声花系统发育树的结构。

第三种方法是基于表型特征的构建方法。

表型特征是物种形态上可以观察到的特征,而表型比较可以帮助我们更好地分析物种间的进化距离,为物种系统发育树的构建提供依据。

以金星兰(Phalaenopsis amabilis)为例,其系统发育树利用了表型特征的构建方法,以金星兰的叶片形态等特征,与附近的物种进行比较,从而得到了金星兰的系统发育树结构。

系统发育树构建教程(PHYLIP)

系统发育树构建教程(PHYLIP)

系统发育树构建教程(PHYLIP)PHYLIP网址:/phylip.html(一)序列的前期准备1.用ENTREZ或SRS搜索同源DNA/蛋白质序列(same sequence in different organisms) 2.用CLUSTALX进行多条序列比对,在output format option选定PHY格式,构建进化树需要这个phy文件。

Figure 4.1 用clustalx进行多条序列比对3.解压缩phylip-3.68.exe,得到三个文件夹,doc文件夹里是关于所有PHYLIP子程序的使用说明,exe文件夹里是直接可以使用的各个子程序,src文件夹里是所有程序的源文件。

4.打开exe文件夹,双击SEQBOOTt子程序(SEQBOOT是一个利用bootstrap方法产生伪样本的程序),输入刚刚生成的phy文件的路径,点击enter。

5.所有PHYLIP程序默认的输入文件名为infile, 输出文件名为outfile。

如果在exe文件夹里找不到默认的输入文件,会提示can’t find input file “infile”。

Figure 4.2 seqboot程序起始界面6.进入程序参数选择页面(Figure 4.3)。

第一列中的D、J、%、B、R、W、C、S等代表可选的参数。

想改变哪个参数,就键入此参数对应的字母,并点击回车键,对应参数将会发生改变。

当我们设置好所有参数后,(这里我们可以不做任何修改),键入Y,按回车。

此时程序询问“random numbe r seed? <must be odd>”,这是询问生成随机数的种子是多少,输入一个4N+1的数,点击回车程序开始运行,输出结果到文件outfile,保存在当前文件夹里。

.Figure 4.3 seqboot程序参数选择页面主要参数解释:D: 数据类型,有Molecular sequence、discrete morphology、restriction sites和gene frequencies4个选项。

MEGA软件——系统发育树构建方法

MEGA软件——系统发育树构建方法

MEGA软件——系统发育树构建方法(图
文讲解)
一、序列文本的准备
构树之前先将目标基因序列都分别保存为txt文本文件中(或者把所有序列保存在同一个txt文本中,可以用“>基因名称”作为第一行,然后重起一行编辑基因序列),序列只包含序列字母(ATCG或氨基酸简写字母)。

文件名名称可以已经您
的想法随意编辑。

二、序列导入到Mega 5软件
(1)打开Mega 5软件,界面如下
(2)导入需要构建系统发育树的目的序列
OK
选择分析序列类型(如果是DNA序列,点击DNA,如果是蛋白序列,点击Prot
ein)
出现新的对话框,创建新的数据文件
选择序列类型
导入序列
导入序列成功。

(3)序列比对分析
点击工具栏中“W”工具,进行比对分析,比对结束后删除两端不能够完全对齐
碱基
(4)系统发育分析
关闭窗口,选择保存文件路径,自定义文件名称
三、系统发育树构建
根据不同分析目的,选择相应的分析算法,本例子以N—J算法为例
Bootstrap 选择1000,点击Compute,开始计算
计算完毕后,生成系统发育树。

文档
根据不同目的,导出分析结果,进行简单的修饰,保存。

手把手教你构建系统进化树

手把手教你构建系统进化树

9、要学生做的事,教职员躬亲共做; 要学生 学的知 识,教 职员躬 亲共学 ;要学 生守的 规则, 教职员 躬亲共 守。2021/6/292021/6/29Tuesday, June 29, 2021
10、阅读一切好书如同和过去最杰出 的人谈 话。2021/6/292021/6/292021/6/296/29/2021 8:10:36 AM
以外米缀蛾的cds为例,点击cdsTA格式,如何保 存见下图
一般情况下点
击该页的右上 角有send 图标, 选择后点击 create file 即 可下载。Txt可 以打开。
该图显示的是
序列全长的 FASTA格式下 载。
因为我采取基于氨
17、儿童是中心,教育的措施便围绕 他们而 组织起 来。2021/6/292021/6/292021/6/292021/6/29
2、Our destiny offers not only the cup of despair, but the chalice of opportunity. (Richard Nixon, American President )命运给予我们的不是失望之酒,而是机会之杯。二〇二一年六月十七日2021年6月17日星期四 3、Patience is bitter, but its fruit is sweet. (Jean Jacques Rousseau , French thinker)忍耐是痛苦的,但它的果实是甜蜜的。10:516.17.202110:516.17.202110:5110:51:196.17.202110:516.17.2021 4、All that you do, do with your might; things done by halves are never done right. ----R.H. Stoddard, American poet做一切事都应尽力而为,半途而废永远不行6.17.20216.17.202110:5110:5110:51:1910:51:19 5、You have to believe in yourself. That's the secret of success. ----Charles Chaplin人必须相信自己,这是成功的秘诀。-Thursday, June 17, 2021June 21Thursday, June 17, 20216/17/2021

Raxml软件构建多基因系统发育树教程

Raxml软件构建多基因系统发育树教程

Raxml软件构建单基因系统发育树教程前言:以真菌ITS序列为例。

大家应该都知道基因库中多数ITS序列一般都包含了ITS两端的外围序列,即ITS1前端的部分18S序列和ITS2后端的部分28S序列。

而在建树的过程中我们通常是采用ITS1+5.8S+ITS2进行建树。

如果我们直接采用下载的序列进行alignment,而不进行两端剪齐(切去ITS1前端的部分18S序列和ITS2后端的部分28S序列)的话,那么我们构建出的基因树虽然结果上与标准构建结果相似但终究不是科学严谨的树。

因为从基因库中下载的基因序列会有长短不一的现象,如果直接用来建树的话会有些不妥。

所以小编建议大家使用MEGA或其他alignment软件进行序列比对,然后将两端切齐,再保存成fasta格式的文件,即可载入RaxmlGUI2.0进行建树。

或许会有人怀疑该建树软件的可行性,也许会想它是否为流氓软件?该软件建出来的系统树能否用于文章发表?编辑和审稿人是否接受?为了消除大家的顾虑,接下来小编给大家证明一下该软件的科学性和可行性:参见下图SCI文章。

消除疑虑后,小编将教大家如何基于ML法构建多基因系统发育树。

该建树教程:以五个基因ITS_GAPDH_CHS1_ACT_TUB2为例。

正如开始所述,大家需谨记先将每种基因的fasta文件进行alignment,然后后再两端切齐,再保存成fasta格式用于载入建树软件!注:载入RaxmlGUI2.0软件中的alignment文件中每个物种序列顺序可以随意调换。

因是多基因建树需要将同一个菌株的五种基因拼接一起,所以同一个菌株的不同基因序列标签名要一致,这样软件才能识别出是同一个菌株的不同基因。

(当然也可以将每个菌株的基因标签一一对应,如ITS序列文件是菌株1,2,3.....; TUB2序列文件也是菌株1,2,3.....按顺序对应好。

)1.将准备好的fasta格式的alignment文件载RaxmlGUI2.0。

构建系统发育树的方法

构建系统发育树的方法

构建系统发育树的方法
构建系统发育树的方法
一、定义
系统发育树(Phylogenetic Tree)又称为系统种群学树,是一
种描述物种演化的树型结构,从根节点开始描述物种主要进化分支结构,树上的每条边则表示两个物种在进化的历史中距离彼此更近或来自同一进化祖先的关系。

二、建立系统发育树的方法
1.收集数据:系统发育树的建立首先要收集数据,作为建立树的基础,这些数据一般是利用各种实验技术来收集,比如遗传学实验和物种形态的实验。

2.选取特征:从收集的大量数据中,应选取尽可能多的可靠特征,作为建立树的材料,这些特征要有规律性,有可靠性,可以容易发现物种之间的内在关系,有利于在研究中可靠地比较各物种之间的相似程度。

3.分类比较:将所有待比较的物种或实体按照类似的特征进行分类,根据同一物种种的特征之间的差异,可以比较出物种之间的相似度,确定出有利于建立树的特征。

4.描绘树枝:根据比较的结果,可以依次将物种分类编码,从根节点开始,逐级分细枝条,最后得出系统发育树的图形结构。

5.校正树枝:检查系统发育树的构建结果,如果发现有一些物种不太符合物种演化过程的规律,可以根据其他数据和结果来校正树枝,
从而得出最终的发育树结构。

MEGA5构建系统发育树

MEGA5构建系统发育树

实验原理
• 系统发生树(英文:Phylogenetic tree)又 称为演化树(evolutionary tree),是表明 被认为具有共同祖先的各物种间演化关系 的树。是一种亲缘分支分类方法。 (cladogram)。在树中,每个节点代表其 各分支的最近共同祖先,而节点间的线段 长度对应演化距离(如估计的演化时间)。
MEGA5可以识别 fasta格式文件 将
17-RNASE1.fasta.txt
重命名为
17-RNASE1.fasta
•选择打开方式为MEGA5,打开17-RNASE1.fasta,自动跳 出序列窗口 •用ClustalW做多序联配
ClustalW参数设置
多序列联配后结果
以.meg格式保 存结果
mega5可以识别fasta格式文件17rnase1fastatxt重命名为17rnase1fasta?选择打开方式为mega5打开17rnase1fasta自动跳出序列窗口?用clustalw做多序列联配clustalw参数设置多序列联配后结果以
实验五 进化树分析
实验目的 1.理解系统发育分析的基本原理 2.学会使用MEGA5.1软件包构建系统发育树。
回到MEGA主窗口 打开所保存的文件(.meg)
点击按钮打开文件窗口
显示保守位点 显示变异位点
回到MEGA主窗口构建进化树
选择邻接法建树
当前打开的文件
选择Bootstrap 检验
作业
1.使用MEGA5.05软件包构建蛋白质进化树的 具体使用顺序,并写出具体步骤。 2.以下面的序列为材料构建系统进化树,并将 进化树抓图。 附序列:花生SAMDC蛋白质进化树分析,见 SAMDC ms.txt文档。

叶绿体基因组系统发育树的构建

叶绿体基因组系统发育树的构建

叶绿体基因组系统发育树的构建
叶绿体基因组是一种常用的分子标记,可用于构建植物的系统发育树。

构建叶绿体基因组系统发育树的步骤如下:
1. 叶绿体基因组测序:首先进行叶绿体基因组的测序,获取叶绿体基因组的完整序列信息。

2. 叶绿体基因组序列比对:将测得的叶绿体基因组序列与已知的参考序列进行比对,找出相似的序列区域。

3. 序列选择:根据不同研究目的和物种特点,选择一些适当的叶绿体基因组序列作为研究对象。

一般选择高度保守的基因,如rbcl、matK等。

4. 序列比对:将选定的叶绿体基因组序列进行多序列比对,找出序列间的相似性和差异性。

5. 构建系统发育树:利用多序列比对结果,采用系统发育学分析的方法,如最大似然法、最小进化法等,构建叶绿体基因组的系统发育树。

6. 树的评估和解读:对构建的系统发育树进行评估,包括支持值(bootstrap值)和相似度等。

根据系统发育树的拓扑结构和分支长度,解读物种间的亲缘关系和进化历史。

需要注意的是,叶绿体基因组系统发育树的构建是一种较为复杂和精细的分析过程,需要较高的数据分析能力和专业知识。

同时,样本选择、序列比对和系统发育分析方法的选择也会对结果产生一定影响,因此需要进行合理的设计和操作。

实习八系统发育树构建2

实习八系统发育树构建2

实习八系统发育树构建:MEGA西北农林科技大学生物信息学中心2014.11实习目的:1. 了解MEGA可以实现的主要进化分析2. 学会使用MEGA进行多序列比对、确定最优模型并构建系统发育树实习内容:MEGA(Molecular Evolutionary Genetics Analysis)是一个运用广泛的进化分析综合软件,1993年首次发布,新版本的MEGA6推出一年多以来,就已经被引用超过700次,MEGA5(2011年)的引用至今有近16700次,MEGA4(2007年)引用近23900次。

软件的主要功能包括序列比对、确定最优替换模型、构建系统发育树、计算进化距离、估计分子进化速率、估计分化时间、推算祖先序列、计算选择压、在线搜索,系统发育树编辑等。

适用不同操作系统的软件可以通过/index.php下载,按照默认设置轻松安装。

本次实习我们用未经比对的一组序列学习使用MEGA构建系统发育树。

尽管有大量的进化分析软件可供选择,但进化分析的一个核心观念是:决定分析结果好坏的不是软件或分析方法的选择,而是所分析序列的质量:序列的插入缺失,序列的有信息位点的多少等。

举例来说,并不是相似度越高的序列越好,相反,相似度高的序列具有的反映序列差异的信息位点较少,而可能不利于准确地判断两两序列间的关系。

1.1 序列格式MEGA能识别多种序列格式(Figure 1),可以在类似文本编辑器的窗口编辑并转换序列格式。

由于MEGA有内嵌的序列比对功能,因此最常用的格式为FASTA,如果是比对后的序列,可以是FASTA 或PHYLIP。

MEGA在进行分析时需要使用自己的文件格式MEG(.meg)和MAS(.mas),其他格式的数据MEGA会提示转换。

其中MEG格式为ASCII编码,可以通过文本编辑器查看(Figure 2),而MAS是二进制数据,文本编辑器不能查看。

此外MEGA还可以查看和编辑Newick(.nwk)格式的树形文件,软件自己的树形文件格式为MTS(.mts)。

系统进化树的构建

系统进化树的构建
用一种类似树状分支的图形来概括各种生物之间的亲缘关系。
• 系统进化树的主要构成:
结点(node):每个结点表示一个分类单元(属、种群)。 进化分枝(Clade): 是指由同一生物进化而来的单一系统群。 实体抽象为节点,实体间的进化关系抽象为连接
分子系统发育的核心为构建系统发育进化树
系统进化树(1)

进化支
结点
猩 猩

一个单位
分支 长度
狒 狒
距离标尺
外 群
系统发育进化树示例
系统发育树重建分析步骤
多序列比对(自动比对,手工校正)
选择建树方法
建立进化树
进化树评估
系统发育树重建的基本方法
• 1. 距离法 (distance)
适用序列有较高相似性时
• 2. 最大简约法 (maximum parsimony, MP)
菜单栏
工具条
•实例讲解
选择File标签-->Convert file format to Mega.
当给出相应的文件路径之后点击ok
显示文件已经转化为MEGA Format, 点击OK. 将文件保存,牢记路径
•实例讲解
点击,载入MEGA格式的分析序列
•实例讲解
选择数据类型,在本次测试中我们 用的是核苷酸序列。
• • • • • • • • • ClustalX (序列比对软件) Modeltest&MrModeltest(碱基替换模型筛选软件) PHYLIP MEGA PHYML 系统发育树构建软件 PAUP BEAST Figtree (树形显示软件) TreLIP或者MEGA • 构建MP树,可以使用PHYLIP或者MEGA • 构建ML树可以使用PHYML,速度快,同时构建ML树还可以用 PHYLIP,

使用贝叶斯方法构建系统发育树—MrBayes

使用贝叶斯方法构建系统发育树—MrBayes

使用贝叶斯方法构建系统发育树—MrBayesmrBayes需要的比对文件格式为:nex,可以在比对是选择输出此种文件格式mtBayes可以在命令提示符里面运行在CMD里面输入mrBayes,出现如下界面在界面内输入 exe file(或者execute file,其中file为序列文件名),得到如下界面如果没有错误,则说明数据文件格式是正确的。

设置替换模型参数可以使用help lset查看lset设置的参数Nucmodel: 指的是核酸的类型。

4by4指的是不区分序列上的位点。

而codon指的是使用密码子模型。

这时序列上每个位点的替换速率会根据密码子模型来推断。

Doublet通常用于具有协同进化效应的序列。

一般情况下可以使用4by4,如果是编码序列的话,最好使用codonNst:核酸替换模型。

1 是JC69模型,即单参数模型。

2为F81模型。

6为GTR模型。

在mrBayes中,可以尝试分别使用三个模型运行,以选择最优的结果。

Code: 指的是密码子编码的规律。

Universal指的是通用密码子使用规律。

如果是推测线粒体内的基因,需要使用Metmt,叶绿体则需要使用MycoplasmaPloidy: 物种是单倍体还是二倍体。

Rates:指定序列上每个位点的替换速率。

Equal表示替换速率都是一致的。

Gamma表示用gamma来确定序列上的替换速率。

Ngammacat:配合上面的参数,如果替换速率设置为Gamma、Invgamma、Adgamma,则需要设置此选项。

Nbetacat:同上。

使用lset Nst=6 Rate=gamma类似命令设置参数。

设置模型的相关先验信息使用help prset查看相关参数及其说明一般情况下,需要关注的参数有:Tratiopr:指定转换和颠换的比例。

可以使用fixed指定,也可以使用beta分布来模拟产生。

Revmatpr:指定GTR模型里面替换速率的先验分布。

Aamodelpr:指定氨基酸替换模型中参数的先验分布。

第四章第二节、构建系统发育树实例

第四章第二节、构建系统发育树实例

拉丁学名
Ardea cinerea Egretta garzetta Nycticorax nycticorax Ixobrychus cinnamomeus Botaurus stellaris Nipponia nippon Platalea leucorodi Platalea alba Ciconia ciconia Ciconia boyciana Ciconia nigra Balaeniceps rex Scopus umbretta Gallus gallus
序列检索号
AF407136 AF407135 AF407145 AF407143 AF407139 AY465752 AY465753 AF339359 NC_002197 NC_002196 AF173571 AF173569 AF339360 X52392
鹭科
鹮(huán)科
鹳科 鲸头鹳科 锤头鹳科 雉(zhì)科
第二节、构建系统发育树实例
基于12SrRNA基因序列的 鹳形目鸟类系统发育分析
鹳形目鸟类为大中型涉禽,包括鹳科、鹮 科、鹭科、鲸头鹳科和锤头鹳科5个科,其 中腿长、颈长且喜好在浅水或开阔地觅食 是鹳形目鸟类共有的形态和生态学特征, 但除此之外各科间的共同特征却很少。长 期以来通过形态和生态学的研究对鹳形目 进行系统学分析时并未能取得一致认识。
1.数据获取 原始数据的采集方法:所涉及的13种鹳形目鸟类及 外类群原鸡的12SrRNA基因序列均直接取自 GenBank. 将下表所有序列以FASTA格式存储在本地机上,并 把所有的FASTA格式的序列粘贴到同一个文件中, 文件名为gene.txt

中文名
苍鹭 白鹭 夜鹭 栗苇鳽(jiān) 大麻鳽 朱鹮 白琵鹭 非洲琵鹭 白鹳 东方白鹳 பைடு நூலகம்鹳 鲸头鹳 锤头鹳 原鸡

三种方法构建系统发育树学习笔记

三种方法构建系统发育树学习笔记

三种方法构建系统发育树学习笔记所用数据为一个属内不同种不同群体的叶绿体基因组序列,数量为80条。

发现用全长序列建树的时候,不适合选用太多外类群,否则ML法中会导致属内分枝的枝长特别短。

原因应该是基因间隔区和内含子区域序列位点的差异较大。

枝长含义NJ:表示遗传距离;MP:性状状态变换的替换数;ML/BI:该分枝上的相对进化数量(遗传变异量);每个位点上的替换数(一般以每位点多少次核苷酸替换或氨基酸取代来表示)。

遗传距离大多数情况以序列来说遗传距离就是两个OTU(个体、群体、物种或基因家族)之间序列的差异值。

序列比对多序列比对用mafft得到的结果较为准确,muscle比对的速度较快。

多序列比对的绝大多数算法都是基于渐进比对的概念。

简单来说就是先从两个序列的比对开始,逐渐添加新序列,直到所有的序列都加入为止。

但是不同的添加顺序会产生不同的比对结果。

所以由最相似的两个序列开始比对,由近到远逐步完成最为可靠。

mafft --thread 15 --auto 80-AcoeOut.fasta > 80-AcoeOut_aln.fasta##比对时如果不清楚什么参数合适,加个参数--auto,软件可以自动帮你处理挑选保守位点进行下一步建树序列比对完后,用于建树的序列位点必须保证具有良好的同源性。

所以需要删除序列分歧很大的区域和gap区域。

我用的软件为Gblocks,主要目的是把有gap的位点全部去除,参数为-b5=n,其余的选项有-b5=h,h表示half 指去除在大于50%的序列中出现gap的位点。

Gblocks 80-AcoeOut_aln.fasta -t=d -b5=n最大简约法(软件PAUP)最大简约法的树长指所有性状在一棵树上的进化改变总数。

计算得到的结果可能会有许多树长相等的简约树,此时需要计算它们的一致树。

分为strict consensus和semistrict consensus等,strict表示100%,在所有简约树中都出现的分枝,才会出现在一致树中,否则为梳子。

图文详解MEGA5构建系统发育树

图文详解MEGA5构建系统发育树

图文详解MEGA 5构建系统发育树(2013-10-11 20:52:49)如遇不妥,请指正。

软件下载:MEGA 5 ; DNAMAN 71 •准备序列文件准备fasta格式序列文件(fasta格式:大于号> 后紧跟序列名,换行后是序列。

举例如下)。

每条序列可以单独为一个文件,也可以把所有序列放在同一文件内。

核酸序列:>sequence1_nameCCTGGCTCAGGATGAACGCT氨基酸序列:>sequence2_nameMQSPINSFKKALAEGRTQIGF2 .多序列比对打开MEGA 5,点击Align,选择Edit/Build Alignment ,选择Create a new alignment ,点击OK。

MEGA 5,05File Analysis HelpOpen Saved Alignment Session,..玄Show Web Browser& Query DstabankEDo BLAST SearchSelect an Option -■ * Create a new dig nment( Open a saved alignment sessiDn「Retrieve sequencer from a file4 OK X Parcel这时需要选择序列类型,核酸(DNA )或氨基酸(Protein )选择之后,在弹出的窗口中直接 Ctrl + V 粘贴序列(如果所有序列在同一 个文件中,即可全选序列,复制)。

也可以:点击 Edit ,选择Insert Seque nee From File ,选择序列文件(可多选)。

TA■I 鼻■ •DataModefcAl 卯Edrt/View £equ>ercer Ries (Tracc)^Edrt/Build AlignmentDistancM5: Aligrrnnent Editor© S3(为选中状态)。

系统发育树构建方法及其应用

系统发育树构建方法及其应用

系统发育树构建方法及其应用简介:系统发育树(Phylogenetic tree)是生物学中常用的工具,用于表示不同物种之间的进化关系。

构建一个准确的系统发育树对于研究生物进化历史、分类和演化过程有着重要的意义。

本文将介绍系统发育树的构建方法以及其在生物学研究中的应用。

一、系统发育树构建方法1. 分子系统发育树构建方法分子系统发育树是通过比较不同物种基因或蛋白质序列的差异性来构建的。

常用的分子系统发育树构建方法包括:(1) 距离法(Distance-based methods):通过计算不同物种之间的序列相似性距离来构建系统发育树。

这种方法基于假设,认为进化关系越近,序列之间的相似性越高。

(2) 个体基因树法(Gene tree methods):通过基因序列的比对和进化关系的推断来构建系统发育树。

这种方法通常被用于研究基因家族在不同物种之间的进化关系。

(3) 群体基因树法(Coalescent-based methods):通过比较人口遗传学和种族学数据来构建系统发育树。

这种方法可以帮助我们理解不同群体之间的种群历史和迁移模式。

2. 形态系统发育树构建方法形态系统发育树是通过比较不同物种形态特征的异同来构建的。

常用的形态系统发育树构建方法包括:(1) 分离法(Cladistic methods):通过对比物种形态特征的共性和差异性来构建系统发育树。

这种方法基于假设,认为进化趋势是分支与分化的结果。

(2) 综合法(Integrated methods):结合形态特征和分子遗传学数据,综合分析不同物种间的形态和分子演化关系。

二、系统发育树的应用1. 生物分类学系统发育树为生物分类学提供了关键的工具。

通过构建系统发育树,我们可以清晰地了解不同物种之间的亲缘关系,进而对它们进行分类和命名。

2. 进化历史研究系统发育树可以帮助研究者重建物种的进化历史,并揭示不同物种之间的共同祖先及其衍生物的关系。

这有助于我们理解生物进化的模式和过程。

基于基因组数据构建系统发育树方法

基于基因组数据构建系统发育树方法

基于基因组数据构建系统发育树方法我折腾了好久基于基因组数据构建系统发育树这事儿,总算找到点门道。

最开始的时候我真的是瞎摸索。

我知道构建系统发育树,基因组数据是关键的原材料,就像盖房子的砖头一样重要。

我首先就收集各种基因组数据。

哎呀,这可不容易,有些数据来源乱七八糟的,格式也不统一,就像从不同的菜市场买回来各种形状的菜,还得把它们整理成一样的规格。

然后我就试着用最基础的距离法来构建。

距离法嘛,简单来说就像是看谁和谁长得不像。

我把各个基因序列之间的差异当成距离,就好比算人和人之间的身高差一样。

但是这个时候就出问题了,有时候数据里有点小错误,或者数据量太大,计算出来的结果就特别奇怪,就像本来想计算相对距离却不小心把单位搞错了。

后来我又了解到最大简约法。

这个方法可有点烧脑。

我就想象我在走迷宫,要找从起点到终点最简洁的路径,也就是找最能解释数据的进化关系,没有那些多余拐弯的路线。

可是我在处理一些复杂基因组数据的时候发现,这个方法对缺失数据很敏感。

我之前没太注意这个,结果得出来的树就有点歪七扭八的,根本不靠谱。

还好最后我掌握了最大似然法。

这就像是一个猜数字的游戏,我们知道一些数字的大致范围和特征,然后去猜最有可能是哪个数字。

我们根据一定的模型,来计算在这个模型下,观察到现有的基因组数据最有可能的系统发育关系。

当然这个模型很重要,就像温度计一样,得选对合适的,选错了就不准了。

我得给大家提个醒,如果是基因组数据量特别大,计算能力可能就跟不上。

我之前就遇到这个问题,电脑一直在那嗡嗡响,计算半天没个结果。

这个时候可以考虑找个云计算平台或者优化数据,就像一个大厨一次炒很多菜忙不过来就可以叫几个帮手或者分成几堆炒。

还有啊,数据的质量一定要保证。

之前我的数据里面杂有一些错误标记的基因,这就像做菜用了坏的食材,肯定影响最后的成品。

所以每次对数据都要进行认真的筛选、清洗,就像洗菜一样,要把烂叶子都摘掉。

我不确定我现在掌握的是不是最完美的,但是就目前来说,这些经验真是我一步步摸索出来的,希望对大家有帮助。

课件:用实例演示最大简约法构建系统发生树

课件:用实例演示最大简约法构建系统发生树
用实例演示最大简约法构建系 统发生树
生技第五组 蔡苑颖 陈晓兰 陈观芝 张满桥 张
明红 陆丽平
系统进化树:用来表示被认为具有共同祖先
的各物种间演化关系的树。是一种亲缘分支 分类方法。在树中,每个节点代表其各分支 的最近共同祖先,而节点间的线段长度对应 演化距离(如估计的演化时间等)
最大简约法:根据信息位点提供的个序列间 的替换情况,在所有可能的树中找出替换数 最小的树的方法。
① 多序列比对
d1:A A C d2:A A T d3:G G C d4:G G T
② 写出所有可能的树,有三种
d1
d3
树1
d2
d4
d1
d2
பைடு நூலகம்树2
d3
d4
d1
d2
树3
d4
d3
③ 分析信息位点,由可看出3列核苷酸序列都有差异,所以都是信息 位点
第一列各碱基在3种进化树的替换情况如下:P246
d1 A
d3 G
树1
A
G
d2 A
d4 G
d1 A
树2
G
d3 G
d2 A G
d4 G
d1 A
树3
G
d4 G
d2 A G
d3 G
第2列与第1列情况一样 第3列各碱基在3种进化树中的替换情况如下:P247
d1 C
树1
T
d2 T
d3 C T
d4 T
d1 C
树2
C
d3 C
d2 T T
d4 T
d1 C
树3
T
d4 T
d2 T T
信息位点:指能把所有可能的树区别出来的 位点,即核苷酸序列存在差异的点
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

通过16s rDNA 研究认识青鳉属内部物种的系统发育关系前言青鳉分布在东亚及东南亚,包括中国大陆、日本、韩国、越南、缅甸、泰国、老挝、柬埔寨、台湾的淡水水域。

本鱼每日产卵、胚胎透明、世代时间短、基因组小并已建立转基因技术[1]。

这些作为实验动物的优势在近缘物种中都有体现,为比较方法提供了理想的条件。

虽然青鳉已经引起生物学家的研究兴趣,并有青鳉的渗透调节[2]、免疫[3]和性选择[4]等不同领域研究报道,但是不同青鳉物种间系统发育关系仍有很多未解之谜[5]。

由于不同种的真细菌与古细菌间的16S rRNA基因(16S rDNA)是高度保守的[6],16S rDNA常被用于对各种生物进行的系统发生学方面的研究[7]这种运用16S rRNA 对生物进行系统发生学研究的方法由卡尔·沃斯(Carl Woese)开创[8]。

故通过16s rDNA研究认识辐鳍亚纲(Actinopterygii)颌针鱼目(Beloniformes)异鳉科(Adrianichthyidae)青鳉属(Oryzias)内部11个物种的系统发育关系。

方法从NCBI(https:///)下载已经报道的青鳉属和花鳉科相关类群的16S rRNA基因序列,所选用的物种信息见表1。

表1 本研究所选青鳉属和花鳉科物种序列和地理分布Table 1 Sequences and geographic distributions of the Oryzias and Poeciliidae species used in this study 物种序列编号序列长度/bp 采集点Species Sequence number length/bp Collection site深青鳉Oryzias profundicola AB188740.1 470 Indonesia:Sulawesi, Timampu, Lake Towuti 湄公河青鳉Oryzias mekongensis AB188736.1 475 Thailand:Nakhon Phanom印尼青鳉Oryzias matanensis AB188734.1 470 Indonesia:Sulawesi, Soroako, Lake Matano 吕宋青鳉Oryzias luzonensis AB188732.1 471 Philippines:Ilocos Norte, Solsona青鳉Oryzias latipes AB188731.1 471 China:Kunming爪哇青鳉Oryzias javanicus AB188725.1 470 Indonesia恒河青鳉Oryzias dancena AB188722.1 471 Thailand:Phuket弓背青鳉Oryzias curvinotus AB188720.1 471 Viet Nam:Caudien near Hanoi西里伯斯青鳉Oryzias celebensis AB188718.1 470 Indonesia:Sulawesi, Ujung Pandang苏拉威西青鳉Oryzias sarasinorum AB188742.1 470 Indonesia:Sulawesi, Lake Lindu花斑青鳉Oryzias marmoratus AB188733.1 470 Indonesia:Sulawesi, Timampu, Lake Towuti 剑尾鱼Xiphophorus helleri U80047.1 448孔雀鱼Poecilia reticulata U80051.1 4481.实验对象选择选择辐鳍亚纲,鳉形目,青鳉属的11个物种作为进行谱系进化比较的目标物种。

2.外群选择同时选取同样为辐鳍亚纲的鳉形目(Cyprinodontiformes)花鳉科(Poeciliidae)作为2个外源物种进行比较。

3.分析对象选择综合提取DNA的难度和稳定性,选择16S rDNA作为分析对象。

4.样品采集由于目标生物种类较少,故每个种选取5个个体进行采集,样本主要是背部肌肉。

均采自野外。

5.分子实验选取相应的试剂盒进行16S rDNA的提取,设计引物进行PCR扩增,之后将PCR 原液送往测序公司进行测序。

本研究采用双向测序,最终序列由正反向两条序列拼接而成。

6.数据分析首先对原始数据进行序列质量、序列长度和序列分布情况的统计。

进行数据预处理后,对高质量序列进行有效序列统计并做物种分类。

7.系统进化分析贝叶斯法建树(BEAST):使用贝叶斯法(Bayesian method)构建系统进化树。

由于贝叶斯法对替换模型很敏感,所以先使用软件jModelTest并根据分析结果选择HKY作为替换模型。

使用软件BEAUti和BEAST进行系统发育分析,Site Heterogeneity Model选择None,即假定物种的进化保持相同的速率。

使用软件TreeAnnotator寻找最大可信树(Maximum clade credibility tree),老化(burn-in)数据设定为1000,即运行的马尔可夫链最初的1000世代。

结果本研究所构建的系统发育树见图1。

图1 使用16s rRNA基因对11种青鳉属和2种花鳉科物种构建的系统发育树Figure 1 Phylogenetic tree of 11 Oryzias and 2 Poeciliidae species by 16s rDNA根据采集序列样本的地理位置以构建的系统发育树为模型建立样本地图见图2.图2 展示图1系统发育树分支的样本地图:花斑青鳉(蓝),深青鳉(蓝),印尼青鳉(蓝),苏拉威西青鳉(蓝),西里伯斯青鳉(蓝),恒河青鳉(粉),爪哇青鳉(粉),弓背青鳉(黄),吕宋青鳉(黄),青鳉(黄),湄公河青鳉(黄)。

Figure 2. Sample map showing lineage of phylogenetic tree in figure 1: Oryzias marmoratus(blue), Oryzias profundicola(blue), Oryzias matanensis(blue), Oryzias sarasinorum(blue), Oryziascelebensis(blue), Oryzias dancena(pink),Oryzias javanicus(pink), Oryzias curvinotus(yellow), Oryzias luzonensis(yellow), Oryzias latipes(yellow), Oryzias mekongensis(yellow).讨论通过匹配最优的核苷酸替代模型,选择剑尾鱼和孔雀鱼为外群确定进化树的根,最终获得进化树上青鳉属的各个单系群。

本研究样本主要从东亚及东南亚地区采集,通过构建图2样本地图进一步验证了图1系统发育树的结果可靠性。

并且可以获知东亚大陆地区和东南亚群岛上的青鳉物种基本上可以认为是起源于同一祖先的两个姐妹群;隔海相望的越南地区的弓背青鳉和菲律宾的吕宋青鳉亲缘关系较近;印度尼西亚中部苏拉威西岛上的五种青鳉的亲缘关系亲疏与地理分布距离密切相关。

参考文献[1] Medakafish as a model system for vertebrate developmental genetics. BioEssays 22, 487–495. Ishikawa, Y., 2000、[2] Asian medaka fishes offer new models for studying mechanisms of seawater adaptation.Inoue, K., Takei, Y., 2003. Biochem.Physiol. B 136, 635–645.[3] The development of cellular immune defence in marine medaka Oryzias melastigma. Seemann, F ; Peterson, DR ; Chiang, MWL; Au, DWT. Comparative Biochemistry and Physiology Part C: Toxicology & Pharmacology V olume 199, September 2017, Pages 81-89[4] Co-option of Sox3 as the male-determining factor on the Y chromosome in the fish Oyrzias dancena. Yusuke Takehana, Masaru Matsuda, Taijun Myosho, Maximiliano L. Suster, Koichi Kawakami, Tadasu Shin-I, Yuji Kohara, Yoko Kuroki, Atsushi Toyoda, Asao Fujiyama, Satoshi Hamaguchi, Mitsuru Sakaizumi & Kiyoshi Naruse. Nature Communications 5, Article number: 4157 (2014)、[5]Molecular phylogeny of the medaka fishes genus Oryzias (Beloniformes: Adrianichthyidae) based on nuclear and mitochondrial DNA sequences. Yusuke Takehana a,*, Kiyoshi Naruse b , Mitsuru Sakaizumi .Molecular Phylogenetics and Evolution 36 (2005) 417–428、[6]Coenye T, Vandamme P.在已测序细菌基因组中的多种16S rRNA操纵子的基因内接合的不均一性. FEMS Microbiol. Lett. November 2003, 228 (1): 45–9. PMID 14612235. doi:10.1016/S0378-1097(03)00717-1、[7]系统发育学研究中对16S rDNA扩增的运用W G Weisburg, S M Barns, D A Pelletier and D J Lane; J Bacteriol. 1991 January; 173(2): 697-703、[8] Woese, C. R.; G. E. Fox. Phylogenetic structure of the prokaryotic domain: The primary kingdoms. Proceedings of the National Academy of Sciences. 1977-11-01, 74 (11): 5088–5090. Bibcode:1977PNAS...74.5088W. ISSN 0027-8424. PMC 432104. PMID 270744. doi:10.1073/pnas.74.11.5088、。

相关文档
最新文档