实验生物学讲义

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验四多重序列比对及系统发生树的构建

【实验目的】

1、掌握使用Clustalx进行序列多重比对的操作方法;

2、熟悉构建分子系统发生树的基本过程,掌握使用MEGA软件构建系统发生树的操作方法。

3、进一步熟练BLAST的使用

【实验原理】

在现代分子进化研究中,根据现有生物基因或物种多样性来重建生物的进化史是一个非常重要的问题。一个可靠的系统发生的推断,将揭示出有关生物进化过程的顺序,有助于我们了解生物进化的历史和进化机制。

对于一个完整的进化树分析需要以下几个步骤:

⑴要对所分析的多条目标序列进行比对;

⑵要构建一个进化树(phyligenetic tree)。

构建进化树的算法主要分为两类:基于距离的方法和基于形状的方法。基于距离的方法是指计算序列之间的两两距离,构成距离矩阵,然后采用聚类算法推断进化树。最常见的基于距离的方法是UPGMA(Unweighted pair group method with arithmetic mean,不加权算数平均对群法)与Neighbor-joining(邻接法),前者不如后者准确。基于性状的方法是指把序列中每个位点的状态视为性状,建立进化树模型来描述序列之间的性状差异。最常见的基于性状的方法包括最大简约法,最大似然法以及贝页斯方法。基于距离的方法相对于基于性状的方法,在计算速度上快很多,而且适用于各种类型的数据(如SNP数据,基因表达数据等);基于性状的方法计算速度较慢,搜索空间更大,得到的结果也往往更加准确。在研究中一般都会尝试不同的方法来建立进化树,综合多种方法得到的结果更加可靠。

⑶对进化树进行评估。进化树的构建是一个统计学问题,我们所构建出来的进化树只是对真实的进化关系的评估或者模拟,需要进行统计学检验和评估。现在主要采用的方法是bootstraping,该方法的原理是每次以位点为单位对用于建树的多序列比对进行重新采样,看得到的进化树跟使用原有多序列比对得到的进化树的相似性。简单的说,就是看如果只用多序列比对的部分信息(2/3左右)构建进化树,得到的序列间的关系是否比较稳定。

在实际应用中,多序列比对常用的软件包括ClustalW/X, MUSCLE, MAFFT 等,三者的准确性相当,但计算时间依次减少;进化树构建常用的软件包括PHYLIP(软件包,包括多种建树方法),MEGA,MrBayes,Phyml等等。从用

户友好性和功能上来说,MEGA是目前用得最多的进化树构建和分析软件。本课程将学习如何使用ClustalX和MEGA分别做多序列比对和进化树构建。

【实验内容】

1、使用CLUSTALX软件对已知八条DNA序列(如下)进行多重序列比对;M._mulatta AGCTTTCT GGCGCAACCA TCCTATGAT TGCTCACGGA CTCACCTCTT M._fascicu AAGCTTCTCC GGCGCAACCA CCTATAAT CGCCCGGG CTCACCTCTT

M._sylvanu AAGCTTCTCC GGTGCAACTA TCCTAGT TGCCATGGA CTCACCTCTT Homo_sapie AATTCACC GGCGCAGTCA TTCATAAT CGCCCACGGG CTTACATCCT Gorilla AATTCACC GGCGCAGTTG TTCTTATAAT TGCCCACGGA CTTACATCAT Pongo AATCACC GGCGCAACCA CCCTCATGAT TGCCATGGA CTCACATCCT Saimiri_sc AAGCTTCC GGCGCAATGA TCCTAATAAT CGCTCACGGG TTTACTTCGT Lemur_catt AAGCTTTA GGAGCAACCA TTCTAATAAT CGCACATGGC CTTACATCAT

2、使用MEGA软件构建上述DNA分子系统发生树。

3、从BLAST上获取跟人类基因P53同源的其他物种的5个基因,使用MEGA 得到它们的分子系统发生树

【实验方法】

一、用CLUSTALX软件对已知DNA序列做多序列比对。

操作步骤:

1、使用BioEdit,以FASTA格式准备上述8个DNA序列test.fas文件.

注意:ClustalX软件不支持中文文件名,请不要把文件放在桌面。

2、双击进入CLUSTALX程序,点FILE进入LOAD SEQUENCE,打开test.fas 文件。

3、点ALIGNMENT,在默认alignment parameters下,点击Do complete Alignment 。在新出现的窗口中点击ALIGN进行比对,这时输出两个文件(默认输出文件格式为Clustal格式):比对文件test.aln和向导树文件test.dnd。

4、点FILE进入Save sequence as,在format 框中选fasta格式,设置文件名为test_align.fas,点击OK。

二、用MEGA软件推导进化树。

1、打开MEGA软件,菜单栏处点击“Data”,从“Open a File/Session”打开上面保存的test_align.fas文件

2、菜单栏处点击“Phylogeny”,选择构建进化树的方法“Construct/Test Neighbor-jo ining Tree”,进入参数设置界面;

3、查看需要设置的参数:

1)是否检验进化树的可信度:默认为做bootstrap检验,改为“None”;

2)设置核苷酸替换模型:默认参数;

3)设置位点和进化速率分布模式:默认参数;

4)处理Gap方法:默认参数;

参数设置完成后,点击窗口下面的”Compute”按钮,开始构建进化树。MEGA会显示任务的进度。

4 进化树建好之后,MEGA会默认打开一个新窗口展示该进化树,如下图所示:

5 可以对进化树的展示形式进行改变,如变成星型,交换同一节点中两个分支的位置,对分支进行压缩显示,也可以把该树保存下来在其他软件打开,或者以图形的形式输出。

6 重复上面的第2~5步,在第2步,改变建进化树的方法,看得到的进化树是否有差异;

7 重复上面的第3~5步,在第3步中,分别改变下面的参数,看得到的结果是否有差异:

1)检验进化树的参数改为默认值;

2)核苷酸替换模型改成p-distance;

三、用BLAST与MEGA软件推导人基因P53与其他物种中该基因的进化树

1 通过NCBI上的Gene数据库,查询到P53编码的其中一个蛋白的序列;

相关文档
最新文档