系统发生树详解

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

系统发生树构建的步骤一般有下面几步:

I,对文件10.8\protein sequence 的序列进行多序列比对,一般用clustalx/w软件完成.这里我们用软件BioEdit内置的clustalw来做多序列比对;

II,对clustalw产生的多序列比对文件进行修剪,去掉比对后相似序列中没有对应的序列,前后全部对齐;

III,将修剪后的多序列比对文件转换成系统发生软件所需的文件格式并保存.这里我们是采用mega来做系统发生树的,所以须将修剪后的多序列比对文件转成.meg的文件格式;

IV,用系统发生软件构树(采用多种方法UPGMA,N-J, Maximum likelihood等);

具体做法如下:

①将protein sequence 的序列文件导入到BioEdit中做多序列比对,这里有好几种做法: a,将所有的序列文件全部保存在一个txt文件中,然后用BioEdit打开;(该方法比较麻烦) b,用DNASTAR中的Editseq工具将所有文件打开,然后用File菜单中Export all as one…按钮将所有的单蛋白质序列文件保存成一个多蛋白质序列文件,文件格式为.fasta

c,直接用BioEdit中File>new alignment>import>sequences alignment file(这里需要注意的是在导入序列文件时要将导入文件的类型选为All Files否则BioEdit将默认显示phy, gb, aln等文件而看不到其他文件);(推荐)

导入后如图:

alignment,如下图:

比对后产生文件,其序列如下:

③对clustalw产生的多序列比对文件进行修剪, 去掉比对后相似序列中没有对应的序列,前后全部对齐,可以直接用BioEdit的edit mode来做也可以用mega5>align>edit/build

alignment来做这里采用后者;

format来导出文件,其文件内容如图:

④用mega5建树.File>open a file打开已经转好的文件然后

phylogeny下的不同方法UPGMA, N-J, Maximum likelihood得到各种树

选择您感兴趣的基因,进行多物种的基因组搜索,将获得的序列进行基因序列特征分析,并构建多序列比对和系统发生树,请阐明选择基因的目的、试验步骤和进行结果分析。解:本次作业以人类(homo sapiens)的视黄醇结合蛋白RBP4为例来做.其序列文件如下:

>Homo sapiens retinol binding protein 4, plasma (RBP4), mRNA|gi|55743121|ref|NM_006744.3 CGCCTCCCTCGCTCCACGCGCGCCCGGACTCGGCGGCCAGGCTTGCGCGCGGTTCCCCTCCCGGTGGGCG GATTCCTGGGCAAGATGAAGTGGGTGTGGGCGCTCTTGCTGTTGGCGGCGCTGGGCAGCGGCCGCGCGGA GCGCGACTGCCGAGTGAGCAGCTTCCGAGTCAAGGAGAACTTCGACAAGGCTCGCTTCTCTGGGACCTGG TACGCCATGGCCAAGAAGGACCCCGAGGGCCTCTTTCTGCAGGACAACATCGTCGCGGAGTTCTCCGTGG ACGAGACCGGCCAGATGAGCGCCACAGCCAAGGGCCGAGTCCGTCTTTTGAATAACTGGGACGTGTGCGC AGACATGGTGGGCACCTTCACAGACACCGAGGACCCTGCCAAGTTCAAGATGAAGTACTGGGGCGTAGCC TCCTTTCTCCAGAAAGGAAATGATGACCACTGGATCGTCGACACAGACTACGACACGTATGCCGTGCAGT ACTCCTGCCGCCTCCTGAACCTCGATGGCACCTGTGCTGACAGCTACTCCTTCGTGTTTTCCCGGGACCC CAACGGCCTGCCCCCAGAAGCGCAGAAGATTGTAAGGCAGCGGCAGGAGGAGCTGTGCCTGGCCAGGCAG TACAGGCTGATCGTCCACAACGGTTACTGCGATGGCAGATCAGAAAGAAACCTTTTGTAGCAATATCAAG AATCTAGTTTCATCTGAGAACTTCTGATTAGCTCTCAGTCTTCAGCTCTATTTATCTTAGGAGTTTAATT TGCCCTTCTCTCCCCATCTTCCCTCAGTTCCCATAAAACCTTCATTACACATAAAGATACACGTGGGGGT CAGTGAATCTGCTTGCCTTTCCTGAAAGTTTCTGGGGCTTAAGATTCCAGACTCTGATTCATTAAACTAT AGTCACCCGTGTCCTGTGAAAAAAAAAAAAA

通过Genbank(/blast/)中的Blastn 检测最相似序列或在GenBank 中下载参考序列,选择Nucleotide-nucleotide BLAST (blastn)。将上述序列粘贴到输入框中,如下图:

点击Blast,得到如下结果:

根据序列相似性大小,将相似性最大的序列下载下来,这里选择如下一些序列:

并与原始文件放在一起形成一个文件:

之后的建树的步骤和上面的实验的步骤就大同小异了:

①多序列比对:

比对后产生的多序列比对文件保存为

②比对后序列修剪(掐头去尾):

修剪后的文件

③系统发生树构建:

这里就用n-j法建树:

得到发生树如下:

相关文档
最新文档