构建分子进化树
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三步:进行序列比对,得到结果
第四步:评价比对质量
打开比对结果: 1、可在ClustalX中直接输出打印 2、可用写字板打开aln文件 3、可将aln文件以图形展示,更直观
更改参数、手动编辑,使之具有生物学意义
可进一步对排列好的序列进行修饰(1)
Boxshade 突出相同或相似位点 (http://www.ch.embnet.org/software/BOX_form.html)
hamster PQVAQLELGGGPGADDLQTLALEVAQQKRGIVDQCCTSICSLYQLENYCN
bovine PQVGALELAGGPGAGG-----LEGPPQKRGIVEQCCASVCSLYQLENYCN
guinea pig PQVEQTELGMGLGAGGLQPLALEMALQKRGIVDQCCTGTCTRHQLQSYCN
多序列对位排列
Multiple Sequence Alignment (MSA)
Βιβλιοθήκη Baidu
chicken PLVSS---PLRGEAGVLPFQQEEYEKVKRGIVEQCCHNTCSLYQLENYCN
xenopus ALVSG---PQDNELDGMQLQPQEYQKMKRGIVEQCCHSTCSLFQLESYCN
human
LQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
monkey PQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
dog
LQVRDVELAGAPGEGGLQPLALEGALQKRGIVEQCCTSICSLYQLENYCN
Output
ALN
NBRF/PIR GCG/MSF PHYLIP
NEXUS GDE/FASTA
Clustal W/X算法基础
两两比对 构建距离矩阵
构建指导树 (guide tree)
将距离最近的两条 序列用动态规划的 算法进行比对; “渐进”的加上其 他的序列
Clustal在线分析方法(ClustalW) EBI的ClustalW分析网页
Find out which parts “do the same thing”
为什么要做MSA?
用于描述同源序列之间的亲缘关系的远近,应用到分子进化 分析中。是构建分子进化树的基础。
a Gene tree
b
A Species tree
B
c
C
We often assume that gene trees give us species trees
meta-methods (MAFFT)…
http://www.ebi.ac.uk/Tools/msa/
Current Opinion in Structural Biology 2006, 16:368–373
Clustal使用方法
Clustal:目前应用最广泛的 MSA 方法
可在线分析
为什么要做MSA?
Contig assembly
怎么做MSA?
动态规划算法(dynamic programming):MSA 改进算法(heuristic algorithm):
1. 渐进法(progressive methods):Clustal, T-Coffee, MUSCLE
2. 迭代法(iterative methods):PRRP, DIALIGN 3. 其它算法:Partial Order Algorithm、profile HMM、
Bring the greatest number of similar characters into the same column of the alignment
为什么要做MSA?
用于描述一组序列之间的相似性关系,以便了解一个基因家族 的基本特征,寻找motif,保守区域等。用于预测新序列的二 级和三级结构,进而推测其生物学功能。
http://www.clustal.org/
可在本地计算机运行
序列输入、输出格式
Input
FASTA
NBRF/PIR EMBL/SWISSPROT
ALN GCG/MSF GCG9/RSF
GDE
>sequence 1 ATTGCAGTTCG CA …… >sequence 2 ATAGCACATCG CA…… >sequence 3 ATGCCACTCCG CC……
Using ClustalX for multiple sequence alignment
by Jarno Tuimala
两种工作模式:
Multiple Alignment Profile Alignment
第一步:输入序列
File
Load sequences
3、为便于识别 每条序列,可在 >后输入物种名 称,并用空格和 其它描述内容分 开,如:
在EBI ClustalW结果网页复制序列比对结果
在“Boxshade”网页粘贴序列,在“Input sequence format”栏目选择“ALN”,在“Output format”栏目 选择“RTF_new”
在结果网页点击“here is your output number 1”
修饰过的排列结果
http://www.ebi.ac.uk/Tools/msa/clustalw2/
粘贴或上载序列
调整参数 Alignments
多序列对位排列结果 Result Summary
http://www.ebi.ac.uk/Tools/msa/clustalw/help/
Clustal离线分析方法(ClustalX) 下载安装 自带Help文件
1、序列为多重fasta格式(可进行编 辑,保存为txt文件)
2、序列文件所在路径不能有空格和 中文字符(如放在系统桌面),否则 ClustalX无法载入
>Human gi|301129180|ref|NP_001180303.1| resistin [Homo sapiens]
第二步:设定比对参数
可进一步对排列好的序列进行修饰(2)
ESPript 多种修饰 功能,突出相同或相似位点 http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi