比较基因组学与分子进化

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

根据引导树,渐进比对多个序列。
2021/3/7
45
Clustal的应用
1.输入输出格式。
输入序列的格式比较灵活,可以是前面介绍过的 FASTA格式,还可以是PIR、SWISS-PROT、GDE、 Clustal、GCG/MSF、RSF等格式。
输出格式也可以选择,有ALN、GCG、PHYLIP和 NEXUS等,用户可以根据自己的需要选择合适的 输出格式。
简单分子构架研究工具
蛋白家族的隐马模型库
网址
http://www.blocks.fhcrc.org http://www.ncbi.nlm.nih.giv/Structure/cdd/ cdd.shtml http://www.ebi.ac.uk/interpro/index.html
http://pir.georgetown.edu/iproclass http://metafam.ahc.umn.edu/
2021/3/7
46
Clustal的应用
2.两种工作模式。 a.多序列比对模式。 b.剖面(profile)比对模式。
3.一个实际的例子。
2021/3/7
47
多序列比对实例
输入文件的格式(fasta):
>KCC2_YEAST NYIFGRTLGAGSFGVVRQARKLSTN…… >DMK_HUMAN DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK……. >KPRO_MAIZE TRKFKVELGRGESGTVYKGVLEDDRHVAVKKLEN…… >DAF1_CAEEL QIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD…… >1CSN HYKVGRRIGEGSFGVIFEGTNLLNN……
2021/3/7
36
Clustal W/X
•ClustaW/X is a general purpose multiple alignment program for DNA or proteins.
•ClustalW/X is produced by Julie D. Thompson, Toby Gibson of European Molecular Biology Laboratory, Germany and Desmond Higgins of European Bioinformatics Institute, Cambridge, UK. Algorithmic
20
2021/3/7
21
2021/3/7
22
2021/3/7
23
2021/3/7
24
2021/3/7
25
2021/3/7
26
多序列比对数据库
数据库名称
BLOCKS CDD
Interpro
iProClass database MetaFAM
Pfam PRINTS
ProDom
PROSITE SMART TIGRFAMs
序列同源性分析:
是将待研究序列加入到一组与之同源,但来自不同物种 的序列中进行多序列同时比较,以确定该序列与其它序 列间的同源性大小。这是理论分析方法中最关键的一步 。完成这一工作必须使用多序列比较算法。常用的程序 包有CLUSTAL等;
2021/3/7
35
多序列比对工具
•CLUSTALW/X •AMAS •CINEMA •DIALIGN •HMMT •Match-Box •MultAlin •MSA •Musca •PileUp •SAGA •T-COFFEE
相 同 点连续的
的、不连续的
都由能够编码蛋白质的编码
相 同 点 区和具有调控作用的非编码 区组成的
2021/3/7
7
Some cases : http://www.wormbase.org/
http://www.ncbi.nlm.nih.gov/
2021/3/7
8
Some cases : http://www.wormbase.org/
常用的系统发育分析软件:
• MEGA (Molecular Evolutionary Genetics Analysis)
– http://www.megasoftware.net/
• Phylip(the PHYLogeny Inference Package)
– http://evolution.gs.washington.edu/phylip.html • PAUP (phylogenetic inference package)
2021/3/7
48
第一步:输入序列文件。
2021/3/7
49
第二步:设定比对的一些参数。
2021/3/7
50
参数设定窗口。
2021/3/7
51
第三步:开始序列比对。
2021/3/7
52
2021/3/7
53
第四步:比对完成,选择保存结果文件的格式
2021/3/7
54
2021/3/7
55
2021/3/7
40
多序列比对工具 -clustalX
Clustal是一个单机版的基于渐进比对的多 序列比对工具,由Higgins D.G. 等开发。有 应用于多种操作系统平台的版本,包括 linux版,DOS版的clustlw,windows版本的 clustalx等。
2021/3/7
41
ClustalX
http://www.cbs.dtu.dk
2021/3/7
29
2021/3/7
30
2021/3/7
31
2021/3/7
32
2021/3/7
33
2021/3/7
34
序列相似性比较和序列
同源性分析
序列相似性比较:
就是将待研究序列与DNA或蛋白质序列库进行比较, 用于确定该序列的生物属性,也就是找出与此序列相似 的已知序列是什么。完成这一工作只需要使用两两序列 比较算法。常用的程序包有BLAST、FASTA等;
2021/3/7
42
Clustalx的工作界面 (多序列比对模式)
2021/3/7
43
Clustalx的工作界面 (剖面(profile)比对模式)
2021/3/7
44
Clustal的工作原理
Clustal输入多个序列
快速的序列两两比对,计算序列间的 距离,获得一个距离矩阵。
邻接法(NJ)构建一个树(引导树)
39
Clustal的渐进比对过程
在比对过程中,先对所有的序列进行两 两比对并计算它们相似性分值,然后根 据相似性分值将它们分成若干组,并在 每组之间进行比对,计算相似性分值。 根据相似性分值继续分组比对,直到得 到最终比对结果。在比对过程中,相似 性程度较高的序列先进行比对而距离较 远的序列添加在后面。
http://www.ncbi.nlm.nih.gov/
2021/3/7
9
2021/3/7
10
2021/3/7
11
2021/3/7
12
2021/3/7
13
2021/3/7
14
2021/3/7
15
2021/3/7
16
2021/3/7
17
2021/3/7
18
2021/3/7
19
2021/3/7
2021/3/7
37
皮肌炎图片——皮肌炎的症状表现
• 皮肌炎是一种引起皮肤、肌肉 、心、肺、肾等多脏器严重损害 的,全身性疾病,而且不少患者 同时伴有恶性肿瘤。它的1症状表 现如下:
• 1、早期皮肌炎患者,还往往伴 有全身不适症状,如-全身肌肉酸 痛,软弱无力,上楼梯时感觉两 腿费力;举手梳理头发时,举高 手臂很吃力;抬头转头缓慢而费 力。
2021/3/7
59
2021/3/7
保存为.mas文件
60
2021/3/7
61
2021/3/7
.meg文件是用于分析的
62
2021/3/7
63
.meg文件打开界面
2021/3/7
64
2021/3/7
65
系统发育树构建界面
2021/3/7
66
Click green boxes to obtain options
Clustal简介
• CLUSTAL是一种渐进的比对方法,先将多 个序列两两比对构建距离矩Βιβλιοθήκη Baidu,反应序 列之间两两关系;然后根据距离矩阵计 算产生系统进化指导树,对关系密切的 序列进行加权;然后从最紧密的两条序 列开始,逐步引入临近的序列并不断重 新构建比对,直到所有序列都被加入为 止。
2021/3/7
2021/3/7
27
•Predict features of aligned objects
•Make patterns
—Can make a profile or a pattern that can be used to match against a sequence database and identify new family members —Motif/profile can be used to predict family membership of new sequences —Databases of motif/profile
描述
类隐与模型库,无空隙
保守结构域数据库
联合了PROSITE, PRINTS, ProDom, Pfam, SMART, TIGRfam的资源 来自PIR 联合了6个数据库的蛋白质 数据库 隐马模型库
SwissProt/TrEMBL的蛋白 指纹 利用PSI-BLAST对Swiss Prot蛋白质数据聚类 蛋白质模体字典
The promoter region of the gene in question can be isolated from the rest of the genome, attached to a marker gene, and reinserted
2021/3/7
67
2021/3/7
68
options设置菜单
2021/3/7
69
距离: MYH9 HUMAN与MYH9 RAT的距离是:0.037+0.015 MYH9 RAT与MYH9 CHICK的距离是:0.015+0.045+0.054
2021/3/7
70
How Is Expression Studied?
比较基因组学与分子进化
Comparative genomics and molecular evolution
11/24/2010
2021/3/7
1
2021/3/7
2
反向遗传(水稻吸收铁为案例)
No.4 : 模式生物基因功能(C.elegans)
生物数据库的使用
序列获得和比对分析,,
No.5:基因结构分析和功能预测(C.elegasns)
– http://paup.csit.fsu.edu
2021/3/7
56
MEGA系统发育分析软件
MEGA界面
2021/3/7
57
比对 发育树构建
文件输入:.meg文件
2021/3/7
58
举例:从其它工具得到的比对结果中构建系 统发育树
将比对结果序 列粘贴
将比对结果文 件打开( .mas)
将比对结果文 件打开
•ClustalX provides a new window-based user interface to the ClustalW program. •It uses the Vibrant multi-platform user interface development library, developed by the National Center for Biotechnology Information.
•PROSITE (http://www.expasy.org/prosite) •BLOCKS (http://www.blocks.fhcrc.org/blocks/)
2021/3/7
28
http://pfam.jouy.inra.fr/
http://psort.hgc.jp/ http://www.cbs.dtu.dk/
进化分析--构建进化树
GFP构建验证生物学功能
No.6: 非模式生物功能研究
花生
No.7 : 非模式生物功能研究
2021/3/7
植物寄生线虫
3
2021/3/7
4
2021/3/7
5
基 因的结构
2021/3/7
6
原核细胞与真核细胞的基因结构比较:
原原核核细细胞胞真真核细细胞胞
不不 同同 点点编码区是 编码区是间隔
http://Pfam.wustl.edu/ http://www.bioinf.man.ac.uk/dbbrowser/PR INTS/ http://prodes.toulouse.inra.fr/prodom/doc/p rodom.html http://www.expasy.ch/prosite http://smart.embl-heidelberg.de/ http://tigrblast.tigr.org/web-hmm/
相关文档
最新文档