上机课件_多序列比对与分子进化分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
程序名称 输入控制 指令 输入文件 名称 输出控制 指令 结果保存 文件名称 输出格式 控制指令
使用MUSCLE 进行比对过程演示
注意:动画需要放映PPT才可播放
使用UltraEdit查看比对结果
用UltraEdit打开HBA.aln文件查看多序列比对结果
操作四 构建血红蛋白alpha亚基家族HBA 的 系统发育树
dir
查看当前目录下的文件
运行命令“muscle”,查看使用说明与参数设置
E:\muscle3.6\
MUSCLE:使用说明
muscle -in HBA.fasta -out HBA.aln -clw
MUSCLE:使用说明
基本操作命令:
muscle -in HBA.fasta -out
HBA.aln -clw
选择序列文件HBA.fasta,并打开
HBA序列文件打开后的序列编辑窗口
序列编辑窗口各菜单说明
请对照使用指南(MEGA4.1使用指南.pdf)了解序 列编辑窗口各菜单的功能
执行多序列比对
多序列比对参数设置
比对完成,保存结果
点击保存
在弹出对话框中写 入数据的标题,即 你对数据的描述 (也可不写) ,点 击OK
构建UPGMA进化树
UPGMA一致树
练 习
使用MEGA,构建酪蛋白家族CASA1(13个物种)的系 统发育树
• 序列数据:来自13个物种的酪蛋白家族序列CASA1.fasta
The End
利用Pfam的搜索功能,回答: • 该序列属于哪个家族?该家族在Pfam中的编号是什么?
• 该家族共同含有哪一个结构域?
在Pfam中进行序列检索
进行序列搜索
输入序列
进行检索
检索结果
点击这里查看 Lipocalin家族的详 细信息 可以看出输入的序列含有一个结构域Lipocalin,属于Lipocalin家族
在Pfam数据库中搜索HBA.fasta中的任意一条序列,查找证实该序列含有结构域 Globin • 例如将HBA.fasta中的第一条序列输入到Pfam中进行检索 >HBA_ACCGE MVLSANDKTNVKNVFTKIGGHAEEYGAETLERMFTTYPPTKTYFPHFDLHHG SAQIKAHGKKVVGALIEAVNHIDDIAGALSKLSDLHAQKLRVDPVNFKLLGQ CFLVVVAIHHPSVLTPEVHASLDKFLCAVGNVLTAKYR
• “开始”菜单运行“CMD”,进入命令行操作 系统 • 命令行操作进入到muscle目录
• 运行 muscle命令,查看参数设置说明 • 进行序列比对操作
DOS命令行操作基本命令
指令 C:\>e: E:\>cd muscle cd.. 说明 从C盘进入E盘根目录 进入E盘下的muscle目录 返回上一级目录
安装程序
安装ClustalX程序
• 看看程序安装到了何处? 安装指导树显示程序TreeView
解压缩Muscle程序到本地磁盘,
如E:\muscle3.6
• 绿色软件,不用安装耶!
安装MEGA软件,MEGA4_setup.exe
查看序列文件
使用UltraEdit查看HBA.fasta文件: • 21条血红蛋白alpha亚基(HBA)数据
• 序列为fasta格式
• 各序列的物种来源如下:
操作一:蛋白质家族数据库Pfam的使用
Pfam网址:http://pfam.janelia.org/
Question
有一条蛋白质序列如下:
MKWVWALLLLAALGSGRAERDCRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQDNIV AEFSVDETGQMSATAKGRVRLLNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQKGND DHWIVDTDYDTYAVQYSCRLLNLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLA RQYRLIVHNGYCDGRSERNLL
操作步骤:
1、输入序列文件
2、设定比对参数 3、进行比对 4、分析结果 5、使用TreeView查看指导树文件
Use your mind!
独立思考,完成上述多序列比对任务
如果遇到困难,可参考接下来的使用指导。
导入序列文件
“File” “Load Sequence”
注意:序列文件要存储在英文目录下,否则会打不开
点击OK导入比 对后的序列
关闭多序列比对窗口后,导入比对结果
出现比对结果编辑窗口,关闭该窗口
进化分析功能菜单在主窗口出现,对照使用指南了解进化分 析主窗口各菜单的基本功能
构建带检验的MP进化树
参数设置窗口
点这里开始 构建进化树
MP一致性树
这几 个按 钮可 以对 树进 行编 辑
பைடு நூலகம்
带遗传标尺的进化树
MEGA4启动界面
第一步:导入序列进行多序列比对序列HBA.fasta
Create a new alignment :是在你没有任何比对的时候使用,比 如你只有一个fasta 格式的序列就可以选择这个选项。 Open a saved alignment session:使用它可以打开一个我们已经 比对好的序列文件; Retieve a sequence from a file :这种情况同第一种情况相似, 只是不用选择是DNA 还是蛋白质序列比对,选择的也是fasta 格 式的文件,打开后的界面都是一样的。
树枝长度表示遗传距离的进化树
邻接法(N-J)构建进化树
N-J一致树
最小进化法构建进化树
最小进化一致树
算术平均非加权对群法UPGMA
它假设沿着进化树分支的变化速率为一个常数, 而距离近似为非加权的。UPGMA 法由计算关系 最近序列间的枝长开始,然后计算序列对与下一 个序列对间的距离平均值,不断重复直到所有序 列都被包括在树中。如果树枝间的突变率不一致 时,UPGMA 法将导致一个错误的树,因此该法 现在已基本不用。
序列导入成功
设定一些比对参数
Alignment Parameters
参数设定窗口
空位罚分 空位扩展罚分
执行比对
Do Complete Alignment
比对结果保存
E:/data/HBA.dnd
E:/data/HBA.aln
点击OK
比对结果
保守 残基
次保守 残基
结果初步分析:保守区域分析
实验内容
1. 蛋白质家族数据库Pfam的使用
2. 使用ClustalX对血红蛋白alpha亚基家族序列 HBA.fasta (HBA)进行多序列比对
3. 使用Muscle对对血红蛋白alpha亚基家族序列 HBA.fasta (HBA)进行多序列比对
4.使用MEGA4 ,构建血红蛋白alpha亚基家族 HBA (21个物种)的系统发育树
上机三 多序列比对与分子进化分析
教学目标
了解:
• 多序列比对的主要方法
• 基因组进化的意义
理解:
• 渐进算法的基本原理 • 系统发育树的构建步骤
掌握:
• 使用CLustalX、 MUSCLE进行多序列比对
• 使用MEGA构建系统发育树
资料准备与实验内容
资料下载地址: • ftp://10.10.188.4 • 下载“上机三_多序列比对与分子进化分析.rar” 资料内容: • 多序列比对软件 ClustalX: clustalx-2.1-win.msi • 多序列比对软件 muscle: muscle3.6 • 指导树查看软件TreeView: TreeView • 进化分析软件 MEGA4:MEGA4_setup.exe • MEGA使用说明:MEGA4.1使用指南.pdf • 超级文本编辑器UltraEdit32:UltraEdit-32 • 来自21个物种的血红蛋白家族序列:HBA.fasta • 来自13个物种的酪蛋白家族序列:CASA1.fasta
Lipocalin家族在Pfam中的编号是PF00061
操作二:使用ClustalX进行多序列比对
实验目的:
• 理解渐进算法比对原理,熟悉和掌握ClustalX 的使用和比对结果分析。
实验内容:
• 使用ClastalX对血红蛋白alpha亚基家族序列 HBA.fasta (HBA)进行多序列比对
选择保存结果文件的格式
Save Sequence as
保存比对结果的选择项
Clustal Format
使用TreView查看指导树文件
使用TreView打开HBA.dnd文件,查看指导树
注意:指导树并不是严格意义上的进化树
操作三:使用MUSCLE进行多序列比对
MUSCLE使用流程:
• 解压缩MUSCLE到硬盘 • 拷贝序列文件HBA.fasta到muscle文件夹内