Clustalx 多重序列比对图解教程by_raindy
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
作 PS:如果你是新手或喜欢中文界面,推荐使用本人汉化的 Clustalx 1.81 版 链接地址:
留 http://www.hanzify.org/index.php?Go=Show::List&ID=7435 (请完整复制)
应用:Clustalx 比对结果是构建系统发育树的前提
实例:植物呼肠孤病毒属外层衣壳蛋白 P8(AA 序列)为例 流程:载入序列―>编辑序列―>设置参数―>完全比对―>比对结果
可让你选择传统多重比对和轮廓比对需要的所有选项。 主要功能:
你可以剪切、粘贴序列以更改比对的顺序;
息
你可以选择序列子集进行比对; 你可以选择比对的子排列(Sub-range)进行重新比对并可插入到原始比对中;
信
可执行比对质量分析,低分值片段或异常残基将以高亮显示。 当前版本:2.0
者
保 1.载入序列:运行 ClustalX,主界面窗口如下所图(图 1),依次在程序上方的菜单栏选择“File”-
“Load Sequence”载入待比对的序列,如图 2 所示,如果当前已载入序列,此时会提示是否替换现有序
载请 列(Replace existing sequences),根据具体情形选择操作。
图6
息 信 者 作 留 保 图 7 请 载 转 , 程 教 创 原
图8
当主界面的左下状态栏会提示“CLUSTAL-Alignment File created []”时说明比全完毕,这时文件保 存位置的目录下会生成生成两个文件,分别是*.aln 和*.dnd,aln 是序列比对的文件,可以进一步用于构 树系统发育树,dnd 是向导树文件(指导树),这两个文件可以用 Windows 系统中的“记事本”或第三 方程序“UltraEdit”等打开,如:
息 信 者 作 留 保 请 载 转 图4 , 修改参数只需点击相应标签,示例比对的是多序列比对,故可选择“Multiple Alignment Parameters” 程 弹出参数设置窗口,如图 5 所示:
4.完全比对:返回菜单栏选择“Complete Alignment”标签,此时会弹出输出文件路径的设置窗口,
教 设置 Guide Tree File(向导树或指导树文件)、Alignment File(比对文件)的保存位置(存放路径),点
击“Align”按钮程序自动开始序列的完全比对,比对所需时间因序列文件大小和长度、计算机性能而异,
创 如图 6-8 所示: 原
息 信 者 作 留 保 图 5 请 载 转 , 程 教 创 原
Search for string(搜索字串)、Remove All gaps(移除序列空位)、Remove Gap-Only Columns(仅移除 选定序列的空位)。
3.参数设置:可以根据分析要求设置相对的比对参数。通常情况下,我们可以使用默认参数。比对参 数主要有六个,分别是 Reset New Gaps before Alignment(比对前重置新的空位参数),Reset All Gaps before Alignment(比对前重置所有空位参数),Pairwise Alignment Parameters(两两序列比对参数), Multiple Alignment Parameters(多重序列比对参数),Protein Gap Parameters(蛋白空位参数), Secondary structure Parameters(二级结构参数),如图 4 所示:
创 >RGDV_AAO64253 原 MSRQAWIETSALIERISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
>RGDV_AAYLeabharlann Baidu4576
一点唠叨: Clustalx 的使用教程最早源自原数字基因网站长曹又方博士的《用 ClustalX 做多序列比对分析》(2004
年)一文,曹兄无私奉献未做署名。不过,网上有些人实在恶心,明明转载他人文章,居然还冠上自己大名, 美其名曰原创,不是不感慨国人的“劣根性”。
息 信 者 作 留 保 请 图 9 ALN 文件 载 转 , 程 教 创 原
图 10 dnd 文件
5.后续分析: 1)Clustalx 比对生成的结果可读性不是太好,一般需要专业的序列着色软件处理,如 Boxshade、 ESPript,这两个工具都是在线进行,其中 Boxshade 图解教程详见本 Blog 日志。 Boxshade 在线网址: http://www.ch.embnet.org/software/BOX_form.html ESPript 在线网址: http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi
2)多重比对文件推荐要求为规范的 FASTA 格式,文件扩展名不限,格式大致如下:
程 >RGDV_BAA02676
MSRQAWIETSALIECISEYGTKCSFRHLWVIMSFIAVFGRYYTVN
教 >RGDV_ABC75537
MSRQAWIETSALIECISEYGTKCSFCHLWVIMSFIAVFGRYYTVN
转
,
程
教
创
原
图1
息 信 者 作 留 保 图 2 请 载 转 , 程 教 创 原
图3 2.编辑序列:对标尺(Ruler)上方的序列进行编辑操作,主要有 Cut sequences(剪切序列)、Paste sequences(粘贴)、Select All sequences(选定所有序列),Clear sequence Selection(清除序列选定)、
Clustalx 多重序列比对图解教程(By Raindy)
本人原创教程,转载请保留作者信息,谢谢!
软件简介:
CLUSTALX-是 CLUSTAL 多重序列比对程序的 Windows 版本。Clustal X 为进行多重序列和轮廓比
对和分析结果提供一个整体的环境。
序列将显示屏幕的窗口中。采用多色彩的模式可以在比对中加亮保守区的特征。窗口上面的下拉菜单
息 2)转换 ALN 文件,进一步构建系统发育树,转换格式依不同软件而有所不同,如在 PHYLIP 分析前需
要将 ALN 格式转换为 PHY 格式方可...
信 者 作 留 保 请 载 转
注意事项:
, 1)dnd 是向导树文件,可以用 TreeViews 软件查看树图。注意:向导树不是系统发育树,两者区别。