BioEdit及MEGA分析序列同源性简介
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
利用系统进化分析软件对序列进行同源性分析
1.0目的
1.1为了保持国际上各个耐药性实验室的高检验水准,进行分子进化分
析是有很重要作用的。
它不仅可以保证流行病学目的顺利实现,而
且有利于发现检测阶段可能产生的潜在的交叉污染。
1.2利用此软件进行分析所得的信息对于进行艾滋病毒在人群中传播
的流行病学研究具有十分重要的意义。
1.3通过对实验室之前分析的数据与当前数据进行比较,可以发现在此
前实验过程中由于标本处理不当所导致的潜在的实验室污染。
1.4对于确保得到高质量的实验结果并及时发现可能出现在实验室里
的问题具有重要意义。
2.0仪器设备
2.1计算机一台。
2.2Windows 95以上的操作系统。
2.3BioEdit 以及MEGA 4 分析软件。
2.3.1均为免费软件,可以从互联网上下载,在计算机上进行安装。
3.0操作过程
3.1局限及要求
3.1.1经过序列编辑软件拼接处理后的txt文件或fasta文件均可,
例如ChromasPro软件。
3.1.2可以在MEGA上分析的分子序列或距离矩阵数据。
3.1.3Mega 4软件只能将长度相等的序列转换为MEGA输出文
件,因此,任何多序列文件必须通过BioEdit软件进行对齐
修剪,然后才能进入通过Mega软件转换成*.meg格式进行
分析。
3.1.4该数据集的大小受限于计算机上可用的物理(RAM)和虚
拟内存。
3.1.5分析的序列必须包括两个或两个以上长度相同的序列,所有
序列分析之前必须用MEGA软件对齐。
3.1.6核苷酸和氨基酸序列应该用英文字母连续书写,不区分大小
写。
一些特殊的特殊符号,例如表示对齐缺口,碱基缺失等
的符号也可以包含在序列中。
3.1.7空格和制表符经常用于数据文件中,因此会被MEGA忽略。
ASCII字符,如(.)(- )(?),一般都作为特殊符号
来表示序列中的不同碱基,分别表示第一个序列,对齐缺口
及碱基缺失。
3.1.8BioEdit 软件进行序列比对
3.1.9双击BioEdit图标打开BioEdit 序列对比编辑器窗口。
3.1.10从工具栏上,单击new alignment图标打开一个新窗口。
3.1.11点击File菜单, 选择import and sequence alignment file
3.1.12出现一个新窗口, 选择要导入的文件存储地址及文件名, 点
击open. 所有需要的序列都会在导入窗口中呈现。
3.1.13点击Edit并选择Select All Sequences,现在可以准备对所
有的序列进行比对。
3.1.14点击Accessory Application并选择ClustalW Multiple
alignment ,打开一个新窗口。
3.1.15点击窗口下方的Run ClustalW,将打开一个新窗口,点
击下方的OK.
3.1.16序列比对将进行,进行的时间取决于所要比对的序列的长度
及数量。
3.1.17比对结束后,经过比对的序列将呈现在一个新窗口中。
3.1.18将模式(Mode)栏中改为edit,即可对序列进行剪切,使其
长度一致。
3.2 比对及编辑结束后,点击File并选择Save保存比对后的文件.
3.3用MEGA软件分析进行距离和系统进化分析
3.3.1双击MEGA4 图标打开MEGA
4.
3.3.2序列比对格式转换:
3.3.2.1从File菜单中, 选择Convert To Mega Format,
打开Text File Editor and Format Converter 窗口。
3.3.2.2选择屏幕中间的File and Format对话框。
3.3.2.3选择要导入的文件存储地址及文件名,点击OK,
在Text File Editor and Format Converter窗口中出
现mega 格式的文件。
3.3.2.4保存文件,关掉此页面返回MEGA
4.主界面。
3.3.3打开mega 文件
3.3.3.1从File菜单中打开mega文件, 选择open data, 或
从窗口中打开Click me to active a data file.
3.3.3.2打开文件后, Input Data 对话框将出现. 在左侧一
栏选择Nucleotide Sequences,默认右侧当前选择,点
击OK.
3.3.3.3出现一个Confirm对话框, 点击Yes.
3.3.3.4Select Genetic Code box opens被打开,通常默认所有
选项,点击OK .
3.3.3.5文件名及信息将会出现在窗口下方。
3.3.4打开Mega文件后
3.3.
4.1File 菜单中, 进行编辑, 导出或转换文件。
3.3.5Data菜单中, 可以用不同形式浏览文件,例如转换成氨基
酸形式。
3.3.6距离分析
3.3.6.1Distances菜单中, 选择Compute Pairwise. 出现
Analysis Preferences 窗口。
3.3.6.2在Distance options列表中, 选择Nucleotide:
Kimura 2-parameter for Models, 选择Distances
only for Comput, 并选择d: Transitions +
transversions for Substitutions to include.
3.3.6.3Include Sites list, 选择Complete Deletion for
Handling Gap/Missing Data, 选择1st, 2nd, 3rd for
Codon Positions/Sites Included, 点击OK.
3.3.6.4Pairwise Distances 窗口打开,在文件中将显示每两
个序列距离的矩阵。
3.3.7File菜单中, 选择Export/Print Distances,在Text File
Editor and Format Converter 窗口中将出现一个名为
Distances 的文件,它显示了所有的信息及距离矩阵,保存
后可以用记事本或写字板打开。
3.3.8进化分析
3.3.8.1Phylogeny菜单中,选择Neibour-Joining(NJ),
Analysis Preferences 框将打开。
3.3.8.2在Distance options列表中, 选择Nucleotide:
Kimura 2-parameter for Models, 选择Distances
only for Comput, 选择d: Transitions +
transversions for Substitutions to include.
3.3.8.3Include Sites list, 选择Complete Deletion for
Handling Gap/Missing Data, 选择1st, 2nd, 3rd for
Codon Positions/Sites Included.
3.3.8.4在Test of Phylogeny列表中, 选择Bootstrap for
Test of Inferred Phylogeny.
3.3.8.5屏幕的右侧将出现一个小对话框,选择1000 for
Replications, 然后点击OK, 进程框将打开。
3.3.8.6进程结束后, Tree Explorer窗口将显示两种进化
树。
同源树Original tree是我们所需要的。
3.3.8.7File菜单中, you can save the tree data as可以将所做
的树通过Save键保存成Tree Session File(*.mts), 或
者选择Export Current Tree得到Tree Data
File(*.tre)文件, 两种格式的文件都能被MEGA或其
他软件所识别。
3.3.8.8Image菜单中, 选择Copy to Clipboard, 进化树即
可被复制并粘贴到word文档或ppt文档中进一部编
辑。
3.3.9交叉污染的判断:
3.3.9.1如果有两个或者更多的序列在进化树中距离非常接
近或者两个分支有相同的结点且有相同的水平距离,
而序列之间又没什么流行病学联系, 那么这些标本
则需要从核酸提取阶段进行重复检测,以此验证它们
之间的相近关系并排除交叉污染。
3.4亚型的初步分析:
3.4.1用NCBI 基因分型工具进行亚型的初步分析。
3.4.2双击下面的网址
/projects/genotyping/formpage.cgi
3.4.3在相应位置填入序列的FASTA/GI /Accession 格式文件。
3.4.4点击亚型按钮。
3.4.5出现一个扫描窗口,如果序列是单一的亚型,记录结果,如
果是复杂的重组亚型,则需要对序列进行详细的系统进化分
析。