序列拼接
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
序列拼接
* 为了保证测序结果的准确性,单基因短片段(700pd左右)测序一般应采用双向测序,然后将双向测序的结果拼接在一起,从而获得一致性序列。线粒体基因组测序和DNA长片段测序一般是通过分段测序来完成的,最后也需要将测出的短片段拼接成一条完整的序列。序列拼接可以在不同的软件中进行。
一、使用“组装批处理文件byLHM.pg4”进行拼接
1. 在预定的位置建立一个文件夹“gap”,将需要使用的3个软件“组装批处理文件byLHM.pg4”、“V ector_primer4pMD18-T.vec_pri”、“pMD18-T_Vector.seq”拷贝到该文件夹下,再将需要拼接的测序文件拷贝到该文件夹下。
2. 双击运行“组装批处理文件byLHM.pg4”程序。
3. 在程序运行后出现的界面右侧点击“Add files”按钮,打开要拼接的序列文件。为了保证
拼接后输出的是正向序列,最好先添加上游引物序列,然后添加下游引物序列,因为在一般情况下软件将添加的第一条序列默认为正向参照序列;有时由于测序效果等因素的影响,有时即使首先添加的是上游引物序列,但拼接后仍然会以测序效果明显更好的下游引物序列为正向参照序列,此时需要按照后面介绍的方法将上游引物序列转换为正向参照序列再输出一致性序列。
4. 点击界面上方第二行的“Configure Modules”,在弹出的窗口左边的任务栏中点击“[x]
Sequencing vector Clip”,再点击右边的“Browse”按钮,通过弹出的窗口打开“Vector_primer4pMD18-T.vec_pri”程序;点击左边任务栏中的“[] Cloning Vector Clip”,再点击右边的“Browse”按钮,通过弹出的窗口打开“pMD18-T_Vector.seq”程序;点击左下角的“Run”按钮,即开始数据处理,处理结果将自动保存到“gap”文件夹中。
5. 在“gap”文件夹中双击“AssMit_tmp.o.aux”文件,将鼠标移到弹出的“Contig Selector”
窗口中的直线上,点击右键,选择“Edit Contig”,即弹出“Contig Editor”窗口,点击最右边的“setting”按钮,在下拉菜单中选择“By background colour”,即可显示比对结果的有差异碱基;双击某一序列,即可显示该序列的测序峰图,以检查核对该位点碱基的测序情况。
* 注:执行此操作时一定要检查正向序列是否为上游引物序列;如果不是,则需要将上游引物序列转换成正向序列后再执行下面的“输出及保存序列”操作;具体的操作步骤是:点击“GAPv4.10 AssMit_tmp.o”窗口中的“Edit”菜单,在下拉菜单中选择“Complement
a contig”命令,在弹出来的“Complement contig”小窗口中检查确认“Contig identifier”
框中的序列为上游引物序列,然后点击“OK”即将完成序列转换。
6. 点击“GAPv4.10 AssMit_tmp.o”窗口中的“File”菜单,在下拉菜单中选择“Save
consensus”可保存一致序列,nomors------ok ,序列即保存在刚刚使用过的那个文件夹中,然后把文件名改成用“*.txt”形式,以便保存的文件成为文本文件,若忘记在文件名后加“.txt”,则保存完毕后可将文件的扩展名改成“.txt”;只有拼接好的一致序列才可用于后面的序列分析。
7.然后把在ncbi里查到的相近种的序列放到一起,也可以直接放到刚才那个cons.txt文本文
档中,然后打开clustalx.exe进行序列比对,file------load sequence ------G盘-----004文件夹-----cons.txt-----aligenment-----do complete aligenment,这时如果发现两条序列的保守区域很不对,极可能是刚刚测得这个种的序列反了,需要用Bioedit把它正过来,
8.在程序里打开已经安装好的Bioedit,例如找file---------open----G盘---004----cons.txt,打开,
选sequence--------下拉菜单中找Nuclic acid,在菜单中找reverse complement,点击它
然后在另一对话框中例如G:/004/CONS.TXT中点击保存save Aligenment. 这样序列即
被正转过来并且保存在刚才建的cons.txt记事本中,即可用于下面的各种分析。