功能基因的序列比对方法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

功能基因的序列比对

<1>.切除载体和(或)引物

a.打开所有的原始引物序列于一个EditSeq的窗口中

b. export all as one

c.保存

d.打开这个保存的文件，开始切除载体和引物

e.选择载体插入点两侧的序列(10-15个的样子)搜索注意：不存在正反向的问题，都是一个

方向，因为测序的时候是选择两个载体上的引物其中的一条来往后测序的！

切完之后另存为

f. 重新打开这个文件，开始切除引物

方法同切载体，但是要注意正反向的问题。比如mcrA基因，其引物为Forward: 5'-GGTGGTGTMGGATTCACACARTAYGCWACAGC-3' Reverse: 5'-TTCATTGCRTAGTTWGGRTAGTT-3'

先找Forward 5’端，此时只找到的部分序列。切去5’端。

然后再切这些切掉5’端序列的3’端的序列，此时其3’端序列应该是Reverse 的反向互补序列。

切去这个反向互补序列，这样一来这个些序列就已经被切去两端的引物了。

但此时还剩下另一部分未切除任何引物的序列，此时记下这些序列的编号，先切去Reverse

5’端。

再用Forward 的反向互补序列切去3’端，这样剩下的序列也都被切除两端的引物了。

<2>将所有序列调整为同向序列：

a. 选择前面记录编号的序列，将这些序列一个个都转换为其反向互补序列。这样一来所有的序列都成为同向序列了，即在DNA两条反向互补链的其中一条上的比较了。

b. 保存该文件

<3> 生成OTUs

Google 搜索”Fastgroup II”

或/fg_tools.htm

(Online grouping--注意勾选的选项)

Choose method 里面相似度可以选97%或98% 提交之后出现的窗口如

可以看到被分为了10个OUT 每个OUT都自动选择了一个代表序列。全选将其复制到word中，备用。并把其中的那些代表序列都复制下来粘贴到TXT保存。

<4> 寻找嵌合体: 一般是对16S rRNA 来说的

两个：

/FindChimerasOutputs.html (或搜decipher chimera)

.au/bellerophon/bellerophon.pl (或搜bellerophon chimera check)

<5>翻译

：/

在保存有OTUs的TXT文件中，一个一个翻译成蛋白质序列。最后保存。

在用Expasy翻译的时候选择第二个选项

点击翻译

理想的情况是这段序列中应该是没有终止序列的即”-”符号，因此先选择阅读框较长，整段序列也没有终止子的那些，如图，先选择第二个。复制红色的区域，在blast上比对，看是否是需要的序列，如果是。那么就选择此结果，如果不是，再一一比对其他的罗列结果。

或者直接将DNA序列提交到sanger上，出现如下结果

Frame2 中有一段绿色，显示就是mcrA的保守家族。那么Frame2 即为正确的翻译方法。另存为，只保留pro的序列的TXT

改名为.FAST格式

<6>寻找最相似序列

打开这个FAST文件，开始一个个找最相似序列了。

在这个窗口，开始blast。找到一个序列后复制其DNA的编号

点击这个按钮

出现这个窗口

把复制的DNA编号手动输入点击OK 则这个序列被自动添加到了FAST文件里了。一般一个序列寻找3个相似度不等的序列。

最后，保存为一个新的FAST文件。

<7>画系统发育树

打开前面的FAST文件，全选文件”W”一下，再直接点OK

左右两头各删除带*之前的序列，另存为新的FAST文件。

打开这个FAST文件开始画树。

<8>最后对画的树进行一些修饰。