如何在genbank中查找一基因的序列.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何在 genbank 中查找一基因的序列
1、在 GeneBank 中查找基因序列只要输入accession号就可以了,下面网址就是一个基因的全部序列信
息的例子,,在记录的末尾有各种记录的详细说明,如果你没有accession 号,可以把你手头的编号用source 等信息源转换成accession号,中文教程太古老了,如果你是初学者一定要养成看英文文献的习惯,要是
特别想看中文翻译的话,书店里随便一本生物信息学书里都会介绍数据库的,不过有些翻译过来的东西真
的很别扭,希望对你有帮助。
2、关于在GeneBank中查找序列我有几点体会:
最直接、最简单的方法是手头有基因的accession号;
如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉丁全名),基因名称尽可能详细,避免搜出一些不相关的信息;
搜索的时候建议先用NCBI 的 Gene数据库搜索,这样得到的 accession 号是属于 NCBI工作人员重新整理过的 Refseq 的序列,这样会比较可靠;当然这个要看你的分析目的,如果你是要对该序列进行下游的分子生
物学操作 or 分析,选这种序列我觉得会比较好,如果是要进行多序列的分析or 其他目的需要全面分析该序列的,可能需要其他序列做补充,但是我觉得序列越多问题越说不清楚,因为毕竟不是自己的序列,如
果 Gene 数据库里没有收录,那就只有在Nucleotide数据库里找了,但是还是建议采用Refseq 的序列,Refseq 序列特征如下:
Accession prefix Molecule type Comment
AC_Genomic Complete genomic molecule, alternate assembly
NC_Genomic Complete genomic molecule, reference assembly
NG_Genomic Incomplete genomic region
NT_Genomic Contig or scaffold, clone-based or WGSa
NW_Genomic Contig or scaffold, primarily WGSa
NS_Genomic Environmental sequence
NZ_b Genomic Unfinished WGS
NM_mRNA
NR_RNA
XM_c mRNA Predicted model
XR_c RNA Predicted model
AP_Protein Annotated on AC_ alternate assembly
NP_Protein
YP_c Protein
XP_c Protein Predicted model
ZP_c Protein Predicted model, annotated on NZ_ genomic records
a Whole Genome Shotgun sequence data.
b An ordered collection of WGS for a genome.
c Computed.
其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子;
其他未尽事宜大家补充!
3、如何在genbank查找某个细菌的基因序列
你输入这个细菌的名字直接查,一般会有的 ~~~~~而且一般第一个会是全基因组序列 ~~~进入 ncbi 的首页,database 选 nucleotide ,输入你的关键词 , 如果库里收录里就会有的
4、如何查找基因序列——在Genbank中
寻找目的基因的实例
(1)根据文献
搞 reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在
Genbank中
的
ID 号,那就好办了,直接打开,在Search后的下拉框中选择Nucleotide,把 Genbank ID 号输入GO前面的文本框中,点“GO”,就可以找到他了。
举例说明,例如:在 2003 年 JBC的文章(Conditional Knock-out of Integrin-linked an Essential Role in Protein Kinase B/Akt Activation)中出现了“ calreticulin Kinase Demonstrates (GenBank accession
number gi )”,那么把“”输入GO前面的文本框中,点“ GO”,就可以找到该基因了(当然包括基因序
列等相关信息)。
在出现了检索结果界面(下图)后,直接点击红箭头所指的AY047586 就可以看到基因的相关信息了...
呵,是不是有点太......easy了)
这里需要指出一下,在显示基因的页面右侧有一个Link ,点击后出现一个小菜单,里面是与该基因相关的
链接,很有用的,值得一个一个地去看看,这里我就不多说了。
(呵(2)点击 AY047586 后出现的界面如下:
如果你只想获得序列(例如去设计 PCR引物的时候),那就可以选择 FASTA,这样就得到了 FASTA格式的序列文件,没有其他数字和格式的干扰。
这就是 FASTA格式的序列:
正如路漫漫所说,如果只是知道基因的名字,怎么查序列呢还是举例说明,比如我想做的基因名称是人的
VEGF基因,那么怎么在Genbank中找到它呢还是一步一步来...
打开
在 search后面的下拉框中选择Gene,然后在中间的文本框中输入基因名称“VEGF”,点击GO...
搜索结果出来了,let me see...啊,怎么这么多689 条,哪一条是我想要的基因呢
(作者注:这也许是大多数人对Genbank 的第一印象,即东西太多了,不知道是哪个。)
点击箭头所指的Limits
Limits的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能大大精简查询结果。
我们接着来,在 Limits这个界面,先选择查询的限定范围。我们要找什么基因来着想起来了,是人的VEGF 基因,那就开始选择:先选Gene name(基因名称) ;然后再选择Limit by Taxonomy(生物分类限定)中的Homo sapiens(人类),然后再点击“GO”