如何在genbank中查找一基因的序列.docx

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何在 genbank 中查找一基因的序列

1、在 GeneBank 中查找基因序列只要输入accession号就可以了,下面网址就是一个基因的全部序列信

息的例子,,在记录的末尾有各种记录的详细说明,如果你没有accession 号,可以把你手头的编号用source 等信息源转换成accession号,中文教程太古老了,如果你是初学者一定要养成看英文文献的习惯,要是

特别想看中文翻译的话,书店里随便一本生物信息学书里都会介绍数据库的,不过有些翻译过来的东西真

的很别扭,希望对你有帮助。

2、关于在GeneBank中查找序列我有几点体会:

最直接、最简单的方法是手头有基因的accession号;

如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉丁全名),基因名称尽可能详细,避免搜出一些不相关的信息;

搜索的时候建议先用NCBI 的 Gene数据库搜索,这样得到的 accession 号是属于 NCBI工作人员重新整理过的 Refseq 的序列,这样会比较可靠;当然这个要看你的分析目的,如果你是要对该序列进行下游的分子生

物学操作 or 分析,选这种序列我觉得会比较好,如果是要进行多序列的分析or 其他目的需要全面分析该序列的,可能需要其他序列做补充,但是我觉得序列越多问题越说不清楚,因为毕竟不是自己的序列,如

果 Gene 数据库里没有收录,那就只有在Nucleotide数据库里找了,但是还是建议采用Refseq 的序列,Refseq 序列特征如下:

Accession prefix Molecule type Comment

AC_Genomic Complete genomic molecule, alternate assembly

NC_Genomic Complete genomic molecule, reference assembly

NG_Genomic Incomplete genomic region

NT_Genomic Contig or scaffold, clone-based or WGSa

NW_Genomic Contig or scaffold, primarily WGSa

NS_Genomic Environmental sequence

NZ_b Genomic Unfinished WGS

NM_mRNA

NR_RNA

XM_c mRNA Predicted model

XR_c RNA Predicted model

AP_Protein Annotated on AC_ alternate assembly

NP_Protein

YP_c Protein

XP_c Protein Predicted model

ZP_c Protein Predicted model, annotated on NZ_ genomic records

a Whole Genome Shotgun sequence data.

b An ordered collection of WGS for a genome.

c Computed.

其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子;

其他未尽事宜大家补充!

3、如何在genbank查找某个细菌的基因序列

你输入这个细菌的名字直接查,一般会有的 ~~~~~而且一般第一个会是全基因组序列 ~~~进入 ncbi 的首页,database 选 nucleotide ,输入你的关键词 , 如果库里收录里就会有的

4、如何查找基因序列——在Genbank中

寻找目的基因的实例

(1)根据文献

搞 reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在

Genbank中

ID 号,那就好办了,直接打开,在Search后的下拉框中选择Nucleotide,把 Genbank ID 号输入GO前面的文本框中,点“GO”,就可以找到他了。

举例说明,例如:在 2003 年 JBC的文章(Conditional Knock-out of Integrin-linked an Essential Role in Protein Kinase B/Akt Activation)中出现了“ calreticulin Kinase Demonstrates (GenBank accession

number gi )”,那么把“”输入GO前面的文本框中,点“ GO”,就可以找到该基因了(当然包括基因序

列等相关信息)。

在出现了检索结果界面(下图)后,直接点击红箭头所指的AY047586 就可以看到基因的相关信息了...

呵,是不是有点太......easy了)

这里需要指出一下,在显示基因的页面右侧有一个Link ,点击后出现一个小菜单,里面是与该基因相关的

链接,很有用的,值得一个一个地去看看,这里我就不多说了。

(呵(2)点击 AY047586 后出现的界面如下:

如果你只想获得序列(例如去设计 PCR引物的时候),那就可以选择 FASTA,这样就得到了 FASTA格式的序列文件,没有其他数字和格式的干扰。

这就是 FASTA格式的序列:

正如路漫漫所说,如果只是知道基因的名字,怎么查序列呢还是举例说明,比如我想做的基因名称是人的

VEGF基因,那么怎么在Genbank中找到它呢还是一步一步来...

打开

在 search后面的下拉框中选择Gene,然后在中间的文本框中输入基因名称“VEGF”,点击GO...

搜索结果出来了,let me see...啊,怎么这么多689 条,哪一条是我想要的基因呢

(作者注:这也许是大多数人对Genbank 的第一印象,即东西太多了,不知道是哪个。)

点击箭头所指的Limits

Limits的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能大大精简查询结果。

我们接着来,在 Limits这个界面,先选择查询的限定范围。我们要找什么基因来着想起来了,是人的VEGF 基因,那就开始选择:先选Gene name(基因名称) ;然后再选择Limit by Taxonomy(生物分类限定)中的Homo sapiens(人类),然后再点击“GO”

相关文档
最新文档