生物信息学分析工具

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

为了使NCBI的资料库发挥更大的进阶应用价值,NCBI研究团队发展许多可以做生物医学资料採矿与资料分析的检索与分析工具。在此依工具的使用目的将其分为六大类,每大类下分别包含工具的名称与简介,作为研究人员在选择工具时的参考。

1.资料检索--文章词语搜寻

‧Entrez一提供核酸、蛋白质、蛋白质3D结构Entrez:提供核酸、蛋白质、蛋白质3D结构、基因体图谱资讯、PubMed MEDLINE 文献等整合式查询。序列资料的来源包括GenBank、EMBL、DDBJ、RefSeq、PIR-International、PRF、Swiss-Prot与PDB(网址:/Entrez/)。

特性:

(1)对每一个资料库纪录做预先的相似性搜寻计算,以鉴别该资料的相关纪录。

(2)提供整合性跨资料库服务,可从一个资料库的纪录连结至其他资料库的相关纪录。

‧Batch Entrez一使使用者可在背景执行,从Entrez取得大量核酸与蛋白质序列资讯,而使用者只需输入含GI或Accession Number 的名单即可。查询结果可直接储存在使用者的电脑中(网址:/entrez/batchentrez.cgi?db=Nucleotide)。

‧LinkOut一在Entrez的文章、期刊或生物资料建立连结到外部网页连结之注册服务。欲建立连结者可提供网址、资源名称、简短的网页描述与想建立的NCBI资料规格书即可(网址:/entrez/linkout/doc/linkoutoverview.html)。

‧Cubby一使Entrez使用者储存与更新搜寻,并且订做他们的LinkOut设定。需填写注册申请书申请使用权限(网址

/entrez/login.fcgi?call=so.SignOn..Login)。

‧Citation Matcher一可查询PubMed 资料库的PubMed ID或MEDLINE UID,提供文献的目录资讯(网址:

/entrez/query/static/overview.html#Citation%20Matcher)。

‧Taxonomy Browser一用来查询生物分类资料库的查询工具,可由生物学名、俗名或较高层级分类查询生物与分类血缘,同时可获得核酸、蛋白质、结构与基因体资讯,并且可向上或向下查询分类树(Taxonomic tree)(网址:/Taxonomy/)。

2.序列相似度搜寻

‧BLAST一Basic Local Alignment Search Tool一核酸与蛋白质序列比对工具。BLAST网页提供提供BLAST(Basic Local Alignment Search Tool)程式、概述、使用说明与常见问题解答(网址:/BLAST/)。BLAST程式包括:

(1) 核酸BLAST:

‧blastn程式一核酸序列比对。

‧MegaBLAST一可搜寻一批EST序列、长序列cDNA或基因体序列。

(2) 蛋白质BLAST:

‧blastp程式一蛋白质序列比对。

‧PHI-BLAST程式一Pattern Hit Initiated BLAST(Zhang, et al., 1998)

一输入蛋白质序列查询蛋白质资料库,搜寻是否存在某种特定序列形式的BLAST程式。

‧PSI-BLAST程式一Position-Specific Iterated BLAST(Altschul, et al., 1997)

一输入蛋白质序列查询蛋白质资料库,搜寻是否属于某个蛋白质家族的BLAST程式。

(3)转译BLAST搜寻:

‧blastx程式一核酸序列与蛋白质资料库比对。

‧tblastn程式一蛋白质序列与转译核酸资料库比对。

‧tblastx程式一核酸序列与转译核酸资料库比对。

(4)保留区搜寻:

‧RPS-BLAST程式一Reverse Position-Specific BLAST一输入蛋白质序列查询Conserved Domain Database(蛋白质保留区资料库),搜寻是否存在保留区的BLAST程式。

‧CDART工具一利用RPS-BLAST比对蛋白质输入序列与CDD资料库。

(5)两条序列比对:

‧BLAST 2 Sequences程式一2条核酸或蛋白质序列比对。

(6)基因体BLAST一使用BLAST程式比对输入序列与生物染色体资料库。目前提供的生物染色体有人类、小鼠、大鼠、Fugu rubripes、斑马鱼、果蝇、Anopheles gambiae、Saccharomyces cerevisiae、Malaria、微生物、阿拉伯芥与水稻等基因体。

(7) Taxonomy BLAST一使用BLAST程式将Taxonomy资料库的生物做分类。生物种类依输入序列比对的相似性由高至低列出。

(8)特殊BLAST:

‧用BLAST比对dbSNP资料库。

‧IgBLAST一分析GenBank的免疫球蛋白序列,使用blastp或blastn程式搜寻人类与老鼠基因的nr或特定资料库。IgBLAST的3个主要功能:(a)报告输入序列之变异区、D或J区域;(b)根据Kabat等人的论文注解免疫球蛋白区(FWR1~FWR3);(c)简化搜寻核酸或蛋白质nr资料库的过程。

‧VecScreen一侦测载体是否受污染的BLAST程式。

(9)从存在的Request ID(RID)检索结果:因为有QBLAST程式的辅助,因此使用者在执行所有的BLAST程式查询时,执行结果都会被给予一个RID(Request ID),BLAST伺服器可储存24小时之内的RID。如果使用者需要取得24小时内执行过的BLAST程式结果,只需输入RID即可取得资料,不需从新执行程式。使用者可以自行设定结果呈现的方式,比较相同结果不同呈现格式上的差异。

3.核酸序列分析

‧BLAST网页一提供BLAST(Basic Local Alignment Search Tool)

程式、概述、使用说明、常见问题解答与各种BLAST程式(请参考2.序列相似度搜寻)(网址:/BLAST/)。

‧e-PCR-Electronic PCR一比对输入序列与Sequence-tagged sites(STSs)的工具,以预测输入序列在PCR反应时在染色体图谱中的可能位置。e-PCR搜寻UniSTS资料库(网址:/genome/sts/epcr.cgi)。

‧HomoloGene一基因相似度比对工具,可比较一对生物的核酸序列,用以认定是否为同源,并经由LocusLink合併各种资源管理同源资料(网址:/HomoloGene/)。

‧ORF Finder一为分析原核生物序列而设计分析工具,藉由找出序列的起始与终止位置,搜寻输入序列所有Open reading frames的图形化工具。此工具被包装在Sequin程式中(网址:/gorf/gorf.html)。

‧CloneFinder一将BAC end sequences(BES)与基因体序列比对,用来鉴定Clone中是否含特定基因区域。目前只能用来检索小鼠序列(网址:/genome/clone/clonefinder/CloneFinder.html)。

‧SAGEmap一Serial Analysis of Gene Expression-SAGE是一种分析基因表现的定量实验技术。SAGEmap是比较Cancer Genome Anatomy Project(CGAP)所产生的基因表现资料与Gene Expression Omnibus(GEO)所产生的基因表现资料的线上分析工具(网址:/SAGE/)。

‧Sequin一NCBI发展的软体工具,为独立(stand-alone)使用的或TCP/IP-based “network aware”模式,用来提交一笔或几笔纪录、长序列、完整基因体、比对资料、族群/演化/突变的资料,作为提交与更新GenBank、EMBL或DDBJ序列资料库之的一个上传工具,此工具包含ORF Finder、比对Viewer/Editor与Entrez连结(上传资料前,请先用VecScreen工具侦测核酸序列侦测核酸序列是否为载体、连接体(Linker)或转接器(adapter),以避免序列感染)(网址:/Sequin/index.html)。

‧BankIt一在WWW使用的提交工具,用来提交一笔或几笔纪录,可使提交资料的过程更快且更容易(上传资料前,请先用VecScreen 工具侦测核酸序列是否为载体、连接体或转接器,以避免序列感染)(网址:/BankIt/)。

‧Spidey一mRNA序列比对至基因体序列的比对程式,模拟可能的基因体Exon/Intron结构。因为Spidey可忽略intron大小,因此可以避免假基因与相异血缘关係序列比对时的错误。Spidey的模型结合比对演算法与归纳法,可执行物种外与物种间的比对(网址:/IEB/Research/Ostell/Spidey/)。

相关文档
最新文档