很好—生物信息相关数据库资源介绍
初二生物生物信息数据库资源概述
初二生物生物信息数据库资源概述在现代生物学研究中,信息数据库资源扮演着至关重要的角色。
生物信息数据库资源广泛涵盖了许多方面的生物学数据,包括基因组、蛋白质、代谢途径、细胞结构等。
本文将概述初二生物学学习中常用的一些生物信息数据库资源。
一、基因组数据库资源基因组数据库资源主要用于存储和访问各种生物的基因组序列信息。
其中,最为著名的是国际基因组浏览器(International Genome Browser),它提供了包括人类、小鼠、果蝇、斑马鱼等多个物种的基因组信息。
学生们可以通过该数据库资源了解各物种的基因组结构和基因的功能。
二、蛋白质数据库资源蛋白质数据库资源主要用于存储和查询蛋白质序列和结构的信息。
蛋白质数据银行(Protein Data Bank)是全球最大的蛋白质结构数据库,其中收录了大量的蛋白质三维结构。
除了蛋白质结构信息外,蛋白质相互作用数据库(Protein-Protein Interaction Database)还提供了蛋白质间相互作用的信息,帮助学生们理解蛋白质的功能和相互作用网络。
三、代谢途径数据库资源代谢途径数据库资源主要用于存储和查询生物体内代谢途径的信息。
KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个常用的代谢途径数据库资源,它包含了多个物种的代谢途径图和相关基因的信息。
学生们可以通过该数据库资源了解细胞内各种代谢途径的组成和相互关系。
四、基因调控数据库资源基因调控数据库资源主要用于存储和查询基因的调控信息。
对于初二生物学学习来说,了解基因调控的基本概念和机制是非常重要的。
TRANSFAC是一个常用的基因调控数据库资源,该数据库中包含了转录因子、调控元件及其相互作用的信息。
学生们可以通过该数据库资源了解基因调控的基本原理和调控网络的组成。
五、细胞结构数据库资源细胞结构数据库资源主要用于存储和查询细胞器结构和功能的信息。
很好—生物信息相关数据库资源介绍
3).核酸三维结构数据库
NDB - Nucleic Acid Databank (3D structures) BNASDB - Nucleic acid structure db from University of Pune
4).其他
AsDb - Aberrant Splicing db (异常拼接) ACUTS - Ancient conserved untranslated DNA sequences db Codon Usage Db - The frequency of codon use in each organism is made searchable through this World Wide Web site. EPD - Eukaryotic Promoter db(真核启动子) HOVERGEN - Homologous Vertebrate Genes db (同源 脊椎动物) IMGT - ImMunoGeneTics db [Mirror at EBI] (免疫遗传学) ISIS - Intron Sequence and Information System RDP - Ribosomal db Project gRNAs db - Guide RNA db PLACE - Plant cis-acting regulatory DNA elements db
5)Transgenics(转基因)
Cre Transgenic Database - Cre transgenic mouse lines Transgenic/Targeted Mutation Database Information on transgenic animals and targeted mutations
生物信息学数据库分类整理汇总
生物信息学数据库分类整理汇总生物信息学数据库是存储和管理生物学领域的大量数据的重要工具和资源,对于生物信息学研究、基因组学、蛋白质组学、转录组学等领域的研究具有重要的意义。
本文将对生物信息学数据库进行分类整理和汇总,方便生物信息学研究者更好地使用和了解这些数据库。
1.基因组数据库:- GenBank:美国国家生物技术信息中心(NCBI)维护的基因序列数据库,包含已知基因的核酸序列。
- Ensembl:英国恩格斯尔基因组项目维护的一个综合性基因组数据库,包含多种物种的基因组数据。
- UCSC Genome Browser:加利福尼亚大学圣克鲁兹分校开发的一个基因组浏览器,提供多种物种的基因组序列和注释信息。
2.蛋白质数据库:- UniProt:一个综合性的蛋白质数据库,集成了多个蛋白质序列和注释信息资源。
- Protein Data Bank (PDB):存储大量已解析的蛋白质结构数据的数据库,提供原子级别的结构信息。
- Protein Information Resource (PIR):收集和整理蛋白质序列、结构和功能信息的数据库。
3.转录组数据库:- NCBI Gene Expression Omnibus (GEO):存储和共享大量的高通量基因表达数据的数据库。
- ArrayExpress:欧洲生物信息学研究所(EBI)开发的一个基因表达数据库,包含多种生物组织和疾病的表达数据。
4.疾病数据库:- Online Mendelian Inheritance in Man (OMIM):记录人类遗传疾病和相关基因的数据库。
- Orphanet:收集和整理罕见疾病和相关基因的数据库。
5.代谢组数据库:- Human Metabolome Database (HMDB):一个综合性的人类代谢物数据库,包括代谢产物的结构和功能信息。
- Kyoto Encyclopedia of Genes and Genomes (KEGG):包含多种生物体代谢途径的数据库。
生物信息学常用数据资源介绍
生物信息学常用数据资源介绍
生物信息学是一门涉及生命科学和计算科学的交叉学科,其主要研究内容是通过计算机技术来分析生物信息。
生物信息学所涉及的数据资源种类繁多,包括但不限于基因组、转录组、蛋白质组、代谢组等不同层次的生物信息数据。
本文将介绍生物信息学常用的数据资源。
1. 基因组数据资源
基因组数据是生物信息学中最基本的数据资源之一,主要包括基因序列、基因位置、基因注释等信息。
在基因组数据资源中,目前最为重要的是人类基因组数据资源,包括NCBI和Ensembl等数据库,
它们提供了全面而丰富的人类基因组数据和注释信息,为人类基因组学研究提供了重要的支持。
2. 蛋白质组数据资源
蛋白质组数据是研究蛋白质的组成、结构、功能以及相互作用等方面的数据资源,主要包括蛋白质序列、结构、功能、互作等信息。
蛋白质组数据资源包括UniProt、PDB、InterPro等数据库,为蛋白
质学研究提供了重要的数据支持。
3. 转录组数据资源
转录组数据是研究转录过程中基因表达及其调控的数据资源,主要包括转录本序列、表达量、差异表达、可变剪接等信息。
转录组数据资源包括NCBI GEO、EBI ArrayExpress等数据库,为研究基因表
达和调控提供了重要的数据支持。
4. 代谢组数据资源
代谢组数据是研究生物代谢过程中代谢物及其相互作用的数据资源,主要包括代谢物浓度、通路、代谢酶等信息。
代谢组数据资源包括KEGG、HMDB等数据库,为研究生物代谢过程及其调控提供了重要的数据支持。
以上是一些常用的生物信息学数据资源,它们为生命科学研究提供了重要的数据支持,为生物信息学的发展和应用提供了基础。
生物信息学常用数据库(已分类)
疟原虫属(Plasmodium)基因组 酵母基因组数据库(SGD) /Saccharomyces 酿酒酵母基因组 TIGR微生物数据库 /tdb/mdb/mdbcomplete.html
COMPEL http://compel.bionet.nsc.ru/ 复合调控元件(Composite regulatory elements)
CUTG http://www.kazusa.or.jp/codon/ 遗传密码使用表
DBTBS http://dbtbs.hgc.jp/ 枯草杆菌反式作用因子和启动子
ArkDB /sites.html 农业相关和其他动物的基因组数据库
综合的微生物资源(CMR) /tigr-scripts/CMR2/CMRHomePage.spl 已完成测序的微生物基因组
CropNet / 农作物基因组图谱
CyanoBase http://www.kazusa.or.jp/cyano/
Synechocystis sp.基因组
EMGlib http://pbil.univ-lyon1.fr/emglib/emglib.html 已完成基因组测序的细菌、古细菌、酵母
EcoGene /EcoGene/EcoWeb/ 大肠杆菌(E.coli)K-12的序列
帖子
441
积分
20
金币
339
贡献值 3 点
最后登录 10-5-10
名称 地址 说明
AceDB /Software/Acedb/ 线虫(C.elegans),酵母(S.pombe)的序列和基因组信息
AmmtDB r.it/mitochondriome/ 寄生虫(Metazoan)线粒体DNA序列
06第六章 常用生物信息学数据库简介
英国辛克斯顿
ID U00096 standard; circular genomic DNA; CON; 4639221 BP. AC U00096; SV U00096.1 DT 24-JUL-2003 (Rel. 76, Last updated, Version 3) DE Escherichia coli K-12 MG1655 complete genome. KW . OS Escherichia coli K12 OC Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacteriales; OC Enterobacteriaceae; Escherichia; Escherichia coli. RN [1] RP 1-4639221 RX MEDLINE; 97426617. RX PUBMED; 9278503. RA Blattner F.R., Plunkett G. III, Bloch C.A., Perna N.T., Burland V.,… RT "The complete genome sequence of Escherichia coli K-12"; RL Science 277(5331):1453-1474(1997). DR GOA; O32528. DR REMTREMBL; AAC74436; AAC74436. DR SPTREMBL; O32530; O32530. DR SWISS-PROT; O32528; YPDI_ECOLI. …
EMBL数据库简介
EMBL是最早的DNA序列 数据库,于1982年建立。
EMBL的数据来源主要有两条途径: 一是由序列发现者直接提交。几乎所有的国际权 威生物学刊物都要求作者在文章发表之前将所测定的 序列提交给EMBL、GenBank或DDBJ,得到数据库管 理系统所签发的登录注册号。 二是从生物医学期刊上收录已经发表的序列资料。
【2019年整理】很好—生物信息相关数据库资源介绍
2.蛋白质序列和相关数据库
蛋白质序列数据库
PIR-international -The Protein Information Resource (protein sequence) (国际蛋白质信息中心,
NBRF+JIPID+MIPs,PIR1\PIR2\PIR3\PIR4))
TelDB - Multimedia Telomere(端粒) Resource
TRADAT - TRAnscription Databases and Analysis Tools
Subviral RNA db - Small circular RNAs db (viroid and viroid-like) (类病毒)
tmRDB - tmRNA dB
tRNA - tRNA compilation(编辑) from the University of Bayreuth
uRNADB - uRNA db
5)其他核酸数据库
RNA editing - RNA editing site
RNAmod db - RNA modification db
3).核酸三维结构数据库
NDB - Nucleic Acid Databank (3D structures) BNASDB - Nucleic acid structure db from University of Pune
4).其他
AsDb - Aberrant Splicing db (异常拼接) ACUTS - Ancient conserved untranslated DNA sequences db Codon Usage Db - The frequency of codon use in each organism is made searchable through this World Wide Web site. EPD - Eukaryotic Promoter db(真核启动子) HOVERGEN - Homologous Vertebrate Genes db (同源 脊椎动物) IMGT - ImMunoGeneTics db [Mirror at EBI] (免疫遗传学) ISIS - Intron Sequence and Information System RDP - Ribosomal db Project gRNAs db - Guide RNA db PLACE - Plant cis-acting regulatory DNA elements db
生物信息学教学资料:生物信息学常用数据库
Bioinformatics Method and Practice
1
生物信息学常用数据库
• 一级数据库
–数据库中的数据直接来源于实验获得的原始数 据,只经过简单的归类整理和注释。
• 二级数据库
–对原始生物分子数据进行整理、分类的结果, 是在一级数据库、实验数据和理论分析的基础 上针对特定的应用目标而建立的。
human
Arabidopsis
Thermotoga maritima
Thermoplasma acidophilum
mouse
Caenorhabitis elegans
rat
Borrelia burgorferi
Plasmodium falciparum
Borrelia burgorferi
Aquifex aeolicus
– FlyBase (Drosophila genome database) – BDGP (Berkeley Drosphila genome project)
Danio rerio (Zebrafish)
– ZFIN (Zebrafish Information Network at University of Oregon, USA) – WashU-Zebrafish Genome Resources (Zebrafish EST database at Washington University, USA)
ftpncbinlmnihgovbloacidsequencednasequencetblastxblastxblastntblastnblastpnucleotidedatabaseproteindatabasenucleotidedatabasenucleotidedatabaseproteindatabasetranslatedtranslatedtransstpproteinprotein比较氨基酸序列与蛋白质数据库使用取代矩阵寻找较远的关系进行seg过滤blastnnucleotidenucleotide比较核酸序列与核酸数寻找较高分值的匹配对较远的关系不太适blastxnucleotideprotein比较核酸序列理论上的六个读码框的所有转换结果和蛋白质数据库用于新的dna序列和ests的分析可转译搜索序列tblastnproteinnucleotide比较蛋白质序列和核酸序列数据库动态转换为六个读码框的结果用于寻找数据库中没有标注的编码区可转译数据库序列tblastxnucleotidenucleotide比较核酸序列和核酸序列数据库经过两次动态转换为六个读码框的结果转译搜索序列与数据库序列32wwwniuwkcom牛牛文档分以blastx为例6
生物信息学中的数据库资源及其应用
生物信息学中的数据库资源及其应用摘要:伴随着生物信息学的发展,生物信息数据库日趋完善。
现对生物信息学、数据库的建设及其应用情况进行了综述,并展望生物信息学的发展前景。
关键词:生物信息学;数据库的建设及其应用生物信息学(Bioinformatics)是80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科,最初常被称为基因组信息学。
广义地说,生物信息学是一门采用计算机技术和信息论方法对蛋白质及其核酸序列等多种生物信息采集、加工、储存、传递、检索、分析和解读的科学,是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。
美国人类基因组计划中[1],对基因组信息学有这样的定义:它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。
这一定义包含着两方面的内容,一方面是发展有效的信息分析工具,构建适合于基因组研究的数据库,用于搜集,管理,使用人类基因组和模式生物基因组的巨量信息。
另一方面是配合实验研究,确定约30亿个碱基对的人类基因组完整核苷酸顺序,找出全部约10万个人类基因在染色体上的位置以及包括基因在内的各种DNA片段的功能,也就是“读懂”人类基因组[2]。
正如基因组信息学的定义所确定的,它的研究内容主要包含两个部分,一是基因组相关数据的收集与管理,另一个是基因组数据内涵的分析与解释,也就是遗传密码的破译。
生物信息学自产生以来大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段。
前基因组时代的标志性工作包括生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等;基因组时代的标志性工作包括基因识别与发现、网络数据库系统的建立和交互界面工具的开发等;后基因组时代的标志则是大规模基因组分析、蛋白质组分析以及各种数据的比较与整合。
三个阶段虽无明显的界限,却真实地反映了整个研究重心的转移变化历程[3]。
1 生物信息学数据库简介近年来随着大量生物学实验数据的积累,众多的生物学数据库也相继出现,它们各自按照一定的标准收集和处理生物学实验数据,并提供相关的数据查询、处理等服务。
生物信息数据库大全
生物信息(bioinformation)数据库大全摘要: [生物信息(bioinformation)数据库大全] http: smartli77 cctrblog netcmd html?do=blogs&id=548&uid=1511 生物信息(bioinformation)数据库一.数据库目录2000年,出版《核酸研究》的牛津大学出版社设立了一个数据库目录网页,这个网页把数据库分成18类在郝柏林、张淑誉编著的《生物信息(bioin……[关键词:数据库序列基因基因组蛋白质蛋白质序列基因图谱]……关键词:数据库序列基因基因组蛋白质蛋白质序列基因图谱/cmd.html?do=blogs&id=548&uid=1511生物信息(bioinformation)数据库一.数据库目录2000年,出版《核酸研究》的牛津大学出版社设立了一个数据库目录网页,这个网页把数据库分成18类在郝柏林、张淑誉编著的《生物信息(bioinformation)学手册》中,他们进行了合并,又把数据库目录、农林牧有关数据库、医学数据库和文献单独列出,分成以下16类:1.数据库目录2.综合数据库包括DNA序列阵:EMBL、GenBank、DDBJ、GSDB、TDB和UniGene3.DNA序列数据库主要是与基因结构和认定有关的数据库,如密码子使用频度表、真核生物启动子库、内含子和外显子库等4.RNA序列和核糖体数据库5.基因图谱数据库6.人类基因组数据库7.其他物种基因组数据库8.基因表达数据库9.基因突变、病理和免疫数据库10.蛋白质序列数据库11.蛋白质结构数据库12.比较基因组学(comparative genomics)和蛋白质组学(Proteomics)数据库13.代谢途径和细胞调控数据库14.与农林牧有关数据库15.医学数据库16.其他数据库二.综合数据库INSD,国际核酸序列数据库(International Nucleotide Sequence Databank)由日本的DDBJ、欧洲的EMBL和美国的GenBank三家各自建立和共同维护EMBL库,欧洲分子生物学实验室的DNA和RNA 序列库/embl.htmlGenBank ,美国国家生物技术信息中心(NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库/Web/Genbank/DNA Databank of Japan (DDBJ) ,日本核酸数据库http://www.ddbj.nig.ac.jp/GSDB是由美国国家基因组资源中心(NCGR)维护的DNA序列关系数据库(Genome Sequence DataBase)/gsdb/TIGR DATAbase,是世界上最大的cDNA数据库,还有大量的EST序列和人类基因索引(HGI)/tdb/hcd/overview.html三.DNA序列和结构数据库包括与DNA的复制、转录、修复等有密切关系的蛋白质因子BioSino是中国自主开发的核酸序列公共数据库/CUTG,密码子使用频度表http://www.dna.affrc.go.jp/~nakamura/CUTG.htmlhttp://www.kazusa.or.jp/codon/http://www.dna.affrc.go.jp/~nakamura/CUTG.html EPD,真核生物启动子数据库(Eukaryotic Promotor Database)http://www.epd.isb-sib.ch/TRANSFAC,真核生物基因表达调控因子的数据库http://transfac.gbf.de/TRANSFACTRRD.真核生物基因组转录调控区数据库http://www.mgs.bionet.nsc.ru/mgs/dbases/trrd4/ OOTFD,转录因子和基因表达数据库/RepBase,真核生物DNA中重复序列数据库/~server/repbase.html MicroSatellite,微卫星重复序列数据库/gopher-menus/MicroSatelliteDatabase.html ALU数据库是人及其他灵长类代表性的Alu重复片段(/pub/jmc/alu/)Simple Repeats,简单重复序列库/COMPEL,复合元件数据库ftp://ftp.gbf-braunschweig.de(/pub/compel/)MPDB,分子探针数据库http://www.biotech.ist.unige.it/interlab/mpdb.htmlHvrBase,灵长类mtDNA调控区序列库,主要是人的HVI和HVII两个高变异区的序列http://monolith.eva.mpg.de/hvrbase/PlantCARE,植物顺式作用(cis-acting)调控因子数据库.http://sphinx.rug.ac.be:8080/PlantCare/PLACE是从文献中搜集的植物顺式作用调控元件DNA模体的数据库,只涉及维管植物.http://www.dna.affrc.go.jp/htdocs/PLACE/ftp://ftp.dna.affrc.go.jp(/pub/dna_place/place.seq)Mendel数据库,搜集植物STS和EST序列./HOX Pro同源异型盒(homeobox)基因数据库.http://spirov.iephb.nw.ru/hox_pro/hox-pro00.htmlOPD,寡核苷酸探针数据库(Oligonucleotide Probe Database)./OPD/dbSTS,序列标记位点(Sequence Tagged Sites)数据库./dbSTS/ftp://(/repository/dbSTS)dbEST.这是GenBank的重要组成部分,它包含若干物种的已表达的序列标记信息. /dbEST/ftp://(/repository/dbEST)AmmtDB,后生动物线粒体DNA多序列联配数据库,搜集了脊椎动物(vertebrates)线粒体中编码蛋白质和tRNA的多DNA序列对比数据,以及哺乳动物(mammal;mammalian)mtDNA主调控区序列联配数据.r.it:8000/BioWWW/#AMMTDBHOVERGEN,脊椎动物(vertebrates)同源基因数据库(HOmologous VERtebrateGENes)http://acnuc.univ-lyon1.fr/ftp://biogen.fr(/pub/db/acnuc/hovergen)DNA结构参数库.ftp://transfac.gbf.de(/pub/structure_library)NUCLEOSOME数据库,收集实验测定的核小体数据,用于预测DNA中与组蛋白八聚体结合的位点.ftp:///pub/databases/nucleosomal_dna/SELEX_DB,随机化序列库.http://www.mgs.bionet.nsu.ru/mgs/systems/selex/ASDB,交替剪接基因的数据库.:8888/Intronerator,秀丽线虫内含子和交替剪接数据库/~kent/intronerator/IDB和IEDB前者是内含子序列数据库,后者是内含子演化数据库/intron/index.htmlEID,外显子、内含子数据库/gilbert/EID/ExInt,外显子、内含子数据库.sg/rint/exint.htmlNDB,核酸晶体结构数据库ftp:////NDB/ndb.htmlVectorDB,载体数据库/Vector和Vector-ig,包分子生物学常用的许多载体的注释和序列信息ftp://(/repository/vetcor-ig)ftp://(/repository/vector)四.RNA序列和核糖体数据库1993年成立的RNA学会,在出版RNA刊物同时,还维护着两个信息网页:/~rna1//Journals/JNLSCAT/rRNA/rna.htmlsnoRNA,小核仁RNA数据库/biochem... noRNA-DataBase.htmlSmall RNA数据库/smallRNA/smallrna.htmlRNAse P数据库,包含RNA水解酶P的RNA亚基序列、联配、二级结构和三维模型/RNAseP/home.htmltmRNA网点包含tmRNA序列、公认蛋白质水解标记、序列联配、确定新tmRNA 的导引,以及简要综述等/~tmrna/tmRDB.已经联配好的、加有注释的、按亲缘关系排列的tmRNA序列数据/dbs/tmRDB/tmRDB.htmlgRNA,导引RNA数据库http://www.biochem.mpg.de/~goeringe/SRPDB,信号识别粒子数据库/dbs/SRPDB/SRPDB.htmlTransTerm,信使RNA的组分和翻译控制信号数据库/Transterm/类病毒和类病毒样RNA数据库herb.ca/~jpperra/UTRdb和UTRsiteUTRdb是真核生物mRNA的5’端和3’端非翻译区序列的非冗余数据库,UTRsite搜集这些非翻译区序列中的功能片段r.it:8000/EmbIT/UTRHome/ncRNA,似mRNA的非编码RNA数据库http://www.man.poznan.pl/5Sdata/ncRNA/index.htmlRNAmods,RNA修饰数据库/RNAmods/RNAmods.htmlftp://(/library/RNAmods)AARSDB,酰氨基tRNA合成酶数据库http://rose.man.poznan.pl/aars/index.htmltRNA序列和基因、结构与功能数据库http://www.uni-bayreuth.de/departments/biochemie/trna/PLMItRNA基于FastA的绿色植物线粒体tRNA分子和tRNA基因的数据库r.it:8000/srs6//services/16SMDB、16S-likeMDB 、16SMDBexp 、23SMDB、23S-likeMDBexp数据库,是一批16S和23S核糖体RNA突变数据库/departments/biology/databasee/rna.htmlftp://(/nar/)RNA www,RNA二级结构网页,也有16S RNA和23S RNA的数据:8080/RNA/uRNADB,已经联配好的、加有注释的、按亲缘关系排列的uRNA序列数据/dbs/uRNADB/uRNADB.htmlU-insertion/deletion,编辑序列数据库,包含5个无脊椎动质体目物种的线粒体基因和编辑后的mRNA序列/RNA/trypanosome/database.html PseudoBase,假扭结数据库http://www.bio.leidenuniv.nl/~Batenburg/PKB.htmlRDP,核糖体数据库计划包含小亚基和大亚基的两部分rRNA,由已联配的RNA序列以及亲缘树组成/RDP//(/pub/)SSU rRNA欧洲核糖体小亚基RNA结构数据库http://rrna.uia.ac.be/ssu/LSU rRNA欧洲核糖体大亚基RNA结构数据库http://rrna.uia.ac.be/lsu/5S rRNA数据库http://rose.man.poznan.pl/5Sdata/index.htmlDRC,核糖体交链数据库http://www.mpimg-berlin-dahlem.mpg.de/~ag_ribo/ag_brimacombe/drc/ ACTIVITY,DNA和RNA中功能位点数据库http://www.mgs.bionet.nsu.ru/systems/Activity/RNA非正则配对数据库/bp_type/五.基因图谱数据库Rhdb,辐射杂交数据库/RHdb/Rhdb/species/HUMAN/gm99.htmlftp://(/pub/databases/RHdb)Mouse RH数据库/mouse_rh/GDB,人类基因组数据库/ftp:///GeneMap’99,人类基因图谱1999年版/genemap/HuGeMap,人类基因遗传图谱和物理图谱的分布式集成数据库ftp://(/pub/databases/RHdb/gm99.map) 六.人类基因组有关数据库人类染色体数据网址:http://linkage.rockefeller/chr1//HGP/chr1/HGP/chr2///HGP/chr4//HGP/chr6http://www.genet.sickkids.on..ca/chrdb:8080/chr8/home.html /chr9/HGP/chr9/htdocs/chr10-mapping/ /HGP/chr10///datapage//database.html /chr12/home.html /~genome/ /HGP/chr13//HGP/chr15//HGP/chr15///tdb/humgen/c16.htmlhttp://bioinformatics.weizmann.ac.il//HGP/chr18///bbrp/genome/genome.html http://www.expasy.ch/cgi-bin/lists?humchr20.txt /HGP/chr20/http://www.expasy.ch/cgi-bin/lists?humchr21.txt /chr21/welcome.html http://www.cephb.fr/chromosome21.html/HGC22.htmlhttp://www.expasy.ch/cgi-bin/lists?humchr22.txt /hum22/HGP/chr22//gifs/http://www.expasy.vh/cgi-bin/lists?humchrx..txt:8080/chrX/home.html/HGP/chrX/http://www.expasy.ch/cgi-bin/lists?humchry.txt/mitomap.html1.人类基因组测序中心HUGO是人类基因组组织的缩写/HUGO Pacific GENOME Newsletter 是HUGO在太平洋部分,其中反映中国情况的短文在:http://hugo-pacific.genome.ac.jp/3_2contents/china.html美国能源部支持的人类基因组计划(genome project)/production/ober/hug_top.html美国国家卫生署对人类基因组计划(genome project)的支持,通过NHGRI即国家人类基因组研究所(National Human Genome Research Institute)体现/英国Wellcome Trust是人类基因组计划(genome project)的另一个主要资助者/百慕大原则:测序的中间和最终结果都必须迅速的公开/hugo/bermuda.html世界上主要人类基因组测序中心的名单/inf/Hgcenters.html/hgmis/centers.htmlNCBI的GenBank数据库从1999年10月起,建立了智人基因组子目录,其下按染色体编号设子目录/genbank/genomes/H_sapiens/英国的Sanger中心的人类基因组计划(genome project)网页,不仅有它们负责测序的染色体数据,还有到其他染色体数据的链接/HGP/日本的DDBJ和信息生物学中心(CIB)联合建立了一个Human Genomics Studio,可以按染色体编号检索和查找基因序列http://studio.nig.ac.jp/Sanger 中心是世界上最大的DAN测序中心之一承担人类基因组计划(genomeproject)的三分之一,集中在1、6、9、10、13、20、22和X/HGP/stats.htmlLBNL,Lawrence Berkeley国家实验室/GenomeHome.htmlLLNL,Lawrence Livermore 国家实验室/bbrp/genome/genome.htmlLANL,美国洛斯阿拉莫斯国家实验室/index.htmlJGI,由美国能源部支持的,依托LBNL、LLNL和LANL三个国家实验室的人类基因组研究部门建的联合基因组研究所(Joint Genome Institute)/UWGC,华盛顿大学基因中心,是国际上最活跃的测序中心之一/ftp:///SHGC,斯坦福大学人类基因中心,主要做高分辨率辐射杂交图谱,以及人类第四号染色体BAC克隆的测序/美国哥伦比亚大学基因中心,主要研究和人类疾病有关的基因和第13号染色体图谱/~genome/http://genome3.cpmc//~legion/GENETHON,法国人类基因组研究中心http://www.genethon.fr/genethon_en.html2.人类基因组有关数据GenBank、EMBL 、GSDB 、GDB等综合数据库的主要内容都来自人UniGene,人类基因序列集合,搜集了GenBank中不同基因产物的序列/UniGene/HIB数据库,是德国人类基因组计划(genome project)中基因分析项目所建立的自动注释的基因集团数据库http://www.mips.biochem.mpg.de/proj/human/dbSNP,设在美国国家生物技术信息中心NCBI的单核苷酸多态性数据库,收录单核苷酸置换,以及短的删除和插入所导致的多态性/SNP/Whitehead的生物医学研究所的人类单核苷酸多态性(SNP)数据库/SNP/humanHGBASE是人类双等位基因序列(Human Genic Bi-Allelic Sequences)的缩写,这是人类基因从启动子到转录终点,即基因及其前后所发现的所有单核苷酸多态性和其他变化的数据库http://hgbase.interactiva.de/http://hgbase.cgr.ki.se/位于St.Louis的华盛顿大学的SNP数据库/SNP/I.M.A.G.E协作组,他们共享高质量的cDNA克隆库,并把有关序列、图谱和表达数据公开/bbrp/image/image/html美国菌种保藏中心(American Type Culture Collection)/GenMapDB,V.Cheung实验室维护的一个BAC图谱数据库/vcheung/BAC Ends,人类BAC末端数据库/tdb/humgen/bac_end_search/HUGE,人类未经实验证实的编码基因的数据库http://dazusa.or.jp/huge/IXDB,集成的人类X染色体物理图谱数据库http://ixdb.mpimp-berlin-dahlem.mpg.de/Genotype,法国人类多态性研究中心的基因型数据库http://www.cephb.fr/cephdb/VIRGIL,专门为GDB中的人类基因和GenBank中的DNA序列提供对应链接关系的数据库biogen.fr/services/birgil/Hpvirgil.htmlftp://biogen.fr(/pub/db/viogil/virgil.ffl)KinMutBase,人类致病蛋白质激酶突变数据库http://www.uta.fi/imt/bioinfo/KinMutBase/CpGIsle,人类基因中CpG岛数据库ftp://bioslave.uio.no(/cpgisle)ftp://biogen.fr(/pub/db/cpgisle/)ftp://(/pub/databases/cpgisle)p53数据库研究人类肿瘤及肿瘤细胞系p53基因突变的数据库,包括:p53库、体细胞突变库、种系突变库和细胞系突变库http://perso.curie.fr/tsoussi/IARC p53数据库法国国际癌症(cancer)研究会的肿瘤和细胞系P53基因突变数据库http://www.iarc.fr/p53/homepage.html/p53数据库具有癌症(cancer)倾向家族P53种系突变数据库http://www.lf2.cuni.cz/projicts/germline_mu_p53.htmlftp://ftp.lf2.cuni.cz(/pub/doc/medical/)人类P53基因突变及软件/dnam/des_p53.html人类hprt即次嘌呤磷酸核糖基转移酶基因突变数据库和在PC视窗下运行的分析软件/dnam/des_hprt.html转基因啮齿动物LacI数据库/dnam/des_laci.html转基因啮齿动物LacZ突变库基因突变数据库及分析软件/dnam/des_lacz.htmlWRN基因突变与遗传病Werner综合征有关/werner/ws-wrn.htmlOMIM,在线人类孟德尔遗传数据库/omim/STACK,南非国家信息中心SANBI维护的一个序列标记联配和代表序列知识库http://www.sanbi.ac.za/Dbases.htmlSANIGENE是与STACK密切相关的一个数据库它包含所有经过计算机处理联配过的人类基因EST的集团http://www.sanbi.ac.za/Dbases.html七.其他物种基因组数据库DOGS,基因组尺寸数据库http://www.cbs.dtu.dk/GenBank的/genomes/子目录:ftp://(/pub/databases/genband/genomes/) EuGenes,真核生物基因综合知识库,目前包括果蝇、人、小鼠、拟南芥(Arabidopsis thaliana)、线虫、酵母、和斑马鱼的数据/eugenes1.原核生物基因组细菌基因组计划(genome project)的进展情况,可从以下网站查询:/PMGifs/Genomes/bact.htmlMOT ,欧洲生物信息(bioinformation)研究所EBI的基因组测序进展表/~sterk/genome-MOT/GIB,日本DDBJ设立的Genome Information Broker for microbial genomes 的缩写http://mol.genes.nig.ac.jp/gib/MAGPIE测序计划清单也可以参考/~gaasterland/genomes.htmlEMGLib,增补微生物基因组库http://pbil.univ-lyon1.fr/emglib/emglib.html大肠杆菌(Escherichia coli)K12菌株的完全基因组序列,可由GenBank的子目录/genomes/获取,或从华盛顿大学大肠杆菌(Escherichia coli)基因组中心,即Blattner实验室的网页读取:/pub/sequence/ECDC,大肠杆菌(Escherichia coli)菌株K12的基因序列库,包括基因、读框、调控区、启动子、终止子、tRNA和rRNA等http://susi.bio.uni-giessen.de/ecdc/ecdc.htmlftp://)/pub/databases/ecdc)EcoGene和EcoWeb,大肠杆菌(Escherichia coli)K12菌株基因组数据库,包括基因、蛋白质、基因间蛋白质组信息/EcoGene/EcoWeb/RegulonDB,大肠杆菌(Escherichia coli)转录调控和操作子数据库http://www.cifn.unam.mx/Computational_Biology/regulondb/ NRSub,非冗余枯草芽孢杆菌DNA数据库,包括完全基因组、密码子使用表、基因图谱和基因家族http://acnuc.univ-lyon1.fr/nrsub/nrsub.htmlftp://ftplnig.ac.jp(/pub/db/nrsub)HIDB,流感嗜血菌完全基因组的原始数据库/tdb/mdb/hidb/hidb.htmlftp:///pub/data/h_influenzaeHIDC,流感署血菌基因序列库http://susi.bio.uni-giessen.de/ecdc/hidc.htmlCyanoBase,蓝细菌数据库,实际上是集胞蓝细菌的基因组数据库蓝细菌具有氧化和光合作用所需的全套基因http://www.kazusa.or.jp/cyano/cyano.htmlMJDB,詹氏甲烷球菌基因组数据库ftp://(/pub/data/m_jannaschii)/tdb/mdb/mjdb/mjdb.htmlMycDB,分枝杆菌数据库http://www.biochem.kth.se/MycDB.htmlRsGDB,类球红细菌基因组数据库第一作者联系:mailto:/madhu@PGI,疫霉属基因预研究计划的数据库/pgi/2.真菌基因组SGS,酿酒酵母基因组数据库/Saccharomyces/ftp://(/pub/yeast)LISTA,LISTA-HOP和LISTA-HON是酿酒酵母基因组中蛋白质编码序列及其同源性的数据库/ftp://bioftp.unibas.ch/MYGD,酵母基因组、蛋白质和同源关系的数据库http://www.mips.biochem.mpg.de/proj/yeast/YIDB,酵母内含子数据库http://www.EMBL-Heidelberg.DE/ExternalInfo/seraphin/yidb.html MNCDB,由德国MIPS所维护的粗糙链孢霉基因组数据库http://www.mips.biochem.mpg.de/desc/neurospora/真菌基因组资源的网址::5080/main.htmlFGSC,真菌遗传学信息中心/3.原生生物和线虫基因组欧洲生物信息(bioinformation)研究所EBI的原生生物网页:/Projects/Protozoa/AceDB,线虫综合数据库ftp://(/pub/acedb)ftp://(repository/acedb)ftp://lirmm.lirmm.fr(/pub/acedb)关于线虫发育特别是化学感觉神经的研究/4.昆虫基因组斯坦福大学的果蝇基因组中心/FlyBase,果蝇基因和分子数据库/ftp:///FlyNets,果蝇分子和遗传相互作用数据库http://gifts.univ-mrs.fr/FlyNets/GIF-DB,果蝇胚胎发育过程中基因相互作用的WWW数据库http://www-biol.univ-mrs.fr/~lgpd/GIFTS_home_page.html 哈佛大学的果蝇网页/MsqDB,蚊子基因数据库/acedb/MsqDB-acedb.html ftp:///5.鱼类数据库美国国家卫生署1997年建立的斑马鱼网页/science/models/zebrafish/ZFIN,斑马鱼基因组、发育突变和野生种系数据库/ZFIN/Fugu是河豚的数据库/6.啮齿动物基因组下面是有关家鼠的数据库M.Musculus基因组库ftp://(/genbank/genomes/M_muslulus)MGD,家鼠基因组库,现在又称MGI即家鼠基因组信息库/mgd.htmlftp:///Cre转基因家鼠系的数据库/periodical/yc/yc9903/990314html RatMap,大鼠基因图谱数据库http://ratmap.gen.gu.se/7.细胞器数据库主要是线粒体和叶绿体基因的数据MitoNuc和MitoAln是关于编码线粒体蛋白的细胞核基因的两个相互关联的数据库r.it:8000/srs6/GOBASE,细胞器基因组数据库http://megasun.bch.umontreal.ca/gobase/MitBASE,线粒体DNA数据库,集成所有已知线粒体基因信息/Research/Mitbase/mitbase.pl/人类线粒体数据库r.it8000/Tutorials/MitBASE/MitBASE Pilot,酵母线粒体中核基因数据库/Research/Mitbase/mitbase.pl/植物和藻类线粒体数据库:8889/mitb... .pla_show_qry_opts/原生生物线粒体数据库r.it:8000/Tu... /protist_table.html脊椎动物(vertebrates)线粒体数据库r.it:8000/Tutorials/MitBASE/vertebrate.html8.拟南芥(Arabidopsis thaliana)基因组MATDB,国际拟南芥(Arabidopsis thaliana)基因组计划(genome project)的数据汇总http://www.mips.biochem.mrg.de/desc/thal/AtDB,拟南芥(Arabidopsis thaliana)基因组数据库/Arabidopsis/ftp://(/pub/arabidopsis) DatA,拟南芥(Arabidopsis thaliana)基因组注释库/group/arabprotein/ TAIR,拟南芥(Arabidopsis thaliana)信息资源/AGR,拟南芥(Arabidopsis thaliana)基因组资源/agr/agr.htmlTIGR-AT,TIGR研究所的似南芥EST和基因序列数据库/tdb/at/at.html9.病毒数据库ICTVdB,病毒数据库.au/viruses/ICTVdB/ictvdb.html VIDEdB,病毒鉴定交换数据库.au/research-groups/MES/vide/RDV,水稻(Rice)矮缩病毒基因组数据库/rdv/八.蛋白质序列数据库SWISS-PROT是对数据人工审读很严格的库http://www.expasy.ch/sprot/TrEMBL是从EMBL库中的核酸序列翻译出来的氨基酸序列,已经完成了自动注释:5000/PIR是蛋白质信息资源的缩写/pir/http://www.mips.biochem.mpg.de/proj/protseqdb/GenBank是由GenBank中的DNA序列翻译得到的蛋白质序列,与TrEMBL相似、但没有像后者那样经专家审读biogen.fr/srs/PROSITE,由专家根据生物知识审编的SWISS-PROT蛋白质序列中有生物意义的位点、模式和轮廓的数据库http://www.expasy.ch/prosite/PrositeScan服务器,根据用户填表提交的蛋白质序列搜索PROSITE模式http://www.isrec.isb-sib.ch/software/PSTSCAN_form.htmlPSD,蛋白质序列数据库,是PIR的主体/pirwww/dbinfo/texpsd.htmlPATCHX,PIR的子库之一,收入尚未纳入PIR库的蛋白质序列/pirwww/dbinfo/patchx.htmlARCHIVE,PIR的子库之一,保存PIR库中条目的原始文献或最初提交的序列/pirwww/dbinfo/achive.htmlProClass,蛋白质类数据库,是根据PROSITE库和PIR库中超家族的关系组织起来的非冗余蛋白质库/gsfserver/prolclass.html/proclass.htmlPIR-ASDB,PIR的注释和相似性数据库/por/KIND,瑞典斯德哥尔摩生物信息(bioinformation)中心维护的非冗余蛋白质序列库ftp://ftp.mbb.ki.se(/pub/KIND)ENZYME,基于命名系统的酶数据库http://www.expasy.ch/enzyme/BRENDA,这是一个内容广泛的酶的信息库http://www.brenda.uni-koeln.de/OWL,蛋白质序列库,是由SWISS-PROT,PIR,GenBank翻译序列和PDB等数据库产生的非冗余的蛋白质序列库/bmb5dp/owl.htmlGeneCards,由以色列魏茨曼科学研究所维护的关于基因及其产物,以及它们的生物医学应用的文献库http://bioinfo.weizmann.ac.il/cardsSWISS-2DPAGE,由二维聚丙烯酰胺凝胶电泳所确定的蛋白质的参考图谱数据库,包括文本和图象信息,通向其他2D-PAGE数据库的链接等http://www.expasy.ch/ch2d/HDB,组蛋白数据库,包括联配好的组蛋白序列以及已确认包含有组蛋白折叠模体的非蛋白序列,以及所有已知组蛋白和组蛋白质折叠的结构,同时指出不同数据库中类似序列的差异/histones/HOBACGEN数据库,包含按家族组织的所有细菌的蛋白质序列,有助于从各种细菌选取同源家族,作多序列联配和构建亲缘树http://www.mips.biochem.mpg.de/proj/medgen/mitop/MITOP,线粒体蛋白质组数据库,包括线粒体有关的基因、蛋白质和疾病信息/Research/Mitbase/mitbase.pl/MITOMAP,人类线粒体基因组数据库/mitomap.htmlREBASE,限制性内切酶和甲基化酶数据库/rebaseProtoMap,蛋白质分类数据库http://www.protomap.cs.huji.ac.il/ISSD蛋白质序列数据库http://www.protein.bio.msu.su/issd/PRF,日本蛋白质研究基金会维护着三个蛋白质和多肽数据库:PRF/LITDB文献库、PRF/SEQDB序列库及PRF/SYNDB合成产物库http://prfsun2.prf.or.jp/MEROPS,肽酶数据库/Merops/Merops.htmlPKR,蛋白激酶信息库/Kinases/pkr/pkk_catalytic/pk_cat_list.html Wnt基因网页/rnusse/wntwindow.html PhosphoBase,磷酸化位点数据库http://www.cbs.dtu.dk/databases/PhosphoBase/ SYSTERS,蛋白质集团数据库http://www.dkfz-heidelberg.de/tbi/services/cluster/DIP蛋白质相互作用数据库/DexH/D数据库/~ej67/dbhome.htm Homeodomain,同源异形结构域数据库/homeodomain/InBase,新英格兰生物实验公司的蛋白质剪接数据库/neb/inteins.htmlLGICdb,配体门控离子通道(ion channel)数据库http://www.pasteur.fr/recherche/banques/LGIC/LGIC.html SENTRA,信号传递蛋白质数据库/WIT2/Sentra/ICN,离子通道(ion channel)网络,是由美国神经科学数据库中心等单位联合建立的一个内容丰富的网页/csn/Aaindex,氨基酸索引数据库http://www.genome.ad.jp/aaindex/九、蛋白质结构和分类数据库PDB,蛋白质结构数据库/pdb/RCSB,结构生物信息(bioinformation)学信息学合作研究组织/PDBNEW,下一版PDB库正式发布前收到的全新或更新条目/PDBFinder,在PDB、DSSP、HSSP、基础上建立的二级库,包含PDB序列、作者、R因子、分辨率、二级结构等http://www.sander.embl-heidelberg.de/pdbfinder/ftp://swift/embl-heidelberg.de(/pdbfinder)PDB at a Glance清单/modeling/pdb_at_a_glance.html PDBselect数据库http://swift.embl-heidelberg.de/pdbsel/PDBsum是PDB库中数据的更便于阅读的总结和分析,以及一些衍生数据/bsm/pdbsum/index.html BioMagResBank简称BMRB,是关于多肽、蛋白质和核酸的核磁共振数据库/CSD,剑桥结构数据库/prods/csd.htmlNRL-3D,三维结构已经确定的蛋白质序列库/Dan/proteins/nr13d.htmlFAMBASE,,是每个蛋白质家族的代表序列的集合,它有助于加速同源性搜索/pirwww/dbinfo/fambase.html ProtFam,蛋白质超家族的序列联配数据库http://www.mips.biochem.mpg.de/proj/protfam/protfam/SCOP,蛋白质结构分类数据库/scop/CATH,蛋白质结构与功能关系分类数据库/bsm/cath/PIR-ALN,蛋白质序列联配数据库/pir/alndb.html3Dee,蛋白质结构域定义的数据库:8080/3Dee/ProTherm,蛋白质及其变异体热力学数据库http://www.rtc.riken.go.jp/protherm.htmlASTRAL是基于SCOP数据库的一组分析蛋白质结构和蛋白质序列的数据库和工具/RESID,蛋白质翻译后修饰情况的数据库/pirwww/search/textresid.htmlSMART是简单模块构架搜索工具的缩写http://SMART.embl-heidelberg.de/PROMISE数据库/bmbknd/promise/MAIN.htmlMMDB蛋白质分子模型数据库/Structure/VAST矢量联配搜索工具http://swift.embl-heidelberg.de/dssp/DSSP,PDB库中所有蛋白质条目的二级结构归属数据库http://swift.embl-heidelberg.de/dssp/HSSP,按同源性导出的蛋白质二级结构数据库http://www.sander.embl-heidelberg.de/hssp/Dali/FSSP,基于PDB数据库中现有蛋白质三维结构,用自动结构对比程序Dali逐一比较而形成的折叠单元和家族分类库http://www.embl-ebi.ac.ul/dali//dali/fssp/3d_ali数据库,搜集彼此相关的蛋白质序列和结构数据http://www.embl-heidelberg.de/argos/ali/ali.htmlDEF蛋白质折叠类的预测数据库http://zeus.cs.uoi.gr/neural/biocomputing/def.htmlINFOGENE,Sanger中心计算基因组学小组维护的、各基因组测序计划所提供的序列中已知的蛋白质和预测出的基因与蛋白质的数据库/inf/infodb.htmlTMBase,跨膜蛋白数据库ftp://ulrec3.unil.ch(/pub/tmbase)PRESAGE是关于结构基因组学(structural genomics)的一个数据库,它为库中每个蛋白质搜集了反映当前实验状况、结构、模型和研究建议的注释/SBASE,带有注释的蛋白质序列片、即蛋白质结构域的数据库,由ICGEB建立和维护http://www.icgeb.trieste.it/sbase/InterPro,集成的蛋白质结构域和功能位点数据库/interpro/HITS,瑞士新近建立的一个蛋白质结构域数据库http://www.isrec.isb-sib.ch/cgi-bin/hits/hits_indexBLOCKS,蛋白质分类与同源性数据库,包含蛋白质家族中保守区域的组块多序列联配的数据/BLOCKS+数据库/PFAM高质量的蛋白质结构域家族数据库/Sorfware/Wise2/PRINTS数据库最近改名为PRINTS-S,这是一个蛋白质家族的指纹和模体数据库/dbbrowser/PRINTS/ProDom自动产生的蛋白质结构域家族数据库http://www.toulouse.inra.fr/prodom.htmlDOMO,蛋白质结构域数据库biogen.fr/services/domo/GRBase,这是参与基因调控的蛋白质的数据库/~regulate/PMD,蛋白质突变体数据库http://pmd.ddbj.nig.ac.jp/GLYCBASE,蛋白质糖基化位点数据库http://www.cbs.dtu.dk/databases/OGLYCBASE/ORDB嗅觉受体蛋白质序列数据库/senselab/ordb/CarbBank亦称CCSD,复杂碳水化合物结构数据库,通常与蛋白质结构数据库归在一起/SWISS-3DIMAGE,蛋白质三维图象和PDB浏览器http://www.expasy.ch/sw3d/IMB,大分子三维图象库http://www.imb-jena.de/IMAGE.htmlBioImage,多维生物学数据库/MolMovDB,耶鲁大学的生物信息(bioinformation)学研究室维护的分子运动数据库/MolMovDB/ModBase,蛋白质结构模型比较数据库/modbase/十.比较基因组学(comparative genomics)和蛋白质组学(Proteomics)数据库COG直系同源聚类数据库/COG/GeneCensus,耶鲁大学生物信息(bioinformation)学研究室维护的各物种基因组的比较数据库,着重于折叠单元的结构对比/XREFdb/XREFdb,哺乳动物(mammal;mammalian)和模式生物(model organism)的基因和遗传学交叉引用数据库/YPDhome.htmlYPD,酿酒酵母蛋白质组数据库/YPDhome.htmlWormPD,线虫蛋白质组学(Proteomics)数据库/YPDhome.html十一.基因表达数据库Flyview,果蝇基因表达数据库http://flyview.uni-muenster.de/Flybrain,果蝇神经系统(Nervous System)图谱和数据库http://flybrain.uni-freiburg.de/NEXTDB,线虫基因表达模式数据库http://watsom.genes.nig.ac.jp:8080/db/MAGEST数据库,其名字来自Maboya Gene Expression patters and Sequence Tags 短语的缩写http://star.scl.kyoto-u.ac.jp/magest/BodyMap,人类和家鼠基因表达数据库http://bodymap.ims.u-tokyo.ac.jp/Axeldb,非洲爪蟾基因表达数据库http://www.dkfz-heidelberg.de/abt0135/axeldb.htmlXMMR,非洲爪分子标记资源/TRIPLES,酵母基因功能数据库,设在耶鲁大学医学院的基因组分析中心/triples/MGEIR,集成的家鼠基因表达信息资源/GXD,家鼠基因表达数据库/searches/gxdindex_form.html EpoDB,脊椎动物(vertebrates)红细胞生成基因表达分析数据库/epodb/KidneyDB,肾脏发育数据库/anatomy/kidbase/kidhome.html ToothExp,牙齿基因表达数据库http://honeybee.helsinki.fi/toothexp/toothexp.html十二.基因突变、病理和免疫数据库HGMD人类基因突变数据库,可用于预测基因疾病/uwcm/mg/hgmd0.htmlMarfan人类FBN1基因突变数据库及分析软件/uwcm/mg/hgmd0.html Collagen人类胶原数据库//genetics/collagen/人类PAX2等位基因变异数据库/Softdata/PAX2/。
生物信息数据库简介
1. GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。
它是由美国国立生物技术信息中心(NCBI)建立和维护的。
它的数据直接来源于测序工作者提交的序列;由测序中心提交的大量EST序列和其它测序数据;以及与其它数据机构协作交换数据而来。
Genbank每天都会与欧洲分子生物学实验室(EMBL)的数据库,和日本的DNA数据库(DDBJ)交换数据,使这三个数据库的数据同步。
到1999年8月,Genbank 中收集的序列数量达到460万条,34亿个碱基,而且数据增长的速度还在不断加快。
Genbank 的数据可以从NCBI的FTP服务器上免费下载完整的库,或下载积累的新数据。
NCBI还提供广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以从NCBI的主页上找到这些服务。
Genbank库里的数据按来源于约55,000个物种,其中56%是人类的基因组序列(所有序列中的34%是人类的EST序列)。
每条Genbank数据记录包含了对序列的简要描述,它的科学命名,物种分类名称,参考文献,序列特征表,以及序列本身。
序列特征表里包含对序列生物学特征注释如:编码区、转录单元、重复区域、突变位点或修饰位点等。
所有数据记录被划分在若干个文件里,如细菌类、病毒类、灵长类、啮齿类,以及EST数据、基因组测序数据、大规模基因组序列数据等16类,其中EST数据等又被各自分成若干个文件。
(1)Genbank数据检索NCBI的数据库检索查询系统是Entrez。
Entrez是基于Web界面的综合生物信息数据库检索系统。
利用Entrez系统,用户不仅可以方便地检索Genbank的核酸数据,还可以检索来自Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、来自分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、以及由PubMed获得Medline的文献数据。
Entrez提供了方便实用的检索服务,所有操作都可以在网络浏览器上完成。
生物数据库介绍——NCBI
⽣物数据库介绍——NCBINCBI(National Center for Biotechnology Information,美国国家⽣物技术信息中⼼)除了维护GenBank核酸序列数据库外,还提供数据分析和检索资源。
NCBI资源包括Entrez、Entrez编程组件、MyNCBI、PubMed、PudMed Central、PubReader、Gene、the NCBI Taxonomy Browser、BLAST、Pimer-Blast、COBALT、RefSeq、UniGene、HomoloGene、ProtEST、dbMHC、dbSNP、dbVar、Epigenomics、the Genetic Testing Registry、Genome和相关⼯具、⽐对查看器、跟踪存档、Sequence Read Archive、BioProject、BioSample、ClinVar、MedGen、HIV-1/⼈类蛋⽩质相互作⽤数据库、Gene Expression Omnibus、Probe、Online Mendelian Inheritance in Animals、the Molecular Modeling Database、the Conserved Domain Database、the Conserved Domain Architecture Retrieval Tool、Biosystem、Protein Clusters and thePubChem suite of small molecule databases,所有这些资源可以在NCBI主页找到。
Databases⼀个提供有关基因组组装结构,装配名称和其他元数据,统计报告以及基因组序列数据链接等信息的数据库。
⼀个有关培养物、动植物样本和其他⾃然样本的精选元数据集。
记录显⽰样本状态,有关馆藏的机构的信息,以及NCBI中相关数据链接。
(生物信息学)CH3生物信息数据库及主要网上资源
未来生物信息数据库的发展将更加注重数据的整合、标准化和共享,同时也会更加注重数据的隐私和 安全问题。此外,随着人工智能和机器学习技术的发展,生物信息数据库将更加智能化和自动化。
02
常用生物信息数据库
GenBank数据库
总结词
全球最大的开放存取生物序列数据库
详细描述
GenBank数据库由美国国家生物技术信息中心(NCBI)维 护,包含了全球范围内的基因组序列、质粒序列、EST序列、 RNA序列等,是生物信息学领域最常用的数据库之一。
04
生物信息数据库分析工具
BLAST软件
强大的序列比对工具
BLAST(Basic Local Alignment Search Tool)是一种用于在数据库中搜索与给定序列相似的序列的工具。它被广泛应用于生物 信息学领域,用于序列比对、基因组注释和功能基因组学研究。BLAST通过局部序列比对算法,能够快速地搜索和比对基因组、 蛋白质和EST等数据库中的序列。
MEGA软件
进化遗传学分析工具
MEGA(Molecular Evolutionary Genetics Analysis)是一个用于进化遗传学分析的工具,
它支持多种数据格式,包括DNA、蛋白质和 氨基酸序列。MEGA提供了多种进化遗传学 分析方法,如分子进化遗传学分析、系统发 育重建和物种进化研究等。它还支持多种算 法和统计方法,帮助研究人员深入了解物种
功能检索
总结词
通过输入蛋白质的功能或活性,查找具有相似功能的蛋白质。
详细描述
功能检索是利用蛋白质的功能信息进行查找的一种方式,用户可以根据已知的蛋白质功能信息,在数据库中找到 具有相似功能的其他蛋白质。
结构检索
总结词
生物信息学:第一讲数据库介绍
�
生物信息学实验
第一讲 数一级数据库(primary databases): ): Genbank数据库,EMBL核酸库和 数据库, 核酸库和DDBJ数据库; 数据库; 数据库 核酸库和 数据库 SWISS-PROT数据库,PIR数据库,PDB数据库 数据库, 数据库, 数据库 数据库 数据库 等等. 等等. 二级数据库( 二级数据库(secondary databases): ): 人类基因组图谱库GDB,真核生物基因表达调 , 人类基因组图谱库 控因子数据库TRANSFAC,蛋白质结构家族分 控因子数据库 , 类库SCOP 等等. 等等. 类库
(五)蛋白质结构与分类数据库
PDB(蛋白质结构数据库 : 蛋白质结构数据库): 蛋白质结构数据库 /pdb/ PROSITE(Motif数据库 : 数据库): 数据库 /prosite/ SCOP(蛋白质结构分类数据库 : 蛋白质结构分类数据库): 蛋白质结构分类数据库 /scop CATH(蛋白质结构与功能关系分类数据库 : 蛋白质结构与功能关系分类数据库): 蛋白质结构与功能关系分类数据库 /bsm/cath/
(三)基因组数据库
GDB(人类基因组数据库 : 人类基因组数据库): 人类基因组数据库
euGenes(真核生物基因综合知识库 : 真核生物基因综合知识库): 真核生物基因综合知识库 /
(四)蛋白质序列数据库
SWISS-PROT(无冗余蛋白序列数据库 : 无冗余蛋白序列数据库): 无冗余蛋白序列数据库 /sprot/ PIR(蛋白质信息资源库 : 蛋白质信息资源库): 蛋白质信息资源库 /pirwww OWL(复合蛋白序列数据库 : 复合蛋白序列数据库): 复合蛋白序列数据库 /dbbrowser/OWL/
生物信息学数据库大全
综合数据库★INSD,国际核酸序列数据库(International Nucleotide Sequence Databank)。
由日本的DDBJ、欧洲的EMBL和美国的GenBank三家各自建立和共同维护。
★EMBL库,欧洲分子生物学实验室的DNA和RNA 序列库。
/embl.html ★GenBank ,美国国家生物技术信息中心(NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库。
/Web/Genbank/★DNA Databank of Japan (DDBJ) ,日本核酸数据库。
http://www.ddbj.nig.ac.jp/★GSDB是由美国国家基因组资源中心(NCGR)维护的DNA序列关系数据库(Genome Sequence DataBase)。
/gsdb/★TIGR DATAbase,是世界上最大的cDNA数据库,还有大量的EST序列和人类基因索引(HGI)。
/tdb/hcd/overview.htmlDNA序列数据库包括与DNA的复制、转录、修复等有密切关系的蛋白质因子。
★BioSino是中国自主开发的核酸序列公共数据库。
/★CUTG,MM子使用频度表。
http://www.dna.affrc.go.jp/~nakamura/CUTG.htmlhttp://www.kazusa.or.jp/codon/http://www.dna.affrc.go.jp/~nakamura/CUTG.html★EPD,真核生物启动子数据库(Eukaryotic Promotor Database)。
http://www.epd.isb-sib.ch/★TRANSFAC,真核生物基因表达调控因子的数据库。
http://transfac.gbf.de/TRANSFAC★TRRD.真核生物基因组转录调控区数据库。
http://www.mgs.bionet.nsc.ru/mgs/dbases/trrd4/★OOTFD,转录因子和基因表达数据库。
生物信息学常用数据资源介绍
生物信息学常用数据资源介绍
生物信息学是一门跨学科的学科,它将计算机科学与生物学有机地结合起来,为生命科学研究提供了新的方法和手段。
在生物信息学中,数据资源是非常重要的,因为数据资源直接关系到生物信息学研究的深度和广度。
本文将介绍生物信息学中常用的数据资源,包括基因组数据库、蛋白质数据库、序列数据库、文献数据库等。
1. 基因组数据库
基因组数据库是基因组信息的集大成者。
基因组数据库收集了各种生物的基因组序列、基因注释、基因组结构等信息。
常用的基因组数据库有:GenBank、EMBL、DDBJ、NCBI、Ensembl、UCSC Genome Browser 等。
2. 蛋白质数据库
蛋白质数据库是收集了各种生物的蛋白质序列、蛋白质结构、蛋白质功能等信息的数据库。
常用的蛋白质数据库有:UniProt、PDB、Swiss-Prot、TrEMBL等。
3. 序列数据库
序列数据库主要收集了各种生物的核酸序列和蛋白质序列。
常用的序列数据库有:NCBI GenBank、EMBL、DDBJ、RefSeq、UniProtKB 等。
4. 文献数据库
文献数据库主要收集了各种与生物学相关的学术文献,包括期刊论文、会议论文、书籍等。
常用的文献数据库有:PubMed、Web of
Science、Google Scholar等。
总结
生物信息学中的数据资源非常丰富,为生物信息学研究提供了非常重要的数据支持。
除了以上介绍的常用数据资源,还有很多其他的数据资源,例如代谢组数据库、蛋白质互作数据库等等。
研究者可以根据自己的需要选择合适的数据资源,以便更好地开展生物信息学研究。
与生物有关的数据库介绍
共600多种期刊 有化学期刊75种, 材料科学27种, 环境科学27种, 生物学121种。
生物期刊列表:121种
5. ScienceDirect OnSite:1731种
有生命科学免疫学和 微生物学等800多种
142种
470种
303种
6. Springer Link :1489种期刊
一般 检索 高级 检索中文全• 3.中国重要会议论文集全文数据库:收录 我国各级政府职能部门、高等院校、科 研院所、学术机构等单位的论文集, 年更 新约10万篇文章,截止2004年年底已累 计收录文献量在同一个平台上。
以中国学术期刊数据库为例:
选择 标记记录
题录的详细信息
同名作者选择
下载全文:点击题名, 然后再点击PDF下载保存
高级检索
5.超星数字图书馆:有图书近60万册 (天津数图中心镜像站)
下载浏览器
高级检索 简单 查询
图书馆分类
生物图书馆有十五部分
总论:136册 遗传:109册 生物物理:79 古生物: 52 动物学: 612 普通生物学: 372
主要收录1998年以来国家级学会、协会、 研究会组织召开的全国性学术会议论文, 数据范围覆盖自然科学、工程技术、 农林、医学等领域,。 收录理工,农医5大类70多个 类目的2500多种科技核心期刊 中国唯一的完整的科技信息群, 有科研机构,科技名人,科技成 果,中外标准,政策法规等
外文全文数据库 1.ACS Publications (美国化学会)
浏览期刊
检索
检索界面
9.NRC加拿大15种期刊
快促检索
期刊列表
7种生物期刊
• • • • • • • • Biochemistry and Cell Biology Canadian Journal of Botany Canadian Journal of Fisheries and Aquatic Sciences Canadian Journal of Forest Research Canadian Journal of Microbiology Canadian Journal of Z600种学术类核 心与专业特色期刊全文,截止2004年年底 已积累全文文献1200多万篇,题录1500 余万条分九大专辑,126个专题文献数据 库。 1994- • 2.中国优秀博硕士学位论文全文数据库: 截止2004年年底已经完成约18万本论文 的数据加工与入库。每年收录全国300家 博士培养单位的优秀博/硕士学位论文。 1999-
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.蛋白质序列和相关数据库 2.蛋白质序列和相关数据库
蛋白质序列数据库
PIR-international -The Protein Information Resource (protein sequence) (国际蛋白质信息中心, 国际蛋白质信息中心,
NBRF+JIPID+MIPs,PIR1\PIR2\PIR3\PIR4)) )
蛋白质三维结构和相关数据库
SBASE - SBASE domain db (Protein domain sequence library) SMART - Protein signalling and extracellular (细胞外) domain patterns (Simple Modular 细胞外) Architecture Research Tool) ProClass - Protein sequence alignments and curation of protein families Kabat - Kabat db of protein of immunological interest PMD - Protein Mutant db
蛋白质二维凝胶电泳数据库
WORLD-2DPAGE - A complete index of 2D-PAGE db and servers Phoretix links - Phoretix page of links to 2D gel db
3、信号传导及蛋白质-蛋白质相互作 信号传导及蛋白质用相关数据库
5)Transgenics(转基因) Transgenics(转基因)
Cre Transgenic Database - Cre transgenic mouse lines Transgenic/Targeted Mutation Database Information on transgenic animals and targeted mutations
5)其它核酸数据库
PlantCARE - Plant cis-acting regulatory DNA elements db sRNA db - Small RNA db ssu rRNA - Small ribosomal subunit db lsu rRNA - Large ribosomal subunit db 5S rRNA - 5S ribosomal RNA db tmRNA Website tmRDB - tmRNA dB tRNA - tRNA compilation(编辑) from the University of (编辑) Bayreuth uRNADB - uRNA db
2).基因组及相关数据 库 Genomic Databases
GenomeWeb(HGMP) - A catalogue of useful Web sites for Genomics with a set of collections of genome databases GSDB - Genome Sequence database (NCGR) GOLD - Genomes On-line db 一些数据库的直接链接
ห้องสมุดไป่ตู้
蛋白质相关数据库
PROSITE - PROSITE dictionary of protein sites and patterns InterPro - Integrated Resources of Proteins Domains and Functional Sites BLOCKS - BLOCKS db DOMO - Protein domain db (Automatically generated) Pfam - Protein families db (HMM derived) [Mirror at Sanger] PRINTS - Protein Motif fingerprint db ProDom - Protein domain db (Automatically generated) PROTOMAP - An automatic hierarchical(分等级) classification of (分等级) SWISS-PROT proteins SBASE - SBASE domain db (Protein domain sequence library) SMART - Protein signalling and extracellular domain patterns (Simple Modular Architecture Research Tool) ProClass - Protein sequence alignments and curation of protein families
生物信息学 数据库资源大全
生物信息学相关数据库资源
1. 1. 2. 2.
3. 3. 4. 4. 5. 5. 6. 6. 7. 7. 8. 8. 9. 9.
核酸及其相关数据库(序列数据库、基因组相关 核酸及其相关数据库(序列数据库、基因组相关 数据库、核酸三维结构数据库、其他) 数据库、核酸三维结构数据库、其他) 蛋白质相关数据库(序列数据库、蛋白质三维结 蛋白质相关数据库(序列数据库、蛋白质三维结 构数据库、蛋白质组数据库(二维凝胶电泳数据 构数据库、蛋白质组数据库(二维凝胶电泳数据 库)、信号传导及蛋白质-蛋白质相互作用相关数 库)、信号传导及蛋白质-蛋白质相互作用相关数 据库、DNA和蛋白质相互作用数据库) 据库、DNA和蛋白质相互作用数据库) 基因或蛋白质一些特定数据库 基因或蛋白质一些特定数据库 糖类及其相关数据库 糖类及其相关数据库 蛋白质翻译后修饰相关数据库 蛋白质翻译后修饰相关数据库 基因表达数据库 基因表达数据库 人类基因突变及疾病相关数据库 人类基因突变及疾病相关数据库 进化相关数据库及资源专利数据库 进化相关数据库及资源专利数据库 资源目录服务器或网页 资源目录服务器或网页
3).核酸三维结构数据库
NDB - Nucleic Acid Databank (3D structures) BNASDB - Nucleic acid structure db from University of Pune
4).其他
AsDb - Aberrant Splicing db (异常拼接) 异常拼接) ACUTS - Ancient conserved untranslated DNA sequences db Codon Usage Db - The frequency of codon use in each organism is made searchable through this World Wide Web site. EPD - Eukaryotic Promoter db(真核启动子) (真核启动子) HOVERGEN - Homologous Vertebrate Genes db (同源 脊椎动物) 脊椎动物) IMGT - ImMunoGeneTics db [Mirror at EBI] (免疫遗传学) ISIS - Intron Sequence and Information System RDP - Ribosomal db Project gRNAs db - Guide RNA db PLACE - Plant cis-acting regulatory DNA elements db
DIP - Db of Interacting Proteins INTERACT - Protein-Protein interaction db ProNet - Protein-Protein interaction db CANSITE - Signal Transduction‘s (信号传导)Web 信号传导) SPAD - Signaling pathway db CSNDB - Cell Signaling Networks db
5)其他核酸数据库
RNA editing - RNA editing site RNAmod db - RNA modification db TelDB - Multimedia Telomere(端粒) Resource TRADAT - TRAnscription Databases and Analysis Tools Subviral RNA db - Small circular RNAs db (viroid and viroid-like) (类病毒)
核酸及其相关数据库
1)、核酸序列数据库 )、核酸序列数据库 )、 BIOSINO 我国的核酸序列公共数据库 EMBL - EMBL Nucleotide sequence database (EBI) GenBank - GenBank Nucleotide Sequence database (NCBI) DDBJ - DNA Data Bank of Japan dbEST - Database of Expressed Sequence Tags (表达序列标签)(NCBI) dbSTS - Database of Sequence Tagged Sites (序 列标签位点) (NCBI)
蛋白质三维结构和相关数据库
PDB - Protein Data Bank [Mirrors in EBI] BioMagResBank – Repository(知识) for data on proteins, (知识) peptides, and nucleic acids from NMR spectroscopy(光谱学) (光谱学) SWISS-MODEL Repository - Automatically generated protein models db ModBase - Db of comparative protein structure models CATH - UCL BSM structural classification of proteins SCOP - Structural classification of proteins [Mirror at USA | Israel | Singapore | Australia] Mol_R_Us - Molecules R Us, browser for PDB BMM Domain Server - Biomolecular Modelling Laboratory (ICRF) protein domain server PRESAGE - Collaborative resource for structural genomics