生物信息学 NCBI数据库PPT

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

线虫 ACeDB, Sanger 果蝇 FlyBase, Berkeley 小鼠 MGD, Japan
酵母 Stanford, MIPS
大肠杆菌 WISC
DNA结构数据库
CUTG (Codon Usage Tabulated from GenBank, 密码子使用频度表) [日]
EPD (Eukaryotic Promotor Database, 真核生物启动子数据库) [欧]
7
2、我 的 实 验 室
简单重复序列
简单重复序列(Simple Sequence Repeats, SSRs)也称微卫星序列(Microsatellites)或短串联 重复序列(Short Tandem Repeats,STRs),是由 1-6个碱基对组成的串联重复DNA片段。SSRs在 真核和原核生物的基因组中分布广泛、数量丰富, 并具有较高的突变频率。
12
13
14
NCBI数据库
1、国外的重要生物信息中心 2、NCBI介绍
15
1、国外重要生物信息中心
16
NCBI
• 美国国家生物技术信息中心(National Center for Biotechnology Information)
• 前身是NIH所属的一个研究所的计算生物学 研究室,1988年独立为NCBI,形式上属于国家 医学图书馆(National Library of Medicine/NLM)
21
DDBJ homepage
22
22
国际核苷酸序列数据库联盟
• International Nucleotide Sequence Database Collaboration (INSDC)包括
– GenBank
[美] /Genbank
– EMBL
[欧] /embl/
– DDBJ
[日] http://www.ddbj.nig.ac.jp/
• 每天这三个数据库作数据同步操作
• 在任何一个数据库操作(查找、投递数据等)是
等效的
23
23
TIGR
• 基因组研究所(The Institute for Genomic Research)
• 是重要的测序中心 • 1992年建立 • 1995年参与完成首次全基因组测序(流感嗜血
杆菌) • 拥有世界最大的cDNA数据库之一 • /
24
基因图谱数据库
RHdb (辐射杂交; 人、鼠),GDB (人类),GeneMap (人类; NCBI)
生物医学文献数据库
如: (A)n、 (ACG)n、(ATCG)、(ACCCTT)n
8
简单重复序列与人类疾病
• 简单重复序列是广泛分布在人类基因 组中的,尽管其中很多功能都不太清 楚,但是既然存在总有它存在的意义。 下面总结了一些人类基因组中由于 SSR扩增或变异所引起的相关疾病
9
10
我们实验是近几年发的文章
11
MEDLINE3800多种生物医学期刊 (通过PubMed查询) SCI ISI提供的文献引用检索 (收费)
人类基因组相关数据库
GDB(人类基因组), OMIM(遗传,变异) ,HGVbase [瑞典] (变异,双等位序列)
其他模式生物的基因组数据库
DOGS ( Database of Genome Sizes [丹麦] 综合)
TRANSFAC (真核生物基因表达调控因子的数据库) [德]
RepBase (重复序列), MicroSatellite (微卫星), COMPEL (复合元件),
MPDB (分子探针), NDB (晶体), VectorDB (载体), EID (外显内含子)
25
BioSino
1ቤተ መጻሕፍቲ ባይዱ
生物信息学课件
吴晓龙
2
讲述内容
一、生物信息学和我的实验室 二、NCBI数据库
3
一、生物信息学和我的实验室
4
1、生物信息学介绍
• 生物信息学(Bioinformatics)是在生命
科学的研究中,以计算机为工具对生物信
息进行储存、检索和分析的科学。它是当
今生命科学和自然科学的重大前沿领域之
一,同时也将是21世纪自然科学的核心领
• 管理着许多著名数据库,如GenBank、 Medline、dbSNP、COG、OMIM等
• 提供Entrez、BLAST等服务

17
NCBI homepage
18
EBI
• 欧洲生物信息学研究所(European Bioinformatics Institute)
域之一。其研究重点主要体现在基因组学
(Genomics)和蛋白质组学(Proteomics)
两方面,具体说就是从核酸和蛋白质序列
出发,分析序列中表达的结构功能的生物
信息。
5
• 具体而言,生物信息学作为一门新的学科 领域,它是把基因组DNA序列信息分析作 为源头,在获得蛋白质编码区的信息后进 行蛋白质空间结构模拟和预测,然后依据 特定蛋白质的功能进行必要的药物设计。
19
EMBL homepage
20
20
NIG
• 日本国立遗传学研究所(National Institute of Genetics)
• 创立于1949年7月1日,属文部省管辖 • 信息服务始于1984年 • 维护管理着DDBJ
– 1987年1月发行DDBJ第一版
• http://www.nig.ac.jp
• 基因组信息学,蛋白质空间结构模拟以及 药物设计构成了生物信息学的3个重要组成 部分。
6
主要研究方向
• 1、序列比对 • 2、蛋白质结构比对和预测 • 3、基因识别非编码区分析研究 • 4、分子进化和比较基因组学 • 6、遗传密码的起源 • 7、基于结构的药物设计 • 8、生物系统的建模和仿真 • ……
• 1994年建于英国剑桥,前身是德国海德堡的欧 洲分子生物学实验室的信息服务部门
• EBI接收了原来EMBL数据库的管理和维护 • 是欧洲分子生物学网(EMBnet)的一个特别节

• / (主页) • / (工具) • / (服务)
相关文档
最新文档