生物奥赛培训生物信息学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Entries
碱基
物种
2217460 1556595261
553872 260818221
77205 177824883
123758 133950582
72565 117022315
87138 47136422
80507 42049391
14403 30390617
61001 26060656
5240
NCBI
GenBank记录起始 IV: 序列
ANACIAG A.nidulans aciA gene for AciA protein Seq: ANACIAG Length: 3042 Sun Jan 19 21:10:37 1997 Check: 422 ..
1 AAGCTTACTT GTGTCCATTT TCTGGATTCC AGACTCAAGA CCAGTGCTAA 51 AGAAAACCCC TAGATTACTA TTTCAACCAT ATTATTTTTT TCCTTGCCAG 101 AATTTAATCG CGAGCGTAGA AGCCAACTAT ACTACAAACA GGCTGTCCCA 151 ATGAAACTGT AGATTTCTAT CGAGTGCTTC TACTTTTACC AAAATTTATT 201 ATTACTTATC TCCTTTTGTC AATTCCACGC TCTGAGCTGG GGCTTTTTGC 251 TGACAGTCAA GTGAGGGGGA GGGGCGGGAG TTTACCCCTC ATGCGGGGAA 301 GACCGTGTGT TGTAGATCAT ACTGACAGCC AGCGACAAAG TATGTCGGCC 351 AGTTTGCAAG TCAACCTGAG GCAGCAGAGA CGATTGGAAG AGC…….
18407242
32227 17046673
33482 14732289
31504 14498639
9882
14270269
5446
11539475
19704 10817282
1101
10008018
13898
9038361
16089
8486371
11429
7007861
Homo sapiens Mus musculus Caenorhabditis elegans Drosophila melanogaster Arabidopsis thaliana Oryza sativa Rattus norvegicus Saccharomyces cerevisiae Rattus sp. Escherichia coli Fugu rubripes Danio rerio Human immunodeficiency virus type 1 Schizosaccharomyces pombe Plasmodium falciparum Zea mays Bacillus subtilis Magnaporthe grisea Dictyostelium discoideum Lycopersicon esculentum
• EST数据库,高通量基因组序列 • 用途:发现新基因
对特定对象的数据库
• RDP, G-蛋白偶联受体数据库等 • 用途:视数据库而定,通常用于获取特定领域的信息
NCBI
主要数据库:
• GenBank (美国) • EMBL (欧洲) • DDBJ (日本)
通用核酸数据库
NCBI
GenBank - 按物种分类
分子生物学数据类型 物种
基因组图谱
PDB entry 1CIS P.Osmark, P.Sorensen, F.M.Poulsen
RNA序列
DNA序列 RNA结构
蛋白质序列 蛋白质结构
NCBI
分子生物学数据类型
核酸结构模体: 转录因子结合位点(CBF1:CCGNC ) (TACCGACAT ) RNA 催化模体
序列数据库
• 含注释 • 无注释 • 针对特定对象
结构数据库
模体数据库
RNA表达
分子生物学数据库
基因组数据库 蛋白质组数据库 突变 多形性 代谢途径 物种 种群 文献
NCBI
序列数据库
含注释的序列数据库
• SWISS-PROT, GenBank 等 • 用途: 功能识别,获取信息
无注释的序列数据库
蛋白质结构
DNA序列 RNA结构
蛋白质模体
NCBI
药物设计
与抑制因子结合的HIV-1蛋白酶复合体
PDB entry 1DIF A.M.Silva, R.E.Cachau, H.L.Sham, J.W.Erickson
NCBI
底物
组织和细胞
分子生物学数据类型 物种
RNA表达 蛋白质表达
DNA模体 RNA序列
基因组图谱
RNA序列 蛋白质序列
DNA序列
...TRLRPLLALLALWPPPPARAFVNQHLCGSHLVEA...
NCBI
分子生物学数据类型 物种
基因组图谱
RNA序列
DNA序列 RNA结构
蛋白质序列
NCBI
E. coli small subunit rRNA
Gutell R.R. (1994) Collection of small subunit (16S- and 16Slike) ribosomal RNA structures Nucleic Acids Res 22:3502
Direct Submission
Submitted (24-JAN-1992) Jennifer A. Saleeba, Department of
Genetics, University of, Melbourne, Grattan Street, Parkville,
Victoria, 3052, Australia
蛋白质序列
基因组图谱 DNA序列
RNA结构
NCBI
代谢途径
抑制因子和药物
蛋白h质tt结p:/构/www.atcc.org
蛋白质模体
种群 组织和细胞 底物
代谢途径
分子生物学数据类型 物种
RNA表达 蛋白质表达
抑制因子和药物
DNA模体 RNA序列
蛋白质序列 蛋白质结构
Hale Waihona Puke Baidu
基因组图谱 DNA序列
RNA结构
蛋白质模体
Eukaryotae; mitochondrial eukaryotes; Fungi; Ascomycota;
Euascomycetes; Plectomycetes; Eurotiales; Trichocomaceae;
Emericella.
1 (bases 1 to 3042)
Saleeba,J.A., Cobbett,C.S. and Hynes,M.J.
抑制因子和药物
蛋白质结构
疾病
分子生物学数据类型 基因组图谱
DNA序列 RNA结构
蛋白质模体
NCBI
种群
突变/多形性
组织和细胞 底物
RNA表达 蛋白质表达
物种
分子生物学数据类型 基因组图谱
DNA模体
RNA序列 文献
蛋白质序列
DNA序列 RNA结构
NCBI
代谢途径
抑制因子和药物
蛋白质结构
疾病
蛋白质模体
ANACIAG
3042 bp DNA
PLN
28-NOV-1996
A.nidulans aciA gene for AciA protein.
Z11612 S51247
g5544
aciA gene; AciA protein.
Emericella nidulans.
Emericella nidulans
NCBI
种群
突变/多形性
分子生物学数据类型 物种
组织和细胞 底物
RNA表达 蛋白质表达
DNA模体 RNA序列
蛋白质序列
代谢途径
抑制因子和药物
蛋白质结构
基因组图谱 DNA序列
RNA结构
蛋白质模体
NCBI
种群
突变/多形性
组织和细胞 底物
RNA表达 蛋白质表达
物种 DNA模体
RNA序列 蛋白质序列
代谢途径
NCBI
通用蛋白质数据库
SWISS-PROT
NCBI
FEATURES source
mRNA exon
mRNA exon
CDS
GenBank记录起始 III: 特征
Location/Qualifiers 1..3042 /organism="Emericella nidulans" /strain="Glasgow" /chromosome="Segment of chromosome 1" join(969..1263,1318..1493,1553..2624) /gene="aciA" 969..1263 /gene="aciA" /number=1 join(1205..1263,1318..1493,1553..2624) /gene="aciA" 1205..1263 /gene="aciA" /number=1 join(1249..1263,1318..1493,1553..2495) /gene="aciA" /codon_start=1 /product="AciA" /db_xref="PID:g5545" /db_xref="SWISS-PROT:Q03134"
蛋白质模体
NCBI
分子生物学数据类型
物种
RNA表达
DNA模体 RNA序列 蛋白质序列
蛋白质结构
基因组图谱 DNA序列
RNA结构
蛋白质模体
NCBI
在RNA水平上使用DNA微阵列检测变异
一个芯片上包含酵母基因组全序列
红色点: RNA 表达水平增加的基因 绿色点: RNA表达水平降低的基因
De Risi et al, Science 278:680 http://cmgm.Stanford.EDU/pbrown/
Characterization of the amdA-regulated aciA gene of Aspergillus
nidulans
Mol. Gen. Genet. 235 (2-3), 349-358 (1992)
93101140
2 (bases 1 to 3042)
Saleeba,J.A.
生物奥赛培训生物信 息学
生物信息学-数据库
生物学已经积累了相当丰富多样和复杂的数据。这些数据可以被分类,但相当难于综合以及用公式进行描述。 随着生物学知识大量增加,要完成对数据的处理只能使用计算机。
NCBI
生物信息学-数据库
目标: ➢ 在分子生物学和基因组学中常见数据类型的概述 ➢ 介绍主要序列数据库,比较它们包含的数据内容和注释质量的区别 ➢ 数据库接受数据的形式(文本搜索,相似性搜索,浏览和交叉索引) ➢ 序列与非序列数据库介绍以及它们的用途 ➢ 一级序列与结构数据库介绍
物种 DNA模体
蛋白质模体: 结构模体 保守区(D/N-R-X-G-R-R/K;
I-X2-R-X3-G-X3-G ) NAD+结合区含有一个保守的模体
[G]-[X]-[G]-[X2]-[G] (GSGAWA)(D. salina) 活性位点等
RNA序列 蛋白质序列
蛋白质结构
基因组图谱 DNA序列
RNA结构
NCBI
记录分为3部分:
• 记录起始 • 特征表 • 序列
GenBank剖析 I: 数据结构
NCBI
GenBank剖析 II:记录起始
LOCUS DEFINITION ACCESSION NID KEYWORDS SOURCE
ORGANISM
REFERENCE AUTHORS TITLE
JOURNAL MEDLINE REFERENCE AUTHORS TITLE JOURNAL
DNA模体 RNA序列 蛋白质序列
蛋白质结构
基因组图谱 DNA序列
RNA结构
蛋白质模体
KEGG database, http://kegg.genome.ad.jp/kegg/
NCBI
底物 代谢途径
分子生物学数据类型 物种
基因组图谱
RNA表达 蛋白质表达
抑制因子和药物
DNA模体 RNA序列 蛋白质序列
NCBI
分子生物学数据类型 物种
基因组图谱
NCBI
小鼠X染色体
来源于小鼠基因组计划 http://www.informatics.jax.org/
分子生物学数据类型 物种
RNA序列
基因组图谱 DNA序列
NCBI
...AATGGTACCGATGACCTGGAGCTTGGTTCGA...
分子生物学数据类型 物种
NCBI
分子生物学数据类型
物种
基因组图谱
RNA表达 蛋白质表达
DNA模体 RNA序列
DNA序列 RNA结构
蛋白质序列
蛋白质结构
蛋白质模体
NCBI
蛋白质组学: 2D凝胶电泳 SWISS-2D PAGE数据库 http://www.expasy.ch
NCBI
底物 代谢途径
分子生物学数据类型 物种
RNA表达 蛋白质表达