微生物基因组学——【生物信息学】
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
816
677
• Mycoplasma pulmonis
963
782
1. 原核生物基因组的大小--基因组较大的原核生 物
• Prokaryocyte
Genome(kb)
• Xanthomonas campestris
5,076
4,182
• Xanthomonas axonopodis
5,273
4,386
12,069
6,294 1,092
57
Schizosaccharomyces pombe 14,000 4,820 2,033
70
Caenorhabditis elegans
97,000 19,099 1,311
27
Arabidopsis thaliana
115,428 25,498
460
29
Homo sapiens
从0.16-13Mb
编码序列
占ຫໍສະໝຸດ Baidu因组总长度的90%,平均为1Kb左 右
GC含量
16.6%-74.9%
DNA链组成的非 GCskew、ATskew、基因方向性偏好、
对称分布
密码子使用偏好
1. 原核生物基因组的大小--基因组较小的原核生
物
• Prokaryocyte
Genome(kb) ORF
• Mycoplasma genitalium G-37B0
系列1
研究现况及内容
细菌
研究内容
病原菌
毒力因子、致病岛、 耐药基因、耐药机制 以及与寄主的关系等
极端环境 极端环境下的生存机
生长的细 制,如嗜热菌的热稳
菌
定性
工业和环 境有影响 的细菌
CO2固定、固氮、硫 氧化 和氢代谢等
代表菌株
肺炎链球菌、致病性 大肠杆菌、沙门氏 菌等
詹氏甲烷球菌、热自 养甲烷杆菌、甲烷 嗜热菌、腾冲嗜热 菌等
单细胞蓝细菌、丝状 蓝细菌、原绿藻等
二 微生物基因组的特点
• 原核生物基因组的大小 • 原核生物基因组的编码序列(CDS/ORF) • 原核生物染色体结构 • GC 含量 • 重复序列 • DNA链组成的非对称性 • 最小基因组
微生物基因组的特点
类别
特征
染色体结构
多为一条环状闭合双链DNA
基因组大小
Clostridium perfringens
02-01 3,031
2,660 1,492(56%) 502(19%) 666(25%)
Methanosarcina Acetivorans 02-07 5,751
4,524 2,226 (49%) 908 (20%) 1,390 (31%)
2. 原核生物基因组的编码序列-- Distribution of E. coli proteins among 22 functional groups
580
468
• Buchnera sp
640
583
• Buchnera aphidicola SG
641
545
• Glossina brevipalpis
679
621
• Ureaplasma urealyticum serovar 3B0
751
613
• Mycoplasma pneumoniae M129B0
16
12,069
6,294
• Schizosaccharomyces pombe
3
14,000
4,824
• Caenorhabditis elegans
6
97,000
19,099
2. 原核生物基因组的编码序列 (Coding sequence)
ORF • 占原核生物基因组总序列的90%
• 基因的平均大小为1kb
2. 原核生物基因组的编码序列-- 不同生物编码序列的比较
Organism
Genome (kb) ORFs ORF size Coding Sequence(%)
Buchnera sp Aquifex aeolicus
640
583
988
90
1,551
1,512
956
93
Saccharomyces cerevisiae
Organism Date Genome (kb) ORFs known hypo. unique Hypo.
Mycoplasma Genitalium 95-10 580
470 318(68%) 56(12%) 96(20%)
Brucella suis 02-10 2,160
2,175 1,333 (61%) 623 (29%) 219 (10%)
微生物基因组学
中科院北京基因组研究所
微生物基因组学
• 微生物基因组研究概况 • 微生物基因组的特点 • 微生物基因组研究的意义
一 微生物基因组研究概况
微生物基因组重要纪事
年限
事件
1994年
美国DOE启动MGP
1995年
《Science》发表了第一株细菌-流感嗜血杆
菌全基因组
1995年
发表了集胞藻菌株PCC6803的测序和注释
ORF 6,264
1. 原核生物基因组的大小--真核生物基因组的大 小
•
Chr. Genome(kb) ORF
• Guillardia theta
3
551
464
• Encephalitozoon cuniculi
1
2,500
1,997
• Saccharomyces cerevisiae S288C
• Methanosarcina acetivorans C2A
5,751
4,540
• Ralstonia solanacearum GMI1000
5,810
5,120
• Escherichia coli O157:H7. Sakai
5,996
5,448
• Pseudomonas aeruginosa PAO1B6
1996年
《Science》发表了第一个完成的古细菌-詹
氏甲烷球菌全基因组序列
1996年
酵母基因组序列发表
1997年
大肠杆菌K-12基因组序列发表
已发表的微生物基因组数
200 180 160 140 120 100
80 60 40 20
0
1995年 1996年 1997年 1998年 1999年 2000年 2001年 2002年 2003年 2004年 2005年 2006年 2007年 2008年 2009年
3,000,000
30,000 1,340
<2
基因组编码序列的注释
• 确定编码序列
•
序列同源性比较 ,如BLAST
•
概率型方法,基于隐马尔可夫模型的GENSCAN
•
• 基因的功能注释
•
已知功能的蛋白质基因的序列
•
已知功能蛋白质的motif/domain
•
有同源序列的未知基因
•
无同源序列的疑是基因
2. 原核生物基因组的编码序列--ORF的注释