生物信息学的研究内容方法及意义
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
– 生物信息学是在生命科学的研究中,以计算机为工具 对生物信息进行储存、检索和分析的科学。
– 生物信息学是当今生命科学和自然科学的重大前沿领 域之一,同时也将是21世纪自然科学的核心领域之一, 其研究重点主要体现在基因组学(Genomics)和蛋白组 学(Proteomics) 。
生物学基础速递
• 细胞(分子水平) • 个体生命 • 生命之树
4 JGI
5,16,19
250
5 Baylor
1,2,3,X
230
6 Riken
21,18,11q
160
7 IMB
8,21,X
50
8 Genoscope
Most of 14
85
9 U. Wash (Olson)
10 Beijing
3p
30
11 GTC (Smith)
10
50
12 MPIMG
17,21,X
H.inf全基因组
Saccharomyces cerevisiae 酿酒酵母
Caenorhabditis elegans 秀丽线虫
1997 大肠杆菌(E.coli)全基因组测序完成
1998 完成人类基因组计划的物理作图 开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争 启动水稻基因组计划
生命的分子基础
• 细胞/分子水平
– DNA/RNA – 蛋白质 –糖 – 脂类
DNA结构和碱基互补原理
中心法则
生物信息学的历史
从人类基因组计划(HGP)说起
曼哈顿原子弹计划
阿波罗登月计划
人类基因组计划
为什么提出HGP?
60年代初,美国总统Kennedy提出两个科学计划:
登月计划 攻克肿瘤计划 人类遗传信息的复杂性
1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元
1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任
1990.10 经美国国会批准,人类基因组计划正式启动
1995 第一个自由生物体流感嗜血菌(H. inf)的全基因组测序完成
1996 完成人类基因组计划的遗传作图 启动模式生物基因组计划
Arabidopsis thaliana 拟南芥
2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图 2001.2.15 《Nature》刊文发表国际公共领域结果 2001.2.16 《Science》刊文发表Celera公司及其合作者结果
2001年2月15日《Nature》封面
13687Kr
0.5 0.45
0.3 0.3 0.29 0.23 0.17 32.64Mr
HGP带来的科学挑战
• 随着实验数据和可利用信息急剧增加,信息的管理和 分析成为HGP的一项重要的工作
利用数学模型 和计算技术
研究基因组数据 之间的关系
2001年2月16日《Science》封面
我国对人类基因组计划的贡献
No
Center
Region
Size(Mb)
1 Sanger Centre
1,6,9,10,13,20,22,X
850
2 W IBR
(Clones from Wash U)
3 Wash U
2,3,4,7,11,15,18,Y
900
信息学
生物信息学
• 说文解字:生物 + 信息 + 学 (bioinformatics)
biology + information + theory • 广义 应用信息科学的方法和技术,研究生物体系
和生物过程中信息的存贮、信息的内涵和信息的 传递,研究和分析生物体细胞、组织、器官的生 理、病理、药理过程中的各种生物信息,或者也 可以说成是生命科学中的信息科学。 • 狭义 应用信息科学的理论、方法和技术,管理、 分析和利用生物分子数据。
人类基因组计划 (HGP,Human Genome Project) 目标:整体上破解人类遗传信息的奥秘
DNA、基因、基因组
生命活动三要素:物质、能量、信息
DNA: 遗传物质(遗传信息的载体) 双螺旋结构
A, C, G, T四种基本字符的复杂文本
基因(Gene):具有遗传效应的DNA分子片段
基因组(Genome):包含细胞或生物体全套的遗传信息的全部
生命信息系统
生物所处的时空系统 物质系统,信息传递与控制,能量
相关学科图示
广义概念图示
狭义概念图示
总结:生物信息学
– 生物信息学(Bioinformatics) 是一门新兴的交叉学科, 是生命科学领域中的新兴学科,面对人类基因组计划 等各种项目所产生的庞大的分子生物学信息,生物信 息学的重要性将越来越突出,它将会为生命科学的研 究带来革命性的变革。
1300
941
4200
>12
837
296
2900
8
865
559
23ห้องสมุดไป่ตู้0
7.9
687
461
2100
6.4
462
261
660
3.1
136
195
520
2.1
180
32
180
1.5
100
118
300
1.4
12.5
12.5
5
40
12
11 27 4663Kr
75 2950Kr
>100 150 40 50 137 110 40
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度
大肠杆菌及其全基因组
水稻基因组计划
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度 2000 Celera公司宣布完成果蝇基因组测序
国际公共领域宣布完成第一个植物基因组——拟南芥全基 因组的测序工作
Drosophila melanogaster 果蝇
遗传物质。原核生物(细菌、病毒等) 真核生物(真菌、植物、动物等)
人类基因组:
3.2×109 bp
HGP的历史回顾
1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义
1985 Dulbecco在《Science》撰文 “肿瘤研究的转折点:人 类基因组的测序” 美国能源部(DOE)提出“人类基因组计划”草案
6.9
13 GBF
21, reg of 9
6
14 Stanford (Davis)
8
23
15 Keio
2,6,8,22,21
30
16 U. Wash (Hood LAB) 14,15
2671
Total
2671Mb
6/1-8/31/99
Projected Kr Proj Accum.
Actual K Genbank Kr 4/1-11/30/99 Mr. 4/99-3/00
– 生物信息学是当今生命科学和自然科学的重大前沿领 域之一,同时也将是21世纪自然科学的核心领域之一, 其研究重点主要体现在基因组学(Genomics)和蛋白组 学(Proteomics) 。
生物学基础速递
• 细胞(分子水平) • 个体生命 • 生命之树
4 JGI
5,16,19
250
5 Baylor
1,2,3,X
230
6 Riken
21,18,11q
160
7 IMB
8,21,X
50
8 Genoscope
Most of 14
85
9 U. Wash (Olson)
10 Beijing
3p
30
11 GTC (Smith)
10
50
12 MPIMG
17,21,X
H.inf全基因组
Saccharomyces cerevisiae 酿酒酵母
Caenorhabditis elegans 秀丽线虫
1997 大肠杆菌(E.coli)全基因组测序完成
1998 完成人类基因组计划的物理作图 开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争 启动水稻基因组计划
生命的分子基础
• 细胞/分子水平
– DNA/RNA – 蛋白质 –糖 – 脂类
DNA结构和碱基互补原理
中心法则
生物信息学的历史
从人类基因组计划(HGP)说起
曼哈顿原子弹计划
阿波罗登月计划
人类基因组计划
为什么提出HGP?
60年代初,美国总统Kennedy提出两个科学计划:
登月计划 攻克肿瘤计划 人类遗传信息的复杂性
1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元
1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任
1990.10 经美国国会批准,人类基因组计划正式启动
1995 第一个自由生物体流感嗜血菌(H. inf)的全基因组测序完成
1996 完成人类基因组计划的遗传作图 启动模式生物基因组计划
Arabidopsis thaliana 拟南芥
2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图 2001.2.15 《Nature》刊文发表国际公共领域结果 2001.2.16 《Science》刊文发表Celera公司及其合作者结果
2001年2月15日《Nature》封面
13687Kr
0.5 0.45
0.3 0.3 0.29 0.23 0.17 32.64Mr
HGP带来的科学挑战
• 随着实验数据和可利用信息急剧增加,信息的管理和 分析成为HGP的一项重要的工作
利用数学模型 和计算技术
研究基因组数据 之间的关系
2001年2月16日《Science》封面
我国对人类基因组计划的贡献
No
Center
Region
Size(Mb)
1 Sanger Centre
1,6,9,10,13,20,22,X
850
2 W IBR
(Clones from Wash U)
3 Wash U
2,3,4,7,11,15,18,Y
900
信息学
生物信息学
• 说文解字:生物 + 信息 + 学 (bioinformatics)
biology + information + theory • 广义 应用信息科学的方法和技术,研究生物体系
和生物过程中信息的存贮、信息的内涵和信息的 传递,研究和分析生物体细胞、组织、器官的生 理、病理、药理过程中的各种生物信息,或者也 可以说成是生命科学中的信息科学。 • 狭义 应用信息科学的理论、方法和技术,管理、 分析和利用生物分子数据。
人类基因组计划 (HGP,Human Genome Project) 目标:整体上破解人类遗传信息的奥秘
DNA、基因、基因组
生命活动三要素:物质、能量、信息
DNA: 遗传物质(遗传信息的载体) 双螺旋结构
A, C, G, T四种基本字符的复杂文本
基因(Gene):具有遗传效应的DNA分子片段
基因组(Genome):包含细胞或生物体全套的遗传信息的全部
生命信息系统
生物所处的时空系统 物质系统,信息传递与控制,能量
相关学科图示
广义概念图示
狭义概念图示
总结:生物信息学
– 生物信息学(Bioinformatics) 是一门新兴的交叉学科, 是生命科学领域中的新兴学科,面对人类基因组计划 等各种项目所产生的庞大的分子生物学信息,生物信 息学的重要性将越来越突出,它将会为生命科学的研 究带来革命性的变革。
1300
941
4200
>12
837
296
2900
8
865
559
23ห้องสมุดไป่ตู้0
7.9
687
461
2100
6.4
462
261
660
3.1
136
195
520
2.1
180
32
180
1.5
100
118
300
1.4
12.5
12.5
5
40
12
11 27 4663Kr
75 2950Kr
>100 150 40 50 137 110 40
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度
大肠杆菌及其全基因组
水稻基因组计划
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度 2000 Celera公司宣布完成果蝇基因组测序
国际公共领域宣布完成第一个植物基因组——拟南芥全基 因组的测序工作
Drosophila melanogaster 果蝇
遗传物质。原核生物(细菌、病毒等) 真核生物(真菌、植物、动物等)
人类基因组:
3.2×109 bp
HGP的历史回顾
1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义
1985 Dulbecco在《Science》撰文 “肿瘤研究的转折点:人 类基因组的测序” 美国能源部(DOE)提出“人类基因组计划”草案
6.9
13 GBF
21, reg of 9
6
14 Stanford (Davis)
8
23
15 Keio
2,6,8,22,21
30
16 U. Wash (Hood LAB) 14,15
2671
Total
2671Mb
6/1-8/31/99
Projected Kr Proj Accum.
Actual K Genbank Kr 4/1-11/30/99 Mr. 4/99-3/00