生物信息学的研究内容方法及意义
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息学
生物信息学
• 说文解字:生物 + 信息 + 学 (bioinformatics)
biology + information + theory • 广义 应用信息科学的方法和技术,研究生物体系
和生物过程中信息的存贮、信息的内涵和信息的 传递,研究和分析生物体细胞、组织、器官的生 理、病理、药理过程中的各种生物信息,或者也 可以说成是生命科学中的信息科学。 • 狭义 应用信息科学的理论、方法和技术,管理、 分析和利用生物分子数据。
生命的分子基础
• 细胞/分子水平
– DNA/RNA – 蛋白质 –糖 – 脂类
DNA结构和碱基互补原理
中心法则
生物信息学的历史
从人类基因组计划(HGP)说起
曼哈顿原子弹计划
阿波罗登月计划
人类基因组计划
为什么提出HGP?
60年代初,美国总统Kennedy提出两个科学计划:
登月计划 攻克肿瘤计划 人类遗传信息的复杂性
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度
大肠杆菌及其全基因组
水稻基因组计划
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度 2000 Celera公司宣布完成果蝇基因组测序
国际公共领域宣布完成第一个植物基因组——拟南芥全基 因组的测序工作
Drosophila melanogaster 果蝇
– 生物信息学是在生命科学的研究中,以计算机为工具 对生物信息进行储存、检索和分析的科学。
– 生物信息学是当今生命科学和自然科学的重大前沿领 域之一,同时也将是21世纪自然科学的核心领域之一, 其研究重点主要体现在基因组学(Genomics)和蛋白组 学(Proteomics) 。
生物学基础速递
• 细胞(分子水平) • 个体生命 • 生命之树
1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元
1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任
1990.10 经美国国会批准,人类基因组计划正式启动
1995 第一个自由生物体流感嗜血菌(H. inf)的全基因组测序完成
1996 完成人类基因组计划的遗传作图 启动模式生物基因组计划
2001年2月16日《Science》封面
我国对人类基因组计划的贡献
No
Center
Region
Size(Mb)
1 Sanger Centre
1,6,9,10,13,20,22,X
850
2 W IBR
(Clones from Wash U)
3 Wash U
2,3,4,7,11,15,18,Y
900
H.inf全基因组
Saccharomyces cerevisiae 酿酒酵母
Caenorhabditis elegans 秀丽线虫
1997 大肠杆菌(E.coli)全基因组测序完成
1998 完成人类基因组计划的物理作图 开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争 启动水稻基因组计划
4 JGI
5,16,19
250
Baidu Nhomakorabea
5 Baylor
1,2,3,X
230
6 Riken
21,18,11q
160
7 IMB
8,21,X
50
8 Genoscope
Most of 14
85
9 U. Wash (Olson)
10 Beijing
3p
30
11 GTC (Smith)
10
50
12 MPIMG
17,21,X
Arabidopsis thaliana 拟南芥
2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图 2001.2.15 《Nature》刊文发表国际公共领域结果 2001.2.16 《Science》刊文发表Celera公司及其合作者结果
2001年2月15日《Nature》封面
人类基因组计划 (HGP,Human Genome Project) 目标:整体上破解人类遗传信息的奥秘
DNA、基因、基因组
生命活动三要素:物质、能量、信息
DNA: 遗传物质(遗传信息的载体) 双螺旋结构
A, C, G, T四种基本字符的复杂文本
基因(Gene):具有遗传效应的DNA分子片段
基因组(Genome):包含细胞或生物体全套的遗传信息的全部
遗传物质。原核生物(细菌、病毒等) 真核生物(真菌、植物、动物等)
人类基因组:
3.2×109 bp
HGP的历史回顾
1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义
1985 Dulbecco在《Science》撰文 “肿瘤研究的转折点:人 类基因组的测序” 美国能源部(DOE)提出“人类基因组计划”草案
生命信息系统
生物所处的时空系统 物质系统,信息传递与控制,能量
相关学科图示
广义概念图示
狭义概念图示
总结:生物信息学
– 生物信息学(Bioinformatics) 是一门新兴的交叉学科, 是生命科学领域中的新兴学科,面对人类基因组计划 等各种项目所产生的庞大的分子生物学信息,生物信 息学的重要性将越来越突出,它将会为生命科学的研 究带来革命性的变革。
1300
941
4200
>12
837
296
2900
8
865
559
2300
7.9
687
461
2100
6.4
462
261
660
3.1
136
195
520
2.1
180
32
180
1.5
100
118
300
1.4
12.5
12.5
5
40
12
11 27 4663Kr
75 2950Kr
>100 150 40 50 137 110 40
6.9
13 GBF
21, reg of 9
6
14 Stanford (Davis)
8
23
15 Keio
2,6,8,22,21
30
16 U. Wash (Hood LAB) 14,15
2671
Total
2671Mb
6/1-8/31/99
Projected Kr Proj Accum.
Actual K Genbank Kr 4/1-11/30/99 Mr. 4/99-3/00
13687Kr
0.5 0.45
0.3 0.3 0.29 0.23 0.17 32.64Mr
HGP带来的科学挑战
• 随着实验数据和可利用信息急剧增加,信息的管理和 分析成为HGP的一项重要的工作
利用数学模型 和计算技术
研究基因组数据 之间的关系
生物信息学
• 说文解字:生物 + 信息 + 学 (bioinformatics)
biology + information + theory • 广义 应用信息科学的方法和技术,研究生物体系
和生物过程中信息的存贮、信息的内涵和信息的 传递,研究和分析生物体细胞、组织、器官的生 理、病理、药理过程中的各种生物信息,或者也 可以说成是生命科学中的信息科学。 • 狭义 应用信息科学的理论、方法和技术,管理、 分析和利用生物分子数据。
生命的分子基础
• 细胞/分子水平
– DNA/RNA – 蛋白质 –糖 – 脂类
DNA结构和碱基互补原理
中心法则
生物信息学的历史
从人类基因组计划(HGP)说起
曼哈顿原子弹计划
阿波罗登月计划
人类基因组计划
为什么提出HGP?
60年代初,美国总统Kennedy提出两个科学计划:
登月计划 攻克肿瘤计划 人类遗传信息的复杂性
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度
大肠杆菌及其全基因组
水稻基因组计划
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度 2000 Celera公司宣布完成果蝇基因组测序
国际公共领域宣布完成第一个植物基因组——拟南芥全基 因组的测序工作
Drosophila melanogaster 果蝇
– 生物信息学是在生命科学的研究中,以计算机为工具 对生物信息进行储存、检索和分析的科学。
– 生物信息学是当今生命科学和自然科学的重大前沿领 域之一,同时也将是21世纪自然科学的核心领域之一, 其研究重点主要体现在基因组学(Genomics)和蛋白组 学(Proteomics) 。
生物学基础速递
• 细胞(分子水平) • 个体生命 • 生命之树
1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元
1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任
1990.10 经美国国会批准,人类基因组计划正式启动
1995 第一个自由生物体流感嗜血菌(H. inf)的全基因组测序完成
1996 完成人类基因组计划的遗传作图 启动模式生物基因组计划
2001年2月16日《Science》封面
我国对人类基因组计划的贡献
No
Center
Region
Size(Mb)
1 Sanger Centre
1,6,9,10,13,20,22,X
850
2 W IBR
(Clones from Wash U)
3 Wash U
2,3,4,7,11,15,18,Y
900
H.inf全基因组
Saccharomyces cerevisiae 酿酒酵母
Caenorhabditis elegans 秀丽线虫
1997 大肠杆菌(E.coli)全基因组测序完成
1998 完成人类基因组计划的物理作图 开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争 启动水稻基因组计划
4 JGI
5,16,19
250
Baidu Nhomakorabea
5 Baylor
1,2,3,X
230
6 Riken
21,18,11q
160
7 IMB
8,21,X
50
8 Genoscope
Most of 14
85
9 U. Wash (Olson)
10 Beijing
3p
30
11 GTC (Smith)
10
50
12 MPIMG
17,21,X
Arabidopsis thaliana 拟南芥
2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图 2001.2.15 《Nature》刊文发表国际公共领域结果 2001.2.16 《Science》刊文发表Celera公司及其合作者结果
2001年2月15日《Nature》封面
人类基因组计划 (HGP,Human Genome Project) 目标:整体上破解人类遗传信息的奥秘
DNA、基因、基因组
生命活动三要素:物质、能量、信息
DNA: 遗传物质(遗传信息的载体) 双螺旋结构
A, C, G, T四种基本字符的复杂文本
基因(Gene):具有遗传效应的DNA分子片段
基因组(Genome):包含细胞或生物体全套的遗传信息的全部
遗传物质。原核生物(细菌、病毒等) 真核生物(真菌、植物、动物等)
人类基因组:
3.2×109 bp
HGP的历史回顾
1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义
1985 Dulbecco在《Science》撰文 “肿瘤研究的转折点:人 类基因组的测序” 美国能源部(DOE)提出“人类基因组计划”草案
生命信息系统
生物所处的时空系统 物质系统,信息传递与控制,能量
相关学科图示
广义概念图示
狭义概念图示
总结:生物信息学
– 生物信息学(Bioinformatics) 是一门新兴的交叉学科, 是生命科学领域中的新兴学科,面对人类基因组计划 等各种项目所产生的庞大的分子生物学信息,生物信 息学的重要性将越来越突出,它将会为生命科学的研 究带来革命性的变革。
1300
941
4200
>12
837
296
2900
8
865
559
2300
7.9
687
461
2100
6.4
462
261
660
3.1
136
195
520
2.1
180
32
180
1.5
100
118
300
1.4
12.5
12.5
5
40
12
11 27 4663Kr
75 2950Kr
>100 150 40 50 137 110 40
6.9
13 GBF
21, reg of 9
6
14 Stanford (Davis)
8
23
15 Keio
2,6,8,22,21
30
16 U. Wash (Hood LAB) 14,15
2671
Total
2671Mb
6/1-8/31/99
Projected Kr Proj Accum.
Actual K Genbank Kr 4/1-11/30/99 Mr. 4/99-3/00
13687Kr
0.5 0.45
0.3 0.3 0.29 0.23 0.17 32.64Mr
HGP带来的科学挑战
• 随着实验数据和可利用信息急剧增加,信息的管理和 分析成为HGP的一项重要的工作
利用数学模型 和计算技术
研究基因组数据 之间的关系