第1讲 生物信息学绪论PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图 2001.2.15 《Nature》刊文发表国际公共领域结果 2001.2.16 《Science》刊文发表Celera公司及其合作者结果
2001年2月15日《Nature》封面
2001年2月16日《Science》封面
人类基因组序列的组装
GigAssembler
Kent & Haussler, Genome Res. 2001. 11: 1541-1548
为什么需要组装呢?
人类基因组计划幕后英雄 Jim Kent. “黄金之路”(The Golden Path)
人类基因组序列的组装和注释
基因(gene)
DNA测序技术
有助于认识自身、掌握生老病死规律、 疾病的诊断和治疗、了解生命的起源。
人类基因组计划目标
Human Genome = three billion (3*10^9) base pairs
人类基因组计划 (HGP,Human Genome Project) 目标:整体上破解人类遗传信息的奥秘
人类基因组计划-DNA 测序技术
例子:偶尔作弊的赌场
1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6
0.95 Fair
1 1/10
0.05
0.9 2 1/10
3 1/10
4 1/10
0.1 Loaded
5 1/10 6 5/10
21621665666352321264622533314315136163516312314636 22222222222111111111111111111111111111111111111111
大肠杆菌及其全基因组
水稻基因组计划
1999.7 2000
第5届国际公共领域人类基因组测序会议,加快测序速度 Celera公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组——拟南芥全基 因组的测序工作
Drosophila melanogaster 果蝇
Arabidopsis thaliana 拟南芥
HGC
Celera
我国对人类基因组计划的贡献
来自百度文库
No
Center
Region
Size(Mb)
生物信息学
从人类基因组计划(HGP), ENCODE 计划 和千人基因组计划说起
三大科学计划
曼哈顿原子弹计划
阿波罗登月计划
人类基因组计划
人类基因组计划
为什么要开展人类基因组计划?
1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义
1985 Dulbecco在《Science》撰文 “肿瘤研究的转折点:人 类基因组的测序”
Sanger测序法 双脱氧链终止法
Sanger测序法
新的测序技术 –焦磷酸测序法(454,Solexa, Solid), 单分子测序 –新的整合技术
1995 第一个自由生物体流感嗜血菌(H. inf)的全基因组测序完成
1996 完成人类基因组计划的遗传作图 启动模式生物基因组计划
H.inf全基因组
生物信息学
• 说文解字:生物 + 信息 + 学 (bioinformatics)
biology + information + theory • 广义: 应用信息科学的方法和技术,研究生物体
系和生物过程中信息的存贮、信息的内涵和信息 的传递,研究和分析生物体细胞、组织、器官的 生理、病理、药理过程中的各种生物信息,或者 也可以说成是生命科学中的信息科学。 • 狭义: 应用信息科学的理论、方法和技术,管理、 分析和利用生物分子数据。
Saccharomyces cerevisiae 酿酒酵母
Caenorhabditis elegans 秀丽线虫
1997 大肠杆菌(E.coli)全基因组测序完成 1998 完成人类基因组计划的物理作图
开始人类基因组的大规模测序 Celera公司加入,与公共领域竞争 启动水稻基因组计划
1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度
3
什 么 是 生 物 信 息 学 ?
生物信息学/计算生物学
美国国家卫生研究院(NIH)的定义:
Bioinformatics 为拓展生物学、医学、行为学和卫生学 数据的用途,而进行有关计算机方法手 段的研究、开发与应用,包括此类数据 的采集、存贮、整理、归档、分析与可 视化。
Computational Biology 开发和应用数据分析、理论方法、数学 模型和计算机仿真技术,用于生物学、 行为学和社会群体系统的研究。
什么是生物信息学? 1
一、生物信息学定义
2
生物信息学(Bioinformatics)名词的由来
八十年代末期,林华安博士认识到将计算机科学与生物学 结合起来的重要意义,开始留意要为这一领域构思一个合适的 名称。起初,考虑到与将要支持他主办一系列生物信息学会议 的佛罗里达州立大学超型计算机计算研究所的关系,他使用的 是“CompBio”;之后,又将其更改为兼具法国风情的 “bioinformatique”,看起来似乎有些古怪。因此不久,他便 进一步把它更改为“bio-informatics(bio/informatics)”。 但由于当时的电子邮件系统与今日不同,该名称中的-或/符号 经常会引起许多系统问题,于是林博士将其去除,今天我们所 看到的“bioinformatics”就正式诞生了,林博士也因此赢得了 “生物信息学之父”的美誉。
51335613554632416254244212326366645622466146342646 11111111111111111111111111112222222222222222222222
隐状态:那个骰子
基因的鉴定
跟线虫的基因数差不多 暗示着。。。。。。
人类基因组序列的显示
Visualization
组装
生物信息学 人类基因组
分析技术
转座元件
进化保守性
基因的鉴定
Human Genome = three billion (3*10^9) base pairs:
基因--有遗传效应的DNA片断,是控制生物性状的基本遗传单位 编码蛋白质或RNA等具有特定功能产物的遗传信息的基本单位
基因的鉴定-隐马尔可夫模型