生物信息学课件1-PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
基因数据的 快速增长
5
为什么这么快
6
Sanger, UK
已完成测序的基因组(EBI)
病毒(virus) 类病毒(viroid) 1639 46 包括多种流感病毒, HIV, SARS冠状 病毒等 主要是植物病毒
质粒(plasmid)
噬菌体(phage) 细胞器(organelle) 古细菌(archaea)
功能分析 发展基因组水平的技术
14
生命科学的发展趋势和热点
发展趋势
系统生物学: 微观还原,系统 统一生物学(General Biology) 生物技术的产业化
热点
生物大分子的结构与功能研究 基因组与细胞的研究 脑科学和神经科学研究 行为科学研究 关于遗传、发育、分化、进化的综合理论研究 生态环保研究
19
多老了?
1960s已有建立数据库、序列分析、 开发算法,当时叫分子进化 如果考虑生物数学,19世纪已经流行 首次提出Bioinformatics的说法
荷兰理论生物学家1980年代初Ben Hesper和Paulien Hogeweg 马来西亚生化物理学家林华安(Hwa A. Lim)于1987年
15
物理学的发展对生命科学的启示
物理学
大量实验数据积累 经典物理学
17世纪 18世纪
19世纪
生命科学
农业、医药实践
博物学
公式化 机械论完善
分类、解剖研究
进化理论 近代生物学
应用物理 20世纪 遗传学、分子生物学 相对论、量子力学 现代物理 现代生物学
非线性物理、复杂系统 大量实验数据积累 21世纪 21世纪的生物学
20
最早提到该词的文献(PubMed) (1990)Genomics,6(2):389
生物信息学发展阶段(1)
前基因组时代(pre-genomics era)
建立生物数据库(1965, Margaret Dayhoff的Atlas of Protein Sequences; 1982,GenBank Release 3) 对位算法(1970,NeedlemanWunsch; 1981,SmithWaterman) 1977,DNA测序和相应的软件分 析(RA Staden)
627
469 1510 54
主要提自细菌中
如线粒体、叶绿体
细菌(bacteria)
真核生物(eukaryota)
694
包括草履虫、疟原虫、弓形虫、酵 78 母、线虫、果蝇、海藻、水稻、鸡、 鼠、狗、人、黑猩猩等 2019.9
7
测序进展
GenBank中已超过2000亿碱基对 速度
目前速度: 10天一个基因组(细菌) 目标: 1天一个基因组 目前价格: 10000美元(细菌) 目标: 1000美元 趋势: 过去十几年,每2年半价
13
人类基因组计划(3) – 超额完成目标
领域
完成时间 15年 遗传图 物理图 2-5厘摩,600-1500个标记 30000 STS
目标
13年
实际达到
1厘摩,3000标记 52000 STS 99%,99.99%精确
完成时间
2019.4 1994.9 2019.10 2019.4
DNA序列 95%含基因序列,99.99%
价格
8
微小化、并列化: 数千到数十万well 多目标化: 肠内几十上百种微生物、土壤中全部微 生物同时测序 最小基因组研究、基因组人工合成
蛋白数据增长(PDB)
9
反应通路(KEGG)
glycolysis pathway(糖酵解) 京都基因与基因 组百科全书 (Kyoto Encyclopedia of Genes and Genomes)
10
全细胞通路
11
人类基因组计划(1) – 人类三大计划
曼哈顿原子弹计划 (1942-46) 人类基因组计划 (1990-2019)
阿波罗登月计划 (1961-69)
12
人类基因组计划(2)
ornl.gov/sci/techresources/Human_Genome /home.shtml 人类基因组计划(Human Genome Project, HGP) 由美国能源部(Department of Energy, DOE) 和美国国立卫生研究院(National Institutes of Health, NIH)组织完成 1990年10月开始,2019年4月完成(1953双螺旋) 参与国:美、英、日、法、德、中 并没有完成测序(2019.5完成)
生物信息学
第一章 绪论
毛理凯
初步计划讲授内容
1. 2. 3.
4.
5.
6.
7. 8.
2
绪论 生物信息学的计算机基础 生物信息学资源与数据挖掘工具 DNA序列分析 分子系统发育分析 基因组分析 蛋白质组分析 数学模型
本课目录
一. 二. 三.
当今生命科学展望 生物信息学简介 发展现状
3
一、当今生命科学展望
16
公式化?
二、生物信息学简介
17
什么是生物信息 学(1)
bioinformatics
= bio + informatics 生物 信息学
பைடு நூலகம்
相关学科
计算生物学(computational biology) 系统生物学(systems biology)
18
什么是生物信息学(2)
bioinformatics.org/faq/#definitions
(大致地)计算机对生物信息的处理 (多数人认为,面窄)计算分子生物学 (computational molecular biology) (宽松地)甚至包括医疗成像、图像分析、遗传算 法、人工智能、神经网络… (经典)用计算机储存、比较、提取、分析、预言、 模拟生物分子的组成与结构。主要应用(core)是 序列分析 (新)比较基因组学、功能基因组学、蛋白质组学、 结构基因组学
测序速度 500 Mb/年,< 0.25 美元/bp 和费用
序列变异 10万SNP 基因识别 全长cDNA 模式生物
> 1400 Mb/年,< 0.09 美元 2019.11 /bp
3.7百万SNP 15000全长cDNA 2019.2 2019.3
大肠杆菌、酵母菌、线虫(C)、 除完成上述,C. briggsae, D. 2019.4 果蝇(D)基因组序列 pseudoobscura,大小鼠草图 高通量寡核苷酸合成、DNA 1994, 2019, 微阵列、酵母全基因组水平敲 2019,2019 除、蛋白双杂交