第一课生物信息学概论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

25
生物信息学当前的主要研究任务
生物信息学研究都有其特定的、不断创新 的方法学。以系统优化、软件并行化和数 据处理技术为主体的海量生物学数据处理 体系的建立将基于新的思路和设想。
26
生物信息学的特点
它是一门基于数据积累,尤其是原始数据 积累的科学。数据的获取是生物信息学发 展的保障和本源。生物信息学研究首先也 是基于实验数据的生产、管理和分析。因 此,生物信息领域的首要特点是生物学基 本数据收集的规模化,数据处理的程序化, 数据分析的专门化。
DNA序列数据增长趋势
功能基因组研究 功能相关海量数据
转录组
EST (Expressed Sequence Tag)
DNA Microarray – large scale gene expression analysis
蛋白质组
2D Gel Electrophoresis – protein expression analysis
DNA序列是生命的真谛,这个世界上发生的一切事 情都与这一序列息息相关。(唯DNA论) 人类基因组计划(HGP)
1990年启动 目标:测定人类基因组的全部DNA序
列, 了解基因及其功能 国际大合作:美国、英国、日本、 法国、德国、中国 投入:30亿美元
结果:2003年完成精细图,产生28亿多个数据(碱基)
蛋白质结构数据增长情况
各种分子生物学数据库及其增长情况
生物数据爆炸性增长:
得到的结论是:生物数据量的积累已达到人类有史以
来所记录的文字的数百倍,而且还将以越来越快的速
度增长。
(2)更为本质的原因是生物学数据的
复杂性急待生物信息学的分析方法。
多基因病中致病基因彼此关系和致病性分 析。 蛋白三维结构和基于结构预测的蛋白之间 或者蛋白与药物分子的相互作用和蛋白亚 细胞定位。
16
生物信息学是今后所有从事现代生物学 (医药学)研究所必需的工具和相关工作 人员需要具备的基本技能。
17
二、生物信息学概念及其研究 内容和特点
生物数据爆炸性增长所带来的挑战
海量数据的存储、管理、共享 数据 知识,如何将这些数据变为生物学知识?
……
AGCATCGAAGTTGCATGACGATGCATGACCTAGC AGCATCGAAGTTGCATGACGATGCATGACCTAGC AAGTTGCATGACGATGCATGACCTAGCAGCATCG AAGTTGCATGACGATGCATGACCTAGTGCATGAC GATGCATGACCTAGCAGCATCGAAGTTGCATGAC GATGCATGACCTAGCAAGTTGCATGACGATTGAC CTAGTGCATGACGATGCATGACCTAGCAGCATCG AAGTTGCATGACGATGCATGACCTAGCAAGAAGT TGCATGACGATGCATGACCTAGTGCATGACGATG CATGACCTAGCAGCATCGAAGTTGCATGACGATG CATGACCTAGCAAGTTGCATGACGATTGACCTAGT GCATGACGATGCATGACCTAGCAGCATCGCGATG CATGACCTAGCAAGAAGTTGCATGACGATGCATG ACCTAGTGCATGACGATGCATGACCTAGCAGCAT CGAAGTTGCATGACGATGCATGACCTAGCAAGTT GCATGACGATTGACCTAGTGCATGACTGACCTAG CAGCATCGAAGTTGCATGACGATGCATGACCTAG TGCATGACGATGCATGACCTAGCAGCATCGAA
23
生物信息学当前的主要研究任务
蛋白质组学:
(1)蛋白质组图像数据处理,蛋白及其修饰鉴定
(2)构建蛋白质数据库,相关软件的开发和应用; (3)蛋白质结构、功能预测; (4)蛋白质连锁图。
24
生物信息学当前的主要研究任务
代谢组学:新陈代谢是由错综复杂的生化 代谢途径所构成的动态网络组成。要揭示 代谢的本质是一个长期的目标。但是,我 们可以从现有数据出发建立主要或特定代 谢途径的模型,如影响人类健康的常见代 谢疾病等。
Mass Spectrometry – protein sequencing Yeast Two-Hybrid (Y2H) System – protein interaction analysis
结构基因组
X-ray Crystallography NMR (Nuclear Magnetic Resonance) Spectroscopy
生 物 信 息 学 概 论
Introduction to Bioinformatics
程钢
生命科学学院 中南民族大学
一、生物信息学发展的背景 二、生物信息学概念及其研究内容和特点 三、生物信息学的发展现状 四、生物信息学课程的特点
一、生物信息学发展的背景
(1)基因组测序计划 海量DNA序列数据
ACGT
相当于2800多本每本1000页每页1000字的“天书”
基因组测序计划 海量DNA序列数据(续)
模式生物基因组计划
模式生物:小鼠、线虫、拟南芥、果蝇、水稻、酵母、
古细菌、真细菌、病毒 … …
地球生物圈约有140万余种物种,
其中2%以上至少有一段DNA序 列被测定。 ▲ 真核生物 12500 种 ▲ 哺乳动物 4200 种 ▲真 细 菌 3600 种 ▲古 细 菌 180 种 ▲病 毒 1750 种
22
生物信息学当前的主要研究任务
1. 生物数据的收集与服务 2. 基因组分析(核酸序列分析) 3. 转录组数据分析(基因表达分析)

RNA水平基因表达研究的基本方法有 EST、Micro-array,所产生的数据量 也非常巨大。但是目前的分析方法和手 段都有很多潜力可以挖掘,尤其是数学 模型的建立,与基因组数据的整合,对 数据真实性的评估等。
AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGC AAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGAC GATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGAC CTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGT TGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATG CATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGAT GCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCA TCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTA GCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAG TTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTA GCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGC ATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATG ACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTG ACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATG CATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAG CAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCA TGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGAT TGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGA CGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACC TAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGC ATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAT GACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGT TGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTA GTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATG ACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTA GCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCA AGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATA
ACGT
生物信息学基本概念
早在1956年,在美国田纳西州盖特林堡召开的首次 “生物学中的信息理论研讨会”上,便产生了生物信 息 学的概念。1987年,林华安博士正式把这一学科命名 为“生物信息学”(Bioinformatics)。被尊称为 “生物 信息学之父”。 生物信息学(Bioinformatics): (1)生物信息学包含了生物信息的获取、处理、储存、 分析和解释等在内一门交叉学科, (2)它综合运用数学、计算机科学和生物学的各种工 具进行研究, (3)目的在于阐明大量生物学数据所包含的生物学意
20
生物信息学当前的主要研究任务
1. 生物数据的收集与服务 2. 基因组分析(核酸序列分析) 3. 转录组数据分析(基因表达分析) 4. 蛋白质组数据分析(七大方面) 5. 代谢组数据分析(生化网络以及多数据资源的整合分
析)
6. 疾病基因预测(相关数据资源的整合分析)
7. 药物靶点发现与药物设计(相关数据资源的整合分析)
……
源自文库
The Yeast cDNA Microarray Picture
基因表达谱数据增长趋势
The number of entries in SwissProt >140,000 now!
蛋白质序列数据增长情况
Tertiary Structure of a Protein
The number of entries in PDB 25,000 now
8. 生物信息分析的技术和方法研究
21
生物信息学当前的主要研究任务
1. 生物数据的收集与服务 2. 基因组分析(核酸序列分析)

核苷酸多态性的研究是以发现和分析群体 (包括相近亚种间)DNA顺序上的差别为 基础,揭示这些多态性与基因表达和基因 功能的关系,基因型和表现型的内在联系。 为我们绘制人类基因组单倍体图和以后绘 制其他物种的遗传图谱奠定基础。
相关文档
最新文档