生物信息学的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
前基因组时代 基因组时代 后基因组时代 生物信息学的发展脉络: ➢ 1918975年6年,,佛在罗美里国达田州纳立西大州学盖32特岁林的堡林华安 ((WaG.aAt.lLiinmb)ur博g)士召首开创的“首Bi次oi“nf生or物ma学ti中cs的”信息 理论研讨会”上,孕育了生物信息学的概念. 一词,被誉为“世界生物信息之父”。
多重序列比对研究的是多个序列的共性。序列的多 重比对可用来搜索基因组序列的功能区域,也可用 于研究一组蛋白质之间的进化关系。
精品课件
发现同源分子
精品课件
3、 基因组序列分析
遗传语言分析——天书 基因组结构分析 基因识别 基因功能注释 基因调控信息分析 基因组比较
精品课件
4、基因表达数据的分析与处理
精品课件
➢ 1990年,林华安博士发起第一届国际 Bioinformatics学术会议。
➢ 1990年10月,被誉为生命科学“阿波罗登月计划” 的国际人类基因组计划(HGP)启动。
➢ 1995年,美国人类基因组计划第一个五年总结报 告中给出生物信息学一个较为完整的定义。
➢ 2000年6月26日,美、英、日、德、法、中等六 国科学家共同努力,完成人类基因组工作草图,这是 人类科学史上又一个里程碑式的事件。
精品课件
空间结构预测
在空间结构预测方面,比较成功的理论 方法是同源模型法
该方法的依据是:相似序列的蛋白质倾 向于折叠成相似的三维空间结构
运用同源模型方法可以完成所有蛋白质 10-30%的空间结构预测工作
精品课件
(三)生物信息学研究现状与展望
1.国外生物信息学研究现状 2.我国生物信息学研究现状 3.我国生物信息学研究目标
生物信息学的应用
精品课件
生物信息学 (Bioinformatics)
生物分子
数据
+
计算机 计算
精品课件
概念(广义)
生
生物体系和过程中信息
命
的存贮、传递和表达
科
学
中
信息科学
的
信
细胞、组织、器官的生理、病理 药理过程的中各种生物信息
息 科 学
精品课件
概念(狭义)
生物分子信息的获取、存贮、分析和利用
精品课件
(二)蛋白质结构预测
蛋白质结构预测内容 二级结构预测 三维结构预测
蛋白质结构预测方法 理论分析方法:是在理论计算的基础上进行结构
预测。 统计分析方法:是在对已知结构的蛋白质进行统
计分析的基础上,建立由序列到结构的映射模型,对未知 结构的蛋白质直接从氨基酸序列预测其结构。
精品课件
(三)蛋白质功能预测
➢ 2003年4月14日,国际人类基因组测序组隆重宣 布:美、英、日、德、法和中国科学家历经13年共同 努力,人类基因组序列图(“完成图”)提前绘制成 功。人类迈入“后基因组精品时课件代”(Post-genomic Era)。
(二)生物信息学的主要研究内容
1.生物信息的收集、存储、管理与提供 2.基因组序列信息的提取和分析 3.功能基因组相关信息分析 4.基因表达数据的分析与处理 5. 蛋白质结构预测
是否未知蛋白序列与已知功能的蛋白质相似
确定跨膜螺旋、卷曲螺旋和前导序列
未知序列是否包含保守序列模体
查对PROSITE数据库库
查对BLOCKS和PRINTS数据库
整理所有肯定的结果并核对一致性
预测蛋白质功能
蛋白质功能预测流程图
(引自HPDB蛋白质数据库
精品课件
(http://hpdb.hbu.edu.cn/prediction/subprediction/functionalflowchat.asp)
精品课件
1、 生物分子数据的收集与管理
EMBL
基因组 数据库
GenBank DDBJ
蛋白质 序列 数据库
SWISS-PROT PIR
蛋白质 结构 数据库
PDB
精品课件
2、 数据库搜索及序列比较
搜索同源序列在一定程度上就是通过ห้องสมุดไป่ตู้列比较寻找 相似序列
序列比较的一个基本操作就是比对(Alignment), 即将两个序列的各个字符(代表核苷酸或者氨基酸 残基)按照对应等同或者置换关系进行对比排列, 其结果是两个序列共有的排列顺序,这是序列相似 程度的一种定性描述
精品课件
(一)蛋白质序列分析
序列比对是生物信息学的基础,通过比较两个或 多个蛋白质序列的相似区域和保守性位点,确定 相互间具有共同功能的序列模式和分子进化关系, 进一步分析其结构和功能。
把未知结构的蛋白质序列与已知具有三维结构的 蛋白质序列进行序列比对,有助于进一步了解该 未知结构蛋白质的空间折叠信息
分子生物信息学 Molecular
Bioinformatics
生物 分子数据
获取 挖掘
精品课件
深层次 生物学知识
生物信息学主要研究两种信息载 体
DNA分子 蛋白质分子
精品课件
生物分子至少携带着三种信息
遗传信息 与功能相关的结构信息 进化信息
精品课件
第一节 生物信息学与基因组学
一、生物信息学概述 (一)生物信息学发展简史 生物信息学发展的3个阶段:
基因表达数据分析是目前生物信息学研究的 热点和重点
目前对基因表达数据的处理主要是进行聚类 分析,将表达模式相似的基因聚为一类,在 此基础上寻找相关基因,分析基因的功能
精品课件
基因芯片
精品课件
二 维 电 泳 图
精品课件
5、蛋白质结构预测
蛋白质的生物功能由蛋白质的结构所决 定 ,蛋白质结构预测成为了解蛋白质功 能的重要途径
蛋白质结构预测分为:
二级结构预测 空间结构预测
精品课件
蛋白质折叠
二级结构预测
在一定程度上二级结构的预测可以归结为模式识别问题
在二级结构预测方面主要方法有:
立体化学方法 图论方法 统计方法 最邻近决策方法 基于规则的专家系统方法 分子动力学方法 人工神经网络方法
预测准确率超过70%的第一个软件是基于神经网络的PHD 系统
实现基因组数据、蛋白质组和结构基因组数 据、天然及合成化合物数据的计算机处理、分析 和可视化,以及生物实验和生物分子的模拟设计, 解析蛋白质三维结构和蛋白质组的时空表达关系 等
精品课件
二、生物信息学与蛋白质
蛋白质研究为生物信息学提供了极为 丰富的研究数据,极大地推动了生物 信息学的发展。生物信息学在蛋白质 的序列分析、结构预测、功能预测、 分子设计等方面具有重要应用。
多重序列比对研究的是多个序列的共性。序列的多 重比对可用来搜索基因组序列的功能区域,也可用 于研究一组蛋白质之间的进化关系。
精品课件
发现同源分子
精品课件
3、 基因组序列分析
遗传语言分析——天书 基因组结构分析 基因识别 基因功能注释 基因调控信息分析 基因组比较
精品课件
4、基因表达数据的分析与处理
精品课件
➢ 1990年,林华安博士发起第一届国际 Bioinformatics学术会议。
➢ 1990年10月,被誉为生命科学“阿波罗登月计划” 的国际人类基因组计划(HGP)启动。
➢ 1995年,美国人类基因组计划第一个五年总结报 告中给出生物信息学一个较为完整的定义。
➢ 2000年6月26日,美、英、日、德、法、中等六 国科学家共同努力,完成人类基因组工作草图,这是 人类科学史上又一个里程碑式的事件。
精品课件
空间结构预测
在空间结构预测方面,比较成功的理论 方法是同源模型法
该方法的依据是:相似序列的蛋白质倾 向于折叠成相似的三维空间结构
运用同源模型方法可以完成所有蛋白质 10-30%的空间结构预测工作
精品课件
(三)生物信息学研究现状与展望
1.国外生物信息学研究现状 2.我国生物信息学研究现状 3.我国生物信息学研究目标
生物信息学的应用
精品课件
生物信息学 (Bioinformatics)
生物分子
数据
+
计算机 计算
精品课件
概念(广义)
生
生物体系和过程中信息
命
的存贮、传递和表达
科
学
中
信息科学
的
信
细胞、组织、器官的生理、病理 药理过程的中各种生物信息
息 科 学
精品课件
概念(狭义)
生物分子信息的获取、存贮、分析和利用
精品课件
(二)蛋白质结构预测
蛋白质结构预测内容 二级结构预测 三维结构预测
蛋白质结构预测方法 理论分析方法:是在理论计算的基础上进行结构
预测。 统计分析方法:是在对已知结构的蛋白质进行统
计分析的基础上,建立由序列到结构的映射模型,对未知 结构的蛋白质直接从氨基酸序列预测其结构。
精品课件
(三)蛋白质功能预测
➢ 2003年4月14日,国际人类基因组测序组隆重宣 布:美、英、日、德、法和中国科学家历经13年共同 努力,人类基因组序列图(“完成图”)提前绘制成 功。人类迈入“后基因组精品时课件代”(Post-genomic Era)。
(二)生物信息学的主要研究内容
1.生物信息的收集、存储、管理与提供 2.基因组序列信息的提取和分析 3.功能基因组相关信息分析 4.基因表达数据的分析与处理 5. 蛋白质结构预测
是否未知蛋白序列与已知功能的蛋白质相似
确定跨膜螺旋、卷曲螺旋和前导序列
未知序列是否包含保守序列模体
查对PROSITE数据库库
查对BLOCKS和PRINTS数据库
整理所有肯定的结果并核对一致性
预测蛋白质功能
蛋白质功能预测流程图
(引自HPDB蛋白质数据库
精品课件
(http://hpdb.hbu.edu.cn/prediction/subprediction/functionalflowchat.asp)
精品课件
1、 生物分子数据的收集与管理
EMBL
基因组 数据库
GenBank DDBJ
蛋白质 序列 数据库
SWISS-PROT PIR
蛋白质 结构 数据库
PDB
精品课件
2、 数据库搜索及序列比较
搜索同源序列在一定程度上就是通过ห้องสมุดไป่ตู้列比较寻找 相似序列
序列比较的一个基本操作就是比对(Alignment), 即将两个序列的各个字符(代表核苷酸或者氨基酸 残基)按照对应等同或者置换关系进行对比排列, 其结果是两个序列共有的排列顺序,这是序列相似 程度的一种定性描述
精品课件
(一)蛋白质序列分析
序列比对是生物信息学的基础,通过比较两个或 多个蛋白质序列的相似区域和保守性位点,确定 相互间具有共同功能的序列模式和分子进化关系, 进一步分析其结构和功能。
把未知结构的蛋白质序列与已知具有三维结构的 蛋白质序列进行序列比对,有助于进一步了解该 未知结构蛋白质的空间折叠信息
分子生物信息学 Molecular
Bioinformatics
生物 分子数据
获取 挖掘
精品课件
深层次 生物学知识
生物信息学主要研究两种信息载 体
DNA分子 蛋白质分子
精品课件
生物分子至少携带着三种信息
遗传信息 与功能相关的结构信息 进化信息
精品课件
第一节 生物信息学与基因组学
一、生物信息学概述 (一)生物信息学发展简史 生物信息学发展的3个阶段:
基因表达数据分析是目前生物信息学研究的 热点和重点
目前对基因表达数据的处理主要是进行聚类 分析,将表达模式相似的基因聚为一类,在 此基础上寻找相关基因,分析基因的功能
精品课件
基因芯片
精品课件
二 维 电 泳 图
精品课件
5、蛋白质结构预测
蛋白质的生物功能由蛋白质的结构所决 定 ,蛋白质结构预测成为了解蛋白质功 能的重要途径
蛋白质结构预测分为:
二级结构预测 空间结构预测
精品课件
蛋白质折叠
二级结构预测
在一定程度上二级结构的预测可以归结为模式识别问题
在二级结构预测方面主要方法有:
立体化学方法 图论方法 统计方法 最邻近决策方法 基于规则的专家系统方法 分子动力学方法 人工神经网络方法
预测准确率超过70%的第一个软件是基于神经网络的PHD 系统
实现基因组数据、蛋白质组和结构基因组数 据、天然及合成化合物数据的计算机处理、分析 和可视化,以及生物实验和生物分子的模拟设计, 解析蛋白质三维结构和蛋白质组的时空表达关系 等
精品课件
二、生物信息学与蛋白质
蛋白质研究为生物信息学提供了极为 丰富的研究数据,极大地推动了生物 信息学的发展。生物信息学在蛋白质 的序列分析、结构预测、功能预测、 分子设计等方面具有重要应用。