蛋白质生物信息学ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
因组DNA序列信息分析作为源头,在获得蛋 白质编码区的信息后进行蛋白质空间结构 模拟和预测,然后依据特定蛋白质的功能 进行必要的药物设计。
• 基因组信息学,蛋白质空间结构模拟以及
药物设计构成了生物信息学的3个重要组成 部分。
12
第二节 蛋白质常用数据库及应用
• 一次数据库:实验获得的原始数据。简单归类
整理、注释。Genbank、Swiss-Prot、PDB
• 二次数据库:在一次数据库、实验数据和理论
分析的基础上,根据研究内容的需要,对相关 生物知识和信息进一步分析整理。包括人类基 因组图谱库GDB、转录因子和结合位点库 TRANSFAC、蛋白质结构家族分类库SCOP等。
13
第二节、蛋白质常用数据库
•研究材料和结果就是各种各样的生物学数据 •研究工具是计算机 •研究方法包括对生物学数据的搜索(收集和
筛选)、处理(编辑、整理、管理和显示)及 利用(计算、模拟)。
3
研究内容
• 1、生物信息的收集、存储、管理与
提供
• 2、基因组序列信息的提取和分析 • 3、功能基因组相关信息分析 • 4、生物大分子结构模拟和药物设计 • 5、生物信息分析的技术与方法研究
7
研究展望
由于生物信息学是基于分子生物学与多种学科交叉而成 的新学科,现有的形势仍表现为各种学科的简单堆砌, 相互之间的联系并不是特别的紧密。在处理大规模数据 方面,没有行之有效的一般性方法;而对于大规模数据 内在的生成机制也没有完全明了,这使得生物信息学的 研究短期内很难有突破性的结果。
8
研究展望
第六章 生物信息学的应用
1
第一节生物信息学与蛋白质工程 一、生物信息学概述
生物信息学是利用应用数学、信息学、wk.baidu.com计 学和计算机科学的方法研究生物学的问题。
1987年,林华安首创Bioinformation 一词,被誉为”世界生物信息之父”。
2
概述
生物信息学分子生物学与信息技术(尤其是互 联网技术)的结合体。
9
二、生物信息学与蛋白质工程
(一)蛋白质序列分析,预测其理化性质、 空间结构及生物学功能 (二)蛋白质结构预测 理论分析法:在理论计算的基础上预测 统计分析法:建立序列-结构的映射模型 (三)蛋白质功能预测P162 (四)蛋白质分子设计
10
三、生物信息学与蛋白质组学
• 1994、澳大利亚Wilkins和Willians提出蛋白质
5
核心内容是研究如何通过对DNA序列的统计计 算分析,更加深入地理解DNA序列,结构,演 化及其与生物功能之间的关系。
研究课题涉及到分子生物学,分子演化及结构 生物学,统计学及计算机科学等许多领域。
6
研究过程
• 以数据(库)为核心 • 1 数据库的建立 • 2 生物学数据的检索 • 3 生物学数据的处理 • 4 生物学数据的利用:计算生物学
组:由全部基因表达的全部蛋白质及其存在方 式,是一种细胞、组织或完整的生命体在特定 时空上所拥有的全套蛋白质
• 蛋白质组学:以蛋白质为研究对象,阐明某生
物体全部蛋白质的表达模式及功能模式
• 生物信息学理论、技术方法和软件等在蛋白质
组学相关数据库的建立、应用以及蛋白质组分 析等方面具有重要的应用
11
• 生物信息学作为一门新的学科领域,把基
18
• ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTC
ATAATATCCAGAGGAGacatccagatgacccagtctccatcctccctgtctgcatctgtagga gacagagtcACCATCACTTGCCAGGCGAGTCAGGACATCAGCAACTATTTAAA TTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAACTCCTGATCTACGATGC ATCCAATTTGGAAACAGGGGTCCCATCAAGGTTCAGTGGAAGTGGATCTGG GACAGATTTTACTTTCACCATCAGCAGCCTGCAGCCTGAAGATATTGCAAC ATATTTCTGTCAACACTTTGATCATCTCCCGCTCGCTTTCGGCGGAGGGAC CAAGGTGGAGATCAAACGT ACTGTGGCTGCACCATCTGTCTTCATCTTCC
三维结构数据库PBD、MMDB
17
全人源抗EGFR单克隆抗体
• 红色字体为信号肽,标黄部分为可变区重链可变区(HV)
DNA序列(423bp) • ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAG
TCATAATATCCAGAGGA CAGGTGCAGCTGCAGGAGTC
• GGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCAC
TGTCTCTGGTGGCTCCGTCAGCAGTGGTGATTACTACTGGACCTGGAT TCGGCAGTCCCCAGGGAAGGGACTGGAGTGGATTGGACACATCTATTA CAGTGGGAACACCAATTATAACCCCTCCCTCAAGAGCAGACTCACCATA TCAATTGACACGTCCAAGACTCAGTTCTCCCTGAAGCTGAGTTCTGTGA CCGCTGCGGACACGGCCATTTATTACTGTGTGCGAGATCGAGTGACTG GTGCTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCA
4
发展条件
2001年2月,人类基因组工程测序 的完成,使生物信息学走向了一个 高潮。由于DNA自动测序技术的快 速发展,DNA数据库中的核酸序列 公共数据量以每天106bp速度增长, 生物信息迅速地膨胀成数据的海洋。 毫无疑问,我们正从一个积累数据 向解释数据的时代转变,数据量的 巨大积累往往蕴含着潜在突破性发 现的可能。 “生物信息学”正是从 这一前提产生的交叉学科。
一、核酸数据库 NCBI的Genbank、EMBL、DDBJ等
14
二、蛋白质数据库
(一)蛋白序列数据库:SWISS-PROT、PIR、 TreEMBL、UniProt、GenPept
15
(二)蛋白序列二次数据库
蛋白保守区域和功能位点数据库,PROSITE、 PRINTS、BLOCKS
16
(三)蛋白结构数据库
要真正解决这一问题,最终不能从计算机科学 得到,真正地解决可能还是得从生物学自身, 从数学上的新思路来获得本质性的动力。毫无 疑问,正如Dulbecco1986年所说:"DNA序列 是人类的真谛,这个世界上发生的一切事情, 都与这一序列息息相关"。但要完全破译这一 序列以及相关的内容,我们还有相当长的路要 走。
相关文档
最新文档