生物信息学在生物科学的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学在生物科学的应用
生物技术112班魏云靖
1303110419
摘要:生物信息学是80年代兴起的一门新的交叉学科,随即在基因组学研究、蛋白质组学研究及相关领域广泛应用。生物信息学对生物数据进行收集、整理与服务,并从中发现规律指导研究,是当今生物学研究不可或缺的重要工具。
关键词:生物信息学;基因组学;蛋白质组学;生物学研究生物信息学是什么样的一门科学?好多人都有这样的疑问!那其究竟是什么样的科学呢?生物信息学是以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。是当今生物学界的热门话题,很多科学家和研究者都投入到这一领域当中进行研究,而人体基因组计划就是这其中的佼佼者。
比较基因组学是生物信息学的主要的研究方向。随着当今社会科技不断的发展,生物科学技术也是其中表现较为明显的一个科目。由于生物科学技术的迅猛发展,生物信息数据资源的增长呈爆炸之势,同时计算机的计算能力的提高和国际互联网络的发展使得对大规模数据的储存、处理和传输成为了可能,所以更加快捷、方便的促进了生物信息学的形成和飞速发展。与此同时也就出现了当代的人类基因组计划的提出以及实施研究,它对于全人类的生存和发展有着深远重要的意义
生物信息学研究的重点是基因组学和蛋白质组学两个大方面,具体来说是从核算和蛋白质序列出发,分析序列中所表达出的结构功能的生物信息。构建出想要表达的基因序列和蛋白质序列,生产出预想的表达产物!而基因组学-蛋白质组学-系统生物学-比较基因组学是生物信息学的主要的方向。
基因是有遗传效应的DNA片段,是遗传信息的携带者,其表达产物——蛋白质是生命活动的执行者。基因组的资本任务是对基因组相关数据的收集和整理,而其主要是集中在结构基因组上。在结构基因表达出相应的蛋白质,产生相应的结构。但是在这个过程中,由基因直接翻译成的初生蛋白质并没有功能,需要进行一系列的修饰、加工、和折叠形成具有一定空降偶像的蛋白质才能实现其生理功能,所以基因组时代的另一重要任务是对基因组数据内涵的分析与解释,即遗传密码的破译,在这些研究工作中生物信息学将得到了广泛的应用。
从生物信息学研究的具体内容上来看,生物信息学可以用于序列分类、相似性搜索、DNA序列编码区识别、分子结构与功能预测、进化过程的构建等方面的计算工具已经成为变态反应研究工作的重要组成部分。针对核酸序列的分析就是在核酸序列中寻找过敏源基因,找出记忆的位置和功能位点的位置,以及标记一致的序列模式等过程。针对蛋白质序列的分析,可以预测出蛋白质的许多物理特性,包括等电点分子量、酶切特性、疏水性、电荷分布等以及蛋白质二级结构预测,三维结构预测等。
生物信息学中的主要方法有:序列比对,结构比对,蛋白质结构的预测,构造分子进化树,聚类等。
基因芯片是基因表达谱数据的重要来源。目前生物信息学在基因芯片中的应用主要体现在三个方面。
1、确定芯片检测目标。利用生物信息学方法,查询生物分子信息数据库,取得相应的序列数据,通过序列比对,找出特征序列,作为芯片设计的参照序列。
2、芯片设计。主要包括两个方面,即探针的设计和探针在芯片上的布局,必须根据具体的芯片功能、芯片制备技术采用不同的设计方法。
3、实验数据管理与分析。对基因芯片杂交图像处理,给出实验结果,并运用生物信息学方法对实验进行可靠性分析,得到基因序列变异结果或基因表达分析结果。尽可能将实验结果及分析结果存放在数据库中,将基因芯片数据与公共数据
库进行链接,利用数据挖掘方法,揭示各种数据之间的关系。
蛋白质组是指一个基因组,一种生物或一种组织/细胞所表达的全套蛋白质,蛋白质组学是以蛋白质组为研究对象的新的研究领域,主要研究细胞内蛋白质的组成及其活动规律,建立完整的蛋白质文库。现有的蛋白质研究方法。如双向电泳等电聚焦(2一D),色谱分析,质谱分析等,都需要特殊设备且价格昂贵;体外翻译表达系统可研究蛋白质的加工,释放和亚细胞定位,但操作烦琐,而生物信息学为我们提供了一条可以直接由基因或蛋白质序列进行蛋白质功能预测和结构分析的捷径。生物信息学在蛋白质组学方面的研究主要在于以下两个方面:
蛋白质的结构与功能的研究:现有的研究结果表明,蛋白质的结构与功能有着密切的关系,尤其是蛋白质的三维结构。通过研究蛋白质三维结构可以预测其特定的功能。通过计算机辅助预测将序列、结构与功能分析等方法联系起来,可克服同源建模、折叠识别、threading以及聚类分析法等方法的不足。生物信息学在蛋白质结构研究中的应用主要有:(1)靶点的选择;(2)同源性模拟;(3)基于结构基础上的功能的研究等。
蛋白质分子相互作用及其作用途径的研究:检测蛋白质分子间相互作用的方法,一是通过实验。另一种是通过计算机法,如启动子分析技术。该技术的理论基础是,共调节基因的产物通常处于同一代谢通路中,而且,共表达意味着拥有共同的启动子或增强子。通过已知基因的作用途径来预测其相关基因的作用途径。但是,由于目前没法获得足够的参考数据,所以,对预测蛋白质分子间的相互作用及其作用途径的方法还很难进行评估。试验方法获得的有关蛋白质间的作用的数据主要来自于酵母双杂交实验,用这种方法得到的有关蛋白质间相互作用的方式只是结构域间的作用,并不代表完整蛋白分子间的作用方式,且作用的时间和地点也都发生了改变。因此,通过计算机技术模拟生物大分子的相互作用是一条比较理想的研究途径。
当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和病人基因又有什么差别。”这就是通常所说的SNPs(单核苷酸多态性)。构建SNPs及其相关数据库是基因组研究走向应用的重要步骤。1998年国际已开展了以EST为主发现新Spps的研究。在我国开展中华民族SNPs研究也是至重要
的。
生物信息学在功能基因组学同样具有重要的应用目前应用最多的是同源序列比较、模式识别以及蛋白结构预测。所谓同源序列,是指从某一共同祖先经趋异进化而形成的不同序列。利用数据库搜索找出未知核酸或蛋白的同源序列,是序列分析的基础如利用BLASTn和BLASTx两种软件分别进行核苷酸和氨基酸序列同源性比较。同源性比较的结果大体可以分为如下几种方式:与生化和生理功能均已知的基因具有同源性;虽与生化和生理功能均已知的基因具同源性,但对该基因功能的了解尚不深入,仍停留在表达水平~I:;与其它物种中生化和生理功能均未知的基因具同源性。同源性检索分析方法为该DNA片段的功能提供了间接的证据。揭示序列数据所隐含的生物学意义的另一重要方法是模式识别技术。顾名思义,模式别的基本思想是利用存在于蛋白质序列或结构中的某些特征模式识别相关蛋白质的性质。如果某一蛋白质序列或结构中的一部分具有保守性,种保守性或者与蛋白质的生物活性有关,或者与蛋白质的折叠方式有关;那么,这种特片模式可以用来识别该蛋白家族中的新成员。换句话说,如果将已知蛋白质的特征序列模式和特征结构模式。搜集起来,构建成数据库.则可以用来确定新测定的蛋白质序列中是否具有某种特征模式,从而确定该未知蛋白属于哪个蛋白质家族。这在治疗肾病问题上具有突破性进展。
生物信息学刚刚起步,但历史的经验告诉我们,未来它必将得到迅猛发展。生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。这一点必须着重指出。学习有关的生物学知识,开展多方面的生物信息学研究,逐渐使我国成为生物信息学研究强国。