医学中的系统生物学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
综述
作者单位:100083北京大学基础医学院医学信息系北京大学心血管研究所
医学中的系统生物学
张其鹏 卢铭 孙冬泳 覃璞 尚彤
对生命体抽象之后就形成一个关于生命体的系统。以生命体为研究对象的生物学和医学,其实就是研究一个生命体的系统,并形成一个关于此系统的知识体系。系统的看待解决医学生物学的问题是一个更符合医学生物学本质需求的思路,而系统生物学的概念也在这样的需求下产生。医学生物学进入21世纪后,首先是医学生物学测量系统化的转变,以基因组为先导的一系列 组!(基因组、蛋白质组、代谢组等)项目的开展、特别是高通量实验技术的发展,使得医学生物学领域内的数据急剧膨胀,而既往的以单一因素为研究重点的研究方法,已经不能适应基于系统测量产生的数据增长速度。这就导致了领域内数据过多而知识和运用相对缺乏。将系统的观念贯彻到科学实践的每一个步骤∀∀∀从数据测量、数据采集、数据储存、数据分析到知识发现和实际运用的开发∀∀∀系统的认识生命系统,在系统模型的指导下进行科学实践,已经成为21世纪医学生物学发展的必然趋势。系统生物学也因此再一次兴起,成为21世纪医学生物学的热点和发展方向。然而在憧憬系统生物学给我们带来无限美好未来之前,我们应该了解到离真正的系统生物学的起飞还有一段距离,这包括了实验技术、仪器设备、分析方法和数据资源构建等多方面软硬件条件的成熟。
生物学的根本目标是理解生物学系统的每一个细节及原理。自中世纪人体解剖学开始,生物学进入到器官系统时代。而到A nton i van L eeu w enhoek 1665年发现细胞结构,生物学又进入了细胞系统的时代。1953年W atson 和C rick 发现了DNA 的结构,从此生物学进入了分子系统时代。随着每一次对生命体系统认识的微小化和复杂化,医学生物学都有长足的进步。特别是DNA 的发现,形成了分子生物学研究领域,并取得巨大的成功。分子生物学使我们将生物学系统理解为分子机器,使我们能够深刻的理解了遗传、进化、发育、疾病背后的基本过程。
随着基因组被完整测序,大量的基因及其转录后产物的功能的鉴定,诸如支原体、大肠杆菌、线虫、果蝇及人类的基因组测序完成,蛋白质组、转录组、代谢组工作的开展,以及对蛋白质相互作用研究方法的进展,转基因和基因敲除,RNA i 的技术发展,毫无疑问,人类对生物学系统分子水平机制的理解将加速发展。然而,这样的知识并不能提供给我们对生物学系统在系统层次上的理解。基因和蛋白质作为系统的组成成分,对其的理解系统非常必要,但并不充分。系
统生物学作为新的生物学研究领域,其目的在于从系统水平对生物学系统进行理解。系统水平的理解需要一系列的原理和方法来描述统御分子行为和系统特征、系统功能,最终达到在细胞、器官乃至人体水平得以理解,并且这种理解是一种得到物理学、化学等基本原理支撑的坚实的知识结构。
科学总是遵循螺旋上升的规律,从系统水平理解生物学系统概念产生已经有半个多世纪的历史。N orbe ttW iener 是最早提出系统层次理解的先驱,这导致控制论、生物控制论的产生[1]。奥地利理论生物学家伯塔兰费早在1928年就在其论文中写道: 生命体是各组分动态变化和各过程相互作用的系统##生物学的跟本任务就是发现这个生化系统的规律##!,其又在1968年试图建立通用的系统理论。Cannon 在1933年提出了 稳态!(homeostasis)的概念,这也是一种系统的概念。但由于早期的研究没有分子生物学的支持,大多数的尝试都是在生理水平上描述和对生物学系统的分析。系统生物学现在和过去的区别就在于现在有可能将系统水平的理解直接建立于如基因、蛋白质等分子水平上。因此,尽管这不是第一次从系统水平进行理解,却是第一次有机会从分子水平到系统水平建立知识结构进而理解生物学系统。
随着分子生物学的发展,逐渐出现了生化系统理论和代谢控制理论等更进一步的系统生物学发展[2,3]。上世纪末本世纪初,H iroaki 和John 等系统生物学家进一步发展了系统生物学的概念,并且提出了 系统生物学是基于模拟的分析,是用芯片上的实验来验证假想,并对真实生物学实验结果的预测!。并对系统生物学的工作方向提出了 四元素论!:系统结构鉴定、系统行为分析、系统控制以及系统设计[4,5]。具体内容如下。
1 系统结构的辨识:系统结构辨识就是明确系统组分的内涵和组分间的相互作用。诸如基因与信号转导、代谢通路相关的蛋白质相互作用的调控关系,有机体、细胞、细胞器、染色质以及其他组分的物理结构和组分所构成的网络的拓扑关系以及每一种关系的参数。在辨识过程中,诸如:DNA 芯片、蛋白质芯片、RT PCR 等高通量的测量方法和具有批量监测生物学过程的方式是必须的。然而,由于细胞与细胞之间通信、三维空间物理构形等的影响,多细胞有机体的基因调控网络的识别十分复杂。多细胞有机体结构的识别不仅需要辨识基因调控网络、代谢网络的结构,而且还需要在细胞层次精确的理解整个生命体的物理结构。既往的
技术难以处理如此复杂的关系,显然需要开发新的仪器系统来收集必要的数据。
2 系统行为分析:研究系统随时间、空间改变而产生的行为。一旦系统结构在一定程度上被弄清楚,就具备了研究系统行为的基础。可以使用多种分析方法。譬如,有人想知道系统对外界刺激的敏感性、系统在刺激后多长时间恢复到正常状态。这样的分析不仅仅揭示了系统水平的特征,而且可以通过发现细胞对特定化学物质的反应来深入理解医学治疗,以至最大程度减少副作用提高效果。
3 系统的控制:系统结构和系统行为模型的构建完成,就将对基于系统而衍生出来的实践统纳在可控的范围内,无疑将减少实验的盲目性和错误发生率。同时系统模型是基于明确的设计原则,并且是对现实世界的仿真,导致此系统模型具有一定的预测性。可以有效地缩小治疗靶点搜索范围,从而减少基础实验的数量,提高实验质量。
为了应用来自系统结构和行为理解的知识成果,有必要建立一个控制生物学系统状态的方法。在掌握了控制细胞系统的技术后,就可以将功能异常的细胞改变成健康的细胞,控制癌细胞使之成为正常细胞或调亡、控制特定细胞成为干细胞状态、使之分化为特定的细胞类型。完成这些控制的技术对人类健康造福无穷。
4 系统的设计:基于以上三种工作,系统生物学的最终目的就是对构建一个为治愈疾病提供方法指导的生物学系统的方法论的研究,基于对实际生命系统的认识,设计出在特定时空环境中,最健康的系统模式,达到从根本上纠正疾病症状,让病人系统恢复到健康状态。例如,我们可以根据某一严重心梗病人现实情况,根据健康状态下的系统情况,计算出病人心肌细胞再生以及心脏重建的参数,通过系统控制的手段干预,让病人从自体组织分化出正常心肌细胞,在调控下模拟心脏的形成,分化出健康的心脏。彻底治愈疾病。这样的器官克隆技术对需要器官移植的疾病治疗有巨大的用途。
K itano等还就一个系统实现的具体问题和原则进行了探讨。至此,以计算机建模和系统模拟为主要工作的计算系统生物学(co m puta tiona l syste m s biology)[2,3]就成为了系统生物学发展的一个重要的方向。在这方面的进展主要体现在几个项目的开展,诸如:细胞信号联盟的信号通路门户(si gna li ng gatew ay,a lli ance for ce ll u lar si gna li ng,A f CS),虚拟细胞计划(V irt ua l ce ll pro ject,http://www.nrca ),日本的电子细胞计划(E Ce ll pro ject,http://www.e cel.l o rg),I UPS phy si ome pro ject计划(h ttp://www.physi om . nz)等。由于这些项目多为国际合作项目,需要多个团队的协同,存在大量的数据交换和信息传递。因此,在这些项目发展的同时,一种为了便利信息共享与交换的机制也被建立起来,诸如:E Ce ll项目中的电子细胞建模描述语言(E M L)!和系统生物学标记语言(SB M L)!以及physio m e项目中的细胞标志语言(Ce lM l L)!等。以这些语言为核心的信息交换机制为专业知识的传递,实验数据的交换提供了便利,从而促进了这些项目的国际合作。详细介绍如下。
(1)信号通路门户:该项目是A f CS和∃自然%(nature)杂志合办的一个关于信号通路建模的信息平台。此平台的核心是名为m o l ecule pages!的关系数据库,收录了信号蛋白质相关的被发表或已经被证实的信息。由于该数据库的构建目的就是为了对相互作用乃至信号通路的建模,所以数据库支持智能化的数据挖掘。领域专家介入了数据的录入和筛选,保证了该数据库的高数据质量。该平台还提供了诸如A f CS D a ta Center!的数据仓储和Si gna li ng U pda te!的实时文献信息报道。
(2)虚拟细胞计划:该项目是美国国立卫生研究院(N I H)支持的国家中心研究资源建设项目(nationa l center f o r research resources)中的子项目,目的是为细胞生物学的量化研究提供一个软件建模环境。用户可以通过提供的网络的访问界面,根据自己的需求,通过调节系统拓扑结构、分子性质和相互作用系数等参数来构建自己的虚拟细胞。它可以将用户对自己虚拟细胞的生物学描述(输入的参数)转换为相应的数学系统模型或方程。
(3)电子细胞计划:该项目是由日本庆应大学高级生命科学系牵头的一个国际合作项目。其目的是为大型复杂系统提供一套面向对象的建模、模拟、分析的软件群,为生物学系统建模提供一个软件模拟环境。1999年发布了1.0版本,随后发布了W indo w s平台下的2.0版本。现在正在开发3.0版本,V3.0是一个可以整合各种来源算法的基于网络的服务平台。V3.0的服务器核心程序是运用C/C++语言开发。在数据交换和通讯上,他们有正在开发了基于XM L语言的电子细胞建模描述语言(E cell m ode ling language, E M L)对细胞模型进行描述,系统生物学标记语言(system biology m arkup language)试图构建一种跨平台的模型对象交换机制。
(4)生理组计划(I U PS physi om e pro ject,h ttp://www. physi om ):该项目是一个国际合作的开源项目,其目的是为计算生理学提供一个公共的领域框架,该结构包含了针对所有脊椎动物的结构和功能建模标准、计算工具和网络数据库的开发。目前已经基本完成的部分包括器官与器官系统的建模、结构构建和描述标准系统以及细胞过程的标记语言系统。在未来5年内,该项目将逐步完成在器官、细胞以及蛋白质水平的生理建模工作。
近十年被称之为测量的10年!或者组革命时期!,以人类基因组计划为代表的组革命!(om i c revo l ution,即基因组、蛋白质组等方面的工作)的兴起,大量的组数据集! (om ic da taset,所谓组数据!,就是指基因组、蛋白质组、代谢组等产生的数据资源)由这场革命!中产生。这些经过系统的测量产生数据集无疑为系统的理解生命体系带来了很大好处,但同时如此海量的数据也让系统生物学家为之头痛。如何处理好这些数据,如何从这些数据中寻找到被蕴涵的知识,如何让组革命!的价值得到真正的体现,都是生物学家及其关心的问题。正是在这样的需求下,源数据系统生物学(data derived systems b i o l ogy)发展起来,并成为系统生物学的一个发展方向,其任务就是对组数据集!的挖掘和