生物信息学在药物设计中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学在药物设计中的应用
SJ
摘要:生物信息学是在数学、计算机和生命科学的基础上形成的一门新型交叉学科,是指为理解各种数据的生物学意义,运用数学、计算机科学与生物学手段进行生物信息的收集、加工、储存、传播、分析与解析的科学。
随着生物信息学的发展,其在药物开发中起着越来越重要的作用。
本文简要的综述了生物信息学在药物设计中的应用。
关键词:生物信息学;药物设计;靶标
1 生物信息学
1.1生物信息学概述
自1990年人类基因组计划正式启动以来,其迅猛发展造成了生物学数据的迅速膨胀,大量多样化生物学数据蕴含着大量生物学规律,这些规律是解决许多生命之谜的关键所在。
因此人们对生物学数据搜集、管理、处理、分析、释读能力的要求迅速提升,计算机技术也越来越多地应用于处理人类基因组研究产生的海量数据及相关生物信息。
一门由生物学、计算机科学及应用数学等学科交叉形成的新兴学科——生物信息学应运而生。
生物信息学利用计算机科学技术,结合生物学、数学、物理学、化学、信息学和系统科学等理论和方法,通过高容量的数据库、繁多的搜索系统、快速的网络通讯和分析工具对生物信息资源进行收集、存储、分析、利用、共享、服务、研究与开发。
其研究重点主要体现在基因组学和蛋白组学两方面。
具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构与功能的生物信息。
目前基因组学的研究出现了几个重心的转移:一是将已知基因的序列与功能联系在一起的功能基因组学研究;二是从作图为基础的基因分离转向以序列为基础的基因分离;三是从研究疾病的起因转向探索发病机理;四是从疾病诊断转向疾病易感性研究。
生物芯片(Biochip)的应用将为上述研究提供最基本和必要的信息及依据,将成为基因组信息学研究的主要技术支撑。
生物信息学的发展为生命科学的进一步突破及药物研制过程革命性的变革提供了契机。
就人类基因组来说,得到序列仅仅是第一步,后一步的工作是所谓后基因组时代的任务,即收集、整理、检索和分析序列中表达的蛋白质结构与功能的信息,找出规律。
1.2生物信息学的阶段
前基因组时代(20世纪90年代前):这一阶段主要是各种序列比较算法的建立、生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等。
基因组时代(20世纪90年代后至2001年):这一阶段主要是大规模的基因组测序,基因识别和发现,网络数据库系统地建立和交互界面工具的开发等。
后基因组时代(2001至今):随着人类基因组测序工作的完成,各种模式生物基因组测序的完成,目前生物科学的发展已经进入了后基因组时代,基因组学研究的重心由基因组的结构向基因的功能转移。
这种转移的一个重要标志是产生了功能基因组学,而基因组学的前期工作相应地被称为结构基因组学。
[1]
1.3生物信息学与药物研发
生物信息学的研究对象主要是核酸和蛋白质的序列、结构和功能信息。
但在新药研发中,药物在生物体内发挥生物效应是通过小分子与生物大分子之间的相互作用实现的。
生物信息学在药物研发中的意义在于找到病理过程中关键性的分子靶标、阐明其结构和功能关系,从而指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物,使药物研发之路从过去的偶然和盲目中找到正确的研发方向。
2 在药物研发中的应用
2.1研发模式
药物研发是一个不断推陈出新的过程,全球每年推出约50种新药,每种均针对某一靶点。
据统计,至今研究过的药物靶点已达483个[2]。
药物作用新靶点的发现,往往成为一系列新药发现的突破口。
传统的药物研发模式为:根据资料筛选合理的药理模型——化学合成或从天然产物中人工寻找——先导物的优化——候选药物临床评价——投入市场[3]。
实践证明,这种方式行之有效,但时间长,花费大,药物作用机理不明确。
随着基因组研究的发展,可利用的数据和信息日益庞大,生物信息学可以快速地分析、选择,帮助人们从海量数据中发现和确定新的药物靶点,并通过计算机构建各种模型,方便、快捷地验证各种设想,指导生物活性筛选,从而设计或发现更为安全、高效的药物,由此为我们提供了新的药物研发模式:靶点的识别——靶点的证实——先导化合物的发现——先导化合物的优化——临床评价——投入市场[4,5]。
新模式的出现使现代新药研发的针对性更强,效果更好,周期更短,研发投入更低。
2.2先导化合物的寻找
药物研发中,第一步是找到能有效地激活或阻断靶标的生物学功能的化合物分子,即先导化合物的结构,该化合物能与靶标蛋白结合并能进一步发展成药。
因此,生物大
分子和配体的相互作用和识别信息在药物设计中极为关键。
先导化合物的寻找有分子对接法、三维结构搜索法和全新药物设计法。
目前人们寻找先导化合物的首选方法就是运用分子对接法和用药效团作为提问结构的三维结构搜索法,从数据库中搜索所需的先导化合物。
当直接从数据库中搜索不到所需的化合物分子时,可运用全新药物设计方法进行先导化合物分子的设计。
2.2.1三维结构搜寻
把药效团(使分子具有某种生物活性的结构特征及其空间排列方式)作为提问结构,利用计算机人工智能的模式识别技术,把三维结构数据库中的小分子数据逐一地与搜寻标准(即提问结构)进行匹配计算,寻找符合特定性质和三维结构形状的分子,从而发现合适的药物分子。
用三维结构搜寻法寻找先导化合物的步骤可以归结为:①选择一个搜索软件和三维结构数据库作为搜索工具。
②以具有某种药效活性的结构或基团作为提问结构。
③按照所选搜索程序和数据库的操作要求进行搜索,找出符合提问结构要求的物质作为命中结构。
④从众多的命中结构中找到有库存或可以购买,并含有必需疏水区范围的样品进行生物活性测定。
⑤从生物活性测定结果中,优选出活性最高的物质作为先导化合物[6]。
根据搜寻方式不同,可分为三维几何搜寻、三维相似性搜寻和柔性构象搜寻,近年来还开发了大分子三维结构搜寻。
三维结构搜寻中常用的软件有Catalyst、Unity 及Apex-3D。
2.2.2分子对接
由于计算机技术的发展、蛋白质三维结构解析速度的快速增长和商业小分子数据库的不断更新,分子对接法在药物设计中已经成为基于结构药物设计的主要方法之一。
分子对接法的最初思想起源于Fisher E提出的“锁钥模型”,即受体与配体的相互识别首要条件是空间结构的匹配。
基于受体的分子对接法,首先要建立大量化合物的三维结构数据库,然后依次在数据库中搜索小分子配体使其与受体的活性位点结合,并通过优化取向和构象,使得配体与受体的形状和相互作用最佳匹配。
最开始的分子对接方法是刚性的分子对接法,这种方法在对接中小分子和蛋白质都保持刚性,没有考虑小分子在大的构象空间中的几种低能状态。
因此后来又发展为柔性的对接方法,其又分为:①构象的系综方法。
②片段的方法。
③遗传算法和进化规则。
④基于分子模拟的方法。
考虑蛋白质柔性的方法[7]。
分子对接法常用的软件有DOCK、FlexX、AutoDock、CombiDOCK、FT-DOCK 和GRAMM。
2.2.3全新药物设计
上两种方法得到的先导化合物通常是已知化合物,需要其它的方法来弥补其不足,因此全新药物设计得到了飞速发展。
全新药物设计又称为三维结构生成或从头设计,它根据受体活性部位的几何形状和化学性质,让计算机自动设计出与其相匹配的具有新颖结构的药物分子。
该分子能与受体活性部位很好的契合,但往往需要进行合成。
全新药物设计分为基于结构的直接药物设计和间接药物设计。
(1)直接药物设计
当数据库中没有所需要的化合物分子时,可根据生物大分子的三维结构信息,运用分子模拟软件分析结合位点的特性,直接设计出与靶蛋白作用位点匹配的新分子,这是一种全新药物设计方法,目前常用的是Insight Ⅱ和Catalyst。
Catalyst是一种药物设计操作平台,能简易设计分子结构模型,提供先进的信息检索、信息分析、功能模拟,访问相关的数据库,设计假设化合物及相关模型,解释构效关系,进行组化合物的结构、功能对比,设计特定药效基团以及筛选特定结构化合物。
InsightⅡ是一种生命科学领域分子模拟系统的图形操作平台,依托于UNIX图形工作站,对生物大分子,特别是蛋白质分子的空间构象给予图形界面化。
同时,集成常用的、具有共性的分子操作工具,如空间构象显示模式、几何参数计算、分子结构单元的定义和操作、计算数据的图形处理等。
(2)间接药物设计
当不知道受体结构信息时,由若干已知活性的药物分子作为基础,根据对这些分子的结构及其所表现出来的活性进行系统研究,提出结构与药效的对应关系,最后确定合理的药效基团。
定量构效关系(QSAR)是将化合物的结构信息、理化参数和生物活性进行分析计算,建立合理的数学模型,研究构-效之间的量变[8],现在已发展为2D-QSAR和3D-QSAR,QSAR with CoMFA是定量构效关系研究的工具集,可用于先导化合物的结构修饰和改造。
HQSAR是全息定量构效关系研究方法,在没有分子三维结构信息的情况下自动建立高度预测的QSAR模型。
当受体结构不知道时,而它的序列和已知三维结构的蛋白质的序列有很近的相似关系时,也可以根据蛋白质的同源模建软件SWISS-MODEL来构建这个蛋白的三维模型,SWISS-MODEL可以自动提供蛋白质建模服务,在同源模建之后,就可以运用分子模拟软件分析其结合位点的特性,进而设计出与该蛋白质相匹配的化合物分子。
3 数据库
3.1数据库分类
随着生物学研究和计算机技术的发展,各种生物数据库多了起来,同时数据库中包含的信息量也在迅速的增长。
生物信息学的发展离不开数据库。
按照处理对象分类, 生物信息学中的数据库主要有四种类型: 核酸序列数据库、蛋白质序列数据库、蛋白质结构数据库和基因组数据库。
根据建库的方式,现有的生物信息数据库也可以大致分为四类:一级数据库是最基础的,一般是国家或国际组织建设和维护的数据库,如由美国NCBI 所维护的GenBank等。
二级数据库是在一级数据库的基础上,结合工作的需要将部分数据从一级数据库中取出,经过重新组合(包括一定的修正或调整) 而成的数据库。
其专一性很强, 数据量相对较少,但质量高,数据库结构设计精制。
专家库是一种特殊的二级数据库, 但它是通过有经验的专家经过人工校对标识之后建立的。
这种数据库质量很高, 使用方便可靠,但更新和发展都比较慢。
还有一种是整合数据库,它是将不同数据库的内容按照一定的要求整合而成,为一定的目的服务,许多商业和内部数据库实质上就是整合数据库。
3.2 数据库对药物设计的作用
生物信息学的发展与网络的迅速发展是密切相关的。
目前,有许多生物信息学数据库分散在网络的上,通过网络为用户提供服务。
现代制药工业离不开生物信息学的参与,而生物信息学也离不开数据库中的信息。
所以药物的开发研究需要对它有足够的重视,并充分利用其优势。
新药创制是一项耗资巨大且效率低下的工作。
根据国际上的统计[9],每成功研制一种上市新药,平均需要花费约10-15年的时间,耗资超过10亿美元。
新药创制的前期工作主要存在两个瓶颈:一是靶标生物大分子的确定及验证;二是具有生物活性的小分子药物的发现和设计。
在今天,应用生物信息学帮助新药物的开发,已成为国际上十分活跃的科学研究领域。
将生物信息学应用到新药研究的工作流程中,能够有效缩短研发周期、节约研发费用、提高新药筛选的成功率。
4 结语
现代药物研发已离不开生物信息技术的参与,虽然由于生物信息技术本身存在的不足,一些算法本身存在着缺陷,这使得在药物研制中的运用受到了很大的限制,但是随着
生物信息学技术的进一步完善和发展,其在药物研制中的作用也必将越来越大,将会大大减少药物研发的成本,提高研发的质量和效率。
参考文献
[1] 医学信息学概论董建成主编人民卫生出版 2010年1月第一版 271页
[2] Drews J. Drug discovery: a historical perspective[J].Science, 2000,287(5463): 1960-1964.
[3] Grasela TH,Fiedela-kelly J,Walawander CA,et al. Challenges in the transition to model-based development[J].AAPS J,2005,7(2):488-495.
[4] Zheng CJ, Han LY, Yap CW,et al. Trends in exploration of therapeutic targets[J]. Drug News Perspect,2005,18(2):109-127.
[5] Austen M, Dohrmann C. Phenotype-first screening for the identification of novel drug targets[J].Drug Discov Today,2005,10(4):275-282.
[6] 郑衍,王非.药物生物信息学[M].第1版,北京:化学化工出版社,2004:214-215.
[7] 俞庆森,邱建卫,胡艾希.药物设计[M].第1版,北京:化学化工出版社,2005:160-164.
[8] Costantino G,Macchiarulo A,Camaioni E,et al. Modeling of poly(ADP-ribose)polymerase (PARP) inhibitors. Docking of ligands and quantitative structure-activity relationship analysis.J Med Chem,2001,44(23):3786
[9] Leaute, J.-B., Impact of Genomics and in Silico RelatedTechnologics in the Drug Discovery Process[J]. Chin. J.Chem. 2003, 21:1241-1246.。