药效基团及三维结构数据库
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Muegge等提出了一种基于药效基团过滤 (pharmcophore point fliter) 的方法来鉴别化合物的类 药性,药效基团包括胺、氨基化合物、醇、酮、砜、磺 胺基、羧酸基、氨基甲酸、胍、脒、脲、酯。
药效基团过滤模型I (pharmcophore point fliter I)的方法用 来区别药物和非药物分子,基本的规则包括:
§7.3 药效基团及三维结构数据库搜寻
药效基团(3D-Pharmacophore)指这些在药物分子识 别中起重要作用的原子和基团及它们的三维空间排列。 药效基团模型间接给出了受体活性结合口袋的形状、 静电以及构象特征 经典的药效基团包括氢键供体、氢键受体、带电或离子 基团、疏水基团、芳香基团以及这些原子或基团的空间距 离、角度和二面角等几何限制等
(2)配体集的大小 大多数方法一般只处理分子数少于100的配体集,如 HipHop、HypoGen、MPHIL和RAPID;有一种方法从 众多的小分子中提炼出一个较小的分子集,通过对小分 子的活性进行排序,选择活性最好的一部分小分子,这 种方法的缺点就是忽略了不少小分子并且影响很大。 SCAMPI方法是一种从1000-2000个配体中构建药效基 团的方法。
162,609 3,425
现有供查询的免费化合物数据库
数据库名称 CCDC Cambridge Crystallographic Data Center 3D Molecular Modeling Database, Tokyo University NCI Drug Information System 3D Database, National Cancer Institute NCI Database 化合物数 272,000 网址 /
PDB数据库以文本文件的方式存放数据,每个分子各用一个独立的 文件。除了原子坐标外,还包括物种来源、化合物名称、结构递交者以 及有关文献等基本注释信息。此外,还给出分辨率、结构因子,温度系 数、蛋白质主链数目、配体分子式、金属离子、二级结构信息、二硫键 位置等和结构有关的数据。
可以用RASMOL、Spdbv等分子图形软件来进行分析和图像显示
5,000
/Cerep/U tilisateur/cerepdiscovery/biopr int/p_bioprint.asp
/ /
ComGenex Menai
ComGenex, Ltd Ryan Scientific, Inc.
第一步是分析已知配体确定药效基团的基本特征 第二步联配小分子的活性构象得到最佳的药效团特征。
同一靶标的一系列小分子的药效基团的构建一般步骤包括: (一) 配体的选择 配体的选择将大大地影响药效基团的 结果,一般考虑三个方面的因素:配体的有无活性,所 选的配体集的大小和分子的多样性。 (1)配体有无活性与否 在大多数方法中,仅仅考虑有活性的配体,并且认 为配体的活性是一样的,例如Crandell-Smith, RAPID 和 HipHop方法;有些方法把没有活性的配体也考虑进来, 通过比较活性分子和无活性的构象和体积,得到影响活 性的必要的结构特征;如DISCO方法。还有一种方法就 是就是利用一系列不同活性配体的构建药效基团, HypoGen
三维药效基团模型的构建有两种方法
1)靶标的结构不明了,只能从配体的信息中构建 三维药效基团模型。 2)基于靶标的结合位点的结构,当靶标的结构和有 一定活性的配体已知时,药效基团模型可以直接从靶 点和配体复合物的结构中得到。
§7.3.1 基于配体的药效团模型
如果没有受体的结构,三维药效基团模型的构建包括两步
1.药效基团连在一起或被少于两个重原子分开计数为一个;
2. 少于两个或多于七个药效基团的小分子无法筛选出来; 3. 吡咯和二嗪类除外的胺认为药效基团; 4. 剔除含多于一个羧酸基团的化合物; 5. 剔除含没有环的化合物;
6.同一环上的胺基看成一个药效基团。
大多数药物都符合药效基团过滤I规则,如MDDR和CMC数 据库中2/3的药物分子可以识别出来而ACD数据库中只有1/3被 鉴别为药物。
~1,000 400,000
http://triton.ps.toyaku.ac.jp /
250251
http://129.43.27.140/ncidb2/
SPECS
BioSpecs
200,000
7029
Байду номын сангаас
/
/
(4)NCI-3D数据库
美国国家癌症研究院(NCI)将其测试过的21万 多种具有2D和3D结构的化合物制成了文本文件。每个 化合物都有CAS登录号。MDL将该数据库进行了转换, 以便与ISIS连用。这些资料属于公用范畴。
(5)AIDS数据库 AIDS数据库中包括了经过美国国家癌症研究院 (NCI)测试过AIDS抗过滤性病原体活性的42,687 个化合物的数据,数据内容除了有NSC号、CA登记 号、化学名等基本信息外,还包括了EC50值、LC50 值、活性等级以及化合物二维、三维结构等药物研究 者非常关心的信息。同时,作为MDL的公共数据库之 一,购买了ISIS/Host的用户只需和MDL签订一份使用 协议就可免费使用该数据库,更详细的信息请查询 MDL数据库网站。
( 一 ) 剑桥小分子数据库
剑桥结构数据库(Cambridge Structural Database, CSD)是基于X-光和中子衍射实验唯一的有机小分子及有 机金属分子晶体结构数据库。
是发展新的药物、材料及化学化工产品的一个 有力的工具。详细的信息可以浏览其网站
PDB结构库是药物设计的一个重要的结构 来源 。可以直接从这儿得到生物大分子靶标的 三维结构或高同源性蛋白的结构。
/pdb/
§7.1.2 小分子数据库
小分子数据库收集了各种已知的合成小分子化合物
或从天然产物中提取的化合物结构以及用计算机方法产 生的虚拟化合物,在计算机辅助药物设计中,主要用于 基于分子性质、药效基团和分子对接的数据库搜索。
( 二 ) MDL数据库
(1)ACD数据库
现有化学品目录三维结构数据库(ACD-3D)为标 准的现有化学品目录数据库(ACD)提供了三维结构模 型。使用三维结构查寻现有化学品目录数据库,可以有 效地查找到能买到的具有潜在活性的候选化学品,而不 需再去合成。 ACD-SC是MDL公司为了迎合高通量筛选而开发的 数据库 ,这一数据库提供了化学品供应商所能够提供的 超过一百五十万个化合物的三维结构及相关信息。这些 信息包括:纯度、形态、等级、可提供的数量、价格、 供应商的地址、电子邮件、电话及各地的代理商等详尽 信息。ACD-SC每个季度更新一次。
参数 LOGP 分子量 最小 -2 200 最大 5 500
氢键给体
氢键受体 摩尔折射率 旋转键数目
0
0 40 0
5
10 130 8
重原子数目
极性表面积 电荷
20
0 -2
70
120 2
2.功能基团的方法
药物分子和非药分子之间的结构有一些显著的不同, 在CMC和MDDR数据库中的药物分子比ACD数据库中的 非药分子有更多的功能基团
/zinc/byvendor.shtml
§7.2 类药性分析
化合物的类药性(drug-like)研究犹为重要,并 且被广泛地应用到组合化学库的合成和小分子数据库的 虚拟筛。Walters 和Murcko定义化合物类药性为:含有 和大多数现有药物分子相同的结构功能团或物理性质
( 三 ) 天然产物数据库
天然产物,特别是其新颖的结构,是创新药物设计 重要的来源之一,China Natural Product Database (CNPD) 是创腾科技有限公司和中国科学院上海药物研 究所联合开发的中国天然产物数据库,天然产物库包含 近60000条化合物。商业版数据库包含12521条记录。选 用ISIS Base作为数据库管理软件。一方面它可以提供天 然产物三维结构信息,利用分子对接技术,我们可以寻 找到与特定受体有特异结合的天然产物,从而开发出高 效、高选择性的天然产物药物,同时也可以研究天然产 物在体内的作用机理。另一方面,数据库还可以提供植 物来源、传统功用、参考文献等重要信息。随着中草药 中的天然产物数据的积累,还可以扩展成中药方剂库, 有利于中药方剂作用机制的研究。
如果化合物有两条规则不满足,则该化合物的口服生物 利用度可能有较大的问题,不过这个规则只适用于被动转 运的情况,对抗生素、抗真菌药、维生素等药物不满足。 Opera等进一步发现: 药物分子的可旋转键小于等于8,环的数目不大于4
Ghost等从6304个CMC数据库中确定了分子量、摩 尔折射率和重原子个数的范围 类药性相关参数的范围
药效团模建及三维结构数据库搜寻
§7.1 分子三维结构数据库简介
§7.1.1 蛋白质结构数据库PDB
蛋白质结构数据库PDB(protein Data Bank),由美国 Brookhaven National Lab开发,是国际唯一的生物大分子结构数据库。 主要收集的数据来源于X-光晶体衍射和核磁共振(NMR)的数据,提供 免费的数据库检索和下载任务,并且PDB数据还可以从发行的光盘获得
/ / / / / /
Bioprint
Cerep Company
天然产物数据库界面图
现有供虚拟筛选的商业化合物数据库
数据库名称 ACD-3D ACD-SC MDDR-3D CMC CNPD Chemfinder 公司 MDL MDL信息系统公司 MDL信息系统公司. MDL信息系统公司 创腾科技&上海药物研 究所 CambridgeSoft Corporation 化合物数 409,123 > 2,000,000 106,592 7936 45,055 50,000 • 网址
1. 简单的计算方法
Lipinski对2245个WDI数据库中已经到达临床II期以 上的药物分子的结构特征进行了系统的研究,提出了著 名的预测化学物口服生物利用度的“五倍律”规则: 分子量MW 小于等于 500; 油-水分配系数 logP小于等于 5; 氢键供体数小于等于5; 氢键受体数小于等于10;
(3)综合药物化学三维结构数据库(Comprehensive Medicinal Chemistry-3D)
它是根据Pergammon出版的《综合药物化学》一书所 载的信息发展而成的。 综合药物化学三维结构数据库含有7,900多种化合物, 包括它们的二维结构、三维模型以及重要的生化特征。所有 这些化合物曾作为药物试剂进行过人体实验。数据包括药物 名称同义词、药物分类、LogP值和pKa值,还包括美国化 学文摘社(CAS)登录号和参考文献。 综合药物化学三维结构数据库中的药物信息中含有已 知的和人们关注的生物活性,从而使它成为一种探索构效关 系(SAR)、假定和改进药效基团特性等十分有用的工具。
(2) 药物数据报道三维结构数据库(MDDR-3D) 该数据库是在标准MDL药物数据报道数据库 (MDDR)中加入三维结构模型。三维结构特征和生 物活性资料相结合的查寻,可以用来探索结构和活性 之间的关系、验证药效基团假设、确定组合化学的框 架。MDDR-3D含有大量信息,并且覆盖面广,这些 特点使得它成为辅助合理药物设计的有效工具,是从 最新研究中产生新思路的最佳源泉