QSAR
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CoMFA上机操作方法
1.进入sybyl的方法,在下列界面中输入sybyl
第二步 建立分子数据库,将优化后的分子放入一个数据库文件中
1、建立新的数据库:file→database/new↙:给数据库命名,后缀为 *.mdb↙ 2、向建立的数据库中放入分子,首先将模板分子放入,然后一一放入其它分子 file→read-选定分子调出,built/edit→name molecule→给分子名字→ok↙ 计算分子电荷:compute→charges-可供选择的计算电荷的方法很多,一般 小分子用:Gasteiger-Huckel 大分子用:MMFF94 蛋白用:pullman 将分子放入数据库, file→database→put molecule 按上列顺序将其它分子一一命名,然后放入数据库
为了使大家对QSAR方法有一个初步的概念,先简要介绍一下其基本过程:
1)收集药理活性数据。 数量上越多越好,品质方面,最 好是同一测试机构测试,且活性分布要广(以相差1到 数个数量级为宜)。
2)收集该类药物有关药学(包括药理学和药代动力学)方 面的知识。此步骤虽然对于QSAR过程来说不是必须的,但 这方面的知识对于参数的选择以及理解所建数学模型的物理 意义却是至关重要的。
CoMFA简介
近20年来,定量结构-活性关系(QSAR)的研究领域已 经扩展到了考虑分子的三维结构与其各类活性之间关 系的层面,这一类的QSAR方法被称为3D-QSAR。其中, 1988年Cramer等提出的比较分子场分析方法 (Comparative Molecular Field Analysis,CoMFA)是 QSAR研究领域中的一个重大贡献。
他假定:在分子水平上,影响生物活性的相互作用通常 是非共价力,利用分子力学力场(立体场和静电场)可 以较好地解释分子的活性。
CoMFA通过研究化合物与相互作用对象之间进行的各种 非共价相互作用(范德华相互作用、静电相互作用,氢键 相互作用和疏水相互作用等)的分布来探求化合物分子的 性质,并称这些相互作用为场。
最终的CoMFA模型的实验值和预测值的相关关系如图 5-芳基乙内酰脲类分子拆分的实验值和预测值
立体场等值线图
静电场等值线图
立体场图示中绿色区域表示该区域增加取代基的体积有利于化合物的活 性,而黄色区域表示增加取代基的体积不利于化合物的活性。静电场图 中红色区域表示增加取代基的负电性有利于提高化合物的活性效果,蓝 色区域则表示增加取代基的正电性对活性有利
活性数据及分子性质参数表
化合物 对应的活性
No.
y
x1
1
y1
x1,1
2
y2
x1,2
…
…
x1,…
n
yn
x1,n
分子结构参数
x2 x2,1 x2,2 x2,… x2,n
x… x…,1 x…,2 x…,… x…,n
xm xm,1 xm,2 xm,… xm,n
5)选择适当的建模手段。
下表对此作了并不十分严格的划分,对不同的研究问题,可以参照选择。
它从微观即从分子和原子的水平上揭示了药物分子与 受体相互作用的空间特征和在空间结合的理化性质,
CoMFA的影响因素:
1)影响计算结果的因素多,构象的选择,分子的叠合, 探针原子的选择等都会对模型的预测能力产生影响; 2)势能函数本身的缺陷; 3)空间场和分子集的空间取向对CoMFA结果也有很大 的影响。
Quantitative Structure-Activity Relationship (QSAR) Models
Set of Compounds
Activity Data (Y)
Molecular Descriptors (Xi)
Prediction
QSAR
Y = f(Xi)
Interpretation
Electrostatic map indicating red contours around regions where high electron density (negative charge) is expected to increase activity, and blue contours represent areas where low electron density (partial positive charge) is expected to increase activity.
具有光学活性的乙内酰脲类 化合物及其衍生物具有抗癫 痫病活性,是一种重要的药 物中间体,大量用于合成青 霉素和头孢菌类抗生素
R1
O *
*
R2
N*
*
* N* O
*ቤተ መጻሕፍቲ ባይዱ
R3
* R4
模板分子结构图示
以活性最高的化合物作为模板,用商业化软件包 BioMedCaChe对所有分子进行低能构象搜索并用AM1方法优 化后进行叠合,叠合点为图中标有*的原子。进行CoMFA计 算时,随机选取16个化合物作为预测集,用以检验模型的预 测能力,其余化合物作为训练集。将重迭好的分子置于一个 正规三维网格中,格点间距离为0.2 nm。用探针计算分子在 每个格点上的立体场和静电场,其阈值均采用默认值。最后 用偏最小二乘法(PLS)对每个格点上的分子场进行交叉验证, 确定最佳主成分数及交叉验证的回归系数
6、用三维等高线图形显示QSAR模型,显示立体与静电 的有利与不利区域,根据此图设计新的化合物,并预测 其活性。
CoMFA可以用等值线图的方式将各种场的分布用图形直 观地表示出来。从图上可以清楚地观察到各种场分布强弱 对化合物活性的影响,从而可以根据模型的指导和对实际 情况的分析,对现有化合物进行结构修饰和改造,设计新 的分子结构。
点击QSAR→Partial Least Squares,弹出如下界面
第五步 查看CoMFA图 在分析表格中点击QSAR→View QSAR→CoMFA,出现下列表格
选择show sterics→show或show electrostatics,出现立体或静电彩图
CoMSIA简介
比较分子相似性指数分析法 (Comparative molecular similarity indices analysis,CoMSIA)
5)用对接后的分子集作为CoMFA中叠合分子集的做法, 并与传统的低能构象叠合方法相比较,得到了较好的计 算结果。
在实际的计算操作中,没有哪种方法更加优越的比较,究竟选 取哪种叠合方式更加有利于所研究的体系要视具体情况而定
4、在分子周围空间中打上三维网格点,使用一个探针原 子计算每个格点对应于每个分子的能量值,得出分子场
6
Experimental pK i
e.应用偏最小二乘确定QSAR方程
f.产生系数等势 图
CoMFA操作基本过程 1、构建分子,进行结构优化确定活性构象(药效构象)。
在有受体的晶体结构和受体与小分子的作用位点清楚的情况下, 采用分子对接的方法确定分子的活性构象是目前比较普遍的活 性构象获得方法。
2、计算分子中的原子的形式电荷。获取原子净电 荷以便能计算分子的静电力场
3D-QSAR
药物的定量结构-活性关系
定量构效关系作为一种非常重要的药物设计方法, 已经在药物 开发中得到了广泛的应用,主要用于先导化合物的优化,已成 为药物结构改造的一个有力工具。
找出这些药物分子结构性质与它们的活性之间的数学关系,就有可能 预测出活性高的药物分子结构,这种方法就是所谓的定量结构-活性 关系 (Quantitative Structure Activity Relationship,QSAR)。通常把 这种药物设计方法称为基于配体(小分子)的设计方法。
常用的探针有: Csp3+ — 计算立体能和静电能 H2O — 计算疏水场 CH3 — 计算van der Waals场 H+ — 计算静电场
5、用PLS建立分子场与生物活性之间的关系,并用交 叉验证来检验PLS得到的模型的可靠性
PCA vectors PLS vectors
Confidence volumes Of PC
几种常见的建模方法
线性建模法 非线性建模法
模型形式已知
多元线性回归法 最优化方法
模型形式尚未知
模式识别 BP神经网络法
6)建立模型,考评模型的品质,特别注意避免过拟合现 象。
7)模型的验证。根据模型提示的信息,构建新的分子, 提取相应的参数并将参数输入模型中,预报这些新分 子的活性值。选择预报活性较高的进行合成或外购。 测试活性并与预测值比较,以验证所建模型的预测能 力。
Steric map indicating areas where steric bulk is predicted to increase (green) or decrease (yellow) activity.
CoMFA自问世以来,由于其预测能力强,模型形象、 直观,已逐渐成为应用最为广泛的3D-QSAR方法
定量构效关系方法大体可以分为两类: 二维定量构效关系(2D QSAR) 方法和三维定量构效关系(3D QSAR) 方法
定量构效关系是借助化合物的理化参数或结构参数, 以一种数学模型表示有机小分子与生物大分子间相互 的情况, QSAR方程的一般形式为:
生物活性 = f(理化参数和/或结构参数)
•化合物的结构参数化 •生物活性的定量化或半定量化 •结构与生物活性相关连的数学模型
3、选择合适的叠加规则叠加分子,这是CoMFA的关键步骤
叠合一般分为骨架叠合和场叠合。对于结构差异大的化合物,叠
加规则的选取对于研究的结果有很大的影响。对于骨架叠合有以 下几种规则可供选择:
1)在了解作用机理的前提下,可以用已知的活性构象作为模板, 构建其余分子的结构,并进行局部优化后与已知的活性构象叠 合。
按照该方法的原理,如果一组结构类似的化合物以同样的 方式作用与同一个受体化合物,那么它们与受体分子之间 的各种作用场应该有一定的相似性,而其活性取决于每个 化合物周围分子场的差别。
在受体的三维结构或者化合物与受体的相互作用模式不很 清楚的情况下,通过研究这一组类似结构的分子周围的场 的分布情况,并将这些场与活性定量地建立相关关系,便 可以推测受体的某些性质,而由此建立起来的数学模型又 可以用来预测新的结构类似物的活性。
CoMFA应用实例
用CoMFA方法分析了乙内酰脲类化合物在(R,R)-N-3,5-二硝基苯甲酰基-1,2二胺型手性固定相上拆分效果的因素,成功地解释了影响这一类化合物拆分 效果的原因。将CoMFA方法用于手性拆分的研究,不仅进一步扩充了 CoMFA方法的应用,也为拆分机理的研究提供了新的有用的工具。
3)提取用于描述药物分子性质的参数(又常被称为变量、变 元、描述子、特征等)。这些参数既可以是实验测定值,也可 以是理论计算值,后者获取方便,且没有或者较少人为因素的 干扰。这些参数从性质上大致可划分为:疏水性质参数、立体 性质参数和电子性质参数等。
4)将收集到的化合物活性数据及提取得的分子结构参数 汇集成 如下表
基本假设:一系列类似化合物以同一机制作用于同一受 体,受体活性部位的分子场分布是确定的
QSAR With CoMFA
6
a.确定化合物构象 5
training set test set
Predicted pKi
b.对分子进行叠
4
合
c.建立分子场的三维空
3
间
2
d.应用探针分子考察作用立场的性质
2
3
4
5
2)在活性构象未知的情况下,可以用活性类似法(Active Analogue Approach,AAA)对分子进行系统构象搜索,找出 其共同的构象,从而确立活性构象进行叠合。
3)或者在活性构象未知的情况下,用活性最高的分子低能构象作为模 板,构建并局部优化其他分子的结构,与模板分子进行叠合。
4)如果分子的结构差异较大时,骨架叠合方法不是理 想的叠加法。可以采用场拟合(field fit)方法进行叠 合。首先计算出各个药物分子的力场,经3个平移自由 度和3个转动自由度及某些扭角调整,然后使它们与模 板(一般为活性最高的药物)的力场差别最小。
3、分子叠加 file→align database 弹出下列界面
第三步 填入参数 调出刚才叠合好的数据库,方法:file→molecule spreadsheet→open 选中数据库名称 弹出下列界面
填入数据,一般第一列加入活性数据 用鼠标选中第二列,点击autofill,弹出下列界面
第四步 数据分析