药物发现的虚拟筛选方法 PPT课件
合集下载
虚拟筛选技术及其应用PPT课件
•libraries are available for immediate purchase from established chemical companies, which facilitates rapid validation of highscoring
hits from virtual screening experiments.
通过managefiles界面上传靶标蛋白酶的坐标文档的tacc的磁盘服务器并在submitjob界面选择计算机中的数据库tacc代管的超级计算机的处理中心将对靶标蛋白和小分子配体进行对接计算一个对接计算需要13分钟的处理时间大部分的操作能在812小时完成对接计算的状态可以通过网站查看对denv蛋白酶进行虚拟筛选时将产生一系列通过对接得分排序的匹配记录得的负分越小被认为是配体和靶标蛋白反应越积极
13
第四步:命中化合物的后处理
最后一步是命中化合物的后处理 通过计算分子的类药性质ADME/T (吸 收、器官分布、体内代谢、排泄 和毒性)性质的估算,排除那些不具有类 药性质的分子。可以利用一些经验规则如“五规则” 等,快速排除那些 不适合进一步药物开发的分子。
通过以上四步处理,大部分分子从化合物库中剔除,形成一个合理 大小的化合物库,仅对这些适合成药的化合物或购买、或合成、或分离 得到,然后再进行实际的生物测试。
化关系。例如:蛋白质的一级、二级、三级、四级结构
.
4
1.2 虚拟筛选技术的定义
虚拟筛选(virtual screening, VS)是计算机辅助药物设计方法的延伸 和推广,针对重要疾病特定靶标生物大分子的三维结构或定量构效关 系(QSAR)模型,从现有小分子数据库中,搜寻与靶标生物大分子结 合或符合QSAR 模型的化合物,进行实验筛选研究。
hits from virtual screening experiments.
通过managefiles界面上传靶标蛋白酶的坐标文档的tacc的磁盘服务器并在submitjob界面选择计算机中的数据库tacc代管的超级计算机的处理中心将对靶标蛋白和小分子配体进行对接计算一个对接计算需要13分钟的处理时间大部分的操作能在812小时完成对接计算的状态可以通过网站查看对denv蛋白酶进行虚拟筛选时将产生一系列通过对接得分排序的匹配记录得的负分越小被认为是配体和靶标蛋白反应越积极
13
第四步:命中化合物的后处理
最后一步是命中化合物的后处理 通过计算分子的类药性质ADME/T (吸 收、器官分布、体内代谢、排泄 和毒性)性质的估算,排除那些不具有类 药性质的分子。可以利用一些经验规则如“五规则” 等,快速排除那些 不适合进一步药物开发的分子。
通过以上四步处理,大部分分子从化合物库中剔除,形成一个合理 大小的化合物库,仅对这些适合成药的化合物或购买、或合成、或分离 得到,然后再进行实际的生物测试。
化关系。例如:蛋白质的一级、二级、三级、四级结构
.
4
1.2 虚拟筛选技术的定义
虚拟筛选(virtual screening, VS)是计算机辅助药物设计方法的延伸 和推广,针对重要疾病特定靶标生物大分子的三维结构或定量构效关 系(QSAR)模型,从现有小分子数据库中,搜寻与靶标生物大分子结 合或符合QSAR 模型的化合物,进行实验筛选研究。
药物发现的虚拟筛选方法 PPT课件
拓扑距离(两原子之间连接的键的个数)
(3)键矩阵:矩阵元素为相连接的两个原子之间的键级。
双键:2,三键:3。
(4)关联矩阵:是一个n×m的矩阵。
顶点(原子)作为列(n),边(化学键)作为行(m),
2020/12/9
如果边在顶点内,则相应的元素置为1。
3、连接表
20世纪80年代开始,成为化合物在计算机中表示的最主要方法。 首先对每个原子进行编号并列表 然后在另一表格中列出键的信息, 键级用整数表示,1表示单键,2表示双键。
2020/12/9
➢基本存储 分子的元素组成、原子坐标、原子连接关系 ➢其他存储 分子子结构信息,适用于生物大分子 原子电荷信息,调用时不必再计算 确定特定原子化学环境的原子类型信息
2020/12/9
二、化合物数据库的生产和管理
➢ 目前有很多商业化合物数据库可以利用 ➢ MDL药物数据报告(MDDR)含有115000个类药性
一个简单的图由顶点(V)和边(E)组成,因此图被定义为一个三元组<V,E,φ>, φ为映射 函数。在下面一个简单的无向图中, V={1,2,3,4}, E={e1,e2,e3,e4, e5, e6}。
e2
2020/12/9
e1
1
4
e3
e4 e6
2
e5
3
图也可用矩阵表示:设G=<V,E>为无向图,令mij等于顶点vi与边ej的关联 次数,则称(mij)n*m为G的关联矩阵,记为M(G)。
化合物。 ➢ 美国国家癌症研究所(NCI)数据库含有250000个
化合物。
2020/12/9
MDL ISIS化学数据库管理系统
ISIS系统提供了基于Oracle 数据库系统的各类化学信息系统的管理和开发工 具,可以同时管理化学结构、化学反应、生物活性及谱图等多种化学信息。
药物发现与药物筛选ppt课件
——鲁迅《南腔北调集·经验》
10
药物发现简史
——现代药理学 1
实验动物的应用
正常动物模型 病理动物模型
自发性病理动物模型 实验性病理动物模型
优势和局限性
扩大药物筛选范围和规模 降低药物研究的风险
种属差异和病理变化的特殊性 技术要求高,病理模型有限
11
药物发现简史
——现代药理学 2
组织器官实验、分子药理药理学、细胞生物学
优势和局限性
高效、低耗自动化程度高 机理明确、结果误差小 信息量大、比较范围大
药理作用不明确
13
药物发现简史
——药物筛选方法比较
原始方法
现代方法
观察对象
人
动物
筛选规模
零散
小规模<100/日
筛选方向
随机
定向
样品用量
不定
1—5克
结果特点
直接
药效明确
高通量筛选 细胞、分子 大规模>1000/日 随机/一药多筛
standard work of pharmacology, the molecular targets of all known drugs that have been characterized as safe and
effective have been collected and listed according to their biochemical nature (62).
机能实验 药物作用机理研究 病理机制研究 药理作用选择性研究
优势和局限性
减少筛选药物用量提高筛选效率 减少动物用量和实验干扰
种属差异和病理变化的特殊性 观察指标局限和手工操作过程
12
10
药物发现简史
——现代药理学 1
实验动物的应用
正常动物模型 病理动物模型
自发性病理动物模型 实验性病理动物模型
优势和局限性
扩大药物筛选范围和规模 降低药物研究的风险
种属差异和病理变化的特殊性 技术要求高,病理模型有限
11
药物发现简史
——现代药理学 2
组织器官实验、分子药理药理学、细胞生物学
优势和局限性
高效、低耗自动化程度高 机理明确、结果误差小 信息量大、比较范围大
药理作用不明确
13
药物发现简史
——药物筛选方法比较
原始方法
现代方法
观察对象
人
动物
筛选规模
零散
小规模<100/日
筛选方向
随机
定向
样品用量
不定
1—5克
结果特点
直接
药效明确
高通量筛选 细胞、分子 大规模>1000/日 随机/一药多筛
standard work of pharmacology, the molecular targets of all known drugs that have been characterized as safe and
effective have been collected and listed according to their biochemical nature (62).
机能实验 药物作用机理研究 病理机制研究 药理作用选择性研究
优势和局限性
减少筛选药物用量提高筛选效率 减少动物用量和实验干扰
种属差异和病理变化的特殊性 观察指标局限和手工操作过程
12
药物虚拟筛选方法ppt课件
• 体外活性测试(大量测试) • 命中率:0.01-0.001% 假阴性较高 • 需要先有大量化合物
虚拟筛选:
+
• 计算机模拟分析
• 命中率:2-24%
• 需要有限化合物测试
虚拟筛选为当前新药研发的常规步骤,是高通量筛选的有效补充。[1-2]
1、Maggio, E. T. and Ramnarayan, K. (2001). Drug Disc. Today 6, 996-1004. 2、Cheng T1, et al. (2012) AAPS J. 2012 Mar;14(1):133-41.
2013年在生物制药领域研发投入最大的二十家药企
排名
1 2 3
4
5 6 7 8 9 10 11 12 13 14 15 16 17
18
19
20
公司
罗氏 诺华 强生
(瑞士) (瑞士) (美国)
默沙东 (美国默克)
辉瑞
(美国)
赛诺菲 (法国)
葛兰素史克 (英国)
礼来
(美国)
阿斯利康 (英国)
安进
(美国)
p.Arg334Ter
pathogenic
p.Ser338Ter
pathogenic
p.Glu343Ter
pathogenic
蛋白质结构
PDB 数据库
软件:PyMOL
PDB ID: 3ODU
药物靶标口袋
软件:PyMOL & PocketPicker
药物靶标口袋
软件:PyMOL
药物靶点
生成蛋白质结构.pdbqt 格式文件和相关Gridbox 配置文件
百时美施贵宝 (美国)
武田制药 (日本)
虚拟筛选:
+
• 计算机模拟分析
• 命中率:2-24%
• 需要有限化合物测试
虚拟筛选为当前新药研发的常规步骤,是高通量筛选的有效补充。[1-2]
1、Maggio, E. T. and Ramnarayan, K. (2001). Drug Disc. Today 6, 996-1004. 2、Cheng T1, et al. (2012) AAPS J. 2012 Mar;14(1):133-41.
2013年在生物制药领域研发投入最大的二十家药企
排名
1 2 3
4
5 6 7 8 9 10 11 12 13 14 15 16 17
18
19
20
公司
罗氏 诺华 强生
(瑞士) (瑞士) (美国)
默沙东 (美国默克)
辉瑞
(美国)
赛诺菲 (法国)
葛兰素史克 (英国)
礼来
(美国)
阿斯利康 (英国)
安进
(美国)
p.Arg334Ter
pathogenic
p.Ser338Ter
pathogenic
p.Glu343Ter
pathogenic
蛋白质结构
PDB 数据库
软件:PyMOL
PDB ID: 3ODU
药物靶标口袋
软件:PyMOL & PocketPicker
药物靶标口袋
软件:PyMOL
药物靶点
生成蛋白质结构.pdbqt 格式文件和相关Gridbox 配置文件
百时美施贵宝 (美国)
武田制药 (日本)
药物发现与药物筛选课件
机能实验 药物作用机理研究 病理机制研究 药理作用选择性研究
优势和局限性
减少筛选药物用量提高筛选效率 减少动物用量和实验干扰
种属差异和病理变化的特殊性 观察指标局限和手工操作过程
学习交流PPT
12
药物发现简史
——高通量药物筛选
基本特点
微量化(反应体系、样品用量) 自动化(自动操作系统) 大规模(数千—数万/日) 分子细胞模型(分子靶点) 计算机管理(生物信息、数据处理) 样品库(大量样品)
1—5微克 机理明确
学习交流PPT
14
药物发现简史 —药物筛选方法比较
原始方法
基本技术 人体反应
作用类型 药效学
理论基础 临床医学
筛选形式
不定
结果评价 治疗作用
现代方法 动物实验 实验药效学
药理学 简单重复 药理作用
高通量筛选 自动化
分子靶点 反向药理学 系统筛选 作用机理
学习交流PPT
15
六、高通量药物筛选——概念
发现途径
剂型研究 理论研究 药物筛选 定向筛选 定向研究 药物筛选
随机筛选
学习交流PPT
6
药物发现的技术概览
药理研究药物设计定向筛选
生物技术
高通量筛选
生物信息 药物发现 超高通量筛选
生产生活
计算机辅助筛选
医疗实践
样品制备 组合化学
天然产物
学习交流PPT
7
四、药物筛选的基本概念
药物筛选
采用适当的方法,对可能作为药物使用的
偶然事件
主动寻找
(药物筛选)
发挥人类优势 借助有利条件
随机事件,规模效应 过程可控、条件可控
选择特定目标 绩效/工作 比低
药物靶标发现与筛选PPT课件
药物靶标发现与筛选的前景
基因组学和蛋白质组学的发展
随着基因组学和蛋白质组学技术的不断发展,将为药物靶标发现与筛选提供更广泛和深入 的视角。
人工智能和机器学习技术的应用
人工智能和机器学习技术有助于从大量数据中挖掘有用的信息,提高药物靶标发现与筛选 的效率和准确性。
免疫疗法和基因疗法的兴起
免疫疗法和基因疗法等新兴治疗方法的兴起,将为药物靶标发现与筛选提供新的方向和机 会。
案例三:代谢性疾病药物靶标发现与筛选
总结词
代谢性疾病是一类常见的慢性疾病,代谢性疾病药物 靶标发现与筛选对于代谢性疾病的治疗具有重要意义 。
详细描述
代谢性疾病药物靶标发现与筛选主要涉及代谢组学、糖 生物学和脂类生物学等领域的研究。通过对糖、脂肪、 蛋白质等代谢物质的深入研究,科学家们可以发现代谢 性疾病中关键的分子靶点,进而筛选出具有调节代谢平 衡和缓解症状的药物候选物。这些药物候选物经过临床 试验验证后,可以用于代谢性疾病治疗,降低患者的血 糖、血脂和血压水平,预防心血管疾病和糖尿病等并发 症的发生。
虚拟筛选方法
虚拟筛选方法
利用计算机模拟技术,对大规模 化合物库进行虚拟筛选,发现具 有潜在活性的小分子化合物,从
而筛选潜在的药物靶标。
数据库构建
建立大规模化合物库和靶标数据库, 为虚拟筛选提供数据基础。
分子对接模拟
利用分子对接技术,模拟小分子化 合物与靶标蛋白的相互作用,预测 其活性,进一步筛选潜在的药物靶 标。
药物靶标筛选提供依据。
基因表达谱分析
通过比较正常和疾病状态下的基 因表达谱,发现差异表达的基因,
进一步筛选潜在的药物靶标。
蛋白质组学筛选方法
蛋白质组学筛选方法
利用蛋白质组学技术,如质谱分析和 蛋白质芯片等,发现与疾病相关的蛋 白质,从而筛选潜在的药物靶标。
分子对接与药物虚拟筛选1课件
NU6102 (6-cyclohexylmethyl-2-(4’-sulfamoylanilino) purine)是第 一个基于活化状态的CDK2-cyclin A复合物结构的高效的小分子抑 制剂。实验表明NU6102对CDK2和CDK4有着不同的选择活性, 对CDK2有一个较高的亲和力Ki= 6nM,但是对CDK4的亲和力比 较低Ki = 1600nM,为了解释这种选择性差异的起源
集代表能被配体占据的体积。配体可以用球集表示或者用 自己的原子表示,在Dock程序中,四个有效匹配的对应点 被考虑,先考虑配体中第一个球集与活性位点的球集的匹 配,第二个点则满足∆d ≤ ε,其中∆d为第二个匹配点中配 体和受体的球心与第一个点球心的距离,第三个点又必需 满足与前两个球心的距离限制,以上过程一直进行到找不 到更多匹配点为止。
第一种方法是把一个片段放入受体的作用位点,然后加 上余下的片段,这种方法称为连续构建 “incremental construction”.
第二种方法把所有或一部分片段独立地放入受体的作用 位点,再重新连接至到构成一个完整的配体分子,这种 策略称为“放置&加” “place & join”
第一个连续构建的算法是Kuntz发展的Dock程序, 首先,一个单独的锚碎片通过手工选择对接进受体的活 性结合位点,并且考虑了氢键的作用。其次这个锚的优 势位置主要包含有有大量匹配氢键对,高打分值,和低 相似性。接着,一种回溯的算法(backtracking algorithm)用来搜索整个配体在结合位点的非重叠放置 空间,在当前位置加上一个碎片后,优化的方法用来减 少立体的张力和改善氢键的几何构型。最后的位置通过 过滤,优化和基于力场的方法来打分评价。FlexX也是一 个基于连续构建算法的对接程序
分子对接与药物虚拟筛选ppt课件
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
Dock对接程序中刚性对接的算法就是基于这种思想 Dock利用球集来表示受体活性位点和配体的形状
配体 受体
复合物
受体-配体的锁和钥匙模型
“雪亮工程"是以区(县)、乡(镇) 、村( 社区) 三级综 治中心 为指挥 平台、 以综治 信息化 为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
这类方法首先要建立大量 化合物(例如几十至上百万个 化合物)的三维结构数据库, 然后将库中的分子逐一与靶标 分子进行“对接” (docking),通过不断优化 小分子化合物的位置(取向) 以及分子内部柔性键的二面角 (构象),寻找小分子化合物 与靶标大分子作用的最佳构象, 计算其相互作用及结合能。在 库中所有分子均完成了对接计 算之后,即可从中找出与靶标 分子结合的最佳分子(前50名 或前100名)
第二部分即识别阶段,蛋白质的特征用来识别哈希 矩阵,每一次匹配表示蛋白质的特征与哈希矩阵中 已定义好方位的配体相匹配,具有大量匹配信息的 哈希矩阵代表着具有几个吻合特征的配体和方位
“雪亮工程"是以区(县)、乡(镇) 、村为支撑 、以网 格化管 理为基 础、以 公共安 全视频 监控联 网应用 为重点 的“群 众性治 安防控 工程” 。
(2) 基于经验的打分函数
基于经验的打分函数用多元回归的方法拟合各种物 理参数对结合自由能的贡献,如FlexX程序中采用下列 函数,所采用的方程包括,配体旋转键的个数、氢键、 离子键,疏水和芳香环的堆积作用,以及亲水作用。 这种方法能快速直接地估算结合自由能,
药物设计学第五章药物发现的虚拟筛选方法ppt课件
鼠和小龙虾的胰蛋白酶
Mouse IVGGYNCEENSVPYQVSLNS-----GYHFCGGSLINEQWVVSAGHCYK-------SRIQV Crayfish IVGGTDAVLGEFPYQLSFQETFLGFSFHFCGASIYNENYAITAGHCVYGDDYENPSGLQI * * Mouse RLGEHNIEVLEGNEQFINAAKIIRHPQYDRKTLNNDIMLIKLSSRAVINARVSTISLPTA Crayfish VAGELDMSVNEGSEQTITVSKIILHENFDYDLLDNDISLLKLSGSLTFNNNVAPIALPAQ |----- S-S--------| Mouse PPATGTKCLISGWGNTASSGADYPDELQCLDAPVLSQAKCEASYPG-KITSNMFCVGFLE Crayfish GHTATGNVIVTGWG-TTSEGGNTPDVLQKVTVPLVSDAECRDDYGADEIFDSMICAGVPE +*|----------S-S----------| Mouse GGKDSCQGDSGGPVVCNG----QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAAN Crayfish GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV--
2、三维结构数据库
1987年出现CONCORD程序,第一个能把二维连接表转换成三维坐 标,摆脱了三维结构信息的来源限制, 使任何拥有二维分子数据 库的实验室和公司都可以建立自己的三维结构数据库。之后产 生Chem-X、COBRA、CORINA和MOLGEO等一些三维结构转换程序。
利用CONCORD程序得到的三维结构数据库有:FCD-3D、MDDR-3D、 CMC-3D、CASRF、CAST-3D、Pomona-92C 目前,各大制药公司和分子设计公司建立的三维结构数据库有: ACD-3D、SYBYL-3DB、Chem-3DBS、NCI-3D。
Mouse IVGGYNCEENSVPYQVSLNS-----GYHFCGGSLINEQWVVSAGHCYK-------SRIQV Crayfish IVGGTDAVLGEFPYQLSFQETFLGFSFHFCGASIYNENYAITAGHCVYGDDYENPSGLQI * * Mouse RLGEHNIEVLEGNEQFINAAKIIRHPQYDRKTLNNDIMLIKLSSRAVINARVSTISLPTA Crayfish VAGELDMSVNEGSEQTITVSKIILHENFDYDLLDNDISLLKLSGSLTFNNNVAPIALPAQ |----- S-S--------| Mouse PPATGTKCLISGWGNTASSGADYPDELQCLDAPVLSQAKCEASYPG-KITSNMFCVGFLE Crayfish GHTATGNVIVTGWG-TTSEGGNTPDVLQKVTVPLVSDAECRDDYGADEIFDSMICAGVPE +*|----------S-S----------| Mouse GGKDSCQGDSGGPVVCNG----QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAAN Crayfish GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV--
2、三维结构数据库
1987年出现CONCORD程序,第一个能把二维连接表转换成三维坐 标,摆脱了三维结构信息的来源限制, 使任何拥有二维分子数据 库的实验室和公司都可以建立自己的三维结构数据库。之后产 生Chem-X、COBRA、CORINA和MOLGEO等一些三维结构转换程序。
利用CONCORD程序得到的三维结构数据库有:FCD-3D、MDDR-3D、 CMC-3D、CASRF、CAST-3D、Pomona-92C 目前,各大制药公司和分子设计公司建立的三维结构数据库有: ACD-3D、SYBYL-3DB、Chem-3DBS、NCI-3D。
药物设计学第八讲虚拟筛选61页PPT
药物设计学第八讲虚拟筛选
36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素 。
39、没有不老的誓言,没有不变的承 诺,踏 上旅途 ,义无 反顾。 40、对时间的价值没有没有深切认识 的人, 决不会 坚韧勤 勉。
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素 。
39、没有不老的誓言,没有不变的承 诺,踏 上旅途 ,义无 反顾。 40、对时间的价值没有没有深切认识 的人, 决不会 坚韧勤 勉。
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人,越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智,自知者明。胜人者有力,自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 研究对象
化学信息学:小分子 生物信息学:小分子结构单元构成的基因和蛋白质等大分子,本质上都是
化学物质。
• 计算方法
基于回归的聚类分析;支持向量机;神经网络;遗传算法等。
• 发挥作用方面
核酸和蛋白质功能和结构;小分子配体和蛋白质受体的相互作用;酶催化 等方面 。
是相互依存,相互影响,需结合在一起, 才能解决大多数的实际问题!
药物发现的虚拟筛选方法 PPT课件
讲述内容
第一节 概述
第二节 化学信息处理
第三节 生物信息处理
2020/12/9
第四节 虚拟筛选
第一节 概述
2020/12/9
• 计算机模拟与化学合成、生物测试的结合构成了后基因组 时代新药研究的新策略。从已有的化合物,包括合成化合 物和天然产物中寻找药物或先导化合物,是药物发现的一 个重要途径。到目前为止,人们只是针对大约500 种疾病的 治疗靶点,筛选了现已发现的2 000 多万种有机化合物中大 约10%的化合物,但仍然有大量的潜在活性化合物未被发 现。
2020/12/9
• 随着科学技术的发展,各种先进技术应运而生(X 射线晶 体衍射法、多维核磁共振法、扫描隧道显微技术等),使 得越来越多生物靶标(蛋白质、核酸、多糖等)的空间结 构被解析。
• 同时计算机科学的发展又极大地提高了计算和分析的速度 和精度。
• 因此,自上世纪90 年代起,合理药物设计就逐渐成
ROSDAL
SMILES
1986年提出的简化的 分子线性输入系统
Simplified molecular input line entry system
IUPAC
主要用于Beilstein 系统
不十分适合计算机的处理
2020/12/9
SMILES(简化分子线性输入系统) 编码的基本原则
➢ 原子通常以大写元素符号表示(省略氢原子),芳香结构原子则以小写表示
• 研究内容 化合物信息在计算机中的表示 化合物数据库的建立、使用和管理 化合物相似性、多样性及分子类药性分析 化合物定量构效关系
2020/12/9
化学信息学
Chemoinformatics,chemical informatics, Cheminformatics,chemi-informatics
➢依马替尼(imatinib) 治疗慢性骨髓型白血病药物
2020/12/9
二、数据库空间
化学空间
生物空间
化学信息学
2020/12/9
生物信息学
化合物数据库
合成化合物库
天然化合物库
组合化合物库
药物分子库
类药化合物库
生物大分子 数据库
核酸分子库
蛋白质 分子库
2020/12/9
化学信息学和生物信息学的共同点
• 利用计算机信息处理技术对化学分子结构和相关信息进行管 理的一种综合性技术和学科
• 应用化学信息学可促进化学信息的获取、转化与共享
2020/12/9
一、化学信息的表示方法
化学 分子
一维结构:化合物名称(俗名);线性符号表示法。 二维结构:原子用元素符号,键用短线,即化合物结构式。为平面结构。 三维结构:原子的空间位置、相互间距离、键角和二面角等。 分子表面:建立在三维结构基础上,能与分子的三维结构一一对应。
• 虽然早在20 世纪70 年代虚拟筛选技术已经得到应用,但由于技术本身的不成熟,使得 在新药开发上仍然主要依靠传统的实验筛选。近年来,随着虚拟药物筛选成功地发现 了一些有开发价值的先导化合物,这项技术又重新引起大家的重视。
2020/12/9
2020/12/9
化学信息学
• 产生的背景 组合化学和高通量筛选,出现了巨大的信息,需要快速收集、存储、分析和 处理,随着信息技术向化学领域的渗透,形成了新的交叉学科——化学信 息学。
2020/12/9
虚拟筛选
先导化合物 候选药物
靶点大分子 基因
化学信息学 VS 生物信息学
(虚拟筛选)
图 药物设计中的化学信息学和生物信息学
2020/12/9
ห้องสมุดไป่ตู้
虚拟筛选(virtual screening, VS)
• 虚拟筛选的时间: 在化合物组合库合成和/或筛选之前。
• 虚拟筛选的空间: 在计算机上进行模拟设计和筛选。
2020/12/9
苯丙氨酸分子结构表征层次
一维
三
结构
NC(Cc1ccccc1)C(O)=O
维
(SMILES编码)
结
构
二维 结构
2020/12/9
O
分
OH 子
H2N
表
面
(一)一维结构表示
线性符号表示法
SLN
是SMILES的改进,除有机 小分子,还表示大分子,
聚合物和组合库。
Sybyl linear notation
。
➢ 相邻原子依次排放在一起,单键通常省略,双键和三键分别以“=”和“#”表
示,芳香键以“:”表示,也可省略。
➢ 分支部分放在括号内,环则打开,并赋予断开键两端的原子以相同的数值。 ➢ 双键“/”表示顺式,“\”表示反式。 ➢ 原子顺时针排列用@表示,逆时针排列用@@表示。
2020/12/9
为一种实用技术接融入到药物研发的各个环节。
2020/12/9
一、合理药物设计
结构生物学兴起 (20世纪80年代中后期)
生物大分子的三维结构测定
结构确定的生物大分子数目大增
基于生物大分子三维结构的 药物分子设计方法
药物的化学特性
生物学特性
2020/12/9
合理药物设计
成功例子
➢奈非那韦(nelfinavir) 抗艾滋病药物 HIV-1蛋白酶抑制剂
• 虚拟筛选的方法: 直接方法:基于分子对接(molecular docking)的虚拟筛选 间接方法:基于药效基团(pharmacophore)的虚拟筛选
2020/12/9
• 虚拟筛选技术是药物设计方法的延伸和推广,广义地讲只要是基于某种提问形式,从 现有的小分子数据库中,搜寻符合条件的化合物都可以称之为虚拟筛选。这其中包括 基于某些分子特性的数据库搜索、基于分子对接的数据库搜索、基于药效团的数据库 搜索等,其目的是从几十乃至上百万个分子中筛选出新的先导化合物。由于实体的药 物筛选需要构建大规模的化合物库,提取或培养大量实验必须的靶酶或者靶细胞,并 且需要复杂的设备支持,因而进行实体的药物筛选要投入巨额资金。而虚拟药物筛选 是将药物筛选的过程在计算机上模拟,对化合物可能的活性作出预测,这样就能够集 中目标,大大降低实验筛选化合物的数量,从而缩短研发周期、节约经费开支。
化学信息学:小分子 生物信息学:小分子结构单元构成的基因和蛋白质等大分子,本质上都是
化学物质。
• 计算方法
基于回归的聚类分析;支持向量机;神经网络;遗传算法等。
• 发挥作用方面
核酸和蛋白质功能和结构;小分子配体和蛋白质受体的相互作用;酶催化 等方面 。
是相互依存,相互影响,需结合在一起, 才能解决大多数的实际问题!
药物发现的虚拟筛选方法 PPT课件
讲述内容
第一节 概述
第二节 化学信息处理
第三节 生物信息处理
2020/12/9
第四节 虚拟筛选
第一节 概述
2020/12/9
• 计算机模拟与化学合成、生物测试的结合构成了后基因组 时代新药研究的新策略。从已有的化合物,包括合成化合 物和天然产物中寻找药物或先导化合物,是药物发现的一 个重要途径。到目前为止,人们只是针对大约500 种疾病的 治疗靶点,筛选了现已发现的2 000 多万种有机化合物中大 约10%的化合物,但仍然有大量的潜在活性化合物未被发 现。
2020/12/9
• 随着科学技术的发展,各种先进技术应运而生(X 射线晶 体衍射法、多维核磁共振法、扫描隧道显微技术等),使 得越来越多生物靶标(蛋白质、核酸、多糖等)的空间结 构被解析。
• 同时计算机科学的发展又极大地提高了计算和分析的速度 和精度。
• 因此,自上世纪90 年代起,合理药物设计就逐渐成
ROSDAL
SMILES
1986年提出的简化的 分子线性输入系统
Simplified molecular input line entry system
IUPAC
主要用于Beilstein 系统
不十分适合计算机的处理
2020/12/9
SMILES(简化分子线性输入系统) 编码的基本原则
➢ 原子通常以大写元素符号表示(省略氢原子),芳香结构原子则以小写表示
• 研究内容 化合物信息在计算机中的表示 化合物数据库的建立、使用和管理 化合物相似性、多样性及分子类药性分析 化合物定量构效关系
2020/12/9
化学信息学
Chemoinformatics,chemical informatics, Cheminformatics,chemi-informatics
➢依马替尼(imatinib) 治疗慢性骨髓型白血病药物
2020/12/9
二、数据库空间
化学空间
生物空间
化学信息学
2020/12/9
生物信息学
化合物数据库
合成化合物库
天然化合物库
组合化合物库
药物分子库
类药化合物库
生物大分子 数据库
核酸分子库
蛋白质 分子库
2020/12/9
化学信息学和生物信息学的共同点
• 利用计算机信息处理技术对化学分子结构和相关信息进行管 理的一种综合性技术和学科
• 应用化学信息学可促进化学信息的获取、转化与共享
2020/12/9
一、化学信息的表示方法
化学 分子
一维结构:化合物名称(俗名);线性符号表示法。 二维结构:原子用元素符号,键用短线,即化合物结构式。为平面结构。 三维结构:原子的空间位置、相互间距离、键角和二面角等。 分子表面:建立在三维结构基础上,能与分子的三维结构一一对应。
• 虽然早在20 世纪70 年代虚拟筛选技术已经得到应用,但由于技术本身的不成熟,使得 在新药开发上仍然主要依靠传统的实验筛选。近年来,随着虚拟药物筛选成功地发现 了一些有开发价值的先导化合物,这项技术又重新引起大家的重视。
2020/12/9
2020/12/9
化学信息学
• 产生的背景 组合化学和高通量筛选,出现了巨大的信息,需要快速收集、存储、分析和 处理,随着信息技术向化学领域的渗透,形成了新的交叉学科——化学信 息学。
2020/12/9
虚拟筛选
先导化合物 候选药物
靶点大分子 基因
化学信息学 VS 生物信息学
(虚拟筛选)
图 药物设计中的化学信息学和生物信息学
2020/12/9
ห้องสมุดไป่ตู้
虚拟筛选(virtual screening, VS)
• 虚拟筛选的时间: 在化合物组合库合成和/或筛选之前。
• 虚拟筛选的空间: 在计算机上进行模拟设计和筛选。
2020/12/9
苯丙氨酸分子结构表征层次
一维
三
结构
NC(Cc1ccccc1)C(O)=O
维
(SMILES编码)
结
构
二维 结构
2020/12/9
O
分
OH 子
H2N
表
面
(一)一维结构表示
线性符号表示法
SLN
是SMILES的改进,除有机 小分子,还表示大分子,
聚合物和组合库。
Sybyl linear notation
。
➢ 相邻原子依次排放在一起,单键通常省略,双键和三键分别以“=”和“#”表
示,芳香键以“:”表示,也可省略。
➢ 分支部分放在括号内,环则打开,并赋予断开键两端的原子以相同的数值。 ➢ 双键“/”表示顺式,“\”表示反式。 ➢ 原子顺时针排列用@表示,逆时针排列用@@表示。
2020/12/9
为一种实用技术接融入到药物研发的各个环节。
2020/12/9
一、合理药物设计
结构生物学兴起 (20世纪80年代中后期)
生物大分子的三维结构测定
结构确定的生物大分子数目大增
基于生物大分子三维结构的 药物分子设计方法
药物的化学特性
生物学特性
2020/12/9
合理药物设计
成功例子
➢奈非那韦(nelfinavir) 抗艾滋病药物 HIV-1蛋白酶抑制剂
• 虚拟筛选的方法: 直接方法:基于分子对接(molecular docking)的虚拟筛选 间接方法:基于药效基团(pharmacophore)的虚拟筛选
2020/12/9
• 虚拟筛选技术是药物设计方法的延伸和推广,广义地讲只要是基于某种提问形式,从 现有的小分子数据库中,搜寻符合条件的化合物都可以称之为虚拟筛选。这其中包括 基于某些分子特性的数据库搜索、基于分子对接的数据库搜索、基于药效团的数据库 搜索等,其目的是从几十乃至上百万个分子中筛选出新的先导化合物。由于实体的药 物筛选需要构建大规模的化合物库,提取或培养大量实验必须的靶酶或者靶细胞,并 且需要复杂的设备支持,因而进行实体的药物筛选要投入巨额资金。而虚拟药物筛选 是将药物筛选的过程在计算机上模拟,对化合物可能的活性作出预测,这样就能够集 中目标,大大降低实验筛选化合物的数量,从而缩短研发周期、节约经费开支。