药物生物信息学 计算药物重定位
药物重定位的研究策略
药物重定位的研究策略
药物重定位是指将一种药物的适应症或用途进行调整或扩大,使其在治疗领域中得到更广泛的应用。
下面是一些药物重定位的研究策略:
1. 挖掘现有药物的新用途:通过对现有药物的药理机制、作用靶点、不良反应等方面进行深入研究,可以挖掘出其新的用途。
例如,化学药阿司匹林被广泛用于预防和治疗心血管疾病,近年来还发现它有抗炎和抗溃疡作用,从而拓展了其应用领域。
2. 研发新药物:通过新药研发,可以开发出具有新作用机制和新适应症的药物。
例如,阿托伐他汀是一种血脂调节药物,近年来被发现还具有治疗心力衰竭的功效,从而被用于治疗心血管疾病的其他疾病。
3. 调整药物的剂型和用法:通过调整药物的剂型和用法,可以使药物在特定的治疗领域中得到更好的应用。
例如,将药物制成注射剂可以提高药效,而将药物制成口服制剂则可以提高患者用药的依从性。
4. 利用药物的生物标记物:通过研究药物的生物标记物,可以更好地理解药物的作用机制和药效学特性,从而扩大药物的适应症或提高其治疗效果。
例如,生物标记物可以帮助医生更好地预测药物在体内的代谢和清除情况,从而更好地选择用药方案。
5. 结合其他治疗方法:通过结合其他治疗方法,可以将药物在特定的治疗领域中得到更好的应用。
例如,化疗药物可以用于治疗癌症,而靶向药物则可以提高化疗药物的治疗效果。
药物重定位需要综合考虑药物的药理机制、作用靶点、不良反应、适应症、治疗效果等因素,以确保药物在新的治疗领域中得到合理的应用。
同时,对于药
物的重定位,需要在确保安全性和有效性的前提下进行深入研究,以确保药物在新的治疗领域中得到合理的应用。
生物信息学在药物开发中的应用
生物信息学在药物开发中的应用在当今的医学领域,药物开发是一项至关重要的工作,它关系着人类的健康和生命质量。
而随着科技的飞速发展,生物信息学这一新兴学科正逐渐在药物开发中发挥着举足轻重的作用。
生物信息学是一门融合了生物学、计算机科学、数学和统计学等多学科知识的交叉领域。
其核心任务是收集、整理、分析和解释生物数据,从中挖掘出有价值的信息和知识。
在药物开发中,生物信息学的应用主要体现在以下几个方面。
首先,药物靶点的发现是药物开发的关键环节。
传统的药物靶点发现方法往往依赖于大量的实验和试错,不仅耗时费力,而且成功率较低。
生物信息学的出现为这一问题提供了新的解决方案。
通过对大量的基因组、蛋白质组和代谢组等数据进行分析,生物信息学家可以筛选出与疾病相关的基因、蛋白质或代谢通路,从而确定潜在的药物靶点。
例如,在癌症研究中,通过对肿瘤细胞和正常细胞的基因表达谱进行比较分析,可以发现那些在肿瘤细胞中异常表达的基因,这些基因很可能成为治疗癌症的药物靶点。
其次,药物筛选也是药物开发中的重要步骤。
生物信息学可以帮助研究人员建立虚拟药物筛选模型,利用计算机模拟的方法对大量的化合物进行筛选,从而快速找到具有潜在活性的药物分子。
这种方法不仅可以大大提高筛选效率,降低成本,还可以减少实验动物的使用,符合伦理要求。
此外,生物信息学还可以对药物分子的结构和性质进行预测和分析,为药物设计提供重要的参考依据。
在药物研发的临床试验阶段,生物信息学同样发挥着重要作用。
通过对临床试验数据的分析,生物信息学家可以评估药物的疗效和安全性,发现潜在的不良反应和药物相互作用,为临床试验的设计和优化提供支持。
例如,利用生物标志物对患者进行分层分析,可以更准确地评估药物在不同亚组患者中的疗效,从而为个性化医疗提供依据。
另外,生物信息学在药物的重定位方面也有着独特的优势。
药物重定位是指将已上市的药物用于治疗新的疾病或适应证。
由于这些药物已经经过了安全性和有效性的评估,因此药物重定位可以大大缩短药物开发的时间和成本。
生物信息学在药物研发中的应用有哪些
生物信息学在药物研发中的应用有哪些在当今的医学领域,药物研发是一项至关重要且极具挑战性的工作。
随着科技的不断进步,生物信息学作为一门融合了生物学、计算机科学和统计学的交叉学科,正逐渐在药物研发中发挥着举足轻重的作用。
那么,生物信息学在药物研发中究竟有哪些具体的应用呢?首先,生物信息学在药物靶点的发现和筛选方面表现出色。
药物靶点通常是指与疾病发生、发展密切相关的生物大分子,如蛋白质、核酸等。
通过对大量生物数据的分析,包括基因组学、蛋白质组学和转录组学等数据,生物信息学能够帮助研究人员识别潜在的药物靶点。
例如,对癌症患者的基因测序数据进行分析,可以发现某些基因突变或异常表达的蛋白质,这些可能成为抗癌药物的新靶点。
此外,利用生物信息学方法还可以对靶点的可行性进行评估,比如考虑靶点在疾病中的关键作用、与其他生物分子的相互作用以及其在人体内的分布和可及性等因素。
其次,生物信息学有助于药物先导化合物的筛选和优化。
先导化合物是药物研发的起点,是具有一定活性但还需要进一步优化的化合物。
在海量的化合物数据库中,通过虚拟筛选技术,生物信息学可以根据药物靶点的结构和性质,快速筛选出可能与之结合的化合物。
这种虚拟筛选大大减少了实验筛选的工作量和成本。
而且,在获得先导化合物后,生物信息学还能通过计算化学的方法,对其进行结构优化,预测其药代动力学和毒理学性质,提高药物研发的成功率。
再者,生物信息学在药物临床试验的设计和数据分析中也发挥着重要作用。
在临床试验前,通过对患者基因信息的分析,可以对患者进行分层,选择最有可能对药物产生反应的人群进行试验,提高试验的效率和成功率。
在试验过程中,生物信息学可以对收集到的大量临床数据进行分析,包括患者的症状、体征、实验室检查结果等,帮助研究人员及时发现药物的疗效和安全性问题。
此外,利用生物信息学还可以对不同临床试验的数据进行整合和meta分析,为药物的审批和上市提供更充分的证据。
另外,生物信息学在药物不良反应的监测和预测方面也具有重要意义。
药物重定位在新药研发中的研究进展
药物重定位在新药研发中的研究进展摘要:药物重新定位是新药研究中非常重要的措施,主要是指研发之前药品是否存在新的功能和效用。
如果只是单纯的进行新药品的研究时,研发流程主要可以采用研究和开发两个部分,各个部分都是由很多阶段共同组成,耗费的时间和资金成本不可逆且非常庞大,而且各大药企虽然都在进行新药研制,但是通过率却一直处于不变的状态,甚至呈现降低的趋势。
所以,对旧药进行研制可以降低研发所用的时间和成本,而且通过率却可以有效提高,所以这种方式被大部分药企广泛认可和使用,都是使用重新定位的方式来进行药物研发。
通常情况下,药物定位可以从三个部分来进行考虑和研究,主要是疾病、基于靶点和基于临床观察角度,需要药企研究人员必须掌握充分地药理知识和研究手段与方式,并且不断收集大量的研究信息进行讨论,可以有效地提高研发成功率。
然而药物数据极其庞大而且需要仔细研究才可以辨真伪,这是工作量非常庞大的任务,为推荐算法应用于药物重定位提供了一个契机。
关键词:药物重定位;新药研发;研究进展引言药物重定位(drugrepurposing,drugrepositioning,drugre-tasking,drugre-profiling)俗称“老药新用”,是指对曾经用于临床的药物(包括正在使用、不再使用和曾被临床评价过的药物)新适应证的发现、确认和应用。
在过去10年,新分子实体药物的研发成本大幅度增加,商品化上市药物库的出现并逐渐完善,快速发展的生物信息学及互联网技术向公众提供了药物作用机制关联性和临床信息,上述因素促进了药物重定位的快速发展。
与从头研发相比,由于上市药物已经过长期临床实践,其毒性和不良反应均已明确,且生产工艺、质量标准、剂型等完备,所以以上市药物作为物质基础的新药研发在时间和经济成本方面都有显著优势,且成功率大幅度提升。
1药物重定位分析的理论依据第一,药物具有杂乱性。
研究人员在进行药物成分的分析时,通常需要搞清楚药物和药物之间存在的靶标关系,因为药物靶向和靶标之间并不是一一对应关系。
药物重定位与疾病治疗
▪ 药物重定位在肿瘤治疗中的应用
1.药物重定位在肿瘤治疗中具有重要的作用,可以通过改变药 物的使用方式或剂量,提高肿瘤的治疗效果。 2.一些抗肿瘤药物通过重定位可以用于其他类型的肿瘤治疗, 如将抗白血病药物用于肺癌的治疗。 3.药物重定位可以减少肿瘤患者的痛苦,提高生存率和生活质 量。
药物重定位与疾病治疗
药物重定位的实践案例分享
药物重定位的实践案例分享
▪ 他汀类药物的重定位
1.他汀类药物原是用于降低胆固醇,减少心血管疾病的风险。 然而,研究发现它们还具有抗炎和神经保护作用。 2.在多项实验中,他汀类药物显示出对阿尔茨海默病、帕金森 病等神经退行性疾病的潜在治疗效果。 3.他汀类药物的重定位案例为药物重定位研究提供了有力证据 ,展示了已有药物在新适应症中的潜力。
药物重定位与疾病治疗
疾病治疗的现状与未来
疾病治疗的现状与未来
▪ 疾病治疗的现状
1.当前的治疗方法:药物治疗、物理治疗、手术治疗等已经在 许多疾病中取得了显著的成效。然而,对于一些复杂和慢性疾 病,如癌症、神经退行性疾病等,现有的治疗方法仍有限,且 存在复发和副作用等问题。 2.药物研发的挑战:药物研发需要投入大量的人力和资金,且 周期长、成功率低。此外,病原体对药物的抗药性增强,使得 药物研发的难度加大。 3.精准医疗的兴起:精准医疗通过基因检测、分子诊断等手段 ,为每位患者提供个性化的治疗方案,提高了治疗效果。
▪ 二甲双胍的重定位
一种基于深度学习多源异构网络的药物重定位方法[发明专利]
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202010531562.4(22)申请日 2020.06.11(71)申请人 湖南大学地址 410012 湖南省长沙市岳麓区麓山南路1号(72)发明人 彭绍亮 冯潇逸 谭蔚泓 李肯立 何敏 曾湘祥 骆嘉伟 陈浩 王小奇 罗娟 (74)专利代理机构 国防科技大学专利服务中心43202代理人 王文惠(51)Int.Cl.G16C 20/50(2019.01)G16C 20/70(2019.01)G06N 3/04(2006.01)G06N 3/08(2006.01)(54)发明名称一种基于深度学习多源异构网络的药物重定位方法(57)摘要本发明属于计算机生物信息学领域,公开了一种基于深度学习多源异构网络的药物重定位方法。
本发明包括步骤:使用随机游走方法,得到概率共生矩阵数据集;利用移位正点互信息(PPMI)矩阵方法计算数据集;利用计算所得的多源数据集对图卷积编码器模型进行训练,获得药物信息的低维嵌入表示作为变分自编码器的输入数据进行参数训练,将训练好的模型结合已知的药物疾病关联矩阵做最终的药物重定位预测。
本发明避免了传统特征提取方法的局限,如:高度依赖于医护人员的经提取出有区分性的高质量特征,也往往存在一定的困难,而且准确率低,本发明借助于图卷积编码器模型和变分自编码器网络模型,实现高精度的药物重定位预测。
权利要求书2页 说明书4页 附图1页CN 111681718 A 2020.09.18C N 111681718A1.一种基于深度学习多源异构网络的药物重定位方法,其特征在于,包括以下步骤:步骤一:基于随机游走方法计算多源异构网络的拓扑结构信息,包括以下步骤:1.1.输入多源异构数据集D=[D1,D2,…,D9],其中,D表示和药物相关的多源异构数据集,D1,D2,D3,…,D9分别表示药物-药物相互作用矩阵,药物-靶标相互作用矩阵,药物-副作用关联矩阵以及6种药物相似性矩阵;1.2.基于随机游走方法,分别计算并捕获D中数据集的网络结构信息并描述每种药物的拓扑上下文,得到每个矩阵的概率共现矩阵集合C=[C1,C2,C3…C9],C表示概率共现矩阵的集合,C1,C2,C3,…,C9分别表示步骤1.1中的输入数据集D的概率共现矩阵,其中概率共现矩阵的计算公式为:C i,k=wC i,k-1A+(1-w)D i其中C i,k表示概率共现矩阵集合C中每个矩阵C i的第k轮迭代结果,D i表示步骤1.1中的输入数据集合D中的原始01矩阵,w表示概率,A表示原始邻接矩阵;1.3.将1.2步骤获得的概率共现矩阵集合C作为输入,分别计算集合中每个概率共现矩阵的移位正点互信息矩阵PPMI,其中PPMI矩阵的计算公式为:其中C为步骤1.2中获得的概率共现矩阵,C(i,j)表示概率共现矩阵C中第i行,第j列的数据,Nr和Nc分别表示矩阵的行数和列数,求得的负数值设置为0;步骤二:利用步骤一生成的多源异构数据的互信息矩阵PPMI数据集对图卷积编码器神经网络进行训练,其中,图卷积编码器神经网络包括四个图卷积层、四个sigmoid层和一个拼接层,且网络顺序为图卷积层、sigmoid层、图卷积层、sigmoid层、拼接层、图卷积层、sigmoid层、图卷积层、sigmoid层;每个图卷积层的维度分别为500,100,500,1519,每个拼接层维度为9*100;步骤三:将交叉熵损失函数作为图卷积编码器神经网络的损失函数,并结合BP算法更新网络参数,使得网络随着训练的进行,网络输出越来越接近正确输入数据。
生物信息学技术在药物设计中的应用
生物信息学技术在药物设计中的应用随着科技的不断进步,生物信息学技术在药物研究领域中得到了广泛的应用。
生物信息学技术是一门交叉学科,它涉及计算机科学、统计学、生物学、化学等多个学科领域,在药物设计、药物开发以及生物分子的理解方面都有着不可替代的作用。
本文将详细探讨生物信息学技术在药物设计中的应用。
一、生物信息学技术在分子建模中的应用在药物设计中,分子建模是一个非常重要的环节。
通过对分子结构的模拟,可以预测分子的性质和活性,为药物研究提供有价值的信息。
生物信息学技术可以利用计算机程序对分子进行模拟和计算,从而预测分子的性质和活性。
在药物研究中,分子对接和药物设计是常用的分子建模方法。
分子对接是指将分子库中的分子与受体分子进行对接,从中筛选出具有高效率和选择性的药物分子。
而药物设计则是指通过计算机程序和实验方法,对药物分子进行设计和优化,使其具有更高的活性和药效。
生物信息学技术在分子建模中的应用,可以大大提高药物研究的效率和准确性。
通过对分子结构的模拟和计算,可以筛选出具有高效率和选择性的药物分子,从而降低了药物研究和开发的成本和时间。
二、生物信息学技术在药物靶点预测中的应用药物靶点是药物作用的目标蛋白分子。
预测药物靶点是药物研究的关键环节,可以为药物的设计和开发提供重要的信息。
生物信息学技术可以结合生物信息学数据库和分子模拟技术,预测药物的靶点和作用机制。
例如,通过对靶点蛋白的结构和序列分析,可以预测蛋白的结构、功能和亚细胞定位。
同时,可以通过分子模拟技术,预测药物与受体蛋白的作用方式和机制。
生物信息学技术在药物靶点预测中的应用,可以为药物的设计和开发提供有价值的信息。
通过预测药物的靶点和作用机制,可以提高药物的选择性和效率,降低药物的副作用和毒性。
三、生物信息学技术在药物代谢和毒性预测中的应用药物代谢和毒性是影响药物研究和开发的重要因素。
生物信息学技术可以利用生物信息学数据库和分子模拟技术,预测药物代谢和毒性,从而评估药物的安全性和可行性。
药物研发中的生物信息学应用
药物研发中的生物信息学应用在当今的医学领域,药物研发是一项充满挑战和机遇的工作。
随着科技的不断进步,生物信息学作为一门交叉学科,正逐渐在药物研发中发挥着越来越重要的作用。
生物信息学整合了生物学、计算机科学、统计学和数学等多个领域的知识和技术,为药物研发提供了全新的视角和方法。
药物研发是一个漫长而复杂的过程,通常包括药物靶点的发现、先导化合物的筛选、药物的优化和临床试验等多个阶段。
在每一个阶段,生物信息学都能提供有价值的支持和帮助。
在药物靶点的发现阶段,生物信息学可以通过对大量生物数据的分析来识别潜在的药物靶点。
例如,通过对基因表达数据、蛋白质组学数据和代谢组学数据的整合分析,可以发现与疾病相关的基因和蛋白质。
这些基因和蛋白质可能成为新的药物靶点,为药物研发提供新的方向。
生物信息学在先导化合物的筛选中也发挥着关键作用。
传统的药物筛选方法往往费时费力,而且效率低下。
而利用生物信息学方法,可以对海量的化合物数据库进行虚拟筛选。
通过建立药物分子与靶点的相互作用模型,预测化合物与靶点的结合能力和活性,从而快速筛选出具有潜在活性的先导化合物。
这种虚拟筛选的方法大大减少了实验筛选的工作量,提高了筛选的效率和准确性。
在药物的优化阶段,生物信息学同样不可或缺。
药物的优化需要考虑药物的药代动力学性质、毒性和药效等多个方面。
通过生物信息学手段,可以对药物分子的结构进行分析和改造,以提高药物的生物利用度、降低毒性和增强药效。
例如,利用分子模拟技术,可以研究药物分子与靶点的结合模式,从而对药物分子进行合理的设计和优化。
此外,生物信息学在临床试验的设计和数据分析方面也具有重要意义。
临床试验是药物研发的关键环节,其结果直接关系到药物能否获批上市。
生物信息学可以帮助研究人员更好地设计临床试验方案,选择合适的受试人群和研究指标。
同时,在临床试验过程中,生物信息学可以对收集到的数据进行深入分析,挖掘出有价值的信息,为药物的安全性和有效性评估提供依据。
生物信息学在药物重定位中的作用
生物信息学在药物重定位中的作用在现代医学的舞台上,药物研发如同一场精心编排的戏剧,而生物信息学则是这场戏剧中不可或缺的导演。
它以其独特的视角和工具,重新审视已有药物的潜在价值,为药物重定位揭开了新的篇章。
生物信息学,这个听起来有些冰冷的名词,实则蕴含着无尽的热情与智慧。
它如同一位细心的园丁,在庞大的数据森林中寻找着那些被忽视的、可能开花结果的种子。
这些种子,就是那些已经在市面上或在研发过程中的药物,它们或许因为种种原因未能充分发挥其潜力。
生物信息学的任务,就是通过深入挖掘和分析这些药物的相关数据,揭示它们在新的领域或治疗对象上的可能性。
想象一下,如果把药物比作一把钥匙,那么疾病就是那扇需要打开的门。
传统的药物研发模式往往是为一把特定的锁(疾病)打造一把新钥匙(药物)。
而药物重定位的思路,则是在已有的钥匙堆中寻找能够打开新锁的可能。
这种“旧钥匙开新锁”的策略,不仅节省了时间和资源,更增加了治疗手段的多样性。
在生物信息学的助力下,药物重定位不再是大海捞针般的偶然事件。
通过对大量基因组、蛋白质组、代谢组等数据的整合分析,生物信息学家们能够在分子水平上理解药物的作用机制,以及它们可能对其他疾病产生的影响。
这就像是在一片繁茂的森林中,通过精准的地图和指南针找到那些隐藏的宝藏。
举个例子来说,某种用于治疗高血压的药物,在生物信息学的深入分析下,被发现具有调节免疫系统的潜在作用。
这一发现就像是在平静的湖面上投下了一颗石子,激起了层层涟漪。
科学家们据此推测,这种药物或许可以用于治疗某些免疫相关性疾病。
随后的临床研究验证了这一假设,从而为这类疾病的患者带来了新的希望。
然而,生物信息学在药物重定位中的应用并非没有挑战。
数据的质量和量、分析方法的准确性、以及跨学科合作的效率等都是需要克服的难题。
但正如攀登珠穆朗玛峰一样,尽管路途遥远且充满未知,但每一步的进展都离顶峰更近。
总的来说,生物信息学在药物重定位中扮演着至关重要的角色。
基于多相似度融合的药物重定位推荐算法
收稿日期:2020-03-12 修回日期:2020-07-15基金项目:国家重点研究发展计划资助项目(2016YFC 0802500)作者简介:陈 鹏(1973-),男,博士,教授,CCF 会员(73012M ),从事大数据分析技术研究;通讯作者:余肖生(1973-),男,博士,副教授,CCF会员(98980M ),从事健康医疗大数据分析研究㊂基于多相似度融合的药物重定位推荐算法陈 鹏,鲍天嘉智,余肖生(三峡大学计算机与信息学院,湖北宜昌443002)摘 要:药物重定位算法可以为发现药物的新用途提供理论上的支持㊂针对传统药物重定位推荐算法的不足,提出一种基于多相似度融合的药物重定位推荐算法(MSF )㊂首先通过药物-疾病数据源计算出疾病相似度,再通过药物-化学结构㊁药物-靶蛋白以及药物-副作用数据源计算出三种相似度并融合为药物相似度,最后利用两种相似度计算药物与疾病对应关系的预测值,并通过预测值融合方法融合为最终预测值㊂实验结果表明,与SLAMS 算法和DRCFFS 算法相比,MSF 算法在精确率和召回率上有较大的提高;与针对单个数据源的药物重定位算法相比,通过融合多种数据源,预测值的可靠性和精确性都有进一步的提升㊂案例分析显示,MSF 算法可以有效地预测出有治疗效果的药物-疾病组合㊂关键词:药物重定位;协同过滤;数据稀疏性;相似度融合;预测值融合中图分类号:TP 399 文献标识码:A 文章编号:1673-629X (2021)01-0168-07doi :10.3969/j.issn.1673-629X.2021.01.030Recommendation Algorithm for Drug Repositioning Based onMulti -similarity FusionCHEN Peng ,BAO Tian -jiazhi ,YU Xiao -sheng(School of Computer and Information ,Three Gorges University ,Yichang 443002,China )Abstract :Drug repositioning algorithms can provide theoretical support for discovering new uses of drugs.To overcome the shortcomings of traditional drug relocation recommendation algorithm ,we propose a drug repositioning recommendation (MSF )based on multi -similarity fusion.Disease similarity is calculated by drug -disease data sources ,and then three similarities are fused into drug similarity by drug -chemical structure ,drug -target protein and drug -side effect data sources.Finally ,two similarities are used to calculate the predicted value and fuse it into the final predicted value.The experiment shows that compared with SLAMS and DRCFFS ,MSF has a greater im⁃provement in accuracy and recall pared with collaborative filtering algorithm for a single data source ,the reliability and accuracy of predicted values are further improved by fusing multiple data sources.Case analysis shows that MSF can effectively predict drug -disease combination with therapeutic effect.Key words :drug repositioning ;collaborative filtering ;data sparsity ;similarity fusion ;predictive value fusion0 引 言药物重定位(drug repurposing ),俗称 老药新用”,是指通过现有的技术手段将已经产生适应症的药物重新定位,寻找其新的适应症[1]㊂药物重定位这一概念自被提出以来,国内外学者对该方向算法的研究投入了巨大的精力[2-3]㊂张永祥等认为药物重定位是网络药理学的重要应用领域,介绍了基于小分子特征㊁基于蛋白靶点特征等方法[4]㊂谢达菲等提出了利用药物-靶标关系㊁药物-药物关系和药物-疾病关系分析等方法进行药物重定位的计算预测[5]㊂文献[6]将深度学习的方法应用于药物重定位㊂Luo 等人提出了一种基于综合相似度和随机游走的药物重定位算法[7-8],通过将药物和疾病特征信息与已知的药物-疾病关系相结合,首次提出了药物与疾病相似性的综合相似度计算方法㊂文献[9-11]提出了基于多数据源融合的药物重定位算法㊂文献[12-15]提出了一系列基于协同过滤的药物重定位算法研究,从多源数据的角度出发,通过协同过滤来计算药物-疾病对应关系预测值㊂由于数据稀疏性对协同过滤的影响较大,所以现阶段基于协同过滤的药物重定位算法大多通过融合多种数据源进行计算的方法来减小影响,但在计算过程第31卷 第1期2021年1月 计算机技术与发展COMPUTER TECHNOLOGY AND DEVELOPMENT Vol.31 No.1Jan. 2021中仅使用了药物相似度,忽略了疾病相似度的作用㊂综上所述,传统的基于协同过滤的药物重定位算法虽然有一定的效果,但仍有很大的进步空间㊂该文提出了一种基于多相似度融合的药物重定位推荐算法(MSF),首先由药物-疾病数据源计算出疾病相似度,其他三种数据源计算出的三种相似度融合为药物相似度,再分别利用基于项目和基于用户的协同过滤进行药物与疾病对应关系的预测值计算,并通过融合方法将两种预测值融合为最终的药物-疾病关系预测值㊂MSF算法在充分利用多源数据的前提下,将计算出的相似度和预测值融合,降低了数据稀疏性对协同过滤的影响㊂1 相关理论1.1 药物重定位药物重定位已经成为医学领域研究的一大热门㊂现阶段,由于药物和疾病数据的大量增长,从不同角度进行药物重定位研究的案例也越来越多㊂为证明本文对药物重定位的研究角度是切实可行的,从药物与疾病的关系㊁药物化学结构㊁药物靶蛋白和药物副作用四个方面进行讨论㊂Chiang等人[16]提出了一种从疾病的角度看待药物重定位的观点,当两种疾病可以被多种相同的药物治疗时,认为两种疾病是相似的㊂如果存在一种药物只对其中一种疾病有治疗效果,则认为该药对另一种疾病也存在潜在的治疗关系,可以作为治疗该疾病的候选药物㊂药物的化学结构被认为可以用来度量药物间相似性,Dudley等人[17]提出药物的化学性质与其治疗效果有密切的关系,药物的化学结构和生物活性之间存在定量关系,所以药物的化学结构可以作为药物重定位的研究方向㊂药物靶蛋白是药物治疗疾病的关键因素,含有相似靶蛋白的药物也可能会有类似的作用效果[18],因此靶蛋白可以作为药物重定位中度量药物相似性的一个研究角度㊂同样,与药物对疾病的治疗效果类似,药物产生的副作用提供了人类的表型特征,因此从药物的副作用角度进行药物重定位的研究也是可行的[19]㊂通过上述讨论证明从药物与疾病的关系㊁药物化学结构㊁药物靶蛋白和药物副作用这四个角度进行药物重定位研究是可行的㊂但是上述文献提供的方法都是从多个角度中的一类或两类进行药物重定位研究,可能会导致预测值的偏差,因此,该文从四个角度综合考虑并进行研究,减小了预测结果的有偏性,更具有实际应用价值㊂1.2 协同过滤协同过滤算法在近几年被广泛应用于各大电商行业以及影视平台的应用推荐中[20-21]㊂传统基于邻域的协同过滤算法分为两种,即基于用户的和基于项目的,两种算法的本质都是通过选取k个最相似的邻居进行评分预测㊂协同过滤的基本流程为:先通过余弦相似度㊁皮尔逊相关系数㊁谷本系数等相似度度量方法计算用户或项目的相似度㊂再利用计算出的相似度找到相似度最高的k个邻居,由对应的两种公式求出预测分数: (1)定义r ui为用户u对项目i的评分,D为用户u的邻居集合,r u_为用户u对所有项目的平均评分, sim uv为用户u和用户v的相似度,r vi为用户v对项目i的评分,r v_表示用户v对所有项目的平均评分,基于用户的预测值计算如式(1):rui=ru_+∑v∈D sim uv•(r vi-r_v)∑v∈D sim uv(1) (2)定义r ui为用户u对项目i的评分,D为项目i 的邻居集合,sim ij表示项目i和j的相似度,r uj为用户u对项目j的评分,基于项目的预测值计算如式(2):rui=∑j∈D sim ij•r uj∑j∈D sim ij(2) 2 基于多相似度融合的药物重定位推荐算法传统的基于协同过滤的药物重定位算法仅使用药物相似度进行预测值计算,往往忽略了疾病相似度在药物重定位中的作用且研究角度比较单一,而由于单个数据源的稀疏问题,导致计算出的有效药物㊁疾病相似度较少,许多项目无法找到合适的邻居,因而计算出的预测值偏差较大[22]㊂该文提出了MSF算法,即:首先由药物-疾病数据源计算出疾病相似度,再通过药物-化学结构㊁药物-靶蛋白以及药物-副作用数据源计算出三种相似度融合为药物相似度,使用疾病相似度和药物相似度计算两种预测值并融合为最终的预测值,整体流程如图1所示㊂2.1 相似度计算2.1.1 疾病相似度疾病相似度通过药物-疾病数据进行计算㊂药物-疾病治疗关系数据从UMLS[23]中的NDF-RT(national drug file-reference terminology)进行采样,其中药物与疾病有作用关系则值为1,若无关系则为0㊂这种药物-疾病数据集在文献[11]中被认为是药物重定位的 金”标准数据集㊂基于文献[16]的思想,该文对于疾病相似度的计算只考虑药物与疾病是否有对应的治疗㊃961㊃ 第1期 陈 鹏等:基于多相似度融合的药物重定位推荐算法关系,而不考虑治疗效果的优劣,所以疾病相似度通过谷本系数进行,与使用余弦相似度等方法相比,在不影响相似度准确性的情况下,简化了计算的复杂程度㊂疾病相似度的计算公式如式(3):sim(i a ,i b )=I abI a +I b -|I ab |(3)其中,sim(i a ,i b )表示疾病a 和疾病b 的相似度,I a 表示可以治疗疾病a 的药物数量,I b 表示可以治疗疾病b 的药物数量,I ab 表示可以同时治疗疾病a 和疾病b 的药物数量㊂sim(i a ,i b )的值应该在区间[0,1]之间㊂图1 算法流程2.1.2 药物相似度在文献[17-19]的基础上,该文认为通过药物-化学结构㊁药物-靶蛋白和药物-副作用三种数据源计算出的药物相似度可以通过一定的权重融合为最终的药物相似度,其中药物-化学结构数据从PubChem [24]进行采样,药物-靶蛋白数据从UniPortKnowledgebase [25]中采样,药物-副作用数据从SIDER [26]数据库中采样㊂融合相似度的方法有效缓解了单个数据源因为数据稀疏而导致计算出的有效相似度较少的问题,并且通过融合减少了计算最终预测值所需要的步骤㊂由于采用相似度融合的方法,所以三种数据源应该选用同一种相似度计算方法㊂与计算疾病相似度类似,用于药物相似度计算的三种数据源中只考虑药物与三种属性的对应关系,所以同样采用谷本系数进行相似度的计算,如式(4):sim(d a ,d b )=D abD a +D b -|D ab |(4)其中,sim(d a ,d b )表示药物a 和药物b 的相似度,(a )在使用药物-化学结构数据源的计算过程中,D a 表示药物a 包含的化学结构数量,D b 表示药物b 包含的化学结构数量,D ab 表示药物a 和药物b 包含的相同化学结构数量;(b )在使用药物-靶蛋白数据源的计算过程中,D a 表示药物a 对应的靶蛋白数,D b 表示药物b 对应的靶蛋白数,D ab 表示药物a 和药物b 对应的相同靶蛋白数;(c )在使用药物-副作用数据源的计算过程中,D a 表示药物a 会产生的副作用数,D b 表示药物b 会产生的副作用数,D ab 表示药物a 和药物b 产生的相同副作用数㊂同样,sim(d a ,d b )的值也应该在区间[0,1]之间㊂sim d 表示由三种相似度融合得到的最终药物相似度,sim s 表示由药物-化学结构算出的相似度,sim p 表示由药物-靶蛋白算出的相似度,sim f 表示由药物-副作用算出的相似度㊂使用式(5)进行计算:sim d =αsim s +βsim p +γsim f(5)其中,α+β+γ=1㊂相似度融合的权值计算采用试探法,以0.1为步长进行试探,通过多次实验确定一组能使效果最优的权值㊂试探法的优点是使用简单且较为准确,缺点是运行效率较低,但在设置合适的步长时可以在一定的时间范围内得到预期的结果㊂通过试探法得出当α=0.2,β=0.4,γ=0.4时,效果达到最优㊂2.2 预测值计算通过两种相似度计算方法得到疾病相似度和药物相似度后,为了融合两类相似度计算出的预测结果,提出预测值融合的方法,如式(6):P aq =ω1P i aq +ω2P d aq(6)其中,P aq 为融合后药物a 与疾病q 对应关系的预测值,P i aq 为通过疾病相似度算出的药物a 与疾病q 的对应关系预测值,P d aq 为由药物相似度算出的药物a 与疾病q 的对应关系预测值,ω1和ω2分别表示两种类型预㊃071㊃ 计算机技术与发展 第31卷测值的权重,且需要满足:ω1+ω2=1㊂为了计算P i aq ,需要通过疾病相似度选取k 个最相似的邻居㊂在选取好k 个邻居后,通过式(7)进行P i aq 的计算:P i aq=∑y ∈Tsim(I q ,I y)×s a ,y∑y ∈Tsim(I q ,I y)(7)其中,sim(I q ,I y )表示疾病q 和疾病y 的相似度,T 为疾病q 的邻居集合,s a ,y 表示药物a 与疾病y 的对应关系值㊂以上计算公式是基于项目的,所以只能通过疾病相似度计算预测值,通过药物相似度计算预测值P d aq 则需要使用式(8):P d aq =s _a +∑b ∈Tsim(D a ,D b )×(s b ,q -s _b )∑b ∈Tsim(D a ,D b )(8)其中,sim(D a ,D b )表示药物a 和药物b 的相似度,T 为药物a 的邻居集合,s _a 和s _b 表示基于药物-疾病数据源计算出的药物a 和药物b 与所有疾病对应关系值的平均数,s b ,q 表示药物b 与疾病q 的对应关系值㊂由于两种预测值也要进行融合,为了保持数据的一致性,两类算法中选取的邻居数应该为相同值㊂根据多次实验结果,设置ω1=0.6,ω2=0.4㊂2.3 算法流程Step 1:将四种数据源转换成对应的矩阵,药物-疾病矩阵通过式(3)计算疾病相似度,其他三种数据源得出的矩阵通过式(4)计算出相似度㊂Step 2:由Step 1算出四种相似度,将通过式(4)算出的相似度用式(5)融合成药物相似度,通过式(3)得出的相似度作为疾病相似度㊂Step 3:得出的疾病相似度通过式(7)计算出药物与疾病对应关系的预测值,药物相似度则通过式(8)计算出预测值㊂Step 4:用式(6)将两类预测值融合得到最终的药物与疾病对应关系预测值㊂3 实验结果及分析3.1 数据集为了验证算法的有效性,该文采用的数据集是文献[9]中的数据,该数据集是通过UMLS ㊁PubChem ㊁UniPort Knowledgebase 和SIDER 中的数据进行人工处理和清洗获得的,其中包括药物-疾病数据㊁药物-化学结构数据㊁药物-靶蛋白数据和药物-副作用数据㊂四种数据均采用二进制表示对应的关系:0表示无相关对应关系,1表示有对应关系㊂数据集包括536种药物,以及对应的578种疾病㊁881种药物化学结构㊁1385种副作用和775种对应靶蛋白㊂其对应的数据稀疏程度分别为:0.9920,0.8592,0.9455,0.9954㊂稀疏程度主要用于观察数据集中无作用的数据占总数据的比例,从得出的数据可以看出四种数据源的稀疏程度都比较高,无作用数据占总数据的比例较大㊂图2 药物-疾病对应数量关系从药物-疾病数据源中可以算出每一种药物对应可以治疗的疾病数,如图2所示,可以看出大约只有50种(10%)药物可以治疗10种以上疾病,大部分药物(75%)只能治疗5种以下的疾病㊂3.2 实验结果文中将药物重定位算法当作一个二分类问题来看待,对于每种药物,如果疾病可以治疗则为1,反之则为0,为了保证实验的准确性和健壮性,使用十折交叉验证法进行实验㊂该文采用准确率㊁召回率㊁F -score 和ROC 曲线来进行算法效果好坏的判断㊂为了给出这四种分类指标的准确定义,首先定义一个二分类问题的混淆矩阵,如表1所示㊂表1 混淆矩阵预测值真实值TP (真正例)FN (假反例)FP (假正例)TN (真反例) 通过混淆矩阵可以对精确率㊁召回率㊁F -score 进行定义,如下:P =TPTP +FP(9)R =TP TP +FN(10)F =2×P ×R P +R(11)为了确定计算中最相似的邻居数k 使预测值最精确,提供了每种数据源在不同邻居数情况下的精确率表现,如图3所示㊂通过观察每种数据源各自的精确率变化,确定一个使算法效果最好的k 值㊂通过观察可以看出当k =25时,各数据源保持在精确率比较高的稳定状态,虽然在k >25时,药物-化学结构和药物-疾病数据源的精确率会有小幅度的提升,但是药物-㊃171㊃ 第1期 陈 鹏等:基于多相似度融合的药物重定位推荐算法靶蛋白和药物-副作用数据源的精确率会有大幅的下降,所以该文将邻居数选取为25㊂图3 各数据源在不同邻居数下的精确率在确定邻居数k 后,通过图4㊁图5对比MSF 算法和其他算法的效果㊂在观察图4(ROC 曲线)时发现,所有数据源的AUC 值都很高,这是由于药物重定位是一个高度不平衡问题,所有的数据源都是稀疏的,即使假正例的数量变化很大,也会因为真反例的基数大,而假正率只发生极小的变化[9]㊂所以在ROC 曲线和AUC 值对于区分算法效果表现较差的情况下,采用了P -R 曲线(见图5)和精确率㊁召回率㊁F -score (见表2)来进一步证明MSF 算法优于传统药物重定位算法㊂图4 基于单个数据源的传统药物重定位算法和MSF 算法的ROC曲线比较图5 单个数据源的传统药物重定位算法和MSF 算法的P -R 图比较表2 单个数据源与MSF 算法指标对比Datasets Precision Recall F -score 药物-疾病0.89100.92280.8910药物-化学结构0.65480.17360.2744药物-靶蛋白0.71760.72630.7219药物-副作用0.68290.29560.4126MSF (融合后)0.91230.89630.9042 通过P -R 曲线可以看出,MSF 算法的P -R 曲线包裹了所有单个数据源的P -R 曲线㊂通过表2可以看出,只有通过药物-疾病数据源得出的召回率比MSF 算法略高,但是在精确率和F -score 方面MSF 算法都表现得更好,据此可以得出MSF 优于基于单个数据源的药物重定位推荐算法㊂表3展示了MSF 算法与其他两种算法(SLAMS算法[9]和DRCFFS 算法[14])的比较㊂可以看出与SLAMS 算法和DRCFFS 相比,MSF 算法在三种指标上都有较大的提升㊂表3 算法效果比较算法Precision Recall F -score SLAMS 0.34520.65050.4510DRCFFS 0.87000.75610.8085MSF0.91230.89630.9042 通过上述几种不同指标的对比表明,MSF 算法在P -R 曲线以及各项指标上都有良好的表现,可以得到更精确的药物重定位预测结果㊂4摇案例分析药物重定位算法的目的是预测旧药物的新用途,为了证明提出的算法是有实效的和现实意义的,表4给出了利用MSF 算法预测的一些药物-疾病组合,其中头孢西丁临床证明可以治疗由敏感菌导致的呼吸道感染等疾病,这与可以治疗支气管炎的预测相符合㊂厄他培南对肺炎的治疗作用在文献[27]中已经得到证实㊂文献[28]中进行了头孢克洛治疗鼻窦炎的临床实验,治愈率达到15.5%㊂文献[29]中给出了利用美罗培南治疗皮肤软组织感染的实例㊂表5给出了甲状腺肿大治疗预测值前五的药物,其中甲硫咪唑和丙硫氧嘧啶已经得到临床验证[30],剩下三种药物尚未得到临床证明,但在文献[31]中双硫仑被证明对甲状腺治疗有一定作用㊂综上所述,MSF 算法可以预测出一些已经得到临床认证的药物-疾病组合,并且也能发现一些尚未证明有临床意义的药物-疾病组合,但是药物的治疗效果与疾病相关症状对应㊂通过一系列的案例证明,MSF 算法具有可行性,对于临床药物重定位具有一定㊃271㊃ 计算机技术与发展 第31卷的辅助作用㊂表4 预测药物-疾病治疗药物名称预测治疗疾病实际效果头孢西丁支气管炎半合成的广谱头孢抗生素,用于静脉注射,主要治疗呼吸道感染等疾病头孢克洛鼻窦炎主要用于治疗对该药品敏感菌产生的急性咽炎㊁急性扁桃体炎厄他培南肺炎,变形杆菌属感染临床上主要用于治疗复杂性腹腔感染㊁复杂性皮肤软组织感染等疾病洛美沙星嗜血杆菌感染是一种氟喹诺酮类抗生素,用于治疗细菌感染,包括支气管炎和尿路感染美罗培南软组织感染用于治疗多种不同的感染,包括脑膜炎以及肺炎表5 甲状腺肿大治疗预测值前五的药物药物名称实际效果甲硫咪唑用于治疗甲状腺功能亢进症状,甲状腺危象等硫酸羟脲临床效果用于恶性黑色素瘤㊁胃癌㊁恶性淋巴瘤等乙胺丁醇影响结核杆菌菌体核糖核酸的合成而具有杀抑作用双硫仑是一种戒酒的药物,服用后即使饮用少量酒精也会产生不适丙硫氧嘧啶药效主要通过抑制甲状腺内过氧化物酶系统,阻止甲状腺内酪氨酸的碘化及碘化酪氨酸的缩合,从而抑制甲状腺激素的合成5摇结束语提出了一种基于多相似度融合的药物重定位推荐算法(MSF算法),实验结果显示MSF算法与SLAMS 算法和DRCFFS相比,在三种指标(精确率㊁召回率和F-score)上的表现更好㊂综上所述,提出的MSF算法优于传统的药物重定位算法,可以预测有治疗效果的药物-疾病组合,为更好地发挥药物治疗效果㊁提升药物利用价值起到一定的作用㊂但是,MSF算法也有一定的缺陷,比如:通过试探法计算相似度融合的权值耗时较长,计算疾病相似度所采用的数据源较少㊂在后续的研究过程中应当对相似度融合的方法进行改进并且在疾病相似度的计算上使用多种数据源㊂参考文献:[1] 徐 燕,郭 颖.药物重定位的研究策略[J].中国新药杂志,2017,26(11):1253-1258.[2] 王可鉴,石乐明,贺 林,等.中国药物研发的新机遇:基于医药大数据的系统性药物重定位[J].科学通报,2014,59(18):1790-1796.[3] 汪 浩,王海平,吴信东,等.药物-疾病关系预测:一种推荐系统模型[J].中国药理学通报,2015,31(12):1770-1774.[4] 张永祥,程肖蕊,周文霞.药物重定位 网络药理学的重要应用领域[J].中国药理学与毒理学杂志,2012,26(6): 779-786.[5] 谢达菲,李 鹏,李 非,等.药物重定位的计算分析方法[J].生物化学与生物物理进展,2012,39(11):1029-1036.[6] 马 浚.基于深度学习的药物重定位方法研究[D].兰州:兰州大学,2019.[7] LUO H,WANG J,LI M,et al.Drug repositioning based oncomprehensive similarity measures and Bi-random walk al⁃gorithm[J].Bioinformatics,2016,32(17):2664-2671. [8] LUO H,LI M,WANG S,et putational drug reposi⁃tioning using low-rank matrix approximation and randomized algorithms[J].Bioinformatics,2018,34(11):1904-1912.[9] ZHANG P,AGARWAL P,OBRADOVIC putationaldrug repositioning by ranking and integrating multiple data sources[C]//Joint European conference on machine learning and knowledge discovery in databases.Prague,Czech Repub⁃lic:Springer,2013:579-594.[10]朱 桥.基于多元信息融合的药物重定位算法研究[D].长沙:湖南大学,2018.[11]LI J,LU Z.A new method for computational drug reposition⁃ing using drug pairwise similarity[C]//IEEE international conference on bioinformatics&biomedicine.Philadelphia, PA,USA:IEEE,2012:1-4.[12]章 啸.协同过滤算法在药物重定位中的研究与应用[D].上海:东华大学,2017.[13]林耀进,张 佳,林梦雷,等.基于协同过滤的药物重定位算法[J].南京大学学报:自然科学版,2015,51(4):834-841.[14]ZHANG J,LI C,LIN Y,et putational drug reposi⁃tioning using collaborative filtering via multi-source fusion [J].Expert Systems with Applications,2017,84:281-289.[15]刘 杰,金柳颀,景 波.基于药物和疾病特征关联的药物重定位混合推荐算法[J].计算机应用研究,2020,37(3): 672-675.[16]CHIANG A P,BUTTE A J.Systematic evaluation of drug–disease relationships to identify leads for novel drug uses [J].Clinical Pharmacology&Therapeutics,2009,86(5): 507-510.[17]DUDLEY J T,DESHPANDE T,BUTTE A J.Exploiting㊃371㊃ 第1期 陈 鹏等:基于多相似度融合的药物重定位推荐算法drug -disease relationships for computational drug reposition⁃ing [J ].Briefings in Bioinformatics ,2011,12(4):303-311.[18]LI J ,ZHU X ,CHEN J Y ,et al.Building disease -specificdrug -protein connectivity maps from molecular interactionnetworks and pubmed abstracts [J ].PLoS Computational Bi⁃ology ,2009,5(7):e 1000450.[19]CAMPILLOS M ,KUHN M ,GAVIN A C ,et al.Drug targetidentification using side -effect similarity [J ].Science ,2008,321(5886):263-266.[20]徐 蕾,杨 成,姜春晓,等.协同过滤推荐系统中的用户博弈[J ].计算机学报,2016,39(6):1176-1189.[21]杨佳莉,李直旭,许佳捷,等.一种自适应的混合协同过滤推荐算法[J ].计算机工程,2019,45(7):222-228.[22]冷亚军,陆 青,梁昌勇.协同过滤推荐技术综述[J ].模式识别与人工智能,2014,27(8):720-734.[23]OLIVIER B.The unified medical language system (UM⁃LS ):integrating biomedical terminology [J ].Nucleic Acids Research ,2004,32(Database issue ):D 267-D 270.[24]WANG Y ,XIAO J ,SUZEK T O ,et al.PubChem :a publicinformation system for analyzing bioactivities of small mole⁃cules [J ].Nucleic Acids Research ,2009,37(Web Server is⁃sue ):W 623-W 633.[25]ROLF A ,AMOS B ,WU C H ,et al.UniProt :the universalprotein knowledgebase [J ].Nucleic Acids Research ,2004,32(Database Issue ):D 115-D 119.[26]KUHN M ,CAMPILLOS M ,LETUNIC I ,et al.A side effectresource to capture phenotypic effects of drugs [J ].Molecu⁃lar Systems Biology ,2010,6(1):343.[27]BADER J C ,LAKOTA E A ,DALE G E ,et al.Pharmacoki⁃netic -pharmacodynamic evaluation of ertapenem for patients with hospital -acquired or ventilator -associated bacterial pneumonia [J ].Antimicrobial Agents and Chemotherapy ,2019,63(6):318-319.[28]头孢克洛缓释片多中心研究小组.头孢克洛缓释片治疗成人急性鼻窦炎临床研究[J ].中国耳鼻咽喉头颈外科,2004,11(4):233-236.[29]HIRAKI Y ,YOSHIDA M ,MASUDA Y ,et al.Successfultreatment of skin and soft tissue infection due to carbapenem -resistant Acinetobacter baumannii by ampicillin –sulbactam and meropenem combination therapy [J ].International Jour⁃nal of Infectious Diseases ,2013,17(12):e 1234-e 1236.[30]杨海辰.甲硫咪唑联合丙基硫氧嘧啶治疗甲状腺功能亢进症临床疗效研究[J ].临床合理用药杂志,2014,7(35):92.[31]RAMIREZ G ,ABLES M F ,BUTCHER D E ,et al.Evalua⁃tion of the hypothalamic -hypophysial ,thyroid ,and gonadal axes before and after disulfiram administration in patients with chronic alcoholism [J ].Southern Medical Journal ,1988,81(11):1407-1411.(上接第76页)[6] BASSIL Y ,ALWANI M.OCR post -processing error correc⁃tion algorithm using Google online spelling suggestion [J ].Journal of Emerging Trends in Computing &Information Sci⁃ences ,2012,3(1):90-99.[7] GUPTA M R ,JACOBSON N P ,GARCIA E K.OCR binari⁃zation and image pre -processing for searching historical doc⁃uments [J ].Pattern Recognition ,2007,40(2):389-397.[8] 柴晨阳.印刷体汉字识别处理技术综述[J ].计算机光盘软件与应用,2014(24):141-142.[9] 弓耀辉.图像文字识别中的预处理技术研究综述[J ].信息通信,2017(9):291-292.[10]杨丽娟,李 利.基于双线性插值的内容感知图像缩放算法仿真[J ].计算机仿真,2019,36(12):244-248.[11]LI Jiang ,WAN Heyang ,SHANG parison ofinterpolation methods for mapping layered soil particle -size fractions and texture in an arid oasis [J ].CATENA ,2019,190:104514.[12]闫三虎,胡卫东,罗小平.改进二值化算法在QR 码识别中的应用[J ].计算机系统应用,2011,20(6):165-168.[13]YAGI K ,SUGIURA Y ,HASEGAWA K ,et al.Gait measure⁃ment at home using a single RGB camera [J ].Gait &Pos⁃ture ,2019,76:136-140.[14]陈海峰,丁丽丽.二值化图像的灰度处理算法研究[J ].电脑与电信,2019(7):34-38.[15]白元明,孔令成,张志华,等.基于改进OTSU 算法的快速作物图像分割[J ].江苏农业科学,2019,47(24):231-236.㊃471㊃ 计算机技术与发展 第31卷。
基于深度学习的药物重定位方法研究
基于深度学习的药物重定位方法研究基于深度学习的药物重定位方法研究随着生物技术和计算机科学的快速发展,药物研究领域也在不断创新和进步。
药物重定位是一种快速和高效的药物开发策略,它利用已有药物库中的药物来发现新的治疗用途。
然而,由于药物的作用机制复杂多样,传统的药物重定位方法面临着许多挑战。
为了克服这些挑战,近年来,基于深度学习的药物重定位方法被提出并获得了广泛关注。
深度学习是一种人工智能领域的算法,它可以通过训练模型从大规模数据中学习到有效的表示和特征。
在药物重定位中,深度学习可以应用于药物的分子结构、细胞通路、药物-蛋白相互作用等多个层面,以发现药物的新用途和潜在目标。
下面将重点介绍基于深度学习的药物重定位方法在这些方面的研究进展。
首先,在药物的分子结构方面,深度学习可以通过学习药物分子的特征表示来预测其药理和生物活性。
传统的药物重定位方法通常依赖于化学特征描述符,如分子的物理化学性质和拓扑指纹等。
然而,这些特征通常较为简化,无法捕捉到药物的复杂特征。
深度学习通过自动学习分子的高级表示,可以更好地捕捉到药物之间的相似性和差异性,从而提高预测的准确性。
其次,在药物的细胞通路方面,深度学习可以通过学习药物对细胞通路的调节效应来预测其新的治疗用途。
细胞通路是细胞内多个分子之间的相互作用网络,药物通过调节细胞通路的活性来发挥治疗作用。
传统的药物重定位方法通常基于对细胞通路的手动定义特征,而深度学习可以通过学习基因表达数据和蛋白质相互作用网络等信息,自动发现和预测药物对细胞通路的调节效应。
最后,在药物-蛋白相互作用方面,深度学习可以通过学习药物与蛋白质相互作用的模式来预测药物的新的治疗目标。
药物通过与蛋白质相互作用来发挥作用,因此预测药物的目标蛋白质对于药物重定位非常重要。
传统的药物重定位方法通常基于化学和结构信息来预测药物的作用目标,但这些方法往往受限于特征的表达能力。
深度学习通过学习大规模药物-蛋白质相互作用数据集,可以发现更复杂的药物-蛋白质关系,并为药物重定位提供更准确的预测。
利用生物信息学方法挖掘新型药物靶点的研究
利用生物信息学方法挖掘新型药物靶点的研究近年来,生物信息学方法在药物研发领域发挥着越来越重要的作用。
利用生物信息学方法挖掘新型药物靶点,不仅加速了药物研发的进程,还提高了药物研发的准确性和成功率。
本文将介绍利用生物信息学方法挖掘新型药物靶点的研究进展。
一、生物信息学方法简介生物信息学是一门综合应用生物学、计算机科学和数学等多学科知识的学科。
在药物研发中,生物信息学方法是通过对大量生物学数据的挖掘和分析,识别出与疾病相关的目标分子,并通过计算模拟等手段,筛选出潜在的药物靶点。
生物信息学方法主要包括基因组学、蛋白质组学、代谢组学和网络生物学等。
这些方法通过构建生物学网络,分析与疾病相关的基因、蛋白质和代谢物等信息,从而挖掘出潜在的药物靶点。
二、生物信息学方法在新药靶点发现中的应用1.基因组学方法基因组学方法通过大规模测序技术获取大量的基因组数据,并通过比对、组装和注释等分析技术,识别出与疾病相关的基因。
利用生物信息学方法,可以从众多基因中筛选出潜在的药物靶点,并进一步研究其功能和调控机制。
2.蛋白质组学方法蛋白质组学方法通过质谱和高通量蛋白质分析技术,获取大量的蛋白质数据,并利用生物信息学方法进行蛋白质结构预测、功能注释和蛋白质互作网络分析等研究。
这些方法可以识别出与疾病相关的蛋白质,并为新药靶点的发现提供重要的依据。
3.代谢组学方法代谢组学方法通过质谱和核磁共振等技术,分析生物体内代谢物的组成和变化规律,获得大量的代谢物数据,并利用生物信息学方法进行代谢物的鉴定和功能注释等研究。
这些方法可以挖掘出与疾病相关的代谢物,为新药靶点的发现提供重要线索。
4.网络生物学方法网络生物学方法通过构建生物学网络,分析基因、蛋白质和代谢物等分子之间的相互作用关系,挖掘出与疾病相关的生物学模块和关键靶点等信息。
利用生物信息学方法,可以从复杂的分子网络中发现新型药物靶点,并加速其研发过程。
三、生物信息学方法挖掘新型药物靶点的实例1.基于基因组学方法的药物靶点发现研究人员利用基因组学方法分析了多种与癌症相关的基因,在其中发现了一些新型的药物靶点。
药物重定位大致原理流程
药物重定位大致原理流程下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by the editor. I hope that after you download them, they can help yousolve practical problems. The document can be customized and modified after downloading, please adjust and use it according to actual needs, thank you!In addition, our shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts,other materials and so on, want to know different data formats and writing methods, please pay attention!药物重定位是一种新兴的药物研究领域,其原理流程主要包括以下几个步骤:一、寻找新的活性靶标在药物重定位的研究中,科学家首先需要寻找新的活性靶标。
研究生物信息学在药物研究中的应用
研究生物信息学在药物研究中的应用第一章介绍生物信息学是一个跨学科的领域,将生物学、计算机科学和统计学等多个学科融合在一起,旨在通过分析和解释生物信息数据来揭示生命科学中的基本机制。
随着生物学和计算机科学的快速发展,生物信息学在许多领域都发挥着重要的作用。
本文将重点讨论生物信息学在药物研究中的应用。
第二章生物信息学在药物靶点发现中的应用药物研究的首要任务是找到与特定疾病相关的药物靶点。
生物信息学在这一过程中起着至关重要的作用。
通过建立蛋白质与基因的互作网络,可以通过分析蛋白质的拓扑特征来预测潜在的药物靶点。
同时,通过基因组学、转录组学和蛋白质组学等高通量技术的发展,大量的生物信息数据可用于筛选潜在的药物靶点。
此外,通过比较疾病组织和正常组织的基因表达谱,可以鉴定与疾病相关的差异表达基因,进一步筛选药物靶点。
第三章生物信息学在药物设计中的应用药物设计是药物研究的一个重要环节,旨在通过计算和模拟方法设计出具有理想效果的药物分子。
生物信息学为药物设计提供了强有力的工具。
通过计算机模拟和分子对接等技术,可以预测药物分子与靶点之间的相互作用,并选择具有高亲和力的药物分子进行后续研究。
此外,通过分析已知药物的结构和活性,可以构建药物结构数据库,并运用机器学习算法进行药物分子的特征提取和预测,加速药物设计的过程。
第四章生物信息学在药物代谢与药效评价中的应用药物的代谢和药效评价是药物研究的重要环节,也是药物开发的瓶颈。
生物信息学通过分析代谢酶的结构和功能,可以预测药物的代谢途径和代谢速率,帮助筛选不易代谢的药物分子。
同时,通过结合转录组和代谢组学的数据,可以揭示药物与靶点之间的关联,并预测药物的药效与安全性。
此外,生物信息学还可以通过比较不同个体之间的基因表达谱和遗传变异,为个性化医疗提供理论依据。
第五章生物信息学在药物重定位中的应用药物重定位是利用已有药物的作用机制和已知药物-靶点信息,发现这些药物在其他疾病治疗中的潜在效果。
生物信息学技术在药物研发中的使用技巧
生物信息学技术在药物研发中的使用技巧随着科学技术的快速发展,生物信息学技术在药物研发中的应用越来越广泛。
生物信息学是一门将生物学与信息学相结合的学科,通过计算机技术对生物学数据进行分析、处理和解释,为药物研发提供了重要的工具和方法。
本文将重点介绍生物信息学技术在药物研发中的使用技巧。
首先,生物信息学技术在药物靶点的发现和验证中发挥着重要作用。
在药物研发中,首要的任务是找到合适的靶点,这是药物设计和优化的基础。
生物信息学技术可以利用大规模的基因组、蛋白质和代谢组数据,通过系统生物学的方法,检测和筛选可能的靶点。
例如,基于基因表达谱数据的差异分析可以揭示可能的疾病标志物和潜在的靶点,并通过生物网络分析等方法来验证和验证这些靶点的作用。
此外,生物信息学技术还可以利用结构生物学方法,通过模拟和分析药物与靶点之间的相互作用,预测潜在的结合位点和亲和力,为药物的设计和优化提供指导。
其次,生物信息学技术在药物分子的筛选和优化中起到了关键作用。
通过基因组学、蛋白质组学和代谢组学技术,可以大规模地获得药物分子与生物体系之间的相互作用数据。
生物信息学技术可以将这些数据与大量的化合物数据库进行比对,筛选出与靶点相互作用的潜在药物候选分子。
例如,利用分子对接技术,可以模拟药物和蛋白质之间的相互作用,并通过评分函数对药物分子进行评估和排序。
此外,生物信息学技术还可以应用机器学习算法,利用已知药物和靶点的结构和活性数据建立模型,用于预测和优化药物分子的活性和性质。
另外,在药物剂量和疗效预测方面,生物信息学技术也发挥着重要作用。
药物的剂量和疗效评估是药物研发过程中的重要环节。
生物信息学技术可以通过整合临床试验和基因组学数据,建立药物-基因组学模型,预测患者的药物反应和剂量个体化。
例如,利用基因芯片技术可以分析患者的基因表达谱,筛选出与药物反应相关的基因,并通过机器学习算法建立模型来预测药物的疗效和剂量。
此外,生物信息学技术还可以利用微生物组学分析,研究特定菌群对药物代谢和疗效的影响,为个体化药物治疗提供指导。
生物信息学在药物研发中的使用教程
生物信息学在药物研发中的使用教程生物信息学是一门将计算机科学与生物学相结合的学科,它的应用范围非常广泛,其中之一就是在药物研发中的应用。
通过运用生物信息学技术,研究人员可以更好地理解药物与生物体之间的相互作用,加速药物研发的过程。
本文将介绍生物信息学在药物研发中的使用教程。
在药物研发过程中,生物信息学技术主要应用在以下几个方面。
首先是药物靶点的鉴定。
药物靶点是指药物作用于生物体内的特定蛋白质或分子。
通过生物信息学技术,研究人员可以利用数据库中的基因组、蛋白质及代谢物信息,鉴定潜在的药物靶点。
例如,可以通过数据库中蛋白质结构与功能的信息,找到与某种疾病相关的靶点,并进一步研究其与药物之间的相互作用。
其次是药物分子的筛选和设计。
生物信息学技术可以进行高通量虚拟筛选,从大量分子库中识别出候选的药物分子。
研究人员可以利用生物信息学工具,比如分子对接和药物相互作用预测模型,预测分子与靶点之间的相互作用力和亲和性,从而评估药物的活性和选择性。
此外,生物信息学还可以进行分子的参数优化和修饰,提高药物分子的药理性能。
第三是药物剂量和给药策略的优化。
生物信息学可以通过个体基因组分析和生物药理模拟等技术,为药物的剂量和给药策略提供指导。
个体基因组分析可以帮助研究人员了解个体对药物的代谢和反应的差异,从而制定个性化的用药方案。
生物药理模拟可以用来研究药物在人体内的吸收、分布、代谢和排泄等过程,优化药物的给药途径和剂型。
最后是药物副作用的预测和评估。
药物研发过程中,副作用是一个重要的考虑因素。
通过生物信息学技术,研究人员可以利用大规模的基因组、蛋白质和代谢物数据,预测药物引起的潜在副作用。
根据预测结果,可以调整药物分子的结构和活性,或者改变给药策略,降低药物的副作用,提高药物的安全性。
总之,生物信息学在药物研发中发挥着重要的作用。
通过生物信息学技术,研究人员可以更好地理解药物与生物体之间的相互作用,加速药物研发的过程。
BCTD:一个药物重定位研究用药物靶点数据库
BCTD:一个药物重定位研究用药物靶点数据库王克强;吴宏宇;李国栋;黄青山【期刊名称】《计算生物学》【年(卷),期】2015(005)003【摘要】新药研发具有周期长、成本高、风险大等特点,往往是漫长而艰难的。
药物重定位,即发现原有药物的新适应症,可有效缩短周期、降低成本、规避风险,正在成为药物研发的重要策略。
近些年药物重定位发展迅速,其中联合药物靶点相互作用信息和组学数据进行药物重定位是一种可行的方法。
但是现有的众多药物靶点数据库中的部分药物靶点信息缺乏实验证明,而且大多存在或遗漏或冗余的现象,各库中信息亦采用不同命名规则,难以直接用作药物重定位研究。
因此我们综合整理多个数据库内容和大量文献,排除缺乏实验证明的信息,并标准化所得信息,建立了一个全新的在线药物靶点数据库。
该数据库现含有766个化合物、746个靶点和2862条药物/化合物和靶点相互作用的信息。
该库的建立大大简化了研究人员查询与寻找药物靶点信息的流程,能够为药物重定位提供方向和线索。
【总页数】7页(P41-47)【作者】王克强;吴宏宇;李国栋;黄青山【作者单位】[1]复旦大学生命科学学院遗传学研究所遗传工程国家重点实验室,上海;;[2]复旦大学生命科学学院遗传学研究所遗传工程国家重点实验室,上海;;[3]上海高科联合生物技术研发有限公司,上海;;[2]复旦大学生命科学学院遗传学研究所遗传工程国家重点实验室,上海【正文语种】中文【中图分类】R9【相关文献】1.在蒙古裸腹溞培养中用药物杀灭褶皱臂尾轮虫的研究Ⅱ.5种常用药物对蒙古裸腹溞的慢性毒性 [J], 赵玉明;何志辉2.磷酸二酯酶7:一个新的抗炎免疫药物靶点研究进展 [J], 张莉;杜冠华3.《实用药物与临床》杂志被国内外数据库收录情况 [J],4.《实用药物与临床》杂志被国内外数据库收录情况 [J],5.《实用药物与临床》杂志被国内外数据库收录情况 [J],因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
College of Bioinformatics
Science and Technology
Pharmacogenomics Harbin Medical University
Jiankai Xu
药物适应症的未知空间
2
Pharmacogenomics Harbin Medical University
Jiankai Xu
主要内容
⏹概念
⏹
主流计算方法 配体相似性 副作用相似性 药物表达谱 CPI谱 通路谱⏹小结⏹
思考题
Pharmacogenomics Harbin Medical University
Jiankai Xu
药物重定位
⏹
药物重定位(drug repositioning)被广泛认为是一种解决新药开发高投入低产出困境的有效方法之一.
⏹
它基于已有药物开发新的治疗功能,充分利用“旧
”药已经有较为完备的药代动力学和毒理学信息,快速对新功能进行Ⅱ期临床实验测试,从而缩短开发周期、降低风险。
Pharmacogenomics Harbin Medical University Jiankai Xu
配体相似性Pharmacogenomics Harbin Medical University
Jiankai Xu
副反应相似性
Pharmacogenomics
Harbin Medical University Jiankai Xu
药物表达谱Pharmacogenomics Harbin Medical University
Jiankai Xu
CPI谱
Pharmacogenomics
Harbin Medical University Jiankai Xu
通路谱
⏹
基本假设
蛋白往往通过与其他体内组分形成蛋白复合物或 pathway 而行使其功能。
疾病往往涉及人体系统内多个生物过程的异常。
药靶与疾病相关蛋白处于同一pathway 上,通过影响与疾病相关的pathway 来达到调节该疾病状态的目的。
药物的靶点(主要治疗靶以外的靶点
)信息的积累以及疾病相关蛋白数据的丰富, 使得从 pathway 层面上直接研究药物与疾病的关系成为可能。
Pharmacogenomics Harbin Medical University
Jiankai Xu
通路谱
⏹
数据资源
通路数据库
KEGG
...
疾病-蛋白数据
MeSH 与MEDLINE
CTD
Pharmacogenomics Harbin Medical University Jiankai Xu
通路谱
⏹
Pathway 谱的构建
分别构建疾病、药物的 pathway 谱.
具体操作是以选取的 185 个特征 pathway 为背景, 根据超几何分布方法计算疾病的相关蛋白/药物靶点富集程度, 得到疾病/药物所对应的 pathway
谱.
Pharmacogenomics Harbin Medical University
Jiankai Xu
通路谱
⏹
药物-疾病 pathway 谱的关联性
pathway 需满足2个条件:
✓ 至少含有2个疾病相关蛋白/药物靶点;
✓ 富集的 p 值不大于 0.01.
Pharmacogenomics Harbin Medical University
Jiankai Xu
通路谱
⏹
构建药物的随机pathway 谱
疾病相关蛋白数量的差异可能会造成得分的绝对值的高低.
为了考查药物是否是因为特定的 pathway 谱而与疾病有高的关联性,
这里保持药物的 pathway 谱序列不变
,随机打乱 pathway 名称 100000
次得到药物的随机pathway
谱.
依照式(1)计算每个随机 pathway 谱与疾病的
S random,disease 值
.
Pharmacogenomics Harbin Medical University
Jiankai Xu
通路谱
⏹
衡量药物-疾病关联性的显著性
计算 Z 值衡量药物对该疾病的关联性是否具有显著性(Z> 2.33 认定为显著).
Pharmacogenomics Harbin Medical University Jiankai Xu
通路谱Pharmacogenomics Harbin Medical University
Jiankai Xu
通路谱
Pharmacogenomics Harbin Medical University Jiankai Xu
通路谱
Pharmacogenomics Harbin Medical University
Jiankai Xu
小结
⏹概念
⏹
主流计算方法 配体相似性 副作用相似性 药物表达谱 CPI谱 通路谱
Pharmacogenomics
Harbin Medical University
Jiankai Xu
思考题
⏹
示例通路谱法中,是否还有需要改进的地方?
⏹
示例通路谱法是否有适用范围的限制?
Pharmacogenomics Harbin Medical University
Jiankai Xu
谢 谢。