中药色谱指纹图谱相似度评价系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中药色谱指纹图谱相似度评价系统国家药典委员会
翟为民
背景
国家食品药品监督管理局于2000年先后下达“关于加
强中药注册管理有关事宜的通知”(国药管注[2000]157
号)和关于印发《中药注射剂色谱指纹图谱研究的技术要号)和“关于印发《中药注射剂色谱指纹图谱研究的技术要
求》的通知”(国药管注[2000]348号)文件。

国家药典
委员会负责组织实施“已批准生产的中药注射剂质量标准的
提高完善及指纹图谱工作”及牵头组织“已批准多家生产的
中药注射剂,其指纹图谱联合起草工作”。

国家药典委员会从2000年12月起开始组织实施,进行
了可行性调研、规范性技术文件起草与研究、同布进行了科
技部立项。

从中药注射剂的指纹图谱研究质量标准提高逐步从中药注射剂的指纹图谱研究、质量标准提高,逐步成熟、扩展,到2010版药典,部分提取物和中成药标准中都收载了指纹图谱项目,为发挥着积极的作用。

1、论证
1论证
首先进行调研,多次召开研讨会,代表涉及科研院所、中央和省级药品检验所及企业科技人员。

形成共识:
央和省级药品检验所及企业科技人员形成共识:
①重点-色谱指纹图谱;
②理论上可行。

②理论上可行
③通过实践,检验可行性,不断完善。

2、修订《中药注射剂指纹图谱研究技术要求》(国药

管注[2000]348号)
①优化、方法验证,细化参数、明确要求。

②解决手工计算“共有峰”、“非共有峰”面积工作中大
量的人为因素,改变“只见树木不见森林”的局面,力求量的人为因素改变“只见树木不见森林”的局面力求反映整体质量特性。

二规范性技术文件起草与研究工作
二、规范性技术文件起草与研究工作
1、修订
修订稿就原料药材、半成品、成品的样品收集、制备、参照物的选择,指纹图谱试验条件,对实验室的要求,对仪器的要求,试验方法和试验条件的建立及验证,色谱条件的优选,指纹图谱的建立和验证、识别、计算和复核,标准书写格式指纹图谱的建立和验证识别计算和复核标准书写格式等进行了详尽的细化规定,起草稿经广泛征求意见,先后进行了多次修改得以完成。

以《中药注射剂色谱指纹图谱试验研究操作规程指南》(试行)的名义发布,作为局颁“技术要求”的补充。

2、计算机辅助中药指纹图谱相似度计算软件的研究开发
对于成药而言,如何控制批与批之间质量的稳定,这就要求需采用某种手段能定量地表征各样品间的相似程度(或差异性)而不是真伪鉴别,从整体性考虑,采用指纹图谱,在批间稳定等方面能够发挥积极作用。

也就需要建立一套能整体反应各样品指纹图谱之间相似程度的计也就需要建立套能整体反应各样品指纹图谱之间相似程度的计算方法,但原版“技术要求”采用共有峰和非共峰之比值的人工计算方法,该方法仅考虑了人为选定的几个特征峰的相似性,即将一个完整的事物割裂开进行比对,是不全面的,未能将中药内在成分的整体特性表达出来,因此,要创建一套能定量比对整体上反映中药内含成分指纹图谱相似程度的工具
上反映中药内含成分指纹图谱相似程度的工具。

•国家药典委员会组织沈阳药科大学、浙江国家药典委员会组织沈阳药科大学浙江大学、中南大学、清华大学、北京大学医学部医药科技开发中心、西北大学、中国学部药科技发中北大学中国药品生物制品检定所、第二军医大学八家单位,于2004年集中测试修改定型《计算机辅助中药指纹图谱相似度计算软件》。

•软件的开发过程与中药注射剂指纹图谱的科研工作直保持了同步。

这种同步的应科研工作一直保持了同步。

这种同步的应用也给软件的测试使用创造了条件。

•开发初期设计思路是将色谱数据导入MATLAB 开发初期设计思路是将色谱数据导入
的专业数据处理的软件中进行相似度的计算。

后考虑到知识产权保护的问题,采用自主编程,将指纹图谱数据导入,数据库管理,计算方法选择,谱图处理等功能综合考虑,设计开发而成。

计开发而成
软件基本算法与版本
一、算法选择简介
二、修订改版工作
三、2.0版的介绍
•一、首要问题是选择算法
•课题组同步进行了《指南》的制定与算法的评价与选择,通过大量计量化学方面的研讨与对比验证,选择了夹角余弦法。

研讨与对比验证选择了夹角余弦法
中药指纹图谱是表征中药复杂成分与其质量关系的重要手段中药指纹图谱是表征中药复杂成分与其质量关系的重要手段。

在表征过程中程中,,相似度评价起着关键作用相似度评价起着关键作用。

目前常用的相似度评价方法主要有峰重叠率评价方法比较与算法选择简介
法(Nei Nei系数法系数法)),相关系数法相关系数法,,距离系数法距离系数法,,向量夹角余弦法与峰重叠率和共有峰强度结合法有峰强度结合法((改进的改进的Nei Nei系数法系数法))。

指纹图谱波动对各种评价方法的影响:
.1.00 A B C 750.800.850.90095r i t y
D E
550.600.650.700.S i m i l a 0.00
0.05
0.10
0.15
0.20
0.45
0.500.F l u c t u a t i n g I n t e n s i t y
A.夹角余弦法
B.相关系数法
C.距离系数法
D. Nei 系数法
E.改进的Nei 系数法
由于药材的产地来源储藏条件和加工工艺的不同以及仪器设备的稳定性等原结果表明:A 方法受指纹图谱波动的影响最小
由于药材的产地、来源、储藏条件和加工工艺的不同,以及仪器设备的稳定性等原因使得指纹图谱产生一定的波动。

举例:向痛必定粉针制剂高效液相色谱指纹图谱中随机地加入一定强度的波动,以考查波动对相似度评价方法的影响。

结果如上图。

小峰的缺失的影响:
091.0A
B 0.70.80.9
C D E
i m i l a r i t y
040.50.6S 0.3
0.40~5%
0~3%The scope of lost peaks in fingerprint
0~1%
A.夹角余弦法
B.相关系数法
C.距离系数法
D. Nei 系数法
E.改进的Nei 系数法
在药材加工和提取过程中,药材中的某些成分往往会有一定的损失,导致结果表明:A 方法受小峰缺失的影响最小
在药材加工和提取过程中,药材中的某些成分往往会有定的损失,导致指纹图谱出现峰的缺失。

假设峰的缺失主要为峰面积较小的峰,以5%作为阈值,将缺失峰分成0~1%,0~3%和0~5%三组进行考察。

大峰的缺失的影响1.0 A
B C 大峰的缺失的影响:
0.80.9
a r i t y
D E
0.60.7S i m i l 0
12
3
0.4
0.5o f la r g e r p e a k s lo s t in f in g e r p r in t
N u m b e r o la p lo t in f A.夹角余弦法B.相关系数法C.距离系数法D. Nei 系数法E.改进的Nei 系数法
结果表明结果表明:
A 方法受大峰缺失的反映较“灵敏”在药材加工和提取过程中,指纹图谱中大峰的缺失并不常见。

而对于同属不
同种的药材,大峰的差异是有可能的。

考察了大峰缺失的影响举例。

数据标准化处理的影响:
数据标准化处理一般会影响各种方法的相似度评价结果。

若处理前后样本的相似度评价结果的大小(等级)顺序变化较小,说明标准化处理对样本的亲疏远近关系影响较小反之影响较大采用相关系数进行检验Influence of data autoscaling on different methods
较小,反之影响较大。

采用Spearman 相关系数进行检验。

g for evaluating similarity
距离系数
相关系数
夹角余弦
Spearman 系数 0.827 1 0.927
( = 0.01, 2-tailed, r s =0.735)
0.842 0.795 0.790
数据标准化对表中三种评价方法所得结果影响较小
关于对照模式的计算
x …•平均矢量(重心)= j (x 1j ,x 2j ,…,x nj )/m •中位数矢量=median((x 1j ,x 2j ,…,x nj ))
两种对照模式
•批样品中不存在离群(outlier)样本时,一般推
荐使用平均矢量(重心)作为对照模式矢量
•样品中存在离群样本时,推荐使用具有稳健(robust)性质的中位数矢量来作为共有模式矢量,
这种情况可能在计算原料药材样本时的共有模式
出现。

出现
•采用具有稳健性质的中位数矢量来作为对照模式,就不会因为原料药材样本中出现了一个离群样本就不会因为原料药材样本中出现了个离群样本
时而影响整个药材的对照模式。

值得指出的是如果不存在离群样本时两种方•值得指出的是,如果不存在离群样本时,两种方法所得结果应该基本一致。

一、2004年版软件与算法简介
•版本:
研究版(2004A)•研究版(2004 A)•检验版(2004 B)
研究版(2004 A )
检验版(2004 B )应用范围科学研究
指纹图谱的检验工作功能具有生成对照图谱功能
不具有生成对照图谱功能
研究版(2004A 2004B 18
结论
2004 A )的功能较多,且函盖了检验版(2004 B )具有的功能
•2004版以后,根据使用情况,验证并确认保持核算法不变
保持核心算法不变。

•根据使用中收集的反馈意见,补充必要的需求,按照软件编制规范,彻底梳理并重需求按照软件编制规范彻底梳理并重新编写了全部代码,在人机交互方面进一步完善,并且为了适应管理需要增加了相步完善并且为了适应管需要增加了相应的功能。

进行了不同范围的测试,形成了2.0版。

业已获得软件著作权证书。

2.0版介绍
20版介绍

运行环境
硬件
•1、硬件:
•最低配置:CPU主频533 MHz以上,内存64M,硬盘剩余最小空间100M,屏幕分辨率
硬盘剩余最小空间100M屏幕分辨率
800×600。

•2、软件环境:
2软件环境
•支持的操作系统:windows 98,windows 2000、windows 2003、windows XP。

windows7(32位)(64位)
•下载:
fp chp org cn •安装:
•操作流程
•生成对照图谱
•检验
主界面
•文件列表区:显示打开的图谱文件列表。

•文件详细信息区:显示选中文件信息。

•绘图区:绘制图谱,标注色谱峰。

•状态栏:显示工作状态、当前用户、登录时间等信息。

•快捷工具栏:常用按钮:•鼠标有提示
•工作状态切换
•注意提示:
•全谱导入(单、多个
多个):
*.cdf*.txt *.SCP *.XSCP
*SCP*XSCP
•可打开三种格式的报表:式的报表
*.rdf
*.qrp
.XQRP
*.XQRP
导出文件(图谱)
图谱
*.txt
*S *.Scp
导出图像*bmp *.bmp
*.wmf
参照图谱信息
删除选定的图谱
•(可多选)
•删除所有图谱•多一项确认,再•删除单个或多个图谱。

多项确认,再清除。

•也可以选定列表中的文件,直接按DEL键。

视图菜单
图谱间距
调整图谱间距
•放大图谱、缩小图谱、原始大小•快捷工具栏或者菜单中选择、鼠标
单谱显示
多谱显示
显示或隐藏色谱峰
菜单、右键,显示或隐藏。

3.3.6 隐藏坐标轴从菜单、右键,隐藏或显示。

随鼠标
显示峰
示峰
信息
菜单右菜单、右
键,当鼠标放在色
谱峰上时,
显示信息。

操作菜单
3.4.1 设置当
前图谱编号
打开就有一个默
认的编号,如S1、
S2等等,用户可
S2等等用户可
以自己编号:
设参照图谱
参照图谱的快捷工具栏、菜单中选择操作颜色会自动变更为设置中指定的颜
操作。

色。

3.4.3 数据剪切
数据恢复
3.4.5 清除Mark 峰
•多点校正
•先显示色
谱峰,点击进行操
作。


峰匹配
•1、Mark峰匹配:只对标记为Mark
峰的色谱峰进行
匹配,非Mark峰
不处理。

•2、全谱峰匹配:2全谱峰匹配
根据时间窗对所
有的色谱峰处理,
但优先处理mark
峰。

–先选择峰面积
占总峰面积多
少以上的峰参
加匹配
匹配结果,蓝色的虚线为色谱峰匹配线。

生成对

(R)
3.4.9 保存对照
*.XSCP *.SCP
相似度菜单
匹配数据
显示匹配的
色谱峰信息
和非共用峰
占比。

相关文档
最新文档