药物分析信息学及基于大数据技术的药物分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
药物分析信息学的最新应用
在中药掺伪鉴别中的应用 褶合差谱分析法 基于对原始光谱的褶合变换,提取3点窗口下的二次正交多项式系 数作为解析对象。通过对纯中药光谱以及化学药物光谱的考察,发现 两者在3点窗口下经褶合变换得到的二次项系数,存在至少一个甚至几 个数量级的差别,因此当掺伪中药光谱的二次项系数抽提至最小时, 对应的含量因子即代表真实掺杂量。 采用褶合差谱分析法对18个不同种类的中药样品进行了测定,获得 了理想的定量准确性。
药物分析信息解析与挖掘
色谱分析法(二维数据)
在每一个保留时间点上都对应着一条光谱, 而在每个检测波长处都得到一条色谱,这 样的数据又称“二维”数据或矩阵型数据。
兼具色谱良好的分离特性和光谱灵敏的定性功能,从色谱、光谱两个 角度提供与物质性质密切相关的大量信息
药物分析信息解析与挖掘
色谱分析法(二维数据)
药物分析信息学已成为现代药物分析学科的重要内
总 结
容,有助于解决生命科学等学科目前面临的复杂混合
物体系定性、定量分析的共同任务。开展药物分析信
息学研究必将有力地促进药物分析学科的发展。
留一法交叉验证和独立验 证结果均表明,该模型预 测准确率达到90%以上。
药物分析信息学的最新应用
在中药掺伪鉴别中的应用
基于待检中药与怀疑掺化学药物的一维红外光谱,不经提 取分离,无需建立模型的两种分析方法
局部直线筛选法
基于对原始光谱特征的认知,即原始光谱上任意连续3点组成的形 状可能为凸曲线、近直线和凹曲线,它们的直线回归系数的绝对值分 别为<o.99或0.99~1。化学药物的掺入显然会改变这些局部谱段 原有的形状。沿着这个思路,对局部直线谱段进行差减,从而预测其 中化学药物的掺杂量。由大量样品验证,该法的检测限可达到0.1%。 采用该法对15个不同种类的中药样品进行了分析,结果只漏判了 一个样品。
经典统计分析 回归和相关 多元统计分析 方差分析
响应面理论 析因试验 序贯优化方法 并行优化方法
计算分光光度法 分析检测理论 滤波、平滑与求导 因子分析法
聚类分析 线性学习机法 K-最近邻法 定量构效关系
人工神经网络 化学专家系统 数据库和谱图检索
目 录
药物分析信息解析与挖掘
光谱分析法(一维数据)
采用OSC滤噪后,PLS— DA能够完全区分不同性 别的血清氢谱,其判别能 力优于PCA和SIMCA。
药物分析信息学的最新应用
在代谢组学中的应用 沈朋:乳腺癌代谢物组模式特征发现方法及HPLC/MS/MS分析 提出一种基于单独最优特征
组合和BP神经网络的代谢 物组模式特征发现方法,并
用其寻找到尿样中与乳腺癌最 为相关的4种核苷,将这4种核 苷作为输入变量,用BP神经网 络建立了乳腺癌诊断模型。
用尺度同一化的方法进行数 据预处理来消除数据的尺度 差异
三种数据预处理方法的应 用,会明显改善代谢组学 生物信息学分析中聚类分 析的结果和生物标志物识 别的准确性及全面性
药物分析信息学的最新应用
在代谢组学中的应用 冒海蕾:正交信号校正在正常成人血清,H NMR谱的代谢组分析中的滤噪 作用评价 研究了正交信号校正(OSC)在78 例正常成人血清1 H—NMR谱的 代谢组分析中的滤噪作用,分 别采用主成分分析、偏最小二 乘法判别分析(PLS-DA)及簇类 的独立软模式法(SIMCA)对氢谱 进行模式识别分析
混 合 线 性 分 析 法 ( H L A ) : 该法结合了多种多元校正方法的优势,其结果优于PLS法。由 于其只需要已知待测组分的纯色谱峰及其在校正谱中的浓度,因此还被用于某些含未知干扰组 分的体系的分析。
药物分析信息解析与挖掘
光谱分析法(一维数据)
பைடு நூலகம்
数学修饰方法 ——数学探针法 数学探针法通过对复杂混合物体系的光谱进行
导致生活不能自理的 病人
01
03
肺癌患者
危重症病人
新型智能型分析仪器的研发
1.小波变换近红外光谱仪
:主要针对中老年患者
02
01 03
无人照料
老人
肺癌患者
危重症病人
慢性呼吸疾病
导致生活不能自理的 病人
新型智能型分析仪器的研发
1.小波变换近红外光谱仪
:主要针对中老年患者
02
03
无人照料
老人
肺癌患者
危重症病人
“原位”数学修饰,“创造”背景干扰的最大吸收点,从 而可以“创造”背景干扰被消除的条件。 具体原理为:在合适的波长位置,向待测混合体系的光谱 中添 加“数学探针”(如高斯函数等),可随意改变和调动 可能的背景干扰,从而使干扰在指定位置成峰,产生 极大值;然后通过求导消除干扰,并求出待测组分的 含量。本课题组曾采用数学探针法测定了安钠咖注 射液中苯甲酸钠和咖啡因的含量,通过考查数学探 针的峰高、峰位和半峰宽与结果的关系,确定数学探 针的参数值,并将由此探针产生的“新化合物”仿真 添加在待测液中,从而使待测组分的紫外光谱图出 现了“吸收峰”,即得到了“数学修饰”,然后在修饰得 到的“吸收峰”处求导就可将干扰组分的影响去除, 从而可对待测组分进行含量测定。数学探针法通过 “仿真”地向待测体系中添加“新化合物”(数学探
药物分析信息学
药物分析信息学
研究对象:药物复杂体系
方法:化学计量学和统计学,对分析仪器提供的
信息进行变换、解析、挖掘、分类
目的:对复杂体系定性定量分析
药物分析信息学
化 学 计 量 学 : chemometrics 产 生 : 1974年,由美国的B.R.Kowalski和瑞典的S.Wold等发
起,在美国华盛顿大学成立了国际化学计量学学会
药物分析信息学的最新应用
在代谢组学中的应用
NMR、LC-MS、GC-MS
获得的数据非常复杂 揭示出反映样品内 在机理的、整体性 差异的关键性生物 标记物
信 息 挖 掘
数据处理
降 维
目的
原 始 数 据 前 处 理
药物分析信息学的最新应用
在代谢组学中的应用 李晶:代谢组学研究中数据处理新方法的应用 用稳健主成分分析(PCA)进行 离群样品点的诊断 用变量的类内差异和类间差异 的比较,来判断非保守性代谢 组分
药物分析信息学
及
基于大数据技术的药物分析
大数据技术
大数据时代:
背景 随着计算、存储资源的容量、速度、智能化程度的迅速提高和价
格的大幅下降,以及物联网、移动互联网、云计算等技术的迅速发展
和大规模应用,数据量出现了爆发式增长。
特点
数据容量(Volume)大、数据产生速度(Velocity)快和数据 多样性(Variety)高 制药行业数据的不断积累和生命科学及健康领域数据的蓬勃发展!
背 景 : 数据处理与信息提取和计算机科学的发展
概 念 : 应用数学、统计学与计算机科学的方法,
来设计或选择最优的化学实验方法,并从测量数据
中最大限度地获取化学及相关信息。
药物分析信息学
化 学 计 量 学 : chemometrics 基本内容
统计学 与统计方法 试验设计 与优化 分析信号处理 化学模式识别 人工智能
大数据技术
大数据技术:
定义 一代全新的数据科学领域的技术架构或模式,对数据量大、类型
复杂、需要即时处理和提纯的各类数据,综合运用新的数据感知、采
集、存储、处理、分析和可视化等技术,提取数据价值,从数据中获 得对自然界和人类社会规律深刻全面的知识和洞察力。 大数据技术涉及到数据的感知、采集、存储、处理(管理)、分析、 可视化呈现等诸多环节,各环节采用的技术手段也层出不穷。
在每个检测波长(或波数)处可得到一个 响应值,这样的数据又称矢量型数据。
快速、简便、经济
药物分析信息解析与挖掘
光谱分析法(一维数据)
常用的数据处理方法
偏 最 小 二 乘 法 ( P L S ) : 已被用作近红外光谱仪的定量分析方法,应用于原料药分析 和复方制剂分析
缺点:PLS要求体系组成已知,而且各组分的信号应具有加和性,这些限制使得 PLS只适用于组分已知且含量与信号响应值符合线性的体系。
在每一个保留时间点上都对应着一条光谱, 而在每个检测波长处都得到一条色谱,这 样的数据又称“二维”数据或矩阵型数据。
兼具色谱良好的分离特性和光谱灵敏的定性功能,从色谱、光谱两个 角度提供与物质性质密切相关的大量信息
新型智能型分析仪器的研发
1.小波变换近红外光谱仪
:主要针对中老年患者
无人照料
老人
慢性呼吸疾病
慢性呼吸疾病
导致生活不能自理的 病人
药物分析信息学的最新应用
主要应用于复方制剂、中药成分分析、代谢组学、中药打假 在代谢组学中的应用
代谢组学:代谢组学是对某一生物或细胞,在一特定生理时期内所有低 分子量代谢产物,同时进行定性和定量分析的一门新学科。它是以组群 指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系 统整合为目标的系统生物学的一个分支。