模式识别在中药质量评价中的应用进展
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模式识别在中药质量评价中的应用进展
模式识别在中药质量评价中的应用进展
摘要:对模式识别在中药质量评价中研究进展进行综述。
方法:总结有关化学模式识别、显微图像模式识别及人工神经网络在中药质量评价中应用的研究文献,综述不同方法在该领域中的应用。
结果:到目前为止,红外、紫外、裂解-高分辨气相色谱、GC-Mass总叠加质谱等被应用于中药的化学总特征的表现;基于体视学和计算机图像测试技术的图像定量分析,以及图形生成理论和计算机图形学的三维重建和显示技术被应用于中药组织的体视学参数的确定;误差反传等类型人工神经网络在中药质量评价中也有重要的应用。
结论:化学模式识别、显微图像模式识别、人工神经网络在中药质量评价中起到了重要的作用,具有广阔的发展前景。
关键词:化学模式识别;显微图像模式识别;人工神经网络;中药质量评价中药学是中国传统文化的重要组成部分,在疾病的防治中起注重要的作用。
对于中药质量的评价显得尤为重要。
以往对中药"有效成分"的定量分析并不能完全表现出中药的内在质量。
随着学科的发展,过去被认为是无效的成分如多糖、蛋白等,现在被发现其新的药用活性,所以对中药质量的评价,最好建立在缜密、系统、全面的基础上,结合药理活性等指标,做出综合评价。
模式识别是近年来发展起来的一门新的技术,广泛的应用于多种领域,本文即对模式识别在中药质量评价中的应用进行简要综述。
1模式识别的基础原理简介
模式识别(pattern recognition)是一门用计算机代替人对模式,即所研究的系统进行描述,分类和决策的新兴学科。
已经被广泛的应用于多种领域。
应用于模式识别中的数学方法有很多,其中决策理论法(又称统计法)应用的较多。
而结构法(又称句法)应用的相对较少。
统计模式识别技术还可以分成许多类,比如图示法和非图式法等等。
统计模式识别技
术主要是根据认输入模式中提取的一组特征,与模板进行对比而
实现对所研究体系的描述和分类。
在模式识别的过程中,要用适当的方式表现每个样本的特征。
当事物只有一个特征(n=1)时,各个模式可以用直线坐标上的点来表示;当事物有两个特征(n=2)时,各个模式可以用平面坐标表示;当必须用3个特征(n=3)来表征事物时,各个模式可以用立体坐标表示;当事物必须用3个以上(n≥3)的特征才可以表征时,在多维空间中的点无法直观的表现在平面上,这时需要采用降维的方法和特殊的图示法。
常用的方法包括主成分分析(principal component analysis, PCA),简单分类算法(simple classification algorithm,SIM- CA),非线性映射(nonlinear mapping,NLM),星座图技术(constellation-graphing t echnique)等等。
对多维空间中的两点距离的描述(多维空间中,两点距离越近,两种模式越有可能属于一类)多采用欧氏距离,PRIMA(pattern recognition by independent mult icategory analysis,独立多重分类分析模式)中采用类距离,以此作为分类的标准。
另外还有一些属于非图示法,不计算样本特征空间距离的模式识别技术,比如人工神经网络识别技术(artificial neural network,ANN),模糊模式识别(fuzzy pattern recongnition)等等。
人工神经网络(ANN)技术是一种全新的模拟人脑功能的信息处理系统。
以数学网络拓扑结构为理论基础,以高度的容错力,信息和加工存储一体化,自组织自学习为特征,具有超强的处理复杂信息的能力。
人工神经网络是真实神经网络的一种数学抽象,用许多数学神经元按一定的方式连接而成的一种网状数学拓扑。
网络结构的基本单位是神经元接点。
神经元是一个多输入,单输出的非线性元件。
网络中的信息处理和传递都由网络结构中的连接权所决定。
根据网络拓扑结构的不同,可分为误差反传(BP)网络、二值目适应共振理论(ART1)网络等多种结构类型。
用神经网络处理问题的过程既是在网络拓扑结构固定的条件下确定网络权值的过程,这一过程被称为训练过程或学习过程(leaning process),学习过程又被分为有指导学习和无指
导学习。
连接权确定之后,学习过程结束,即可用网络对未知系统进行预测和描述,又称为网络的回想(recall)。
对于模式识别中一些具体的操作和算法可参见有关文献。
2模式识别在中药质量评价中的应用进展
2.1化学模式识别在中药质量评价中的应用
化学模式识别是根据物质所含的化学成分,用计算机对其进行分类或描述。
可利用TLC,UV,IR,HPLC,GC,MS等方法获得其化学数据,再根据一定的方法进行识别。
近年来,很多学者对化学模式识别已作了很多的研究。
齐美玲等人对来自10个产地、5种典芩的23个样品,借助TLC,PC,GC及UV等分析手段,获得其理化特征。
利用模糊聚类分析对不同种黄羊间的差异进行了研究,得到了模糊等价关系矩阵及动态聚类图。
结果表明,粘毛黄芩和甘肃费芩与正品的差异比较小,可以考虑作为正品的代用品使用,而滇黄芩和丽江黄芩与正品的差异比较大。
王铁杰等人对7个种 38个龙胆样品的甲醇提取物进行了HPLC分析,按《中国药典》的规定将样品分为正品和非正品两类,运行SIMCA程序.选用18个正品和6个非正品龙胆样品作为星区图的训练集,其余14个作为试验集。
结果表明,化学模式识别结果和形态鉴别结果一致。
毕开顺等人将25个生态环境和生长年数不同的人参样品制备成水、酒提取液,用紫外-可见分光光度法、高效液相法和电感偶合等离子发射光谱法获得反映提取液内化学成分的整体数据。
再利用抗疲劳、抗利尿作用和巨噬细胞吞噬功能测定提取液的生物活性。
然后根据药理试验的结果对上述化学数据进行特征抽取,求解模糊关系方程,最后通过相关分析,制定出评价人参质量的新方案,结果发现,人参总糖和总皂苷的含量与生物活性存在负相关。
人参的3种生物活性与其总糖和总皂苷的百分含量。
几个皂苷各自的百分含量及它们的配比有关。
就3个生物活性指标和水、酒提取物的整体而言,人参皂苷起主要医疗作用,糖次之,微量元素作用很小。
张亮等人运用气相色谱-质谱法对雷公藤和昆明山海棠共21个样品进行分析,将每一样本进行色谱分离后的各成分质谱,按一定规则进行叠加,形成样本的总质谱,然后根据Shannon信息理论进行特征选取,
采用SIMCA法和非线性映射技术,将多维空间中的样本点放在二维平面上。
结果显示,雷公藤去皮根心和根皮差异显著,被分为两类;昆明山海棠去皮根与雷公藤去皮根被归为同类。
张亮等人对32种不同产地的石斛样品在 200~360nm区间,每隔1nm测定1个吸收值,利用不同波长下的吸光度与特定波长下吸光度的比值作为化学特征,再利用Shannon信息理论进行特征选取,选用10个通道作为分类特征,再采用主成分分析法进行质量研究,分类结果与植物形态学鉴定基本一致。
王秀坤等人对不同产地的共 40种苦参样品利用同样的方法进行紫外测定,运用主成分分析和非线性映射技术对苦参进行了化学模式识别。
分析结果与药材形态特征明显相关。
曾明等人运用同样的方法对不同产地的野葛及葛属的其他8种植物共20种样品进行 UV测定,再运用Shann on信息论及主成分分析法进行模式识别研究,结果显示,商品流通中的主流样本野葛和粉葛比较近似,产于黄河以南和以北的野葛被分别归为一类。
刘谦光等人对不同产地的14种西洋参中的可溶性糖、总皂苷和微量元素进行测定并作为化学参数,将这些数据压缩到[0,1]闭区间内,按模糊动态聚类分析法构造出模糊关系矩阵。
再按模糊聚类最大树法直接进行累类,结果显示,包括美国加拿大的7种西洋参质量最佳;陕西汉中等3个产地的西洋参质量优良;贵州等2个产地的西洋参质量欠佳,结果与实际结果相符。
张汉明等人选择了葛根的总黄酮、葛根素、大豆苷元、大豆苷、多糖等成分的含量及抗内毒素活性强度作为化学和药理指标,运用逐步回归法建立了回归方程;同时采用Bayers判别分析建立了判别分析方程,对葛属植物进行了模式识别研究。
结果发现,黄酮类成分在逐步回归分析中,没有达到相关水平,未进入方程;而多糖则与抗内毒素活性呈负相关。
判别分析的正确率达到了94.12%和 88.24%。
2.2显微图像模式识别在中药质量评价中的应用
随着计算机技术的发展及其在生物医学中的应用,中药组织形态学研究开始向三维和定量的方向发展,同时使中药鉴定更加客观、全面和准确。
基于体视学和计算机图像测试技术的图像定量分析,以及图形生成理论和计算机图形学的三维重建和显示技术的应用,使中药
混乱品种的鉴定和多源道地药材形性识别,及其质量的相关研究找到了一个新的方法。
现将有关研究总结如下。
肖小河等人使用改进的Mas- Ⅱ定量图像分析系统测试不同产地的共16种
郁金类中药组织的显微图像的体视学形态参数,包括统计和形态两大模块。
前者包括体密度、面数密度、间距、直径等;后者包括截面积、周长、最大直径、球化度等参数。
然后通过聚类分析和主成分分析,定性定量的刻划了郁今类中药显微鉴定特性和评判标准。
结果显示,当分类阈值取8.25时,可将黄丝都今、绿丝郁今。
温郁今和云南郁今明确的区分开来;不同部位的郁今类中药显徽图像定量分析结果差异显著,黄丝郁今的头部。
中部、尾部就有明显的差异。
通过主成分分析,确定了对排序和分类最有影响的内皮细胞平均最大直径等10个组织细胞的体视学参数。
此外,肖小河等人还运用同样的方法对不同品种、不同产地、不同部位的22种黄连样品进行了计算机图像定量分析,建立了其显微鉴定模式识别系统,结果显示,不同产地和不同采收期的同种黄连组织细胞的体视学形态有很大的相似性和重现性,不同种类的黄连之间差异较大。
对于国产的不同产地、不同种类的共21个姜黄属药物植物的叶子,肖小河等人也对其进行了同样的研究,结果表明,姜黄属植物不同产地不同种类的叶表皮细胞密度、大小和形状存在明显差异;上表皮细胞平均周长、下表皮细胞平均截面积和平均国形度等8个主要参数可作为鉴别的特征参数。
2.3人工神经网络在中药质量评价中的应用
人工神经网络是用工程技术手段模拟生物神经网络的结构特征和功能特征的一类人工系统。
它与传统的核式识别技术相比,具有自组织、自学习和自适应的能力,处理信息量大的特点。
因而近年来发展较快,在中药质量评价中也有一些应用,并获得许多有意义的成果,特综述如下。
张亮等人将雷公藤和昆明山海棠根皮及去皮报共25种浸出物的红外光谱数据通过误差反传网络进行模式识别,网络结构为3 层,输入节点9个,隐层节点21个,输出节点1个。
分类结果与SIMCA法基本一致。
证明雷公藤根皮和去皮根在化学成分上是有区别的,而昆明山海棠处于两者之间。
乔延江等人使用对称三层BP神经网
络方法对22个蟾酥样品的9个色谱峰的测量数据进行特征抽取,用抽取的两个特征及对应的误差绘图,直接对样本实现了分类。
结果将蟾酥分为3类,北方中华大蟾蜍产蟾酥,南方中华大蟾蜍产蟾酥和花背蟾蜍产蟾酥。
将22个样本随机分为2组,用12个作为训练集,10个作为检验集,发现网络的
识别正确率达到100%,证明网络提取的特征可以全面的反映原始数据的信息。
蔡煜本等人对于不同产地的12种厚朴样品,通过气相色谱分析得到各组分的相对含量,运用BP人工神经网络对这些样品进行分析和评价,选择8个样品作为训练集,4个作为检验集,结果发现,网络的误判率为0,评价结果与实际情况完全一致。
张亮等人运用二值目适应共振理论(ART 1)网络和非线性映射(NLM)技术对中药戊已丸进行了缺省药材的定性识别研究,实验数据为药材浸出液的红外光谱,特征选取采用Shannon信息量法,结果表明,ARTh网络对3类共60个作品的正确识别率分别为85%,80%,90%,平均正确率为85%,可见ART1网络能够对多类情况进行正确的识别,但是准确率有待于进一步的提高。
另外,钟晨等人运用人工神经网络(BP 模型)成功的不经分离直接测定了复方依刘维C银翘片中扑热息痛和维生素C 的含量,为中药复方的质量控制建立了一个新的方法。
模式识别和人工神经网络在其他方面比如药剂学、药动学/药效学、蛋白质二级结构预测、通过分子结构预测药物毒性及三糖的13C-NMR化学位移的预测等方面都有更广泛的应用。
另外,模式识别在中药指纹图谱方面也有许多应用,鉴于这方面已有许多综述性文章,本文不再赘述。
3小结及前景展望
中药质量的模式识别,既体现了中药成分复杂,多成分多靶点综和作用的机理。
又具有较强的科学性和实践性。
但是,从现阶段的研究状况来看,还存在很多的困难和问题。
首先,对于某一中药的研究中,不容易把不同属性的样品收集齐全,至于正品、代用品及伪劣品更不容易收集到足够的样本含量。
其次,不容易采用适当的方法将样品的特征信息完全表现出来,以进行识别分析。
还有,在模式识别研
究中,模式识别与药理试验的联系没有更多的开展,使综合的质量评价没有与中药的疗效结合起来。
但是,随着计算机技术在中药研究领域中的不断应用,模式识别方法从理论性到实践性的不断发展,相信它会成为中药质量评价的一种科学的、全面的、准确的方法。
参考文献
[1]计算机在化学化工中的应用吴若峰,上海大学出版社,7-81058-189-9,TQ015.
[2]计算机化学化工丛书科学出版社,,TQ015.9-51
[3]模式识别优化技术及其应用陈念贻,中国石化出版社,7-80043-673-X,O235
[4]计算化学及其应用陈念贻,上海科学技术出版社,,O6-052
[5]数理统计分析与实验设计贺建勋,西北大学出版社,7-5604-0363-8,TQ015.9
[6]化学计量学应用杜一平,化学工业出版社
[7]人工神经元网络方法在毛细管电泳和色谱分析中的应用[J]; 张雅雄,李华,Josef Havel 分析化学;2004年05期
[8]化学模式识别及其在水质分类中的应用[J]; 卢伟,陈国松,张红漫,张之翼,蒋皎梅,华毅超,刘泼;化工时刊;2004年07期
[9]药用植物化学分类法与红外指纹图谱的相关性研究[J];光黄昊,孙素琴,许锦文,王钊;谱学与光谱分析;2003年02期
[10]化学模式识别优化方法及其应用[J]; 陈念贻,李重河,钦佩;科学通报;1997年08期
[11]三维数据分析与模式识别方法及其在药学研究中的应用[D]; 谢洪平;湖南大学;2002年
[12]Balaban A T. J Chem Inf Comput Sci,1997,37:65
[13]王旭,王宏,王文辉编著.人工神经元网络原理与应用[M].沈阳:东北大学出版社,2000.
[14]薛定宇,陈阳泉著.基于MATLAB/Simulink的系统仿真技术与应用[M].北京:清华大学出版社,2002.
[15]董长虹编著.Matlab神经网络与应用[M].北京:国防工业
出版社,2005.
[16]杨淑莹著.模式识别与智能计算-Matlab技术实现[M].北京:清华大学出版社,2008.。