仿生模式识别_拓扑模式识别_一种模式识别新模型的理论与应用_王守觉
模式识别技术的新进展和应用
模式识别技术的新进展和应用第一章:引言模式识别技术是一种用于从大量数据中识别出模式和规律性的技术。
它广泛应用于人工智能、机器学习、生物信息学等领域。
近年来,随着计算机算力的提升和数据的爆炸式增长,模式识别技术得到了快速发展。
本章将介绍模式识别技术的定义和基本原理。
第二章:模式识别算法模式识别算法是模式识别技术的核心,它能从输入的数据中自动学习出一种描述模式的模型。
常用的模式识别算法包括神经网络、支持向量机、决策树和随机森林等。
本章将详细介绍这些算法的原理和应用场景,并对它们的性能进行比较。
第三章:深度学习在模式识别中的应用深度学习是近年来兴起的一种机器学习方法,它通过构建多层神经网络来提取高级特征和表示。
深度学习在模式识别领域取得了重大突破,特别是在图像和语音识别方面。
本章将介绍深度学习的基本原理和模型结构,并探讨其在模式识别中的应用。
第四章:模式识别技术在医疗领域的应用模式识别技术在医疗领域有着广泛的应用,如医学影像分析、疾病诊断和预测等。
例如,利用模式识别技术可以从医学影像中自动检测和识别疾病的标志性特征。
本章将介绍模式识别技术在医疗领域的常见应用,并分析其优势和挑战。
第五章:模式识别技术在金融领域的应用模式识别技术在金融领域也有着广泛的应用。
例如,利用模式识别技术可以从金融市场数据中识别出股票价格的趋势和规律,从而进行交易决策和风险预测。
本章将介绍模式识别技术在金融领域的常见应用,并讨论其局限性和未来发展方向。
第六章:模式识别技术在安全领域的应用模式识别技术在安全领域也扮演了重要角色。
例如,利用模式识别技术可以从网络数据中识别出异常行为和入侵行为,提升网络安全的水平。
本章将介绍模式识别技术在网络安全、人脸识别和指纹识别等方面的应用,并探讨其挑战和发展趋势。
第七章:模式识别技术的未来展望模式识别技术在各个领域都有着广泛的应用,但仍然面临许多挑战。
随着人工智能和大数据技术的发展,模式识别技术将会得到更大的突破和应用。
北京理工大学文献检索大作业
文献检索大作业班级:******* 姓名:***** 学号:**********检索课题:模式识别技术的应用一.技术背景模式识别(Pattern Recognition)的研究涉及信息学、计算机科学、模式识别与统计学、心理学、计算机科学、控制论、数字信号处理、图像处理等多种学科,具有广阔的应用前景,是通过计算机用数学技术方法来研究模式的自动处理和判读。
我们把环境与客体统称为“模式”。
随着计算机技术的发展,人类有可能研究复杂的信息处理过程。
信息处理过程的一个重要形式是生命体对环境及客体的识别。
对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。
这是模式识别的两个重要方面。
市场上可见到的代表性产品有光学字符识别、语音识别系统。
模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。
随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。
(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
二.中外文检索词主题词:模式识别(Pattern Recognition)关键词:模式识别(Pattern Recognition)、技术(Technology)同义词:Pattern Recognition同义扩展:模式:特征,表象识别:认知,了解全称与简称:模式识别技术(Pattern Recognition,PR)下位词扩展:无监督模式识别,分类器,文字识别,语音识别,指纹识别等上位词扩展:识别等三、检索1.检索图书1.1检索途径:使用CALIS公共书目查询系统进行检索;1.2检索式:题名=*模式识别技术*,检中文献数:25,无需调整检索策略.1.3结果:[1]李介谷,蔡国廉.计算机模式识别技术[M].上海:上海交通大学出社,1986.[2]余正涛,郭剑毅,毛存礼.模式识别原理及应用[M].北京:科学出版社,2014.1.4获得途径:文献[1]可以从北京大学图书馆、北京航空航天大学图书馆、复旦大学图书馆等通过馆际互借获得。
基于近红外光谱的商品玉米品种快速鉴别方法
出不同品种玉米籽粒光谱之间差异较大。而相同品种玉米籽 粒光谱之问筹异较小的特征光谱区域,从而减少无用信息的 干扰,提高模型的鉴别精度。主成分分析可降低数据维数, 提高鉴别速度。仿生模式识别对于小样本、多分类问题具有 特殊的优势,且能对未经训练类别的样本有效地拒识,对品 种鉴定较为适合。 目前,利用近红外光谱数据对玉米中各种成分进行定量 分析已非常普遍,但对玉米品种进行定性的品种鉴定还不多 见,且现有报道中鉴定的品种种类较少,绝大多数在10个品 种以内,大规模的品种鉴定还未见报道。该方法的提出对利 用近红外光谱在玉米品种鉴』!}{I上的规模化应用具有重要参考 价值。
(BPR)方法建它了37个玉米品种罄别模型,对于每个品种的25个样本,随机挑选15个样本作为训练样本,
其余10个样本作为第一测试集,其他品种共900个样Байду номын сангаас作为第二测试集。该鉴别模型对于37个玉米品种的 平均正确识别率为94.3 oA。该方法的进一步研究有利于建立以近红外光谱为基础的物理指纹品种鉴别技术。
90.1 94.1 9t.4 97.3 92.4 80.1 74.6 86.6 83.I 89.9 95.6 90.9 82.6
87.0 86。9 84.2 86.9 85.4 80.0 96.0 93.9 88.1 88.9 81.8 87.9
100
100
耕玉801
I』)8074 I』)8078 I』)3070
100
90
100
90
弘大8号
07H130366 LI)688 I』)9067 LD9059 I』)6076 I』)6077 DH8601
100
90
100 100 80 100 100 90 80 90 90
ICA的DOA估计方法
基于仿生模式识别和PCA /ICA 的DOA 估计方法安冬,王守觉(中国科学院半导体研究所神经网络实验室,北京100083)摘要:本文提出了一种基于仿生模式识别和PCA /ICA 的DOA 估计方法.这种方法的建模过程是用在实际环境下采集的训练样本构造人工神经网络模型,对环境的适应能力较强;且这种方法采用PCA /ICA 进行特征提取,使数据得到有效压缩,可以实现系统实时处理.实验结果表明:在信噪比为20dB 和0dB 时,该方法的正确估计率可达100%;在信噪比降为-20dB 时,该方法仍有83%的可识别率.关键词:DOA 估计;仿生模式识别;人工神经网络;PCA ;ICA 中图分类号:TNTP391.4文献标识码:A 文章编号:0372-2112(2004)09-1448-04A DOA Estimation Method Based on Biomimetic Pattern Recognitionand PCA /ICAAN Dong ,WANG Shou-jue(Lab of Artificial Neural Networks ,Institute of Semiconductors ,CAS ,Beijing 100083,China )Abstract :The applicability of biomimetic pattern recognition to information processing of abstract objects is studied ,and then aDOA estimation method based on biomimetic pattern recognition and PCA /ICA is advanced.In this method ,the output signals of an-tenna array are collected in practical conditions and expressed as feature vectors by using PCA /ICA.These feature vectors are studied with the method of high dimensional geometry and the principle of biomimetic pattern recognition.By using the feature vectors as train-ing samples ANN models are constructed.In our experiments ,when SNR is 20dB or 0dB ,the correct estimation rate is 100%;when SNR is -20dB ,the correct estimation rate is 83%;The experimental results show that the proposed method has the great advantage of preferable robustness and fast computation.Key words :DOA estimation ;biomimetic pattern recognition ;neural networks ;PCA ;ICA!引言所谓DOA 估计就是利用天线阵列接收信号源发出的信号,运用现代信号处理方法估计出信号源所在的方位,即在信号源情况未知的条件下,利用天线阵列输出(为一包含有信号源方位信息的复合矢量信号)估计出信号源方位.解决这个问题可以从两个角度考虑:一个角度是建立数学模型、通过解析计算得出结果,如传统的MUSIC 法、ESPRIT 法等.近年来,基于这种思路的DOA 估计取得了丰硕的成果,但这些理论上很好的算法大都停留在实验室仿真上,很难在实际工程中应用.其根源在于以下两点:一是算法运算量大,无法实时实现;二是对实际应用环境的适应性差,达不到要求的性能指标.另一个解决DOA 估计问题的思路是采用“软建模”、“软计算”的方法,如人工神经网络、模糊集合理论、进化计算等等.本文采用的是一种基于人工神经网络的方法.这种方法的建模过程是用训练样本构造人工神经网络模型,而不是建立严格精确的数学方程式.在实际情况下采集的训练样本已经将噪声、信噪比、信号模型、传输通道等因素考虑了进去,因此可以较好的解决这些问题.且这种方法在计算时采用了PCA /ICA 进行特征提取,有效的压缩了数据,计算量较小,可以实现系统实时处理,从而有望应用于实际工程.现实世界中的大多数事物(包括抽象事物在内)都可以通过若干特征来描述,从而形成一个表征该事物的特征矢量,对特征矢量可以有不同的分析方法.多年来,人们多使用代数的方法对特征矢量进行分析[1~4],而王守觉院士最近提出了一种高维空间几何分析方法[5],并在此基础上提出了一种模式识别新理论———仿生模式识别(拓扑模式识别)[6].基于上述思路本文提出了一种基于仿生模式识别和PCA /ICA 的DOA估计方法,其基本原理为:将包含有信号源方位信息的天线阵列输出信号用特征矢量来表征,使用高维空间几何分析方法、仿生模式识别原理及PCA /ICA 对特征矢量进行处理,实现对空间角度这一抽象对象的识别.其实现方法是将空间角度分割成许多细小的连续的等份,每一等份对应一个神经元,即每个神经元表征一个可分辨的信号源方位,神经网络的作用是收稿日期2003-09-22;修回日期2004-03-02第9期2004年9月电子学报ACTA ELECTRONICA SINICA Vol.32No.9Sep.2004判别信号方位是哪个神经元所表征的信号源方位,从而间接实现DOA估计.2仿生模式识别(拓扑模式识别)及PCA/ICA基本原理简介2.1仿生模式识别(拓扑模式识别)以往,人们在研究模式识别问题时,考虑的出发点都是怎样利用统计决策理论对若干有限类别的样本进行最优分类划分(包括支持向量机)[1~4].而王守觉院士提出的仿生模式识别(拓扑模式识别)是利用高维空间几何分析方法对一类一类样本进行“认识”.图1为仿生模式识别与传统模式识别的比较.图1传统模式识别与仿生图2划分方式与认识模式识别的区别方式的区别基于上述思想,仿生模式识别是以一类样本在特征空间中分布的最佳覆盖为目标的,不同于传统模式识别以不同类样本在特征空间中的最佳划分为目标,现以二维空间为例说明,见图2.图2中,三角形为要识别的样本,圆圈和十字形为与三角形不同类的两类样本,折线为BP网络的划分方式,大圆为RBF网络的划分方式(等同于模板匹配的识别方式),细长椭圆形构成的曲线代表仿生模式识别的“认识”方式.基于特征空间中同类样本分布的连续性规律,对一类事物的“认识”,实质上就是对这类事物的全体在特征空间中形成的无穷点集合的“形状”的分析和“认识”.仿生模式识别就是利用点集拓扑学中关于高维流形的理论,研究特征空间中同类样本集的拓扑属性,从而对这类样本在特征空间中的分布状况加以合理覆盖.在仿生模式识别中,任何一类事物全体连续映射到特征空间R I中的“像”所组成的点集都被视为一个闭集A.仿生模式识别的具体应用对象不同,集合A可以是不同维数的流形.识别过程就是判别某一被识别事物映射到特征空间R I 中的“像”是否属于集合A.这就必须在特征空间R I中构筑一个能覆盖集合A的I维空间几何形体.一个神经元可以是一个的复杂的封闭超曲面[7],多个神经元组合起来的人工神经网络就可以实现高维空间复杂几何形体覆盖.因而,人工神经网络是实现仿生模式识别的十分合适的手段.2.2PCA(Principal Components Analysis,主元分析)[9]主元分析对由一系列观测数据向量组成的向量组进行分析,找到最能表达该组向量特征的一组正交基,且使基的个数尽可能的少.这组最能表达该组向量特征的正交基被称为“主元”.将该组向量投影到这组正交基上,该组向量的维数在投影后将会得到压缩.具体的算法由于篇幅的原因这里不再详细介绍.2.3ICA(Independent Components Analysis,独立元分析)[9]独立元分析同样是对由一系列观测数据向量组成的向量组进行分析,但它找出的是最能表达该组向量特征的一组非正交基,这将具有更大的通用性和适应性.这组最能表达该组向量特征的非正交基被称为“独立元”.主元分析可作为独立元分析的预处理,用来得到最能反映数据特征的维数,确定独立元的个数.独立元分析的算法有很多,本文是利用四阶统计信息求出独立元的,具体的算法这里不再详细介绍.3DOA估计问题的数学模型虽然本文所采用的方法是一种基于仿生模式识别的方法,这种方法的建模过程是用训练样本构造人工神经网络模型,而不是建立严格精确的数学方程式.但是仿生模式识别是通过研究特征空间中同类样本集的拓扑属性,对这类样本在特征空间中的分布状况加以合理覆盖来“认识”这类样本的.所以研究仿生模式识别的具体实例首先要分析被识别事物映射到特征空间中的“像”的分布状况,因此对DOA估计问题的数学模型进行分析是十分必要的.为了分析推导的方便,现作以下假设:(1)信号源为窄带的,且具有相同的中心频率U0.待测信号源的个数为D.(2)天线阵列是由M个阵元组成的等间距直线阵,阵元间距为i.(3)各阵元上有互不相关、方差为O2、均值为零的高斯白噪声.(4)阵列响应在观测时间内是时不变的.则单源DOA估计问题的数学模型如下:!=S(t)"+#=S(t)1e-(2!i/X)Sin Oe-(M-1)(2!i/X)SinO+#(1)其中,!=[x1(t),x2(t),…,xM(t)]T#=[I1(t),I2(t),…,I M(t)]T!为天线阵列输出,S(t)为信号的包络,"为信号的方向向量,#为噪声.据阵列响应在观测时间内时不变假设,S(t)为一常数,i,X为常数(通常取i/X为1/2),如不考虑噪声#的影响,可以将阵列输出!看成是一个关于O的函数,记作!=I(O).所以!经连续变换后,在特征空间中形成的“像”应近似于一个一维流形P.加以噪声#的影响,可以考虑在特征空间中的覆盖形状是一个一维流形P与I维超球的拓扑乘积Pa:P a={x\P(x,y)!I,y"P,x"R I}(2)P(x,y)为x,y之间的距离,I为选定的距离常数,即在I维9441第9期安冬:基于仿生模式识别和PCA/ICA的DOA估计方法特征空间中,离一条空间曲线的距离小于等于某定值I的所有点的集合.4基于仿生模式识别的DOA估计方法4.1基于PCA/ICA的预处理使信号源以天线为中心缓慢旋转一定角度范围(如从30度旋转到40度),向一个m元天线阵列发射信号.同时每隔一定角度间隔!!(!!为一自定常数,通常可以设为1度)对阵列输出进行I点采样,产生一个m>I维矩阵X:X=[X(1),…,X(I)](3)将此矩阵以列为基础,列与列按顺序首尾相接成为一个m> I维的列向量,这样就在m>I维测量空间中形成了一个样本点.针对所有被采样的角度,就形成了一个m>I行c列的矩阵H,c为被采样的角度总数,这样就在m>I维测量空间中形成了多个样本点,组成了测量样本集O.首先对矩阵H做PCA[9],求出其主元U=[u1,...,ui],i为主元个数,一般i<c,u i为一个m>I维的列向量.则通过计算G=U T H就将测量空间中的样本点变换到了由主元U组成的新坐标系中.G为一个i>c的矩阵,其每一个列向量为i维主元坐标系中的一个样本点.这时,样本点的维数由原来的m>I维,降到了i维.然后利用四阶统计信息对G做ICA[9],求出其独立元V =[v1,...,1i],再通过计算F=V T G将主元坐标系下的样本点变换到由独立元V组成的新坐标系中.F为一个i>c 的矩阵,其每一个列向量为i维特征空间中的一个样本点,整个的F矩阵形成了原始样本集S.这样就完成了从m>I 维测量空间到i维特征空间的变换,实现了降维和特征提取的目的.4.2神经网络结构构造根据第3节的分析,原始样本集在特征空间中的覆盖形状应是一个一维流形P与m2维超球的拓扑乘积Pa,即P a={x I"(x,y)S I,y P,x R I}(4)S={x I x=S i(i=1,2,...采集样本总数)},S C P,P C R I,I=m2(5)为了使用较少的神经元近似覆盖Pa,现用若干空间直线段近似空间曲线P.每个神经元覆盖的是一个直线段与m2维超球的拓扑乘积.具体方法如下在原始样本集S中选取个样本组成训练样本集S',S'={x I x=S i(i=1,2,…,),"(S,S i+1)="(S I+1,S i+2)=i}(6)S'C S,i为设定常数用-1个神经元来近似覆盖Pa ,第i个神经元的覆盖范围Pi为P i={x I"(x,y)S I,y B i,x R I},I=m2(7)B i={x I x=#S'i+(1-#)S'i+1,#[0,1]}(8)即某一角度范围内的样本点,该神经元对应于一个可分辨的信号源方位.为了实现对Pi 的覆盖,本文采用了一个形状类似香肠的神经元:[7,8]y i=f[$(S i,S i+1,x)](9)式中Si,Si+1为第i和i+1个训练样本;x为输入样本;yi为第i个神经元的输出.$(S i,S i+1,x)="(x,y),x R IY{z I z=#S i+(1-#)S i+1,#[0,1]}(10)f[·]为一阈值函数,全部 -1个神经元形成的覆盖区域为P a=U -1i=1P i(11)这样,连续对应于-1个可分辨信号源方位的-1个神经元完成了对Pa的近似覆盖.4.3样本训练从由训练样本S1与S2组成的直线段开始,在i维特征空间中训练覆盖该直线段与i维超球拓扑乘积P1的神经元,直到完成所有-1个直线段对应的-1个神经元的训练.存储每个神经元的参数,完成训练.4.4样本识别由4.1节的叙述可知,每个可分辨的信号源方位对应于一个神经元.现对所有神经元按所代表的空间角度的顺序进行编号,即所有的-1个神经元顺序表征了所有可分辨的信号源方位.神经网络的作用是判别带有角度信息的输入样本点落入到几号神经元的覆盖区域,则这个神经元所表征的可分辨的信号源方位即为信号入射的方位,从而完成DOA估计.具体来说,将某一输入样本点输入到神经网络中,得到所有-1个神经元的输出,如果该样本点落入神经网络所覆盖的区域Pa内,则其中输出值最小的神经元所对应的可分辨信号源方位即为信号入射的方位;如果该样本点没有落入神经网络所覆盖的区域,则信号入射的方位不是该神经网络可分辨的信号源方位.5实验过程及结果使信号源y =2sin(500t)向一个8元线阵发射信号,设置采样频率为200hz,采样点数为100,对阵列输出进行采样,可得到一个8>100的矩阵.现使信号源围绕天线从0度缓慢旋转到18度,均匀采集100个样本,为第一测量样本集.(所谓均匀采集样本即每隔一定的角度间隔采集一次样本,本试验是每隔0.18度采集一次样本.)调整信噪比,再次使信号源围绕天线从0度缓慢旋转到18度,均匀采集200个样本,为第二测量样本集.使信号源围绕天线从18度旋转到36度,均匀采集100个样本,为第三测量样本集.实验步骤如下:(1)按4.1小节的方法对第一测量样本集做PCA/ICA后即可在一个6维特征空间中形成特征样本集.在这个样本集中,每隔1.8度选取一个样本,共选取了11个样本,组成训练样本集.(2)用10个神经元实现对由这11个训练样本点所组成的折线段的覆盖,构造出识别网络,这个网络对空间角度的分辨率为1.8度.(3)对所有神经元进行依次编号,编号为1, (10)0541电子学报2004年(4)将第一、第二、第三测量样本集中的所有样本按4.1小节的方法变换到6维特征空间后对这个网络进行测试,结果见表1.(5)如果测试样本点没有落入整个神经网络所覆盖的范围,则为拒识,如果落入网络中任一神经元的覆盖范围,则为可识别的样本,可识别时的平均误差S为:S=1n!ni=1(^x i-x i)"2(12)其中,n为测试样本总数,^x i为第i个样本的估计值,x i 为第i个样本的真实值.(6)重新在特征样本集中,等间距的选择7个样本,即每隔3度选取一个样本,组成新的训练样本集.用6个神经元实现对由这7个训练样本点所组成的折线段的覆盖,构造出识别网络,这个网络对空间角度的分辨率为3度.将第一、第二、第三测量样本集中的所有样本按4.1小节的方法变换到6维特征空间后对这个网络进行测试,得出的试验结果见表1.表!基于仿生模式识别的DOA估计实验结果神经元个数1010101066距离常数I0.30.3 2.8 3.111信噪比/dB200-20-20200识别率/%100100831009598拒识率/%0017052识别是的平均估计误差/()000.310.5700(7)在目前的DOA估计工程中,所使用的最先进的方法为MUSIC法.为了将基于仿生模式识别的方法和MUSIC 法进行比较,我们在同样的实验条件下(即信号源相同,天线阵列相同,信噪比相同,角分辨率取1.8度)使用MUSIC法进行DOA估计.得出的实验结果和仿生模式识别法的实验结果比较如表2所示.表"MUSIC法和仿生模式识别法的估计性能比较信噪比/dB平均估计误差/()MUSIC法20000.24-20 2.4仿生模式识别法20000-200.57#讨论与结论由上述实验结果可以看出:(1)增加神经元的数量,即增加神经元覆盖范围的复杂度,可以改善估计效果.(2)针对较低的信噪比,可以通过适当调大k值,即调大神经元覆盖区域,来改善估计效果.但是要注意,随着k值的增大,拒识率虽会下降,但识别时的平均误差却会增大.(3)在同样的实验条件下,基于仿生模式识别的DOA估计方法要优于MUSIC法,尤其在信噪比较低的情况下,这种优势表现的更为明显.说明基于仿生模式识别的DOA估计方法对环境的适应性要比MUSIC法好,更具有实用价值.实验结果证明了以高维空间几何分析方法为基础的仿生模式识别不仅可以应用于传统的模式识别(如实物识别、人脸识别、语音识别),而且完全可以应用于非感性的抽象对象的信息处理(如阵列信号处理).且这种方法的建模过程是用训练样本构造人工神经网络模型,鲁棒性很好,估计时计算量较小,可以实现系统实时处理,从而有望应用于实际工程.这两点在信号处理领域具有普遍意义,值得推广.参考文献:[1]Fisher.Contributions to MathematicaI statistics[M].New York:J Wi-Iey,1952.[2]陈季镐(美).统计模式识别[M].邱炳章,邱华,译.北京:北京邮电学院出版社,1989.[3]Vapnik and Chervonenkis.Theory of Pattern Recognition[M].Nauka:Moscow,1974.[4]Adimir N Vapnik.统计学习理论的本质[M].张学工,译.北京:清华大学出版社,2000.[5]王守觉,等.人工神经网络的多维空间几何分析及其理论[J].电子学报,2002,30(1):1-4.[6]王守觉.仿生模式识别(拓扑模式识别)———一种模式识别新模型的理论与应用[J].电子学报,2002,30(10):1417-1420.[7]王守觉,等.通用神经网络硬件中神经元基本数学模型的讨论[J].电子学报,2001,29(5):577-580.[8]王守觉,等.基于仿生模式识别的多镜头人脸身份确认系统研究[J].电子学报,2003,31(1):1-5.[9]斯华龄(美).智能视觉图像处理[M].上海:上海科技教育出版社,2002.作者简介:安冬女,1977年1月生于河北省石家庄市,博士生,主要研究方向为模式识别、人工神经网络、信号处理.王守觉男,1925年6月生于江苏省苏州市,研究员,中科院院士,电子学报主编,主要研究方向为模式识别与人工神经网络模型、算法、硬件和应用.1541第9期安冬:基于仿生模式识别和PCA/ICA的DOA估计方法基于仿生模式识别和PCA/ICA的DOA估计方法作者:安冬, 王守觉作者单位:中国科学院半导体研究所神经网络实验室,北京,100083刊名:电子学报英文刊名:ACTA ELECTRONICA SINICA年,卷(期):2004,32(9)被引用次数:12次1.Fisher Contributions to Mathematical statistics 19522.陈季镐;邱炳章;邱华统计模式识别 19893.Vapnik;Chervonenkis Theory of Pattern Recognition 19744.Adimir N Vapnik;张学工统计学习理论的本质 20005.王守觉人工神经网络的多维空间几何分析及其理论[期刊论文]-电子学报 2002(01)6.王守觉仿生模式识别(拓扑模式识别)—一种模式识别新模型的理论与应用[期刊论文]-电子学报 2002(10)7.王守觉通用神经网络硬件中神经元基本数学模型的讨论[期刊论文]-电子学报 2001(05)8.王守觉基于仿生模式识别的多镜头人脸身份确认系统研究[期刊论文]-电子学报 2003(01)9.斯华龄智能视觉图像处理 20021.王守觉.徐健.王宪保.覃鸿基于仿生模式识别的多镜头人脸身份确认系统研究[期刊论文]-电子学报2003,31(1)2.安冬.王守觉基于仿生模式识别的DOA估计方法[期刊论文]-电子与信息学报2004,26(9)3.杨国为.王守觉.刘扬阳.YANG Guo-wei.WANG Shou-jue.LIU Yang-yang仿生模式识别的两个关键技术问题研究[期刊论文]-电子学报2008,36(12)4.王守觉.曲延锋.李卫军.覃鸿基于仿生模式识别与传统模式识别的人脸识别效果比较研究[期刊论文]-电子学报2004,32(7)5.崔皓.李冬海.CUI Hao.LI Donghai基于两种神经网络方法分析的DOA估计算法比较[期刊论文]-现代电子技术2008,31(21)6.杨志广.张鹏.陈树.邵国光PCA的应用、手术部位及年龄与开胸术后心因性反应的相关性研究[期刊论文]-中国老年学杂志2010,30(10)7.黎洪松.许保华.LI Hong-song.XU Bao-hua一种用于视频对象编码的运动模式识别算法[期刊论文]-电子学报2007,35(12)8.武妍.王守觉.WU Yan.WANG Shou-jue线性与非线性输出单元相结合的神经网络[期刊论文]-同济大学学报(自然科学版)2005,33(4)9.刘钢.张锦.刘雪花基于嗅觉仿生模型的人脸识别[会议论文]-20081.徐毅.殷业.王沛基于仿生模式识别的语音识别研究[期刊论文]-上海电机学院学报 2007(2)2.罗争.张旻.陈思剑基于选择性集成径向基神经网络的来波方向估计[期刊论文]-新能源进展 2013(1)3.蒋晔.唐振民短语音说话人辨认的研究[期刊论文]-电子学报 2011(4)4.陶业荣.安新宇.张义军.李鹏飞协方差矩阵输入的DOA估计方法[期刊论文]-无线电工程 2013(2)。
基于仿生模式识别的眉毛识别方法
性. 本文提 出了一 种基于仿 生模式 识别 的眉毛识别
方法 , 利用多权值 神 经元 构 建 高维 空 间 , 现对 识 实 别样本 的覆盖 , 到识别 的 目的. 达
归类知识 把需 要归 在 一 起 的类 别 合并 .因 而 以下
同类样本指 的都是 “ 同源 ” 的一类样本 .
自然 界 任 何 欲 被 认 识 的 事 物 ( 括 事 物 、 包 图 像 、 音 、 言 、 态 等 等 )若 存 在 两个 “ 声 语 状 同源 ” 同
覆 盖作为 目标 . 仿 生模式识 别 的基点为 : 人们在对 事物 的识别 过程 中 , 在两 种不 同的归 类 过程. 种 是“ 存 一 同源 ” 的归类过 程 , 另一 种是不 同源 的按 逻辑知识 归类过 程 . 同源 ” “ 的称为 同一类 , 而在 识别 以后再 按逻辑
已经研究 和使 用 的生 物 特 征 识别 技术 有 : 人脸 识 别 ]虹膜识别 ]指 纹识 别 J 掌纹 识别 J人耳 、 、 、 、
传 统 的模 式识 别是 把 不 同类样 本在 特征空 间 的最佳划 分作为 目标 , 这样该识别 方法把重点放 于 区别 , 而忽 视认识 , 即一 类样 本 与有 限类 已知 样本
的区分. 这恰 好与 人认 识 事 物 的过 程相 反. 认识 人
事物 是一类一 类认识 得 , 即一 类样本 与无限类未知
第 6期
李颜 瑞 , : 于仿 生模 式 识别 的眉 毛识 别方 法 等 基
89 5
特征 空 间 中设所 有属 于 A类 事 物 的全体 所 做成 的点 集为 A , 集合 A 中存 在任 意两 个元 素 若
关键 词 : 仿 生模 式识别 ; 眉毛识 别 ; 多权值神 经元 中 图分类 号 : T 3 1 P 9 文 献标 识码 : A
仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论和应用
——一全里堡璺苎查兰兰些查垦主茎丝苎6神经网络高维空闯复杂几何形体覆盖识别方法及其应用实例在实际的仿生模式识别中为了判别是否属于集合P。
,必须用软件或硬件为手段,在特征空问RⅡ中构筑一个能覆盖集合P。
的n维空间几何形体。
近似于覆盖集合P。
的n维空间几何形体是以不同维数的“流形”(集合A)中,无穷多的点作球心,以常数k作半径的无穷多个n维超球体的并,即集合A与n维超球体的拓扑乘积。
根据维数理论f”,要把n维空间分成两部分,其界面必须是一个n-1维的超平面或超曲面。
而人工神经网络中一个神经元正是在11维空间中作一个n-1维的超平面或超曲面,把Rn分成两个部分。
一个神经元,也可以是多种多样的复杂的封闭超曲面睥】。
冈而,人工神经网络是实现仿生模式识别的十分合适的手段。
为了方便发展神经网络仿生模式识别,我们在前一篇论文中一】引入了神经网络高维空间几何分析方法,用来作为发展仿生模式识别的一种实用性工具,该文中对n维空间的点、直线、平面、超平面、圆、球面、超球面间的关系作了叙述,但未对非球超曲面进行讨论。
以下,将介绍和讨论一个应用非球超曲面的仿生模式识别的实例。
仿生模式识别应用实例的要求是在海面上或地平面上对不同方向观察的目标(如舰艇、坦克、汽车、牛、马、羊等)的认识。
样本的采集是从不同方向观察所采集到的bmp文件,进行前处理(连续映射)后压缩成256维特征空间样本点。
由于观察方向都是水平的,可咀说方向的改变只有一个变量,因而,特征空问中样本点的分布应近似于呈一维流形分布。
加以其他方向存在的微弱变动,可以考虑某类对象在特征空间中的覆盖形状应是个与圆环同胚的一维流形与256维超球的拓扑乘积。
用语言描述也就是在256维特征空间中,离开一条头尾相接的空问曲线的最小距离小于某定值k的所有点的集合P。
,而该空间曲线包含所有采集的样本点集合S,即S={Xx=S。
(i=1,2….采集样本总数)}图3Pa=(xfp()【,y)<kY∈A,X∈舯}其中A={x{x2Xi,i_(I,2,…,n)’11CN,P(xm,x叶1)<£,p(X1x。
多权值神经元网络仿生模式识别方法在低训练样_省略_特定人语音识别中与HMM及DT
多权值神经元网络仿生模式识别方法在低训练样本数量非特定人语音识别中与H M M 及DTW 的比较研究覃 鸿,王守觉(中国科学院半导体研究所神经网络实验室,北京100083) 摘 要: 本文将基于多权值神经元网络的仿生模式识别方法用于连续语音有限词汇量固定词组识别的研究中,并将其识别效果与H M M 方法及DT W 方法进行了比较分析.以15个词组的词汇表做测试,通过调整这三种识别算法的参数,在它们的拒识率相同的情况下,针对参加训练的词汇,比较他们的错误识别率(某类误认为他类);针对未参加训练的词汇,比较他们的错误接受率(误认为某类).结果表明,在低训练样本数量的情况下,仿生模式识别方法能获得更好的识别效果.关键词: 仿生模式识别;多权值矢量神经元;语音识别;H M Ms ;DT W 中图分类号: T N912 文献标识码: A 文章编号: 037222112(2005)0520957204Comparison of Biomimetic Pattern Recognition ,HMM and DTW for Speaker 2Independent Speech RecognitionQI N H ong ,W ANG Shou 2jue(Lab o f Artificial Neural Networks ,Institute o f Semiconductors ,C AS ,Beijing 100083,China )Abstract : The purpose of this paper is to compare the performance of three speech recognition methods ,one based on Biomimetic Pattern Recognition (BPR )and the other tw o based on Hidden Markov M odels (H M Ms )and Dynamic T ime Warping (DT W )respectively.As a general purpose m odel of pattern Recognition ,BPR is realized by Multi 2Weights Neuron Netw orks.F or the 15w ords v ocabulary ,we analyze the false recognition rate (ratio of accepting a trained w ord to another trained w ord )and false accep 2tance rate (ratio of accepting an untrained w ord to a trained w ord )respectively.Experiment results show that when the training data was not su fficient ,the manner of BPR achieved a higher performance.K ey words : biomimetic pattern recognition ;multi 2weights neuron ;speech recognition ;hidden markov m odels ;dynamic time warping1 引言 语言是人类最自然的交流方式,因而语音识别技术用途广泛,潜力巨大.然而,由于语音信号的随机性、多变性和不稳定性,语音识别技术跟其他识别技术相比发展缓慢.近年,语音信号特征参数提取技术的研究成果(LPCC 参数、MFCC 参数等)促进了语音识别研究的快速发展,出现了动态时间规整算法[1](DT W )、隐马尔可夫模型[2](H M M )和人工神经网络[3](ANN )等识别算法,其中H M M 在语音识别领域的成功应用[4],使其成为语音识别的主要方法.H M M 方法关注的是模式的统计特性,目的是将模型分成几类,然后选择出与感知数据最接近的模型类别[5].它需要大量的训练样本才能获得满意的训练效果,这往往很难做到.实际应用中,要识别的可能是一些词汇量较少,并有可能变动的词汇集,例如餐厅的语音点菜系统,它要求新菜名的加入不影响已有词汇,并且新菜名的训练过程中训练样本容易获得,如果训练需要大量样本,这就给系统的更新带来困难.DT W 方法是一种基于模板匹配的语音识别方法,它应用动态规划方法成功解决了语音信号的参数序列在进行序列比较时时长不等的难题,并在特定人语音识别和孤立词语音识别中得到了广泛应用.仿生模式识别[6]自从被提出来以后,已用于实物目标识别、人脸确认[7]与人脸识别[8]等的研究,并在与传统模式识别的比较中,显示出其在识别效果上的优越性.本文利用仿生模式识别基本原理研究一种在低训练样本数量的情况下有限词汇量固定词组识别的新方法.2 仿生模式识别简介 传统的模式识别或模式分类,是模式识别长期发展过程中建立起来的经典方法,它从“划分”的概念出发,认为所有可用的信息都包含在训练集中,同类事物之间的关系无任何先收稿日期:2004203222;修回日期:2004212213基金项目:国家自然科学基金(N o.60135010)第5期2005年5月电 子 学 报ACT A E LECTRONICA SINICA V ol.33 N o.5M ay 2005验知识存在.其目标是如何对若干有限类样本在特征空间中进行最优分类划分,或一类样本与有限类已知样本的区分.仿生模式识别是一种不同于传统模式识别的理论方法,它从“认识”的概念出发,认为两个同类事物之间至少存在一个渐变过程,在渐变过程中间的各事物都是同属于该类的,或者说特征空间中同类样本的全体是连续的.因而其目标是如何对特征空间中的同一类样本作最佳覆盖.关于仿生模式识别的详细叙述请参考文献[6].3 基于仿生模式识别的语音识别 仿生模式识别以“同类样本的全体在特征空间中是连续的”作为样本点分布的先验知识,即:设特征空间R n中所有属于A类事物的全体为集合A,若集合A中存在任意两个元素x与y,则对ε为任意大于零的值时,必定存在集合B,使得:B={x1,x2,x3,…,x n|x1=x,x n=y,n<N,ρ(xm,x m+1)<ε,ε>0,n-1≥m≥1,m<N},B<A对应于学习过程,就是针对同类事物的训练样本在特征空间中的分布,选择一个或多个合适的封闭曲面,形成一个高维空间的连续的复杂几何形体[9]来合理覆盖训练样本.多权值矢量神经元[10]在一定的计算函数下,能形成一个高维空间的封闭曲面.一个多权值矢量神经元的通用表达式为:Y=f[Φ(W1, W2,…,W m,X)-θ],式中:W1,W2,…,W m为m个权值矢量;X是输入矢量;Φ为由多权值矢量神经元决定的计算函数(多个矢量输入,一个标量输出);θ为多权值神经元的激活阈值;f为非线性转移函数.设特征空间是n维实数空间R n,即X∈R n,矢量函数方程:Φ(W1,W2,…,W m,X)=θ(1)可视为由W1,W2,…,W m等m个权值矢量所决定的在特征空间R n中X矢量的一种轨迹,此轨迹为R n空间中的(n-1)维超曲面(或超平面),它把R n分成两个部分.如果使公式(1)是一个封闭的超曲面,则就在特征空间中形成了一个有限覆盖区域[11].改变神经元权值,将得到具有不同形状的超曲面神经元.对应于多权值神经元网络的学习过程,就是针对不同类事物的训练样本在特征空间中的分布,选择合适的多个多权值神经元,他们的并在特征空间中表示为一个连通区域,即对于某类A,则Y A=min(Y Aj)P j=1,其中P是覆盖A类全部训练样本所需的神经元的个数,通过网络训练决定,Y Aj=f[Φ(W Aj1,W Aj2,…W Ajm,X]-θAj]是这些神经元的输出.对应于识别过程,则是判断被识别样本是否落在代表某类事物的多个神经元的超曲面围成的高维有限空间的并集中.设被识别样本为X,则识别时的判别函数为:R=F[min(Y A,Y B,……].4 基于H MM的语音识别 20世纪80年代初人们开始用H M M(隐含马尔科夫模型)来描述语音信号后,该模型不断得到发展,成为目前语音识别的主流技术[12].H M M的算法是将语音看成是一连串特定状态,这种状态不能被直接观测到,而是以某种隐含的关系与语音的观测值(语音特征)相关联.这种隐含关系在H M M中通常以概率形式表现出来,模型的输出结果也以概率的形式给出.H M M由马尔科夫过程和概率输出函数集组成.马尔科夫过程由状态及状态间的转移概率组成.状态用S l(l=1,2,…N)表示,N为状态的个数.在时刻n,模型所处的状态用x n 表示,并且有:x n∈{S1~S N},Πn.状态间的转移概率由矩阵A N×N决定,其中a ij表示模型n时刻在S i状态下,则下一时刻(n+1)转移到S j状态的概率.模型在初始化时,有一个初始状态概率矢量α=[α1,α2,…,αN],其中αi表示初始时刻,系统处于S i状态的概率.对应于每一个状态都有一个相关的概率输出函数,用于估计观测值在该状态下的输出概率.N个状态的概率输出函数集构成一个N维概率分布函数矢量B,具有离散分布的概率分布函数矢量构成一个矩阵,而具有连续分布的概率密度函数矢量的每个元素为一个概率密度函数.因此,一个H M M的特性由其三个特征参数α、A、B来决定.对应于模型的训练过程,就是根据已知的训练样本集,确定模型的三个特征参数α、A、B,使得该参数下的模型产生训练样本集中的每个学习样本的概率平均值达到最大.对应于识别过程,就是已知模型的输出Y以及模型的三个特征参数α、A、B,估计模型产生Y时最可能经历的状态序列X,或称为最优状态序列搜索.5 基于DTW(Dynamic Time W arping)的语音识别 把待识别的语音模式称为测试模板T,T=T(a1,a2,…a i,…a I),把标准语音模式称为参考模板R,R=R(b1,b2,…b j,…b J),识别时,计算T与R之间的失真度.失真度可用两者之间的欧几里得距离衡量,在属于相同类别时,距离小,失真度小;在属于不同类别时,距离大,失真度就大.然而,即使是同一个人说同一句话,说话人每次发声的持续时间都会不一样,这时,I≠J,或者说时间序列模型在整个时间段内发生了非线性时间伸缩.DT W方法为了克服语速的差异,用动态规划的方法,将两个模式特征序列进行匹配,即将T和R的帧号分别在坐标系的横轴和纵轴上标出,坐标上某点D(i,j)表示T的第i帧与R的第j帧的失真度.DT W方法的目标就是要找出一条从起点(1,1)到终点(I,J)的最佳路径,使得在路径失真度总和最小,即总失真达到最小.另外,基于模板匹配的识别方法,识别的性能与特征模板的可靠性有很大关系.对于非特定人的语音识别,需要先对训练样本进行聚类[13,14].6 非特定人连续语音点菜系统的实验过程与结果611 语音特征参数的提取方法特征提取是语音识别的一个关键步骤,本文实验用859 电 子 学 报2005年MFCC(Mel倒谱系数)作为语音的特征参数.人耳对不同频率的语音具有不同的感知能力,人的听觉系统是一个特殊的非线性系统,它响应不同频率信号的灵敏度是不同的.为模拟人耳对不同频率语音的感知特性,人们提出了Mel频率的概念,MFCC即为基于Mel频率的概念而提出的,由于它反映了人耳的听觉特征,因而具有很好的性能及其鲁棒性.实际提取过程中,还需对语音信号进行预处理.对语音的高频部分进行预加重来增加语音的高频分辨率;根据语音具有短时平稳的特点,对语音进行分帧操作以提取其短时特性.在本文的实验中,语音信号采用22kH z,16位精度进行采样,原始的一个语音信号经过端点检测、预加重后,分为32帧,每帧16个MFCC参数,映射成512维特征空间的一个样本点.612 训练样本集与测试样本集词汇表由15个汉语词组组成.训练集A的发音人为来自不同地区的3名男性和3名女性,每人每个词组各发音3遍,每个词组18个样本,共270个样本用于训练.训练集B将发音人数增加到5名男性和5名女性,即每个词组30个样本,共450个样本用于训练.测试集由不是训练集发音人的其他多人的发音共697个样本构成,其中539个样本属于词汇表中的词组,构成测试集A,应能正确认识,用以测试识别系统在一定拒识率下的错误识别率;其余的158个样本为词汇表以外的词组,构成测试集B,应能正确拒识,用以测试它的错误识别率.613 实验过程及结果H M M模型采用状态数N=5的无跳转从左到右模型对每个词进行统计建模.高斯概率密度函数混合数M的多少对识别有很大的影响,混合数的个数较多,系统的性能就更好,但意味着需要训练的参数量增加,因而需要更多的训练数据.本文经实验比较,在选择M=6时系统获得最优的性能.多权值神经元网络的输入层包括512神经元,对应一个词组的512个特征值;隐层由三权值神经元构成,其神经元的数量和权值由训练过程决定;输出层包括15个神经元,每个神经元对应于一个要识别的语音.整个网络的输出矢量为O=[O1,O2,…,O15]若当前输入矢量属于第i类,O i=1,否则O i=0.若O=[O1,O2,…,O15]=0,则认为当前输入矢量不属于已训练的任何类.DT W方法的模板通过K均值算法对训练样本进行聚类获得,每个词组对应一个特征模板.本文实验中H M M模型的训练及DT W的聚类用文献[15]的算法及部分程序.对于测试表1 BPR、H M M、DTW三种方法在不同规模训练集下的识别结果识别方法训练集A(270个样本)训练集B(450个样本)测试集A测试集B测试集A测试集B 误识率拒识率误识率误识率拒识率误识率BPR(仿生模式识别)3.40%5%13.92% 1.48%5%13.29%H M M13.36%5%95.57% 2.60%5%89.24%DTW 6.68%5%93.67% 4.3%5%78.48%集A,为比较三种方法的效果,实验中调整各自的判别函数阈值,使这三种方法在拒识率相同的情况下,比较他们误识率.对于测试集B,则比较他们对未训练过的词汇的错误识别率.识别结果如表1所示.7 结果讨论与结论 H M M在本质上是一种统计的方法,因此需要大量的训练样本才能得到事物的统计特性,参加训练的样本越多,H M M 的性能越好.以上实验结果表明,在低训练样本数量的情况下,对于已训练词组的被识别样本,H M M方法的误识率较高,随着训练样本数量增加,其误识率下降.然而,事实上,大量的语音数据往往不容易获得,面临的问题更多是在低训练样本数量时,如何获得较高的识别率.DT W方法在训练样本数量较少的情况下,能获得教高的识别率,但不论是DT W方法或是H M M方法,它们对于词汇表以外的词误识率都很高.仿生模式识别方法在训练样本数量较少的情况下,就能获得很好的识别效果,而且对于未训练过的词组有较高的正确拒识率.这正是由于它是基于“认识”事物而不是基于“区分”事物为目的,它更接近于人类“认识”事物的特性,因而显示出其优越的效果.参考文献:[1] LR Rabiner,AE R osenberg,SE Levins on.C onsiderations in dynamictime warping alg orithms for discrete w ord recognition[J].IEEE T rans2actions on Acoustics,S peech and S ignal Processing,December,1978,26(6):575-582.[2] Rabiner L,Juang B.An Introduction to H idden M arkov M odels[M].1EEE Acoustics,S peech&S ignal Processing M agazine,JANUARY1986.4-16.[3] G emello R,Albesano D,M ana F,M oisa.L Multi2s ource neural netw orksfor speech recognition:a review of recent results[A].IEEE2INNS2E NNS International Joint C on ference on Neural Netw orks[C].Italy:2000.265-270.[4] Lee K F.Automatic S peech Recognition:The Development of theSPHINX SY STE M[M].K luwer Academic Publishers,Boston,1989. [5] Duda R O.模式分类(原书第2版)[M].李宏东,等,译.北京:机械工业出版社,2003.9.[6] 王守觉.仿生模式识别(拓扑模式识别)———一种模式识别新模型的理论与应用[J].电子学报,2002,30(10):1417-1420.W ANG Shou2jue.Bionic(T opological)pattern recognition—a newm odel of pattern recognition theory and its applications[J].Acta E le2clronica S inica,2002,30(10):1417-1420.[7] 王守觉,等.基于仿生模式识别的多镜头人脸身份确认系统研究[J].电子学报,2003,31(1):1-3.W ANG Shou2jue,X U jian,W ANG X ian2bao,QIN H ong.Multi2camerahuman2face pers onal identification system based on the biomimetic pat2tern recognition[J].Acta E lectronica S inica,2003,31(1):1-3. [8] 王守觉,等.基于仿生模式识别与传统模式识别的人脸识别效果比较研究[J].电子学报,2004,32(7):1057-1061.W ANG Shou2jue,QU Y an2feng,LI W ei2jun,QIN H ong.Face recogni2tion:biomimetic pattern recognition vs.traditional pattern recognition959第 5 期覃鸿:多权值神经元网络仿生模式识别方法在低训练样本数量非特定人语音识别中与H M M及DT W的比较研究[J].Acta E lectronica sinica,2004,32(7):1057-1061.[9] 模式识别中的非超球面几何形体覆盖方法[P].中国专利申请文件:申请号02124837.0[10] 多权值突触的神经元构造方法[P].中国专利申请文件:申请号02122638.5.[11] 王守觉,等.人工神经网络的多维空间几何分析及其理论[J].电子学报,2002,30(1):1-4.W ANG Shou2jue,W ANG Bai2nan.Analysis and theory of high2dimen2 sion space geometry for artificial neural netw orks[J].Acta E leclronicaS inica,2002,30(1):1-4.[12] L R Rabiner,B H Juang.Fundamental of S peech Recognition[M].En2glew ood cliffs,N J:Prentice2Hall,1993.[13] LR Rabiner,et al.S peaker2independent recognition of is olated w ordsusing clustering techniques[J].IEEE T rans.Acoustics,S peech,andS ignal Processing,1979,ASSP227(4):336-349.[14] 蔡莲红,等.现代语音技术基础与应用[M].北京:清华大学出版社,2003.243-244.[15] 何强,何英.matlab扩展编程[M].北京:清华大学出版社,2002.作者简介:覃 鸿 女,中国科学院半导体研究所神经网络实验室在职研究生,从事神经网络软、硬件研究工作.E2mail:qinh@.王守觉 男,历任中国科学院半导体研究所室主任、副所长、所长等职,1980年当选中国科学院院士.现为半导体所神经网络实验室负责人.电子学报2005年第5期 Acta Electronica Sinica No.5 2005 (总期259期) (Monthly) (Serie s No.259) 主管单位 中国科学技术协会 China Ass ociation for Science and T echnology主办单位 中国电子学会 Published by the Chinese Institute of Electronics,Beijing协办单位 南京才华科技有限公司 Nanjing Caihua T echnology C o.,Ltd.编 辑 《电子学报》编辑委员会 Edited by Editorial Board of Acta Electronica Sinica主 编 王守觉 Chief Editor:W ANG Shou2jue总编辑 刘力 Director:LI U Li通信处 北京165信箱 Add:Editorial O ffice of Acta Electronica Sinica(邮政编码100036) (POBox165,Beijing100036,China)电话 (010)68279116,68285082 T el:86210268279116,68285082传真 (010)68173796 Fax:86210268173796H ome page:http://w w ;Email:cje@;dzxu@排版印刷 北京育兴达印刷厂 Printed by Y uxingda,Beijing,China国内总发行 北京市报刊发行局 Distributed by Domestic:Beijing Baokan Faxingju,China国外总发行 中国国际图书贸易总公司 F oreign:China International Book Trading C orporation国内订购处 全国各邮电局 Subscription O ffice———All Local P ost O ffices in China国内统一刊号:C N11-2087/T N 邮发代号(国内/国外):2-891/M436 国内定价 32100 069 电 子 学 报2005年。
基于仿生模式识别的小词汇量连续型语音识别的研究
基于仿生模式识别的小词汇量连续型语音识别的研究
王守觉;沈孙园;曹文明
【期刊名称】《哈尔滨工程大学学报》
【年(卷),期】2006(027)B07
【摘要】提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新
算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小和数目来判断有多少关键词.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性.
【总页数】5页(P1-5)
【作者】王守觉;沈孙园;曹文明
【作者单位】中国科学院半导体所神经网络实验室,北京100083;浙江工业大学信
息工程学院智能信息研究所,浙江杭州310014
【正文语种】中文
【中图分类】TN912.34
【相关文献】
1.基于仿生模式识别的非特定人连续语音识别的研究
2.基于仿生模式识别的小词汇量连续型语音识别的研究
3.基于仿生模式识别的语音识别研究
4.基于动态贝叶斯
网络的大词汇量连续语音识别和音素切分研究5.结合MFCC分析和仿生模式识别的语音识别研究
因版权原因,仅展示原文概要,查看原文内容请购买。
判定一点是否属于高维复杂形体的算法及其应用
判定一点是否属于高维复杂形体的算法及其应用
杨国为;王守觉
【期刊名称】《青岛大学学报(工程技术版)》
【年(卷),期】2009(024)001
【摘要】许多模式识别问题都可以归结为判定一点是否属于高维满意覆盖体的问题,在传统的解析几何框架内判定一点是否属于高维(数百维以上)凸包络的并的问题是不适定难题.把高维凸包络的并视为同类事物特征在高维空间中形成的复杂几何形体的满意覆盖,给出了判定一点是否属于高维凸包络的并的有效算法,变通地解决了一个在传统的解析几何框架内直接计算的不适定难题.模式识别应用实验结果显示,对以6 400个样本作为正确识别集的测试样本,识别率为99.87%,表明该算法实用有效.
【总页数】8页(P1-7,24)
【作者】杨国为;王守觉
【作者单位】青岛大学自动化工程学院,山东,青岛,266071;中国科学院半导体研究所神经网络研究室,北京,100083;中国科学院半导体研究所神经网络研究室,北京,100083
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.一种基于高维空间凸面单形体体积的高光谱图像解混算法 [J], 耿修瑞;张兵;张霞;郑兰芬
2.判定一点是否落在简单多边形内 [J], 郭小华
3.改进粒子群算法在高维复杂函数寻优中的应用 [J], 国博;王社伟;陶军
4.混合粒子群算法在高维复杂函数寻优中的应用 [J], 谭皓;沈春林;李锦
5.求解高维复杂函数的两类新型蝗虫优化算法 [J], 王倩;李风军
因版权原因,仅展示原文概要,查看原文内容请购买。
模式识别作业-小论文
《模式识别》学习心得模式识别(Pattern Recognition)技术也许是最具有挑战性的一门技术了,模式识别有时又被称为分类技术,因为模式识别说到底就是对数据进行分类。
说到识别,最为常用的便是模仿人的视觉的图像识别(当然还有语音识别),也许你会想当然地认为那还不简单,觉得我们用我们的眼睛可以轻而易举地识别出各种事物,但是当你想用计算机中的程序来实现它时,于是你便会觉得很沮丧,甚至于有无从下手的感觉,至此你再也不会觉得电脑有多聪明,你会觉得电脑是多么的低能。
是的,现在的电脑智能,即人工智能还远不如蟑螂的智能,这其中最为根本的原因是模式识别技术还是处于较为低层次的发展阶段,很多的识别技术还无法突破,甚至有人还断言,再过30年也不会有本质的飞跃。
当然,世事总是让人难以预料,我们也用不着这么地悲观,科学技术总是向前发展的,没有人可以阻档得了的。
在这里,我把我对模式识别技术的学习和研究心得拿出来与大家分享一下。
模式识别具有较长的历史,在20世纪60年代以前,模式识别主要是限于统计学领域中的理论研究,还无法有较强的数学理论支持,20世纪80年代神经网络等识别技术得到了突破,计算机硬件技术更是有了长足的发展,模式识别技术便得到了较为广泛的应用,光学字符识别(OCR)是模式识别技术最早得到成功应用的技术,之后的应用还有如DNA序列分析、化学气味识别、图像理解力、人脸检测、表情识别、手势识别、语音识别、图像信息检索、数据挖掘等。
模式识别是一门与数学结合非常紧密的科学,所应用到的数学知识非常多,最基本的便是概率论和数理统计了,模式识别技术到处都充满了概率和统计的思想,我们经常所说的识别率,其实就是概率的表达:在大数据量(严格地说应当是数据量无穷大)测试中识别成功的概率,还有常用的贝叶斯决策分类器便是运用了概率公式。
模式识别还用到了线性代数,因为运用线性代数可以较为方便表达具有多特征的事物,我们一般会用向量来表达一个事物的特征,对于向量的计算是一定会用到线性代数的知识的。
一种基于仿生模式识别思想的固定音频检索方法
摘要
固定音 频检 索是 指在待 检 音 频 中检 测 和 定位 与给 定查 询 音 频 同源 的音 频 片段 ,它是 多媒
体检 索 中的基本 问题之 一. 根据 仿生模 式识别 的基本 思想 ,将查 询 段映 射为 高维 特征 空 间 中的点 ,
然 后考虑各 种 同源 情况对 其进 行扰 动 ,形成 一 个超 立 方体 覆 盖. 通 过逐 一 判 断待检 段 是 否位 于该 覆 盖 内,即可进行 检 索. 除特征 提取 外,该 方 法不 需要 对待 检 音频 进行 额 外 的预 处 理. 实验 结 果
维普资讯
自 蕊科乎.展 i 第1卷 第7 2 8 月 建 , 8 期 0 年7 0
特 征 空 间 根 据 某 类 样 本 的 分 布 形 成 一 个 覆 盖 , 从 而
8 O 9
到达 “ 识”该 类样 本 的效果 .与传 统 的模 式识 别 认
果 ,即可供 以后 反复 使用 .但 是 在某 些 场合 ,例 如 广告 检索 、网络新 内容监 察 等 ,每 次 检索 的 待检 音
频都 不尽 相同 ,这 时 每次 都需 要 进行 预 处理 ,这 部 分 时间将成 为快速 检索 的瓶颈. 本文借 用仿生模 式 识别 的基本 思想 来 尝 试解 决 这一 问题.从 固定 音频 检 索 的定 义可 以看 到 ,它侧 重 于在待检 音频 中去 “ 知 ”查 询段 ,而 不 是简 单 认
方 法 相 比 ,仿 生 模 式 识 别 不 再 强 调 对 模 式 进 行 “ 划
图 1给 出 了这 种 覆 盖 的 示 意 图 , 由 于 高 维 空 间 可 视 化 的 困 难 ,图 中仅 给 出 了部 分 维 的 数 值 .
分” ,而强调 对 已 知 模 式 进 行 “ 盖 ” 具 体 实 现 覆 . 时 ,仿 生模式识 别用封 闭 的 曲面 函数代 替 了人 工神 经 网络的分类 函数. 抛开 其具 体算 法 ,可 以看 到仿
物理过程的模式识别
物理过程的模式识别
殷显安
【期刊名称】《电子技术参考》
【年(卷),期】1989(000)004
【总页数】6页(P29-34)
【作者】殷显安
【作者单位】无
【正文语种】中文
【中图分类】O235
【相关文献】
1.从深坑打夯机物理过程的分析探析凸现多方物理过程隐含条件的解析方法 [J], 高翔;杨远萍
2.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用 [J], 王守觉
3.关注物理过程瞬间洞察物理过程本质 [J], 许忠艳;陈晓斌;杨小伟
4.“以人为本”:新一代生物识别核心理念--专访国际模式识别学会第一副主席、模式识别国家重点实验室主任谭铁牛研究员 [J], 诚凌
5.祁连山夏季地形云结构和云微物理过程的模拟研究(II):云微物理过程和地形影响[J], 刘卫国;刘奇俊
因版权原因,仅展示原文概要,查看原文内容请购买。
关于仿生模式识别技术研究与应用进展探究
关于仿生模式识别技术研究与应用进展探究模式识别经过多年的发展,已形成了一系列经典的理论和方法。
传统模式识别的目的是将对象( 样本) 进行分类,因此也被称作模式分类,传统模式识别认为所有可用的信息都包含在训练样本集中,考虑的出发点是特征空间中若干类别样本的最佳分类划分,代表性方法有Fisher 判别分析、支撑向量机( SVM)等。
这些方法解决了很多问题,并在多个领域得到了成功应用,为科学发展和社会进步做出了巨大贡献,但这些传统方法也存在一些固有的缺陷:1) 对事物进行学习时通常至少需要两类才可进行区分,例如在人脸检测中,学习的任务仅是人脸这一个类别,但在训练分类器时,分类器需要学习人脸和非人脸两种类型;2) 已训练好的分类器类别之间的最优分类边界是确定的,若要增加学习新类,则需要重新训练分类器,这将会打乱现有知识( 最优分类边界改变) ;3) 未经训练类别的样本很容易被误认为是已训练的某一类,分类器不能有效对其进行正确拒识,这是由于分类边界只是将一个无限特征空间划分为多个无限空间。
中国科学院半导体研究所王守觉院士通过分析人类认识事物的特点,提出了一种全新思想的模式识别方法仿生模式识别( biomimetic pattern recognition,BPR)。
仿生模式识别认为,事物具有同源连续性规律,即同类事物的两个不同样本之间,至少有一个渐变过程,在这个渐变过程中的所有样本仍属于该类; 也可以这样认为: 同类样本在特征空间中是连续分布的,任意两个样本点之间具有某种连续变化的关系。
同源连续性规律是现实中人类直观认识世界的普遍存在的规律,同时也是仿生模式识别方法用于提高对事物的识别能力的先验知识。
引入同源连续性规律后,研究仿生模式识别如何对某类事物进行学习,就是研究在高维特征空间中如何对该类样本进行最优连续覆盖( 即对一类样本的识它不同于传统模式识别方法侧重于别,即如何在高维特征空间中对不同类样本进行最优划分。
基于仿生模式识别的DOA估计方法
基于仿生模式识别的DOA估计方法
安冬;王守觉
【期刊名称】《电子与信息学报》
【年(卷),期】2004(026)009
【摘要】该文就仿生模式识别(拓扑模式识别)在非感性抽象对象的信息处理方面的应用作了一些探索,提出了一种基于仿生模式识别的DOA估计方法.这种方法的建模过程是用在实际环境下采集的训练样本构造人工神经网络模型,对环境的适应能力较强,且这种方法的计算量较小,可以实现系统实时处理.实验结果表明:在信噪比为20 dB和0 dB时,该方法的正确估计率可达100%;在信噪比降为-20 dB时,该方法仍有83%的可识别率.
【总页数】6页(P1468-1473)
【作者】安冬;王守觉
【作者单位】中国科学院半导体研究所神经网络实验室,北京,100083;中国科学院半导体研究所神经网络实验室,北京,100083
【正文语种】中文
【中图分类】TP391.4;TN911.23
【相关文献】
1.基于TDOA/FDOA不相关估计的选择融合定位方法 [J], 朱伟强;束锋;陆锦辉;马琴;黄培康
2.基于仿生模式识别和PCA/ICA的DOA估计方法 [J], 安冬;王守觉
3.小样本下基于改进的直接数据域方法的DOA估计方法 [J], 解虎;党红杏;谭小敏;冯大政
4.一种基于混合RJMCMC方法的宽带信号DOA估计方法 [J], 金美娜;赵拥军;盖江伟
5.基于TDOA方法的无线传感器网络运动参数估计方法 [J], 徐城旭; 吴晓平; 王国英; 朱雪芬
因版权原因,仅展示原文概要,查看原文内容请购买。
地震数据处理的一种模式识别计算方法
地震数据处理的一种模式识别计算方法
刘心
【期刊名称】《牡丹江师范学院学报(自然科学版)》
【年(卷),期】2005(000)004
【摘要】在地震中建筑物受到破坏,对其破坏程度要进行分类.在处理受地震破
坏的数据中,如,有Xa={a1,a2,…,an}个样本,对它们震害的描述往往是由
现场调查者凭经验进行的,一般分为“基本完好”、“轻微破坏”、“严重破坏”、“坍塌”四类.这种分类粗糙、模糊,不可避免地受到主观性的影响.由于调查者水平不一,对破坏程度的描述确切程度也不一样.
【总页数】2页(P14-15)
【作者】刘心
【作者单位】东北财经大学数量经济系,辽宁,大连,116025
【正文语种】中文
【中图分类】P5;TP3
【相关文献】
1.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用 [J], 王守
觉
2.一种分布式并行文件系统的介绍及在海洋地震数据处理中的应用 [J], 郑如秋;梁庭玮
3.地震短临预报的一种模糊模式识别方法 [J], 李闽峰;马宗晋
4.疲劳寿命数据处理中威布尔分布三参数的一种计算方法 [J], 叶冠吾
5.一种新的核爆地震模式识别方法──信息压缩式Hopfield神经网络 [J], 邹红星;李川;赵克
因版权原因,仅展示原文概要,查看原文内容请购买。
基于视觉仿生的图像目标分类算法
基于视觉仿生的图像目标分类算法
柳培忠;王守觉
【期刊名称】《计算机工程与设计》
【年(卷),期】2014(35)5
【摘要】总结了当前图像目标识别算法的现状;从生物医学角度出发,分析了人类对图像信息的获取原理,提出一种基于仿生思维的图像亮度自适应调整算法;从人的视觉系统机制出发,实现一种从各种复杂的图像背景中分辨出同类目标的视觉仿生分类算法.实验结果表明,对于针对各种复杂的、具有多目标的图像,与其它目标分类算法比较,视觉仿生算法的分类效果更好.
【总页数】5页(P1722-1726)
【作者】柳培忠;王守觉
【作者单位】华侨大学工学院,福建泉州362000;中国科学院苏州纳米技术与纳米仿生研究所,江苏苏州215123
【正文语种】中文
【中图分类】TP391.4
【相关文献】
1.基于小波分析和绩效学习机图像分类算法的机器人导航视觉系统设计 [J], 康丽军;高茜;;
2.基于生物视觉特征的SVM目标分类算法 [J], 李钊;李建军;李智生;杨亚威
3.基于小波分析和绩效学习机图像分类算法的机器人导航视觉系统设计 [J], 康丽军;高茜
4.基于Hadoop的视觉词袋模型图像分类算法 [J], 侯春萍;张倩楠;王宝亮;常鹏;孙韶伟
5.基于仿生视觉机制的红外与可见光图像融合 [J], 陈松;王西泉;陈俊彪
因版权原因,仅展示原文概要,查看原文内容请购买。
仿生关节链球坐标系的建立及应用
仿生关节链球坐标系的建立及应用王守觉;张众维;肖泉【期刊名称】《计算机辅助设计与图形学学报》【年(卷),期】2014(26)2【摘要】为了直观准确地记录和计算空间骨架结构的状态,提出一种仿生关节链球坐标系.对于待求活动关节,在已知与其相连的前两节节棍位置状态的前提下,利用当前节棍的长度值和链球坐标系下的2个角度值来精确计算关节新位置的三维笛卡儿坐标值.最后结合高维仿生信息学理论的应用,证明了采用该坐标系对骨架结构进行的刻画可以逼真地反映状态上细微的、连续的变化,无冗余信息,比传统方法参数少、速度快、应用范围广,可生成丰富的姿态,有利于艺术创作.【总页数】7页(P191-197)【作者】王守觉;张众维;肖泉【作者单位】中国科学院苏州纳米技术与纳米仿生研究所高维仿生信息学及其应用实验室苏州215123;中国科学院半导体研究所神经网络实验室北京 100083;中国科学院半导体研究所神经网络实验室北京 100083;天津城建大学计算机与信息工程学院天津300384;中国科学院苏州纳米技术与纳米仿生研究所高维仿生信息学及其应用实验室苏州215123【正文语种】中文【中图分类】TP391【相关文献】1.高中课标课程选修4-4《坐标系与参数方程》教学参考(三) 空间斜坐标系的建立和应用 [J],2.多重PCR检测奶牛乳腺炎金黄色葡萄球菌、无乳链球菌、停乳链球菌和酵母菌方法的建立与应用 [J], 马保臣;秦卓明;蔡玉梅;董玉兰;柴同杰3.猪链球菌种与9型猪链球菌二重PCR检测方法的建立及应用 [J], 闫若潜;吴志明;张志凌;刘梅芬;赵明军;拜廷阳4.基于仿生关节链球坐标系的虚拟手势生成 [J], 张众维;赵洁;刘洪飞5.关于车身坐标系建立以释放场地的应用研究 [J], 师健弘因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Bionic (Topological)Pattern Recognition ——— A New Model of Pattern Recognition Theory and Its Applications
1 41 8
电 子 学 报
2002 年
的是改变了 所用的术语 .特别 地 , 感 知器被 改称为 神经网 络 . 然后这些研 究被称作是与 生理学家 共同进 行的 , 对学 习问题 的研究减少了一般性 , 增加了主观色彩 .在 60 和 70 年代学习 问题研究的主要目标是寻找从小数量样本出发进行归纳推理 的最好途径 , 而到了 80 年 代 , 目 标变成 了构 造利 用大脑 来推 广的模型 .(原文注 :当然研究人是如何学习的是很有意 义的 , 但是这并不 一定是建立人 工学习机 器的最 佳途径 , 正 如人们 对鸟类如何 飞行 的研 究实 际上 对建 造飞 机没 有多 少帮 助一 样).”
本文对 Vapnik 这段 话并 非有 所评 议 , 只 想说 明 , 本 文题 目用“ 仿生模式识别” 中的“ 仿生” 二字 , 并非 Vapnik 所 批评的 “ 目标变成了构造利用大 脑来推 广的模 型” , 而 只是为 了从功 能上更接近 于人类对事物 的识别过 程 , 而从数 学模型 上加入 了实际“ 被识别对象” 的某些 普遍存 在的“ 特殊 性” .这 个所谓 “ 特殊性”是 针对目前传统的 模式识 别数学描 述方法 的“ 一般 性与通用性” 而言的 , 它在实际的模式识别问题中却仍然具有 一般性与通用性 .
200第2 年10
期 10 月
电 子 学 报 ACTA ELECTRONICA SINICA
Vo l O
.30 No.10 ct . 2002
仿生模式识别(拓扑模式识别)———一种模式识别 新模型的理论与应用
王守觉
(中国科学院半导体研究所神经网络实验室 , 北京 100083) 摘 要 : 本文提出了一种模式识别理论的新 模型 , 它是 基于“ 认识” 事物而不 是基于“ 区分” 事物为目 的 .与 传统 以“ 最佳划分” 为目标的统计模式识别相比 , 它更接 近于人类“ 认识” 事物的特 性 , 故 称为“ 仿生模式识 别” .它的数 学方 法在于研究特征空间中样本集合的拓扑性质 , 故亦 称作“ 拓扑模式识别” .“ 拓扑模式识别” 的理论基点在于它确认 了特 征空间中同类样本的连续性(不能分裂成两个彼此 不邻接的部分)特性 .文中用“ 仿生模式识别” 理论及其“高维空 间复 杂几何形体覆盖神经网 络” 识别 方法 , 对 地平面刚体目标全方 位识别问题作了实 验 .对各种 形状相像的动物及 车辆模 型作全方位 8800 次识别 , 结果正确识别率为 99.75%, 错误识别率与 拒识率分别为 0 与 0.25 %.
1 引言
模式识别的发 展已 有几 十年的 历史 .早 在 20 世 纪 30 年 代 , Fisher 提出的判别分析就是利用已知的两类向量的概率分 布函数来设 计将两类向 量分开的 决策规 则的问 题[ 1] .随 即在 统计模式识 别发展以后 , 模式识 别就被 认为是 用来选 择使平 均风险达到 最小的模式 类别 .因而 , 划分类 别问题 , 与统 计判 决理论完全相同[ 2] .
4 仿生模式识别的 基点 ———特征空 间中同类样本 全体的连续性规律
人们在对事物的识别过程中 , 存在两种不同的归类过程 . 一种是“ 同源”的归类过程 , 例如同为简体汉字的手写体识别 . 另一种是不同源的按 逻辑知 识归类过 程 , 例如手 写体中 简体 汉字与繁体汉字的归 并 .对 学过简 体汉字 而未学 过繁体 汉字 的人 , 对于简体汉字的印刷体 、手写楷书和 行书等往往都能认 识 , 而对于繁体汉字却不认识 .因为繁体汉 字与简体汉字并不 源于同一个字形 , 而是被人为地定义为同一个字的 , 靠事先学 习的逻辑知识把二类归 并成一类 .我 们把“ 同源” 的称为 同一 类 , 而在识别以后再按逻辑 归类知 识把需 要归在 一起的 类别 合并 .因而以下所称同类样本指的都是“ 同源” 的一类样本 .以 下讨论“ 同源”同类样本的连续性 规律 ;
本文的 基本出 发点 就在 于把 模式 识别 问题 看成 模 式的 “ 认识” , 而不是分类划 分 , 不是模式 分类 ;是一 类一类样 本的 “ 认识” , 而不是多类样 本的划 分 .因 而 , 其基本 数学模型 当然 会与传统模式识别的“最优分类” 界面的概念大不相同 .
2 人类的识别功能与传统模式识别方法的差异
近年受到人 们 关注 的支 持 向量 机(SVM)的最 早 提出 者 Vapnik 在 1974 年提出 了“ 最 优分 类超 平面” 的概 念[ 3] 并 在此 基础上后来发展构造成了支持向量机(SVM)[ 4] .综上所述 , 数 十年来人们 在研究模式识 别问题中 , 考 虑的出 发点都 是在若 干类别的最 佳分类划分上 .其根 本原因 或许在 于用这 样的数 学描述与处 理方法最具 有一般性 、通 用性 .但众所 周知 , 即使 基于目前最 先进的模式识 别理论基 础上的 识别机 , 其 实际效
WANG Shou-jue
(Lab of Artificial Neural Networks , Institute of Semiconductors , CAS , Beijing 100083, China) Abstract : A new model of pattern recognition principles, witch is based on “matter cognition”instead of “matter classification” in traditional statistical pattern recognition, has been proposed.This new model is better closer to the function of human being , rather than traditional statistical pattern recognition using“optimal seperating”as its main principle .So the new model of pattern recognition is called the Bionic Pattern Recognition.Its mathematical basis are topological analysis of sample set in the high dimensional feature space , therefore it is also called the Topological Pattern Recognition .The basic idea of this model is based on the fact of the continuity in the feature space of any one of the certain kinds of samples.We did experiments on recognition of omnidirectionally oriented rigid objects on the same level, with the Bionic Pattern Recognition using neural networks, which acts by the method of covering the high dimensional geometrical distribution of the sample set in the feature space .M any animal and vehicle models(even with rather similar shapes)were recognized omnidirectionally thousands of times.For total 8800 tests, the correct recognition rate is 99.75 %, the error rate and the rejection rate are 0 and 0.25 respectively . Key words: pattern recognition;neural networks;bionics;high dimensional geometry
上看 , 还 没 有“ 仿 生” 的含 意 .下 面 把 仿 生
模式 识别 与传 统模 式
识别 的比 较与 差异 以
图表 方 式 表 示 在 图 1
图1
中.
3 从基本数学 模型看仿生模式识别与传统模式识 别的本质差别
传统模式识 别其基本数 学模型的 基点在于如 文献[ 5] 中 第 12 页所述的 :《 所有可用 的信息 都包 含在训 练集(1 -1)式 中的情况下》(注 :原 文(1 -1)式 即训 练 集坐 标(x 1 , y1), … , (x1 , y 1))这就是说在同类样本点相互之间没 有任何关系 的先 验知识存在 , 因此 , 一切都只能从特征空间 中不同类样本的划 分出发了 .然而在自然界实际规律中并非如此 ;本文所提出的 仿生模式识别就在于引 入了同类样本间存在的某些普遍的规 律性而建立起来的“ 多维空间中非超球复杂几何形体覆盖” 的 识别原理 .下节将重点讨论同类样本间普遍存在的规律性(亦 即普遍存在的先验知识)
不认识这种东西” .这正是人类认识事物与传统模式识别的差 别 .人类侧重于“认识” , 只有在 细小 之处才 重视“ 区 别”(例如
要区分狼与 狗或马与驴等等), 而传 统模式识 别则只 注意“ 区