仿生模式识别_拓扑模式识别_一种模式识别新模型的理论与应用
北京理工大学文献检索大作业
文献检索大作业班级:******* 姓名:***** 学号:**********检索课题:模式识别技术的应用一.技术背景模式识别(Pattern Recognition)的研究涉及信息学、计算机科学、模式识别与统计学、心理学、计算机科学、控制论、数字信号处理、图像处理等多种学科,具有广阔的应用前景,是通过计算机用数学技术方法来研究模式的自动处理和判读。
我们把环境与客体统称为“模式”。
随着计算机技术的发展,人类有可能研究复杂的信息处理过程。
信息处理过程的一个重要形式是生命体对环境及客体的识别。
对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。
这是模式识别的两个重要方面。
市场上可见到的代表性产品有光学字符识别、语音识别系统。
模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。
随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。
(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
二.中外文检索词主题词:模式识别(Pattern Recognition)关键词:模式识别(Pattern Recognition)、技术(Technology)同义词:Pattern Recognition同义扩展:模式:特征,表象识别:认知,了解全称与简称:模式识别技术(Pattern Recognition,PR)下位词扩展:无监督模式识别,分类器,文字识别,语音识别,指纹识别等上位词扩展:识别等三、检索1.检索图书1.1检索途径:使用CALIS公共书目查询系统进行检索;1.2检索式:题名=*模式识别技术*,检中文献数:25,无需调整检索策略.1.3结果:[1]李介谷,蔡国廉.计算机模式识别技术[M].上海:上海交通大学出社,1986.[2]余正涛,郭剑毅,毛存礼.模式识别原理及应用[M].北京:科学出版社,2014.1.4获得途径:文献[1]可以从北京大学图书馆、北京航空航天大学图书馆、复旦大学图书馆等通过馆际互借获得。
第四章模式识别
知觉
现代认知心理学认为,知觉是确定人 们所感受的刺激物的意义的过程。或者 说,知觉是解释刺激信息,从而产生模 式和意义的过程。
知识经验在知觉中的作用
因素恢复实验 (Warren 1970 ) 已有知识对句子知觉的作用
(Miller&Isard ,1963) 视知觉研究的证据 (Biederman,1972)
Marr 的计算理论 (computational theory)
初级素描 (primal sketch):这一表征对视 觉输入的主要光强变化进行二维描述,包括 关于边缘、轮廓和墨块的信息。
2 1/2 -D 素描 (2 1/2 -D sketch):这一 表征通过利用由阴影 (shading)、纹理 (texture)、运动 (motion)、双眼视差 (binocular disparity) 等提供的信息,对 可视表面深度和方位进行描述,此表征依赖 于观察点。
第四章模式识别
第一节 知觉理论概述
一、知觉概述
关于知觉的传统观点
知觉是在刺激作用下即刻产生的,而且似乎是 自动的
常人意识不到知觉的过程 某些空间特性的知觉受先天制约,不依赖于过
去的经验或者学习 某些几何错觉甚至不依赖于人掌握的有关概念
传统的观点认为,知觉是一种 消极被动的接受刺激的过程;
(二)、特征分析说
1.基本思想
特征分析说试图将模式分析为组成它们的各种 特征(feature),模式识别时需要对刺激的特征进 行分析,将之与长时记忆中的各种刺激特征进行 比较,一旦获得最佳的匹配,外部刺激就得以识 别。
2. “泛魔堂”模型(“魔城”模型)
通过特征分析识别一个字母R
3.特征分析的生理学依据
第二节 模式识别及其 理论模型
基于流形判别分析的半监督支持向量机
基于流形判别分析的半监督支持向量机郝勇智【摘要】半监督分类研究的主要内容是,如何有效地利用大量的无类别标签的数据对分类问题所具有的有用信息.该文提出了一种基于流形判别分析的半监督支持向量机(Semi-Supervised Support Vector Machine Based on Manifold-based Discriminant Analysis,简称MDASSVM).通过定义基于流形的类内离散度和类间离散度,充分利用流形判别分析的性质,进一步改进半监督支持向量机,在分类决策时同时考虑样本的边界信息、分布特征以及局部流形结构,该方法不仅继承了传统降维方法的优势,而且进一步提高降维效率.人造数据集和UCI中的部分实际数据集上的实验结果表明,与现有算法相比,数据集通过该算法降维后,能使半监督支持向量机有更高的分类精度.【期刊名称】《山西电子技术》【年(卷),期】2015(000)006【总页数】4页(P3-5,19)【关键词】流形判别分析;半监学习;支持向量机;分类;降维【作者】郝勇智【作者单位】中北大学计算机与控制工程学院,山西太原030051【正文语种】中文【中图分类】TP391.4传统机器学习问题分为两类:无监督学习和监督学习。
无监督学习仅仅利用为无标签样本集,而监督学习则需要大量有标签的样本集,但在很多实际应用中,获取少量的已标记数据通常需要较大的代价,但获取未标记数据的代价要小很多。
这就使得同时利用已标记样本集和未标记样本集的半监督学习方法快速发展起来。
支持向量机(SVM)是20 世纪90 年代由V.Vapnik 首先提出,它建立在统计学习理论的VC 维理论和结构风险最小化原理基础上的新型机器学习算法。
标准支持向量机具有良好的推广能力,已经被应用到很多场景中并发挥着重要作用。
标准支持向量机算法都属于监督学习的算法,倘若可以将半监督学习的思想很好地引入到标准支持向量机中,就能解决标准支持向量机依赖大量已标记样本的问题,进而改进监督分类方法[1]的性能,训练得到分类性能更好的分类器,从而获得更好的分类效果。
模式识别(PatternRecognition)
近年来模式识别在化学、生物、医学、 近年来模式识别在化学、生物、医学、 食品、环境科学、 食品、环境科学、电子等学科中得到了 迅速发展及广泛应用,特别是聚类分析, 迅速发展及广泛应用,特别是聚类分析, 它可以解决样品的分类、 它可以解决样品的分类、方法的选择及 分析过程优化等问题, 分析过程优化等问题,因而越来越受到 人们的重视,并渗透到分析化学领域中。 人们的重视,并渗透到分析化学领域中。
经过许多国际组织多年的研究和讨论 , 经过许多国际组织多年的研究和讨论, 1993年终于制定了 《 测量不确定度表示 年终于制定了《 年终于制定了 指南》 指南》 (Guide to the Expression of Uncertainty in Measurement) 得到了包括 ) 得到了包括IUPAC在 在 内的七个国际组织的批准, 内的七个国际组织的批准 , 并由国际标 准化组织( 准化组织(ISO)出版。 )出版。 目前 目前GUM的执行已得到了包括中国在内 的执行已得到了包括中国在内 的许多国家政府机构的批准。 的许多国家政府机构的批准。
化学模式识别是根据化学测量矩阵,自 化学模式识别是根据化学测量矩阵, 动将样本集按样本的某种性质( 动将样本集按样本的某种性质(通常是 隐含的)进行分类及特征选取的方法, 隐含的)进行分类及特征选取的方法, 化学模式识别从化学测量数据出发, 化学模式识别从化学测量数据出发,进 一步揭示样本的隐含性质, 一步揭示样本的隐含性质,提供十分有 用的决策性信息。 用的决策性信息。
对于系统误差来说,可以运用消除误差源、改变测量方 对于系统误差来说,可以运用消除误差源、 寻求修正值等方法来使其减小。在分析化学中, 法、寻求修正值等方法来使其减小。在分析化学中,常 用以下一些方法来进行: 用以下一些方法来进行: 1.空白试验 空白试验 空白试验就是用纯试剂、纯样品来对照,或者用不含对 空白试验就是用纯试剂、纯样品来对照, 象的样品来对照,最终用测得值扣去空白值。 象的样品来对照,最终用测得值扣去空白值。. 2.对照试验 对照试验 凡由方法引起的误差,都应该用标准方法或公认的准确 凡由方法引起的误差, 的方法来进行对照试验。 的方法来进行对照试验。 3.回收试验 回收试验 试验中样品的损失是取样和处理样品的难题。通常是在 试验中样品的损失是取样和处理样品的难题。 被测样品中加入已知量的被测组分,然后看其能否定量 被测样品中加入已知量的被测组分, 回收。 回收。
统计模式识别的原理与方法
统计模式识别的原理与⽅法1统计模式识别的原理与⽅法简介 1.1 模式识别 什么是模式和模式识别?⼴义地说,存在于时间和空间中可观察的事物,如果可以区别它们是否相同或相似,都可以称之为模式;狭义地说,模式是通过对具体的个别事物进⾏观测所得到的具有时间和空间分布的信息;把模式所属的类别或同⼀类中模式的总体称为模式类(或简称为类)]。
⽽“模式识别”则是在某些⼀定量度或观测基础上把待识模式划分到各⾃的模式类中去。
模式识别的研究主要集中在两⽅⾯,即研究⽣物体(包括⼈)是如何感知对象的,以及在给定的任务下,如何⽤计算机实现模式识别的理论和⽅法。
前者是⽣理学家、⼼理学家、⽣物学家、神经⽣理学家的研究内容,属于认知科学的范畴;后者通过数学家、信息学专家和计算机科学⼯作者近⼏⼗年来的努⼒,已经取得了系统的研究成果。
⼀个计算机模式识别系统基本上是由三个相互关联⽽⼜有明显区别的过程组成的,即数据⽣成、模式分析和模式分类。
数据⽣成是将输⼊模式的原始信息转换为向量,成为计算机易于处理的形式。
模式分析是对数据进⾏加⼯,包括特征选择、特征提取、数据维数压缩和决定可能存在的类别等。
模式分类则是利⽤模式分析所获得的信息,对计算机进⾏训练,从⽽制定判别标准,以期对待识模式进⾏分类。
有两种基本的模式识别⽅法,即统计模式识别⽅法和结构(句法)模式识别⽅法。
统计模式识别是对模式的统计分类⽅法,即结合统计概率论的贝叶斯决策系统进⾏模式识别的技术,⼜称为决策理论识别⽅法。
利⽤模式与⼦模式分层结构的树状信息所完成的模式识别⼯作,就是结构模式识别或句法模式识别。
模式识别已经在天⽓预报、卫星航空图⽚解释、⼯业产品检测、字符识别、语⾳识别、指纹识别、医学图像分析等许多⽅⾯得到了成功的应⽤。
所有这些应⽤都是和问题的性质密不可分的,⾄今还没有发展成统⼀的有效的可应⽤于所有的模式识别的理论。
1.2 统计模式识别 统计模式识别的基本原理是:有相似性的样本在模式空间中互相接近,并形成“集团”,即“物以类聚”。
模式识别
模式识别模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种定义1:借助计算机,就人类对外部世界某一特定环境中的客体、过程和现象的识别功能(包括视觉、听觉、触觉、判断等)进行自动模拟的科学技术。
所属学科:测绘学(一级学科);摄影测量与遥感学(二级学科)定义2:一类与计算机技术结合使用数据分类及空间结构识别方法的统称。
所属学科:地理学(一级学科);数量地理学(二级学科)定义3:昆虫将目标作为一幅完整图像来记忆和识别。
所属学科:昆虫学(一级学科);昆虫生理与生化(二级学科)定义4:主要指膜式识别受体对病原体相关分子模式的识别。
所属学科:免疫学(一级学科);概论(二级学科);免疫学相关名词(三级学科)模式识别研究内容:模式还可分成抽象的和具体的两种形式。
前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。
我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。
模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。
前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。
人工神经网络分类器
通信工程学院题目人工神经网络分类器专业:自动化学号:52110608学生姓名:张继伟指导教师姓名:刘富日期:年月日人工神经网络分类摘要:80 年代重新兴起的人工神经网络已成为世界人工智能研究的热门课题之一。
本文介绍了人工神经网络的一般结构及其算法, 介绍人工神经网络在模式识别方面的作用及用作模式识别的人工神经网络分类器。
人工神经网络简介:人们对人工神经网络( A rt ifi ci al N e ur al N et 简作人N N , 也称神经网络) 的研究可追溯到40 年前。
初期人们致力于建立较为详细的、仿生的( 模仿人的神经元) 神经网络的数学模型。
50 年代至60 年代有人便试图建立结构上类于人脑的计算机。
但由于当时集成电路、计算机及人工智能等方面技术的限制使得这种尝试未获成功, ’而且使这方面的工作几乎停顿了近20 年. 直到80 年代, 超大规格集成电路、人工智能、计算机技术及拓扑学算法的发展使得人工神经网络重新兴起并很快地蓬勃发展成了当今世界的一大热门课题. 尤其是人们希望人工神经网络能在语音和图象识别(s , ” c h a n d im a se eR co gn it on ) 方面达到完成人类的功能。
使得人工神经网络在这方面有了不少应用成果。
1 98 7 年6 月在美国圣地亚哥召开的第一届国际神经网络年会( I c N N , nI entr iat o o al oC n fe r en ce on Ne ur ia N et w or k ) 重新揭开了人类向神经网络大规模进军的战幕, 据有关人士预料, 今后新一代计算机将是以神经网络为基础的, 具有高度并行处理能力, 具有自适应能力的新一代的计算机。
从当前研究的热点看主要有下列几个方面: 一是各种神经网络模型的研究, 包括生物物理模型, 数学模型等。
二是在数字机上进行模拟以探讨各类模型的特点、性能等。
三是各种训练、学习规则的研究。
《人工智能》考试复习资料
中南大学人工智能习题:1—1、什么是人工智能?试从学科和能力两方面加以说明。
从学科方面定义:人工智能是计算机科学中涉及研究、涉及应用智能机器的一个分支。
它的近期主要目标在于研究用机器来模范和执行人脑的某些智力功能,并开发相关理论和技术。
从能力方面定义:人工智能是智能机器所执行的通常与人类智能有关的智能行为,如判断、推理、证明、识别、感知、理解、通信、设计、思考、规划、学习和问题求解等思维活动。
1-2、在人工智能的发展过程中,有哪些思想和思潮起了重要作用?1、数理逻辑和关于计算本质的新思想2、1956年第一次人工智能研讨会召开3、控制论思想的影响4、计算机的发明发展5、专家系统和知识工程6、机器学习、计算智能、人工神经网络和行为主义研究1—3、为什么能够用机器(计算机)模仿人的智能?物理符号系统的假设:任何一个系统,如果它能够表现出智能,那么它就必定能执行输入符号、输出符号、存储符号、复制符号、建立符号结构、条件性迁移6种功能。
反之,任何系统如果具有这6种功能,那么它就能够表现出智能(人类所具有的智能)。
物理符号系统的假设伴随有3个推论:推论一: 既然人具有智能,那么他(她)就一定是个物理符号系统。
推论二: 既然计算机是一个物理符号系统,它就一定能够表现出智能。
推论三:既然人是一个物理符号系统,计算机也是一个物理符号系统,那么我们就能够用计算机来模拟人的活动。
1—4、人工智能的主要研究和应用领域是什么?其中,哪些是新的研究热点?研究和应用领域:问题求解(下棋程序),逻辑推理与定理证明(四色定理证明),自然语言理解,自动程序设计,专家系统,机器学习,神经网络,机器人学(星际探索机器人),模式识别(手写识别,汽车牌照识别,指纹识别),机器视觉(机器装配,卫星图像处理),智能控制,智能检索,智能调度与指挥(汽车运输高度,列车编组指挥),系统与语言工具。
新的研究热点:概率图模型(隐马尔可夫模型、贝叶斯网络)、统计学习理论(SLT)&支持向量机(SVM)、数据挖掘与知识发现(超市市场商品数据分析),人工生命1—5、人工智能有哪几种学派?1)符号主义(Symbolicism),又称为逻辑主义(Logicism)、心理学派(Psychlogism)或计算机学派(Computerism),其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。
模式识别作业-小论文
《模式识别》学习心得模式识别(Pattern Recognition)技术也许是最具有挑战性的一门技术了,模式识别有时又被称为分类技术,因为模式识别说到底就是对数据进行分类。
说到识别,最为常用的便是模仿人的视觉的图像识别(当然还有语音识别),也许你会想当然地认为那还不简单,觉得我们用我们的眼睛可以轻而易举地识别出各种事物,但是当你想用计算机中的程序来实现它时,于是你便会觉得很沮丧,甚至于有无从下手的感觉,至此你再也不会觉得电脑有多聪明,你会觉得电脑是多么的低能。
是的,现在的电脑智能,即人工智能还远不如蟑螂的智能,这其中最为根本的原因是模式识别技术还是处于较为低层次的发展阶段,很多的识别技术还无法突破,甚至有人还断言,再过30年也不会有本质的飞跃。
当然,世事总是让人难以预料,我们也用不着这么地悲观,科学技术总是向前发展的,没有人可以阻档得了的。
在这里,我把我对模式识别技术的学习和研究心得拿出来与大家分享一下。
模式识别具有较长的历史,在20世纪60年代以前,模式识别主要是限于统计学领域中的理论研究,还无法有较强的数学理论支持,20世纪80年代神经网络等识别技术得到了突破,计算机硬件技术更是有了长足的发展,模式识别技术便得到了较为广泛的应用,光学字符识别(OCR)是模式识别技术最早得到成功应用的技术,之后的应用还有如DNA序列分析、化学气味识别、图像理解力、人脸检测、表情识别、手势识别、语音识别、图像信息检索、数据挖掘等。
模式识别是一门与数学结合非常紧密的科学,所应用到的数学知识非常多,最基本的便是概率论和数理统计了,模式识别技术到处都充满了概率和统计的思想,我们经常所说的识别率,其实就是概率的表达:在大数据量(严格地说应当是数据量无穷大)测试中识别成功的概率,还有常用的贝叶斯决策分类器便是运用了概率公式。
模式识别还用到了线性代数,因为运用线性代数可以较为方便表达具有多特征的事物,我们一般会用向量来表达一个事物的特征,对于向量的计算是一定会用到线性代数的知识的。
模式识别及其在图像处理中的应用
模式识别及其在图像处理中的应用摘要:随着计算机和人工智能技术的发展,模式识别在图像处理中的应用日益广泛。
综述了模式识别在图像处理中特征提取、主要的识别方法(统计决策法、句法识别、模糊识别、神经网络)及其存在的问题,并且对近年来模式识别的新进展一一支持向量机与仿生模式识别做了分析和总结,最后讨论了模式识别亟待解决的问题并对其发展进行了展望。
关键词:模式识别;图像处理;特征提取;识别方法模式识别诞生于20世纪20年代,随着计算机的出现和人工智能的发展,模式识别在60年代初迅速发展成一门学科。
它所研究的理论和方法在很多学科和领域中得到广泛的重视,推动了人工智能系统的发展,扩大了计算机应用的可能性。
图像处理就是模式识别方法的一个重要领域,目前广泛应用的文字识别(MNO就是模式识别在图像处理中的一个典型应用。
1.模式识别的基本框架模式识别在不同的文献中给出的定义不同。
一般认为,模式是通过对具体的事物进行观测所得到的具有时间与空间分布的信息,模式所属的类别或同一类中模式的总体称为模式类,其中个别具体的模式往往称为样本。
模式识别就是研究通过计算机自动地(或者人为进行少量干预)将待识别的模式分配到各个模式类中的技术。
模式识别的基本框架如图1所示。
图I嘆式识别的基本框架根据有无标准样本,模式识别可分为监督识别方法和非监督识别方法。
监督识别方法是在已知训练样本所属类别的条件下设计分类器,通过该分类器对待识样本进行识别的方法。
如图1,标准样本集中的样本经过预处理、选择与提取特征后设计分类器,分类器的性能与样本集的大小、分布等有关。
待检样本经过预处理、选择与提取特征后进入分类器,得到分类结果或识别结果。
非监督模式识别方法是在没有样本所属类别信息的情况下直接根据某种规则进行分类决策。
应用于图像处理中的模式识别方法大多为有监督模式识别法,例如人脸检测、车牌识别等。
无监督的模式识别方法主要用于图像分割、图像压缩、遥感图像的识别模式识别过程可以看作从样本空间到类别空间的一个映射过程。
当今世界最顶级数学大神们,一起了解下
当今世界最顶级数学大神们,一起了解下数学一门基础学科,来源于生活,目前世界上最赚钱的项目都跟数学有关系,比如金融、比如赌场、比如互联网程序、黑客技术等等;还有目前的各种科学研究也几乎都离不开数学,顶级的数学家可以说在现代社会中生存,犹如囊中取物,随随便便就可以成为百万富翁,只不过往往这些顶级数学家潜心研究、淡泊名利、待人以诚,性格不是常人,有着常人不一般的思维。
我们今天就来聊聊这些顶级数学家,因为所处领域不同故而没有排名一说,只能说他们在各自的领域都是王者一样的存在。
1.佩雷尔曼:证明了百年难题的庞加莱猜想佩雷尔曼:俄罗斯数学家,他是一位Ricci流的专家,证明了数学中一个重要的未解决的问题:庞加莱猜想。
2006年8月在西班牙马德里召开的国际数学大会上,国际数学联合会(IMU)决定将有“数学诺贝尔奖”之称的菲尔茨奖授予佩雷尔曼。
然而,面对这巨大的荣誉他却选择了拒绝。
他也拒领“千禧年数学大奖”。
潜心研究、淡泊名利、待人以诚、来去无踪是佩雷尔曼给同行最深刻的印象。
也有很多大学邀请他做教授开出百万年薪,他都拒绝了。
2.罗伯特朗兰兹:朗兰兹纲领创造者罗伯特·朗兰兹:加拿大数学家,罗伯特·朗兰兹发展了一项雄心勃勃的革命性理论,将数学中的两大分支数论和群论之间建立了新的联系,即“朗兰兹纲领”,并因此荣获2018年度阿贝尔奖,这项难度极高的工作整整历时30年才得以完成,他在1996年还获得沃尔夫数学奖。
朗兰兹纲领是数学中一系列影响深远的构想,联系数论、代数几何,群论,表示论;纲领最初由罗伯特·朗兰兹于1967年在一封给韦伊的信件中提出,自朗兰兹互反猜想提出起,朗兰兹纲领就引起了众多数学家的兴趣。
目前,几乎所有顶尖的欧美大学数学系都有人研究朗兰兹纲领,在朗兰兹纲领基础上发展而来的几何朗兰兹被誉为是21世纪数学新的制高点,代表着一个国家的数学研究先进水平之一。
中国目前研究朗兰兹纲领的著名数学家是恽之伟。
教育部关于印发《高等学校人工智能创新行动计划》的通知
教育部关于印发《高等学校人工智能创新行动计划》的通知文章属性•【制定机关】教育部•【公布日期】2018.04.02•【文号】教技〔2018〕3号•【施行日期】2018.04.02•【效力等级】部门规范性文件•【时效性】现行有效•【主题分类】高等教育正文教育部关于印发《高等学校人工智能创新行动计划》的通知教技〔2018〕3号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局,有关部门(单位)教育司(局),部属各高等学校:为落实《国务院关于印发新一代人工智能发展规划的通知》(国发〔2017〕35号),引导高等学校瞄准世界科技前沿,不断提高人工智能领域科技创新、人才培养和国际合作交流等能力,为我国新一代人工智能发展提供战略支撑,特制定《高等学校人工智能创新行动计划》,现印发给你们,请结合实际认真贯彻执行。
教育部2018年4月2日高等学校人工智能创新行动计划人工智能的迅速发展将深刻改变人类社会生活、改变世界。
为贯彻落实《国务院关于印发新一代人工智能发展规划的通知》(国发〔2017〕35号)和2017年全国高校科技工作会议精神,引导高校瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究和引领性原创成果的重大突破,进一步提升高校人工智能领域科技创新、人才培养和服务国家需求的能力,特制定本行动计划。
一、总体要求(一)基本态势随着互联网、大数据、云计算和物联网等技术不断发展,人工智能正引发可产生链式反应的科学突破、催生一批颠覆性技术,加速培育经济发展新动能、塑造新型产业体系,引领新一轮科技革命和产业变革。
我国正处于全面建成小康社会的决胜阶段,人民对美好生活的需要和经济高质量发展的要求,为我国人工智能发展和应用带来广阔前景。
人工智能具有技术属性和社会属性高度融合的特点,是经济发展新引擎、社会发展加速器。
大数据驱动的视觉分析、自然语言理解和语音识别等人工智能能力迅速提高,商业智能对话和推荐、自动驾驶、智能穿戴设备、语言翻译、自动导航、新经济预测等正快速进入实用阶段,人工智能技术正在渗透并重构生产、分配、交换、消费等经济活动环节,形成从宏观到微观各领域的智能化新需求、新产品、新技术、新业态,改变人类生活方式甚至社会结构,实现社会生产力的整体跃升。
仿生神经网络在模式识别中的应用研究
仿生神经网络在模式识别中的应用研究近年来,仿生神经网络逐渐成为人工智能领域的热点研究方向。
仿生神经网络是指通过对生物神经系统的研究,模拟出一种类似生物神经系统的人工神经网络。
很多科学家认为,真正智能的机器应该是仿生的,即类似人类的智能。
仿生神经网络在模式识别中的应用,具有非常广泛的前景。
一、概述人类感官信息获取渠道繁多,涉及到视觉、听觉、嗅觉、触觉等多种感官系统。
仿生神经网络在模式识别领域的应用,就是将人类感官系统的特点与仿生神经网络相结合,将其运用到图像识别、语音识别、生物医学信号处理等众多领域。
二、仿生神经网络的原理仿生神经网络是一种有机神经元和突触器官网络,在人机交互中,它的神经元承担接受信息、处理信息和传递信息的作用。
这种神经元不仅能按行为方式实现神经元动作,反应到实际中的学习和实验中,其权重和偏执信号的自我更新也可以通过仿生神经网络的学习算法,使得该网络可以自行调整、模拟和学习人类感官系统的工作方式。
三、仿生神经网络在图像识别中的应用图像识别技术可以应用到很多领域,例如人脸识别、图像相似性检索、人体姿态识别等。
在图像识别中,人类是如何实现图像的识别的呢?这是因为人类大脑对物体的视觉信息进行了多层次的分析和处理。
仿生神经网络可以模拟人类视觉系统的工作方式,将多层次的特征提取和组合运用到图像识别中。
通过仿生神经网络,可以以人脑神经元为参考,将图像分割和分析的过程分成多个部分,并进行不同层次的特征提取和处理。
首先,仿生神经网络会将输入的图像进行初步处理,提取出基本的边缘和颜色特征。
其次,对提取出来的特征进行运算和筛选,得到更高层次的组合特征。
最后,通过逐层递归的计算,最终得到物体的判别结果。
通过仿生神经网络,可以实现对单一图像或同类图像集的自动识别。
四、仿生神经网络在语音识别中的应用仿生神经网络同样可以应用在语音识别领域。
语音识别的困难在于声音信号经常受到噪声的干扰,而人类的大脑可以通过多种方式快速适应不同环境中的语音信号。
仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论和应用
——一全里堡璺苎查兰兰些查垦主茎丝苎6神经网络高维空闯复杂几何形体覆盖识别方法及其应用实例在实际的仿生模式识别中为了判别是否属于集合P。
,必须用软件或硬件为手段,在特征空问RⅡ中构筑一个能覆盖集合P。
的n维空间几何形体。
近似于覆盖集合P。
的n维空间几何形体是以不同维数的“流形”(集合A)中,无穷多的点作球心,以常数k作半径的无穷多个n维超球体的并,即集合A与n维超球体的拓扑乘积。
根据维数理论f”,要把n维空间分成两部分,其界面必须是一个n-1维的超平面或超曲面。
而人工神经网络中一个神经元正是在11维空间中作一个n-1维的超平面或超曲面,把Rn分成两个部分。
一个神经元,也可以是多种多样的复杂的封闭超曲面睥】。
冈而,人工神经网络是实现仿生模式识别的十分合适的手段。
为了方便发展神经网络仿生模式识别,我们在前一篇论文中一】引入了神经网络高维空间几何分析方法,用来作为发展仿生模式识别的一种实用性工具,该文中对n维空间的点、直线、平面、超平面、圆、球面、超球面间的关系作了叙述,但未对非球超曲面进行讨论。
以下,将介绍和讨论一个应用非球超曲面的仿生模式识别的实例。
仿生模式识别应用实例的要求是在海面上或地平面上对不同方向观察的目标(如舰艇、坦克、汽车、牛、马、羊等)的认识。
样本的采集是从不同方向观察所采集到的bmp文件,进行前处理(连续映射)后压缩成256维特征空间样本点。
由于观察方向都是水平的,可咀说方向的改变只有一个变量,因而,特征空问中样本点的分布应近似于呈一维流形分布。
加以其他方向存在的微弱变动,可以考虑某类对象在特征空间中的覆盖形状应是个与圆环同胚的一维流形与256维超球的拓扑乘积。
用语言描述也就是在256维特征空间中,离开一条头尾相接的空问曲线的最小距离小于某定值k的所有点的集合P。
,而该空间曲线包含所有采集的样本点集合S,即S={Xx=S。
(i=1,2….采集样本总数)}图3Pa=(xfp()【,y)<kY∈A,X∈舯}其中A={x{x2Xi,i_(I,2,…,n)’11CN,P(xm,x叶1)<£,p(X1x。
浅谈模式识别在图像处理中的应用_程方
浅谈模式识别在图像处理中的应用程方(铜川职业技术学院基础部,陕西铜川727031)摘要:模式识别是指处理和分析表征事物或现象的各种形式的信息,从而实现描述、辨认、分类和解释事物或现象的一个过程。
作为一个比较新的计算机应用领域的学科,已经经历了几十年的发展,本文对这个学科做了一个简单的综述,首先简单介绍了模式识别技术的发展历程,接着介绍了其研究进展和现状,同时介绍比较了几种模式识别的新方法,最后给出了本文的结论。
关键词:模式识别;研究进展;新方法;应用中图分类号:TP391.4文献标识码:A文章编号:1673-1131(2012)06-0259-020引言模式识别(Pattern Recognition)就是机器识别、计算机识别或机器自动识别,目的在于让机器自动识别事物。
具体一点说,模式识别就是处理和分析事物或现象的各种形式所传达的信息,从而实现描述、辨认、分类和解释事物或现象的一个过程。
该学科的研究目的是使机器能做人类能做的事情,具备人所具有的对各种事物与现象进行分析、描述与判断的部分能力。
模式识别是直观的、无所不在的。
实际上人类在日常生活的每个环节,都从事着模式识别的活动。
人和动物的模式识别能力是极其平常的,但对计算机来说,却是非常困难。
因此,虽然近年来模式识别领域已经取得了很多让人瞩目的成就,有很多不可忽视的新的进展,但其仍然面临着非常多的亟待解决的问题,也就是说,模式识别这个学科的潜力还是很大的,发展前景十分广阔。
1新的模式识别方法经过这么多年的发展,模式识别已经算是一个比较成熟的学科,今年来有一些新的方法不断涌现,下面简单介绍其中的几种。
1.1共享核函数模型无监督方法中有一种是概率密度估计,在该方法中,原始密度函数模型的建立在所得到的没有标记的数据集之上。
解决分类的问题是密度估计的一个用途之一。
基于混合密度的模型是应用广泛的统计模式识别中密度估计的方法之一。
所述模型中的有效训练过程是根据期望最大(EM)算法得到的。
仿生模式识别目标自适应跟踪算法
仿生模式识别目标自适应跟踪算法刘焕云;王军宁;何迪;涂尚斌【摘要】将仿生模式识别应用于图像目标的识别与跟踪,提出了一种能够自适应改变图像目标尺寸的目标识别与跟踪算法.仿生模式识别通过构建人工神经网络模型对训练样本进行覆盖,完成对不同尺寸目标的学习过程.针对仿生模式识别中有限数量训练样本不能够识别连续目标尺寸的问题,提出采用基于径向基神经网络的曲线拟合技术对仿生模式识别网络覆盖中的目标尺寸进行拟合,以实现目标尺寸的自适应改变;针对识别与跟踪过程中目标位置和尺寸的判定,提出采用基于欧氏距离的二次最小距离识别算法在图像序列中搜索目标.通过对比经典BP神经网络与文中算法,理论分析与实验结果均表明,该算法对于视频图像序列中目标中心和尺寸的识别是有效的和稳健的.【期刊名称】《西安电子科技大学学报(自然科学版)》【年(卷),期】2013(040)004【总页数】7页(P142-148)【关键词】仿生模式识别;目标跟踪;曲线拟合;二次最小距离;神经网络【作者】刘焕云;王军宁;何迪;涂尚斌【作者单位】西安电子科技大学通信工程学院,陕西西安710071;西安电子科技大学通信工程学院,陕西西安710071;西安电子科技大学通信工程学院,陕西西安710071;西安电子科技大学通信工程学院,陕西西安710071【正文语种】中文【中图分类】TN911.73目标跟踪是指对传感器摄像机拍摄到的视频图像序列进行分析、检测、提取、识别和跟踪,并返回目标的位置和大小信息,是模式识别、图像处理和计算机视觉等领域的重要研究课题,在智能机器人、智能交通系统和视频监控等方面起着重要作用.经典的目标跟踪算法有模板匹配、Camshift、Mean-Shift、Kalman滤波、粒子滤波等.单一的跟踪算法都有其局限性,例如模板匹配算法在目标状态发生较大的变化时会产生跟踪点漂移,Mean-Shift和Camshift算法较适用于彩色目标的跟踪,Kalman滤波鲁棒性不足等,因此目前目标跟踪算法多采用多特征融合技术来削弱单一特征跟踪算法的不足[1-3].笔者将仿生模式识别(Biomimetic Pattern Recognition,BPR)[4]应用于灰度图像目标的识别与跟踪,针对图像序列中目标尺寸的变化,提出了一种新的目标尺寸自适应的跟踪算法.首先根据仿生模式识别原理选取一定尺寸变化规律的目标作为训练样本并将其转换到高维空间并归一化,然后构建超香肠人工神经网络模型对高维空间样本进行覆盖,完成对目标的学习过程;针对仿生模式识别中有限数量的训练样本和该神经网络模型不能够识别连续目标尺寸的问题,提出采用基于径向基神经网络的曲线拟合技术对该网络覆盖空间中的目标尺寸进行拟合,以便在跟踪的过程中实现目标尺寸的自适应改变;提出采用基于欧式距离的二次最小距离识别算法确定图像序列中目标的位置及尺寸.理论分析和仿真实验表明,该算法对于目标尺寸渐变的视频图像序列中的目标识别与跟踪是有效的和稳健的.1 BPR目标跟踪算法1.1 仿生模式识别简介传统模式识别中,例如传统的BP神经网络,同类模式之间没有任何关系的先验知识存在,只能从不同模式之间的划分出发,寻找最优分界面.这就使得基于“最佳划分”的传统模式识别不可避免地存在两个缺陷[4]:一是当识别从未学习过的新模式时,传统模式识别总是牵强地把它划分为某一类已学习过的旧模式;二是当学习新模式时,往往会打乱已学知识,破坏了对已学模式的识别性能.这样的局限性限制了传统模式识别的发展.仿生模式识别以“认识”事物为目的,突破了传统模式识别的局限性,更加准确地模拟了人类学习和认识事物的过程.目前仿生模式识别已在众多领域得到了研究和应用:Su等[5]将仿生模式识别应用到癌症识别中,通过在高维空间对同类模式进行覆盖,形成复杂包络,达到多类癌症识别的目的;Zhai等[6]在人眼虹膜识别过程中,运用二权值神经元构造同类模式在高维空间的复杂几何形体,取得了比传统模式识别更好的识别效果;刘军立等[7]则把仿生模式识别应用到人脸识别中,通过对人脸特征子空间在高维空间进行几何分析与处理,获得了更高的识别率并解决了未训练样本的误识别问题.传统模式识别以不同模式在特征空间中的“最佳划分”为目标,而仿生模式识别则以一类模式在特征空间中分布的“最佳覆盖”为目标.仿生模式识别侧重于寻找一类模式之间的连续性,由于同源同类但又不完全相同的事物之间的差别一定是渐变的,如果两个事物之间存在一个渐变的过程,那么在这个渐变过程中的所有事物应该都是属于同一类别的[4].以数学公式描述这个过程如下:假设样本x和y均属于类别A,对于任意数ε>0,总是存在集合B,在特征空间中,一类模式之间的连续性超出了传统模式识别学习理论的假定,但是这个假定是人类认识事物的客观规律.例如同一事物由小到大的变化或者旋转变化,人们都可以认为这是同一事物.仿生模式识别正是利用了人类对事物的这种认识规律,通过研究一类模式在特征空间的分布状况来完成“认识”过程的.一类模式的覆盖可以是一个超平面或超曲面,也可以是一个复杂封闭的几何形体.仿生模式识别通过分析一类模式在高维空间的分布来完成对该模式的学习过程,一类模式在高维空间中转化为复杂几何形体,要实现对这个复杂几何形体的覆盖是一件困难的事情.如果将多个简单几何形体进行合并交叉,以达到对该类模式的最佳覆盖,则是一个行之有效的解决办法[7].1.2 仿生模式识别的网络实现由维数理论可知,若把n维空间分成两部分,其界必须是n-1维的超平面或超曲面,而人工神经网络中的一个神经元正是在n维空间中作一个n-1维的超平面或超曲面来把n维空间分成两部分,因而可以采用人工神经网络模型实现仿生模式识别理论.多权值神经网络[8]作为仿生模式识别的实现手段,其通用数学模型为其中,W1,W2,…,Wm为m个n维权值矢量,即为训练样本在高维空间中的特征矢量;X为n维输入矢量;θ为激活阈值;Ψ是由权值个数决定的函数;f(·)为非线性转移函数.笔者采用基于2权值的超香肠神经网络对目标进行学习.为了实现用若干神经元来构建神经网络,可以采用若干首尾相连的直线段逼近流形曲线,折线与n维超球的拓扑乘积就形成了该模式的最佳覆盖.由于文中算法针对单目标的跟踪,因此训练样本仅有一类.假设训练样本数为N,则训练样本集S可以表示为其中,s1,s2,…,sN分别是不同尺寸的目标构成的n维训练样本,若训练样本的尺寸为H×W,则维数n=H×W.采用N-1个神经元完成对该模式的覆盖,第i个神经元可以表示为其中,α是在[0,1]之间等间隔进行取值的.第i个神经元的覆盖范围为从超香肠神经网络的构成过程可以看出,基于分类覆盖式学习的仿生模式识别与基于最佳分类划分的传统模式识别之间的差异.1.3 目标尺寸拟合视频图像序列中目标尺寸随着目标与传感器相机之间相对位置的变化而变化,顺序为从大到小或从小到大.假设第x1帧图像中目标尺寸为h1×w1,第x3帧中目标尺寸为h3×w3,且 w1<w3,h1<h3.由目标尺寸的变化规律可知,介于第x1帧与第x3帧之间的第x2帧中,对于目标高度h2一定有h1<h2<h3,宽度w2一定有 w1< w2<w3.采用仿生模式识别原理对训练样本进行学习,首先将训练样本按照目标尺寸的变化规律进行排列.由超香肠神经网络的实现过程可知,在两个训练样本之间会形成神经网络覆盖,网络覆盖中的目标尺寸一定介于两个训练样本的目标尺寸之间,这恰与目标尺寸的变化规律相一致.从上面的分析可知,当采用仿生模式识别进行学习时,可以通过曲线拟合逼近超香肠神经网络覆盖中的目标尺寸.常见的曲线拟合方法有最小二乘法、径向基(Radial Basis Function,RBF)神经网络和NURBS三次曲线拟合.最小二乘法最简单,但精度最低;径向基神经网络的精度最高,但不易用数学表达式表示;而NURBS曲线拟合易用数学公式表达,但精度低.因此笔者采用径向基神经网络进行目标尺寸拟合.径向基神经网络[9]是一单隐层的三层前馈型神经网络,具有全局逼近性能.目前已证明,径向基神经网络能以任意精度逼近任意连续函数.径向基神经网络以径向基函数作为隐含层神经元的基函数,将输入矢量进行变换,每个神经元的输出通过线性加权作为整个网络的输出.(由于篇幅原因,在此不再详细叙述,请详见参考文献[9].)采用径向基神经网络进行曲线拟合的流程如下:输入训练样本和目标向量,采用K-均值聚类算法确定聚类的中心,按照聚类中心进行分组,计算样本均值,重复上述步骤,直至聚类中心不再变化,确定半径并调节输出层权值.网络构建完成后输入测试样本,得到拟合结果.在文中算法中,目标向量为训练样本中目标的宽度和高度.1.4 识别算法仿生模式识别认知算法规定[10]:待识别样本点x到神经元距离最近的那个神经元的类别即为x所属的类别.在仿生模式识别的众多应用中,通常计算待识别样本与神经元的最小距离是否在判定阈值包含之内,从而确定待识别的未知模式是否属于已学习模式,实现分类识别.然而判定阈值的大小与实际输入的样本数据在高维空间的分布有关,通常需要进行多次试验才能得到一个较好的判定阈值.在图像目标的识别与跟踪过程中,目标和目标所处环境在不断发生变化,那么目标与神经元的距离也是在不断变化的.若判定阈值设置过大,则可能找到很多假目标;若阈值设置过小,则可能找不到目标,因此设置判定阈值这一识别方法不适用于图像目标的识别与跟踪.单一图像目标跟踪算法中,由于训练样本中只包含一类模式的样本,而且需要在待跟踪序列图像中确定目标的尺寸信息,因此在文中算法中,提出采用基于欧氏距离的二次最小距离识别算法确定目标在图像序列中的位置和尺寸. 二次最小距离识别算法的思想是计算每一帧所有测试样本X(X∈Rn)与超香肠神经网络之间的欧式距离dk(k=1,2,…,Num,Num为所有神经元B中的样本点个数),记录最小距离dmin(第1次最小距离)以及其对应的拟合尺寸Ssize.判定dmin中最小距离处的测试样本即为跟踪波门Tmp的位置(第2次最小距离),即目标位置.最小距离处神经网络覆盖的拟合尺寸对应跟踪波门Tmp的尺寸,即目标尺寸.其中,ρ(·)为n维空间中两点间的欧氏距离函数.1.5 BPR目标跟踪算法流程基于仿生模式识别的图像目标识别与跟踪算法,通过构建训练样本在高维空间中几何分布的最佳超香肠神经网络覆盖来学习目标;采用径向基神经网络估计该网络覆盖中目标尺寸的变化;在识别与跟踪的过程中采用基于欧氏距离的二次最小距离识别算法确定图像序列中目标的位置和尺寸信息.该算法的具体流程图如图1所示.2 实验结果与分析由于文中算法是基于学习的目标跟踪算法,因此可对比经典BP神经网络与文中算法在学习同样的目标训练样本后的跟踪效果.在MATLAB环境下对BP神经网络跟踪算法和文中算法进行研究与仿真,从图像序列中第1帧开始,每隔50帧得到一个目标训练样本,1 000帧中一共选取了20个目标样本进行训练,尺寸为80×90,样本中的目标尺寸从75×80变化到24×26.由于BP神经网络是基于分类划分的,因此在学习的过程中也必须对非目标进行学习.从图像序列中随机选择了20个非目标样本与目标样本一起送入BP网络进行训练,部分目标样本与非目标样本如图2所示.图1 算法流程图图2 部分训练样本单隐层的BP神经网络输入层为7 200个神经元,输出层为1个神经元.神经元的传递函数为S型正切函数和S型对数函数,训练函数为traingdx,最大训练次数为1 000,最小均方误差为0.001.输入数据为40列归一化后的图像灰度值,取不同的中间层神经元对网络进行训练,当隐层神经元为30个时网络的性能最佳,训练次数为145次,最小均方误差为0.000 997 28.采用RBF神经网络对超香肠神经网络覆盖空间中的目标尺寸进行连续拟合,输入层为20个神经元,隐层为10个神经元,输出层为1个神经元.目标尺寸拟合的结果如图3所示,图中“+”表示训练样本中目标的尺寸,实线表示网络覆盖中目标的连续拟合尺寸.图3(a)表示目标宽度的拟合结果,均方误差为0.225 1;图3(b)表示目标高度的拟合结果,均方误差为0.203 1.图3 径向基神经网络拟合结果图采用BP神经网络算法对目标样本和非目标样本进行学习.文中算法对目标样本进行学习,其中α每间隔0.05取值.对1 000帧图像序列中的目标进行识别与跟踪,待跟踪图像序列中每帧图像的尺寸为512×384,对每帧图像进行遍历搜索.跟踪效果如图4所示,其中黑框表示目标跟踪波门,跟踪波门的尺寸即为目标的尺寸,跟踪波门中心的“+”即为所跟踪目标的中心位置.图4 基于学习的目标跟踪算法比较图由图4可见,学习同样的目标样本,BP神经网络跟踪结果中目标中心的漂移显示了BP神经网络的泛化能力不如文中算法的泛化能力强;在第900帧以后,由于目标与背景的灰度值相差很小,目标几乎融入背景中,BP神经网络此时已经丢失目标,而文中算法还能准确识别与跟踪到目标的变化.由此可见,采用文中算法对目标尺寸覆盖范围内的图像目标的识别与跟踪是有效的和稳健的.在上面的跟踪结果中,BP神经网络对于图像目标的跟踪产生了跟踪点漂移,现将训练样本作为测试样本重新输入BP神经网络和超香肠神经网络,识别结果如图5所示.图5(a)中,“▽”代表期望结果值,期望结果值为1代表该训练样本为目标样本,期望结果为0代表该训练样本为非目标样本;“□”代表实验结果值,实验结果值在1附近代表该测试样本为目标样本,实验结果值在0附近代表该测试样本为非目标样本.从图中可以看出,当将训练样本重新输入BP神经网络进行识别时,实验结果值与期望结果值没有很好的重叠在一起,这一点也可以从误差曲线看出.实验结果与期望结果产生了一定的误差,这是由于BP神经网络采用梯度下降法通过对所有的训练样本进行学习来整体调节网络的权值和阈值,当最小均方误差达到设定的性能指标时立即停止学习,从而产生一个最优分界面.图5 训练样本识别误差曲线由仿生模式识别理论构建的超香肠神经网络只学习了目标样本,图5(b)给出超香肠神经网络中训练样本的识别误差.从图中可以看出,超香肠神经网络可以准确实现所有训练样本的识别,这是因为超香肠神经网络是对目标样本进行覆盖完成对训练样本的学习过程.图6 目标中心在图像序列中的位置比较图6 显示了上述两种跟踪算法得到的目标在图像序列中的位置变化.在目标状态发生变化时,BP神经网络产生了跟踪点漂移,而文中算法准确跟踪到了目标.仿生模式识别的平均误差为2.8个像素,BP神经网络的平均误差为9个像素.图7给出文中算法识别出的目标在图像序列中的尺寸变化.从以上的分析和对比可以看出,在学习同样的目标样本之后,仿生模式识别取得了比传统BP神经网络更好的跟踪效果,并且文中算法成功识别出图像序列中目标尺寸的变化.3 总结与展望图7 目标尺寸变化情况笔者将仿生模式识别应用于图像目标的识别与跟踪,解决了图像序列中目标尺寸自适应识别的问题.通过构造超香肠神经网络来完成对目标的学习过程,训练样本的选择对实验结果有直接影响;利用径向基神经网络拟合超香肠神经网络覆盖中的目标尺寸;采用基于欧式距离的二次最小距离算法,识别与跟踪目标在图像序列中的状态变化.通过对比传统的BP神经网络与文中算法在图像序列中的跟踪结果和理论分析,表明文中算法是有效的并具有较好的稳定性.文中算法解决了仿生模式识别中训练样本目标尺寸覆盖范围内图像目标的识别与跟踪问题,但是训练样本的选择和目标尺寸的确定对跟踪结果影响较大,如何选择一组较好的样本进行学习是今后的研究重点.由于文中算法是在高维的情况下对图像进行分析和计算的,构建网络的过程需要大量的加法运算和少量乘法运算,这一阶段算法复杂度较低;识别过程中需要计算待跟踪序列图中每一点与超香肠网络每一覆盖点的距离,这一阶段算法复杂度较高,因此未来迫切需要寻找一种实用降维算法来缩短程序运行时间.参考文献:[1 ]顾鑫,王海涛,汪凌峰,等.基于不确定性度量的多特征融合跟踪[J].自动化学报,2011,37(5):550-558.Gu Xin,Wang Haitao,Wang Lingfeng,et al.Fusing Multiple Features for Object Tracking Based on Uncertainty Measurement[J].Acta Automatica Sinica,2011,37(5):550-558.[2 ]高国旺,刘上乾,秦翰林.强背景噪声下红外目标的鲁棒性跟踪算法[J].西安电子科技大学学报,2010,37(6):1098-1100.Gao Guowang,Liu Shangqian,Qin Hanlin.Robustness-tracking Algorithm for the Infrared Target under Complex Background Noise[J].Journal of Xidian University,2010,37(6):1098-1100.[3 ]李玉珏,颜景龙.多特征联合匹配的目标图像稳定跟踪算法[J].兵工学报,2011,32(5):575-579.Li Yujue, Yan Jinglong.Stalized Target Tracking Algotithm Using Multi-feature Joint Matching[J]. Acta Armamentarii,2011,32(5):575-579.[4 ]王守觉.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用[J].电子学报,2002,30(10):1417-1420.Wang Shoujue.Bionic (Topological)Pattern Recognition-A New Model of Pattern Recognition Theory and Its Applications[J].Acta Electronica Sinica,2002,30(10):1417-1420.[5 ]Su Qian,An Dong,Zhai Yafeng,et al.A Cancer Recognition Method based on DNA[J].Chinese Journal of Electronics,2009,18(3):491-493.[6 ]Zhai Yikui,Gan Junying,Zeng Junying,et al.A Novel Iris Recognition Method Based on the Contourlet Transform and Biomometic Pattern Recognition Algorithm [C]//10th International Conference on Signal Processing(ICSP).Beijing:IEEE Conference Publications,2010:1390-1393.[7 ]刘军立,孙劲光.基于高维仿生覆盖的人脸识别方法[J].计算机工程与应用,2011,47(17):178-180.Liu Junli,Sun Jinguang.Face Recognition on High-Dimensional Bionic Coverage[J].Computer Engineering and Applications,2011,47(17):178-180.[8 ]Xu Xiaping,Jiang Jiafu.Study on Head Recognition Based on Biomimetic Pattern Recognition in Complicated Traffic Environment[C]//Seventh International Conference on Natural Computation (ICNC).Shanghai:IEEE Conference Publications,2011:242-246.[9 ]Neruda R,Kudova P.Learning Methods for Eadial Basis Function Networks[J].Future Generation Computer Systems,2005,21(7):1131-1142.[10]曹文明,冯浩.仿生模式识别与信号处理的几何代数方法[M].北京:科学出版社,2010:12-20.。
模式识别简述
模式识别简述
严红平;潘春洪
【期刊名称】《自动化博览》
【年(卷),期】2006(23)1
【摘要】模式识别可以使人们在影响因素很多的情况下仍能对众多信息进行方便的处理.进而对物群进行分类。
而在工业中使用模式识别.则可以节约原材料、提高产品质量和产量、降低单产能耗。
解决企业和工程技术人员所关心的问题。
从本期开始,“模式识别”专栏将陆续邀请国内外知名专家向广大读者介绍模式识别的发展和具体应用。
希望使更多读者认识和了解模式识别对自动化技术的推动。
【总页数】5页(P22-26)
【作者】严红平;潘春洪
【作者单位】中国地质大学(北京)信息工程学院,北京,100083;中国科学院自动化所模式识别国家重点实验室,北京,100080
【正文语种】中文
【中图分类】TP3
【相关文献】
1.基于仿生模式识别与传统模式识别的人脸识别效果比较研究 [J], 王守觉;曲延锋;李卫军;覃鸿
2.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用 [J], 王守觉
3.“以人为本”:新一代生物识别核心理念--专访国际模式识别学会第一副主席、
模式识别国家重点实验室主任谭铁牛研究员 [J], 诚凌
4.2009年全国模式识别学术会议暨中日韩模式识别研讨会在南京召开 [J],
5.地震资料的统计模式识别和神经网络模式识别 [J], 代俊堂;钱绍新
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
仿生模式识别(拓扑模式识别) 一种模式识别新模型的理论与应用王守觉(中国科学院半导体研究所神经网络实验室,北京100083)摘 要: 本文提出了一种模式识别理论的新模型,它是基于 认识 事物而不是基于 区分 事物为目的.与传统以 最佳划分 为目标的统计模式识别相比,它更接近于人类 认识 事物的特性,故称为 仿生模式识别 .它的数学方法在于研究特征空间中样本集合的拓扑性质,故亦称作 拓扑模式识别 . 拓扑模式识别 的理论基点在于它确认了特征空间中同类样本的连续性(不能分裂成两个彼此不邻接的部分)特性.文中用 仿生模式识别 理论及其 高维空间复杂几何形体覆盖神经网络 识别方法,对地平面刚体目标全方位识别问题作了实验.对各种形状相像的动物及车辆模型作全方位8800次识别,结果正确识别率为99 75%,错误识别率与拒识率分别为0与0 25%.关键词: 模式识别;神经网络;仿生学;高维几何中图分类号: O235 文献标识码: A 文章编号: 0372 2112(2002)10 1417 04Bionic (Topological)Patte rn RecognitionA New Model of Pattern Recognition Theory an d Its Applica tionsWANG Shou jue(Lab o f Arti ficial Neural Networks ,Institute o f Se miconductors,CAS ,Be ijing 100083,China)Abstract: A new model of pattern recogni tion principles,witch is based on matter cognition ins tead of matter classification in traditional statistical pattern recognition,has been proposed.This new model is better closer to the function of human being,rather than tradi tional s tatistical pattern recogni tion using opti mal seperating as its main principle.So the new model of pattern recogniti on is called the Bionic Pattern Recognition.Its mathematical basis are topological analysis of sample set in the high di mensi onal feature space,therefore it is also called the Topological Pattern Recognition.T he basic idea of this model is based on the fact of the continui ty in the feature space of any one of the certain kinds of samples.We did experi ments on recogniti on of omnidirectionally oriented ri gid objects on the same level,wi th the Bi onic Pattern Recognition using neural networks,which acts by the method of covering the high di mensional geometrical distribution of the sample set in the feature space.M any ani mal and vehicle models(even with rather si milar shapes)were recognized omnidirectionally thousands of times.For total 8800tests,the correct recogni tion rate is 99 75%,the error rate and the rejection rate are 0and 0 25respectively.Key words: pattern recogni tion;neural networks;bionics;hi gh dimensional geometry1 引言模式识别的发展已有几十年的历史.早在20世纪30年代,Fisher 提出的判别分析就是利用已知的两类向量的概率分布函数来设计将两类向量分开的决策规则的问题[1].随即在统计模式识别发展以后,模式识别就被认为是用来选择使平均风险达到最小的模式类别.因而,划分类别问题,与统计判决理论完全相同[2].近年受到人们关注的支持向量机(SVM )的最早提出者Vapnik 在1974年提出了 最优分类超平面 的概念[3]并在此基础上后来发展构造成了支持向量机(SVM)[4].综上所述,数十年来人们在研究模式识别问题中,考虑的出发点都是在若干类别的最佳分类划分上.其根本原因或许在于用这样的数学描述与处理方法最具有一般性、通用性.但众所周知,即使基于目前最先进的模式识别理论基础上的识别机,其实际效果却仍然远不能令人满意.虽然Vapnik 在一本非常出色的书中是这样批评人工智能学者的[5].(为了忠于原文,把Vapnik 书中(中译本)原话一段引在下面,这对说明本文的目的与出发点是必要的.)Vapnik 写道: 在80年代,人工智能学者在计算学习领域中扮演了主要的角色.在这些人工智能研究者中间,一些较极端的学者有很大的影响(正是他们强调了 复杂的理论是没有用的,有用的是简单的算法 ).这些人工智能学者对于处理学习问题有丰富的经验,善于对一些理论上非常复杂的问题构造 简单的算法 .60年代末,人们认为在几年之内就可以完成计算机自然语言翻译器(但时至今日我们尚离解决这个极其复杂的问题很远);在此之后的另一个计划是构造通用问题求解器;再之后又是建立大系统自动控制机的计划,等等.所有这些科研计划都没有取得成功.接下来要研究的问题就是如何建立一种计算学习技术.这些学者首先做收稿日期:2002 07 12;修回日期:2002 08 05基金项目:国家自然科学基金项目(No 60135010)第10期2002年10月电 子 学 报ACTA ELECTRONICA SINICA Vol.30 No.10Oct. 2002的是改变了所用的术语.特别地,感知器被改称为神经网络.然后这些研究被称作是与生理学家共同进行的,对学习问题的研究减少了一般性,增加了主观色彩.在60和70年代学习问题研究的主要目标是寻找从小数量样本出发进行归纳推理的最好途径,而到了80年代,目标变成了构造利用大脑来推广的模型.(原文注:当然研究人是如何学习的是很有意义的,但是这并不一定是建立人工学习机器的最佳途径,正如人们对鸟类如何飞行的研究实际上对建造飞机没有多少帮助一样).本文对Vapnik 这段话并非有所评议,只想说明,本文题目用 仿生模式识别 中的 仿生 二字,并非Vapnik 所批评的 目标变成了构造利用大脑来推广的模型 ,而只是为了从功能上更接近于人类对事物的识别过程,而从数学模型上加入了实际 被识别对象 的某些普遍存在的 特殊性 .这个所谓 特殊性 是针对目前传统的模式识别数学描述方法的 一般性与通用性 而言的,它在实际的模式识别问题中却仍然具有一般性与通用性.本文的基本出发点就在于把模式识别问题看成模式的 认识 ,而不是分类划分,不是模式分类;是一类一类样本的 认识 ,而不是多类样本的划分.因而,其基本数学模型当然会与传统模式识别的 最优分类 界面的概念大不相同.2 人类的识别功能与传统模式识别方法的差异设想农村中的一孩子,能认识牛、羊、马、狗、树林、房子等等农村中所有的一切,但没见过汽车;如果有一辆汽车突然出现在他面前时,试问他会怎样想呢?他会把汽车与以前见过的牛、羊、马、狗 等一件件比较,看与哪件最相像吗?(传统模式识别正是这样的)不,他绝不是这样想的,而是认为 我没见过这种东西 我不认识这种东西 .这正是人类认识事物与传统模式识别的差别.人类侧重于 认识 ,只有在细小之处才重视 区别 (例如要区分狼与狗或马与驴等等),而传统模式识别则只注意 区分 ,没有重视 认识 的概念.本文提出的 仿生模式识别 就是从 认识 模式的角度进行模式识别;既然它的基本概念不同于已经发展数十年的传统模式识别,为强调与传统模式识别在概念上的不同,用了 仿生模式识别 这一名词;其中仿图1生 二字的含义只是在模式识别的功能和数学模型上强调了从 认识 的概念出发,更接近于人类的识别;而从实现的途径上看,还没有 仿生 的含意.下面把仿生模式识别与传统模式识别的比较与差异以图表方式表示在图1中.3 从基本数学模型看仿生模式识别与传统模式识别的本质差别传统模式识别其基本数学模型的基点在于如文献[5]中第12页所述的: 所有可用的信息都包含在训练集(1-1)式中的情况下 (注:原文(1-1)式即训练集坐标(x 1,y 1), ,(x 1,y 1))这就是说在同类样本点相互之间没有任何关系的先验知识存在,因此,一切都只能从特征空间中不同类样本的划分出发了.然而在自然界实际规律中并非如此;本文所提出的仿生模式识别就在于引入了同类样本间存在的某些普遍的规律性而建立起来的 多维空间中非超球复杂几何形体覆盖 的识别原理.下节将重点讨论同类样本间普遍存在的规律性(亦即普遍存在的先验知识)4 仿生模式识别的基点 特征空间中同类样本全体的连续性规律人们在对事物的识别过程中,存在两种不同的归类过程.一种是 同源 的归类过程,例如同为简体汉字的手写体识别.另一种是不同源的按逻辑知识归类过程,例如手写体中简体汉字与繁体汉字的归并.对学过简体汉字而未学过繁体汉字的人,对于简体汉字的印刷体、手写楷书和行书等往往都能认识,而对于繁体汉字却不认识.因为繁体汉字与简体汉字并不源于同一个字形,而是被人为地定义为同一个字的,靠事先学习的逻辑知识把二类归并成一类.我们把 同源 的称为同一类,而在识别以后再按逻辑归类知识把需要归在一起的类别合并.因而以下所称同类样本指的都是 同源 的一类样本.以下讨论 同源 同类样本的连续性规律;自然界任何欲被认识的事物(包括事物、图像、声音、语言、状态等等)若存在两个 同源 同类而不完全相等的事物,而这两个事物的差别是可以渐变的或非量子化的(宏观世界的绝大部分事物正是如此,即使像 苹果产量 那样不可能细化到一只苹果以下,但以重量计的 苹果产量 是考虑为可以渐变的)则这两个同类事物之间必至少存在一个渐变过程,在这个渐变过程中间的各事物都是属于同一类的.以数学公式描述为:特征空间R n 中设所有属于A 类事物的全体所做成的点集为A ,若集合A 中存在任意两个元素x 与y ,则对 为任意大于零的值时,必定存在集合B,使B ={x 1,x 2,x 3, ,x n |x 1=x ,x n =y ,n N , (x m ,x m +1)< ,>0,n -1 m 1,m N },B A 在特征空间R n 中同类样本点之间所存在的这个连续性规律是超出了传统模式识别与学习理论的基本假定的,该假定认为 可用的信息都包含在训练集中 .但这个连续性规律却是客观世界中人类直观认识范围的客观存在的规律;因而也是仿生模式识别中用来作为样本点分布的 先验知识 ,从而来提高对事物的认识能力.传统模式识别中把不同类样本在特征空间中的最佳划分作为目标,而仿生模式识别则以一类样本在特征空间的分布的最佳覆盖作为目标,以二维空间的情况示意如图2.1418 电 子 学 报2002年图2图中,三角形为要识别的样本,圆圈和十字形为与三角形不同类的两类样本,折线为传统BP网络模式识别的划分方式,大圆为RB F网络的划分方式(等同于以模板匹配的识别方式)细长椭圆形构成的曲线代表仿生模式识别的 认识 方式.因而,仿生模式识别把分析特征空间训练样本点的关系作为基点,而特征空间中样本分布的连续性规律为此提供了可能性.5 仿生模式识别理论的数学工具问题在仿生模式识别中引入了特征空间中同类样本的连续性规律后,对一类事物的 认识 ,实质上就是对这类事物的全体在特征空间中形成的无穷点集合的 形状 的分析和 认识 .正如前苏联多名院士的数学名著[6]中所指出的 任何对象的每一个集合,只要在有着关于连续性、关于无限接近的自然概念,就是一个拓扑空间.拓扑空间的概念是非常普遍的,而关于这种空间的学问 抽象拓扑学 不是别的,正是关于连续的最普遍的数学分支 .而本文所提出的仿生模式识别的理论分析数学工具正是点集拓扑学中对高维流形的研究问题.这同传统的以数理统计为基础的模式识别显然在数学工具的基础上有根本的差别.与传统的统计模式识别相别,把仿生模式识别也称为拓扑模式识别.在仿生模式识别(拓扑模式识别)中,特征空间R n中任何一类事物(如A类)全体在R n中映射(必须是连续映射)的 象 所做成的点集被视为都是一个闭集,这个闭集我们称它为A,集合A根据仿生模式识别的具体应用对象可以是不同维数的 流形 .关于一般点集的维数分析在前苏联数学家乌利逊(1898~1924)所建立的 一般维数论 中已有讨论.但模式识别是一门实际应用的科学.在实际工程中,无论模式识别欲解决的具体问题是什么,在采集样本和识别对象时必然会带来一定的随机 噪声 .因而,在实用的仿生模式识别中,对A类事物 认识 的判别覆盖集合应该用集合P a取代集合A, P a={x| (x,y) k,y A,x R n},k为选定的距离常数.集合P a是n维的,因而仿生模式识别的任务,就是判别 被识别事物 映射在特征空间R n中的 象 是否属于集合P a.6 神经网络高维空间复杂几何形体覆盖识别方法及其应用实例在实际的仿生模式识别中为了判别是否属于集合P a,必须用软件或硬件为手段,在特征空间R n中构筑一个能覆盖集合P a的n维空间几何形体.近似于覆盖集合P a的n维空间几何形体是以不同维数的 流形 (集合A)中,无穷多的点作球心,以常数k作为半径的无穷多个n维超出球体的并,即集合A与n维超球体的拓扑乘积.根据维数理论[7],要把n维空间分成两部分,其界面必须是一个n-1维的超平面或超曲面,而人工神经网络的一个神经元正是在n维空间中作一个n-1维的超平面或超曲面,把R n分成两个部分.一个神经元,也可以是多种多样的复杂的封闭超曲面[8].因而,人工神经网络是实现仿生模式识别的十分合适的手段.为了方便发展神经网络仿生模式识别,我们在前一篇论文中[9]引入了神经网络高维空间几何分析方法,用来作为发展仿生模式识别的一种实用性工具.该文中对n维空间的点、直线、平面、超平面、圆、球面、超球面间的关系作了叙述,但未对非球超曲面进行讨论.以下,将介绍和讨论一个应用非球超曲面的仿生模式识别的实例.仿生模式识别应用实例的要求是在海面上或地平面上对不同方向观察的目标(如舰艇、坦克、汽车、牛、马、羊等)的认识.样本的采集是从不同方向观察所采集到的bmp文件,进行前处理(连续映射)后压缩成256维特征空间样本点.由于观察方向都是水平的,可以说方向的改变只有一个变量,因而,特征空间中样本点的分布应近似于呈一维流形分布.加以其他方向存在的微弱变动,可以考虑某类对象在特征空间中的覆盖形状应是一个与圆环同胚的一维流形与256维超球的拓扑乘积.用语言描述也就是在256维特征空间中,离开一条头尾相接的空间曲线的最小距离小于某定值k的所有点的集合P a,而该空间曲线包含所有采集的样本点集合S,即S={x|x=S i(i=1,2, ,采集样本总数)}P a={x| (x,y) k,y A,x R n}A={x|x=x i,i=(1,2, ,n),n N, (x m,x m+1)< , (x1,x n)< , >0,n-1 m 1,m N},A R n,S A 为了实际用神经网络中若干神经元来实现近似覆盖P a,我们用若干空间直线段来近似空间曲线A,每个神经元覆盖的是一个直线段与n维超球的拓扑乘积.设采集原始样本集合为S,在其中取样本j个组成新的样本集S ,使S ={x|x=S i(i=0,1,2, ,j), (s i,s i+1) d<(s i-1,s i+1),d为设定常数,s 0=s j},S S用j个神经元来近似地覆盖P a,第i个神经元覆盖范围P i 为:P i={x| (x,y) k,y B i,x R n}B i={x|x= S i+(1- )S i+1, =[0,1]}全部j个神经元覆盖范围为:P a=j-1i=0P i1419第 10 期王守觉:仿生模式识别(拓扑模式识别) 一种模式识别新模型的理论与应用7 实验与结果以狮子、老虎、坦克、小汽车等八件实物模型(见图3),各以旋转360 一圈采集400个样本,称为第一样本集八类共3200个样本,再在不同时间下另行重复采集一次,得第二样本集八类3200个样本.图3再用猫、小狗、斑马等六件实物模型(见图4),同样各采集400个样本,称为第三样本集六类共2400个样本.试验步骤与结果如下:图4(1)首先在第一样本集3200个样本中,按同类样本间的距离大小每类分别选择26至50个不等数量的样本作为训练样本,共八类338个样本作为训练集.(2)以统一的距离参数k ,分别用神经网络构作P a ,P b , 等八类对象拓扑流形的识别网络,其神经元数量与训练集样本数量相同.(3)把第一、第二两样本集共6400个样本作为正确识别率的测试样本,结果正确识别的样本总数为6384个,正确识别率为99 75%,未正确识别的16个样本全部属拒识,拒识率为0 25%.(4)把第一、第二、第三样本集全部8800个样本作为错误识别率的测试样本,结果无一样本被误识.由于参数k 的选择与P a ,P b , 等八类识别网络的建立等工作的描述与讨论需占用太大的篇幅,将在另文发表.8 讨论与结论由以上实验结果说明:(1)仿生模式识别对于未经过训练的任意对象决不会误识(无一次误识,即使动物模型的后影是十分相似的)这正是人们识别功能的特点,也是传统模式识别的致命弱点.(2)仿生模式识别是一类一类分别训练 认识 的,对新增加样本的训练不会影响原有识别知识,这是一大优点.(3)正确识别率99 75%,剩下的0 25%全部是拒识(而不是误识),这在实际应用中往往没有影响,只要重复一次即可,不会造成错差.(4)该实验实例是拓扑模式识别中最简单的 一维流形实例 ,即每一类样本的全体在特征空间中呈与圆环同胚的 一维流形 状分布(亦即空间闭合曲线),它与n 维超球的拓扑乘积P a 易于用神经网络覆盖.(5)上述情况说明研究具体的仿生模式识别首先要分析研究被识别事物在特征空间中分布状况的拓扑属性,再考虑用神经网络覆盖方法.(6)在上述实验实例中,首先保证了预处理(即特征提取)过程是连续映射,无跳变现象,这是拓扑模式识别的基本要求,否则将会影响效果.(7)上述实验中用的识别对象实物模型,为消除光线色度的影响和反光的影响(正如一般摄影技术中要避免反光一样),这些实物都采用无色毛面,而摄像采样只用了黑白灰度.(8)综上所述可以说明,仿生模式识别开辟了一个效果较好有前途的新方向,正有待于从理论到实践上研究发展众多具体针对性的应用领域.参考文献:[1] Fis her R.A.Contributi ons to Mathematical Statis tics [M ].Ne w York:J.Wiley,1952.[2] 陈季镐(美)著,邱炳章,邱华译.统计模式识别[M].北京:北京邮电学院出版社,1989.[3] Vapni k V.N and Chervonenkis A.Ja.Theory of Pattern Recogni tion[M].Nauka,Moscow,1974.[4] Boser B,Guyon I and Vapnik V.N.A traini ng algorithm for optimalmargin clas sifirers [A].Fifth Annual Works hop on Co mputati onal Learning Teory [C].Pittsburgh:ACM ,1992.144-152.[5] Vladi mir N Vapnik 著,张学工译.统计学习理论的本质[M ].北京:清华大学出版社,2000.[6] A D 亚历山大洛夫等著,王元等译.数学 它的内容、方法和意义[M].北京:科学出版社,2001.[7] R ys zard Engelking.Dimension Theory [M ].PWN Polis h Sci entificPublis hers Warsza wa,1978.[8] 王守觉,李兆洲,陈向东,王柏南.通用神经网络硬件中神经元基本数学模型的讨论[J].电子学报,2001,29(5):577-580.[9] 王守觉,王柏南.人工神经网络的多维空间几何分析及其理论[J].电子学报,2002,30(1):1-4.作者简介:王守觉 男,1925年生于上海,早年就读于西南联大和同济大学,毕业后在北平研究院镭学研究所从事氧化亚铜研究,解放后改为中国科学院应用物理所结晶学室,1960年成立半导体所后历任器件室主任、副所长、所长等职务,1980年当选为学部委员(院士),现为中国电子学会副理事长, 电子学报 主编,中国半导体学科奠基人之一,现从事半导体超高速电路与人工神经网络算法、模型、硬件和应用的研究.1420 电 子 学 报2002年。