模式识别简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模式识别系统
领域相关知识 获取, 表达 数据获取 摄像头, 超声, 激光,…. 预处理 图像增强, 分割 表示 特征: 颜色, 形状, 材质,… 分类或决策 统计模式识别(几何) 语意模式识别(结构) 神经网络 后处理; 上下文相关应用
系统性能
错误率,Error rate (Prob. of misclassification) 速度,Speed (throughput) 代价,Cost 鲁棒性,Robustness 拒绝选项,Reject option 投入回报,Return on investment
Pattern Recognition System
挑战性问题(1)
图像分辨率低: 号牌距离太远或者采用了低分辨率的摄像 机 模糊图像, 运动模糊 恶劣光照/低对比度: 曝光过度, 反射 或者 阴影 视点变化或者遮挡 (车牌上的污痕)
模糊图像 (左)
光照和视点问题(中)
遮挡 (右)
挑战性问题(2)
不同的字体 车牌上图案 无法区别来自不同国家地区的车牌,例两辆来自不同国家或 地区的车牌可能有相同的车牌号码
模式识别
Having been shown a few positive examples (and perhaps a few negative examples) of a pattern class, the system learns to tell whether or not a new object belongs in this class (Watanabe); face vs. non-face 从少量样本中推断通用样本的情况 认知(COGNITION)= 形成(辨识)新的类别 识别(RECOGNITION) = 辨别已知的类别
好的表示方法特性
具有一些不变特性( invariant properties ) 如:旋转不变,平移不变, 尺度不变… 类间变化的不变特性 能够区分感兴趣的模式类别; 不同类别之间的相似性低 对噪声遮挡等因素鲁棒 可以得到简单的匹配结果或者决策制定策略 (例如, 线性 决策边界) 低测量(计算)代价;可实时
预处理: 图像增强与分 割 (i) 分隔开相互接触 或者遮挡的鱼 (ii) 提 取鱼的轮廓
表示: 采用鱼的长度作为特征
Training samples
鱼的亮度(颜色深浅)作为特征
该特征统计直方图中重叠部分要少于采用长度为特征的统计直方图
二维特征空间
线性决策边界; 错误分类代价?
联合两种特征可以得到更好的区分性能
6
模式识别( Pattern Recognition )
“The real power of human thinking is
based on recognizing patterns. The better computers get at pattern recognition, the more humanlike they will become.”
地形、植被覆盖 坦克, 机场 文字
模式识别应用
问题描述 工业制造 网络搜索 指纹识别 输入 输出 3-D 图像 (结构光, 激光, 立体视觉) 物体识别, 姿态估计, 装配 用户输入的关键字 指纹采集传感器获得的指纹图像 与输入相关的文本 指纹对应人员
数字识别
• 印刷体
• 手写体
车牌识别系统
Michigan州 and Kentucky 州车牌例子
模式识别系统
关键问题
表示(Representation) 匹配
一个模式识别系统包括:
训练学习阶段 测试评估阶段
表示(Representation)的难题
到底采用哪种面部描述 特征(description)或 模型来支持大范围的类 内可变性?
实际生活中的模式识别系统
智能电表检定 脑机接口
手势识别
模式识别应用
问题描述 语音识别 语音波形 输入 输出 语音单词, 说话人识别
非破坏性检测 疾病检测与诊断
超声,涡流 ,声发射波形 心电图, 脑电图波形
有/无 瑕疵, 瑕疵类型 心脏,大脑状况
自然资源检测 空中侦察 文字识别
多频谱图像 可见光, 红外, 雷达图像 扫描图像
Supervised Classification
训练样本已经标注(labeled)
Unsupervised Classification
训练样本无标注(unlabeled)
Segmentation
ຫໍສະໝຸດ Baidu
一个模式识别的例子
水源紧缺地区的饮水区域进入控制(e.g. 澳大利亚内陆地区); 野生动物 vs. 家畜 安装一个智能门,仅仅允许家畜进入
类内可变性
不同书写形式的字母“T”
同样的人脸处于不同的表情,姿态和光照情况
类间相似性
相似字母 双胞胎
模式类别模型
为每一个模式类别建立数学或统计模型(描述 description) 其它模型:语法( syntactic)/结 构(structural),模板( template) 该模式类别是从样本中学习到的(类别的条件概率 密度) 给定一个模式,选择最佳拟合模型:能够将模式是 类别最佳拟合的模型
拒绝
允许
采用模式识别系统识别家畜 室外相机采集图像 边缘检测与轮廓跟踪 与已经存在的轮廓模板库匹配 仅当匹配时打开门 原型系统: Dunn et al., U. South Queensland, Australia. 达到100% 准确率!
模式识别Pattern Recognition
• 给定一个输入的模式, 做出决策判定该模式是属于哪 一个类别的模式 • 几乎所有的自动系统中都需要用到模式识别 • 其它适用领域:数据挖掘、机器学习、计算机视觉、 统计决策理论等 • 本课程讲授的是基础的PR方法和理论,以及相应理 论的优势和劣势
模式类别(Pattern Class)
一系列相似( similar)物体 (not necessarily identical) 类别由相应的类别样本定义 (paradigms, exemplars, prototypes, training/learning samples) 类内可变 类间相似 如何定义相似性?
模式识别与人工智能领域主要期刊
Pattern Recognition, Elsevier IEEE Transactions on Pattern Analysis and Machine Intelligence
IJCV, International Journal of Computer Vision JMLR, Journal of Machine Learning Research Artificial Intelligence, Elsevier
分割: 人类检测
*Theo Pavlidis, http://home.att.net/~t.pavlidis/comphumans/comphuman.htm
分割: 人类检测
Games Magazine, September 2001
Fish Classification: 鲑鱼(Salmon) v. 鲈鱼(Sea bass)
浙江大学研究生《模式识别与人工智能》课件
第一讲 模式识别概述
刘勇 yongliu@iipc.zju.edu.cn 浙江大学 Winter 2013
Outline
主要参考书目 模式识别与人工智能领域主要期刊与会议 模式识别介绍 小结
主要参考书目
模式识别,边肇祺,张学工等 编著,清华大学出版社,北京 ,2000 模式分类,Richard O. Duda, Peter E. Hart, David G.Stork著, 李宏东,姚天翔 等译,机械工业出版社, 2006 Machine Learning, Tom M. Mitchell著,2003. (有中译 版) Artificial Intelligence: A New Synthesis. Nils J. Nilsson,1999(中译本:《人工智能—一种新的集成》. 郑扣根、庄越挺 等译,2000)
模式识别( Pattern Recognition )
The act of taking in raw data and taking an action based on the
“category” of the pattern
什么是模式(Pattern)?
“A pattern is the opposite of a chaos; it is an entity vaguely defined, that could be given a name.” (Watanabe)
复杂的决策边界
决策边界的泛化(generalization)能力
具有好的泛化能力的决策边界
首选简单决策边界
特征选择与抽取
• 选择 vs. 抽取 • 采用多少、采用哪些特征子集来构造决策边界 • 一些特征是冗余的 • 维度灾难(Curse of dimensionality)—在使用 大量特征的小样本训练集上,错误率反而会升高
模式识别模型
模版匹配 统计 (geometric) 语法系统 (structural) 神经网络 混合方法
模版匹配
Template
John P. Frisby, Seeing. Illusion, Brian and Mind, Oxford University Press, 1980
上图中哪些物体是树?人类可以非常容易的区分,而 计算机难以区分,例如将电线杆误识别为树
表示(Representation)的难题
如何教会人或者电脑看懂杂志中的讽刺漫画, 仅 仅是让其找从一组畸形的图片中找到人或者人脸 么? “A program that could distinguish between male and female faces in a random snapshot would probably earn its author a Ph.D. in computer science.” (Penzias 1989) 一种表示可能是一个实数值的向量,一列有序的 属性,一系列模块以及相互之间的关系….
模式识别与人工智能领域主要会议
CVPR,ICCV,ECCV,ACCV ICML,NIPS,ECML,COLT AAAI,IJCAI ICRA,IROS ICPR,ICIP
成绩评定方式
成绩评定方式
最新的顶级模式识别会议(如CVPR, AAAI)论文研 读,在此基础上形成读书报告,或 模式识别大程序 (可由2~3人组成一个小组,题目可选) 期末考试成绩 按适当的比例进行加权计算,形成总评成绩
识别(Recognition)
将一个模式标示为一个我们已知或者熟悉的分类 分类(Classification,已知类别),监督学习 聚类(Clustering,学习类别),无监督学习
Category “A”
Category “B” Clustering Classification
识别:猫、狗
自动检测获得车牌号码信息
功能模块: (i) 图像获取, (ii) 图像增强, (iii) 图像分 割, 字符识别 实时系统
典型应用
电子收费系统 自动交通事故报告
处理流程
车牌定位: 在整幅图像中定位出车牌 调整车牌的位置与尺寸: 自动对齐车牌,并且标准化车牌 尺寸 正规化图像: 调节图像亮度与对比度 特征分割: 找到单独的特征区域 字符识别 字符语法/几何分析: 在号牌规则指导下对字符识别进行检 查
Ray Kurzweil, NY Times, Nov 24, 2003
“The problem of searching for patterns in data is a fundamental one and has a long and successful history.” Bishop