机器视觉第7章 模式识别技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第7章 模式识别技术 10
7.1.1 印刷体字符识别
2. 字符切分的方法
目前,字符识别的方法大多停留在单字识别上,因此需 要对获得的字符区域进行二次分割,以得到单个的字符区域。 正常情况下的高质量图像字符区域,采用形态分割的方 法就可以将单字区域分割出来。例如,采用 3.5 节介绍的图 像投影法。 质量较低、背景较复杂的字符区域,字符分辨率一般较 低,可能有背景干扰,会造成字符残缺、粘连等现象,需要 进一步采用特定的方法进行单字分割。
―这些结构特征往往与句法分类方法配合使用。
第7章 模式识别技术
21
7.1.2 手写体字符识别
根据模式特征的不同选择及判别决策方法的不同,识别方 法分为5类
统计模式法 句法结构法 逻辑特征法
以同类模式具有相同属性为基础的识 别方法。 描述事物属性的参量叫做特征,可以 通过模式的多个样本的测量值统计分析 后按一定准则来提取。
第7章 模式识别技术
16
一种模式识别的方法——模板匹配法
模板匹配中常用特征
灰度特征:适用于无变形、无破损的场合。 方向轮廓特征
统计特征
矩特征 局部特征 点特征 Gabor纹理特征 形态特征 ……
统计识别方法是模式识别领域中应用最 广泛的方法之一。它利用特征向量来描述特 征,识别时根据输入模式与标准模式特征向 量之间的相似度做出判决。 字符识别中常用的特征有:方向线素、 穿越、交叉度、外围、网格等特征。 利用统计特征进行字符识别,算法丰富, 抗噪声能力强。适用于字符骨架清楚、边缘 不齐整的场合。
统计模式法 句法结构法 逻辑特征法
对待识别的未知样本,先抽取样本的 基元构造出样本的句子,然后分析该句 子满足什么样的句法,从而推断出它属 于哪个模式类。
模糊模式方法
神经网络方法。
优点:能反映模式的结构特征,对模 式的结构特征变换不敏感,比较适合联 机识别。
缺点:字符基元的抽取比较困难,不 太适合脱机识别;方法的理论基础还不 可靠,抗干扰ቤተ መጻሕፍቲ ባይዱ力较弱。
第7章 模式识别技术
第7章内容
7.1 字符识别
7.2 车牌识别 7.3 工件识别 7.4 条码识别 7.5 医学图像识别
第7章 模式识别技术
2
7.1 字符识别
印刷体字符识别
手写体字符识别
联机识别 脱机识别
低 识 别 难 度 高
第7章 模式识别技术
3
7.1.1 印刷体字符识别
1. 识别流程:
第7章 模式识别技术
11
7.1.1 印刷体字符识别
2. 字符切分方法
一串字符存在如下结构和形态特征: 1) 单个字符长度比例 一致; 2) 多个数字和英文字符轮廓存在凹凸结构; 3) 多数 情况下字符不会出现重叠交叉。 根据以上特征,可以检测字符串凹凸结构,结合字符长宽 比来分割单个字符。基本流程如下: 1) 读取二值化字符图 像;2)上下轮廓求取;3)检测凹结构;4)检测凸结构;5)确 定凹凸结构组;6)切分调整;7)切分图像。 常用的字符切分方法:滴水算法、 Viterbi 算法、基于细化 的算法、储水区算法、基元合并法和形态检测法等。
19
一种模式识别的方法——模板匹配法
模板特征和样本特征相似程度的三种判别法则:相似度 和隶属度、距离判别、交叉相关。 交叉相关
交叉相关是一种分类器。
正规化的交叉相关定义为:
R
1 2 F i Fi i 1 1 2 F F i i i 1 i 1 N N
N
―Fi1是识别字符和模板字符的特征向量的第i个特征。
18
一种模式识别的方法——模板匹配法
模板特征和样本特征相似程度的三种判别法则:相似度 和隶属度、距离判别、交叉相关。
距离判别
定义距离用于描述目标图像和模板图像的相似程度。 基于空间点的距离:
―欧式空间距离、城区距离、棋盘距离
基于空间点集的距离:
―Hausdorrf距离。
第7章 模式识别技术
先将图像切割为行 ( 列 ) , 再从字符图像中分离出单个 字符。
当图像质量很差时,不易 进行简单的分割,常与识别 过程相结合。 随着单字识别率的增高, 切割错误在所有错误中占的 比重不断上升,怎样实现字 符的正确分割成为需要认真 解决的问题。
⑧ 识别结果的编辑修改后处理
第7章 模式识别技术 6
7.1.1 印刷体字符识别
第7章 模式识别技术 4
7.1.1 印刷体字符识别
1. 识别流程:
① 扫描输入文本图像 ② 图像预处理 ③ 图像版面的分析和理解 ④ 图像的行切分和字切分 ⑤ 基于单字图像的特征选择和提取 ⑥ 基于单字图像特征的模式识别 ⑦ 将被分类的模式赋予识别结果
首先,对图像进行总结分 析,标示文本的段落,图表, 表格区域。
第7章 模式识别技术 17
一种模式识别的方法——模板匹配法
模板特征和样本特征相似程度的三种判别法则:相似度
和隶属度、距离判别、交叉相关。
相似度和隶属度
相似度:描述两个或多个目标体特征间相似程度的度量值。 隶属度:描述一个目标对另一个目标特征相对位置关系紧
密程度的度量值。
第7章 模式识别技术
模糊模式方法
神经网络方法
第7章 模式识别技术
26
7.2 车牌识别
汽车已成为日常生活中不可或缺的代步工具,随 之出现的是不断恶化的交通困扰。交通拥挤、交通事 故、环境污染、能源短缺是各国面临的共同问题。 传统的解决方案是修建道路。然而可供修建道路 的空间越来越小,此外交通系统是一个复杂的大系统, 单从车辆或道路方面考虑,难以完美解决问题。 上世纪末,美国、欧洲和日本等工业发达国家开 始进行智能交通系统(Intelligent Transportation System, ITS)的研究,希望解决汽车带来的交通问题。
i, j 2 m n m n
2
一种模式识别的方法——模板匹配法
模板匹配中常用特征
灰度特征:适用于无变形、无破损的场合。 方向轮廓特征
统计特征
矩特征 局部特征 点特征 Gabor纹理特征 形态特征 ……
方向轮廓信息通过字符的外围特征 来描述,符合人的感官认知过程。 该方法忽略了字符的内部细节,因 而具有较强的抗干扰能力,消除了因字 符内部粘连、不能提取细节特征造成的 识别困难。 适用于字符框架完整但内部有污损 的场合。
⑧ 识别结果的编辑修改后处理
第7章 模式识别技术
9
7.1.1 印刷体字符识别
1. 识别流程:
① 扫描输入文本图像 ② 图像预处理 ③ 图像版面的分析和理解 ④ 图像的行切分和字切分 ⑤ 基于单字图像的特征选择和提取 ⑥ 基于单字图像特征的模式识别 ⑦ 将被分类的模式赋予识别结果
核 心 技 术
⑧ 识别结果的编辑修改后处理
13
一种模式识别的方法——模板匹配法
相似度度量公式:
D i, j S
m 1 n 1
M
M
i, j
m, n T m, n
第7章 模式识别技术
2
14
一种模式识别的方法——模板匹配法
相似度度量公式:
M M
D i, j S
m 1 n 1
1. 识别流程:
① 扫描输入文本图像 ② 图像预处理 ③ 图像版面的分析和理解 ④ 图像的行切分和字切分 ⑤ 基于单字图像的特征选择和提取 ⑥ 基于单字图像特征的模式识别 ⑦ 将被分类的模式赋予识别结果
从单个字符中提取统 计特征或结构特征,是 整个识别中最重要的步 骤。 特征提取的好坏,直 接决定识别的性能在特 征提取前,常进行归一 化、细化处理。
然后,对文本区域进行识 别处理,对表格区域进行专 用的表格分析及识别处理, 对图像区域进行简单的压缩 或存储。
⑧ 识别结果的编辑修改后处理
第7章 模式识别技术 5
7.1.1 印刷体字符识别
1. 识别流程:
① 扫描输入文本图像 ② 图像预处理 ③ 图像版面的分析和理解 ④ 图像的行切分和字切分 ⑤ 基于单字图像的特征选择和提取 ⑥ 基于单字图像特征的模式识别 ⑦ 将被分类的模式赋予识别结果
⑧ 识别结果的编辑修改后处理
第7章 模式识别技术 7
7.1.1 印刷体字符识别
1. 识别流程:
① 扫描输入文本图像 ② 图像预处理 ③ 图像版面的分析和理解 ④ 图像的行切分和字切分 ⑤ 基于单字图像的特征选择和提取 ⑥ 基于单字图像特征的模式识别 ⑦ 将被分类的模式赋予识别结果
从学习得到的特征库 中找到与待识别字符相 似度高的字符。 为了提高识别速度, 常采用树分类器。
⑧ 识别结果的编辑修改后处理
第7章 模式识别技术 8
7.1.1 印刷体字符识别
1. 识别流程:
① 扫描输入文本图像 ② 图像预处理 ③ 图像版面的分析和理解 ④ 图像的行切分和字切分 ⑤ 基于单字图像的特征选择和提取 ⑥ 基于单字图像特征的模式识别 ⑦ 将被分类的模式赋予识别结果
对单字识别的结果, 利用语义、词频、语 义等先验知识进行识 别结果的确认或纠错。
第7章 模式识别技术 12
7.1.1 印刷体字符识别
3. 字符识别方法
识别的方法多集中在 分类器和分类方法上, 包括:模板匹配、神 经网络、聚类支持向 量机等。
开始 模板训练? 模板特征提取 样本特征提取
特征匹配
广义上,任何一种模 式识别的方法都可以 用来进行字符识别。
辨识结果
结束
第7章 模式识别技术
① 扫描输入文本图像 ② 图像预处理 ③ 图像版面的分析和理解 ④ 图像的行切分和字切分 ⑤ 基于单字图像的特征选择和提取 ⑥ 基于单字图像特征的模式识别 ⑦ 将被分类的模式赋予识别结果
通过扫描仪、 CCD 或传真机等 获得,一般是灰度或黑白图像。
倾斜校正、去噪、二值化、分 割等。
⑧ 识别结果的编辑修改后处理
第7章 模式识别技术 23
7.1.2 手写体字符识别
根据模式特征的不同选择及判别决策方法的不同,识别方 法分为5类
统计模式法 句法结构法 逻辑特征法
特征的选择对一类问题来说是独一无 二的,即在一类问题中只有一个模式具 有某一种(或某一组合)的逻辑特征。 该方法建立了关于知识表示及组织、 目标搜索及匹配的完整体系。对需要通 过众多规则推理达到识别目标的问题, 有很好效果。 当样品有缺损、背景不清晰、规则不 明确甚至有歧义时,效果不好。
i, j
m, n T m, n
2

0R(i, j)1; Si,j(m,n)=T(m,n); R(i,j)取极大值1。
归一化的相关函数:
R i, j
i, j S m, n T m, n m n
T m, n S m, n
模糊模式方法
神经网络方法
选择特征时,用于各类模式的特征应 该将同类模式的各个样本聚集在一起, 使不同模式的样本尽量分开,以保证识 别系统具有足够高的识别率。
第7章 模式识别技术
22
7.1.2 手写体字符识别
根据模式特征的不同选择及判别决策方法的不同,识别方 法分为5类
对每个模式都用一个句法表示。
―R越大,识别字符与模板字符相似程度越大。
第7章 模式识别技术 20
7.1.2 手写体字符识别
根据识别使用的特征,识别方法分为两类。
全局分析
―使用模板匹配、像素密度、矩、特征点、数学变换等方法。 ―这类特征常和统计分类方法一起使用。
结构分析
―从字符的轮廓或骨架上提取字符形状的基本特征,包括圈、端 点、节点、弧、突起、凹陷、笔画等。
模糊模式方法
神经网络方法。
第7章 模式识别技术
24
7.1.2 手写体字符识别
根据模式特征的不同选择及判别决策方法的不同,识别方 法分为5类
统计模式法 句法结构法 逻辑特征法
用隶属度函数作为目标与模板相似 程度的度量,能反映整体的、主要的 特性。
模糊模式方法
神经网络方法。
该方法有较强的抗干扰与抗畸变特 性,难点在于如何建立准确合理的隶 属度函数。
第7章 模式识别技术
25
7.1.2 手写体字符识别
根据模式特征的不同选择及判别决策方法的不同,识别方 法分为5类
统计模式法 句法结构法 逻辑特征法
可处理某些环境信息十分复杂、背 景知识不清楚、推理规则不明确的问 题。 允许样品有较大的缺损、畸变。 运行速度,自适应性能好,有较高 的分辨率。
相关文档
最新文档