文字识别算法

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

题目图像分割技术

学院计算机科学与技术班级计软1401

学生兰俊锋

学号 20141214023

文字识别是智能识别技术中的一个重要技术。文字具有便于信息保存和传递的优点，使信息在时间和空间上得以迅速扩散。在人们的日常生活中，在机关事务处理、工业以及商业交往中，需要识别文字的数量如同天文数字，但利用计算机识别的文字量却很少。最近几年，随着计算机技术、数学和图像技术的发展，文字识别的应用领域逐步扩大，目前较为活跃的应用包括数字识别，文字识别等。文字识别是指用计算机字典、高速地识别现在介质（如纸张等）上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题，一般通过特征及特征匹配的方法来进行处理。

本文将从算法、应用两方面介绍文字识别技术，本文介绍的文字识别应用有英文字母识别、车牌特殊文字识别、书写文字识别、特殊文字识别。

文字是人类相互交流信息的重要工具。社会发展进入信息时代，人们已不再停留在用自己的耳朵和眼睛去直接获得这些信息，而是使用计算机将文字自动的输入计算机，用计算机对他们进行处理，随时以各种方式满足人们的不同需要。因此，研究如何用计算机自动识别文字图像，解决文字信息自动输入计算机，并进行高速加工处理的问题已引起大家的广泛关注。

归一化算法一般作为一种图像的预处理技术，其目的是将采集到的原始图像转换成特征提取器所能接受的形式(灰度图像或二值图像)，消除一些与类别无关的因素(噪声消除、归一化等) 。从理论上讲，经过归一化后的骨架应该是宽度为一的中心线，但这是不可能的。不同的硬件设备和不同的算法得出的结果可能不是唯一的，其结果与原图案的扭曲程度也是不～样的，扭曲程度尽量的小应该是归一化算法追求的目的之一。既然预处理是为后续的特征提取和分类器设计服务的，那么预处理方法的选择就应该有利于特征的提取，以使分类变得简单。

汽车牌照识别，在高速公路收费、电子警察和治安卡口等系统中有重要的应用价值。作为图像识别的典型问题，汽车牌照识别的研究有很长的历史，但因为实际路况的高度复杂性（如车速、光线、污染及变形等），目前的性能还不能令人满意。

1.文字识别过程概述

一般来说，文字图像的识别过程主要由以下 4 个部分组成：①正确地分割文字图像区域；②正确地分离单个文字；③正确识别单个文字；④正确地连接单个文字。其中①、④属于文字图像分析技术问题，③属于文字识别技术问题。关于②，由于仅从分割处理不能对其进行评价，通常采用文字识别地评价值来判断分离的正确性。单纯的文字识别是指经二值化处理后的单个文字识别。

1.1.文字识别系统的原理及组成

文字图像的识别的原理如下图所示。图中光电变换检测部分的主要功能，是对纸面上的文字进行光电转换，然后经模数转换成具有一定灰度的数字信号，送往其后的各部分进行处理和识别。常用的检测设备是扫描仪，CCD 摄像头等。文字图像分割的目的就是根据文字图像的特征的视线文字图像区域的定位和分割，将真正的文字图形分割出来，以便后续进行识别，识别与处理部分的功能是将已分割出的文字图形信息加以区分，去除信号中的污点、空白等噪声，增强文字图像的信息。并根据一定的准则除掉一些非本质信号，对文字的大小、位置和笔画粗细等进行规范化，以便简化判断部分的复杂性。特征提取部分是从整形和规范化的信号中抽取反映字符本身的有用信息，供识别部分进行识别。作为特征提取的内容是比较多的，可以是几何特征，如文字线条的端点、折点和交点等。识别判断部分则是根据抽取的特征，运用一定的识别原理，对文字进行分类，确定其属性，达到识别的目的，实际上判断部分就是一个分离器。

识别系统学习部分的功能是生成计算机特征字典，学习根据已准备好的多个字样，抽出代表该字的特征，进行修改，按照字典的规定位置存放该特征。学习分为两种：一种是在人的参与下进行，称为“有教师”学习；一种由计算机自动进行，称为“无教师学习”。

1.2.文字识别的方法

文字识别是指用计算机字典、高速地识别现在介质（如纸张等）上的数字、英文符号或汉字。文字识别实际上就是解决文字的分类问题，一般通过特征及特征匹配的方法来进行处理。

特征判别是通过文字类别（例如英文或汉字）的共同规则（如区域特征、四周边特征等）进行分类判别。它不需要利用各种文字的具体知识，根据特征抽取的程度（知识的使用程度）分解到地使用结构分析的办法完成字符的识别。

匹配的方法则是根据各国文字的知识（称为自动）采取按形式匹配的方法进行。按实现的技术途径不同又可分为两种：一种是直接利用输入的二维平面图像与字典中记忆的图像进行全域匹配；另一种是只抽出部分图像与字典进行匹配。然后根据各部分形状及相对位置关系，与保存在字典中的知识进行对照，从而识别出每一个具体的文字。前一种匹配方法适合于数字、英文符号一类的小字符集；后一种匹配方法适用于汉字一类的大字符集。

1.3.边缘检测

边缘(Edge)是指图像局部亮度变化量最显著的部分。边缘主要存在于目标与木板、目标与背景、区域与区域（包括不同色彩）之间，是图像分割、纹理特征提前和形状特征提取等图像分析的重要基础。图像分析和理解的第一步常常是边缘检测。由于边缘检测十分重要，因此成为机器视觉研究领域最活跃的课题之一。

图像中的边缘通常与图像亮度或图像亮度的一阶导数的不连续性有关。图像亮度的不连续可分为：①阶跃不连续，即图像亮度在不连续处的两边的像素灰度值有着显著的差异；②线条不连续，即图像亮度突然从一个值变化到另一个值，保持一个较小的行程后又返回到原来的值。在实际中，阶跃和线条边缘图像是很少见的，由于大多数传感元件具有低频特性，使得阶跃边缘变成斜坡型边缘，线条边缘变成屋顶形边缘，其中的亮度变化不是瞬间的，而是跨越一定的距离。

对一个边缘来说，有可能同时具有阶跃和线条边缘特性，例如在一个表面上，由一个平面变化到发线方向不同的另一个平面上就会产生阶跃边缘；如果这一表面具有镜面反射特性且两平面形成的棱角比较圆滑，则当棱角圆滑表面的法线经过镜面反射角时，由于镜面反射分量，在棱角圆滑表面上会产生明亮光条，这样的边缘看起来像在阶跃边缘上叠加了一个线条边缘。由于边缘可能与场景中物体的重要特征对应，所以它是很重要的图像特征。比如，一个物体的轮廓通常产生阶跃边缘，因为物体的图像亮度不同于背景的图像亮度。

2.简单贝叶斯分类器

简单贝叶斯分类器（Simple Bayes Classifier或Naïve Bayes Classifier）[1]假定特征向量的各分量间相对于决策变量是相对独立的。对于特征向量为

X=[x

1,x

, (x)

]T的测试样本，它属于第C

类的条件概率为：

P(C

i |X)=P(X|C

)*P(C

)/P(X)

=(P(C

)/P(X)) (1)

对每一个类别（即取不同的值）都计算上面的条件概率，最终的识别结果为条件概率最大的那一类别。虽然简单贝叶斯分类器是基于独立性假设的，在违背这种假定的条件下简单贝叶斯也表现出相当的健壮性和高效性678，它已经成功地应用到分类、聚类等问题中。

2.1.简单贝叶斯分类器在切分中的应用