光学字符识别技术研究答辩稿

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1 f ( x, y) 0
f ( x, y) T otherweise
预处理
图像二值化
1.二值化基本要求是：（1）笔画中不能出现空白；（2）二值化后的笔画基本保持原来文字的特征。 2.常用二值化方法（1）全局阈值法 Ostu 算法（2）局部阈值法Bernsen 算法（3）Ostu 算法和Bernsen 算法结合
行投影
列投影投影法流程
连通域法是基于“自底向上”的方法
原始图像
二值化图像
由最小连通域组成的图像
图像行、列投影图
由分栏组成的图像
由确定属性的分栏组成的图像
a
识别结束
b
连通域法流程图
不同版块垂直投影
3.字符分割
混排字符切分算法（1）文本块粗切分
字切分行切分
水平投影
垂直投影
xoy 计算了总长为27.127inch(689.03mm)，球直径为5.894inch(149.70mm)，缝长和缝宽均为0.25inch（6.35 mm）的锥球带缝体在“
合并方法流程图
4.其他环节
特征提取
字符图像的细化基于检测字符骨架中闭合曲线的初分类基于字符骨架纵向线条特征第二次初分类
单字识别
从扫描文字中分检出的文字图像，由计算机将其图形、图像转变成文字的标准代码。
后处理
将单字识别的结果进行分词，与词库中的词组进行比较，以提高系统识别率，减少误差。
三、研究工作的总结
OCR流程图
二、论文的主要内容
本文的主要内容就是对光学字符识别过程中，每一环节的处理方法的பைடு நூலகம்究和验证。 1、图像输入和预处理
2、版面分析
3、字符分割 4、其他环节
1、图像输入和预处理
图像输入技巧
（1）文字识别的重要前提是分辨率的设置。（2）扫描时适当地调整好亮度和对比度。（3）扫描半透明文稿时，在背面附盖一张黑纸。（4）手动选取扫描区域会有更好识别效果。（5）扫描文字材料一定要摆放在扫描起始线正中。（6）应保护扫描仪玻璃的干净和不受损害。
0。
f 3GHZ 。
字符类型判定
所有连通区域
汉字连通区域
非汉字连通区域
字符周期性
汉字部件其他非中文字符
字符类型判定过程
混排周期性
中文字符连通区域的分离
字符类型判断保存切分结果
粗切分
部件合并
识别模块
合并方法流程图
中文字符分离结果
汉字部件分离结果
光学字符识别技术研究
专业名称：学生姓名：指导教师：
基本内容
一、论文研究的背景二、论文研究的主要内容三、研究工作的总结
一、论文研究的背景
随着计算机技术的推广应用，尤其是互联网的日益普及，人类越来越多地依赖计算机获得各种信息，因此信息
处理工作也都转移到计算机上进行。因此，要求有一种能
将文字信息高速、自动地输入计算机的方法，即光学字符识别技术。 OCR（Optical Character Recognition，光学字符识别）是指电子设备检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；
谢谢大家！
文字识别技术的研究就有很强的技术和理论挑战性，也具有较大的实用性价值和广泛的应用前景，是推动模式识别技术产业进程的关键。本论文主要对文字图像的识别进行了一些探索性的理论研究，观察分析了文字图像识别的难点，以其自身特性和规律作为知道，在各个模块的实现方法上做了一些深入细致的研究。目标就是从理论、方法和应用三个层次上研究OCR的高性能识别问题。
二值化结果对比
原灰度图
Ostu 方法
Bernsern 方法
混合方法
2.版面分析
版面分析方法
（1）“自顶向下”的方法此方法就是将图像由较大的区域不断的细分为更小的区域（2）“自底向上”的方法此方法是先分割出文档图像较小的区域，然后再不断合并为更大的区域，从而完成对图像的分割任务
投影法是“自顶向下”方法的基础