OCR文字识别系统
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
授课内容及教学活动设计附注(教学方法、活动形式、辅助手段等)
2•删除识别区域
3•更改识别区域的顺序
多个识别区域的使用,可以较好处理图文混排的稿件。
活动二识别之前稿件画面的处理
在实际应用中,稿件画面并不都像sample文件夹中那样理想,
或多或多少会有小许倾斜、污点等,这会影响到最后识别的效果。所以最好在识别之前,先对稿件画面进行一定的处理,以增加识别的准确率。
1•擦拭图像一一用“橡皮”工具擦去图像上的杂点或部分一块图像区域。
2.旋转图像一一可以对图像旋转90、180、270度的旋转。因
为在拍摄、扫描图像的过程中,可能会出现90、180、270度的差异。
3•倾斜校正一一拍摄或扫描图像的过程中,可以会形成几度的倾斜,用此功能可以将图像校正。
活动四其它类型稿件的识别
除了对中文内容的稿件进行识别外,汉王OCR文字识别系统
还可以对繁体中文、英文、表格等内容的稿件进行有效的识别。
任务1对繁体中文、英文、表格等内容的稿件进行识别
对繁体中文、英文的识别操作与中文相冋,只是在识别之前需要在工具栏最右边的下拉列表中选择“ 繁体字集”或“纯英文识别” 的选项。
任务2对含有表格的稿件进行识别含有表格稿件的识别操作与中文稿件的识别相冋。
任务3特殊网页的识别
1 .使用屏幕硬拷贝的功能将网页画面转换成图像文件。
2.用OCR软件对此进行识别,发现效果很差。
3.用Photoshop对图像文件进行分辨率的处理。
4.再用OCR软件对此进行识别,发现效果较好。
可以使用软件自带的样例图片进行上机实验,这些图片存放在sample 文件夹中。
可以使用sample文件夹中的文件进行上机操作。
可以将学生机与因特网相联。或将现成的网页图像提供给学生。