扫描参数设置2012
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
扫描参数设置2012-04-07 12:421.首先要保持工作环境的清洁,扫描仪的玻璃板以及若干个反光镜片及镜头,其中任何一部分脏污都会影响扫描文字图像的效果。因此,保持扫描仪的清洁是确保文字图像扫描质量及识别率较高的重要前提。
2.扫描仪在刚开启时,光源的稳定性较差,而且光源的色温也没有达到正常工作所需的色温,所以开始扫描以前最好先让扫描仪预热一段时间。
3.在放置扫描原稿时,把扫描的文字材料摆放在扫描起始线正中,可以最大限度地避免由于光学透镜导致的失真而影响识别率。
4.扫描后的文字图像经常会有一定角度的倾斜,出现这种情况必须在扫描后使用自动或手动旋转工具进行纠正,OCR软件一般都设有自动纠偏和手动纠偏工具。否则OCR识别软件会将水平笔画当作斜笔画处理,识别率会下降很多。如果扫描后的文字图像倾斜角度超过15°,倾斜校正会产生较大的失真和误差,从而严重影响识别率,这种情况建议摆正原稿重新扫描。
图2 分辨率、亮度、对比度的设定
三、扫描参数的设置
扫描参数的设置主要包括分辨率的设置及亮度和对比度的设置。
1.一般来讲,分辨率越高识别率也就会越高。但这也不是绝对的,对于一些过大过粗的字体,设置过高的分辨率,识别率可能会降低,而且设置高分辨率后,扫描速度会大大降低。根据实际经验,1、2、3号字的文稿推荐使用200dpi,4、小4、5号字的文稿推荐使用300dpi,小5、6号字的文稿推荐使用400dpi,7、8号字的文稿推荐使用600dpi(图2)。
2.扫描时适当地调整好亮度和对比度值,对识别率的高低影响很大,在进行扫描亮度和对比度的设定时(图2),以扫描后的图像中文字的笔画较细、均匀,且没有明显断点为准。如果扫描后的文字图像存在黑点、黑斑或文字线条很粗很黑,分不清笔画,说明亮度值太小,应该增加亮度值再重新扫描。如果文字线条凹凸不平,有断线甚至图像中汉字轮廓严重残缺时,说明亮度值太大,应减小亮度后再重新扫描。如果要扫描质量比较差的文稿,比如报纸,扫描出的图像可能会出现大量的黑点,而且在字体的笔画上也会出现粘连现象,为获得较好的识别结果,必须仔细进行亮度和对比度值的调整,反复扫描多次才能获得比较理想的效果。
四、识别后的处理工作
1.文字校正
文字校正是OCR识别工作中比较烦琐的一步。一般OCR软件对可能出现错误的文字,会显
示出蓝色标记,请用户确认。但在没有提示出错的地方,也有可能出错。所以大家在校对时应该通读一遍,以提高文字录入的准确率。
2.识别后文本的保存
如果把识别后的文本简单复制粘贴到Word中保存处理,就需要去掉多余的硬回车,这样会非常麻烦。正确方法是:先将识别后的文本存盘,在存盘时设置为软回车就行了。对于《紫光OCR》,则需要在识别完成后,选择文件菜单下的导出命令,将存储类型选为TXT,段内回车字符选为无。注意:一定不要直接存盘,否则不能自动去掉文章的硬回车。《
包装技术:谈扫描仪参数的设置
有 27 人阅读 (关于:IC)
自从1984年MICROTEK公司推出世界上第一台扫描仪以来,虽然只有十几年的历史,但扫描仪的市场与需求量出现了飞速增长的势头。随着电脑的普及,作为电脑的输入设备——扫描仪达到了异常火爆的程度,随着扫描仪厂商的增加,扫描仪用途的多样化,普及型扫描仪正走进千家万户,成为必不可少的电脑输入设备。
无论您使用哪个厂家生产的哪种类型的扫描仪,在扫描图像之前,必须先进行扫描参数的设置,其中包括输出图像的控制参数和图像增强工具。下面主要讨论扫描分辨率设置以及Gamma值调整时应注意的一些问题。
每一种扫描设备都具有分辨率限制,只有在限制范围之内工作时才能产生最好的图像。在理想的情况下,应该采用能被扫描仪的光学分辨率整除的输入分辨率按1:1的比例进行扫描。如对一台600ppi的扫描仪就应该是600ppi,300ppi,150ppi,100ppi,75ppi等。如果选用某一个其它的输入分辨率,那么为一个给定的象素确定彩色或灰度值时,扫描仪必须要进行匹配,并且要求平均值,这样势必降低原始图像的色调整体性。
扫描分辨率有光学分辨率和插值分辨率之分。光学分辨率是扫描仪的实际分辨率,是扫描仪的光学系统可以采样的最大信息量,是确定扫描清晰程度的最为关键的因素。内插分辨率是指在处理器或软件算法的帮助下扫描仪可以捕获的视在信息量。我们在扫描时,最好不要用高于扫描设备最大光学分辨率输入分辨率进行扫描。在采用内插分辨率时,扫描仪使用
基于硬件和软件的算法在图像上增添新的数据,虽然某些算法比较好,但永远不可能通过内插获得新的细节,而且由于这种方法是对象素值取平均数,因而实际上会恶化图像的清晰度和反差。但它对于一些有特定要求的图像或扫描线条图则十分有用。
在实际工作中,扫描分辨率的选择可依据图像原稿的清晰情况及扫描文件的用途来确定。对于正常的原稿来说,在扫描时,建议采用较低分辨率,因为分辨率会影响扫描速度与文件大小,当采用真彩或灰度模式时,使用100ppi-200ppi这样的低分辨率,也已超出大多数打印机和显示器所显示的能力。扫描分辨率与文件长度之间存在一种几何关系,例如,用RGB方式去扫描一幅3英寸×3英寸的照片,如果选择的输入分辨率为300PPi,那么产生的图像文件的长度约为2.4MB,如下面公式所示:
[3in.×3in.×(300ppi)2×3÷1000=2.43MB
如果再次扫描该图像,扫描分辨率加倍成为600ppi,那么文件长度将会是其4倍,如下所示:
[3in.×3in.×(600ppi)2×3÷1000=9.72MB
由此可以看出,当分辨率过高时,文件的大小会呈几何倍的增长,增加了操作的难度,也过多的占用了存储空间。如果扫描图像只作为屏幕显示用,一般情况下,设置的分辨率不必大于屏幕的分辨率,只需72ppi,因为屏幕的最高分辨率只有72ppi。
另外,在扫描设置时,我们还可以调整Gamma选项来调整颜色,一开始尝试较小的改变,并查看效果。例如:扫描夜晚的照片,若照片特别暗(正常曝光的照片),试着增加Gamma 值(可增加到1.6-1.9之间),这可以增加阴影区的细节,并且不会影响图像的整体色调范围。如果扫描雪景照片等很亮的照片,如明亮阳光下的滑雪照片,可减少Gamma值(到1.2-1.3),这可以显出明亮区域的细节,并且不会影响图像的整体色调范围。
取得最佳效果的唯一途径是不断实践。扫描时,当您预览扫描后,这些设置的改变将会反应到预览窗口中,可通过这种方式改变设置,并不需要真的扫描,即可检查设置的结果。