如何将扫描文件转换成可编辑的Word文档

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何将扫描文件转换成可编辑的Word文档?

豫竹千里草

汉王ocr文字识别软件V8.1免费中文版,是一个带有PDF 文件处理功能的OCR 软件;具有识别正确率高,识别速度快的特点。有批量处理功能,避免了单页处理的麻烦;支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF多种格式的图像文件;可识别简体、繁体和英文三种语言;具有简单易用的表格识别功能;具有TXT、RTF、HTM和XLS多种输出格式,并有所见即所得的版面还原功能。新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别,既可以采用OCR的方式将PDF文件转换为可编辑文档,也可以采用格式转换的方式直接转换文字型PDF 文件为RTF文件或文本文件。

下载地址:/baike/335364.shtml

一、PDF文件转换为RTF文件

操作步骤:

1.打开汉王PDF OCR,单击工具栏内左边第二个图标或按Ctrl+O 快捷键打开图像文件,然后找到并点选要识别的扫描文件。

2.单击对话框下方“PDF转换为RTF文件”或“PDF转换为TXT 文件”按钮,弹出如下对话框。

3.按提示设置完成后,单击“确定”即可直接将PDF文件转换为可编辑文件。

【注】:PDF文件转换为RTF文件时也可以选择下列操作方法:点击“输出”菜单中“PDF转换为RTF文件”和“PDF转换为TXT文件”选项,或点击工具栏中“PDF转换为RTF文件”

按钮(左边第三个按钮)和“PDF转换为TXT文件”按钮(左边第四个按钮),弹出下图对话框,您可以根据需要选择转换的图像页范围,点击“确定”,系统自动导出文件。

特别提示:

如果勾选“转换后打开RTF文件”,在转换后自动打开,如果不勾选则只转换保存文件,不打开。

如果未安装Word,导出后不能正确打开浏览,只能生成文件。

二、快捷键与工具按钮

1.快捷键

扫描文件:按下“Ctrl+N”调出扫描程序,扫描图像文件。打开文件:按下“Ctrl+O”打开图像文件,追加图像文件。保存图像:按下“Ctrl+S”键保存图像。

图像反白:按下“Ctrl+I”将图像反白。

自动倾斜校正:按下“Ctrl+D”进行自动倾斜校正。

手动倾斜校正:按下“Ctrl+M”进行手动倾斜校正。

版面分析:按下“F5”键,对选中的文件进行版面分析。

取消版面分析:按下“Ctrl+Del”键,取消当前页的版面分析。

取消当前栏:按下“Del”键或“Esc”键,取消当前栏属性标识。

版面识别:按下“F8”键,对选中的文件进行识别。

光标切换:按下“F9”键,光标在剪刀、画线笔、鼠标三种状态间切换。

左转图像:按下“Ctrl+L”将图像左转90度。

右转图像:按下“Ctrl+R”将图像右转90度。

向后翻页:按下“Page down”向后翻页。

向前翻页:按下“Page up”向前翻页。

撤消:按下“Ctrl+Z”键取消上一步操作。

剪切:按下“Ctrl+X”键剪切选中的内容。

复制:按下“Ctrl+C”键复制选中的内容。

粘贴:按下“Ctrl+V”键粘贴选中的内容。

向后找可疑字:按下“Ctrl+Tab”键。

向前找可疑字:按下“Shift+Tab”键。

2.工具按钮

:扫描图像。

:打开扫描好的图像文件。

:将PDF文件转换为RTF文件。

:将PDF文件转换为TXT文件。

:图像放大。

:图像缩小。

:选中全部图像文件。

:对所选图像进行分析识别。

:对所选图像版面分析。

:取消选中图像页的版面分析。

:标记/修改当前图像框的属性。

:取消当前图像框属性。

:将光标切换成鼠标状态。

:去除版面噪音,如黑点、黑框等。

:在图像页上画线,弥补断线处或将表格填补成标准表格。

:向前/向后翻页。

三、图像文件识别

1.打开要识别的扫描文件。

根据要求选择,一般情况下分辨率DPI选择默认300即可。单击“确定”。

2.按F8快捷键或单击“开始识别”图标,弹出如下对话框:

可以对图像文字进行识别、编辑(不再赘述)。

四、PDF文件转换为TXT文件

选择PDF转换成TXT文件,有太多不便。一是TXT格式只保存文字、表格部分,不保存图片;二是要转换成Word文档时尚需进行“复制”、新建Word文档、“粘贴”等操作后,才能保存为Word 文档格式。一句话,太麻烦了!

【附】

TXT是纯文本格式只保存文字、表格部分,不保存图片;

RTF是通用格式可以用WORD、WPS等文字处理软件编辑;

HTML是网页格式可以输出到IE等网络浏览器;

XLS格式可以用Excel 等软件编辑。

相关文档
最新文档