计算机系列 《扫描版pdf转换成文字版的方法》(文字版)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

扫描版pdf转换成文字

第一种办法:识别工具

如果你所得到的pdf文档是用扫描仪扫进去的图片转换的,那么就麻烦了,不过还是比手输入快多了,所以继续往下看。首先你用acrobat把pdf文件打开,然后点文件——>另存为——>把他保存成图片格式*.tiff(这是无压缩图片格式,以便识别),然后到网上下载文字识别软件,建议用尚书六号(现在好像出到七号了,很有名,随处都可以下到),安装好后,打开转换好的tiff图片,点击识别,看,文字出来了吧,尚书系列文字识别软件功能十分强大,你可以在里面把文字都编辑好了,再保存成rtf或txt文件,然后粘贴到word里就可以使用了,注意过滤回车符。

如果是影印版,也就是pdf 全都是扫描上去的图片格式,那你去下个汉王OCR。如果是文字版的话,就去下个 adobe acrobat 9 ,在文件的菜单下可以导出了。

尚书7号 :支持二楼的说法,PDF转WORD有这类软件,但对于你这种图片格式的根本没有用。

只能用文字识别这类软件如“尚书七号”但是还是要有一定的分辩率才能识别将其转成文档格式

赛酷OCR就可以完成你的要求,打开PDF识别,然后就可以导入WORD

如果你有扫描仪的话,就需要一款汉王OCR软件,如6800。如果没有扫描仪的话,需要购进一款汉王6800(或更高的级别的)扫描仪,随机赠送OCR软件。

它能够将扫描的文字直接导入到WORD中进行编辑。

第二种方法:office

上面几位朋友说的软件对于扫描的pdf格式文件即使能转换成word文档,也还是以图片格式显示,不能修改编辑。要真正转为Word而且能编辑修改的话,可用OCR文字识别软件。但我强烈推荐你用Office 2003中的M icrosoft Office Document Imaging组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:

用Adobe Reader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。

注:如果没有找到“Microsoft Office Document Image Writer”项,使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office 工具 Microsoft DRAW转换器”。

然后,运行“Microsoft Office Document Imaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操

作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。

以上仅在word2003中可用,其他版本没有Microsoft Office Document Image Writer。

相关文档
最新文档