知网格式转换
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何将中国知网CAJ、NH、KDH格式文件转换成WORD
开始做毕业论文,发挥信息时代网络的强大力量。找论文,一般就去中国知网。
从中国知网下载而来的资料,大都是.CAJ、.NH、.KDH、.PDF等格式,需使用中国期刊网的专用全文格式阅读器 CAJViewer 全文浏览器进行查看。.PDF转换成.DOC格式,网上能找到很多的方法,自己动手去找吧。在这里,主要介绍的是.CAJ、.NH、.KDH等使用 CAJViewer全文浏览器阅读的文件转换成.DOC格式文件。
首先到中国知网()下载CAJViewer阅读器,安装CAJViewer阅读器软件。运行CAJViewer阅读器并点击“文件”打开.CAJ、.NH、.KDH等格式文件。接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将.CAJ、.NH、.KDH等格式文件输出为MDI格式的虚拟打印文件。
(如果你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。)
运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不用管它,点确认即可。
(目前,包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。)大功告成!补充一下,PDF格式文件也可以按照上面的方法转换成DOC格式文件。
还有一个方法如下所述:
首先用CAJViewer7.02版本阅读器打开nh文件,在你当前打开页的左上方有个保存为图片的按钮
,把当前页面保存为图片。然后下载安装一个汉王6.0,安装好后打开。注意,此软件安装好后没有快捷方式,需要按照下面的步骤打开:开始--程序--汉王 ocr6.0--汉王ocr6.0.打开后按照下面的操作就可以识别图片,转换成文字。文件--打开图像--识别--开始识别--输出--到指定格式文件,保存为txt文件就可以了。现在打开刚刚保存的文件,是不是看见文字转换好了!还有一个方法:
1、从CAJ格式的文件中提取文本前需要做好以下准备工作,安装CAJViewer7.02版的CAJ浏览器软件(系统中一定要有Office2003或者是office2007 办公软件);
2、从网上下载CAJ格式的资料文件保存到本地硬盘上。
3、启动CAJViewer浏览器程序,用CAJViewer7.02打开刚才保存的CAJ格式的文件。
4、(1)用CAJViewer7.02打开caj 文件;(2)单击“选择图像”按钮,然后在每页的左右两边分区域选取文字(如图:红色区域内);(3)再在选取区域内,单击右键,右键选击“文字识别”,这时会出现“文字识别结果”对话框,单击“复制到剪贴板”或“发送到word”,按你的需要点击,即可大功告成。
打开word 看看,就是你想要的文字了,随便编辑。
不足:就是不能对整篇、整页文档进行识别(整页识别会出现许多乱码),不过这样也算不错了,毕竟能够识别了,而且识别率也比较高了