前几天帮小白敲论文的时候,从Google图书上参考了点内容,因为Google Book是没法下载的,难道要我一个字一个字的敲么! 作为一名懒人,才不会就这样屈服! 于是只用了3个软件,就快速的输入了全部内容!
软件:
Word2010,doPDF,CAJViewer
Word就不用介绍了。
doPDF是一款免费的PDF转换器,允许从任意一个有打印输出的程序中将文件输出为PDF。下载地址: 点击下载
CAJViewer是中国期刊网的专用全文格式阅读器,与超星阅读器类似。在这里主要用他的文字识别功能(OCR)。下载地址: 点击下载
方法:
1、 将图片转换为PDF(原生为PDF可忽略)doPDF
2、 对PDF进行文字识别 CAJViewer
3、 对识别出来的文字进行编辑 Word
操作步骤:
一、新建一个空白Word文档,用QQ或者其他截图软件将Google Book中你要录入的部分截取,直接粘贴到Word中,然后打印,注意打印机选择“doPDF”,点打印之后按提示保存即可。
二、在CAJViewer中打开刚才保存的PDF文档,然后点击红圈里那个按钮,即文字识别功能,像QQ截图那样选择要识别的区域,松开鼠标后等待一小会就会出现结果。
三、由于识别受图片或影印件的清晰度影响,会存在一些错误,你可以在CAJViewer里编辑一下再复制,在这里推荐直接复制到Word中,利用Word中“审阅—拼写和语法”这个功能配合原文进行纠正,效率比较高。
技巧:
1、 注意一定要用word输出PDF,我尝试过直接用doPDF把jpg转换为PDF以及直接用图片查看器打印输出,这两种方法转换出来的PDF质量都不高,在CAJViewer里识别出来全是乱码!
2、 如果是影印件图片清晰度不行建议先用PS修改一下。
3、 利用Word的“拼写和语法”功能会高效很多!
4、 以上步骤你可能要重复很多次!
5、 附我遇到的不清晰的情况下频繁出现的识别错误(以英文为例):
Se 识别为 x
e 识别为 c
gi 识别为“乡”
dy 识别为 “办”
y 识别为 v
[ 识别为 【或者L或者1
1 识别为 i或者L
3 thoughts on “三步将JPG或PDF转换为Word文档”