【原创】职场利器2——利用TextGrabber实现快速OCR

楼主  收藏   举报   帖子创建时间:  2019-01-24 10:29 回复:0 关注量:143
职场利器2——利用TextGrabber实现快速OCR

工作中经常会遇到需要将纸质材料转换成电子文档,这时你会怎么操作?是一个一个地码出来,还是扫描+OCR?No,No,No,这些都太OUT了,现在和我一起来学习利用手机拍照+TextGrabber实现快速OCR,只需几秒钟就可以将一个版面的资料快速转换成电子文档。
1软件简介
以下是网络上对TextGrabber的简介:
ABBYY TextGrabber是一款易于使用的应用程序,只需在任何印刷源上对您感兴趣的文本进行拍照,然后选择所需的选项即可。这都归功于 ABBYY 的 Mobile OCR 技术,TextGrabber +Translator 可为您提供高质量的效果,并在几秒钟内识别超过 60 种语言的任何平文本。此应用程序支持超过40种语言的全文本翻译,并可以与 Lingvo Dictionaries 应用程序集成,让您访问最新的综合词典,帮助您翻译不熟悉的词语。您也可以在应用程序内直接搜索互联网,以查找有关任何您不熟悉的字词或条目的附加信息。使用保存历史功能,有用的信息绝不会丢失。若要恢复您的数据,只需打开历史文件夹或者打开并识别先前文本的截图即可。
2下载并安装
在度娘上输入“TextGrabber”并搜索,点击进入第一条搜索结果“ABBYY TextGrabber-_安卓应用下载-_百度手机助手”,下载TextGrabber安装包。

图1 软件下载页面
安装后的界面如下(请注意右下角显示的是EN):

图2 软件安装后的初始界面
3设置
TextGrabber安装后需要进行必要的设置才能使用。首先点击右上角“┇”图标,然后点击setting出现设置界面:

图3 识别语言设置界面
需要识别简体中文(SimplifiedChinese)的,在Chinese S.后面的方框内打勾;需要识别繁体中文(Traditional Chinese)的,在Chinese Tr.后面的方框内打勾。在选中语言选项后,软件需要下载相应的语言包,点击Download开始下载,速度较慢,可能要数分钟才能完成。

图4 识别语言包下载界面
语言包下载后自动加载,软件右下角显示的内容变成了EN和ZH-CN。很奇怪这里的简体中文为什么不是CS。

图5 加载中文语言包后的软件界面
4识别
现在可以用TextGrabber来识别材料了。
4.1拍照识别
点击拍照按钮,启动照相机。将需要识别的材料全部纳入范围后拍照,出现浏览界面,不满意可点击左上角“×”按钮后重拍,满意点击右上角“√”按钮进入裁剪环节。需要裁剪的话,直接拉动图片四边的线条即可进行裁剪,不需要裁剪的话,可直接点击右上角READ进行识别。

图6 拍照识别之照片页面
识别的速度还是很快的,一般只要数秒即可。

图7 拍照识别之识别结果页面
由于这张图片拍自报纸,印刷质量相对较差,相应的识别率要稍微低一点。但对于一个一个码字来说,速度已经提高了不少。如果是印刷质量较高的书籍,识别率会好很多。
4.2图片识别
图片模式用途非常大,到图书馆或书店看到好的资料,可以先拍照回来慢慢OCR;网络上有一些资料因加密只能浏览不能复制,可以截图后慢慢OCR;检测标准或参考资料是图片转换的PDF文档,可以先用Adobe Acrobat转换成图片,然后慢慢OCR。具体方法是:
点击图片按钮,选择相应的图片,出现浏览界面,不满意可点击左上角“×”按钮后重新选择,满意点击右上角“√”按钮进入裁剪环节。需要裁剪的话,直接拉动图片四边的线条即可进行裁剪,不需要裁剪的话,可直接点击右上角READ进行识别。

图8 手机版论坛截图页面

图9 载入截图后进行适当裁剪

图10 截图识别结果页面
5分享
识别后的文本,可通过多种方式进行分享。点击右上角分享按钮,可以将内容通过QQ、微信等方式传输到电脑,或直接发送给好友。

图11 识别结果分享页面
6体会
总的来说,TextGrabber是一款非常不错的OCR软件,不仅可以直接拍照后识别,也可以载入图片进行识别,用途广泛,识别率也较高,实为人在职场之一把利器。