开始
最近小编遇到一个很棘手的问题,就是将pdf或图片的文字内容提取出来,pdf的还好说,工具比较多,图片就比较有难度了。不过好在秉持坚持不懈的精神,终于给解决了,顺便把工具分享记录下!
关于OCR
Ocr(Optical Character Recognition),光学字符识别,就是将文本图像转换为机器可读文本格式,便于内容处理。
下载&安装(Windows)
Ocr工具有很多,开源或商用,如果条件允许还是建议支持官方正版;
本文介绍的工具很轻量化,无任何附加内容,安装即可使用,目前仅支持Windows系统;
获取方式很简单,直接公众号后台回复【ocr】即可获取
首先需要提取压缩包,如下图所示;

解压之后内容如下;

进入\Release目录,往下翻找到 天若OCR文字识别.exe 启动文件;

打开之后没有软件页面,默认在任务栏,如下图;

移动光标到icon,双击即开始截图,选择要提取的内容部分;

稍等片刻之后,就会弹出文本框,内容就是识别的结果,准确度还是很高的,毕竟ocr技术发展到现在是有很大提升了;
剩下就是自由发挥了,对于系统来说非常轻量,对于用户来说也是非常简洁,没有多余的操作;
注意事项
本工具没有任何病毒等损害利益的东西,请放心使用;
目前仅支持windows,后续小编会持续跟进其它系统;
如果过程中涉及其它问题,可以私信小编;
本文分享的内容均为学习自用,如有其它任何用途并造成任何后果均需自行承担,与小编无关,请谨慎使用。
END
大家好,我是安然,喜欢各种分享,希望能够帮助到你。
关注【安然见南山】(ID:anranshill)。如果你也喜欢我的不定时分享,
请记得⭐星标⭐