码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • java 通过Tess4j 读取图片中的文字


    Maven依赖导入Tess4j

    1. <!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
    2. <dependency>
    3. <groupId>net.sourceforge.tess4j</groupId>
    4. <artifactId>tess4j</artifactId>
    5. <version>4.5.4</version>
    6. </dependency>

    下载Tessdata语言库

    https://gitee.com/superaskar/tessdata

    解压后的文件库

    代码实现:

    1. import javax.imageio.ImageIO;
    2. import java.awt.image.BufferedImage;
    3. import java.io.File;
    4. import net.sourceforge.tess4j.ITesseract;
    5. import net.sourceforge.tess4j.Tesseract;
    6. public class ITesseract{
    7. /**
    8. *
    9. * @param srImage 图片路径
    10. * @param ZH_CN 是否使用中文训练库,true-是
    11. * @return 识别结果
    12. */
    13. public static String FindOCR(String srImage, boolean ZH_CN) {
    14. try {
    15. System.out.println("start");
    16. double start=System.currentTimeMillis();
    17. File imageFile = new File(srImage);
    18. if (!imageFile.exists()) {
    19. return "图片不存在";
    20. }
    21. BufferedImage textImage = ImageIO.read(imageFile);
    22. //Tesseract instance=Tesseract.getInstance();
    23. ITesseract instance = new Tesseract(); // JNA Interface Mapping
    24. instance.setDatapath("D:\\Program Files\\tessdata-master");//设置训练库
    25. if (ZH_CN)
    26. instance.setLanguage("chi_sim");//中文识别
    27. String result = null;
    28. result = instance.doOCR(textImage);
    29. double end=System.currentTimeMillis();
    30. System.out.println("耗时"+(end-start)/1000+" s");
    31. return result;
    32. } catch (Exception e) {
    33. e.printStackTrace();
    34. return "发生未知错误";
    35. }
    36. }
    37. public static void main(String[] args) throws Exception {
    38. String result=FindOCR("C:\\Users\\mycom\\Pictures\\8d7d90385ea742b58fda9d4de1fe3241.png",true);
    39. System.out.println(result);
    40. }

    原图:

    识别结果:

    有点低啊

     提高识别率:

    tess4j图片识别 和训练语言库提高图片识别率

     https://www.cnblogs.com/tiansc1/p/15773740.html

     

  • 相关阅读:
    阻容降压电阻应用
    ArcGIS综合制图教程,简单上手!
    jquery控制easyui中combobox、textbox显示隐藏
    win10部署 Mistral-7B 文本生成模型
    中学校园IP网络广播系统解决方案-校园数字IP广播系统建设指南
    NET7下用WebSocket做简易聊天室
    托管服务器常见的问题有哪些(常见托管问题解决)
    Vue2.0开发之——Vue基础用法-侦听器(27)
    Flink Java 之 Savepoints
    jenkins升级版本遇到的问题
  • 原文地址:https://blog.csdn.net/zhaofuqiangmycomm/article/details/133900739
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号