码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • Tesseract OCR安装与简单使用


    Tesseract OCR安装与简单使用

    1.下载Tesseract OCR

    下载地址:https://digi.bib.uni-mannheim.de/tesseract/
    在这里插入图片描述

    2.安装Tesseract OCR

    • 双击安装程序,进入安装界面。
      在这里插入图片描述

    • 接受协议,下一步。
      在这里插入图片描述

    • 选择用户
      在这里插入图片描述

    • 选择组件

      • 如果电脑配置够好、网速够快,可以之间勾选”Additional language data(download)“,下载全部额外的语言数据。
        在这里插入图片描述

      • 直接全选的话,后面下载语言包需要很长时间,导致安装进度缓慢。可以点击“Additional language data(download)”旁边的”+“号,选择几种需要的语言包。
        在这里插入图片描述

    • 设置安装目录。点击”Next“。
      在这里插入图片描述

    • 点击”Install“。
      在这里插入图片描述

    • 等待安装完成。
      在这里插入图片描述
      在这里插入图片描述

    • 安装完成。点击”Finish“。
      在这里插入图片描述

    • 将目录添加到系统环境变量Path
      在这里插入图片描述

    • 查看版本信息

      tesseract -v
    
    • 1

    在这里插入图片描述

    • 查看已下载的语言包。
      tesseract --list-langs
    
    • 1

    在这里插入图片描述

    3.文字识别程序编写

    • 安装pytesseract模块
    pip install pytesseract
    
    • 1

    在这里插入图片描述

    • 示例1:
    from PIL import Image
    import pytesseract
    
    
    # 添加tesseract的路径
    pytesseract.pytesseract.tesseract_cmd = r'D:\software\Tesseract-OCR\tesseract.exe'
    """
    image_to_string():如果识别英文或数字可以不必额外参数,如果识别其他语言则需要加上lang参数
    lang='chi_sim'表示要识别的是中文简体
    没有识别出来时,返回空白
    """
    text = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
    print(text)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13

    test.jpg:
    在这里插入图片描述
    识别效果:
    在这里插入图片描述

    • 示例2:

      test2.jpg:
      在这里插入图片描述
      识别效果:
      在这里插入图片描述

    • 示例3

      test4.png:
      在这里插入图片描述
      识别效果:
      在这里插入图片描述


    参考文章:

    • https://blog.csdn.net/weixin_51571728/article/details/120384909
    • https://blog.csdn.net/qq_53751944/article/details/125941604
  • 相关阅读:
    南方农业杂志南方农业杂志社南方农业编辑部2022年第19期目录
    听说你想面对监狱编程,你,够格吗?
    sftp和ftp的区别
    leetcode6. Z 字形变换python_字符串
    python+django车辆违章信息查询管理系统pycharm项目
    ardupilot BMI088加速度陀螺仪学习
    记LGSVL Map Annotation使用
    Cocos2d-x 3D渲染技术 (三)
    Linux命令从入门到实战 ---- 磁盘管理类
    图像相似度对比方法
  • 原文地址:https://blog.csdn.net/username666/article/details/126310781
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号