• PaddlePaddle飞浆搭建和机器学习文字识别


    PaddlePaddle飞浆搭建和机器学习文字识别

    文章转自:https://lingkang.top/archives/paddlepaddle-fei-jiang-da-jian-he-ji-qi-xue-xi-wen-zi-shi-bie

    官网:https://www.paddlepaddle.org.cn/
    飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

    安装 PaddlePaddle 对python版本是有要求,2022年11月21日15:04:36最新的PaddlePaddle(2.3.2)不能用最新python安(3.11.0)装。可以使用3.7、3.8、3.9的python版本安装,其他版本我没测试,这里用的py3.9.13 下面的python版本为3.9.13 window install版

    cmd执行安装飞浆

    # 配置阿里云镜像
    pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
    
    python -m pip install paddlepaddle==2.3.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
    
    • 1
    • 2
    • 3
    • 4

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hTrRjsXG-1669104078472)(/upload/2022/11/image-1669014423651.png)]
    在这里插入图片描述

    安装中
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NUwSVVd5-1669104078473)(/upload/2022/11/image-1669014438349.png)]
    在这里插入图片描述

    PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。
    安装PaddleOCR
    https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/quickstart.md

    python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
    
    • 1

    安装PaddleOCR whl,用于调用

    pip install "paddleocr>=2.3.2"
    
    • 1

    等待它安装完毕
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j0eVPNgt-1669104078474)(/upload/2022/11/image-1669014501408.png)]
    在这里插入图片描述

    图片识别
    在Win+R的cmd执行,否则会找不到命令

    paddleocr --image_dir ./Desktop/picture/微信图片_20220425094332.jpg --use_angle_cls true --use_gpu false
    
    • 1

    中英文检查:检测+方向分类器+识别全流程:
    –use_angle_cls true设置使用方向分类器识别180度旋转文字,
    –use_gpu false设置不使用GPU
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cXQ3Tf3d-1669104078474)(/upload/2022/11/image-1669014546924.png)]
    在这里插入图片描述

    在py代码中识别
    idea安装了插件,创建一个项目
    在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CN3NDY3V-1669104078474)(/upload/2022/11/image-1669014619606.png)]

    编写识别代码

    from paddleocr import PaddleOCR, draw_ocr
    
    # Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
    # 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
    ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
    img_path = './微信图片_20220425094332.jpg'
    result = ocr.ocr(img_path, cls=True)
    for idx in range(len(result)):
        res = result[idx]
        for line in res:
            print(line)
    
    # 显示结果
    from PIL import Image
    result = result[0]
    image = Image.open(img_path).convert('RGB')
    boxes = [line[0] for line in result]
    txts = [line[1][0] for line in result]
    scores = [line[1][1] for line in result]
    im_show = draw_ocr(image, boxes, txts, scores, font_path='C:\\Windows\\Fonts\\simfang.ttf')
    im_show = Image.fromarray(im_show)
    im_show.save('result.jpg')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22

    需要安装一些包
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TNDHOJbW-1669104078474)(/upload/2022/11/image-1669014635545.png)]
    在这里插入图片描述
    执行完毕
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ce8SLKxV-1669104078475)(/upload/2022/11/image-1669014640416.png)]
    在这里插入图片描述

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Tpctpwm5-1669104078475)(/upload/2022/11/image-1669014651560.png)]
    在这里插入图片描述

  • 相关阅读:
    AndroidT(13) -- natvie LOG 输出的实现(三)
    U盘文件损坏且无法读取?别着急,教你恢复的绝招!
    前端开发:Vue混入(mixin)的使用
    [CISCN2019 华北赛区 Day2 Web1]Hack World1
    Java反射系列(2):从Class获取父类方法说起
    【Unity3D】Unity 组件 ④ ( 摄像机 | 调整摄像机 | 手工调整 | 3D 视图对齐 Align with View 调整摄像机 )
    【装机】第一次装机记录
    「学习笔记」平衡树基础:Splay 和 Treap
    故障诊断实验台 | PT500mini轴承齿轮箱转子故障实验台
    [附源码]java毕业设计网上书店管理系统
  • 原文地址:https://blog.csdn.net/weixin_44480167/article/details/127984585