• PaddleOCR mac 安装指南


    前言

    现在网络上有很多百度PaddleOCR的安装教程,但普遍的问题是缺少对整个安装流程框架的讲解,而遇到的问题又五花八门,导致小白安装时容易被绕晕。

    本文将梳理PaddleOCR的安装框架,同时提供几个常见报错和解决方案,希望能帮助大家高效地成功安装PaddleOCR:

    • 1.官网安装PaddlePaddle

    • 2.下载github上PaddleOCR包

    • 3.install支持PaddleOCR的包

    1.安装PaddlePaddle

    官方快速安装PaddlePaddle

    根据自己mac电脑环境, 本次选择macOS pip python3 cpu版本的来进行安装
    在这里插入图片描述

    MacOS下的python安装

    1. 安装Anaconda

    • 说明:使用paddlepaddle需要先安装python环境,这里我们选择python集成环境Anaconda工具包

      • Anaconda是1个常用的python包管理程序
      • 安装完Anaconda后,可以安装python环境,以及numpy等所需的工具包环境
    • Anaconda下载:

      • 地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D
        在这里插入图片描述

      • 选择最下方的Anaconda3-2022.05-MacOSX-x86_64.pkg下载

    • 下载完成后,双击.pkg文件进入图形界面

      • 按默认设置即可,安装需要花费一段时间
    • 建议安装vscodepycharm等代码编辑器

    2.打开终端并创建conda环境

    • 打开终端

      • 同时按下command键和空格键,在聚焦搜索中输入"终端",双击进入终端
    • 将conda加入环境变量

      • 加入环境变量是为了让系统能识别conda命令

      • 输入以下命令,在终端中打开~/.bash_profile

        vim ~/.bash_profile
        
        • 1
      • ~/.bash_profile中将conda添加为环境变量:

        # 先按i进入编辑模式
        # 在第一行输入:
        export PATH="~/opt/anaconda3/bin:$PATH"
        # 若安装时自定义了安装位置,则将~/opt/anaconda3/bin改为自定义的安装目录下的bin文件夹
        
        • 1
        • 2
        • 3
        • 4
        # 修改后的~/.bash_profile文件应如下(其中xxx为用户名):
        export PATH="~/opt/anaconda3/bin:$PATH"
        # >>> conda initialize >>>
        # !! Contents within this block are managed by 'conda init' !!
        __conda_setup="$('/Users/xxx/opt/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
        if [ $? -eq 0 ]; then
        		eval "$__conda_setup"
        else
        		if [ -f "/Users/xxx/opt/anaconda3/etc/profile.d/conda.sh" ]; then
                		. "/Users/xxx/opt/anaconda3/etc/profile.d/conda.sh"
        		else
                		export PATH="/Users/xxx/opt/anaconda3/bin:$PATH"
        		fi
        fi
        unset __conda_setup
        # <<< conda initialize <<<
        
        • 1
        • 2
        • 3
        • 4
        • 5
        • 6
        • 7
        • 8
        • 9
        • 10
        • 11
        • 12
        • 13
        • 14
        • 15
        • 16
        • 修改完成后,先按esc键退出编辑模式,再输入:wq!并回车,以保存退出
      • 验证是否能识别conda命令:

        • 在终端中输入source ~/.bash_profile以更新环境变量
        • 再在终端输入conda info --envs,若能显示当前有base环境,则conda已加入环境变量
    • 创建新的conda环境

      # 在命令行输入以下命令,创建名为paddle_env的环境
      # 此处为加速下载,使用清华源
      conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
      
      • 1
      • 2
      • 3
      • 该命令会创建1个名为paddle_env、python版本为3.8的可执行环境,根据网络状态,需要花费一段时间

      • 之后命令行中会输出提示信息,输入y并回车继续安装
        在这里插入图片描述

    • 激活刚创建的conda环境,在命令行中输入以下命令:

      # 激活paddle_env环境
      conda activate paddle_env
      # 查看当前python的位置
      where python
      
      • 1
      • 2
      • 3
      • 4

      在这里插入图片描述

    以上anaconda环境和python环境安装完毕

    MacOS下的PIP安装

    一、环境准备

    1.1目前飞桨支持的环境
    • macOS 版本 10.x/11.x (64 bit) (不支持GPU版本)

    • mac机器上支持mac M1芯片、Intel芯片

    • Python 版本 3.6/3.7/3.8/3.9/3.10 (64 bit)

    • pip 或 pip3 版本 20.2.2或更高版本 (64 bit)

    1.2如何查看您的环境
    • 可以使用以下命令查看本机的操作系统和位数信息:

      uname -m && cat /etc/*release
      
      • 1
    • 确认需要安装 PaddlePaddle 的 Python 是您预期的位置,因为您计算机可能有多个 Python

      使用以下命令输出 Python 路径,根据的环境您可能需要将说明中所有命令行中的 python 替换为具体的 Python 路径

      which python
      
      • 1
    • 需要确认python的版本是否满足要求

      使用以下命令确认是 3.6/3.7/3.8/3.9/3.10

      python --version
      
      • 1
    • 需要确认pip的版本是否满足要求,要求pip版本为20.2.2或更高版本

      python -m ensurepip
      
      • 1
      python -m pip --version
      
      • 1
    • 需要确认Python和pip是64bit,并且处理器架构是x86_64(或称作x64、Intel 64、AMD64)架构 或 arm64架构(paddle已原生支持Mac M1芯片):

      python -c "import platform;print(platform.architecture()[0]);print(platform.machine())"
      
      • 1
    • 默认提供的安装包需要计算机支持MKL

    • 如果您对机器环境不了解,请下载使用快速安装脚本,配套说明请参考这里。

    二、开始安装

    本文档为您介绍pip安装方式

    首先请选择您的版本

    目前在MacOS环境仅支持CPU版PaddlePaddle

    根据版本进行安装

    确定您的环境满足条件后可以开始安装了,选择下面您要安装的PaddlePaddle

    python -m pip install paddlepaddle==2.3.1 -i https://mirror.baidu.com/pypi/simple
    
    • 1

    注:

    • MacOS上您需要安装unrar以支持PaddlePaddle,可以使用命令brew install unrar
    • 请确认需要安装 PaddlePaddle 的 Python 是您预期的位置,因为您计算机可能有多个 Python。根据您的环境您可能需要将说明中所有命令行中的 python 替换为具体的 Python 路径。
    • 默认下载最新稳定版的安装包,如需获取develop 版本nightly build 的安装包,请参考这里
    • 使用MacOS中自带Python可能会导致安装失败。请使用python官网提供的python3.6.x、python3.7.x、python3.8.x、python3.9.x、python3.10.x。

    三、验证安装

    安装完成后您可以使用 python 进入python解释器,输入import paddle ,再输入 paddle.utils.run_check()

    如果出现PaddlePaddle is installed successfully!,说明您已成功安装。

    四、如何卸载

    请使用以下命令卸载PaddlePaddle:

    python -m pip uninstall paddlepaddle
    
    • 1

    2.下载github上PaddleOCR包

    根据项目文档第3步,克隆PaddleOCR代码,本地新建目录后

    #推荐
    git clone https://github.com/PaddlePaddle/PaddleOCR
    #因为网络问题无法pull成功,也可选择使用码云上的托管, 码云托管代码可能无法实时同步本github项目更新,存在3~5天延时,请优先使用推荐方式
    git clone https://gitee.com/paddlepaddle/PaddleOCR
    
    • 1
    • 2
    • 3
    • 4

    也可直接在这里下载zip文件,解压到对应位置

    在这里插入图片描述

    3. install支持PaddleOCR的包

    下载github成功后进入PaddleOCR文件

    cd PaddleOCR
     
    python -m pip install -r requirements.txt
    
    • 1
    • 2
    • 3

    此处易发生的问题:

      1. PaddleOCR文档的位置:放在默认目录下即可
      1. requirements.txt 文件找不到:用dir列出目录下所有文件,再复制粘贴

    install requirement.txt其实是安装的最后一步, 即安装支持PaddleOCR的必要包,其中大部分都在requirements.txt中列出。
    通常的报错也是在这步报错,因为有些包安装的问题,需要手动在这里下载。网上已经有很多解决“有些包安装不上”的报错及解决方案,以下为几个常见范例:

    1.shapely包:

    官方建议从这里下载shapely安装包完成安装, 直接通过pip安装的shapely库可能出现找不到指定模块的问题。

    下载和自己电脑,python版本吻合的文件即可
    在这里插入图片描述
    下载好后放到PaddleOCR文件夹里(和requirements.txt同级)并安装(下载其他包的流程都一样)

    pip install Shapely-1.7.1-cp37-cp37m-win_amd64.whl(根据下载文件的名字改)
    
    • 1

    2.Running setup.py install for python-Levenshtein … error:
    在这里插入图片描述
    下载并install Python-Levenshtein
    在这里插入图片描述
    注:现在网站上的很多博客有提到安装C++环境的步骤,其实也是为了解决某个python包无法安装的问题,建议采取上述步骤进行安装,比较简单快捷。

    如果还是有问题,可以打开requirements.txt,按照列表一个个安装。
    在这里插入图片描述

    前几个安装的都很顺利,一直到python-Levenshtein库,使用pip install python-Levenshtein安装的时候出现了跟前文一样的错误,于是我猜想之前PaddleOCR安装失败大概是因为这个包没有正常安装。我就继续上网查了下如何安装python-Levenshtein,解决办法异常简单,改用conda install python-Levenshtein就可以正常安装了,后续的几个包安装没有再出现过这些问题。

    最后安装PaddleOCR, pip install "paddleocr>=2.0.1".

    成功安装,没有报错,bingo。

    总结一下,在安装PaddleOCR之前首先要确定能否安装requirements.txt 文件里列出的包。
    可以先cd 到该文件的目录下执行>python -m pip install -r requirments.txt,如果没报错就可以直接
    pip install "paddleocr>=2.0.1",安装PaddleOCR,
    如果报错的话可以试着一个个安装requirments.txt文件里的包,找到是哪一个安装失败,如果是pip安装失败的话可以考虑conda install 安装,亲测有用。

    4.参考

    https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.5/doc/doc_ch/environment.md#1.2
    https://blog.csdn.net/HarryLi0520/article/details/126035799
    https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/macos-pip.html
    https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/installation.md
    https://blog.csdn.net/weixin_43285586/article/details/126122451

  • 相关阅读:
    如何用PHP语言实现远程语音播报
    Java使用apache.poi生成excel插入word中
    Java开发学习---Maven私服(二)本地仓库访问私服配置与私服资源上传下载
    苹果如何做ASO优化?优化的主要思路有哪些?
    实战讲解Kibana开发工具(Dev tools)操作ES:CURD(图+文)
    手搓一个“七夕限定”,用3D Engine 5分钟实现烟花绽放效果
    很多人觉得程序员岗位不需要沟通能力,是这样吗?
    requests爬虫IP连接初始化问题及解决方案
    nltk download所需包
    C++:继承、模板、CRTP:谈谈C++多态设计模式(二)
  • 原文地址:https://blog.csdn.net/zhanglei5415/article/details/126263265