目录
一、说明
1.1 如何选择版本
1.2 查看 github 中的 PaddleOCR 版本
二、安装
2.1 安装前环境准备
2.2 下载包
2.3 解压
2.4 安装依赖库
异常处理:Read timed out.
2.5 下载推理模型:inference
2.5.1 模型存放位置
2.5.2 模型下载链接
2.5.3 下载OCR 文本检测模型
2.5.4 下载OCR 文本识别模型
2.5.5 结果
2.6 检测是否安装成功
2.6.1 检测
2.6.2 异常处理
no attribute 'is_compiled_with_rocm
2.6.3 命令参数说明
一、说明
1.1 如何选择版本
目标:安装 PaddleOCR 2.3 。
参考资料:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_ch/installation.md
因为 PaddleOCR 2.4 的 推荐环境 PaddlePaddle >= 2.1.2。而我的 PaddlePaddle 是 2.0.0 。
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.4/doc/doc_ch/environment.md
1.2 查看 github 中的 PaddleOCR 版本
GitHub - PaddlePaddle/PaddleOCR
二、安装
2.1 安装前环境准备
(1)安装python 3.8
具体安装方法请参见 【ubuntu】安装 Anaconda3-CSDN博客
(2)安装paddlepaddle 2.0.0
具体安装方法请参见 Ubuntu 14.04:安装PaddlePaddle(Conda安装)-CSDN博客
2.2 下载包
https://codeload.github.com/PaddlePaddle/PaddleOCR/zip/refs/heads/release/2.3
注:
官方文档中,是 clone。
因为我 clone 时有异常,偷懒不想处理,就直接下载包,然后安装。
2.3 解压
上传到目标位置(/home/xxx/workspace),解压
unzip PaddleOCR-release-2.3.zip
2.4 安装依赖库
# 先进入PaddlePaddle所在的Anaconda虚拟环境:conda activate {paddle_env}。
# 然后在 /home/xxx/workspace/PaddleOCR-release-2.3 执行下面的命令
pip install -r requirements.txt
异常处理:Read timed out.
异常
socket.timeout: The read operation timed out
During handling of the above exception, another exception occurred:
pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.
异常原因
下载包时耗时过长,导致超时。
解决方案
重复执行下面的命令,直到操作成功。
pip install -r requirements.txt
2.5 下载推理模型:inference
2.5.1 模型存放位置
# 切换到 PaddleOCR 主目录
# cd /home/xxx/PaddleOCR-release-2.3/# 创建目录:inference
mkdir inference
模型存放位置
/home/xxx/PaddleOCR-release-2.3/inference
2.5.2 模型下载链接
模型下载链接1:
GitHub - PaddlePaddle/PaddleOCR at release/2.3
模型下载链接2:https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_en/models_list_en.md
2.5.3 下载OCR 文本检测模型
可以下载包,上传至目标位置,也可以wget。
我这里是wget,省去上传的步骤。
# 切换到目录
# /home/xxx/workspace/PaddleOCR-release-2.3/inference ,
# 执行:下载并解压
wget https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv2_det_infer.tar -O ch_PP-OCRv2_det_infer.tar && tar -xf ch_PP-OCRv2_det_infer.tar
2.5.4 下载OCR 文本识别模型
可以下载包,上传至目标位置,也可以wget。
我这里是wget,省去上传的步骤。
# 切换到目录
# /home/xxx/workspace/PaddleOCR-release-2.3/inference ,
# 执行:下载并解压
wget https://paddleocr.bj.bcebos.com/PP-OCRv2/chinese/ch_PP-OCRv2_rec_infer.tar -O ch_PP-OCRv2_rec_infer.tar && tar -xf ch_PP-OCRv2_rec_infer.tar
2.5.5 结果
2.6 检测是否安装成功
2.6.1 检测
# 先进入PaddlePaddle所在的Anaconda虚拟环境:conda activate {paddle_env}。
# 切换到目录 /home/xxx/workspace/PaddleOCR-release-2.3/
# 再执行下面的命令
# 我没有gpu,用cpu版。
#
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/00018069.jpg" --det_model_dir="./inference/ch_PP-OCRv2_det_infer/" --rec_model_dir="./inference/ch_PP-OCRv2_rec_infer/" --use_angle_cls=false --use_mp=True --total_process_num=6 --use_gpu=false
图片:
图片识别打印
如果出现上面的结果,说明安装成功了。
注:包里面有准备测试资料。
2.6.2 异常处理
no attribute 'is_compiled_with_rocm
异常
AttributeError: module 'paddle.fluid.core_avx' has no attribute 'is_compiled_with_rocm'
异常原因
居然原因不明,只是参考下面资料进行了处理,后面就正常了。
paddleocr报错AttributeError: module ‘paddle.fluid.core_noavx‘ has no attribute ‘is_compiled_with_rocm‘-CSDN博客
解决方案
在 /home/xxx/workspace/PaddleOCR-release-2.3/tools/infer/utility.py 中,
注释掉蓝色字体的内容,添加紫色框里的内容。
注意格式,格式不对,执行时会出错。
异常
异常原因
解决方案
2.6.3 命令参数说明
参数所在的文件:
/home/xxx/workspace/PaddleOCR-release-2.3/tools/infer/utility.py