搭建基于飞桨的OCR工具库,总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别的PaddleOCR

介绍

  • 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

相关链接

  • PaddleOCR项目地址
  • 飞桨开源深度学习平台
  • 效果展示页面
  • 中文OCR在线体验地址
  • 中文OCR模型快速使用

特性

  • 超轻量级中文OCR模型,总模型仅8.6M
    • 单模型支持中英文数字组合识别、竖排文本识别、长文本识别
    • 检测模型DB(4.1M)+识别模型CRNN(4.5M)
  • 实用通用中文OCR模型
  • 多种预测推理部署方案,包括服务部署和端侧部署
  • 多种文本检测训练算法,EAST、DB
  • 多种文本识别训练算法,Rosetta、CRNN、STAR-Net、RARE
  • 可运行于Linux、Windows、MacOS等多种系统

算法介绍

文本检测算法

  • EAST
  • DB

文本识别算法

  • CRNN
  • Rosetta
  • STAR-Net
  • RARE

文档教程

快速安装

   准备工作

  • 快速安装  提炼最核心的代码,此处仅仅使用最简单的CPU的方式进行安装,使用GPU的方式遇到了一些问题,需要解决
  • 切换到工作目录下面 cd /home/Projects  只要是自己可以记住的文件夹就可以
  • 如果先前没有安装过docker的需要先安装docker 不同系统的命令不一样,此处以centos为例子,yum install docker
  • docker相关简单命令 参考 我的博客 ,需要执行 docker -v 验证docker是否安装成功,如果安装成功,执行service docker start的命令,启动docker,然后才可以执行下面的命令

(建议)准备docker环境

  • 第一次使用这个镜像,会自动下载该镜像,请耐心等待
  • 在CPU环境下使用docker,使用docker而不是nvidia-docker创建docker
sudo docker run --name ppocr -v $PWD:/paddle --network=host -it hub.baidubce.com/paddlepaddle/paddle:latest-gpu-cuda9.0-cudnn7-dev /bin/bash
  • 小提示
# ctrl+P+Q可退出docker,重新进入docker使用如下命令
sudo docker container exec -it ppocr /bin/bash
  • 然后就会进行镜像的拉取操作,通过docker images检查是否加载了下载的镜像
docker images
  • 执行docker images后如果有下面的输出,则证明拉取镜像成功
  • hub.baidubce.com/paddlepaddle/paddle latest-gpu-cuda9.0-cudnn7-dev f56310dcc829

更改python3默认版本

  • docker中的python默认使用python3.5,PaddleOCR需要在Python3.7下执行(该版本下,对于第三方依赖库的兼容性更好一些)。进入docker后,可以编辑/etc/profile文件,但是你会发现docker镜像里面没有vim等编辑工具
  • 先执行apt-get update命令,同步 /etc/apt/sources.list 和 /etc/apt/sources.list.d 中列出的源的索引,这样才能获取到最新的软件包,这个时候系统由先前的centos使用yum换成了apt-get内核
  • 等更新完毕以后再敲命令:apt-get install vim,安装vim
  • 这次再编辑/etc/profile,在文件末尾添加
alias python3=python3.7
alias pip3=pip3.7
  • 保存之后,使用source /etc/profile命令使设置的默认Python生效

安装PaddlePaddle Fluid v1.7

  • 更新pip,使用命令pip3 install --upgrade pip
  • 如果您的机器是CPU,请运行以下命令安装
python3 -m pip install paddlepaddle==1.7.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

克隆PaddleOCR repo代码

git clone https://github.com/PaddlePaddle/PaddleOCR

安装第三方库

cd PaddleOCR
pip3 install -r requirments.txt

中文OCR模型快速使用

 inference模型下载

  • 参考文档

  •  模板样例
mkdir inference && cd inference
# 下载检测模型并解压
wget {url/of/detection/inference_model} && tar xf {name/of/detection/inference_model/package}
# 下载识别模型并解压
wget {url/of/recognition/inference_model} && tar xf {name/of/recognition/inference_model/package}
cd ..
  • 以超轻量级模型为例
mkdir inference && cd inference
# 下载超轻量级中文OCR模型的检测模型并解压
wget https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db_infer.tar && tar xf ch_det_mv3_db_infer.tar
# 下载超轻量级中文OCR模型的识别模型并解压
wget https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn_infer.tar && tar xf ch_rec_mv3_crnn_infer.tar
cd ..
  • 解压完毕后应有如下文件结构:

验证结果

  • 需要在home/PaddleOCR文件夹下面执行这些命令

单张图片

  • 以下代码实现了文本检测、识别串联推理,在执行预测时,需要通过参数image_dir指定单张图像或者图像集合的路径、参数det_model_dir指定检测inference模型的路径和参数rec_model_dir指定识别inference模型的路径。可视化识别结果默认保存到 ./inference_results 文件夹里面
# 预测image_dir指定的单张图像
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db/"  --rec_model_dir="./inference/ch_rec_mv3_crnn/"# 预测image_dir指定的图像集合
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/" --det_model_dir="./inference/ch_det_mv3_db/"  --rec_model_dir="./inference/ch_rec_mv3_crnn/"# 如果想使用CPU进行预测,需设置use_gpu参数为False
python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_det_mv3_db/"  --rec_model_dir="./inference/ch_rec_mv3_crnn/" --use_gpu=False
  • 更为详细的内容请参见官网

Q&A

  • 参考网址
  • 关于推理速度
    图片中的文字较多时,预测时间会增加,可以使用--rec_batch_num设置更小预测batch num,默认值为30,可以改为10或其他数值。
  • 超轻量模型和通用OCR模型的区别
    目前PaddleOCR开源了2个中文模型,分别是8.6M超轻量中文模型和通用中文OCR模型。两者对比信息如下:

    • 相同点:两者使用相同的算法训练数据
    • 不同点:不同之处在于骨干网络通道参数,超轻量模型使用MobileNetV3作为骨干网络,通用模型使用Resnet50_vd作为检测模型backbone,Resnet34_vd作为识别模型backbone,具体参数差异可对比两种模型训练的配置文件.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/447157.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

macos 10.15 django2.2+apache2.4+ladon+wsgi写webseverice接口

他的文档不够完善,使用起来可能有坑,因为不知道如何将ladondjangoapache绑定在一起使用,所以放弃了。 提醒:最好用个虚拟环境,防止库冲突我使用的是anaconda 安装apache macos本身自带apache,其他平台百度…

基于HubServing的PaddleOCR部署

前提要求 服务器的部署需要鉴于先前安装配置的docker环境,因此相关步骤查看我之前的博客 参考链接 服务部署 先前介绍 参考链接 官方推荐本博客采用基于HubServing的部署,这种方式已经集成到PaddleOCR里面,在先前的docker镜像里面就可以…

我的职业生涯规划学习日记(软件工程)整理时间线

学习路线 语言只是工具不过学c一直都做不出来东西是为什么呢,下图要第六部才做项目 概述 大一上学期:C,C,数据结构,cstl源码,python爬虫进入物联网实验室python方向,进入算法协会运维部学习算…

PaddleOCR和ChineseOCR的对比

PaddleOCR和ChineseOCR的对比 ChineseOCRPaddleOCR 对比 识别时间 chineseOCR识别的速度相对于PaddleOCR较慢,单纯使用CPU对于单张图片的识别时间可以达到20秒,如果使用GPU识别的时间一般控制在5秒以内(图片包含的文字比较少的情形&#x…

C++内存管理(1)

根据侯捷老师的视频:https://www.bilibili.com/video/BV1Kb411B7N8 这篇文章归纳内存管理的面试题和一些知识点梳理 正在更新中 首先为什么想要内存管理 不知道有没有人好奇delete[]或者delete的时候为什么系统会自动这个变量 占了多少字节。 答案是因为cookies&a…

Linux学习笔记(一)------实操排雷

参考兄弟连b站网课 1.1如果没有ifconfig 使用sudo apt install net-tools 下载;(ifconfig已经被淘汰所以需要另外下载) 1.2如果网卡是ens33; (1). vi /etc/sysconfig/network-scripts/ifcfg-ens33 将里面的…

Dapp简单的投票小例子

准备工作 相关命令 mkdir simple_voting_dapp //创建文件夹cd simple_voting_dapp //进入文件夹npm init //初始化npm包管理文件,输入ls 可以看到创建的package.json文件npm intsall web30.20.1 //安装web3npm install solc0.4.25 //安装solcnpm install -g ga…

使用mocha进行测试 区块链

mocha安装 npm install mocha --save-dev mocha简介 mocha是一个JavaScript的单元测试的框架,既可以运行在浏览器环境中,也可以运行在node.js环境中,只需要编写测试用例,mocha就会将测试自动的运行,并且给出测试的结…

Linux学习笔记(六)

参考书籍:linux就该这么学 6.存储结构与磁盘划分 6.1 文件系统与数据资料 6.2 挂载硬件设备 6.2.1 mount 命令用于挂载文件系统 6.2.2 umount 命令用于撤销已经挂载的设备文件 6.3 添加硬盘 6.3.1 fdisk 命令用于管理磁盘分区 6.3.2 用于查看文件数据占用量的 du 命…

实现Linux系统外部和容器内部的文件传输

主机和容器之间进行文件传输,需要使用容器的ID即可 获取方法如下 输入指令 docker ps -a只需要CONTAINER ID传输命令 docker cp 本地文件路径 容器ID:容器的路径将文件从容器拷贝到本地的原理是一致的,只需要将对应路径的位置进行更换即可

Linux学习笔记(五)

参考书籍:linux就该这么学 5 用户身份与文件权限 5.1 用户身份与能力 强烈推荐大家在学习时使用 root 管理员权限!因为在 Linux 的学习过程中如果使用普通用户身份进行操作,则在配置服务之后出现错误时很难判断是系统自身的问题还是因为权限不…

清除Docker的占用空间问题

使用命令查看磁盘的空间 docker system df ,类似于Linux的df命令,用于查看Docker使用的磁盘空间Docker镜像占据了4.789GBDocker容器占据了348BDocker数据卷占据了0B 执行删除命令 docker system prune命令可以用于清理磁盘,删除关闭的容器、…

区块链的完整流程 自动化执行代码

通过npm script机制, 在package.json文件中,输入对应的代码,就可以自动化执行相关的函数使用npm run test执行package.json中的内容,因为package.json包含test,所以可行,但是使用npm run compile会报错

windows版本的clion软件除了使用wsl配置Ubuntu子系统外,还可以使用MinGW-w64来配置gcc和g++

主要内容 MinGW-w64安装CMake安装环境配置参考链接 MinGW-w64安装配置 安装配置分为在线版本和离线版本,推荐使用离线版本,因为在线版本很慢,需要插入网线进行操作参考链接 这个是百度云下载地址,相对于从官网下载速度稍微快一些…

python学习路线

自用 Task1: 如果对一个列表,既要遍历索引又要遍历元素时,首先可以这样写: list1 ["这", "是", "一个", "测试"] for i in range (len(list1)):print i ,list1[i]#上述方法有些累赘&#xff0c…

解决使用MinGW编译C++代码报cannot find -lxxxx的问题

报错的截图如下面所示 我一开始使用target_link_libraries(ThreadTest libsdf_core.dll)这条命令来将dll库文件和项目文件关联起来,但是解决不了问题也尝试在编译代码的环境时候,将dll库文件的绝对路径加入到编译环境中,但是也没有用解决办法…

Linux搭建深度学习环境使用指南

本文档归纳不收悉的linux知识点,自用 终端美化:https://zhuanlan.zhihu.com/p/37195261(unix终端通用) 基础linux命令:https://blog.csdn.net/q357010621/article/details/80248611 shell是什么?shell是一…

CLion 输出遇到乱码解决办法,GBK和utf-8的转换

具体操作 File -> Settings -> Default Settings -> Editor -> File Encodings:Global Encoding: UTF-8Project Encoding : UTF-8Default encoding for properties files: UTF-8 图片展示 然后,在main.cpp右下角选择语言编码格式为GBK,在弹…

Vim使用方法归纳

编辑模式i 0 :光标移至行首d0 : 删除到行首$ :光标移至行尾D/d$ : 删除到行尾dd : 删除当前行yy/nyy : 复制当前行/复制n行p/P : 粘贴(vim中删除是剪切,可以删除后用p粘贴)u : 撤回…

epoll 转kqueue的用法介绍和实例 实现跨平台Macos

网上关于kqueue的博客很少 我来补充一个例子echo 的例子 #include <stdlib.h> #include <unistd.h> #include <fcntl.h> #include <errno.h> #include <string.h> #include<stdio.h> #include<arpa/inet.h> #include<sys/event.…