安装
参考github的官网就可以:
github链接
简单的说,就是两句话:
python3 -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple
pip install "paddleocr>=2.0.1" # 推荐使用2.0.1+版本
Python下的使用
from paddleocr import PaddleOCR
import cv2
import numpy as np
if __name__=="__main__":ocr = PaddleOCR(use_angle_cls=True, use_gpu=True,ocr_version='PP-OCRv4')img_path = r'F:\dataset\images\1.bmp'img=cv2.imread(img_path)result = ocr.ocr(img, cls=True)[0]for line in result:list_points=line[0]str_data,conf=line[1]pts = np.array(list_points, np.int32)pts = pts.reshape((-1, 1, 2))cv2.polylines(img, [pts], isClosed=True, color=(0, 255, 255), thickness=1)cv2.imshow("img",img)cv2.waitKey(0)
这里面包括了图片的读取,推理过程,还有检测框的显示。
如果想对每一个字符都做框选,可以多写几句画,把每个框都拆出来。
from paddleocr import PaddleOCR
import cv2
import numpy as np
if __name__=="__main__":ocr = PaddleOCR(use_angle_cls=True, use_gpu=True,ocr_version='PP-OCRv4')img_path = r'F:\dataset\images\1.bmp'img=cv2.imread(img_path)result = ocr.ocr(img, cls=True)[0]for line in result:list_points=line[0]str_data,conf=line[1]len_str=len(str_data)p0,p1,p2,p3=np.array(list_points)for ic in range(len_str):p0_c=p0+(p1-p0)/len_str*icp1_c=p0+(p1-p0)/len_str*(ic+1)p2_c=p3+(p2-p3)/len_str*(ic+1)p3_c=p3+(p2-p3)/len_str*(ic)list_ps=[p0_c,p1_c,p2_c,p3_c]pts = np.array(list_ps, np.int32)pts = pts.reshape((-1, 1, 2))cv2.polylines(img, [pts], isClosed=True, color=(0, 255, 255), thickness=1)cv2.imshow("img",img)cv2.waitKey(0)