PaddleOCR 是由百度开发的一个开源光学字符识别(OCR)工具,它可以识别图片中的文本信息。然而,PaddleOCR 本身主要专注于文本的检测与识别
安装PaddleOCR框架
pip install paddlepaddle paddleocr
使用PaddleOCR识别图片代码
from paddleocr import PaddleOCR# 初始化 PaddleOCR
ocr = PaddleOCR(use_angle_cls=False, lang="ch")# 识别图片中内容
result = ocr.ocr("test_ocr.png", cls=True)# 输出识别出的文本内容
for table in result:for row in table:print(row[1][0])
测试图片
识别效果:
如果要定们坐标信息,改一下参数 use_angle_cls=True即可,如下图:
识别内容外还包含了位置坐标信息。