一、介绍
paddleocr分为文字定位(Det)和文字识别(Rec)两个部分
二、定位模型训练
(1)Det预训练模型下载:https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_train.tar
(2)下载完之后,在PaddleOCR根目录下创建pretrain_models文件夹,将解压的模型文件夹放入
(3)配置模型文件参数:
打开模型配置文件,选用ch_PP-OCRv4_det_student.yml(图片用错了, 自行更换)
(4)修改配置参数信息:
(5)打开tool目录下的train.py文件,编辑train.py的配置参数,配置好之后就可以运行train.py进行训练了。
-c ../configs/det/ch_PP-OCRv4/ch_PP-OCRv4_det_student.yml
三、文字识别模型训练
(1)Rec预训练模型:
https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_train.tar
(2)下载完之后,在PaddleOCR根目录下创建pretrain_models文件夹,将解压的模型文件夹放入
(3)配置模型文件参数:
(4)修改配置参数信息:跟训练定位差不多, 把训练集和验证集的路径改一下就好了
(5)打开train.py, 修改配置参数, 然后运行train.py:
-c ../configs/rec/PP-OCRv4/ch_PP-OCRv4_rec.yml