paddleocr实验过程

切割数据

Paddleocr/PPOCRLabel/gen_ocr_train_val_test.py;切割后的数据在train_data中,注意切割后的数据前缀默认是当前目录,因此建议切割数据在liunx中进行。建议在liunx中指定

python gen_ocr_train_val_test.py --datasetRootPath==XX

或者修改下面--datasetRootPath中的default

if __name__ == "__main__":# 功能描述:分别划分检测和识别的训练集、验证集、测试集# 说明:可以根据自己的路径和需求调整参数,图像数据往往多人合作分批标注,每一批图像数据放在一个文件夹内用PPOCRLabel进行标注,# 如此会有多个标注好的图像文件夹汇总并划分训练集、验证集、测试集的需求parser = argparse.ArgumentParser()parser.add_argument("--trainValTestRatio",type=str,default="8:2:0",help="ratio of trainset:valset:testset")parser.add_argument("--datasetRootPath",type=str,default="./xia/",help="需要切割的数据path to the dataset marked by ppocrlabel, E.g, dataset folder named 1,2,3...")parser.add_argument("--detRootPath",type=str,default="../train_data/det",help="the path where the divided detection dataset is placed")parser.add_argument("--recRootPath",type=str,default="../train_data/rec",help="the path where the divided recognition dataset is placed")parser.add_argument("--detLabelFileName",type=str,default="Label.txt",help="the name of the detection annotation file")parser.add_argument("--recLabelFileName",type=str,default="rec_gt.txt",help="the name of the recognition annotation file")parser.add_argument("--recImageDirName",type=str,default="crop_img",help="the name of the folder where the cropped recognition dataset is located")

如果在Win中切割,放入liunx中训练。前缀可能如下

常见的Liunx命令

切换路径:cd /路径

编辑或者创建文档:vim 

                                 仅退出vim,先按ESC,再shift+:,在底部看到:,输入q或者q!

                                 改动完退出vim,先按ESC,再shift+:,在底部看到:,输入wq

复制文件:单个文件:cp XXX  YYY  ;文件夹:cp -rf XXX YYY

删除文件:rm -rf XXX

det

训练

1、打开tmux窗口启动,这样断开连接后台可以继续训练

2、根据需求修改配置文件,如输出名称,数据集位置,注意暂时不要改吧epoch,训练容易报错

shell命令如下,创建和修改shell后需要

创建:vim XXX.sh 

修改权限:chmod +x XXX.sh 

#首先使用该命令打开tmux窗口: tmux attach -t my_session_name
#根据任务修改configs
python3 -m paddle.distributed.launch --gpus '0' tools/train.py 
-c ./configs/det/ch_PP-OCRv4/训练使用的配置文件.yml 
-o Global.pretrained_model=./pretrain_models/PPHGNet_small_ocr_det.pdparams

推理

python3 tools/export_model.py 
-c ./configs/det/ch_PP-OCRv4/训练使用的配置文件.yml 
-o Global.pretrained_model=./output/训练输出文件夹名称/best_accuracy 
Global.save_inference_dir=./inference/输出文件夹名称/                                                                                                                                                                                                                     

 配置文件位置:/data/ocr/PaddleOCR-2.7.5/configs/det

#使用命令修改配置文件
#-o参数在不需要修改yml文件的情况下,改变训练的参数,比如,调整训练的学习率为0.0001
python3 tools/train.py -c configs/det/det_mv3_db.yml 
-o Optimizer.base_lr=0.0001

也可以直接修改额配置文件,如/data/ocr/PaddleOCR-2.7.5/configs/det/ch_PP-OCRv4/ch_PP-OCRv4_det_teacher.yml

修改训练得到模型地址

 修改数据集:

 

修改batch_size:

Rec:

训练

# tmux attach -t my_session_name
python3 -m paddle.distributed.launch --gpus '0' tools/train.py 
-c configs/rec/PP-OCRv4/配置文件.yml  
-o 
Global.pretrained_model=./pretrain_models/en_PP-OCRv4_rec_train/best_accuracy

 配置文件位置:/data/ocr/PaddleOCR-2.7.5/configs/rec 

推理

python3 tools/export_model.py 
-c  configs/rec/PP-OCRv4/训练配置文件.yml 
-o Global.pretrained_model=/data/ocr/PaddleOCR-2.7.5/output/训练输出文件夹/best_model/model 
Global.save_inference_dir=./inference/推理输出文件夹/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/28479.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

锁存器的工作原理及其在FPGA设计中的注意事项

锁存器(Latch)是数字电子中常用的一种基本元件,用于在特定的时间点或条件下“锁存”或保存输入的数据值。锁存器对脉冲电平敏感,它只在输入脉冲的高电平(或低电平)期间对输入信号敏感并改变状态。在数字电路…

React native 使用Animated 优化连续setState 性能问题

再部分场景下我们需要连续更新state刷新页面。一般情况刷新使用setstate没有问题,当需要连续刷新的情况会有明显的性能问题。 场景:自定义可拖动抽屉组件 新增需求在抽屉活动是更新主页面组件样式,此时需要动态传递抽屉高度修改主页组件属性…

vba学习系列(5)--指定区域指定字符串计数

系列文章目录 文章目录 系列文章目录前言一、需求背景二、vba自定义函数1.引入库 总结 前言 一、需求背景 想知道所有客诉项目里面什么项目最多,出现过多少次。 二、vba自定义函数 1.引入库 引用: CountCharInRange(区域,“字符串”) Function CountCh…

AWS无服务器 应用程序开发—第十二章 小结

在使用 AWS 无服务器架构进行开发时,需要注意的事项、易错点、性能优化建议和付费相关的信息: 前端开发(React.js) 注意点和易错点 CORS(跨域资源共享)问题:确保 API 网关设置了正确的 CORS 头。 环境配置:使用 .env 文件来管理环境变量。 构建优化:使用代码分割和…

人有时候不逼自己一把,永远不知道自己有多牛逼!

大家好,我是墨云,一位看起来不像搞技术的IT男。 之前写过一篇文章,从零开始,如何在3个月内吸引3500用户:我的私域运营秘诀,现如今,我们的私域社群成员数已逾五千人。👫 今天的主题&a…

MySQL -- 优化

1. 查询优化 使用索引 示例:有一个包含数百万用户的表,名为 users,常见的查询是通过 email 字段查找用户。 CREATE INDEX idx_email ON users(email);通过创建索引 idx_email,SELECT * FROM users WHERE email exampleexample…

【漏洞复现】红海云eHR PtFjk.mob 任意文件上传漏洞

免责声明: 本文内容旨在提供有关特定漏洞或安全漏洞的信息,以帮助用户更好地了解可能存在的风险。公布此类信息的目的在于促进网络安全意识和技术进步,并非出于任何恶意目的。阅读者应该明白,在利用本文提到的漏洞信息或进行相关测…

【图解IO与Netty系列】Netty编解码器、TCP粘包拆包问题处理、Netty心跳检测机制

Netty编解码器、TCP粘包拆包问题处理、Netty心跳检测机制 Netty编解码器编码器解码器编解码器Netty提供的现成编解码器 TCP粘包拆包问题处理Netty心跳检测机制 Netty编解码器 网络传输是以字节流的形式传输的,而我们的应用程序一般不会直接对字节流进行处理&#x…

Verilog-Behavior Level 和 RTL Level 和 GATE Level的区别

硬件设计中对硬件的描述可以具有不同的抽象级别,以Verilog为例: Behavior Level。描述的是硬件的行为,当我们在看到如下关键字时就是行为级别的代码:#,wait,while,force,release等&…

System-Verilog 实现DE2-115 流水灯

文章目录 一、什么是SystemVerilog二、代码实现实现结果 一、什么是SystemVerilog SystemVerilog是一种硬件描述语言(HDL),它用于设计和验证电子系统,特别是在集成电路(IC)和系统级芯片(SoC)的设计过程中。SystemVerilog是Verilog语言的一个超集&#xf…

大模型生成的常见Top-k、Top-p、Temperature参数

参考: https://zhuanlan.zhihu.com/p/669661536 topK,topP https://www.douyin.com/video/7380126984573127945 主要是softmax产生的词表每个词的概率分布后, topK,比如K3,表示采样概率最大的前3个,其他全…

【Perl】与【Excel】

引言 perl脚本语言对于文本的处理、转换很强大。对于一些信息量庞大的文本文件,看起来不直观,可以将信息提取至excel表格中,增加数据分析的可视化。perl语言的cpan提供了大量模块。对于excel文件的操作主要用到模块: Spreadshee…

【C++】类相关知识

C 类相关内容 1 默认构造 在C中,如果你遇到了错误信息“the default constructor of ‘B’ cannot be referenced – it is a deleted function”,这通常意味着类B的默认构造函数(即不带参数的构造函数)被声明为 delete了&#…

C 运算符优先级

在 C 语言中,运算符的优先级决定了在表达式中运算符的计算顺序。以下是 C 语言中运算符优先级表,按从高到低的顺序排列: 1. **括号**: () 2. **后缀运算符**: [] (数组下标), () (函数调用), . (成员访问), -> (指向成员访问), (后缀自…

详解 HBase 的安装部署及命令行操作

一、下载安装 进入 HBase 下载地址:https://archive.apache.org/dist/hbase/ 下载对应版本的 HBase 安装包并上传到虚拟机,并确保安装了 jdk 环境 将 HBase 安装包解压 #在 /opt/software 目录下解压安装包 tar -zxvf hbase-1.3.1-bin.tar.gz -C /opt/…

Android的自启动

最近要用到这个,所以也花时间看看。 从分层来说,安卓的自启动也分成三种,app的自启动,framework服务的自启动,HAL服务的自启动。现在简单说说这三种吧。当然,我主要关注的还是最后一种。。。 一 App的自启…

【论文速读,找找启发点】2024/6/16

ICME 2023 End-To-End Part-Level Action Parsing With Transformer 类似 DETR,通过 加 query的方式实现 端到端 ELAN: Enhancing Temporal Action Detection with Location Awareness 如何实现位置感知? > 重叠的卷积核? Do we really …

大数据开发流程解析

大数据开发是一个复杂且系统的过程,涉及需求分析、数据探查、指标管理、模型设计、ETL开发、数据验证、任务调度以及上线管理等多个阶段。本文将详细介绍每个阶段的内容,并提供相关示例和代码示例,帮助理解和实施大数据开发流程。 本文中的示…

基于WPF技术的换热站智能监控系统02--标题栏实现

1、布局划分 2、准备图片资源 3、界面UI控件 4、窗体拖动和关闭 5、运行效果 走过路过不要错过,点赞关注收藏又圈粉,共同致富,为财务自由作出贡献

CodeQL从入门到入土

为什么在现在写这文章 CodeQL传闻找到了Log4j的漏洞,这段时间上边要求,把公司系统内部常见的问题用CodeQL写检测脚本,用于系统长期检测。主要是记录这段时间的学习,以及自己总结的常用写法。 一个需求,不同人写出来的…