目录
一、程序编写背景
二、编程思路讲解
- 类图
- 实现逻辑
- 工厂模式
- 模板方法模式
- 接口类(代码)
- 抽象类(代码)
- 具体实现类(代码)
- 工厂类(代码)
- 注册类(代码)
- 系统启动加载(代码)
- 系统启动加载 - 初始化方法(代码)
总结
- 类图绘制
- UML图型使用
- 设计模式理解
- 推荐书籍
一、背景
1. 业务需要使用ocr场景对图片进行识别。但由于前期使用的TesserOcr识别率不是特别高。故又需要新的识别方式。
2. 在确定使用paddleocr后,对程序进行修改。为了兼容两种ocr使用方式。
3. 通过配置yml文件的方式可以在使用时对两种ocr识别方式进行切换使用。(也可配置入数据库进行动态配置)
具体的Ocr识别教程可参照其他文章
TesseractOcr(开源ocr)
- 安装及使用
此部分内容后期待补充
PaddleOcr (开源ocr)
- paddleocr的安装及使用
此部分内容后期待补充
- 使用pyinstall打包 >> 👀
- paddleocr模型的训练
此部分内容后期待补充
二、编程思路讲解
首先上类图。可以较直观表现了调用关系
1. 实现逻辑
简单描述了程序调用顺序
1. 手动配置yml中ocr类型(可配置入数据库进行动态配置)。
2. 程序启动时将两种ocr服务对象加载入缓存。
3. 业务进行时,程序识别会通过传入参数获取对应类型的orc服务对象进行识别服务。
2. 工厂模式
创建TesseractOcr与PaddleOcr使用
import service.ocrservice.recognize.OcrMultiParamRecognize;
import service.ocrservice.recognize.OcrNomralRecognize;
import service.ocrservice.recognize.PaddleOcrRecognize;
import com.msun.cloud.dcm.util.Direct;import java.io.File;public class RecognizeFactory {/*** TesseractOcr识别*/public static Recognize getRecognize(String dataPath, File pendingFile, Direct patientDirect, Direct accnumDirect, String formateName, String dpi) {return new OcrNomralRecognize(dataPath, pendingFile, patientDirect, accnumDirect, formateName, dpi);}/*** paddleOcr识别*/public static Recognize getPaddleOcrRecognize(String filePath, Direct patientDirect, Direct accnumDirect, String formateName) {return new PaddleOcrRecognize(filePath, formateName, patientDirect, accnumDirect);}
}
3. 模板方法模式
粘贴内容还包括使用工厂模式创建对象
- 接口类
提供了业务在调用Ocr服务类对象时的统一接口,表现了面向接口编程的思想
package service.ocrservice;import entity.PO.Patient; import PO.RecognizeTemplate;import java.io.File;/*** 通过ocr识别获取患者信息*/ public interface OcrPatientService {Patient getRecognizedPatient(File pendingFile, String aeTitle, String spFilePath, String formateName, RecognizeTemplate recognizeTemplate);Recognize getRecognize(File pendingFile, RecognizeTemplate template, String formatName);}
- 抽象类
封装了公共方法,子类实现抽象类中的抽象方法。公共方法对抽象方法进行调用
package service.ocrservice;import com.alibaba.fastjson.JSON; import entity.BO.OcrRecognizeLog; import entity.PO.Patient; import entity.PO.RecognizeTemplate; import entity.common.Const; import mapper.PatientMapper; import mapper.RecognizeTemplateMapper; import service.SystemConfigService; import service.ocrservice.entity.RecognizeEntity; import service.ocrservice.service.AsyncOcrRecognizeLogService; import lombok.extern.slf4j.Slf4j; import org.springframework.beans.factory.annotation.Autowired;import javax.annotation.Resource; import java.io.File; import java.util.List;@Slf4j public abstract class AbstractOcrPatientServiceImpl implements OcrPatientService{@Resourceprivate RecognizeTemplateMapper recognizeTemplateMapper;@Resourceprivate SystemConfigService systemConfigService;@Autowiredprivate AsyncOcrRecognizeLogService asyncOcrRecognizeLogService;@Resourceprivate PatientMapper patientMapper;/*** 获取识别的人员信息* @return*/public Patient getRecognizedPatient(File pendingFile, String aeTitle, String spFilePath, String formateName, RecognizeTemplate recognizeTemplate) {Patient patient = null;try{# 抽象方法调用patient = recognize(dataPath, pendingFile, template, formateName);} finally {...}return patient;}public abstract Patient recognize(String dataPath, File pendingFile, RecognizeTemplate template, String formatName);private void insertExOcrRecord(Patient patient, String aeTitle, String spFilePath) {... 插入日志}protected Patient queryPatient(RecognizeEntity entity) {... 查询人员信息}}
- 具体实现类
package com.msun.cloud.dcm.service.ocrservice.impl;import com.msun.cloud.dcm.entity.PO.Patient; import com.msun.cloud.dcm.entity.PO.RecognizeTemplate; import com.msun.cloud.dcm.service.ocrservice.AbstractOcrPatientServiceImpl; import com.msun.cloud.dcm.service.ocrservice.OcrPatientService; import com.msun.cloud.dcm.service.ocrservice.Recognize; import com.msun.cloud.dcm.service.ocrservice.RecognizeFactory; import com.msun.cloud.dcm.util.Direct; import org.springframework.stereotype.Service;import java.io.File; import java.util.function.Consumer;@Service public class PaddleOcrPatientServiceImpl extends AbstractOcrPatientServiceImpl {@Overridepublic Patient recognize(String dataPath, File pendingFile, RecognizeTemplate template, String formatName) {Direct patientDirect = new Direct(template.getPatientRecognizeX(), template.getPatientRecognizeY(), template.getPatientRecognizeW(), template.getPatientRecognizeH());Direct accNumDirect = new Direct(template.getAccnumRecognizeX(), template.getAccnumRecognizeY(), template.getAccnumRecognizeW(), template.getAccnumRecognizeH());Recognize recognize = RecognizeFactory.getPaddleOcrRecognize(pendingFile.getAbsolutePath(), patientDirect, accNumDirect, formatName);if("1".equals(template.getIsReBuild())){return queryPatient3D(recognize.recognize());}return queryPatient(recognize.recognize());}public Recognize getRecognize(File pendingFile, RecognizeTemplate template, String formatName) {Direct patientDirect = new Direct(template.getPatientRecognizeX(), template.getPatientRecognizeY(), template.getPatientRecognizeW(), template.getPatientRecognizeH());Direct accNumDirect = new Direct(template.getAccnumRecognizeX(), template.getAccnumRecognizeY(), template.getAccnumRecognizeW(), template.getAccnumRecognizeH());Recognize recognize = RecognizeFactory.getPaddleOcrRecognize(pendingFile.getAbsolutePath(), patientDirect, accNumDirect, formatName);return recognize;} }
- 工厂类
import ocrservice.recognize.OcrMultiParamRecognize; import ocrservice.recognize.OcrNomralRecognize; import ocrservice.recognize.PaddleOcrRecognize; import util.Direct;import java.io.File;public class RecognizeFactory {/*** 范围识别* @param dataPath* @param pendingFile* @param patientDirect* @param formateName* @param dpi* @return*/public static Recognize getRecognize(String dataPath, File pendingFile, Direct patientDirect, String formateName, String dpi) {return new OcrMultiParamRecognize(dataPath, pendingFile, patientDirect, formateName, dpi);}/*** 精确识别* @param dataPath* @param pendingFile* @param patientDirect* @param formateName* @param dpi* @return*/public static Recognize getRecognize(String dataPath, File pendingFile, Direct patientDirect, Direct accnumDirect, String formateName, String dpi) {return new OcrNomralRecognize(dataPath, pendingFile, patientDirect, accnumDirect, formateName, dpi);}public static Recognize getPaddleOcrRecognize(String filePath, Direct patientDirect, Direct accnumDirect, String formateName) {return new PaddleOcrRecognize(filePath, formateName, patientDirect, accnumDirect);} }
- 注册类(包含枚举类)
package service.ocrservice;import org.springframework.beans.factory.annotation.Value; import org.springframework.stereotype.Component;import java.util.Arrays; import java.util.HashMap; import java.util.Map;/*** 收集 ocr 服务类*/ @Component public class OcrServiceRegistry {public static Map<OcrType, OcrPatientService> registryMap = new HashMap();public static OcrPatientService ocrPatientServiceCache;...public enum OcrType {TesserOcr("1"),PaddleOcr("2");private String code;OcrType(String code) {this.code = code;}public static OcrType getOcrTypeByCode(String code) {for (int i = 0; i < OcrType.values().length; i++) {OcrType ocrType = OcrType.values()[i];if(ocrType.code.equals(code)) return ocrType;}return TesserOcr;}}public static OcrPatientService getOcrService(String ocrTypeCode) {if(ocrPatientServiceCache == null) {ocrPatientServiceCache = registryMap.get(OcrType.getOcrTypeByCode(ocrTypeCode));}return ocrPatientServiceCache;} }
- 系统启动加载
import lombok.Data; import lombok.extern.slf4j.Slf4j; import org.springframework.boot.ApplicationArguments; import org.springframework.boot.ApplicationRunner; import org.springframework.data.redis.listener.RedisMessageListenerContainer; import org.springframework.stereotype.Component;import javax.annotation.Resource;/*** 初始化工具类*/ @Slf4j @Data @Component public class PostApplicationRunner implements ApplicationRunner {@Resourceprivate ProjectConfig projectConfig;@Overridepublic void run(ApplicationArguments args) throws Exception {PrintDcmOcrRecognizeService.init();} }
- 系统启动加载 - 初始化方法
public class PrintDcmOcrRecognizeService {public static void init() {OcrServiceRegistry.registryMap.put(OcrServiceRegistry.OcrType.TesserOcr, SpringUtils.getBean(TessOcrPatientServiceImpl.class));OcrServiceRegistry.registryMap.put(OcrServiceRegistry.OcrType.PaddleOcr, SpringUtils.getBean(PaddleOcrPatientServiceImpl.class));} }
三、总结
-
类图绘制。
类图绘制为后期加入的。前期没有做类图中框架的设计,模式的使用是可以是根据业务的需要而做的。在编程中对业务架构中每一个部分做了设计。最后的总结才有了这个样子。
类图参照《大话设计模式》一书
-
UML图型使用。
UML类图中图型的使用是参照《大话设计模式》中UML类讲解
>> | 使用的。 -
设计模式理解。
目前经常用到的设计模式种类不多。基本为工厂、模板、享元、静态代理。设计模式虽多,但不宜滥用,过度设计,因为设计的初衷是根据业务的需要,使得代码更加容易阅读和拓展。
-
推荐书籍。
-《大话设计模式》使用讲Demo的方式有趣介绍了模式的使用,其中的UML类图使用较多
-《设计模式之美》根据实际业务场景讲解了何时要用到设计模式。内容易懂,对工作帮助比较大
可以在有了设计模式基础后去读一读