Ocr之TesseractOcr的安装及使用

目录

一、安装环境

二、安装内容

三、安装过程及识别测试

1. 安装过程
2. 程序编写

总结

1. 安装复杂度较低
2. 国外开源Ocr
3. 可设置识别参数
4. 工具类

一、 系统环境windows 10

linux环境也可安装, 可借鉴此篇文章>> |

二、安装内容

Tesseract exe 程序安装
exe程序下载地址, 可选择版本安装>> |

# 我们这里安装的版本是
tesseract-ocr-w64-setup-5.3.1.20230401.exe

三、安装过程及识别测试

1. 安装过程
  • 安装后的目录结构
    默认安装在C盘。可选择路径。傻瓜式安装就可以
    在这里插入图片描述
  • 添加环境变量 TESSDATA_PREFIX=<安装的tessoract-ocr.exe后文件夹根路径>/tessdata
    在这里插入图片描述
2. 程序编写
  • 使用Tesseract进行识别程序的编写
    目前使用TesseractOcr已经更换为 PaddleOcr 了。源于TesseractOcr对背景模糊的图片识别率不高,使用PaddleOcr后识别率有明显提高。
    不过使用PaddleOcr识别过程会将图片进行预处理(图片放大和模糊处理再使用paddleocr识别效果更佳:后期会做记录并将链接加到此处)

  • 使用java程序进行识别需要引用 mvn 第三方依赖

    <!--ocr图像识别--><dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>5.3.0</version></dependency>
    
  • 单元测试用例+执行结果
    在这里插入图片描述
    下方代码中对上方图片进行识别(图片名称:new33.jpg)

    @Test
    public void readImageByOcr() throws TesseractException {String imgSrc = "C:\\...\\changepic\\new33.jpg";File imgFile = new File(imgSrc);//创建tesseract对象Tesseract tes = new Tesseract();//语言包位置  根据实际环境修改替换tes.setDatapath("E:\\...\\Tesseract-OCR\\tessdata");//配置使用的语言  中文tes.setLanguage("eng");String imgText = tes.doOCR(imgFile);System.out.println("解析结果:" + imgText);
    }
    

    执行后
    在这里插入图片描述

  • 业务代码示例
    结合业务代码使用TesseractOcr。TesseractOcr使用时可传入不通参数。如language, variable等。
    tessedit_char_whitelist:设置白名单。下方demo限制内容为只能识别数字和字母

    /*** ocr识别* @param img* @param dataPath* @param replacedEmp 是否替换回车和空格为空, true:替换, false, 不替换(含回车和空格符)* @param dpi 分辨率, 默认 96* @param charNoLimit 识别空格: true, 不识别空格: false* @return* @throws TesseractException*/private static String doOcrImpl(BufferedImage img, String dataPath, boolean replacedEmp, String dpi, boolean charNoLimit) throws TesseractException {// 初始化 OCR 引擎Tesseract tesseract = new Tesseract();File tessDataFolder = LoadLibs.extractTessResources("tessdata");tesseract.setDatapath(tessDataFolder.getAbsolutePath());//语言包位置  根据实际环境修改替换tesseract.setDatapath(dataPath);//配置使用的语言  中文tesseract.setLanguage("eng");if(!charNoLimit) {//限制只识别数字字母tesseract.setVariable("tessedit_char_whitelist", "0123456789CDFGMRTX");}//设置分辨率tesseract.setVariable("user_defined_dpi", dpi);String result = tesseract.doOCR(img);if(replacedEmp) {// 文字识别-过滤空白、换行符result = result.replace(StrUtil.SPACE, StrUtil.EMPTY).replace(StrUtil.LF, StrUtil.EMPTY);}return result;}
    

总结

  1. 安装复杂度较低。
    相比于paddleocr的安装要简单的多(需要安装python环境及下载paddleocr相关内容)。paddleocr安装借鉴 gitee paddleocr开源代码>> |
  2. 属于国外开源Ocr。
  3. 可设置识别参数。可设置变量与识别语言。
  4. 使用Ocr时用到的工具类。可自行测试
package util;import cn.hutool.core.util.StrUtil;
import common.aspect.core.StringUtils;
import common.exception.CustomException;
import PO.RecognizeTemplate;
import service.PrintDcmOcrRecognizeService;
import lombok.extern.slf4j.Slf4j;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import net.sourceforge.tess4j.util.LoadLibs;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;
import org.springframework.beans.factory.annotation.Value;import javax.imageio.ImageIO;
import javax.imageio.ImageReader;
import javax.imageio.stream.ImageInputStream;
import java.awt.*;
import java.awt.image.BufferedImage;
import java.awt.image.RasterFormatException;
import java.io.File;
import java.io.IOException;
import java.lang.reflect.Method;
import java.util.HashMap;
import java.util.Map;@Slf4j
public class ReadTextFromFileRegion {/*** @Description: ocr按区域识别文件**/public static String doRecognize(File file, Rectangle rectangle, String dataPath, String formateName, String dpi)throws Exception {if (!file.exists()) {throw new CustomException(0, "待识别文件不存在");}// OCR 文字识别return doOcr(createImg(file, rectangle, formateName), dataPath, dpi);}/*** file: 图片文件* rectangle: 图片中需要识别的区域。如new Rectangle(x, y, w, h), 坐标及宽高* dataPath: tessData的路径(文章开头已添加到环境变量,也可传入)* formateName: file文件的格式。如 JPG, PNG, DICOM等, * dpi: tesseractOcr识别时传入的参数。如:tesseract.setVariable("user_defined_dpi", dpi);*/public static String doRecognizeOrcOriginResult(File file, Rectangle rectangle, String dataPath, String formateName, String dpi)throws Exception {if (!file.exists()) {throw new CustomException(0, "待识别文件不存在");}// OCR 文字识别return doOcrImpl(createImg(file, rectangle, formateName), dataPath, false, dpi, true);}/*** 截取的图像缓冲区*/private static BufferedImage createImg(File file, Rectangle rectangle, String formateName) throws Exception {BufferedImage img = readFile(file, rectangle, formateName);if(img == null) {log.warn("读取图像异常: img == null");throw new Exception("文件读取异常, 创建img为空.");}return img;}/*** @Description: 把文件转为BufferedImage对象,并截取指定区域**/private static BufferedImage readFile(File file, Rectangle region, String formateName) throws IOException {ImageInputStream iis = null;ImageReader reader = null;try {// 创建 ImageInputStream 对象iis = ImageIO.createImageInputStream(file);// 获取 指定 文件的 ImageReader 实例reader = ImageIO.getImageReadersByFormatName(formateName).next();// 设置解码器reader.setInput(iis);// 如果需要截取图像,获取完整的BufferedImage,然后截取指定区域BufferedImage image = reader.read(0);BufferedImage subImage = null;try{subImage = image.getSubimage(region.x, region.y, region.width, region.height);}catch (RasterFormatException e) {log.warn("截取图像异常: 识别区域超出边界. err.msg: {}", e.toString());return subImage;}// 释放完整的BufferedImageimage.flush();return subImage;} finally {// 关闭资源if (reader != null) {reader.dispose();}if (iis != null) {iis.close();}}}/*** @Description: ocr按区域识别pdf文件**/public static String doPdfRecognize(File pdfFile, String dataPath) throws Exception {BufferedImage img = readPdfToImage(pdfFile);// 按自定义区域截取图像BufferedImage subImage = img.getSubimage(460, 170, 320, 100);// OCR 文字识别return doOcr(subImage, dataPath, "120");}/*** @Description: 把pdf转为图像,renderImageWithDPI方法的第二个参数dpi影响图像分辨率,经测试dpi为300,生成2k分辨率的图像**/private static BufferedImage readPdfToImage(File pdfFile) throws IOException {try (PDDocument document = PDDocument.load(pdfFile)) {PDFRenderer renderer = new PDFRenderer(document);return renderer.renderImageWithDPI(0, 300);}}/*** @Description: 使用Tesseract进行ocr识别**/private static String doOcr(BufferedImage img, String dataPath, String dpi) throws TesseractException {return doOcrImpl(img, dataPath, true, dpi, false);}/*** ocr识别* @param img* dataPath: tessData的路径(文章开头已添加到环境变量,也可传入)* @param replacedEmp 是否替换回车和空格为空, true:替换, false, 不替换(含回车和空格符)* @param dpi 分辨率, 默认 96* @param charNoLimit 识别空格: true, 不识别空格: false* @return* @throws TesseractException*/private static String doOcrImpl(BufferedImage img, String dataPath, boolean replacedEmp, String dpi, boolean charNoLimit) throws TesseractException {// 初始化 OCR 引擎Tesseract tesseract = new Tesseract();File tessDataFolder = LoadLibs.extractTessResources("tessdata");tesseract.setDatapath(tessDataFolder.getAbsolutePath());//语言包位置  根据实际环境修改替换tesseract.setDatapath(dataPath);//配置使用的语言  中文tesseract.setLanguage("eng");if(!charNoLimit) {//限制只识别数字字母tesseract.setVariable("tessedit_char_whitelist", "0123456789CDFGMRTX");}//设置分辨率tesseract.setVariable("user_defined_dpi", dpi);String result = tesseract.doOCR(img);if(replacedEmp) {// 文字识别-过滤空白、换行符result = result.replace(StrUtil.SPACE, StrUtil.EMPTY).replace(StrUtil.LF, StrUtil.EMPTY);}return result;}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/680041.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python学习23

前言&#xff1a;相信看到这篇文章的小伙伴都或多或少有一些编程基础&#xff0c;懂得一些linux的基本命令了吧&#xff0c;本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python&#xff1a;一种编程语言&…

数模.matlab符号计算方程

一、符号函数 a&#xff1a;整理简化&#xff1a; b&#xff1a;因式分解&#xff1a; c&#xff1a;多项式展开 d&#xff1a;合并&#xff1a; e&#xff1a;计算分子分母&#xff1a; f&#xff1a;求导&#xff1a; f&#xff1a;差分&#xff1a; g&#xff1a;不定积分&a…

阿里云服务器“带宽计费模式”怎么选?有啥区别?

阿里云服务器带宽计费模式分为“按固定带宽”和“按使用流量”&#xff0c;有什么区别&#xff1f;按固定带宽是指直接购买多少M带宽&#xff0c;比如1M、5M、10M、100M等&#xff0c;阿里云直接分配用户所购买的带宽值&#xff0c;根据带宽大小先付费再使用&#xff1b;按使用…

BYTEVALUE 百为流控路由器远程命令执行漏洞

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

单片机接收PC发出的数据

#include<reg51.h> //包含单片机寄存器的头文件 /***************************************************** 函数功能&#xff1a;接收一个字节数据 ***************************************************/ unsigned char Receive(void) { unsigned char dat; …

网络编程项目:电子辞典

项目要求&#xff1a; 登录注册功能&#xff0c;不能重复登录&#xff0c;重复注册。用户信息也存储在数据库中。单词查询功能历史记录功能&#xff0c;存储单词&#xff0c;意思&#xff0c;以及查询时间&#xff0c;存储在数据库基于TCP&#xff0c;支持多客户端连接&#x…

C++引用(内含和指针的对比)

1.引用的概念 概念&#xff1a;引用不是新定义一个变量&#xff0c;而是给已存在变量取了一个别名&#xff0c;编译器不会为引用变量开辟内存空间&#xff0c;它和它引用的变量共用一块内存空间。 类型& 引用变量名(对象名) 引用实体&#xff1b;&#xff08;&这个符…

leetcode 394. 字符串解码

本题主要思路是使用两个栈&#xff1a;一个用于存储倍数&#xff08;数字&#xff09;&#xff0c;另一个用于存储解码结果&#xff08;字符串&#xff09;。在遍历输入字符串时&#xff0c;根据不同的字符执行相应的操作&#xff0c;最终得到解码后的字符串。 具体来说&#x…

从零开始实现消息队列(二)

从零开始实现消息队列 .核心API交换机类型持久化网络通信Connection和Channel 消息应答模块划分 . 核心API 对于Broker来说,要实现以下核心API,通过这些API来实现消息队列的基本功能. 创建队列(queueDeclare)销毁队列(queueDelete)创建交换机(exchangeDeclare)销毁交换机(exc…

Duilib List 控件学习

这是自带的一个示例; 一开始运行的时候List中是空的,点击Search按钮以后就填充列表框; 先看一下列表框列头是在xml文件中形成的; <List name="domainlist" bkcolor="#FFFFFFFF" ... menu="true"> <ListHeader height="24…

中国电子学会2019年3月份青少年软件编程Scratch图形化等级考试试卷三级真题(选择题、判断题)

一、单选题(共 25 题&#xff0c;每题 2 分&#xff0c;共 50 分) 1. 要使以下代码运行后画出如图所示三角形风车,则以下代码中①②③④处应分别填入多少?( ) A.3 4 90 120 B.4 3 90 120 C.3 4 120 90 D.4 3 120 90 2.运行下列脚本&#xff0c;i的值为&#xff08; &am…

VitePress-14- 配置-titleTemplate 的作用详解

作用描述 1、titleTemplate 是标题的后缀&#xff1b;2、可以自定义标题的后缀&#xff1b;3、可以自定义整个的标题以及后缀&#xff0c;语法如下&#xff1a; titleTemplate: :title 链接符号 自己定义的后缀 【:title】&#xff1a;从页面的第一个 <h1> 标题推断出的…

HarmonyOS 鸿蒙 ArkTS ArkUI 页面之间切换转换动画设置

第一步&#xff1a;导入 import promptAction from ohos.promptAction 第二步&#xff1a;在build下方写入 pageTransition(){PageTransitionEnter({ duration: 1200 }).slide(SlideEffect.Right)PageTransitionExit({ delay: 100 }).translate({ x: 100.0, y: 100.0 }).opac…

统计数字出现次数的数位动态规划解法-数位统计DP

在处理数字问题时,我们经常遇到需要统计一定范围内各个数字出现次数的情况。这类问题虽然看起来简单,但当数字范围较大时,直接遍历统计的方法就变得不再高效。本文将介绍一种利用数位动态规划(DP)的方法来解决这一问题,具体来说,是统计两个整数a和b之间(包含a和b)所有…

掌握Go的加密技术:crypto/rsa库的高效使用指南

掌握Go的加密技术&#xff1a;crypto/rsa库的高效使用指南 引言crypto/rsa 库概览RSA 加密算法基本原理crypto/rsa 库的功能和应用 安装和基本设置在 Go 项目中引入 crypto/rsa 库基本环境设置和配置 密钥生成与管理生成 RSA 密钥对密钥存储和管理 加密和解密操作使用 RSA 加密…

代码随想录算法训练营第五十天|518. 零钱兑换Ⅱ

518. 零钱兑换Ⅱ 题目链接&#xff1a;力扣&#xff08;LeetCode&#xff09;官网 - 全球极客挚爱的技术成长平台 思路 本题相当于求装满容量为amount的背包有多少种方法&#xff0c;又由于零钱可以重复使用&#xff0c;属于完全背包的题型。将01背包完全装满的思路在494. 目…

【Redis快速入门】初识Redis、Redis安装、图形化界面

个人名片&#xff1a; &#x1f43c;作者简介&#xff1a;一名大三在校生&#xff0c;喜欢AI编程&#x1f38b; &#x1f43b;‍❄️个人主页&#x1f947;&#xff1a;落798. &#x1f43c;个人WeChat&#xff1a;hmmwx53 &#x1f54a;️系列专栏&#xff1a;&#x1f5bc;️…

【Java程序设计】【C00259】基于Springboot的人事管理系统(有论文)

基于Springboot的人事管理系统&#xff08;有论文&#xff09; 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于Springboot的人事管理系统 本系统分为管理员功能模块以及员工功能模块。 管理员功能模块&#xff1a;管理员登录系统后&#xff0c;可以对首页&a…

在vscode 中配置 pyside6 环境

在vscode中编写pyside环境配置 start 记录一下在 vscode 中编写 pyside6 程序&#xff0c;环境如何配置。 前提 请自行安装好 python。请自行安装好 vscode。安装 vscode 插件 Python&#xff0c;PYQT Integration。 配置环境 1.借助 pip 安装我们的pyside6 pip install…

【PowerShell】修改Windows网络配置的常用命令

PowerShell&#xff08;PS&#xff09;是一种强大的任务自动化和管理框架&#xff0c;具有丰富的命令和语法&#xff0c;可以用于编写脚本来管理Windows操作系统和其他应用程序。它的开放式架构和跨平台支持使得它成为一个灵活和可扩展的工具。 在网络配置方面&#xff0c;Powe…