Linux安装Tesseract-OCR(操作系统CentOS)

Linux安装Tesseract-OCR

  • 第一步,安装依赖
  • 第二步,下载安装包
  • 第三步,安装leptonica库
  • 第四步,安装tesseract
  • 第五步,添加语言包
  • 第六步,测试

第一步,安装依赖

sudo yum install libpng-devel
rpm -qa | grep libpng-devel
sudo yum install libjpeg-devel
rpm -qa | grep libjpeg-devel
sudo yum install tiff-devel
rpm -qa | grep tiff-devel
sudo yum install libtool-ltdl
rpm -qa | grep libtool-ltdl
sudo yum install gcc
gcc --version
sudo yum install g++
g++ --version
sudo yum install automake
automake --version

第二步,下载安装包

leptonica-1.78.0.tar.gz
下载地址 http://www.leptonica.org/source/leptonica-1.78.0.tar.gz

tesseract-5.2.0.tar.gz
下载地址 https://codeload.github.com/tesseract-ocr/tesseract/tar.gz/refs/tags/5.2.0

第三步,安装leptonica库

#1、首先,使用tar命令解压leptonica-1.78.0.tar.gz文件。这个命令会将压缩包中的所有文件和目录提取到当前目录下
tar -xzvf leptonica-1.78.0.tar.gz#2、然后,进入解压后的目录leptonica-1.78.0
cd leptonica-1.78.0#3、./autogen.sh是一个用于生成Makefile文件的脚本。它会根据系统的环境和配置信息,自动生成适合当前环境的Makefile文件,以便进行编译和安装。通常在源代码包中提供该脚本,用户需要先运行该脚本,然后再执行make命令进行编译和安装。
./autogen.sh
【如果执行autogen.sh脚本提示libtoolize: 未找到命令,执行sudo yum install libtool】#4、接下来,执行configure命令进行配置
./configure --prefix=/usr/local/leptonica#5、配置完成后,执行make命令进行编译
make#6、最后,使用sudo make install命令进行安装。这个命令需要管理员权限,因为安装软件通常需要修改系统文件。
sudo make install接下来配置 leptonica 环境变量
#1、打开 /etc/profile
vim /etc/profile#2、追加以下字段
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/leptonica/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/leptonica/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/leptonica/lib
export LIBRARY_PATH
LIBLEPT_HEADERSDIR=/usr/local/leptonica/include/leptonica
export LIBLEPT_HEADERSDIR#3、应用配置
source /etc/profile

第四步,安装tesseract

#1、首先,使用tar命令解压tesseract-5.2.0.tar.gz文件。这个命令会将压缩包中的所有文件和目录提取到当前目录下。
tar -xzvf tesseract-5.2.0.tar.gz#2、然后,进入解压后的目录tesseract-5.2.0.tar.gz
cd tesseract-5.2.0#3、./autogen.sh是一个用于生成Makefile文件的脚本。它会根据系统的环境和配置信息,自动生成适合当前环境的Makefile文件,以便进行编译和安装。通常在源代码包中提供该脚本,用户需要先运行该脚本,然后再执行make命令进行编译和安装。
./autogen.sh#4、执行configure命令进行配置(这步可能会提示报错,看看自己缺少什么依赖就安装什么依赖)
./configure --prefix=/usr/local/tesseract#5、配置完成后,执行make命令进行编译
配置完成后,执行make命令进行编译
make#6.最后,使用sudo make install命令进行安装。这个命令需要管理员权限,因为安装软件通常需要修改系统文件
sudo make install接下来配置 tesseract 环境变量
#1、打开 /etc/profile
vim /etc/profile#2、追加以下字段
PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/usr/local/share/tessdata
#export PATH=$PATH:$TESSDATA_PREFIX#3、应用配置
source /etc/profile#4、测试一下
tesseract -v

第五步,添加语言包

#1、如果你不想每次都指定语言包加载路径的话...你需要: 将软件安装目录下的 tessdata目录 拷贝到 /usr/local/share/tessdata目录#2、下载 tesseract 语言包(从你win系统里面的C:\Program Files\Tesseract-OCR\tessdata里面的语言包拷贝到Linux服务器上/usr/local/share/tessdata目录就可以了,因为这样操作是最安全的,不然会出现奇奇怪怪的问题等待你处理,因为你下载的语言包不一定是正确的。)ps:前提是你的win安装了tesseract,并且在安装的时候选择了安装语言包

第六步,测试

识别图片命令
tesseract 567.png outputteee -l chi_sim+eng参数说明
tesseract = 命令
567.png=当前目录文件
outputteee=会在当前目录生成outputteee.txt文件
-l chi_sim+eng=中文+英文,如果是单个语言-l chi_sim就可以了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/167039.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从零学算法400

400.给你一个整数 n ,请你在无限的整数序列 [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, …] 中找出并返回第 n 位上的数字。 示例 1: 输入:n 3 输出:3 示例 2: 输入:n 11 输出:0 解释:第…

ubuntu22.04 arrch64版在线安装mysql8

脚本 # todo参考链接 Ubuntu服务器配置mysql8_ubuntu安装mysql8-CSDN博客

乐得瑞LDR6020 VR串流线方案:实现同时充电传输视频信号

VR(Virtual Reality),俗称虚拟现实技术,是一项具有巨大潜力的技术创新,正在以惊人的速度改变我们的生活方式和体验,利用专门设计的设备,如头戴式显示器(VR头盔)、手柄、定…

三菱PLC定时中断应用编程(计数器+比较器)

三菱PLC如何开启定时中断可以查看下面文章链接: PLC定时中断程序应用注意事项(西门子三菱信捷)_plc设置断点之后会怎样_RXXW_Dor的博客-CSDN博客文章浏览阅读2.5k次,点赞5次,收藏6次。首先我们了解下什么是中断。中断(打断的意思),在PLC执行当前程序时,由于系统出现了…

抖音推广实战,教你如何快速成长

一、背景介绍 随着移动互联网的飞速发展,抖音作为一款短视频平台,已经成为越来越多人生活中的一部分。它不仅提供了丰富多彩的内容,还为商家提供了推广产品的绝佳平台。本文将为大家详细解析抖音推广实战,帮助大家快速成长。 二…

基于SSM的老年公寓信息管理(有报告)。Javaee项目

演示视频: 基于SSM的老年公寓信息管理(有报告)。Javaee项目 项目介绍: 采用M(model)V(view)C(controller)三层体系结构,通过Spring SpringMvc …

Spring Boot 应用的 Docker 化:从 Maven 构建到 Docker 部署的完整指南

1. 使用Dockerfile部署 # 使用Java 8基础镜像 FROM java:8 LABEL authors"mabh"# 设置时区为Asia/Shanghai,可以根据需要更改 ENV TIME_ZONEAsia/Shanghai# 更新时区 RUN ln -snf /usr/share/zoneinfo/$TIME_ZONE /etc/localtime && echo $TIME_…

堆的实现(C语言版)

文章目录 概述堆的实现初始化销毁插入删除取堆顶元素求堆的长度判断堆是否为空 完整代码 概述 如果有一个关键码的集合K {k0,k1,k2…kn-1}&#xff0c;把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中&#xff0c;并满足&#xff1a;Ki <K2*i1 且 Ki<K2…

Python Opencv实践 - 全景图片拼接stitcher

做一个全景图片切片的程序Spliter 由于手里没有切割好的全景图片资源&#xff0c;因此首先写了一个切片的程序spliter。 如果有现成的切割好的待拼接的切片文件&#xff0c;则不需要使用spliter。 对于全景图片的拼接&#xff0c;需要注意一点&#xff0c;各个切片图片之间要有…

NX二次开发UF_CSYS_map_point 函数介绍

文章作者&#xff1a;里海 来源网站&#xff1a;https://blog.csdn.net/WangPaiFeiXingYuan UF_CSYS_map_point Defined in: uf_csys.h int UF_CSYS_map_point(int input_csys, double input_point [ 3 ] , int output_csys, double output_point [ 3 ] ) overview 概述 Ma…

Android11编译第七弹:串口文件读写

问题&#xff1a;需要对SIM卡进行管理&#xff0c;支持APP切换SIM卡。此功能需要访问串口文件&#xff0c;并且对串口文件进行读写。APP操作串口文件/dev/ttyUSB1时&#xff0c;串口文件打开失败。 2023-11-23 10:59:44.092 14264-14264 MULTI_CARD_SerialHandle com.wellnkio…

三分钟快速理解 ChatGPT 背后的大模型技术

在过去的十年中&#xff0c;人工智能领域取得了重大突破&#xff0c;其中自然语言处理&#xff08;NLP&#xff09;是其重要子领域之一。NLP使用的模型之一是大型语言模型&#xff08;LLMs&#xff09;。LLMs被设计用于处理大量文本数据&#xff0c;采用先进的神经网络架构&…

nodejs 文件目录监听 chokidar watchpack

文件监听实现&#xff0c;推荐使用chokidar&#xff1a; chokidar 默认是基于事件监听文件 const chokidar require("chokidar"); const folderToWatch path.join(__dirname, "lib"); const watcher chokidar.watch(folderToWatch, { ignored: /(^|[…

在Vue中使用Echarts

文章目录 Echarts1. 介绍2. 体验NPM 安装 Echarts定义 Echarts 容器引入 Echarts 3. 基础配置 Echarts 1. 介绍 常见的数据可视化库&#xff1a; D3.js 目前 Web 端评价最高的 Javascript 可视化工具库(入手难)ECharts.js 百度出品的一个开源 Javascript 数据可视化库Highch…

鼠标拖拽问题,不选中文本不触发单击事件

文章目录 1. 为什么鼠标单击的时候触发了mousemove事件&#xff1f;明明鼠标没有移动2. 鼠标拖拽元素怎么能不触发单击事件&#xff1f;怎么处理鼠标在元素内的相对定位&#xff0c;而不是每次定位到左上角&#xff1f;方式一&#xff1a;拖拽的元素没有注册click监听就不会触发…

10年测试老鸟,自动化测试经验10条建议,一路狂飙...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 1、哪一刻&#x…

Java面试题(每天10题)-------连载(37)

目录 Mysql篇 1、Mysql如何优化DISTINCT&#xff1f; 2、如何输入字符为十六进制数字&#xff1f; 3、如何显示前50行&#xff1f; 4、可以使用多少列创建索引&#xff1f; 5、NOW()和CURRENT_DATE()有什么区别&#xff1f; 6、什么样的对象可以使用CREATE语句创建&…

Postman如何使用(二):Postman Collection的创建/使用/导出分享等

一、什么是Postman Collection&#xff1f; Postman Collection是可让您将各个请求分组在一起。 您可以将这些请求组织到文件夹中。中文经常将collection翻译成收藏夹。如果再下文中看到这样的翻译不要觉得意外。Postman Collection会使你的工作效率更上一层楼。Postman Colle…

【洛谷 B2080】计算多项式的值 题解(顺序结构+四则运算)

计算多项式的值 题目描述 假定多项式的形式为 x n x ( n − 1 ) x^nx^{(n-1)} xnx(n−1) … x 2 x 1 x^2x1 x2x1&#xff0c;请计算给定单精度浮点数 x x x 和正整数 n n n 值的情况下这个多项式的值。多项式的值精确到小数点后两位&#xff0c;保证最终结果在 doub…

NFS 速度变慢问题排查 性能优化

NFS 使用 RPC 来进行客户端和服务器之间的通信。而在 RPC 的底层&#xff0c;NFS 使用 TCP 来进行数据的可靠传输&#xff0c;以便客户端和服务器之间能够有效地传输文件和进行远程调用&#xff08;默认为TCP,也可调整为udp&#xff09; 1.首先服务器端启动RPC服务portmap&…