如何使用Python获取图片中的文字信息

如下有三中方法:

方法1. 使用Tesseract OCR(pytesseract)

安装依赖

首先,确保你已经安装了Tesseract OCR引擎(例如,通过你的操作系统的包管理器)。然后,你可以通过pip安装pytesseractPillow(PIL的分支)。

pip install pytesseract pillow

你可能还需要设置Tesseract OCR引擎的路径,例如:

import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'  # 例如:r'C:\Program Files\Tesseract-OCR\tesseract.exe'

提取文字

from PIL import Image
import pytesseractdef ocr_core(filename):text = pytesseract.image_to_string(Image.open(filename))return textprint(ocr_core('example.png'))  # 替换 'example.png' 为你的图片文件

方法2. 使用Google Cloud Vision API

设置Google Cloud项目

  • 前往Google Cloud Console并创建一个项目。
  • 启用Vision API。
  • 创建一个服务账户并下载其JSON密钥文件。

安装依赖

你需要安装Google Cloud Vision的Python客户端库:

pip install google-cloud-vision

提取文字

from google.cloud import vision_v1 as vision
from google.cloud.vision_v1 import typesdef ocr_with_google_cloud(path):client = vision.ImageAnnotatorClient()with open(path, 'rb') as image_file:content = image_file.read()image = types.Image(content=content)response = client.document_text_detection(image=image)texts = response.text_annotationsprint('Texts:')for text in texts:print('\n"{}"'.format(text.description))vertices = (["({},{})".format(vertex.x, vertex.y)for vertex in text.bounding_poly.vertices])print("bounds: {}".format(",".join(vertices)))ocr_with_google_cloud('example.png')  # 替换 'example.png' 为你的图片文件

方法3. 使用EasyOCR库

EasyOCR 是一个简单而强大的 OCR 引擎,它支持超过 70 种语言和多种脚本,包括拉丁字母、中文、阿拉伯文、日文、韩文等。以下是如何在 Python 中使用 EasyOCR 库来从图片中提取文字的具体方法:

安装 EasyOCR

首先,你需要安装 EasyOCR。你可以通过 pip 来安装:

pip install easyocr

使用 EasyOCR 提取图片中的文字

以下是一个简单的示例,展示了如何使用 EasyOCR 从图片中提取文字:

import easyocrdef ocr_with_easyocr(image_path, lang_list=['ch_sim', 'en']):"""使用 EasyOCR 从图片中提取文字参数:image_path (str): 图片路径lang_list (list): 要识别的语言列表,默认为简体中文 ('ch_sim') 和英文 ('en')返回:list: 包含一个或多个 dict 的列表,每个 dict 代表一行文字及其位置信息"""reader = easyocr.Reader(lang_list=lang_list)  # 创建一个 Reader 对象,指定要识别的语言result = reader.readtext(image_path)  # 从图片中提取文字return result# 示例使用
results = ocr_with_easyocr('example.png')  # 替换 'example.png' 为你的图片文件
for result in results:print(f"文本: {result['text']}, 位置: {result['bbox']}")

在上面的示例中,ocr_with_easyocr 函数接受一个图片路径和一个语言列表作为参数。它使用 easyocr.Reader 创建一个 Reader 对象,并指定要识别的语言。然后,它调用 readtext 方法从图片中提取文字,并返回一个包含识别结果的列表。每个结果都是一个字典,包含识别到的文本和其在图片中的位置信息(以边界框的形式给出)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/846564.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微博增强-tampermonkey脚本实现网页管理悄悄关注

不是很明白微博为什么不出个x的列表功能&#xff0c;毕竟现在信息洪流&#xff0c;有些东西只是要看要了解&#xff0c;但不希望天天在首页轰炸眼睛&#xff0c;扰乱心智。 这个tampermonkey脚本适配了pc web和手机pwa版本&#xff08;weibo.com/m.weibo.cn&#xff09;,解决了…

golang map部分原理源码个人走读-附个人理解过程图解

近期再写map的demo时出现了下面一段报错&#xff0c;于是带着疑惑去看了一下源码 目的&#xff1a;主要想知道为啥map不让并发读写 fatal error: concurrent map read and map write 一.map的数据结构 先有个印象&#xff0c;后续会详细介绍 // A header for a Go map. ty…

NDIS Filter开发-OID 请求

NDIS 定义对象标识符 (OID) 值来标识适配器参数&#xff0c;其中包括操作参数&#xff0c;例如设备特征、可配置的设置和统计信息。 Filter驱动程序可以查询或设置基础驱动程序的操作参数&#xff0c;或过滤/覆盖顶层驱动程序的 OID 请求。 NDIS 还为 NDIS 6.1 及更高版本的Fi…

Informer

I n f o r m e r Informer Informer 摘要&#xff1a; 长序列时间序列的预测 i n f o r m e r informer informer优点&#xff1a; P r o b s p a r e Probspare Probspare自关注机制&#xff0c;在时间复杂度和内存使用方面达到 O ( N l o g N ) O(NlogN) O(NlogN),在序列依…

IP协议1.0

基本概念&#xff1a; • 主机: 配有IP地址, 但是不进⾏路由控制的设备; • 路由器: 即配有IP地址, ⼜能进⾏路由控制; • 节点: 主机和路由器的统称; IP协议的报头 • 4位版本号(version): 指定IP协议的版本, 对于IPv4来说, 就是4. • 4位头部⻓度(header length): IP头部的⻓…

初识SDN

初识SDN 软件定义网络&#xff08;SDN&#xff0c;Software-Defined Networking&#xff09;是一种网络架构方法&#xff0c;它通过将网络控制平面与数据平面分离来实现网络的集中化控制和管理。 基本概念 以下是SDN的关键概念和组成部分&#xff1a; 1. SDN的基本概念 控制…

mybatis增删改查模板设置及设置调用

mybatis增删改查模板设置 系统配置文件完成以及连接好数据之后&#xff0c;就可以用这个mybatis了&#xff0c;首先写这个数据库的增删改查模板StashMapper.xml&#xff0c;这个东西是要放在DAO层中的奥&#xff0c;切记。 1.编写mybatis对应数据库的增删改查模板 在我的Sta…

持续总结中!2024年面试必问 20 道 Kafka面试题(一)

一、Kafka 的基础概念有哪些&#xff1f; Kafka 是一个分布式流处理平台&#xff0c;由 LinkedIn 开发&#xff0c;并于 2011 年成为 Apache 软件基金会的一部分。以下是 Kafka 的一些基础概念&#xff1a; Broker: Kafka 集群由多个 Broker 组成&#xff0c;每个 Broker 存储…

DKTCDR:Domain-Oriented Knowledge Transfer for Cross-Domain Recommendation

Domain-Oriented Knowledge Transfer for Cross-Domain Recommendation IEEE(CCF B.SCI 1)-Guoshuai Zhao, Xiaolong Zhang, Hao Tang, Jialie Shen, and Xueming Qian-2024 思路 在CDR中,构建连接两个域的桥梁是实现跨域推荐的基础。然而现在的CDR方法往往在连接两个域时忽…

通俗易懂理解RANSAC算法

RANSAC(Random Sample Consensus)&#xff0c;翻译为随机抽样一致算法。 算法思路&#xff1a;从所有观测中随机找到几个尽可能少的点去拟合模型&#xff0c;拟合后依次计算模型和所有观测数据的残差&#xff0c;当残差小于给定的阈值时&#xff0c;就将其判断为内点&#xff…

软件测试进阶

目录 一、自动化测试 1.概念 2.Selenium 2.1 概念 2.1.1 Selenium是什么&#xff1f; 2.1.2 Selenium特点 2.1.3 工作原理 2.2 SeleniumJava环境搭配 2.3 定位元素 2.3.1 CSS语法 2.3.2 XPath语法 2.4 应用 2.4.1 点击提交文本 2.4.2 模拟输入 2.4.3 清除文本 2…

统信UOS桌面操作系统1070上使用notepad--文本编辑器

原文链接&#xff1a;统信UOS桌面操作系统1070上使用notepad–文本编辑器 Hello&#xff0c;大家好啊&#xff01;今天我要向大家推荐一款在统信UOS桌面操作系统1070上非常好用的文本编辑器软件——“notepad–”。这款软件功能强大、操作简便&#xff0c;特别适合开发人员和日…

车载软件架构 - AUTOSAR 的信息安全框架

车载软件架构 - AUTOSAR 的信息安全架构 我是穿拖鞋的汉子&#xff0c;魔都中坚持长期主义的汽车电子工程师。 老规矩&#xff0c;分享一段喜欢的文字&#xff0c;避免自己成为高知识低文化的工程师&#xff1a; 屏蔽力是信息过载时代一个人的特殊竞争力&#xff0c;任何消耗…

Nginx企业级负载均衡:技术详解系列(17)—— 长连接优化策略与下载服务器高效搭建

你好&#xff0c;我是赵兴晨&#xff0c;97年文科程序员。 今天咱们来聊聊Nginx的两个知识点&#xff1a;Nginx的长连接优化、如何将Nginx配置成下载服务器。 长连接配置详解 在Nginx的配置中&#xff0c;长连接是一个重要的性能优化手段。它允许一个TCP连接上发送多个请求和…

STM32作业实现(一)串口通信

目录 STM32作业设计 STM32作业实现(一)串口通信 STM32作业实现(二)串口控制led STM32作业实现(三)串口控制有源蜂鸣器 STM32作业实现(四)光敏传感器 STM32作业实现(五)温湿度传感器dht11 STM32作业实现(六)闪存保存数据 STM32作业实现(七)OLED显示数据 STM32作业实现(八)触摸按…

C++指针和引用到内存泄漏,内存对齐——面试八股素材库

参考《CPrimer》2.3 复合结构&#xff1b; C内存管理&#xff0c;内存泄漏&#xff0c;内存对齐 目录 指针和引用 引用和指针差别 引用 指针 具体用法差异 常量指针和指向常量对象的指针 const int * ptr; 和 int const * ptr 和 int * const ptr; 区别 const int *ptr…

c++实现:小型公司的信息管理系统(关于多态)

前言&#xff1a; 介绍员工信息&#xff1a;一个小型公司的人员信息管理系统 某小型公司&#xff0c;主要有四类人员&#xff1a;经理、技术人员、销售经理和推销员。现在&#xff0c;需要存储这些人员的姓名、编号、级别、当前薪水。计算月薪总额并显示全部信息人员编号基数为…

Nginx企业级负载均衡:技术详解系列(16)—— Nginx的try_files指令,你知道这个指令是干什么的吗?

你好&#xff0c;我是赵兴晨&#xff0c;97年文科程序员。 今天咱们来聊一聊Nginx的try_files指令&#xff0c;你知道这个指令是干什么的吗&#xff1f; 如果你对Web服务器配置有所了解&#xff0c;那么你可能会对try_files指令感到好奇。这个指令实际上是Nginx配置中的一项强…

提高工作效率的招数

自己的工作效率为啥比别人低&#xff0c;因为不会使用工具&#xff0c;这就是一个大冤种。 1.血泪教训&#xff0c;写代码调用第三方接口的时候已经要打印调用日志&#xff0c;不然扯皮真的难搞。 2.pg 上测试或的时候由于schema 错误mybatis会给你报空指针一样&#xff0c;还…

服务失败后如何重试?

服务失败后如何重试&#xff1f; 在分布式系统和网络应用程序中&#xff0c;重试策略对于有效处理瞬时错误和网络不稳定性至关重要。 重试策略能让系统在发生故障时多次尝试操作&#xff0c;从而提高最终成功的可能性。 下图显示了 4 种常见的重试策略。 01 线性回退 线性回…