做简单的html网站/苏州百度推广代理商

做简单的html网站,苏州百度推广代理商,天津全包圆装修公司电话,做企业网站设计与实现引言 在智能交通、地图定位等应用场景中,经常会遇到需要从图像中提取经纬度信息的需求。本篇文章将介绍如何利用 Python 的 pytesseract 库结合 PIL 对图像进行预处理,通过固定区域裁剪,来有效地识别出图像上显示的经纬度信息。 1. OCR 与 …

引言

在智能交通、地图定位等应用场景中,经常会遇到需要从图像中提取经纬度信息的需求。本篇文章将介绍如何利用 Python 的 pytesseract 库结合 PIL 对图像进行预处理,通过固定区域裁剪,来有效地识别出图像上显示的经纬度信息。

1. OCR 与 pytesseract 简介

OCR(Optical Character Recognition,光学字符识别)技术能够将图片中的文字信息转换成可编辑的文本。Tesseract 是一款开源的 OCR 引擎,功能强大且准确率较高;而 pytesseract 则是其 Python 封装,可以方便地在 Python 项目中调用 Tesseract 进行识别。

在我们的示例中,我们主要针对图像上固定位置的经纬度区域进行处理与识别。由于经纬度中只包含数字、小数点、°、N、S、E、W 等字符,我们可以通过设置 白名单 限制识别字符,从而提高识别准确率

2.示例代码

下面给出完整示例代码,并附带详细的注释说明每一步的实现逻辑:

import time
import pytesseract
from PIL import Image, ImageFilter, ImageEnhanceclass OCRReader:def __init__(self, center_x, center_y, width, height, sharpness=2.0, contrast=2.0, blur_radius=1):"""初始化 OCRReader 类,使用中心点和宽高设置裁剪区域的参数,并配置图像预处理的超参数。参数:center_x (int): 经度/纬度信息区域中心点的 x 坐标(从左向右)center_y (int): 经度/纬度信息区域中心点的 y 坐标(从上向下)width (int): 裁剪区域的宽度height (int): 裁剪区域的高度sharpness (float): 锐化处理的增强系数,数字越大效果越明显contrast (float): 对比度增强系数,数字越大表示对比度越明显blur_radius (float): 高斯模糊的半径,主要用于图像降噪"""self.center_x = center_xself.center_y = center_yself.width = widthself.height = heightself.sharpness = sharpnessself.contrast = contrastself.blur_radius = blur_radius# 对于经纬度,白名单中仅包含数字、°、小数点以及方向字符self.whitelist = "0123456789°.NSEW"def preprocess_image(self, img):"""对裁剪后的图像进行预处理:包括图像的锐化、对比度增强以及高斯模糊降噪。参数:img (Image): PIL 图像对象返回:Image: 预处理后的图像对象"""# 锐化处理,增强图像细节sharpener = ImageEnhance.Sharpness(img)img = sharpener.enhance(self.sharpness)# 增强对比度,使文字更明显enhancer = ImageEnhance.Contrast(img)img = enhancer.enhance(self.contrast)# 应用高斯模糊降噪if self.blur_radius > 0:img = img.filter(ImageFilter.GaussianBlur(self.blur_radius))return imgdef read_coordinates(self, image_path):"""从给定图像文件中提取经纬度信息。参数:image_path (str): 图像文件的路径返回:str: OCR 识别出的文本"""# 加载图像img = Image.open(image_path)# 如果图像带有透明度,则将其转换为 RGB 模式(填充背景为白色)if img.mode == 'RGBA':background = Image.new('RGB', img.size, (255, 255, 255))background.paste(img, mask=img.split()[3])img = backgroundelif img.mode == 'LA':background = Image.new('L', img.size, 255)background.paste(img, mask=img.split()[1])img = background.convert('RGB')# 根据中心点坐标和宽高,计算出裁剪区域的左上角和右下角坐标left = self.center_x - self.width // 2top = self.center_y - self.height // 2right = self.center_x + self.width // 2bottom = self.center_y + self.height // 2# 裁剪图像得到经纬度显示区域cropped_img = img.crop((left, top, right, bottom))cropped_img.save('sub_img.jpg')  # 保存裁剪后的图像,便于调试# 对裁剪后的图像进行预处理processed_img = self.preprocess_image(cropped_img)processed_img.save('processed_sub_img.jpg')  # 保存预处理后的图像,便于调试# 配置 Tesseract 的识别参数:# --psm 6 表示将图像看作单一文本块# tessedit_char_whitelist 限定识别的字符集custom_config = f'--psm 6 -c tessedit_char_whitelist={self.whitelist}'result = pytesseract.image_to_string(processed_img, config=custom_config, timeout=1)return result# 示例使用
if __name__ == '__main__':ocr_reader = OCRReader(center_x=1440, center_y=802, width=204, height=20)t1 = time.time()result = ocr_reader.read_coordinates('./ocr_test.png')print("\n识别结果:", result)print(f"Time: {time.time() - t1}")

2.1 类的初始化与参数设定

  • center_x 与 center_y:代表图像中经纬度展示区域的中心坐标。
  • width 与 height:定义裁剪区域的尺寸。
  • sharpness、contrast 和 blur_radius:预处理步骤中用于改善图像质量的参数。
  • whitelist:指定 OCR 识别时只允许出现的字符,本例中仅包含经纬度所必需的字符。

2.2 图像预处理

预处理步骤主要有三个:

  • 锐化:通过 ImageEnhance.Sharpness 增加图像的细节,帮助提高文字的边缘清晰度。
  • 对比度增强:利用 ImageEnhance.Contrast 调整图像的对比度,使目标文字更醒目。
  • 高斯模糊:适当的模糊可以起到降噪的作用,有利于提高 OCR 的识别率。

2.3 裁剪与 OCR 识别

  • 裁剪区域计算:通过中心点和尺寸参数计算出目标区域的四个边界的坐标,然后使用 crop 方法裁剪图像。
  • 透明度处理:有的图像可能带有透明通道(如 PNG 图片),通过转换为 RGB 模式确保 OCR 引擎能够正确处理。
  • OCR 参数配置:设置 --psm 6 以适应单一文本块的场景,并通过白名单限制识别字符范围,进一步提高识别准确性。
  • 超时设置:timeout=1 参数确保在识别超时时不会阻塞程序。
    在这里插入图片描述

3. 总结与扩展

通过本文示例,我们展示了如何利用 pytesseract 进行专门的区域 OCR 识别,并结合图像预处理技术提升识别率。在实际项目中,你可以根据图像质量和识别场景进一步调整预处理参数,比如增加二值化处理、去背景等操作。

此外,若图像中包含不同区域的文本信息,可扩展代码实现批量处理和区域定位,从而用于更大规模的自动化识别任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/897666.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器人交互系统 部署构建

环境要求 Ubuntu 20.04 或更高版本ROS Noetic 或兼容版本Python 3.8 安装步骤 1. 安装ROS环境(如未安装) sudo apt update sudo apt install ros-noetic-desktop-full source /opt/ros/noetic/setup.bash2. 创建工作空间并克隆代码 mkdir -p ~/code…

全员DeepSeek时代,前端能做些什么?

全员DeepSeek时代,前端能做些什么? 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,可以分享一下给大家。点击跳转到网站。 https://www.captainbed.cn/ccc #mermaid-svg-VNyL95jkz9jEXgUq {font-family:&…

Machine Learning: 十大基本机器学习算法

机器学习算法分类:监督学习、无监督学习、强化学习 基本的机器学习算法: 线性回归、支持向量机(SVM)、最近邻居(KNN)、逻辑回归、决策树、k平均、随机森林、朴素贝叶斯、降维、梯度增强。 机器学习算法大致可以分为三类: 监督学习算法 (Sup…

【Linux docker 容器】关于想要让虚拟机在开机时候也docker自己启动,容器也自己启动,省去要自己开docker和容器

确认 Docker 服务状态: 首先,你需要确保 Docker 服务已经在虚拟机上安装并正确配置。你可以使用如下命令来检查 Docker 服务的状态: systemctl status docker.service 如果服务没有运行,你可以使用以下命令启动它: s…

linux 命令 ls

ls 是 Linux 系统中用于列出目录内容的核心命令,几乎所有日常操作都会用到。以下是其详细用法和常见场景说明 1. 基础语法 ls [选项] [目录/文件] 不指定目录时,默认列出当前目录的内容。 可以指定文件或目录路径,支持通配符(如…

CI/CD—GitLab部署

GitLab简介: GitLab 是一个用于代码托管和软件开发协作的平台,在全球开发者社区及企业中应用广泛,以下是对它的详细介绍: 主要功能 代码托管:提供了基于 Git 的代码仓库管理功能,支持创建、克隆、推送、…

ubuntu软件

视频软件,大部分的编码都能适应 sudo apt install vlc图片软件 sudo apt install gwenview截图软件 sudo apt install flameshot设置快捷键 flameshot flameshot gui -p /home/cyun/Pictures/flameshot也就是把它保存到一个自定义的路径 菜单更换 sudo apt r…

Easysearch 使用 AWS S3 进行快照备份与还原:完整指南及常见错误排查

Easysearch 可以使用 AWS S3 作为远程存储库,进行索引的快照(Snapshot)备份和恢复。同时,Easysearch 内置了 S3 插件,无需额外安装。以下是完整的配置和操作步骤。 1. 在 AWS S3 上创建存储桶 登录 AWS 控制台&#x…

探索高性能AI识别和边缘计算 | NVIDIA Jetson Orin Nano 8GB 开发套件的全面测评

随着边缘计算和人工智能技术的迅速发展,性能强大的嵌入式AI开发板成为开发者和企业关注的焦点。NVIDIA近期推出的Jetson Orin Nano 8GB开发套件,凭借其40 TOPS算力、高效的Ampere架构GPU以及出色的边缘AI能力,引起了广泛关注。本文将从配置性…

开源免费日志服务ELK Syack代替syslog

一、ELK Stack 采集 syslog 日志的主要方式 通常,ELK Stack 使用 Logstash 或者 Filebeat 来采集 syslog 日志。 Beats 通常更轻量级,适合作为代理部署在各个日志源服务器上,而 Logstash 则功能更强大,可以进行更复杂的日志处理和…

C#+AForge 实现视频录制

C#AForge 实现视频录制 ​ 在C#中,使用AForge 库实现视频录制功能是一个比较直接的过程。AForge 是一个开源的.NET框架,提供了许多用于处理图像和视频的类库。 开发步骤 安装AForge库 ​ 首先,确保你的项目中已经安装了 AForge.Video和AFo…

PHP框架加载不上.env文件中的变量

以lumen5.5框架为例,根目录中bootstrap文件夹下的app.php文件中 (new Dotenv\Dotenv(__DIR__./../))->load(); 是读取所有.env中的文件的,这个是正常的,但是在代码中的任何位置或者在config目录下的databases.php里,代码如…

21.Linux 线程库的使用与封装

在linux内核中并没有线程的概念,只有轻量级进程LWP的概念,linux下的线程都是是由LWP进行模拟实现的。因此linux操作系统中不会提供线程的相关接口,只会提供轻量级线程的接口(如vfork,clone等)。但是在我们的…

Aliyun CTF 2025 web 复现

文章目录 ezoj打卡OKoffens1veFakejump server ezoj 进来一看是算法题,先做了试试看,gpt写了一个高效代码通过了 通过后没看见啥,根据页面底部提示去/source看到源代码,没啥思路,直接看wp吧,跟算法题没啥关系,关键是去…

Git使用(一)--如何在 Windows 上安装 Git:详细步骤指南

如果你想在 Windows 机器上安装 Git,可以按照以下详细指南进行操作。 第一步:下载 Git 可通过官网下载 适用于 Windows 的 Git 最新版本。 如果下载速度较慢,可以通过下面提供的百度网盘 链接下载安装包, https://git-scm.com/d…

本地Git仓库搭建(DevStar)与Git基本命令

本地Git仓库搭建(DevStar)与Git基本命令 实验环境搭建平台Git基本命令的使用本地仓库的创建代码提交代码合并版本发布 总结 实验环境 搭建平台 按照DevStar的Github仓库要求,在终端中执行下列命令,即可成功安装DevStar到本地部署…

stm32 蓝桥杯 物联网 独立键盘的使用

在蓝桥杯物联网平台里面,有5个外接设备,其中有一个就是6个独立按键。首先,我们先看一下按键有关的电路图。 电路图与cubemx设定 由图可见,独立键盘组由两行三列构成,我们通过行列来锁定要访问的独立按键在哪。ROW1挂…

工作记录 2017-01-06

工作记录 2017-01-06 序号 工作 相关人员 1 协助BPO进行Billing的工作。 修改CSV、EDI837的导入。 修改邮件上的问题。 更新RD服务器。 郝 修改的问题: 1、 In “Full Job Summary” (patient info.), sometime, the Visit->Facility is missed, then …

Python Selenium库入门使用,图文详细。附网页爬虫、web自动化操作等实战操作。

文章目录 前言1 创建conda环境安装Selenium库2 浏览器驱动下载(以Chrome和Edge为例)3 基础使用(以Chrome为例演示)3.1 与浏览器相关的操作3.1.1 打开/关闭浏览器3.1.2 访问指定域名的网页3.1.3 控制浏览器的窗口大小3.1.4 前进/后…

SpringMVC 基本概念与代码示例

1. SpringMVC 简介 SpringMVC 是 Spring 框架中的一个 Web 层框架,基于 MVC(Model-View-Controller) 设计模式,提供了清晰的分层结构,适用于 Web 应用开发 SpringMVC 主要组件 DispatcherServlet(前端控…