基于OpenCV的图像处理案例之图像矫正(Python)

Index 目录索引

  • 写在前面
  • 解决思路
  • 参考

写在前面

本文通过一个案例介绍如何使用OpenCV将倾斜的扫描文档图像进行水平矫正。

解决思路

因为扫描图像中的大部分文字倾斜后,同一行文字也在同一条直线,所以可以通过拟合直线来计算文本倾斜角度,接着对这些倾斜角度进行排序,选择其中值作为最终的旋转角度,通过旋转来实现倾斜图像的水平矫正1。本文在参考文档的基础上,进行了中值筛选,从而更好地对倾斜图像进行矫正。

废话不多说,直接上代码:

import numpy as np
import os
import cv2
import math
from scipy import misc, ndimagedef getMedianAngle(lines):angles = []for line in lines:x1, y1, x2, y2 = line[0]# 计算直线的斜率if x1 != x2:  # 避免除以零错误slope = (y2 - y1) / (x2 - x1)# 计算斜率对应的角度angle = np.degrees(math.atan(slope))angles.append(angle)# 计算角度的中位数median_angle = np.median(angles)return median_angledef rotate(image, angle, center=None, scale=1.0):(w, h) = image.shape[0:2]if center is None:center = (w // 2, h // 2)wrapMat = cv2.getRotationMatrix2D(center, angle, scale)return cv2.warpAffine(image, wrapMat, (h, w))# 使用霍夫变换
def getCorrect2():# 读取图片,灰度化src = cv2.imread('./text_correct/640.png')showAndWaitKey("src", src)gray = cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)showAndWaitKey("gray", gray)# 腐蚀、膨胀kernel = np.ones((5, 5), np.uint8)erode_Img = cv2.erode(gray, kernel)eroDil = cv2.dilate(erode_Img, kernel)showAndWaitKey("eroDil", eroDil)# 边缘检测canny = cv2.Canny(eroDil, 50, 150)showAndWaitKey("canny", canny)# 霍夫变换得到线条lines = cv2.HoughLinesP(canny, 0.8, np.pi / 180, 90, minLineLength=100, maxLineGap=10)# 求得拟合图像倾斜角度的中位数median_angle = getMedianAngle(lines)print("Median Angle:", median_angle)drawing = np.zeros(src.shape[:], dtype=np.uint8)# 画出线条for line in lines:x1, y1, x2, y2 = line[0]cv2.line(drawing, (x1, y1), (x2, y2), (0, 255, 0), 1, lineType=cv2.LINE_AA)showAndWaitKey("houghP", drawing)"""旋转角度大于0,则逆时针旋转,否则顺时针旋转"""rotateImg = rotate(src, median_angle)cv2.imshow("rotateImg", rotateImg)cv2.waitKey()cv2.destroyAllWindows()cv2.imwrite('./text_correct/result.jpg', rotateImg)def showAndWaitKey(winName, img):cv2.imshow(winName, img)cv2.waitKey()if __name__ == "__main__":getCorrect2()

原图和结果图分别如下:

原图
原图
矫正后的图像
结果图


如果我的这篇文章帮助到了你,那我也会感到很高兴,一个人能走多远,在于与谁同行


参考


  1. 实战 | OpenCV实现扫描文本矫正应用与实现详解(附源码) ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/763823.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++初阶:2_类与对象(中)

类与对象(中) 一.类的6个默认成员函数 如果一个类中什么成员都没有,简称为空类。 空类中真的什么都没有吗?并不是,任何类在什么都不写时,编译器会自动生成以下6个默认成员函数。 默认成员函数:用户没有显式实现&am…

C语言自定义类型结构体

variable adj.易变的,多变的;时好时坏的;可变的,可调节的; (数)(数字)变量的;(植,动)变异的,变型的&#xff1…

【保姆级教程】YOLOv8_Track多目标跟踪,快速运行

一、YOLOV8环境准备 1.1 下载安装最新的YOLOv8代码 仓库地址: https://github.com/ultralytics/ultralytics1.2 配置环境 pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple二、下载测试视频,预训练权重 测试视频 链接&am…

Qt pro项目文件属性

一.Qt pro项目文件属性介绍 Qt项目的.pro文件是项目管理文件,用于记录项目设置和组织管理项目包含的文件。以下是一些主要属性及其介绍: QT: 指定项目使用的Qt模块。例如,QT core gui表示项目中加入core和gui模块。如果使用到数据库操作&…

腾讯云COS - 前端上传文件到 COS 跨域问题

问题描述 原因分析 因为我本地的地址是:http://localhost:9528 而发送请求时的地址是:http://132-1307119153.cos.ap-beijing.myqcloud.com/tu.jpg 域名不同,自然而然就出现了跨域的问题! 解决方案 先点击对象存储 - 安全设置…

C#如何从上次窗体关闭的位置打开窗体

目录 1.操作方法 (1)Location属性 (2)读写注册表 (3)SetValue方法 (4)命名空间 2.示例 实际开发中,有很多软件都有一个通用的功能,即从上次关闭位置启动…

mysql 事务基本介绍

目录 命令小结 一 MySQL事务的概念 (一)事务介绍 (二)事务特点 (三)事务的ACID特点 1,原子性 1.1 原子性具体形容 1.2 原子性案例 2 ,一致性 2.1一致性具体介绍 2.2…

《数字集成电路物理设计》学习笔记(持续更新中)

参考书籍: 《数字集成电路物理设计》pdf下载百度云链接: 链接: https://pan.baidu.com/s/1jOD54q_f9KLhfX6InabTRA?pwd8888 提取码: 8888 复制这段内容后打开百度网盘手机App,操作更方便哦 --来自百度网盘超级会员v8的分享 目录 第1章 集…

C++ set 、unordered_set 删除

erase() 语法格式 set_name.erase(element);//删除 set 容器中值为 val 的元素name.erase(iterator position);//删除 position 迭代器指向的元素name.erase(iterator start, iterator end);//删除 [start,end) 区间内的所有元素示例 set<int> myset{1,2,3,4,5}; myse…

Vue 常见面试题(一)

目录 1、Vue 的最大的优势是什么&#xff1f;&#xff08;必会&#xff09; 2、Vue 和 jQuery 两者之间的区别是什么&#xff1f;&#xff08;必会&#xff09; 3、MVVM 和 MVC 区别是什么&#xff1f;哪些场景适合&#xff1f;&#xff08;必会&#xff09; 1、基本定义 2…

索尼下一代游戏主机PS5将于11月20日发售

索尼下一代游戏机PS5将于2020年11月20日发布。据悉&#xff0c;这款游戏机的售价可能会达到499美元&#xff08;约合人民币3500元&#xff09;。 我们知道游戏主机的价格低于游戏PC的价格。 既然PS5的主要硬件配置已经公开&#xff0c;那么现在配置一台同样配置的游戏PC需要多少…

WSL2的安装步骤

WSL2&#xff08;Windows Subsystem for Linux 2&#xff09;是微软公司开发的一项创新性技术&#xff0c;它在Windows操作系统上提供了一个完整的Linux内核&#xff0c;并允许用户在Windows环境中运行Linux发行版。之前想在Windows上使用Linux系统必须先安装VirtualBox或VMWar…

实战whisper语音识别第一天,部署服务器,可远程访问,实时语音转文字(全部代码和详细部署步骤)

Whisper是OpenAI于2022年发布的一个开源深度学习模型&#xff0c;专门用于语音识别任务。它能够将音频转换成文字&#xff0c;支持多种语言的识别&#xff0c;包括但不限于英语、中文、西班牙语等。Whisper模型的特点是它在多种不同的音频条件下&#xff08;如不同的背景噪声水…

聊聊功率器件(氮化镓,碳化硅)

氮化镓和碳化硅是两种具有独特性质和广泛应用的无机物。下面将尽可能详细地解释它们的定义、应用、研究热点以及对我们的价值。 1&#xff0c;氮化镓 氮化镓&#xff08;GaN&#xff09;是一种由氮和镓元素组成的化合物&#xff0c;具有直接能隙的半导体特性。其结构类似于纤…

多线程基础 -概念、创建、等待、分离、终止

文章目录 一、 线程概念1. 什么是线程2. 线程的优点3.线程的缺点4. 线程异常5. 线程用途 二、 Linux进程VS线程1. 进程和线程2. 进程和线程的地址空间3. 进程和线程的关系 三、Linux线程控制1. POSIX线程库2. 线程创建3. 线程ID及进程地址空间布局4. 线程终止5. 线程等待6. 线程…

故障诊断 | 一文解决,RBF径向基神经网络的故障诊断(Matlab)

文章目录 效果一览文章概述专栏介绍模型描述源码设计参考资料效果一览 文章概述

专业140+总分410+南京大学851信号与系统考研经验南大电子信息与通信集成,电通,真题,大纲,参考书。

今年分数出来还是有点小激动&#xff0c;专业851信号与系统140&#xff08;感谢Jenny老师辅导和全程悉心指导&#xff0c;答疑&#xff09;&#xff0c;总分410&#xff0c;梦想的南大离自己越来越近&#xff0c;马上即将复试&#xff0c;心中慌的一p&#xff0c;闲暇之余&…

#Linux(权限管理)

&#xff08;一&#xff09;发行版&#xff1a;Ubuntu16.04.7 &#xff08;二&#xff09;记录&#xff1a; &#xff08;1&#xff09; &#xff08;2&#xff09;-开头代表普通文件 划分为三组&#xff1a; rw- rw- r-- rw-: 文件拥有…

蓝桥杯-体育健将-CPP-贪心

目录 一、题目描述&#xff1a; 二、整体思路&#xff1a; 三、代码&#xff1a; 一、题目描述&#xff1a; 二、整体思路&#xff1a; 要在k分钟内拿最多的金牌&#xff0c;就意味着要参加尽可能多的项目&#xff0c;因此就要选择耗时(比赛时间和休息时间)最少的项目先预处…

【隐私计算实训营003详解隐私计算框架及技术要点】

1. 隐语架构一览 1.1 隐语架构 隐语架构通常指的是一种面向隐私保护计算的软件框架或解决方案&#xff0c;它采用了密码学、可信执行环境&#xff08;TEE&#xff09;、多方安全计算&#xff08;MPC&#xff09;等多种隐私保护技术来实现在数据加密状态下进行计算&#xff0c;…