Python OpenCV精讲系列 - 高级图像处理技术(五)

在这里插入图片描述

💖💖⚡️⚡️专栏:Python OpenCV精讲⚡️⚡️💖💖
本专栏聚焦于Python结合OpenCV库进行计算机视觉开发的专业教程。通过系统化的课程设计,从基础概念入手,逐步深入到图像处理、特征检测、物体识别等多个领域。适合希望在计算机视觉方向上建立坚实基础的技术人员及研究者。每一课不仅包含理论讲解,更有实战代码示例,助力读者快速将所学应用于实际项目中,提升解决复杂视觉问题的能力。无论是入门者还是寻求技能进阶的开发者,都将在此收获满满的知识与实践经验。

1. 特征检测

特征检测用于在图像中寻找具有独特性的区域或点,这些特征可以在不同的图像之间进行匹配。

1.1 SIFT (Scale-Invariant Feature Transform)

SIFT 是一种用于检测和描述图像中的关键点的方法。

sift = cv2.SIFT_create()
keypoints, descriptors = sift.detectAndCompute(image, None)
  • 参数

    • image:输入图像。
  • 返回值

    • keypoints:检测到的关键点列表。
    • descriptors:对应关键点的描述符。
  • 详细解释

    • 原理

      • SIFT 算法通过检测尺度不变的关键点来识别图像中的特征。
      • 关键点是具有独特性的点,它们在不同的视角和光照条件下仍然可以被识别。
      • 描述符是关键点周围区域的特征表示,用于后续的匹配。
    • 应用

      • SIFT 常用于图像配准、对象识别、三维重建等任务。
      • SIFT 特征具有尺度不变性和旋转不变性,因此非常适合于图像匹配任务。
    • 注意事项

      • SIFT 计算较为耗时,不适合实时应用。
      • SIFT 描述符较长(128维),占用内存较多。
    • 实现细节

      • SIFT 算法首先构建尺度空间,检测关键点。
      • 接着计算关键点的方向,使其具有旋转不变性。
      • 最后生成描述符,用于描述关键点周围的区域。
    • 局限性

      • SIFT 对于快速移动的物体或低光照条件下的图像可能表现不佳。
      • SIFT 可能无法处理大规模的图像变形或旋转。
1.2 SURF (Speeded Up Robust Features)

SURF 是一种更快的特征检测和描述方法。

surf = cv2.SURF_create(hessianThreshold)
keypoints, descriptors = surf.detectAndCompute(image, None)
  • 参数

    • image:输入图像。
    • hessianThreshold:Hessian 阈值,用于控制关键点的数量。
  • 返回值

    • keypoints:检测到的关键点列表。
    • descriptors:对应关键点的描述符。
  • 详细解释

    • 原理

      • SURF 算法通过近似 SIFT 的高斯金字塔来加速关键点检测过程。
      • SURF 也具有尺度不变性和旋转不变性,但在速度上优于 SIFT。
    • 应用

      • SURF 常用于图像配准、对象识别、三维重建等任务。
      • SURF 特征在实时应用中更为实用。
    • 注意事项

      • SURF 的 Hessian 阈值会影响检测到的关键点数量。
      • SURF 描述符比 SIFT 短(64维),占用内存较少。
    • 实现细节

      • SURF 算法使用积分图像来加速关键点检测。
      • 使用 Hessian 阈值来筛选关键点,降低计算量。
      • 生成描述符,用于描述关键点周围的区域。
    • 局限性

      • SURF 在某些情况下可能不如 SIFT 精确。
      • SURF 对于大规模的图像变形或旋转可能表现不佳。
1.3 ORB (Oriented FAST and Rotated BRIEF)

ORB 是一种快速且高效的特征检测和描述方法。

orb = cv2.ORB_create(nfeatures)
keypoints, descriptors = orb.detectAndCompute(image, None)
  • 参数

    • image:输入图像。
    • nfeatures:要检测的最大关键点数量。
  • 返回值

    • keypoints:检测到的关键点列表。
    • descriptors:对应关键点的描述符。
  • 详细解释

    • 原理

      • ORB 算法结合了 FAST 关键点检测和 BRIEF 描述符。
      • ORB 特征具有旋转不变性,并且计算速度快。
    • 应用

      • ORB 常用于实时应用,如机器人导航、增强现实等。
      • ORB 特征适合于需要高速处理的场景。
    • 注意事项

      • ORB 的 nfeatures 参数决定了检测到的关键点数量。
      • ORB 描述符较短(32位),占用内存较少。
    • 实现细节

      • 使用 FAST 算法检测关键点。
      • 使用 BRIEF 描述符来描述关键点周围的区域。
      • ORB 通过计算关键点的方向来实现旋转不变性。
    • 局限性

      • ORB 在某些情况下可能不如 SIFT 或 SURF 精确。
      • ORB 对于大规模的图像变形或旋转可能表现不佳。

在这里插入图片描述

2. 图像配准

图像配准是指将两幅或多幅图像对齐的过程,通常用于图像融合、三维重建等任务。

2.1 基于特征的配准

基于特征的配准利用特征点进行图像配准。

# 检测特征点
sift = cv2.SIFT_create()
kp1, des1 = sift.detectAndCompute(image1, None)
kp2, des2 = sift.detectAndCompute(image2, None)# 匹配特征点
matcher = cv2.BFMatcher()
matches = matcher.knnMatch(des1, des2, k=2)# 应用比率测试
good_matches = []
for m, n in matches:if m.distance < 0.7 * n.distance:good_matches.append(m)# 计算变换矩阵
src_pts = np.float32([kp1[m.queryIdx].pt for m in good_matches]).reshape(-1, 1, 2)
dst_pts = np.float32([kp2[m.trainIdx].pt for m in good_matches]).reshape(-1, 1, 2)
M, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)# 应用变换
aligned_image = cv2.warpPerspective(image1, M, (image2.shape[1], image2.shape[0]))
  • 详细解释
    • 原理

      • 首先使用特征检测器(如 SIFT、SURF 或 ORB)检测两幅图像中的特征点。
      • 使用匹配器(如 BFMatcher)匹配两幅图像中的特征点。
      • 应用比率测试来过滤匹配点,确保只有最好的匹配被保留。
      • 使用 RANSAC 方法估计变换矩阵。
      • 应用变换矩阵将一幅图像对齐到另一幅图像上。
    • 应用

      • 图像配准可用于图像融合、全景图制作、三维重建等任务。
      • 基于特征的配准适用于两幅图像间有足够多的共同特征点的情况。
    • 注意事项

      • 特征检测器的选择会影响匹配的准确性。
      • 匹配器的选择和参数设置会影响匹配效果。
      • RANSAC 参数的选择会影响变换矩阵的精度。
    • 实现细节

      • 使用特征检测器检测关键点,并生成描述符。
      • 使用匹配器匹配两幅图像中的特征点。
      • 使用比率测试来过滤匹配点,确保匹配质量。
      • 使用 RANSAC 方法估计最优的变换矩阵。
      • 应用变换矩阵将一幅图像对齐到另一幅图像上。
    • 局限性

      • 如果两幅图像间没有足够的共同特征点,配准可能失败。
      • 如果两幅图像间存在较大的变形或旋转,配准可能不准确。

在这里插入图片描述

3. 图像拼接

图像拼接是指将多幅图像合成一幅大图像的过程,通常用于创建全景图。

# 检测特征点
sift = cv2.SIFT_create()
kp1, des1 = sift.detectAndCompute(image1, None)
kp2, des2 = sift.detectAndCompute(image2, None)# 匹配特征点
matcher = cv2.BFMatcher()
matches = matcher.knnMatch(des1, des2, k=2)# 应用比率测试
good_matches = []
for m, n in matches:if m.distance < 0.7 * n.distance:good_matches.append(m)# 计算变换矩阵
src_pts = np.float32([kp1[m.queryIdx].pt for m in good_matches]).reshape(-1, 1, 2)
dst_pts = np.float32([kp2[m.trainIdx].pt for m in good_matches]).reshape(-1, 1, 2)
M, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)# 应用变换
aligned_image = cv2.warpPerspective(image1, M, (image2.shape[1] + image1.shape[1], max(image1.shape[0], image2.shape[0])))# 合并图像
result_image = np.zeros_like(aligned_image)
result_image[:image2.shape[0], :image2.shape[1]] = image2
result_image[:aligned_image.shape[0], :aligned_image.shape[1]] = aligned_image# 融合重叠区域
overlap = result_image[:image2.shape[0], :image2.shape[1]]
mask = overlap.sum(axis=2) > 0
result_image[:image2.shape[0], :image2.shape[1]][mask] = overlap[mask]# 显示结果
cv2.imshow('Result Image', result_image)
cv2.waitKey(0)
cv2.destroyAllWindows()
  • 详细解释
    • 原理

      • 使用特征检测器(如 SIFT、SURF 或 ORB)检测两幅图像中的特征点。
      • 使用匹配器(如 BFMatcher)匹配两幅图像中的特征点。
      • 应用比率测试来过滤匹配点,确保只有最好的匹配被保留。
      • 使用 RANSAC 方法估计变换矩阵。
      • 应用变换矩阵将一幅图像对齐到另一幅图像上。
      • 合并对齐后的图像,并融合重叠区域。
    • 应用

      • 图像拼接可用于创建全景图、大视场图像等。
      • 图像拼接适用于需要合成多幅图像的情况。
    • 注意事项

      • 特征检测器的选择会影响匹配的准确性。
      • 匹配器的选择和参数设置会影响匹配效果。
      • RANSAC 参数的选择会影响变换矩阵的精度。
      • 合并图像时需要注意重叠区域的处理。
    • 实现细节

      • 使用特征检测器检测关键点,并生成描述符。
      • 使用匹配器匹配两幅图像中的特征点。
      • 使用比率测试来过滤匹配点,确保匹配质量。
      • 使用 RANSAC 方法估计最优的变换矩阵。
      • 应用变换矩阵将一幅图像对齐到另一幅图像上。
      • 合并对齐后的图像,并融合重叠区域。
    • 局限性

      • 如果两幅图像间没有足够的共同特征点,拼接可能失败。
      • 如果两幅图像间存在较大的变形或旋转,拼接可能不准确。

在这里插入图片描述

4. 综合示例

接下来,我们将结合上述几种技术,创建一个综合示例。在这个示例中,我们将读取两张图像,使用 SIFT 检测特征点,进行图像配准,最后进行图像拼接,创建全景图。

import cv2
import numpy as npdef stitch_images(image1_path, image2_path):# 读取图像image1 = cv2.imread(image1_path)image2 = cv2.imread(image2_path)if image1 is None or image2 is None:print("Error: Files not found!")return# 特征检测sift = cv2.SIFT_create()kp1, des1 = sift.detectAndCompute(image1, None)kp2, des2 = sift.detectAndCompute(image2, None)# 匹配特征点matcher = cv2.BFMatcher()matches = matcher.knnMatch(des1, des2, k=2)# 应用比率测试good_matches = []for m, n in matches:if m.distance < 0.7 * n.distance:good_matches.append(m)# 计算变换矩阵src_pts = np.float32([kp1[m.queryIdx].pt for m in good_matches]).reshape(-1, 1, 2)dst_pts = np.float32([kp2[m.trainIdx].pt for m in good_matches]).reshape(-1, 1, 2)M, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)# 应用变换aligned_image = cv2.warpPerspective(image1, M, (image2.shape[1] + image1.shape[1], max(image1.shape[0], image2.shape[0])))# 合并图像result_image = np.zeros_like(aligned_image)result_image[:image2.shape[0], :image2.shape[1]] = image2result_image[:aligned_image.shape[0], :aligned_image.shape[1]] = aligned_image# 融合重叠区域overlap = result_image[:image2.shape[0], :image2.shape[1]]mask = overlap.sum(axis=2) > 0result_image[:image2.shape[0], :image2.shape[1]][mask] = overlap[mask]# 显示结果cv2.imshow('Result Image', result_image)cv2.waitKey(0)cv2.destroyAllWindows()if __name__ == "__main__":image1_path = 'path/to/your/image1.jpg'image2_path = 'path/to/your/image2.jpg'stitch_images(image1_path, image2_path)
5. 小结

在本篇文章中,我们详细介绍了如何使用OpenCV进行特征检测、图像配准以及图像拼接。这些技术在计算机视觉领域非常重要,并且是许多高级应用的基础。接下来的文章将涉及更复杂的图像处理技术,如目标检测、语义分割等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/53811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用 Elastic 和 LM Studio 的 Herding Llama 3.1

作者&#xff1a;来自 Elastic Charles Davison, Julian Khalifa 最新的 LM Studio 0.3 更新使 Elastic 的安全 AI Assistant 能够更轻松、更快速地与 LM Studio 托管模型一起运行。在这篇博客中&#xff0c;Elastic 和 LM Studio 团队将向你展示如何在几分钟内开始使用。如果你…

监控易监测对象及指标之:全面监控MySQL数据库

随着企业信息化建设的不断深入&#xff0c;数据库作为核心数据资产的管理中心&#xff0c;其性能和稳定性直接关系到业务的连续性和企业的运营效率。MySQL作为广泛使用的开源关系型数据库管理系统&#xff0c;其稳定性和性能对于保障业务连续性至关重要。 为了确保MySQL数据库的…

【UE5 C++课程系列笔记】02——创建C++类的三种方式

目录 一、从UE编辑器中创建 引用头文件报错的两种解决方式 &#xff08;1&#xff09;方式1 &#xff08;2&#xff09;方式2 二、在文件夹中直接创建 三、在Visual Studio中创建 一、从UE编辑器中创建 在UE编辑器中选择“Tools-》New C Class” 这里新建的类的父类选择…

解锁阿尔茨海默病(AD)靶点密码,开启靶向治疗新篇章

前 言&#xff1a; 阿尔茨海默病&#xff08;AD&#xff09;是一种严重的神经退行性疾病&#xff0c;多发于高龄人群&#xff0c;主要表现为记忆、思维、分析判断、视空间辨认、情绪等障碍。从实验室到临床应用的过程充满挑战。阿尔茨海默症新型疗法的开发主要聚焦于靶向Aβ、…

【随手笔记】

目录 开源许可声明线程数量限制如何获取手机位数令牌桶算法maven介绍pm指令QUICNAT穿越打洞原理Netty详解websocketWebRTC 开源许可声明 几种开源协议的区别&#xff08;Apache、MIT、BSD、MPL、GPL、LGPL&#xff09; 线程数量限制 一个进程最多可以创建多少个线程 ulimit命…

Vue3.0项目实战(三)——大事件管理系统首页 layout 架子与文章分类的实现

目录 1. 首页 layout 架子 [element-plus 菜单] 1.1 基本架子拆解 2. 登录访问拦截 2.1 需求 2.2 vue3 和 vue2 中的 Vue-Router 区别 3. 用户基本信息获取&渲染 4. 退出功能 [element-plus 确认框] 5. 文章分类页面 - [element-plus 表格] 5.1 基本架子 - PageCo…

专业版PyCharm使用plt.show()显示图像时,如何不显示在右侧工具栏中,而是直接弹出来

解决方案 File -> Settings -> Python Plots -> 取消勾选 Show plots in tool window 示例 默认勾选 Show plots in tool window 的显示效果&#xff1a; 取消勾选 Show plots in tool window 的显示效果&#xff1a;

伙房食堂电气安全新挑战:油烟潮湿环境下,如何筑起电气火灾“防火墙”?

近几年&#xff0c;随着我国经济的飞速发展&#xff0c;食堂餐饮也经历了一场变革&#xff0c;越来越多的电器走进了伙房食堂中&#xff0c;实现了电气化&#xff0c;为人们提供了高效便利的饮食服务&#xff0c;但同时也增加了火灾负荷。目前我国非常严重的电气火灾危害&#…

使用 Parallel 类进行多线程编码(下)

2.Parallel.ForEach() 的使用 从 ForEach() 这个名字可以看出该方法是用来遍历泛型集合的&#xff0c;新建一个 ASP.NET Core Web应用的项目&#xff0c;如下&#xff1a; 在 Index.cshtml.cs 文件中增加一个 UserInfo.cs 的类&#xff0c;代码如下&#xff1a; public class U…

组合逻辑电路的分析

目录 组合逻辑电路的分析 分析思路 基本步骤 例题1 例题2 组合逻辑电路的分析 分析思路 基本步骤 例题1 将每个门的输出命名。 写出逻辑函数式。 列真值表。 ABC全一致输出为1。 例题2 观察发现这三个结构是一样的。 逐级写出逻辑函数式&#xff1a; 发现这其实就是异或…

R语言 基础笔记

起因: 今天不知道要写什么。 把之前的笔记复制一下。 代码开头&#xff0c;导入: # 清除系统变量 rm(list ls())# 隐藏警告信息: options(warn -1)# 把当前目录&#xff0c;设置为工作目录。 library(rstudioapi) current_folder_path <- dirname(rstudioapi::getActi…

基于云端的跨平台个人信息管理系统

博主介绍&#xff1a;专注于Java .net php phython 小程序 等诸多技术领域和毕业项目实战、企业信息化系统建设&#xff0c;从业十五余年开发设计教学工作 ☆☆☆ 精彩专栏推荐订阅☆☆☆☆☆不然下次找不到哟 我的博客空间发布了1000毕设题目 方便大家学习使用 感兴趣的可以…

SpringBoot3与SpringBoot2的区别

文章目录 1、JDK环境2、Spring Framework版本3、主要变化和新特性3.1 配置变化3.2 GraalVM3.3 安全性改进3.4 性能优化3.4.1 启动时间3.4.2 内存使用 3.5 改进的依赖管理3.6 全新启动器3.7 Kotlin支持 SpringBoot3与SpringBoot2的区别 1、JDK环境 SpringBoot3最低要求JDK17 S…

前后端时间转换的那些常见问题及处理方法

在现代的Web开发中&#xff0c;前后端分离的架构已经成为主流&#xff0c;尤其是在Spring Boot和Vue.js的组合中。开发者在这种架构下经常遇到的一个问题就是如何处理时间的转换和显示。前端和后端对时间的处理方式不同&#xff0c;可能会导致时间在传递过程中出现问题&#xf…

基于TCP发送北斗消息给船舶设备终端

文章目录 引言I 自定义动态数据交换协议信息交换接口通信格式II Netty实现TCP客户端III Java 原始API实现TCP客户端知识扩展: 基于Netty的定位数据平台通信协议定位方式移动定位设备see also引言 需求:发送北斗消息给船舶设备终端 动态信息交换接口采用TCP自定义协议实现数据…

无线麦克风哪款好用,手机领夹麦克风哪个牌子好,麦克风推荐

随着短视频与直播行业的蓬勃发展&#xff0c;无线领夹麦克风市场迎来了前所未有的繁荣。品牌如罗德、大疆、西圣等麦克风品牌凭借卓越的技术实力与品牌影响力占据了市场的主导地位&#xff0c;其中西圣更是凭借其高性价比和用户口碑&#xff0c;稳居行业口碑品牌前列。但在这光…

Qt 基础按钮布局管理

cpp public: Content(QWidget *parent0); ~Content(); QStackedWidget *stack; QPushButton *AmendBtn; QPushButton *CloseBtn; Baseinfo *baseInfo; Contact *contact; Detail *detail; // 打开 "Content.cpp" 文件&#xff0c;添加如下代码&#xff1a; Content:…

调整兰德系数-评估聚类效果的指标

调整兰德系数&#xff08;Adjusted Rand Index, ARI&#xff09;是一种用于评估聚类结果与真实标签之间相似度的指标。它在传统兰德系数&#xff08;Rand Index, RI&#xff09;的基础上进行了调整&#xff0c;考虑了随机聚类的期望值&#xff0c;因此能够更公平地评估聚类结果…

Chainlit集成Langchain并使用通义千问实现文生图网页应用

前言 本文教程如何使用通义千问的大模型服务平台的接口&#xff0c;实现图片生成的网页应用&#xff0c;主要用到的技术服务有&#xff0c;chainlit 、 langchain、 flux。合利用了大模型的工具选择调用能力。实现聊天对话生成图片的网页应用。 阿里云 大模型服务平台百炼 API…

最新融合多模态的理解和生成的大一统transform架构,show-o模型部署

Show-o是由字节跳动和新加坡国立大学Show Lab共同研发的一个多模态大模型&#xff0c;统一了多模态理解和生成。 Show-o的创新之处在于它将自回归和离散扩散建模相结合&#xff0c;以适应不同和混合模态的输入和输出。 Show-o模型的架构基于预训练的大型语言模型&#xff08;…