特征点检测与匹配是计算机视觉中的基础任务之一,广泛应用于图像配准、物体识别、运动估计、三维重建等领域。

特征点检测与匹配是计算机视觉中的基础任务之一,广泛应用于图像配准、物体识别、运动估计、三维重建等领域。下面是一些关键的知识点:

1. 特征点检测

特征点检测的目的是从图像中找到独特的、稳定的点,这些点在图像变化(如旋转、缩放、光照变化等)中具有较好的鲁棒性。常见的特征点检测算法包括:

  • SIFT描述符:具有旋转和尺度不变性。
  • SURF描述符:加速的SIFT,计算速度更快。
  • ORB描述符:结合了旋转不变的BRIEF描述符,速度快且具有较好的性能。

1.1 Harris 角点检测器
Harris 角点检测器是最早的一种特征点检测方法,通过计算图像的梯度,找到角点。

import cv2
import numpy as np# 读取图像并转换为灰度图
img = cv2.imread('example.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Harris 角点检测
gray = np.float32(gray)
dst = cv2.cornerHarris(gray, 2, 3, 0.04)# 结果通过膨胀标记角点
dst = cv2.dilate(dst, None)# 设置阈值
img[dst > 0.01 * dst.max()] = [0, 0, 255]# 显示结果
cv2.imshow('Harris Corners', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.2 SIFT (Scale-Invariant Feature Transform)
SIFT 是一种尺度不变特征变换算法,能够检测并描述图像中的局部特征点。

import cv2# 读取图像并转换为灰度图
img = cv2.imread('example.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 创建SIFT对象
sift = cv2.SIFT_create()# 检测关键点和计算描述符
keypoints, descriptors = sift.detectAndCompute(gray, None)# 在图像上绘制关键点
img_with_keypoints = cv2.drawKeypoints(img, keypoints, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)# 显示结果
cv2.imshow('SIFT Keypoints', img_with_keypoints)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.3 ORB (Oriented FAST and Rotated BRIEF)
ORB 是一种快速且高效的特征点检测与描述算法,结合了FAST关键点检测器和BRIEF描述符。

import cv2# 读取图像并转换为灰度图
img = cv2.imread('example.jpg', cv2.IMREAD_GRAYSCALE)# 创建ORB对象
orb = cv2.ORB_create()# 检测关键点和计算描述符
keypoints, descriptors = orb.detectAndCompute(img, None)# 在图像上绘制关键点
img_with_keypoints = cv2.drawKeypoints(img, keypoints, None, color=(0, 255, 0))# 显示结果
cv2.imshow('ORB

2. 特征点匹配

特征点匹配是将一幅图像中的特征点与另一幅图像中的特征点进行匹配,以找到它们之间的对应关系。
2.1 Brute-Force匹配
Brute-Force匹配器逐一比较描述符,并找到最相似的描述符对。

import cv2# 读取图像并转换为灰度图
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 创建ORB对象
orb = cv2.ORB_create()# 检测关键点和计算描述符
keypoints1, descriptors1 = orb.detectAndCompute(img1, None)
keypoints2, descriptors2 = orb.detectAndCompute(img2, None)# 创建Brute-Force匹配器
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)# 进行描述符匹配
matches = bf.match(descriptors1, descriptors2)# 按距离排序
matches = sorted(matches, key=lambda x: x.distance)# 绘制匹配结果
img_matches = cv2.drawMatches(img1, keypoints1, img2, keypoints2, matches[:10], None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)# 显示结果
cv2.imshow('ORB Matches', img_matches)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.2 FLANN匹配
FLANN是快速最近邻搜索库,适用于大数据集和高维特征的匹配。

import cv2
import numpy as np# 读取图像并转换为灰度图
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 创建SIFT对象
sift = cv2.SIFT_create()# 检测关键点和计算描述符
keypoints1, descriptors1 = sift.detectAndCompute(img1, None)
keypoints2, descriptors2 = sift.detectAndCompute(img2, None)# 设置FLANN匹配器参数
FLANN_INDEX_KDTREE = 1
index_params = dict(algorithm=FLANN_INDEX_KDTREE, trees=5)
search_params = dict(checks=50)# 创建FLANN匹配器
flann = cv2.FlannBasedMatcher(index_params, search_params)# 进行描述符匹配
matches = flann.knnMatch(descriptors1, descriptors2, k=2)# 仅保留距离比率小于0.7的匹配
good_matches = []
for m, n in matches:if m.distance < 0.7 * n.distance:good_matches.append(m)# 绘制匹配结果
img_matches = cv2.drawMatches(img1, keypoints1, img2, keypoints2, good_matches, None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)# 显示结果
cv2.imshow('SIFT FLANN Matches', img_matches)
cv2.waitKey(0)
cv2.destroyAllWindows()

3.单应性矩阵

单应性矩阵(Homography Matrix)是一种用于描述两个平面间映射关系的3x3矩阵,常用于图像配准、图像拼接和透视变换等应用中。在计算机视觉中,通过计算单应性矩阵可以将一个图像中的点映射到另一个图像中的对应点,从而实现图像的对齐和变换。

计算单应性矩阵

为了计算单应性矩阵,我们需要至少四对对应的点(即源图像中的点和目标图像中的点)。OpenCV提供了cv2.findHomography函数来计算单应性矩阵。

基本步骤:

  • 读取图像并检测特征点
  • 匹配特征点
  • 计算单应性矩阵
  • 应用单应性矩阵进行图像变换

下面是一个详细的示例代码:

import cv2
import numpy as np# 读取源图像和目标图像
src_img = cv2.imread('source.jpg')
dst_img = cv2.imread('destination.jpg')# 转换为灰度图像
src_gray = cv2.cvtColor(src_img, cv2.COLOR_BGR2GRAY)
dst_gray = cv2.cvtColor(dst_img, cv2.COLOR_BGR2GRAY)# 使用ORB检测关键点和描述符
orb = cv2.ORB_create()
src_keypoints, src_descriptors = orb.detectAndCompute(src_gray, None)
dst_keypoints, dst_descriptors = orb.detectAndCompute(dst_gray, None)# 使用Brute-Force匹配器进行特征点匹配
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
matches = bf.match(src_descriptors, dst_descriptors)# 按距离排序匹配结果
matches = sorted(matches, key=lambda x: x.distance)# 确保有足够的匹配点对
if len(matches) >= 4:# 提取匹配的点坐标src_pts = np.float32([src_keypoints[m.queryIdx].pt for m in matches]).reshape(-1, 1, 2)dst_pts = np.float32([dst_keypoints[m.trainIdx].pt for m in matches]).reshape(-1, 1, 2)# 计算单应性矩阵H, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)# 使用单应性矩阵对源图像进行透视变换height, width, channels = dst_img.shapewarped_img = cv2.warpPerspective(src_img, H, (width, height))# 显示结果cv2.imshow('Warped Image', warped_img)cv2.waitKey(0)cv2.destroyAllWindows()
else:print("Not enough matches found - {}/{}".format(len(matches), 4))
详细说明
  • ORB特征点检测和描述:使用ORB算法检测关键点和描述符。
  • 特征点匹配:使用Brute-Force匹配器对检测到的特征点进行匹配。
  • 检查匹配点对数量:在计算单应性矩阵之前,确保有足够的匹配点对(至少4对)。
  • 计算单应性矩阵和透视变换:如果有足够的匹配点对,计算单应性矩阵并进行透视变换;否则,输出提示信息。

4.项目

用于将两张图像拼接在一起,生成一个全景图。以下是代码的主要步骤和功能:

1.读取和预处理图像:

  • 代码首先读取了两张图片(map1.png 和 map2.png)。
  • 然后将两张图片调整到相同的尺寸(640x480)。
    2.特征点检测和匹配:
  • 使用SIFT(Scale-Invariant Feature Transform)算法检测两张图像中的特征点,并计算特征描述子。
  • 创建一个BFMatcher(Brute-Force Matcher)对象来进行特征匹配。
  • 使用knnMatch方法找到两张图像中的特征点匹配对,并根据距离筛选有效的匹配点。

3.计算单应性矩阵:

  • 通过有效的特征匹配点计算单应性矩阵(Homography Matrix),这个矩阵用于将一张图像变换到另一张图像的坐标系中。
    4.图像变换与拼接:
  • 使用单应性矩阵将第一张图像进行透视变换。
  • 计算结果图像的尺寸,并创建一个新的大图像,将变换后的第一张图像和第二张图像拼接在一起。
    5.显示结果:
  • 最后,将拼接后的结果图像显示出来。

具体代码解释如下:

import cv2
import numpy as npdef stitch_image(img1, img2, H):# 获得原始图的高/宽h1, w1 = img1.shape[:2]h2, w2 = img2.shape[:2]# 获取图像的四个角点img1_dims = np.float32([[0,0], [0, h1], [w1, h1], [w1, 0]]).reshape(-1, 1, 2)img2_dims = np.float32([[0,0], [0, h2], [w2, h2], [w2, 0]]).reshape(-1, 1, 2)# 对第一张图像的角点进行透视变换img1_transform = cv2.perspectiveTransform(img1_dims, H)# 计算结果图像的尺寸result_dims = np.concatenate((img2_dims, img1_transform), axis=0)[x_min, y_min] = np.int32(result_dims.min(axis=0).ravel() - 0.5)[x_max, y_max] = np.int32(result_dims.max(axis=0).ravel() + 0.5)# 平移的距离transform_dist = [-x_min, -y_min]# 平移矩阵transform_array = np.array([[1, 0, transform_dist[0]],[0, 1, transform_dist[1]],[0, 0, 1]])# 对第一张图像进行透视变换和平移result_img = cv2.warpPerspective(img1, transform_array.dot(H), (x_max-x_min, y_max-y_min))# 将第二张图像拼接到结果图像上result_img[transform_dist[1]:transform_dist[1]+h2, transform_dist[0]:transform_dist[0]+w2] = img2return result_imgdef get_homo(img1, img2):# 创建SIFT特征检测对象sift = cv2.xfeatures2d.SIFT_create()# 检测特征点和计算描述子k1, d1 = sift.detectAndCompute(img1, None)k2, d2 = sift.detectAndCompute(img2, None)# 创建特征匹配器bf = cv2.BFMatcher()matches = bf.knnMatch(d1, d2, k=2)# 过滤特征匹配点verify_ratio = 0.8verify_matches = []for m1, m2 in matches:if m1.distance < 0.8 * m2.distance:verify_matches.append(m1)min_matches = 8if len(verify_matches) > min_matches:img1_pts = []img2_pts = []for m in verify_matches:img1_pts.append(k1[m.queryIdx].pt)img2_pts.append(k2[m.trainIdx].pt)img1_pts = np.float32(img1_pts).reshape(-1, 1, 2)img2_pts = np.float32(img2_pts).reshape(-1, 1, 2)# 计算单应性矩阵H, mask = cv2.findHomography(img1_pts, img2_pts, cv2.RANSAC, 5.0)return Helse:print('err: Not enough matches!')exit()# 读取两张图片
img1 = cv2.imread('map1.png')
img2 = cv2.imread('map2.png')# 将两张图片设置成同样大小
img1 = cv2.resize(img1, (640, 480))
img2 = cv2.resize(img2, (640, 480))inputs = np.hstack((img1, img2))# 获得单应性矩阵
H = get_homo(img1, img2)# 进行图像拼接
result_image = stitch_image(img1, img2, H)cv2.imshow('input img', result_image)
cv2.waitKey()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/56080.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Caffeine+Redis两级缓存架构

CaffeineRedis两级缓存架构 在高性能的服务项目中&#xff0c;我们一般会将一些热点数据存储到 Redis这类缓存中间件中&#xff0c;只有当缓存的访问没有命中时再查询数据库。在提升访问速度的同时&#xff0c;也能降低数据库的压力。 但是在一些场景下单纯使用 Redis 的分布…

Redis登录校验

登录拦截器 第一个拦截器只是确保一切请求都要进行token刷新的大动作 第二个拦截器从ThreadLocal中获取user用户 缓存一致性如何解决 并发情况下发生缓存不一致的问题&#xff0c;主要是因为写数据库和写缓存不是原子的 先写缓存&#xff0c;再写数据库 先写数据库&#xff…

大厂面试真题-微服务有什么缺点

微服务架构在提供诸多优势的同时&#xff0c;也伴随着一些显著的缺点和挑战。以下是对微服务缺点的详细归纳&#xff1a; 一、操作复杂性增加 微服务架构将一个大型应用程序分解为多个小型服务&#xff0c;这导致系统整体的复杂度显著提高。需要管理更多的服务实例、网络通信…

thinkphp阿里云发送短信验证码,存储到缓存中完成手机号验证

源码demo下载地址 https://download.csdn.net/download/hanzhuhuaa/89865893 或者也可以在文章中查看demo源码 ↓ 第一步安装阿里云 SDK 您可以使用 Composer 来安装阿里云的 SDK。在项目目录中运行: composer require alibabacloud/sdk第二步发送短信 namespace app\api\c…

根据注释软件结果从ICTV中获取物种完整注释(python代码)

比如病毒注释软件注释到了&#xff1a; Viruses;Phixviricota;Malgrandaviricetes;Petitvirales;Microviridae;; import os import pandas as pd# 设置工作区 os.chdir("folder") dir_ls os.listdir()# 把ICTV物种表保存为df ICTV_txt "ICTV去冗余.txt"…

Linux下Git操作

一、基本命令 1、创建 git 目录&#xff08;工作区&#xff09; mkdir gitcode 2、创建本地仓库&#xff0c;生成 .git 隐藏目录 git init 3、设置配置项 git config user.name "xxx" git config user.email "....." 4、查看配置项 git config -l …

QD1-P14 HTML 输入标签(input)

本节学习 HTML 常用标签&#xff1a;input 输入标签 ‍ 本节视频 www.bilibili.com/video/BV1n64y1U7oj?p14 ‍ 知识点 1&#xff1a;简单示例 HTML <!DOCTYPE html> <html><head><meta charset"utf-8"><title>P14-input标签<…

git add 、 git commit、git push 、git stash、git reset --hard HEAD用法

下面是 git 中常见的几个命令的作用解释&#xff1a; git add&#xff1a; 这个命令用于将文件添加到暂存区&#xff08;Staging Area&#xff09;。它的意思是你标记了文件&#xff0c;将其准备好提交到仓库中。只有在执行 git add 后&#xff0c;文件的更改才能包含在下一次提…

在中国使用AWS服务器的法律要求与注册公司问题

随着云计算技术的迅猛发展&#xff0c;亚马逊网络服务&#xff08;AWS&#xff09;逐渐成为企业和开发者的首选平台。然而&#xff0c;当涉及到在中国境内使用AWS服务器时&#xff0c;许多人会关注一个重要问题&#xff1a;是否需要注册公司才能在中国运营AWS服务器&#xff1f…

Elasticsearch 实战应用

Elasticsearch 实战应用 引言 Elasticsearch 是一个分布式、RESTful 风格的搜索和分析引擎&#xff0c;能够快速、实时地处理大规模数据&#xff0c;广泛应用于全文搜索、日志分析、推荐系统等领域。在这篇博客中&#xff0c;我们将从 Elasticsearch 的基本概念入手&#xff…

【华为】配置BGP协议

边界网关协议BGP是一种实现自治系统AS之间的路由可达&#xff0c;并选择最佳路由的距离矢量路由协议。BGP在不同自治系统之间进行路由转发&#xff0c;分为EBGP&#xff08;外部边界网关协议&#xff09;和IBGP&#xff08;内部边界网关协议&#xff09;两种情况。 [A]in g0/0/…

STM32外设应用详解

STM32外设应用详解 STM32微控制器是意法半导体&#xff08;STMicroelectronics&#xff09;推出的一系列基于ARM Cortex-M内核的高性能、低功耗32位微控制器。它们拥有丰富的外设接口和功能模块&#xff0c;可以满足各种嵌入式应用需求。本文将详细介绍STM32的外设及其应用&am…

神经网络的基本骨架——nn.Module(torch.nn里的Containers模块里的Module类)

**前置知识&#xff1a; nn&#xff1a;neural network神经网络 1、torch.nn&#xff1a;与神经网络有关的库 Containers&#xff1a;torch.nn中的一个模块 Module&#xff1a;所有神经网络模型的基础类&#xff08;Base class for all neural network modules&#xff09; …

《Windows PE》5.2 遍历导出表

为了将程序读到内存指定位置&#xff0c;本节我们将讨论如何使用两种不同的方法遍历导出表。此外&#xff0c;我们还将给出一个打印进程调用kernel32中的API信息的示例程序。 本节必须掌握的知识点&#xff1a; 遍历导出表 打印kernel32 5.2.1 遍历导出表 ■方法一 实验三十四…

【Vue.js】vue2 项目在 Vscode 中使用 Ctrl + 鼠标左键跳转 @ 别名导入的 js 文件和 .vue 文件

js 文件跳转 需要安装插件 Vetur 然后需要我们在项目根目录下添加 jsconfig.json 配置&#xff0c;至于配置的作于&#xff0c;可以参考我的另外一篇博客&#xff1a; 【React 】react 创建项目配置 jsconfig.json 的作用 它主要用于配置 JavaScript 或 TypeScript 项目的根…

C++ | Leetcode C++题解之第475题供暖器

题目&#xff1a; 题解&#xff1a; class Solution { public:int findRadius(vector<int>& houses, vector<int>& heaters) {sort(houses.begin(), houses.end());sort(heaters.begin(), heaters.end());int ans 0;for (int i 0, j 0; i < houses.…

华为---MUX VLAN简介及示例配置

目录 1. 产生背景 2. 应用场景 3. 主要功能 4. 基本概念 5. 配置步骤及相关命令 6.示例配置 6.1 示例场景 6.2 网络拓扑图 6.3 配置代码 6.4 配置及解析 6.5 测试验证 配置注意事项 1. 产生背景 MUX VLAN&#xff08;Multiplex VLAN&#xff09;提供了一种通过VLA…

python xml的读取和写入

import xml.etree.ElementTree as ET from xml.dom import minidom# 读取XML文档 tree ET.parse("./xml_3/z_20240827_001.xml") root tree.getroot() # 获取size元素 size_find_0 root.find("size") # 获取width子元素 size_w size_find_0.find("…

InstructGPT的四阶段:预训练、有监督微调、奖励建模、强化学习涉及到的公式解读

1. 预训练 1. 语言建模目标函数&#xff08;公式1&#xff09;&#xff1a; L 1 ( U ) ∑ i log ⁡ P ( u i ∣ u i − k , … , u i − 1 ; Θ ) L_1(\mathcal{U}) \sum_{i} \log P(u_i \mid u_{i-k}, \dots, u_{i-1}; \Theta) L1​(U)i∑​logP(ui​∣ui−k​,…,ui−1​;Θ…

C++和OpenGL实现3D游戏编程【连载15】——着色器初步

&#x1f525;C和OpenGL实现3D游戏编程【目录】 1、本节实现的内容 上一节我们介绍了通过VBO、VAO和EBO怎样将顶点发送到GPU显存&#xff0c;利用GPU与显存之间的高效处理速度&#xff0c;来提高我们的图形渲染效率。那么在此过程中&#xff0c;我们又可以通过着色器&#xff…