OpenCV中的SIFT特征提取

文章目录

  • 引言
  • 一、SIFT算法概述
  • 二、OpenCV中的SIFT实现
    • 2.1 基本使用
      • 2.1.1 导入库
      • 2.1.2 图片预处理
      • 2.1.3 创建SIFT检测器
      • 2.1.4 检测关键点并计算描述符
      • 2.1.5 检测关键点并计算描述符并对关键点可视化
      • 2.1.6 印关键点和描述符的形状信息
    • 2.2 参数调优
  • 三、SIFT的优缺点分析
    • 3.1 优点
    • 3.2 缺点
  • 结语

引言

在计算机视觉领域,特征提取是许多任务的基础步骤,如图像匹配、目标识别和三维重建等。SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)是一种经典的特征提取算法,由David Lowe在1999年提出。本文将详细介绍SIFT算法的原理,并通过OpenCV实现展示其应用。

一、SIFT算法概述

SIFT是一种基于局部特征的图像处理算法,具有以下突出特点:

  1. 尺度不变性:在不同尺度的图像中都能检测到相同的特征点
  2. 旋转不变性:不受图像旋转的影响
  3. 光照鲁棒性:对光照变化不敏感
  4. 视角部分不变性:能够处理一定程度的视角变化

二、OpenCV中的SIFT实现

OpenCV提供了简洁的SIFT接口:

2.1 基本使用

2.1.1 导入库

import cv2
import numpy as np
  • 导入opencv库和numpy库

2.1.2 图片预处理

image = cv2.imread('man.jpg')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  • 读取图像并转换为灰度图

2.1.3 创建SIFT检测器

sift = cv2.SIFT_create()
  • 功能:创建一个 SIFT 特征检测器 对象。
  • 细节:SIFT 是一种经典的 局部特征提取算法,对尺度、旋转、光照变化具有鲁棒性。
  • cv2.SIFT_create() 是 OpenCV 中初始化 SIFT 检测器的方式(需 OpenCV ≥ 4.4.0,早期版本用cv2.xfeatures2d.SIFT_create())。

2.1.4 检测关键点并计算描述符

kp = sift.detect(gray)

功能:在灰度图像 gray 上检测关键点(keypoints)

细节
sift.detect() 会返回一个列表 kp,其中每个元素是一个 KeyPoint 对象,包含以下属性:

  • pt:关键点的坐标 (x, y)。
  • size:关键点的尺度(scale)。
  • angle:方向(角度,0-360°)。
  • response:关键点的强度(可用于筛选)。
  • octave:所在金字塔层级(尺度空间)

2.1.5 检测关键点并计算描述符并对关键点可视化

man_sift = cv2.drawKeypoints(man,kp,None,flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)

输入参数:

  • man:原始 BGR 彩色图像(NumPy 数组)。
  • kp:SIFT 检测到的关键点列表(cv2.KeyPoint 对象组成的列表)。
  • None:可选参数,表示输出图像(如果为 None,函数会新建一个图像)。
  • flags:控制关键点的绘制方式。

输出

  • man_sift:绘制了关键点后的新图像(BGR 格式)

关键参数详解:flags

flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS 表示 “以丰富格式绘制关键点”,具体效果包括:

  • 圆圈标记:每个关键点用一个圆圈表示,圆圈的 半径 表示该关键点的 尺度(scale)(尺度越大,圆圈越大)。
  • 方向指示:圆圈内有一条直线,表示关键点的 主方向(angle)(方向由 SIFT 计算得出)。
  • 颜色对比:默认关键点会以醒目的颜色(如红色、绿色)绘制,与原始图像形成对比。

如果省略 flags 或设置为 cv2.DRAW_MATCHES_FLAGS_DEFAULT,则仅用简单的小点标记位置,不显示尺度和方向。

2.1.6 印关键点和描述符的形状信息

kp,des = sift.compute(man,kp)
print(np.array(kp).shape,des.shape)

1.sift.compute(man, kp)

功能:基于原始图像 man 和已检测到的关键点 kp,计算每个关键点的 描述符(descriptor)。
输入参数:

  • man:原始图像(BGR 或灰度格式)。虽然 SIFT 检测通常在灰度图上进行,但 compute() 可以接受彩色图像(内部会自动转换为灰度)。
  • kp:之前通过 sift.detect() 得到的关键点列表(cv2.KeyPoint 对象的列表)。

输出:

  • kp:更新后的关键点列表(可能与输入相同,但某些实现可能会过滤掉无法计算描述符的关键点)。
  • des:描述符的 NumPy 数组,形状为 (n_keypoints, 128),数据类型通常为 np.float32。

2.print(np.array(kp).shape, des.shape)

功能:打印关键点列表 kp 和描述符数组 des 的形状。

输出含义:

  • np.array(kp).shape:将关键点列表 kp 转换为 NumPy 数组后的形状。由于 kp 是 cv2.KeyPoint对象的列表,直接转换后的形状是 (n_keypoints,)(表示有 n_keypoints 个关键点)。
  • 注意:cv2.KeyPoint 对象的属性(如坐标、尺度等)需要通过 kp[i].pt、kp[i].size 等方式单独访问。
  • des.shape: 描述符数组的形状为 (n_keypoints, 128),表示每个关键点对应一个 128 维的特征向量(SIFT 描述符的固定维度)。

2.2 参数调优

OpenCV的SIFT实现提供了多个可调参数:

# 自定义参数创建SIFT
sift = cv2.SIFT_create(nfeatures=0,          # 保留的特征点数量,0表示不限制nOctaveLayers=3,      # 每组(octave)中的层数contrastThreshold=0.04,  # 对比度阈值edgeThreshold=10,      # 边缘阈值sigma=1.6            # 高斯模糊的初始sigma值
)

三、SIFT的优缺点分析

3.1 优点

  1. 对尺度、旋转、光照变化具有鲁棒性
  2. 特征区分性强,匹配准确率高
  3. 算法成熟,有大量实际应用验证

3.2 缺点

  1. 计算复杂度高,实时性较差
  2. 对模糊图像和非刚性变形敏感
  3. 专利限制(已过期)

结语

SIFT作为计算机视觉领域的里程碑算法,尽管已有20多年历史,但其核心思想仍影响着现代特征提取方法的发展。通过OpenCV的简洁接口,我们可以轻松地将这一强大工具应用到各种视觉任务中。理解SIFT的原理和实现,对于掌握更先进的视觉算法也大有裨益。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/77125.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【信息系统项目管理师】高分论文:论成本管理与采购管理(信用管理系统)

更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 论文1、规划成本管理2、成本估算3、成本预算4、成本控制论文 2019年1月,我作为项目经理参与了 XX基金管理有限公司信用管理系统项目。该项目成 本1000万,建设期为1年。通过该项目,XX基金管理有限公司在信用…

从边缘到云端,如何通过时序数据库 TDengine 实现数据的全局洞

在当今数字化转型加速的背景下,海量的数据生成和实时处理需求已成为企业面临的关键挑战。无论是物联网设备、工业自动化系统,还是智能城市的各类传感器,数据的采集、传输与分析效率,直接影响企业的决策与运营。为此,TD…

Axure全局变量的含义与基础应用

亲爱的小伙伴,在您浏览之前,烦请关注一下,在此深表感谢! Axure产品经理精品视频课已登录CSDN可点击学习https://edu.csdn.net/course/detail/40420 课程主题:全局变量 主要内容:全局变量含义、基础应用 应用场景:元件赋值 案例展示: 案例视频:

题目 3320: 蓝桥杯2025年第十六届省赛真题-产值调整

题目 3320: 蓝桥杯2025年第十六届省赛真题-产值调整 时间限制: 2s 内存限制: 192MB 提交: 549 解决: 122 题目描述 偏远的小镇上,三兄弟共同经营着一家小型矿业公司 “兄弟矿业”。公司旗下有三座矿山:金矿、银矿和铜矿,它们的初始产值分别用…

常见缓存淘汰算法(LRU、LFU、FIFO)的区别与实现

一、前言 缓存淘汰算法主要用于在内存资源有限的情况下,优化缓存空间的使用效率。以确保缓存系统在容量不足时能够智能地选择需要移除的数据。 二、LRU(Least Recently Used) 核心思想:淘汰最久未被访问的数据。实现方式&#x…

linux ptrace 图文详解(七) gdb、strace跟踪系统调用

目录 一、gdb/strace 跟踪程序系统调用 二、实现原理 三、代码实现 四、总结 (代码:linux 6.3.1,架构:arm64) One look is worth a thousand words. —— Tess Flanders 相关链接: linux ptrace 图…

Git基本使用(很详细)

一:Git 概述 1.1 定义:分布式版本控制系统 1.2 版本控制 (1)定义: 版本控制时一种记录文件内容变化,以便将来查阅特定版本修订情况的系统 (2)举例 多副本 优化: 不使用多…

23种设计模式-结构型模式之桥接模式(Java版本)

Java 桥接模式(Bridge Pattern)详解 🌉 什么是桥接模式? 桥接模式用于将抽象部分与实现部分分离,使它们可以独立变化。 通过在两个独立变化的维度之间建立“桥”,避免因多维度扩展导致的类爆炸。 &#x…

基于SIMMECHANICS的单自由度磁悬浮隔振器PID控制系统simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1 单自由度磁悬浮减振器工作原理简介 4.2 SIMMECHANICS工具箱 5.完整工程文件 1.课题概述 基于SIMMECHANICS的单自由度磁悬浮隔振器PID控制系统simulink建模与仿真。其中,SIMMECHANICS是M…

contenthash 持久化缓存

以下是关于持久化缓存(contenthash)的深度技术解析,涵盖原理、配置策略及最佳实践,帮助我们构建高性能前端应用的缓存体系: 一、缓存机制核心原理 1. 浏览器缓存决策矩阵 触发条件缓存行为对应场景URL 未变化 + 强缓存有效直接读取磁盘/内存缓存未修改的静态资源URL 变化…

【前端记事】关于electron的入门使用

electron入门使用 背景how to start第一步 创建一个vite-vue3项目第二步 装各种依赖第三步 配置vite.config.jspackage.jsonelectron入口 启动重写关闭、隐藏、最大化最小化 背景 最近对electron比较感兴趣,折腾一段时间后有了点眉目,记录一下 how to …

跨浏览器音频录制:实现兼容的音频捕获与WAV格式生成

在现代Web开发中,音频录制功能越来越受到开发者的关注。无论是在线会议、语音识别还是简单的语音留言,音频录制都是一个重要的功能。然而,实现一个跨浏览器的音频录制功能并非易事,因为不同浏览器对音频录制API的支持存在差异。本…

Semantic Kernel也能充当MCP Client

背景 笔者之前,分别写过两篇关于Semantic Kernel(下简称SK)相关的博客,最近模型上下文协议(下称MCP)大火,实际上了解过SK的小伙伴,一看到 MCP的一些具体呈现,会发现&…

识别图片内容OCR并重命名文件

在工作场景中,经常出现通过拍摄设备获取图片后,未及时进行有效命名的情况。这些图片中往往包含关键信息(如合同编号、产品型号、日期等),需要人工识别并命名,存在以下痛点: 效率低下&#xff1…

【防火墙 pfsense】3 portal

(1)应该考虑的问题: ->HTTPS 连接的干扰问题:HTTPS 是一种旨在防止恶意第三方截取和篡改流量的协议。但强制门户的工作原理是截取并改变终端用户与网络之间的连接。这对于 HTTP 流量来说不是问题,但使用 HTTPS 加密…

银发科技:AI健康小屋如何破解老龄化困局

随着全球人口老龄化程度的不断加深,如何保障老年人的健康、提升他们的生活质量,成为了社会各界关注的焦点。 在这场应对老龄化挑战的战役中,智绅科技顺势而生,七彩喜智慧养老系统构筑居家养老安全网。 而AI健康小屋作为一项创新…

TCP协议理解

文章目录 TCP协议理解理论基础TCP首部结构图示字段逐项解析 TCP是面向连接(Connection-Oriented)面向连接的核心表现TCP 面向连接的核心特性TCP 与UDP对比 TCP是一个可靠的(reliable)序号与确认机制(Sequencing & Acknowledgment&#xf…

什么是机器视觉3D碰撞检测?机器视觉3D碰撞检测是机器视觉3D智能系统中安全运行的核心技术之一

机器视觉3D碰撞检测是一种结合计算机视觉和三维空间分析的技术,旨在检测三维场景中物体之间是否发生碰撞(即物理接触或交叠)。它通过分析物体的形状、位置、运动轨迹等信息,预测或实时判断物体间的碰撞可能性。以下是其核心要点: 基本原理 三维感知:利用深度相机(如RGB-…

nacos设置权重进行负载均衡不生效

nacos设置权重进行负载均衡不生效,必须在启动类下加上这个bean Beanpublic IRule nacosRule(){return new NacosRule();}如下图所示

创建 Node.js Playwright 项目:从零开始搭建自动化测试环境

一、环境准备 在开始创建 Playwright 项目之前,确保你的电脑上已经安装了以下工具: Node.js:Playwright 依赖于 Node.js 环境,确保你已经安装了最新版本的 Node.js。可以通过以下命令检查是否安装成功: node -v npm -…