[机器视觉] SIFT特征-尺度不变特征理解

SIFT特征-尺度不变特征理解

简介

SIFT,即尺度不变特征变换(Scale-invariant feature transform,SIFT),是用于图像处理领域的一种描述。这种描述具有尺度不变性,可在图像中检测出关键点,是一种局部特征描述子。该方法于1999年由David Lowe首先发表于计算机视觉国际会议(International Conference on Computer Vision,ICCV),2004年再次经David Lowe整理完善后发表于International journal of computer vision(IJCV)。截止2014年8月,该论文单篇被引次数达25000余次。
1492605-20181117135137736-135954834.jpg

特点

  • 对旋转、尺度缩放、亮度变化保持不变性,对视角变化、噪声等也存在一定程度的稳定性
  • 独特性,信息量丰富,适用于在海量特征数据中进行快速,准确的匹配
  • 多量性,即使少数几个物体也可以产生大量的Sfit特征向量
  • 可扩展性,可以很方便的与其他形式的特征向量进行联合

高斯图像金字塔

理解

高斯图像金字塔是把原图像先放大一倍(如150✖150到300✖300),对这个放大后的图像进行高斯滤波(之前讲过的高斯模糊,可以回去看一下),其中模糊半径分别取σ、kσ、k^2σ等等,得到若干个模糊后的图像,这是第一组,然后依次按照比例为2缩小图像,如此重复,构建一个有若干组(Octave)的金字塔,每组分为若干层。

1492605-20181117135158730-1518395369.jpg

补充

用O表示octave(第几组),用L表示layer(第几层),则(O,L)就代表高斯图像空间中的确定的一副图像。

DOG金字塔

理解

DOG金字塔(Difference of Gaussian)就是高斯金字塔同一octave下相邻两层的差分构成的金字塔。
1492605-20181117135221600-111713368.jpg

解释

之所以要构建差分金字塔,就是为了找到在不同尺度和不同模糊程度下的不变特征,而这正式SIFT要提取的"稳定"特征。

空间极值点检测

理解

这里的空间极值点检测,其实就是在DOG空间的一个octave下比较每一个像素和它相邻点的大小,看它是否比其他点都要大。如果比周围点都大,说明它是是局部的极值点(这一点我们可以类比一个二次函数,它的最低点是不是比周围点都小,所以它是极值点,当然它也恰巧是最低点)。

1492605-20181117135259640-1166269881.png

补充

这里我们要计算图中打x的点是不是极值点,那么我们就要比较它与不同层以及同层的周围一共26个点的大小,才能确定它是不是空间的极值点。

关键点精确定位

理解

由于我们上面的操作都是在离散空间操作的,我们知道,离散空间取到的极值点,并不一定是真正的极值点,所以我们需要通过类似函数拟合的方式,对离散点进行拟合使之连续,在连续空间就很容易利用我们的知识求取极值点。

1492605-20181117135350081-1076292510.jpg

计算

我们将DOG空间的泰勒展开式子看成其拟合函数,就可以操作连续空间的函数了。
候选特征点x,其偏移量定义为Δx,其对比度为D(x)的绝对值∣D(x)∣,对D(x)应用泰勒展开式
1492605-20181117135439014-43467477.png
由于x是D(x)的极值点,所以对上式求导并令其为0,得到
1492605-20181117135502775-1473460452.png
然后再把求得的Δx代入到D(x)的泰勒展开式中
1492605-20181117135522809-670920556.png
设对比度的阈值为T,若∣D(x^)∣≥T,则该特征点保留,否则剔除掉。

关键方向匹配

理解

上面说了,SIFT特征具有旋转不变性,而它的旋转不变性就在于每一个关键点都有一个基准方向,而这个基准方向是由图像的局部决定和分配的。

计算

梯度的模值和方向定义如下:
1492605-20181117145045290-1858212389.png

1492605-20181117145054345-1120992100.png

利用这个公式计算以关键点为中心的领域内所有点的梯度方向(8个方向),计算完之后,我们使用直方图来统计领域内像素的梯度和方向。梯度直方图将0~360度的方向分为36个立柱,每柱10度。直方图的峰值代表的是该关键点的主方向。为了增强鲁棒性,如果由立柱的值大于峰值的80%,我们将其作为关键点的辅方向。(下图只花了8个方向)。

1492605-20181117145105371-1698977824.png

关键点描述

理解

关键点描述是对领域内高斯图像直方图统计结果的一种表示形式,我们找到的特征点参数有位置、尺度和方向。在关键点周围的领域内,将其分为m✖m个子块,每个子块以中间点为原点,分别计算梯度直方图,生成局部向量,对该向量进行标准高斯函数加权处理,然后对特征向量进行归一化处理。每个关键点在下图中可以产生2✖2✖8维向量作为特征向量。

1492605-20181117150728312-1317861547.png

David G.Lowed的实验结果表明:对每个关键点,采用448共128维向量的描述子进项关键点表征,综合效果最佳:

1492605-20181117150739591-1816082258.png

特征点匹配

理解

有了目标图片,对目标图片计算SIFT特征,然后用其特征向量与已知特征的特征向量进行欧式距离匹配,其欧式距离越小,匹配度越高。

转载于:https://www.cnblogs.com/aoru45/p/9973961.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/464292.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

harmonyos手机开发者beta,HarmonyOS 手机应用开发者 Beta 版到来,对开发者意味着什么...

北京时间12月16日,HarmonyOS手机开发者Beta活动在北京国贸开启,这场活动现场的人潮涌动也足以说明一切——用户和开发者对HarmonyOS手机应用开发者Beta版期待已久。作者 | 贾凯强头图 | 华为官方提供打破手机单设备限制,为万物互联而生在活动…

你确定不反编译 likely 看看?

大家好,我是写代码的篮球球痴,下面推荐飞哥的一篇文章,觉得对大家很有帮助,希望大家先看看再扔到收藏夹吃灰,转发不转发看大爷们心情咯!今天我给大家分享一个内核中常用的提升性能的小技巧。理解了它对你一…

看完这篇文章,会让你对电容的作用更明白!

电容是电路设计中最为普通常用的器件,是无源元件之一,有源器件简单地说就是需能(电)源的器件叫有源器件,无需能(电)源的器件就是无源器件。电容的作用和用途一般都有好多种,如:在旁路、去耦、滤波、储能方面的作用&…

华为mate40pro 升级鸿蒙,华为Mate40Pro再次曝光,麒麟9000+可升级到鸿蒙OS,这才是华为...

原标题:华为Mate40Pro再次曝光,麒麟9000可升级到鸿蒙OS,这才是华为在如今的手机市场,创新和差异化的设计已经成为消费者最在意的地方,所以加大技术创新和研发投入才是手机厂商们谋求发展的唯一道路。华为手机是一个大家…

10年深圳,回去了

十年前,2012年,我们毕业。毕业后,我们很多人都选择来深圳,那时候的想法很简单,深圳有我们想要的工作,我们很多人都是村里来的孩子,没有背景,家里也没有矿。考不上公务员也不想去做老…

android studio导入eclipse项目各种问题,Android | 导入Eclipse项目到Android studio的问题解决全过程...

D老师今天给了一个Android项目,但是他当时(2015年)用的是eclipse写的而我用的是Android studio,所以在导入项目的过程中出现了一些常见的问题,在这里总结一下解决的问题的过程。1.eclipse项目导入到Android studio的过程:File->…

蜡烛节能车模

❝简 介: 本文给出了几款使用蜡烛驱动的车模。关键词: 蜡烛,车模01 蜡烛车模1.1 蜡烛光电池点上蜡烛就能跑,DIY制作玩具汽车小模型The Energy of the Candle. Car Model[4]▲ 图1.2 蜡烛驱动的智能车模▲ 图1.1.3 光电池车模▲ …

Xen Desktop测试报告

Xen Desktop测试报告 (九叔最近写的一个测试报告,仅供参考,可能结论不适合你们公司) 目的 测试目的:本次测试周期耗时两周(2011.11.14-2011.11.24),主要为了理解思杰的桌面虚拟化&am…

Linux基础提高_系统性能相关命令

w 看系统的负载信息 用于显示已经登陆系统的用户列表,并显示用户正在执行的指令 uptime [rootlocalhost]#uptime 17:26:07 up 9:02, 3 users, load average: 0.00, 0.00, 0.00 能够打印系统总共运行了多长时间和系统的平均负载。uptime命令可以显示的信息显示依次为…

去广州见了我大学老师标哥

标哥是我的大学老师。标哥也是我们很多学生公认上课非常好的老师,最近标哥突然想见见我这个年轻仔,让我去广州见见他,当然,并不是说他不能来深圳,见面的时候标哥特意给我们解释了一遍,我肯定是能理解他的良…

说好的薪资统计

本来是不想把最后的统计发出来的,但是后台很多同学都想看看嵌入式的薪资,我自己也答应了会发出来,所以趁着这个假期再发一次,也让大家做个参考。不想发的原因是因为担心有别有用心的人拿这个薪资来做比较,多少会让大家…

STL面试题

http://blog.csdn.NET/tianya_team/article/details/50753759 1.说说std::vector的底层(存储)机制。 vector就是一个动态数组,里面有一个指针指向一片连续的内存空间,当空间不够装下数据时,会自动申请另一片更大的空间…

实现IButtonControl接口时, PerformClick()方法的代码怎么写,请高手指导!

在做WinForm时,想做一个像Asp.Net里的ImageButton的控件,于是自己写了一个自定义控件,名为:ImageButton,继承PictureBox类,并实现IButtonControl接口,但是实现IButtonControl接口时必须重写IBut…

【转载】 Asp.net Mvc 3当然也不会例

最快的学习方法:找到官方的教程,最好是类似Msdn演练或者冠以Step By Step的,跟着做一遍,做的过程中可以拷贝少量教程中的代码,确保每个步骤、每行代码含义都能够明白,中途随手记录一下,每个步骤…

什么是BSP工程师?

文章转自https://luomuxiaoxiao.com/?p170一、嵌入式系统要明白什么是嵌入式软件工程师,我们先从嵌入式系统(嵌入式设备)说起。维基百科上对嵌入式系统的定义如下:嵌入式系统(Embedded System)&#xff0c…

《STL源码剖析》相关面试题总结

一、STL简介 STL提供六大组件,彼此可以组合套用: 容器 容器就是各种数据结构,我就不多说,看看下面这张图回忆一下就好了,从实现角度看,STL容器是一种class template。 算法 各种常见算法,如sor…

工厂好的html页面,jquery中被誉为工厂函数的是什么?

jquery中被誉为工厂函数的是“$()”。在jQuery中,无论我们使用哪种类型的选择符都需要从一个“$”符号和一对“()”开始。下面本篇文章给大家介绍一下。有一定的参考价值,有需要的朋友可以参考一下,希望对大家有所帮助。jQuery的三种$()“$”…

如何学好单片机?​嵌入式第一门课

很多想学单片机的人问我的第一句话就是:怎样才能学好单片机?对于这个问题我今天就我自己是如何开始学单片机,如何开始上手,如何开始熟练这个过程给大家讲讲。先说说单片机,一般我们现在用的比较多的的MCS-51的单片机&a…

在 Mac 上通过 Docker 运行 Asp.net Core 简易教程

首先,你需要在 Mac 上安装好 Docker 下载地址 https://download.docker.com/mac/stable/Docker.dmg 或者查看别人的 安装教程 怎么安装这里就不在赘述了。 打开 Docker 输入命令 docker run -d --rm -p 8000:80 --name aspnetcore_sample microsoft/dotnet-sample…

TCP协议-相关面试题

一、TCP协议简介 一般问到TCP协议的时候 最常见的是TCP连接建立和断开的过程,也就是三次握手和四次挥手,两张图足矣。 1.1 三次握手 1.2 四次挥手 二、常见面试题 2.1 TCP连接阶段 2.1.1 发送序号和确认序号问题 例: TCP建立连接的过程采用三…