SIFT算法中概念简单解释

尺度空间

真实世界的物体只有在一定尺度上才有意义,例如我们能够看到放在桌子上的水杯,但对于整个银河系,这个水杯是不存在的。物体的这种多尺度的本质在自然界中是普遍存在的。尺度空间就是试图在数字图像领域复制这个概念。又比如,对于某幅图像,我们是想看到叶子还是想看到整棵树,如果是树,那么我们就应该有意识的去除图像的细节部分(如叶子、细枝等)。在去除细节部分的过程中,我们一定要确保不能引进新的错误的细节。因此在创建尺度空间的过程中,我们应该对原始图像逐渐的做模糊平滑处理。进行该操作的唯一方法是高斯模糊处理,因为已经被证实,高斯函数是唯一可能的尺度空间核。

(我简单的把尺度空间理解为,一副图像通过缩小后,会产生很多尺度空间,给定的一副图像我们只能进行缩小;同一个组的图像的分辨率相同,但是组内的图像依次看起来模糊,细节的部分被省略,尽大可能保留了图像的主要信息,以便于后面的特征点检测;各个组之间图像的分辨率依次减小;我们得到各类尺度空间的目的是为了检测图像中的特征点,当图像模糊、进一步缩小后,检测到的特征点可能是原图的一个区域,因此每个特征点会有半径的属性)

 

极值检测

为了在连续的尺度下检测图像的特征点,需要建立 DoG 金字塔,而 DoG 金字塔的建立又离不开高斯金字塔的建立,如下图所示,左侧为高斯金字塔,右侧为 DoG 金字塔。

(下图只显示了两组尺度空间图像,两组图像的分辨率是一样的,但是每组图像里,上层图像比下层图像模糊,上面的那组图像的分辨率要小于下面的那组图像,上面的图像进行了缩小;右侧每层的尺度空间图像数目都比左侧少一个,因为左侧的每相邻的两层图像相减得到右侧的一层图像,)

 

极值点的搜索是在 DoG 金字塔内进行的,这些极值点就是候选的特征点。在搜索之前,我们需要在 DoG 金字塔内剔除那些像素值过小的点,因为这些像素具有较低的对比度,它们肯定不是稳定的特征点。极值点的搜索不仅需要在它所在尺度空间图像的邻域内进行,还需要在它的相邻尺度空间图像内进行,如图 2 所示。

 

 

特征点的定位

极值点的求取是在 DoG 尺度图像内进行的, DoG 图像的一个特点就是对图像边缘有很强的响应。一旦特征点落在图像的边缘上,这些点就是不稳定的点。这是因为一方面图像边缘上的点是很难定位的,具有定位的歧义性;另一方面这样的点很容易受到噪声的干扰而变得不稳定。因此我们一定要把这些点找到并剔除掉。它的方法与 Harris 角点检测算法相似,即一个平坦的 DoG 响应峰值往往在横跨边缘的地方有较大的主曲率,而在垂直边缘的方向上有较小的主曲率。

(这一个步骤主要是去掉检测到的极值点中的图像边缘点)

 

方向角度的确定

       (确定特征点方向角度时,我们首先要确定该特征点的半径,半径和该图像的尺度有关,确定半径后,统计特征点周围各个方向半径内的像素梯度幅值和,10度为一个方向,方向统计和最大的表示该特征点的方向。)

 

特征点描述符生成

目前为止,我们已经为关键点赋予了坐标位置、尺度信息以及方向。现在我们需要一组向量将这个关键点表达出来,并且这组向量不单包括关键点,还应包括关键点周围对其有贡献的像素点。我们还期望这组向量对仿射变换、光照变换等具有一定的鲁棒性,这些不变特性将会作为目标匹配的依据。

描述子的基本思路:通过对关键点周围图像区域分块,计算块内梯度直方图,生成具有独特性的向量,这个向量是该区域图像信息的一种抽象,具有唯一性。

(特征点描述符表示这个特征点独特性的地方,区别与其他特征点的地方,找出区别主要根据特征点周围的像素值,计算特征点周围的像素值的梯度直方图,根据周围像素直方图来唯一描述特征点,通常一个特征点需要计算周围4*4个子区域,每个子区域涉及8个方向,所以每个特征点有4*4*8=128维)

 

参考自:

https://blog.csdn.net/dcrmg/article/details/52561656

http://blog.csdn.net/zhaocj/article/details/42124473

http://blog.csdn.net/liuheng0111/article/details/51234163

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492918.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

发布|CES 2019 科技趋势(附40页PPT)

来源:Robot未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网&#xff…

UVAL - 6755 - Swyper Keyboard

先上题目: https://icpcarchive.ecs.baylor.edu/external/67/6755.pdf 题目复制起来比较麻烦。 题意:定义一种操作:给出一个字符串,然后手指就按照给出的字符串的字符出现顺序不离开触摸屏那样移动,这样最后就会得到一…

Ransac算法简介

给定两个点p1与p2的坐标,确定这两点所构成的直线,要求对于输入的任意点p3,都可以判断它是否在该直线上。初中解析几何知识告诉我们,判断一个点在直线上,只需其与直线上任意两点点斜率都相同即可。实际操作当中&#xf…

2018年AI和ML(NLP、计算机视觉、强化学习)技术总结和2019年趋势

来源:网络大数据1、简介过去几年一直是人工智能爱好者和机器学习专业人士最幸福的时光。因为这些技术已经发展成为主流,并且正在影响着数百万人的生活。各国现在都有专门的人工智能规划和预算,以确保在这场比赛中保持优势。数据科学从业人员也…

HDU 2421

由算术基本定理Np1^e1*p2^e2....ps^es,可知一个素的因子个数为(e11)*(e21)*...*(es1)。 而N的一人因子必定也有np1^k1*p2^k2。。。。*ps^ks的形式。因子个数形式同上。 而事实上,即是从ei中选取其中一些来充当k1。那么,所有的因子的个数之和必…

仿射变换的原理

在条形码识别软件中有图像预览的功能。有时预览的图像需要进行转置(旋转180度或者90度)、缩放、镜像(左右反转)等操作。OpenCV提供了相应的函数进行以上操作。例如: 转置:cv::WarpAffine() 缩放&#xff…

拯救顽疾大作战!IDC绘中国医疗AI生态图谱,英伟达献医疗影像新杀器

来源:智东西摘要:中国千家医院部署AI系统!IDC医疗AI报告详解行业趋势和五大药方。2018年是令人唏嘘的一年,台湾作家李敖、动画大师高畑勋、相声表演艺术家师胜杰、央视主持人李咏、微软联合创始人保罗艾伦、武侠小说宗师金庸等一个…

设计模式之适配器模式(Adapter Pattern)

在正式开始之前,让我们先思考几个问题: 如果现有的新项目可以利用旧项目里大量的遗留代码,你打算从头开始完成新项目还是去了解旧项目的模块功能以及接口?如果你了解过遗留代码之后,发现有几个重要的功能模块接口不同&…

错位排列-信封问题

五个编号为1~5的小球放进5个编号为1~5的小盒里面,全错位排列(即1不放1,2不放2,依次类推)一共有多少种放法 这是著名的信封问题,很多著名的数学家都研究过瑞士数学家欧拉按一般情况给出了一个递推公式: 用A…

存在描述所有生命的方程吗?

○ 生物体既复杂又有序,就像这片亚麻茎的横截面。研究人员希望最终发展出描述所有生命的基本方程。来源:原理关于生命,没有什么是简单的。每一秒钟,都有数百万个缜密有序的化学反应发生在一个细胞内;数十亿个单细胞生物…

asp.net(C#)写SQL语句技巧

/*添加SQL*/string fields "";string values "";fields "xm"; values "" Request.Form["xm"].ToString() "";fields ",xb"; values "," Request.Form["xb"].ToString() …

Python函数参数值传递

Python的函数参数是通过值传递的,但是如果变量是可变对象,返回到调用程序后,该对象会呈现被修改后的状态 测试程序如下: # 值传递不改变变量 def addInterest(balance, rate):newBalance balance * (1rate)return newBalance de…

CSS3滤镜

今天在办公室亲眼目睹了同事使用CSS3滤镜为一张漂亮的照片轮廓加上了阴影,瞬间亮瞎了我的的双眼,见笑了。 所以也迅速尝试使用CSS3滤镜让最新出炉的MUI LOGO也性感一把,试图来愉悦一下大家的双眼。已经等不及了,赶紧奉上今天的测试…

Python中递归字符串反转

我们可以用Python轻松的反转字符串,代码如下: def reverse(s):if s :return selse:return reverse(s[1:]) s[0]print(reverse(hello))运行结果如下:Connected to pydev debugger (build 143.1559) ollehProcess finished with exit code 0

全面认识“边缘云”,中国首份边缘云白皮书发布

来源:中国电子技术标准化研究院、阿里云摘要:《边缘云计算技术与标准化白皮书》近期发布,定义了边缘云计算的概念和标准等。中心云和边缘云相互配合,实现中心-边缘协同、全网算力调度、全网统一管控等能力,真正实现“无…

Python中异常处理

Python使用try...except...来处理异常,当Python遇到一个try语句,他会尝试执行try语句体内的语句,如果执行这些语句没有错误,控制转移到try...except...后面的语句,如果语句体内发生错误,python会寻找一个符…

【Tech】Mac上安装MAMP打开本地网页

不知道为什么实验室老是用些奇葩的东西,这次是madserve,主要是用来统计移动端广告点击率的,基于PHP/MYSQL实现。 昨天很快在Windows上搭好一个xampp,并用它建立了一个virtual host把madserve跑起来了。但是在mac上xampp建立virtua…

中国10大最震撼的无人工厂,你吃的用的都是这么来的!

来源:工业机器人摘要:你吃的用的那么多东西,早已不是“人造”的!1.上海通用金桥工厂:386台机器人图中展示的是上海通用金桥工厂。这里号称中国最先进的制造业工厂、中国智造的典范。即使从全球来看,这个水平…

图像拼接2 特征匹配

特征匹配旨在从两幅图像所提取的特征集中寻找对应关系,匹配过程是从前面的图像特征描述符的相似性来进行判断。 判断两个图像特征集中的特征点的相似程度存在两种基本方式: 1:给定阈值,即从特征集中找出所有与待匹配点距离小于阈…

状态压缩 之 UVA 10944 - Nuts for nuts..

// [9/19/2014 Sjm] /* dis[j][k] : 从 j 点到 k 点的最少步数,由于They can travel in all 8 adjacent direction in one step.故而 dis[j][k] max( abs(Xj - Xk), abs(Yj - Yk) )f[j][i] : 在 i 状态下,最后收集坚果 j 的最少步数n 代表坚果的数目。…