图像金字塔总结

图像金字塔总结

news/2025/7/16 6:30:01/文章来源:https://wangcaiyong.blog.csdn.net/article/details/78596240

本文转载自： http://blog.csdn.net/dcrmg/article/details/52561656

一、图像金字塔

图像金字塔是一种以多分辨率来解释图像的结构，通过对原始图像进行多尺度像素采样的方式，生成N个不同分辨率的图像。把具有最高级别分辨率的图像放在底部，以金字塔形状排列，往上是一系列像素（尺寸）逐渐降低的图像，一直到金字塔的顶部只包含一个像素点的图像，这就构成了传统意义上的图像金字塔。

获得图像金字塔一般包括二个步骤：

1. 利用低通滤波器平滑图像

2. 对平滑图像进行抽样（采样）

有两种采样方式——上采样（分辨率逐级升高）和下采样（分辨率逐级降低）

上采样：

下采样：

二、高斯金字塔

高斯金字塔式在Sift算子中提出来的概念，首先高斯金字塔并不是一个金字塔，而是有很多组（Octave）金字塔构成，并且每组金字塔都包含若干层（Interval）。

高斯金字塔构建过程：

1. 先将原图像扩大一倍之后作为高斯金字塔的第1组第1层，将第1组第1层图像经高斯卷积（其实就是高斯平滑或称高斯滤波）之后作为第1组金字塔的第2层，高斯卷积函数为：

对于参数σ，在Sift算子中取的是固定值1.6。

2. 将σ乘以一个比例系数k,等到一个新的平滑因子σ=k*σ，用它来平滑第1组第2层图像，结果图像作为第3层。

3. 如此这般重复，最后得到L层图像，在同一组中，每一层图像的尺寸都是一样的，只是平滑系数不一样。它们对应的平滑系数分别为：0，σ，kσ，k^2σ,k^3σ……k^(L-2)σ。

4. 将第1组倒数第三层图像作比例因子为2的降采样，得到的图像作为第2组的第1层，然后对第2组的第1层图像做平滑因子为σ的高斯平滑，得到第2组的第2层，就像步骤2中一样，如此得到第2组的L层图像，同组内它们的尺寸是一样的，对应的平滑系数分别为：0，σ，kσ，k^2σ,k^3σ……k^(L-2)σ。但是在尺寸方面第2组是第1组图像的一半。

这样反复执行，就可以得到一共O组，每组L层，共计O*L个图像，这些图像一起就构成了高斯金字塔，结构如下：

在同一组内，不同层图像的尺寸是一样的，后一层图像的高斯平滑因子σ是前一层图像平滑因子的k倍；

在不同组内，后一组第一个图像是前一组倒数第三个图像的二分之一采样，图像大小是前一组的一半；

高斯金字塔图像效果如下，分别是第1组的4层和第2组的4层：

三、尺度空间

图像的尺度空间解决的问题是如何对图像在所有尺度下描述的问题。

在高斯金字塔中一共生成O组L层不同尺度的图像，这两个量合起来（O，L）就构成了高斯金字塔的尺度空间，也就是说以高斯金字塔的组O作为二维坐标系的一个坐标，不同层L作为另一个坐标，则给定的一组坐标（O,L）就可以唯一确定高斯金字塔中的一幅图像。

尺度空间的形象表述：

上图中尺度空间中k前的系数n表示的是第一组图像尺寸是当前组图像尺寸的n倍。

四、 DOG金字塔

差分金字塔，DOG（Difference of Gaussian）金字塔是在高斯金字塔的基础上构建起来的，其实生成高斯金字塔的目的就是为了构建DOG金字塔。

DOG金字塔的第1组第1层是由高斯金字塔的第1组第2层减第1组第1层得到的。以此类推，逐组逐层生成每一个差分图像，所有差分图像构成差分金字塔。概括为DOG金字塔的第o组第l层图像是有高斯金字塔的第o组第l+1层减第o组第l层得到的。

DOG金字塔的构建可以用下图描述：

每一组在层数上，DOG金字塔比高斯金字塔少一层。后续Sift特征点的提取都是在DOG金字塔上进行的。

DOG金字塔的显示效果如下：

这些长得黑乎乎的图像就是差分金字塔的实际显示效果，只在第1组第1层差分图像上模糊可以看到一个轮廓。但其实这里边包含了大量特征点信息，只是我们人眼已经分辨不出来了。

下边对这些DOG图像进行归一化，可有很明显的看到差分图像所蕴含的特征，并且有一些特征是在不同模糊程度、不同尺度下都存在的，这些特征正是Sift所要提取的“稳定”特征：

附带说一下后面的归一化，在图像处理中是很常见的操作，主要原因是亮度不均匀，显然偏暗。因此我们希望灰度值分布较为均匀些，因此我们可以将当前的像素灰度值缩放到[0,255]即可。具体可参考《MATLAB实现图像灰度归一化》

参考资料：
1. 深度学习目标检测中的图像金字塔 pyramid

2. 图像金字塔

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/258605.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

表单的get和post使用情景

表单的get和post使用情景

GET和POST两种方法都是将数据送到服务器，但你该用哪一种呢？HTTP标准包含这两种方法是为了达到不同的目的。POST用于创建资源，资源的内容会被编入HTTP请示的内容中。例如，处理订货表单、在数据库中加入新数据行等。当请求无副作用…

阅读更多...

什么叫做罗列式_项目起盘的时候，如何确定自己该做什么社群？

什么叫做罗列式_项目起盘的时候，如何确定自己该做什么社群？

这是祁杰『社群日记』第48篇持续日更，做最懂社群的营销咨询人很多人手上有资源，准备起盘项目的时候，总会思考一个问题：我能做什么样的社群？今天我们从用户需求出发，拆解一下哪些社群是能够确切地满足用户的…

阅读更多...

C++ exit 与 return 浅析

C++ exit 与 return 浅析

【摘要】本文从代码形式。经常使用方式，相关概念，调用关系和比較分析，这5个维度浅析 exit 与 return 在C的同样点与差别。【常见形式】 exit(0)： 正常执行程序并退出程序。 exit(1)： 非正常执行导致退出程序&…

阅读更多...

Feature Pyramid Networks for Object Detection 总结

Feature Pyramid Networks for Object Detection 总结

最近在阅读FPN for object detection,看了网上的很多资料，有些认识是有问题的，当然有些很有价值。下面我自己总结了一下，以供参考。 1. FPN解决了什么问题？ 答： 在以往的faster rcnn进行目标检测时，无论…

阅读更多...

最近工作

最近工作

最近的工作忙且乱，以至于，我第天早晨早早起来到晚上11点多才能回到家。今天早晨写代码的时候腰突然猛疼，疼的我直叫唤。躺在床上半天起不来。最近每天的工作要计划一下了，不能客户说干嘛就干嘛，这样累坏了自己&#x…

阅读更多...

LeetCode OJ - Candy

LeetCode OJ - Candy

题目： There are N children standing in a line. Each child is assigned a rating value. You are giving candies to these children subjected to the following requirements: Each child must have at least one candy.Children with a higher rating get mor…

阅读更多...

那些 IT 界的神翻译，原来我学不好编程的原因就在这

那些 IT 界的神翻译，原来我学不好编程的原因就在这

近日博主 ruanyf 在网上发布了一条关于套接字“socket”的解释，引发了网友对于那些 IT 界的神翻译的讨论： 突然想到，socket就是插座。服务器的socket，就是服务器提供插座，等着客户端的插头插进来。一旦插入完成&#x…

阅读更多...

navicat 结构同步会加锁吗_被柜员怠慢的张小波，真的会永久地转走几个亿的结构性存款吗？...

navicat 结构同步会加锁吗_被柜员怠慢的张小波，真的会永久地转走几个亿的结构性存款吗？...

4月7日下午，北京凤凰联动文化传媒有限公司总裁张小波发布微博称，前几天去安贞附近一银行，想把借记卡的转帐额度从每天五百万上调一下，没有想到，在其问到“最高可调到多少”时，柜员回答一个亿并“鄙夷地看了…

阅读更多...

Mask RCNN笔记

Mask RCNN笔记

mask rcnn简介 mask rcnn是何凯明基于以往的faster rcnn架构提出的新的卷积网络，一举完成了object instance segmentation. 该方法在有效地目标的同时完成了高质量的语义分割。文章的主要思路就是把原有的Faster-RCNN进行扩展，添加一个分支使用现有的检…

阅读更多...

IOS开发之----常用函数和常数--秀清

IOS开发之----常用函数和常数--秀清

介绍一下Objective-c常用的函数，常数变量算术函数【算术函数】函数名说明int rand()随机数生成。（例）srand(time(nil));　//随机数初期化int val rand()P;　//0～49之间的随机数int abs(int a)整数的绝对值（例&#…

阅读更多...

网页设计中常用的19个Web安全字体

网页设计中常用的19个Web安全字体

来自http://www.jb51.net 在Web编码中，CSS默认应用的Web字体是有限的，虽然在新版本的CSS3，我们可以通过新增的font-face属性来引入特殊的浏览器加载字体。但多数情况下，考虑各个因素的影响我们还是在尽量充分利用这些默认调用的字…

阅读更多...

python slice是共享内存吗_python共享内存实现进程通信

python slice是共享内存吗_python共享内存实现进程通信

1.概述共享内存可以说是最有用的进程间通信方式.两个不同的进程共享内存的意思是:同一块物理内存被映射到两个进程的各自的进程地址空间.一个进程可以及时看到另一个进程对共享内存的更新,反之亦然.采用共享内存通信的一个显而易见的好处效率高,因为进程可以直接读写内存,而不需…

阅读更多...

FCN-数据篇

FCN-数据篇

从本篇开始，我们来记录一下全卷积网络用来做语义分割的全过程。代码：https://github.com/shelhamer/fcn.berkeleyvision.org 下面我们将描述三方面的内容： 1. 官方提供的公开数据集 2. 自己的数据集如何准备，主要是如何标注…

阅读更多...

深圳本地网店代运营公司

深圳本地网店代运营公司

◆★◆深圳本地网店代运营，淘宝代运营多少钱，微博运营公司，代运营平台，天猫京东代运营，网站代运营图片， 北京京东代运营，网店代运营协议，京东店铺代运营，网站代运营服务…

阅读更多...

搜索专题题解

搜索专题题解

题目链接： codeforces 277A - Learning Languages 题目描述： 一个团体有n个人，每个人都掌握了一些语言，每个人学一门语言有1个花费，两个人之间可以通过其他人的翻译，问最少花费多少使得这个团体的任意两个人…

阅读更多...

Facebook 开源的快速文本分类器 FastTex

Facebook 开源的快速文本分类器 FastTex

FastText是Facebook开发的一款快速文本分类器，提供简单而高效的文本分类和表征学习的方法，性能比肩深度学习而且速度更快。 fastText 原理fastText 方法包含三部分：模型架构、层次 Softmax 和 N-gram 特征。下面我们一一介绍。 1.1 模型架构 …

阅读更多...

FCN-加载训练与测试数据

FCN-加载训练与测试数据

当我们生成了数据后，我们来看看FCN是如何加载数据的。 FCN 代码预览其中： - data : 训练测试数据 - ilsvrc-nets：存放预训练的模型 - 剩下的框：不同数据集的训练测试prototxt - voc_layers，siftflow_layers等&am…

阅读更多...

怎么撤销定时说说_已注册商标遇到撤三申请怎么办

怎么撤销定时说说_已注册商标遇到撤三申请怎么办

很多企业的商标都遇到过商标撤三的情况，撤三简单的说就是，注册商标没有正当理由连续三年不使用的，任何单位或者个人可以向商标局申请撤销该注册商标。所以说，无论您的企业多大，商标持有的再多，也要做好商标…

阅读更多...

windows下架设SVN服务器并设置开机启动

windows下架设SVN服务器并设置开机启动

1、安装SVN服务器，到http://subversion.apache.org/packages.html上下载windows版的SVN，并安装，在命令行下运行svn命令，如下所以，则svn服务器安装成功。 C:\Documents and Settings\Administrator>svn 使用“svn …

阅读更多...

Spartan-6 FPGA SelectIO Resources User Guide 笔记2 SelectIO Attributes/Constraints

Spartan-6 FPGA SelectIO Resources User Guide 笔记2 SelectIO Attributes/Constraints

1.Location Constraint 用于分配I/O端口 NET <I/O_NAME> LOC "<EXTERNAL_PORT_IDENTIFIER>"; Example: NET MY_IO LOCR7; 2.IOSTANDARD Attribute 用于选择IO标准如LVCMOS25，LVDS_25等 NET <I/O_NAME> IOSTANDARD”<IOSTANDARD V…

阅读更多...

最新文章