图像处理中的通信原理——冈萨雷斯读书笔记(三)

法国数学家傅里叶男爵在1822年出版的《热分析理论》一书中指出,任何周期函数都可以表示为不同频率的正弦和或余弦和(每个正弦项/余弦项乘不同的系数)的形式,这其实就是无穷级数的一种:傅里叶级数。无穷级数的思想是通过简单的函数形式,逼近复杂的函数,包括泰勒级数、幂级数也是这个道理。还是回到傅里叶级数,我们可以坐而论道地简单地想一下为什么所有符合要求的周期函数都可以表示为余弦/正弦之和。我们可以把函数看成一种运动的描述,而最简单的运动就是直线运动和圆周运动,而我们可以看一下wiki上讲的余弦是如何构成的:正余弦就是直线运动与圆周运动的结合体!

那么,我们一直在谈论的傅里叶变换是什么呢?当函数非周期时,我们依然把它看作是周期函数,只不过周期是无穷大的,这时候的余弦和就演变成了积分的形式,其作用在多数理论和应用学科中甚至远大于傅里叶级数。利用欧拉公式可以将正余弦转化为复数,所以频谱图是复数域的,横纵坐标代表实部与虚部。关于傅里叶级数和傅里叶变换的联系可以看知乎大神马同学的回答。

线性系统和傅里叶变换研究的核心是冲激及其取样特性。冲激可以是连续的或离散的。连续的冲激函数是广义的函数,在变量等于0的时候取正无穷。离散冲激是一个普通函数,在变量等于0的时候取1。周期为T的冲激串的傅里叶变换还是冲激串,周期为1/T。盒状函数的傅里叶变换是辛格函数,其零值位置与盒状函数的宽度W成反比,高度和W成正比。

卷积定理是频率域滤波的基础。卷积定理就是空间域两个函数的卷积的傅里叶变换等于两个函数的傅里叶变换在频率域中的乘积。那么什么是卷积呢?卷积是信号处理中最基础、最重要的一个概念,具体应用有卷积码,有现在大热的卷积神经网络CNN,但是很多人对卷积的理解其实还是不够,关于卷积我也是看了好多文章,这里先引用一段参考链接1的论述:

对图像和滤波矩阵进行逐个元素相乘再求和的操作就相当于将一个二维的函数移动到另一个二维函数的所有位置,这个操作就叫卷积或者协相关。卷积和协相关的差别是,卷积需要先对滤波矩阵进行180的翻转,但如果矩阵是对称的,那么两者就没有什么差别了。Correlation 和 Convolution可以说是图像处理最基本的操作,但却非常有用。这两个操作有两个非常关键的特点:它们是线性的,而且具有平移不变性shift-invariant。平移不变性指我们在图像的每个位置都执行相同的操作。线性指这个操作是线性的,也就是我们用每个像素的邻域的线性组合来代替这个像素。这两个属性使得这个操作非常简单,因为线性操作是最简单的,然后在所有地方都做同样的操作就更简单了。

至于翻转180度的理解,在书中空间滤波的部分进行了解释。在对只有一个1,其他全0的序列(离散单位冲激)填充0之后,相关操作对滤波器序列进行从左到右的横移,结果得到这个滤波器函数的翻转版本。而我们知道卷积的基本特性是某个函数与某个单位冲激卷积得到一个在该冲激处的这个函数的拷贝。结合刚才相关的结果,那么我们就可以把卷积看作是先对滤波器函数翻转180度,再进行相关操作。在图像处理中,我们就通常预先旋转模板,然后滑动求和。如果滤波器模板是对称的,卷积核相关将得到相同的结果。相关还可以用于寻找图像中的匹配。

但这只是谈到了卷积和相关的联系与区别。卷积的意义到底是什么?知乎:如何理解卷积,另外如何理解图像处理中的卷积?中看到了几个不错的回答:从滤波(空间滤波)角度,就是刚才提到的滑动加权;从投影角度,卷积也是一种内积(图像模板与图像patch),patch投影在模板上,得到feature map,常见的如卷积神经网络第一层,在卷积核上的投影,用一组Garbor滤波器提取图像特征;从随机信号角度,图像和模板都看作随机变量,卷积结果就是随机变量和X+Y的分布,这也和卷积定义中的暗合,更进一步,马同学的知乎回答中还提到荆哲解释的卷积中的“卷”是什么意思 卷积为什么叫「卷」积? - 荆哲的回答 - 知乎https://www.zhihu.com/question/54677157/answer/141245297,将纸看作是f和g的张量积,卷起来之后的一条环线就对应纸上的一条直线,x+y=n。对应翻转的理解,其实这只是方便和相关做比较,或者是把信号看作整体,计算每一个时间点的响应值,卷积也可以按照知乎张俊博的理解将信号分开,计算在所有时间的响应值再叠加。

取样定理在频域告诉我们,只要满足取样率大于函数最高频率的两倍,就可以恢复原来的连续带限函数(意味着在时间上是无穷扩展的)。用单位间隔为T的冲激串作为取样函数。用来从函数的取样恢复原始函数的滤波器就是重建滤波器。由一组样本集合来重建函数实际上可以减少样本间的内插。由书上的4.3.12式,在整数m处,sinc函数等于0,恢复函数的值就是样本值,样本点之间的值就是sinc函数的和形成的内插。

因为图像不是在两个坐标方向无限扩展,也不能无限取样,所以取样后总会存在混淆,分为空间混淆和时间混淆。空间混淆由欠采样造成,时间混淆是帧率低于运动速度,如电影中车轮倒转。



Reference:

1.https://blog.csdn.net/zouxy09/article/details/49080029 图像卷积与滤波的一些知识点

2.https://www.zhihu.com/question/27251882 知乎

3.https://www.zhihu.com/question/22298352 如何通俗易懂地理解卷积如何通俗易懂地解释卷积? - 张俊博的回答 - 知乎https://www.zhihu.com/question/22298352/answer/34267457



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/493763.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

腾讯俞栋:定义下一代智能人机交互,从目标、挑战到实现路径

来源:腾讯AI实验室语音识别及深度学习领域专家、腾讯AI Lab副主任及西雅图实验室负责人俞栋博士,在2018年腾讯全球合作伙伴大会上展示了腾讯AI正在推进的跨领域前沿研究:下一代的多模态智能人机交互。以下是有补充的演讲全文,介绍…

图像处理中的通信原理——冈萨雷斯读书笔记(四)

完美重建要求使用无限求和来内插,实践中,不得不寻求某种近似。在图像处理中,二维内插最普通的应用就是调整图像的大小。放大可看成是过取样,缩小是欠取样。无论是过取样还是欠取样,都需要内插,内插有最近邻…

unity3d游戏开发(一)——圈圈叉叉

参考:http://game.ceeger.com/forum/read.php?tid1719 ———————————————————开始————————————— 好吧,吹了那么多我们开始吧,先发个最终截图 当然,你觉得3个格子太少,你还可以扩展成任…

腾讯张正友:攻克可进化机器人,6个研究趋势与7大技术突破点

来源:腾讯AI实验室11月2日,机器人及多媒体技术专家、腾讯Robotics X实验室主任张正友博士,在2018年腾讯全球合作伙伴大会的人工智能分论坛上,展示了腾讯在机器人领域的思考。包括:腾讯将人工智能(AI&#x…

摩拜开锁方式

摩拜作为共享单车中发展得比较好的一个,最近又因为被美团收购和抛弃同龄人的文章上了新闻,我们从技术上看,它的解锁时候的通信方式是怎样的呢? 注意到摩拜的一款车车筐里面装了太阳能电池,所以能源问题容易解释。我们先…

前沿地带:从量子计算到量子互联网

来源:资本实验室当我们进入互联网时代,科技进步和社会发展就建立在了数据与计算能力的基础之上。庞大的数据量与快速的计算能力这两大基本因素决定着我们进入未来社会的速度,而在当前的各种新技术中,量子计算无疑是最具未来感的新…

千万级负载均衡架构设计

负载均衡 (Load Balancing) 负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。 大型网站负载均衡的利器 全局负载均衡系统&#xf…

科学为什么重要?马化腾公开信引热议,透露企业未来发展方向

来源:世界科技创新论坛摘要:美国强大的源泉,不是因为它有原子弹,航空母舰,隐性飞机,或者芯片,而在于它牢牢地掌握着基础科学的最前沿。科学一点都马虎不得,没有捷径可走,…

吴恩达斯坦福大学机器学习 CS229 课程学习笔记(二)

终于要开始正式的学习了。看了第一节课最大的印象是Ng老师的优雅,儒雅,偏英式的发音(突然意识到他从小在伦敦长大)。配着字幕看的视频,但还是希望能锻炼一下自己的听力,也只有在自己看过一遍印象才深刻&…

当自动驾驶汽车撞过来的时候,你希望它如何判断?

来源:网易智能 摘要:据报道,当无人驾驶汽车在繁忙的街道上发生碰撞的时候,它该优先避免让谁受伤呢?它该杀死谁,而不杀死谁呢?麻省理工学院的一项研究表明,你的回答将取决于你来自哪里…

细数黑客攻击的七大战术

不计其数的黑客们游荡在因特网中来欺骗那些容易上当的用户。它们多年使用着重复的攻击手段,毫无创新地利用着我们懒惰、误判和一些犯二的行为。 不过每年,恶意软件研究人员总会遇到一些引人侧目的攻击手段。这些攻击手段在不断拓展恶意攻击的范围。新的攻…

人工智能黑暗面

来源:大数据文摘编译:DonFJ、蒋宝尚机器学习是现在大家都打了鸡血想用或者在用的技术。但是,你以为只有好人能用它吗?Too young too simple!接下来,我将揭秘AI技术黑暗的一面——犯罪份子和人工智能的孽缘。…

认识蚁群算法

好像是看罗胖的罗辑思维,看到过一种说法,越是准入门槛高的,难以取代的行业,所需的工具是越简单的。摄影师需要昂贵的镜头,而画家却只需要简单的纸笔,尽管照片比画逼真得多,但是却无法取代绘画的…

薛定谔的猫跳进了生物学界,化学家表示:没有我可能办不到

来源:原理摘要:在生物科学界流传着“物理学家累了就来生物界玩一玩”的调侃。确实,现今学科之间密不可分,生物学的发展对特定物理技术的需求也越大。但是这样化学家却不满意了?1943年,物理学家薛定谔在都柏…

图像配准之特征点匹配的思考

最近赶时髦,看了一些智能优化算法如蚁群算法,还有机器学习的一些东西,就想着怎么把这些先进的东西用在图像配准中。头脑风暴了一下,觉得在已经检测到两幅图像的特征点的基础上,就如何对它们进行匹配似乎有优化的空间。…

指针%p输出的一些认识

还是看源码发现的问题 static int import_lowe_features( char*filename, struct feature** features ) 这个函数的作用是将txt文件中的Lowe的特征点导入到feature结构体中。在这个函数中第二个参数是指向结构体的指针的指针。 f calloc( n, sizeof(struct feature) );//在内存…

全球智慧医疗产业发展现状

来源:无锡情报所摘要:全球智慧医疗市场主要集中在美国、欧洲、日本和中国,而产品生产主要集中在美国、欧洲和日本。 随着大数据、云计算、物联网和人工智能技术快速发展和普及,运用互联网应用平台提升医疗资源的使用效率、提高救治和服务水平…

2018AI和机器学习界的12个重大收购案

来源:网络大数据据IDC声称,到2018年,全球人工智能(AI)和认知系统支出将达到190亿美元,这比2017年的支出总额增加约54%。并购在不断发生。仅2017年就见证了几起大宗收购,比如雅虎被Verizon收购、苹果收购Shazam等。知名…

PCA对特征点描述子降维

降维在机器学习领域其实是很重要的一部分,因为在高维情形下回出现样本稀疏,计算距离、内积困难,是所有机器学习面临的共同问题,被称为维数灾难(Curse of dimensionality),而降维就是解决的一个办…

C语言基础知识整理

一、 关于sizeof和strlen。Sizeof()用于计算某类型或者某变量在内存中所占空间。比如整数分为short型,int型,long整型,分别占2,2/4,4个字节,int型具体占用几个字节和编译系统有关。我们输入字符串时通常用c…