视觉中的经典图像特征小结(一): 颜色直方图, HOG, LBP

[普兒原创, 如有错误和纰漏欢迎指正. 更新中...]

 1. 颜色直方图

颜色空间在本质上是定义在某种坐标系统下的子空间,空间中的每一个坐标表示一种不同的颜色。颜色空间的目的在于给出某种颜色标准,使得不同的设备和用途都能对颜色有一致的描述。这里主要介绍两种不同的颜色空间,包括RGB颜色空间和CIE-Lab颜色空间,如图4-2所示。

 

 (a)RGB颜色空间; (b)CIE-Lab颜色空间

图1 颜色空间示意图

 

RGB颜色空间是定义在三维笛卡尔坐标系中的颜色模型,每一种颜色定义在3个主颜色分量红(R)、绿(G)、蓝(B)上。如图1(a)所示,立方体表示RGB空间,3个主颜色分量分别在立方体位于坐标轴的角上,3个分量在虚线表示的立方体对角线上的取值相等,表示灰度值空间。坐标原点表示黑色,3个分量在距离原点最远的角上取得最大值,表示白色。通过RGB颜色空间表示的图像由分别由红、绿、蓝3个通道的图像组成。当图像被显示出来时,3个通道的颜色被组合起来表示RGB颜色空间中的一种颜色。

与RGB颜色空间不同,CIE-Lab颜色空间由国际照明委员会在1976年正式提出,旨在提供一种基于人类视觉感知特性的颜色系统,能通过数字的方式度量人体感知到的颜色的差别[1]。CIE-Lab颜色空间由明度(luminance)分量、a分量和b分量表示。其中明度分量表示颜色的灰度,a和b分量共同定义了色调和饱和度,a分量表征从红(+a)到绿(-a)的颜色,b分量表征从黄(+b)到蓝(-b)的颜色,且a、b分量相互垂直,如图4-2(b)所示。直观说来,CIE-Lab颜色空间是基于人的主观感知定义的,例如没有“偏红的绿色”和“偏蓝的黄色”,是用于替换过分简化的RGB直角坐标颜色空间的折中方案。

本文在RGB和CIE-Lab颜色空间的各通道图像上提取直方图作为图像区域的颜色特征。所谓直方图,是指强度为\([0, L-1]\)范围的图像的离散函数\(h(r_k)=n_k\),其中\(r_k\)表示第\(k\)级灰度,\(n_k\)是图像中灰度级为\(r_k\)的像素个数。通常用图像中的像素总数\(n\)除直方图函数\(h(\cdot)\)的每个值来得到归一化的直方图\(P(r_k)=\frac{n_k}{n}, k=0, 1, \cdots, L-1\). 直观说来,\(P(r_k)\)给出了灰度级为\(r_k\)发生的概率估计值。

2. 方向梯度直方图(HOG)

图2. 方向梯度直方图

方向梯度直方图(Histogram of Oriented Gradient, HOG)最初用于行人检测,由Dalal等人[2]提出,现已被广泛应用于各种目标检测问题中。方向梯度直方图统计图像的梯度方向和幅度(大小)信息,非常适合描述图像的形状特征。

在实现时,方向梯度直方图首先将图像分解若干图像块(block),每个图像块中有若干细胞单元(cell),即矩形或环形的小图像块。然后计算每个细胞单元的方向梯度直方图,将同一图像块内的所有细胞单元的直方图连接起来形成该图像块的方向梯度直方图特征,并对其进行归一化。最后将图像所有图像块的特征描述连接起来就得到了整张图像的方向梯度直方图特征。

下面介绍一个计算方向梯度直方图的具体例子。如图2所示,首先对每个分割区域,取能够完全包含该分割区域的最小矩形块作为初始图像,并将该图像灰度化,归一化为\(72\times 72\)的图像。每个图像继续划分为\(2\times 2\)的图像块,每个图像块包含\(3\times 3\)的细胞单元,每个细胞单元包含\(6\times 6\)个像素。在每个细胞单元中,分别用\([-1, 0, 1]\)和\([1, 0, -1]^T\)的梯度算子对图像做卷积提取水平方向的梯度\(G_x\)和垂直方向的图像梯度\(G_y\)。然后梯度幅度\(M_G\)和方向\(\alpha_G\)可以通过下述公式计算

\(M_G = \sqrt{G_x^2 + G_y^2}\),

\(\alpha_G = \tan^{-1} \frac{G_y}{G_x}\).

然后,再将梯度分为8个区间,以梯度幅度作为每个区间的大小统计梯度直方图。在统计完每个细胞单元的直方图后,将每个图像块内的细胞单元直方图连接起来进行归一化,得到该图像块的统计直方图。最后,将所有图像块的直方图连接起来,得到原始图像的方向梯度直方图,维度为\(8\times 3 \times 3 \times 2 \times 2 = 288\)维,作为该图像的特征描述。

 

3. 局部二值模式(LBP)直方图

图3. 局部二值模式

局部二值模式(Local Binary Pattern,LBP)最早由Ojala等人[3]提出,是一种描述局部纹理特征的算子,最早应用于人脸识别、表情识别等问题。

局部二值模式算子的计算基于纹理单元(texture units),通过对多个纹理单元的分析就能得到一个图像区域的纹理谱(texture spectrum)。在局部二值模式中,一个纹理单元定义为一个\(3\times 3\)的图像窗口(图3(a)),由中心像素周围的8个值表征,其中每个值的取值只有\((0, 1)\),若周围像素的值大于中心像素,则取值为1,否则取值为0(图3(b)). 注意一个纹理单元所有的取值可能有\(2^8 = 256\)种。然后,对该窗口进行\(3\times 3\)的卷积操作,即给纹理单元中的8个值赋予权重(图3(c))。最后将纹理单元的8个值相加,得到该纹理单元的响应(图3(d), 响应为\(1+8+32+128 = 169 \))。

只实际应用中, 往往是针对一个图像计算每个像素的LBP响应, 最后再统计所有LBP响应的直方图.

 

转载于:https://www.cnblogs.com/platero/p/4238201.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/398547.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++从0到1的入门级教学(七)——指针

文章目录7 指针7.1 指针的基本概念7.2 指针变量的定义和使用7.3 指针所占内存空间7.4 空指针7.5 野指针7.6 void*指针7.7 指向指针的指针7.8 const修饰指针7.9 指针和数组7.10 指针和函数7 指针 指针是指向另外一种类型的符合类型,和引用类似,指针也实现…

C++从0到1的入门级教学(五)——字符串、向量和数组

文章目录5 字符串、向量和数组5.1 命名空间5.2 标准库string5.2.1 定义和初始化string对象5.2.2 string对象上的操作5.2.2.1 读取string对象5.2.2.2 风格5.2.2.3 使用getline读取一整行5.2.2.4 empty和size操作5.2.2.5 size_type类型5.2.2.6 比较string对象5.2.2.7 string对象的…

媒体格式分析之flv -- 基于FFMPEG

本来是应该先写一个媒体文件格式的简单讲解的,还没来得及写,以后再写。今天就先根据ffmpeg的flv.c的flv_demux这个结构体来讲解一下当前比较流行的媒体格式flv. FLV 是FLASH VIDEO的简称,FLV流媒体格式是随着Flash MX的推出发展而来的视频格式…

C++从0到1的入门级教学(三)——表达式和运算符

文章目录3 运算符3.1 表达式3.1.1 基本概念3.1.2 运算符和运算对象3.1.3 运算对象的转换3.1.4 左值和右值3.2 运算符3.2.1 算术运算符3.2.2 赋值运算符3.2.3 比较运算符3.2.4 逻辑运算符3.2.5 成员访问运算符3.2.6 条件运算符3 运算符 C提供了一套供操作内置数据类型的运算符&…

谈谈用SQLite和FMDB而不用Core Data

谈谈用SQLite和FMDB而不用Core Data 发布于:2014-04-22 11:22阅读数:4235 凭良心讲,我不能告诉你不去使用Core Data。它不错,而且也在变好,并且它被很多其他Cocoa开发者所理解,当有新人加入你的组或者需要别…

Idea工具开发 SpringBoot整合JSP(毕设亲测可用)

因为,临近毕业了,自己虽然也学了很多框架。但是,都是在别人搭建好的基础上进行项目开发。但是springboot的官方文档上明确指出不提倡使用jsp进行前端开发,但是在校期间只学了jsp作为前端页面。所以,废话不多说&#xf…

深度学习番外——Yolov5服务器环境搭建

文章目录1 服务器搭建yolov5环境1.1 创建环境1.2 跟随官方指引2 下载预训练权重3 推理4 测试1 服务器搭建yolov5环境 1.1 创建环境 首先先的在本地环境下搭建一个我们的环境,名字设为yolo5-6 conda create -n yolov5-6 python3.7#创建环境 conda activate yolov5…

机器学习实战(一)——员工离职预测

文章目录员工离职预测——逻辑回归的应用1 读取文件2 独热编码3 划分数据集4 归一化5 逻辑回归预测6 模型预测及评估员工离职预测——逻辑回归的应用 开始这个案例之前,请先点击这里的数据集进行下载:HR_comma_sep.zip - 蓝奏云 (lanzout.com) 1 读取文…

Mac版Anaconda安装Tweepy包

Anaconda官网给出的tweepy包安装方法:https://anaconda.org/conda-forge/tweepy 查阅Anaconda官方文档,可以通过以下控制台命令安装Tweepy包。 conda install -c conda-forge tweepy 在控制台执行后,系统可能会提示未找到conda指令&#xff…

iOS 证书与签名 解惑详解

iOS 证书与签名 解惑详解 分类: iPhone2012-06-06 19:57 9426人阅读 评论(1) 收藏 举报iosxcodecryptographyappleiphone测试目录(?)[] 教程截图: 下面是一篇有澳洲墨尔本的一名全职iOS开发者提供的文章。他在论坛上是一个很摩登的年轻人 – Adam Eberb…

Julia学习笔记(一)——入门

文章目录1 入门1.1 启动与退出1.1.1 启动1.1.2 退出1.2 编译文件1.3 变量1.3.1 基本介绍1.3.2 重定义1.3.3 变量名合法性1 入门 1.1 启动与退出 1.1.1 启动 在没有任何IDE的帮助下,使用cmd启动黑窗口来尝试julia是一种最简单的方法。我们称进入julia后的黑窗口为…

Linux学习宝典

文章目录1 虚拟机1.1 简介1.2 Linux版本1.2.1 内核1.2.2 发行版1.3 文件和目录1.3.1 单用户操作系统和多用户操作系统1.3.2 window文件系统1.3.3 Linux下的文件系统2 概述2.1 为什么要学习命令2.2 一些基本操作和说明3 指令和选项4 基础指令4.1 ls指令4.1.1 讲解4.1.2 选项4.1.…

《华为工作法读后感》

开篇 首先不得不说《华为工作法》是一本很好的书籍。感谢我们领导的照顾和用心,才使得我们又有了一些对社会 对工作 对生活等等的认知 。 之前的我是不怎么读书的,因为个人原因读的慢,每句话都要了解其中寓意之后才继续读下去,还有就是工作…

Redis发布与订阅——PUBLISH SUBSCRIBE

2019独角兽企业重金招聘Python工程师标准>>> Redis发布与订阅——PUBLISH & SUBSCRIBE 一般来说,发布与订阅(又称pub/sub)的特点是订阅者(listener)负责订阅频道(channel&…

Android 网络通信架构学习

最近跟着云课堂上的极客学院做安卓APP,学习了课程里面介绍的一种网络通信架构。清晰明了,比我自己东一块西一块拼凑出来的要好很多。在这里记录一下。 云课堂的连接:http://study.163.com/course/courseMain.htm?courseId917001 目录&#x…

网络爬虫(二)——Xpath和Selenium的使用

文章目录2 网络爬虫进阶2.1 Xpath2.1.1 Xpath解析原理2.1.2 信息提取2.1.2.1 获取所有结点2.1.2.2 获取子节点2.1.2.3 获取父节点2.1.2.4 获取文本2.1.3 属性匹配2.1.3.1 单个属性匹配2.1.3.2 多个属性匹配3.1 Selenium3.1.1 概述3.1.2 安装3.1.3 元素定位3.1.4 元素信息3.1.5 …

lintcode:买卖股票的最佳时机 III

买卖股票的最佳时机 III 假设你有一个数组,它的第i个元素是一支给定的股票在第i天的价格。设计一个算法来找到最大的利润。你最多可以完成两笔交易。 样例 给出一个样例数组 [4,4,6,1,1,4,2,5], 返回 6 解题 尝试参考买卖股票的最佳时机 II 提交运行发现错误&#…

团队项目计划BACKLOG

团队名称: 铁大老司机 团队成员: 组长:杨超群 组员:杨涛 杜文星 张家军 计划会议过程: 我们小组在周三下午进行了团队会议,会议召开在图书馆大厅,主要内容是进行项目的总体计划安排&#xff0…

C++从0到1的入门级教学(八)——通讯录管理系统

文章目录8 通讯录管理系统8.1 系统需求8.2 菜单功能8.3 退出功能8.4 添加联系人8.4.1 设计联系人结构体8.4.2 设计通讯录结构体8.4.3 main函数中创建通讯录8.4.4 封装添加联系人函数8.5 显示联系人8.5.1 封装显示联系人函数8.5.2 调用显示联系人函数8.6 删除联系人8.6.1 封装检…

【Data Cluster】真机环境下MySQL数据库集群搭建

真机环境下MySQL-Cluster搭建文档 MySQL Cluster简介 MySQL cluster 和 Oracle RAC 完全不同,它采用 无共享架构Shared nothing(shared nothing architecture)。整个集群由管理节点(ndb_mgmd),处理节点(mysqld)和存储节点(ndbd)组…