视觉中的经典图像特征小结(一): 颜色直方图, HOG, LBP

[普兒原创, 如有错误和纰漏欢迎指正. 更新中...]

 1. 颜色直方图

颜色空间在本质上是定义在某种坐标系统下的子空间,空间中的每一个坐标表示一种不同的颜色。颜色空间的目的在于给出某种颜色标准,使得不同的设备和用途都能对颜色有一致的描述。这里主要介绍两种不同的颜色空间,包括RGB颜色空间和CIE-Lab颜色空间,如图4-2所示。

 

 (a)RGB颜色空间; (b)CIE-Lab颜色空间

图1 颜色空间示意图

 

RGB颜色空间是定义在三维笛卡尔坐标系中的颜色模型,每一种颜色定义在3个主颜色分量红(R)、绿(G)、蓝(B)上。如图1(a)所示,立方体表示RGB空间,3个主颜色分量分别在立方体位于坐标轴的角上,3个分量在虚线表示的立方体对角线上的取值相等,表示灰度值空间。坐标原点表示黑色,3个分量在距离原点最远的角上取得最大值,表示白色。通过RGB颜色空间表示的图像由分别由红、绿、蓝3个通道的图像组成。当图像被显示出来时,3个通道的颜色被组合起来表示RGB颜色空间中的一种颜色。

与RGB颜色空间不同,CIE-Lab颜色空间由国际照明委员会在1976年正式提出,旨在提供一种基于人类视觉感知特性的颜色系统,能通过数字的方式度量人体感知到的颜色的差别[1]。CIE-Lab颜色空间由明度(luminance)分量、a分量和b分量表示。其中明度分量表示颜色的灰度,a和b分量共同定义了色调和饱和度,a分量表征从红(+a)到绿(-a)的颜色,b分量表征从黄(+b)到蓝(-b)的颜色,且a、b分量相互垂直,如图4-2(b)所示。直观说来,CIE-Lab颜色空间是基于人的主观感知定义的,例如没有“偏红的绿色”和“偏蓝的黄色”,是用于替换过分简化的RGB直角坐标颜色空间的折中方案。

本文在RGB和CIE-Lab颜色空间的各通道图像上提取直方图作为图像区域的颜色特征。所谓直方图,是指强度为\([0, L-1]\)范围的图像的离散函数\(h(r_k)=n_k\),其中\(r_k\)表示第\(k\)级灰度,\(n_k\)是图像中灰度级为\(r_k\)的像素个数。通常用图像中的像素总数\(n\)除直方图函数\(h(\cdot)\)的每个值来得到归一化的直方图\(P(r_k)=\frac{n_k}{n}, k=0, 1, \cdots, L-1\). 直观说来,\(P(r_k)\)给出了灰度级为\(r_k\)发生的概率估计值。

2. 方向梯度直方图(HOG)

图2. 方向梯度直方图

方向梯度直方图(Histogram of Oriented Gradient, HOG)最初用于行人检测,由Dalal等人[2]提出,现已被广泛应用于各种目标检测问题中。方向梯度直方图统计图像的梯度方向和幅度(大小)信息,非常适合描述图像的形状特征。

在实现时,方向梯度直方图首先将图像分解若干图像块(block),每个图像块中有若干细胞单元(cell),即矩形或环形的小图像块。然后计算每个细胞单元的方向梯度直方图,将同一图像块内的所有细胞单元的直方图连接起来形成该图像块的方向梯度直方图特征,并对其进行归一化。最后将图像所有图像块的特征描述连接起来就得到了整张图像的方向梯度直方图特征。

下面介绍一个计算方向梯度直方图的具体例子。如图2所示,首先对每个分割区域,取能够完全包含该分割区域的最小矩形块作为初始图像,并将该图像灰度化,归一化为\(72\times 72\)的图像。每个图像继续划分为\(2\times 2\)的图像块,每个图像块包含\(3\times 3\)的细胞单元,每个细胞单元包含\(6\times 6\)个像素。在每个细胞单元中,分别用\([-1, 0, 1]\)和\([1, 0, -1]^T\)的梯度算子对图像做卷积提取水平方向的梯度\(G_x\)和垂直方向的图像梯度\(G_y\)。然后梯度幅度\(M_G\)和方向\(\alpha_G\)可以通过下述公式计算

\(M_G = \sqrt{G_x^2 + G_y^2}\),

\(\alpha_G = \tan^{-1} \frac{G_y}{G_x}\).

然后,再将梯度分为8个区间,以梯度幅度作为每个区间的大小统计梯度直方图。在统计完每个细胞单元的直方图后,将每个图像块内的细胞单元直方图连接起来进行归一化,得到该图像块的统计直方图。最后,将所有图像块的直方图连接起来,得到原始图像的方向梯度直方图,维度为\(8\times 3 \times 3 \times 2 \times 2 = 288\)维,作为该图像的特征描述。

 

3. 局部二值模式(LBP)直方图

图3. 局部二值模式

局部二值模式(Local Binary Pattern,LBP)最早由Ojala等人[3]提出,是一种描述局部纹理特征的算子,最早应用于人脸识别、表情识别等问题。

局部二值模式算子的计算基于纹理单元(texture units),通过对多个纹理单元的分析就能得到一个图像区域的纹理谱(texture spectrum)。在局部二值模式中,一个纹理单元定义为一个\(3\times 3\)的图像窗口(图3(a)),由中心像素周围的8个值表征,其中每个值的取值只有\((0, 1)\),若周围像素的值大于中心像素,则取值为1,否则取值为0(图3(b)). 注意一个纹理单元所有的取值可能有\(2^8 = 256\)种。然后,对该窗口进行\(3\times 3\)的卷积操作,即给纹理单元中的8个值赋予权重(图3(c))。最后将纹理单元的8个值相加,得到该纹理单元的响应(图3(d), 响应为\(1+8+32+128 = 169 \))。

只实际应用中, 往往是针对一个图像计算每个像素的LBP响应, 最后再统计所有LBP响应的直方图.

 

转载于:https://www.cnblogs.com/platero/p/4238201.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/398547.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++从0到1的入门级教学(七)——指针

文章目录7 指针7.1 指针的基本概念7.2 指针变量的定义和使用7.3 指针所占内存空间7.4 空指针7.5 野指针7.6 void*指针7.7 指向指针的指针7.8 const修饰指针7.9 指针和数组7.10 指针和函数7 指针 指针是指向另外一种类型的符合类型,和引用类似,指针也实现…

urllib库的使用

#使用urllib库,将langlang2017全站网页请求并保存 #1、引入模块 from urllib import request from urllib import error#2、操作 #(1)创建url base_url "http://www.langlang2017.com/route.html"try:# (2)…

一个显示日期的工具类

一个显示日期的工具类 .h文件 #import <Foundation/Foundation.h>interface TimeUtil : NSObject (NSString*)getTimeStr1:(long long)time;(NSString*) getTimeStrStyle1:(long long)time;(NSString*)getTimeStr1Short:(long long)time;(NSString*) getTimeStrStyle2:(l…

【leetcode】Median of Two Sorted Arrays

题目简述&#xff1a; There are two sorted arrays A and B of size m and n respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (mn)). 解题思路&#xff1a; 这本身是个很简单的题目&#xff0c;但是题目要求他的复…

C++从0到1的入门级教学(五)——字符串、向量和数组

文章目录5 字符串、向量和数组5.1 命名空间5.2 标准库string5.2.1 定义和初始化string对象5.2.2 string对象上的操作5.2.2.1 读取string对象5.2.2.2 风格5.2.2.3 使用getline读取一整行5.2.2.4 empty和size操作5.2.2.5 size_type类型5.2.2.6 比较string对象5.2.2.7 string对象的…

媒体格式分析之flv -- 基于FFMPEG

本来是应该先写一个媒体文件格式的简单讲解的&#xff0c;还没来得及写&#xff0c;以后再写。今天就先根据ffmpeg的flv.c的flv_demux这个结构体来讲解一下当前比较流行的媒体格式flv. FLV 是FLASH VIDEO的简称&#xff0c;FLV流媒体格式是随着Flash MX的推出发展而来的视频格式…

Linux命令整合之find

描述Linux下find命令在目录结构中搜索文件&#xff0c;并执行指定的操作。用法find 路径 -命令参数 [输出形式]参数说明路径&#xff1a;告诉find在哪儿去找你要的东西&#xff0c;命令参数&#xff1a;参数很多下面会说到输出形式&#xff1a;输出形式很多&#xff0c;-print,…

[HEOI2015]兔子与樱花

题目描述 很久很久之前&#xff0c;森林里住着一群兔子。有一天&#xff0c;兔子们突然决定要去看樱花。兔子们所在森林里的樱花树很特殊。樱花树由n个树枝分叉点组成&#xff0c;编号从0到n-1&#xff0c;这n个分叉点由n-1个树枝连接&#xff0c;我们可以把它看成一个有根树结…

C++从0到1的入门级教学(三)——表达式和运算符

文章目录3 运算符3.1 表达式3.1.1 基本概念3.1.2 运算符和运算对象3.1.3 运算对象的转换3.1.4 左值和右值3.2 运算符3.2.1 算术运算符3.2.2 赋值运算符3.2.3 比较运算符3.2.4 逻辑运算符3.2.5 成员访问运算符3.2.6 条件运算符3 运算符 C提供了一套供操作内置数据类型的运算符&…

谈谈用SQLite和FMDB而不用Core Data

谈谈用SQLite和FMDB而不用Core Data 发布于&#xff1a;2014-04-22 11:22阅读数&#xff1a;4235 凭良心讲&#xff0c;我不能告诉你不去使用Core Data。它不错&#xff0c;而且也在变好&#xff0c;并且它被很多其他Cocoa开发者所理解&#xff0c;当有新人加入你的组或者需要别…

Idea工具开发 SpringBoot整合JSP(毕设亲测可用)

因为&#xff0c;临近毕业了&#xff0c;自己虽然也学了很多框架。但是&#xff0c;都是在别人搭建好的基础上进行项目开发。但是springboot的官方文档上明确指出不提倡使用jsp进行前端开发&#xff0c;但是在校期间只学了jsp作为前端页面。所以&#xff0c;废话不多说&#xf…

深度学习番外——Yolov5服务器环境搭建

文章目录1 服务器搭建yolov5环境1.1 创建环境1.2 跟随官方指引2 下载预训练权重3 推理4 测试1 服务器搭建yolov5环境 1.1 创建环境 首先先的在本地环境下搭建一个我们的环境&#xff0c;名字设为yolo5-6 conda create -n yolov5-6 python3.7#创建环境 conda activate yolov5…

计算球体积

Problem Description 根据输入的半径值&#xff0c;计算球的体积。Input 输入数据有多组&#xff0c;每组占一行&#xff0c;每行包括一个实数&#xff0c;表示球的半径。Output 输出对应的球的体积&#xff0c;对于每组输入数据&#xff0c;输出一行&#xff0c;计算结果保留三…

机器学习实战(一)——员工离职预测

文章目录员工离职预测——逻辑回归的应用1 读取文件2 独热编码3 划分数据集4 归一化5 逻辑回归预测6 模型预测及评估员工离职预测——逻辑回归的应用 开始这个案例之前&#xff0c;请先点击这里的数据集进行下载&#xff1a;HR_comma_sep.zip - 蓝奏云 (lanzout.com) 1 读取文…

Mac版Anaconda安装Tweepy包

Anaconda官网给出的tweepy包安装方法&#xff1a;https://anaconda.org/conda-forge/tweepy 查阅Anaconda官方文档&#xff0c;可以通过以下控制台命令安装Tweepy包。 conda install -c conda-forge tweepy 在控制台执行后&#xff0c;系统可能会提示未找到conda指令&#xff…

iOS 证书与签名 解惑详解

iOS 证书与签名 解惑详解 分类&#xff1a; iPhone2012-06-06 19:57 9426人阅读 评论(1) 收藏 举报iosxcodecryptographyappleiphone测试目录(?)[] 教程截图&#xff1a; 下面是一篇有澳洲墨尔本的一名全职iOS开发者提供的文章。他在论坛上是一个很摩登的年轻人 – Adam Eberb…

Julia学习笔记(一)——入门

文章目录1 入门1.1 启动与退出1.1.1 启动1.1.2 退出1.2 编译文件1.3 变量1.3.1 基本介绍1.3.2 重定义1.3.3 变量名合法性1 入门 1.1 启动与退出 1.1.1 启动 在没有任何IDE的帮助下&#xff0c;使用cmd启动黑窗口来尝试julia是一种最简单的方法。我们称进入julia后的黑窗口为…

从地址栏中敲入一个网址,到网页显示出来,这个过程经历了什么

这个问既考察技术深度又考察技术广度&#xff0c;其实要答好是相当难的。 在地址栏中敲入一个网址后&#xff0c;浏览器向服务器发出请求&#xff0c;请求对应网址页面的内容&#xff1b;然后服务器收到请求以后对这个请求进行处理&#xff0c;处理之后以HTML文件的形式把处理结…

mac上nginx静态页面访问403

第一天配置好的nginx可以正常的访问静态页面&#xff0c;第二天通过网络云盘下载的index.html文件之后&#xff0c;再次访问出现了403forbidden的问题。 查看文件的权限&#xff1a; -rwxr-x--x 1 hu staff 6351 4 12 21:10 bluePlan.js -rwxr-x--x 1 hu staff 113 4 12…

PHP JSON 操作总结

PHP JSON 操作总结 原文:PHP JSON 操作总结由于JSON可以在很多种程序语言中使用&#xff0c;所以我们可以用来做小型数据中转&#xff0c;如&#xff1a;PHP输出JSON字符串供JavaScript使用等。在PHP中可以使用 json_decode() 由一串规范的字符串解析出 JSON对象&#xff0c;使…