HOG特征人体检测

1. 引言

  HOG(Histogram of Oriented Gradient),即方向梯度直方图。它通过计算和统计局部区域的梯度方向直方图来构成特征,一般与SVM分类器结合用于目标的图像识别。由于人体姿势和外表的多变,在图像中检测人体是一项具有挑战性的工作,要在不同的光照和背景下都能清晰的识别出人体,首先需要的是一个强壮的特征集。而研究表明,局部归一化的HOG特征描述子相比边缘方向直方图、形状上下文等,在对人体的特征描述方面有更佳的表现。因此,目前主流的人体识别采用的是HOG+SVM。

2. HOG特征

  利用HOG特征的方法基本观点是:局部目标的外表和形状可以被局部梯度或边缘方向的分布很好的描述,即便我们不知道对应的梯度和边缘的位置。而这就引出一个问题,到底什么是梯度?在梯度(Gradient)与梯度下降法(Gradient descent)这篇文章中,对于梯度介绍的比较清楚。主要可以总结为:梯度是一个向量,即有方向有大小;它的方向是最大方向导数的方向,它的模为方向导数的最大值。通俗的讲,梯度指的是函数在变量空间的某一点处的最大变化率及其方向。

  在HOG特征提取中,我们首先将图像分割成小的细胞单元(cells),将各个单元视为变量空间中的一点,在每个细胞单元中计算其梯度方向直方图。考虑到对光照和阴影的不变性,对所得到的直方图进行对比度归一化,即将几个细胞单元组合成一个更大的块(blocks),并归一化块内的所有细胞单元。归一化后的块描述符即为HOG描述子,而后将一幅图像中所有块的描述子组合起来就形成了最终的特征向量,即HOG特征。然后就可以通过SVM分类器进行人体检测。

3. HOG特征提取

  使用某一特征进行目标识别,首先要对特征进行提取,而后才能进行匹配。HOG特征的提取主要分为以下几步:
  1. 图像归一化

    图像归一化,或者说是标准化,即标准化gamma和颜色空间(Gamma/Colour Normalization)。其主要目的是减少光照因素的影响,同时可以抑制噪声的干扰。

    Gamma压缩如下:

       

    其中,gamma<1在高灰度区域内,动态范围变小,图像对比度降低,图像整体灰度值变大,显得亮一些;gamma>1,在低灰度值区域内,动态范围变小,图像对比度降低,图像整体灰度值变小,变得暗淡。

  2. 计算像素点的梯度

    对图像中的每一个像素点,计算其水平和垂直方向的梯度及梯度方向值,计算公式如下:

       

    式中,分别表示像素点(x,y)处的水平方向梯度、垂直方向梯度、像素值。

    像素点处的梯度幅值和方向为:

       

  3. 分割细胞单元(cells)并构建直方图

    在这一步,将图像分割成8*8个像素的细胞单元(cells),采用若干个bin的直方图来统计这8*8像素的梯度信息(加权投影)

  4. 细胞单元组合块(blocks)及归一化梯度直方图

    由于局部光照的变化以及前景-背景对比度的变化,使得梯度强度的变化范围非常大。这就需要对梯度强度做归一化。归一化能够进一步地对光照、阴影和边缘进行压缩。首先将多个临近的cells组合成块,并求其梯度直方图向量,需要注意的是,块与块之间的细胞单元是共享的;然后采用不同的方法进行归一化处理,即将直方图向量中bin值的最大值限制为0.2以下,然后再重新归一化一次,归一化的方法主要有L2-norm、L1-norm、L1-sqrt和L2-Hys四种;块的选取主要有两种 形状:矩形和环形,在此就不赘述了。用于行人检测的最佳参数设置是:3×3细胞/区间、6×6像素/细胞、9个直方图通道。则一块的特征数为:3*3*9;

  5. 组合形成HOG特征向量

       最后一步就是将检测窗口中所有重叠的块进行HOG特征的收集,并将它们结合成最终的特征向量供分类使用。

  总结的流程图如下:

 

4. 总结

  以上即为HOG特征提取的原理及流程,事实上,在Open Cv中包含已经训练好的分类模型,足以实现一些基本的识别要求。至于HOG与SVM的结合,这里有一个行人数据集INRIA Person dataset,可用于SVM的训练,具体的SVM训练及识别方法以后有机会再更。

转载于:https://www.cnblogs.com/ethanda/p/10325101.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/425880.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Leedcode][JAVA][第45题][跳跃游戏 II][贪心算法]

【问题描述】[Leedcode][JAVA][第45题][跳跃游戏 II] 输入: [2,3,1,1,4] 输出: 2 解释: 跳到最后一个位置的最小跳跃数是 2。从下标为 0 跳到下标为 1 的位置&#xff0c;跳 1 步&#xff0c;然后跳 3 步到达数组的最后一个位置。【解答思路】 1. 动态规划 超时 第 1 步&…

大型动态应用系统平台系统架构?这些大家并不陌生

大型动态应用系统平台系统架构[多图] 动态应用&#xff0c;是相对于网站静态内容而言&#xff0c;是指以c/c、php、Java、perl、.net等服务器端语言开发的网络应用软件&#xff0c;比如论坛、网络相册、交友、BLOG等常见应用。动态应用系统通常与数据库系统、缓存系统、分布式…

c语言round函数能四舍五入吗,怎么利用round函数实现四舍五入?

Excel强大的制表功能让很多人都对它无比依赖&#xff0c;它也早已成为日常必备的工具。我们在办公室工作时&#xff0c;经常会遇到要用 Excel处理数字的情况&#xff0c;需要对其进行四舍五入。那么实现这一操作&#xff0c;我们需要使用哪些Excel函数呢&#xff1f;今日小编就…

InnoDB 事务/锁/多版本分析?你了解多少?

目录 • InnoDB事务 – 事务结构/功能 – XA事务/Group Commit – mini-transaction• InnoDB锁 – 锁结构/类型/功能 – 锁等待/死锁检测 – 自增序列锁(autoinc lock) – 半一致读(semi-consistent read) – 隐式锁(implicit lock) • InnoDB多版本 – ReadView –…

[剑指offer]面试题第[42]题[Leedcode][JAVA][第53题][最大子序和][动态规划][贪心][分治]

【问题描述】[第53题][最大子序和][中等] 给定一个整数数组 nums &#xff0c;找到一个具有最大和的连续子数组&#xff08;子数组最少包含一个元素&#xff09;&#xff0c;返回其最大和。示例:输入: [-2,1,-3,4,-1,2,1,-5,4], 输出: 6 解释: 连续子数组 [4,-1,2,1] 的和最大…

[Leedcode][JAVA][第983题][最低票价][动态规划]

【问题描述】[第983题][最低票价][中等] 在一个火车旅行很受欢迎的国度&#xff0c;你提前一年计划了一些火车旅行。在接下来的一年里&#xff0c;你要旅行的日子将以一个名为 days 的数组给出。每一项是一个从 1 到 365 的整数。火车票有三种不同的销售方式&#xff1a;一张为…

[Leedcode][JAVA][第572题][另一个树的子树]

【问题描述】 给定两个非空二叉树 s 和 t&#xff0c;检验 s 中是否包含和 t 具有相同结构和节点值的子树。s 的一个子树包括 s 的一个节点和这个节点的所有子孙。s 也可以看做它自身的一棵子树。示例 1: 给定的树 s:3/ \4 5/ \1 2 给定的树 t&#xff1a;4 / \1 2 返回…

LVS在淘宝环境中的应用

目录 1. LVS-简介 2. LVS-问题 3. LVS-fullnat 4. LVS-synproxy 5. LVS-cluster 6. LVS-performance 7. LVS-todo list 疑问引入:用户访问淘宝&#xff0c;访问哪台apache服务器 传统做法&#xff1a;DNS服务 四个问题 Q1&#xff1a;apache2 down&#xff0c;remove生…

android 开发艾特功能,Android Binder

Binder 是一种进程间通信机制&#xff0c;基于开源的 OpenBinder 实现&#xff1b;OpenBinder 起初由 Be Inc. 开发&#xff0c;后由 Plam Inc. 接手。从字面上来解释 Binder 有胶水、粘合剂的意思&#xff0c;顾名思义就是粘和不同的进程&#xff0c;使之实现通信。为什么 Act…

C# Json转对象

第一步&#xff0c;项目添加negut的搜索Newtonsoft.Json&#xff0c;安装第一个&#xff1a;如图所示&#xff1a; 安装以后&#xff0c;自动引用。 private ObservableCollection<Traffic> m_listcls; var json JsonConvert.DeserializeObject<List<Traffic>&…

Dubbo开源

什么是Dubbo? 分布式服务框架 – 远程服务调用 • Ne/y/Mina/Grizzly • RMI/Hessian/WebService – 服务动态发现 • Zookeeper/Redis – 集群软负载均衡 • Random/RoundRobin – 集群失败容错 • Failove…

[Leedcode][JAVA][第470题][Ran7()实现Rand10()]

【问题描述】[Leedcode][JAVA][第470题][Ran7()实现Rand10()] 已有方法 rand7 可生成 1 到 7 范围内的均匀随机整数&#xff0c;试写一个方法 rand10 生成 1 到 10 范围内的均匀随机整数。不要使用系统的 Math.random() 方法。示例 1:输入: 1 输出: [7] 示例 2:输入: 2 输出: …

推荐系统?淘宝?

目录 • 推荐系统概念 • 淘宝的数据 • 淘宝推荐系统应用场景 • 淘宝推荐系统核心算法 • 淘宝推荐系统的设计 • 推荐系统概念 • 淘宝的数据 • 淘宝推荐系统应用场景 • 淘宝推荐系统核心算法 • 淘宝推荐系统的设计 推荐系统定义 维基百科&#xff1a; form…

android studio 无法输入中文,Android Studio 升级到3.0后输入法中文状态下无法选词的终极解决方案...

AndroidStudio终于出3.0正式版了&#xff0c;内置了kotlin(虽然我安了插件一直能用)。一直忍着没敢下rc版的好奇猫&#xff0c;总算装了正式版。当然&#xff0c;伴随每次大版本更新&#xff0c;总有一些恼人的后遗症&#xff0c;其中以gradle问题最多。AS3.0要求gradle版本在3…

java学习(174):constructor类反射编程

//class反射编程 //定义一个学生类 public class test124 {public String name;protected int age;double height;private double money;public void setName(String name) {this.name name;}public String getName() {return name;}public int getAge() {return age;}public …

[国密算法]一文了解国密算法

国密算法概述1 SM1对称密码2 SM2椭圆曲线公钥密码算法3 SM3杂凑算法4 SM4对称算法5 SM7对称密码6 SM9标识密码算法7 ZUC祖冲之算法总结算法名称算法类别应用领域特点SM1对称密码算法芯片分组长度、密钥长度均为 128 比特SM2公钥密码算法加密ECC椭圆曲线密码机制256位 相比RSA&a…

java学习(175):method类反射机制

//class反射编程 //定义一个学生类 public class test124 {public String name;protected int age;double height;private double money;public void setName(String name) {this.name name;}public String getName() {return name;}public int getAge() {return age;}public …

java-web的mybatis的学习

idea开发必须是把Mapper文件与配置文件放到Resources标记的classpath目录下&#xff0c;eclips好像放到哪都行指定好路径就可以了&#xff0c; maven里面做好配置resources的路径&#xff0c;不然更新依赖 工程结构标记又没了 <build> <resources> <resour…

[Leedcode][JAVA][第85题][第221题][最大正方形][动态规划]

【问题描述】[第221题][最大正方形][中等] 在一个由 0 和 1 组成的二维矩阵内&#xff0c;找到只包含 1 的最大/长方形正方形&#xff0c;并返回其面积。示例:输入: 1 0 1 0 0 1 0 1 1 1 1 1 1 1 1 1 0 0 1 0 长方形 输出: 6 正方形 输出: 4【解答思路】 1. 长方形 暴力 时间…

次时代各制作插件使用方案以及技巧 包括UV 烘焙 减面等

次世代游戏的到来&#xff0c;使游戏行业向前迈进了一大步。次世代本来代表的是拥有更高cpu硬件设施的电视游戏&#xff0c;即戴着头盔能感到wii拳击的震动、拿着拳套能感应阴森恐怖的氛围。绝对让玩家融入气氛的Xbox360的《生化危机5》还带有场景破坏&#xff0c;能打下一片墙…