人脸识别的多样化和稀疏关注对姿势变化和遮挡具有鲁棒性

DSA-Face: Diverse and Sparse Attentions for Face Recognition Robust to Pose Variation and Occlusion

一、创新点

        1.提出了成对自我对比注意力来强制模型提取不同的局部特征;

        2.设计注意力稀疏性损失是为了鼓励注意力图中的稀疏反应,阻止对分散注意力的区域的强调,同时鼓励对有区别的面部部位的关注。

二、模型

        提出了多样化和稀疏注意力,称为 DSA-Face。首先,散度损失旨在通过最大化每对注意力图之间的欧几里得距离来明确鼓励多个注意力图之间的多样性。因此,开发了成对自我对比注意(PSCA)来定位提供全面描述的不同面部部位。其次,提出了注意力稀疏损失(ASL)来鼓励注意力图中的稀疏响应,其中仅强调有区别的部分,而不鼓励分散注意力的区域(例如背景或面罩)。 DSA-Face 模型建立在 PSCA 和 ASL 的基础上,旨在学习多样化和稀疏的注意力,它可以提取多样化的判别性局部表示并抑制对噪声区域的关注。

        主要包括成对自我对比注意力(PSCA)和注意力稀疏损失(ASL)。首先,PSCA以自我对比的方式扩大了成对注意力距离。以这种方式,鼓励不同的注意力图相互排斥,从而定位不同的面部部位。PSCA 能够通过扩大成对注意力距离来提取不同的局部表示。由于每个图像细节都是在 PSCA 的指导下进行彻底挖掘的,因此如果没有明确的信号,则可能会提取一些噪声信息,例如背景或面罩。其次,ASL 将注意力图中分散区域的反应缩小到零。因此,仅强调有区别的部分,而不鼓励分散注意力的区域。

        总体框架如图3所示。主干CNN提取高级特征图以提取不同的局部特征。然后使用多个局部分支来提取不同的局部特征,这些特征由 PSCA 和 ASL 指导。提取局部特征并用于预测身份。

        总体框架:LPSCA 鼓励模型通过挖掘每个面部图像细节来定位不同的局部块。 LASL 引导模型在注意力图中做出稀疏响应,从而抑制对分散区域的强调。GAP和FC分别表示全局平均池化和全连接层。LCls 是学习判别特征的分类损失。 LANet是[8]中的空间注意力,其中h、w和c分别是特征图的高度、宽度和数量,r是缩减比率。

A. 成对自我对比注意力

        由于不同的本地分支使用相同的架构(即LANet),如果没有适当的指导,将会学习到高度相似的参数。这会导致注意力冗余问题。因此,应该设计一个多元化先验,旨在多元化多个本地分支机构。成对自我对比注意力(PSCA),它由散度损失 LPSCA 引导。损失定义如下:

        其中, Mi 和 Mj 分别表示由第 i 个和第 j 个局部分支生成的注意力图。 B是局部分支的总数,t是指超参数边距,dist(Mi,Mj)是Mi和Mj之间的欧氏距离。它最大化 Mi 和 Mj 之间的距离,并最小化 Mi 和 Mj 之间的距离。请注意,Mj + Mj` = E,其中 E 是一个全 1 元素的矩阵,这意味着 Mj 中响应高的区域在 Mj` 中响应低,反之亦然。

        对于 FR 中的局部表示,只有少数重要的局部斑块(例如鼻子、嘴巴、双眼或嘴巴)可以发挥至关重要的作用。因此,预计 Mi 和 Mj 在少数部分上有稀疏响应。另一方面,Mj` 在大的不重要区域周围有很高的响应。因此,dist(Mi , Mj`)往往比 dist (Mi , Mj ) 大得多。因此,我们使用一个系数(即α)来平衡这两个值。PSCA中不太可能出现注意力子集问题。通过这种方式,鼓励不同的地方分支相互排斥并提取更多样化的参数。

B. 注意力稀疏损失

        应该强调少数有区别的部分,并且应该抑制不重要或分散注意力的区域。因此,注意力响应应该是稀疏的。提出了一种注意力稀疏损失 LASL 来增强目标函数,其定义如下:

        其中B是当地分支机构的总数。 h 和 w 是注意力图 Mi 的高度和宽度。这个想法背后的主要动机是通过鼓励注意力图中的响应稀疏性来施加稀疏性惩罚损失。通过惩罚高响应区域,LASL 将注意力图中的值限制为零。通过这种方式,只有有用的面部部位才会做出反应,而分散注意力的区域则被抑制。

C. 总体损失

        为了监督网络学习判别性特征,应该使用分类损失LCls,包括CosFace损失(LCls-cosface)和ArcFace损失(LCls-arcface),它们可以生成判别性特征。 CosFace 损失的公式如下:

        其中 N 代表样本数。 m 是使角度空间中的决策裕度最大化的余弦裕度。样本 xi 被归一化并重新缩放为 s,属于 yi 类。

        ArcFace 损失中使用附加角边距惩罚 m 来鼓励类内紧凑性和类间差异:

在我们的方法中,总体损失计算如下:

        其中 LCls 是分类损失,监督网络学习受试者之间的区分。 LPSCA 鼓励不同面部部位的本地化。由于每个细节都是在图像中探索的,LCl 可能无法过滤掉一些分散注意力的区域,例如面罩或其他被遮挡的部分。为了解决这个问题,LASL 能够增强抑制噪声响应的能力。 λ和β控制这三种损失的平衡。

三、实验

        DSA-Face[a]采用ResNet-100[38]作为主干CNN,ArcFace 损失进行监督;

        DSA-Face[c]采用LS-CNN[8]作为主干CNN,由ArcFace 损失进行监督;

        DSA-Face[b]使用LS-CNN[8]作为主干 CNN,由CosFace 损失进行监督;

        DSA-Face[d]使用LS-CNN-177作为主干,CosFace 损失进行监督;

        我们在表 III 中展示了我们的 DSA-Face 模型在 M2N、M2M 和 MLFW 协议上的结果。M2N是指蒙面人脸与正常人脸之间的匹配。M2M是指蒙面与蒙面人脸之间的匹配。MLFW 表示masked LFW 数据集中的协议。错误接受率 (FAR) = 0.1、0.01 和 0.001 时的真实接受率 (TAR) 值, d 表示 Rank-1 准确度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/662498.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++ Web 编程

什么是 CGI? 公共网关接口(CGI),是一套标准,定义了信息是如何在 Web 服务器和客户端脚本之间进行交换的。CGI 规范目前是由 NCSA 维护的,NCSA 定义 CGI 如下:公共网关接口(CGI&…

passband, transition band and stopband

passband, transition band and stopband 引言正文 引言 这里给大家介绍一下 passband, transition band 和 stopband 的区别。 正文 如图所示,左侧和右侧比较高的部分是 passband。中间最低的部分是 stopband。而 passband 与 stopband 的连接区域被叫做 transit…

12款神级idea插件,让你少些80%代码

日常的业务功能开发,大部分情况下,核心代码差不多只占了项目的20%,剩下的80% 基本就是一些体力活,配置项等;这80%的代码,却消耗了我们大量的时间,而这部分代码,也不会对我们带来大的…

性能测试工具之工作原理及意义

随着软件系统的不断复杂和用户需求的不断增加,对于软件性能的要求也变得越来越高。性能测试工具成为确保应用程序在各种条件下都能提供卓越性能的关键组成部分。本文将深入解析性能测试工具的工作原理,以便更好地理解这些工具在保障系统性能方面的重要性…

vue实现带缩略图的轮播图(vue-awesome-swiper)

demo 请复制打开 https://download.lllomh.com/cliect/#/product/E125504451206525 如点击链接跳转失败请复制网址到浏览器打开 1.引入swiper和vue-awesome-swiper插件 npm install swiper4 --save npm install vue-awesome-swiper3 --save2.在main.js中引入: …

什么是接口的幂等性,如何保证接口的幂等性?

✅作者简介:大家好,我是Leo哥,热爱Java后端开发者,一个想要与大家共同进步的男人😉😉 🍎个人主页:Leo哥的博客 💞当前专栏: Java ✨特色专栏: MyS…

设备的层次结构 - 驱动程序的垂直层次结构

Windows操作系统是分层调用。其实在驱动程序中也可以是分层调用的。 驱动程序的垂直层次结构 不仅是WDM驱动,NT式驱动也可以分层,这主要是通过一个设备附加在另一个设备之上。因此,可以将WDM驱动模型看成是NT驱动模型的延伸。 设备的创建顺序…

appsmith安装手记:5.Sql server数据库容器再安装(yml)

上次安装好了sql server容器,但是appsmith创建数据源出现连接错误: [2024-01-30 00:25:52,186] userEmailttapp.com, sessionIdb99a2476-5c35-4a71-9e8e-25c9c3292cfa, threadboundedElastic-38, requestIdea262c1d-722b-4176-aac7-4b062d7066b6 - Opera…

迁移windows操作系统

最近有个朋友跟我说他电脑台卡了,我帮他大概看了下,归集原因磁盘还是机械硬盘,需要将他的电脑的磁盘的机械硬盘换一下,内存也比较小,4GB的,换一下,换成8GB的,本文只涉及到更换系统盘…

SimpleDateFormat 格式化 Date 时间戳

前言 Date 是 Java 中经常用来表示时间的类型,但将 Date 类型的数据发送给前端时,通常会呈现出乱码的状态,用户不宜理解,所以要通过 SimpleDateFormat 把 Date 类型的数据格式化为用户容易理解的格式 如下是 Date 的格式&#xff…

速过计算机二级python——第四讲:列表与字典

第四讲:列表与字典 列表定义定义索引切片 操作基本操作进阶操作 字典定义定义索引 操作基本操作进阶操作 二者转化列表->字典字典->列表 列表 定义 定义 列表是由一系列按顺序排列的元素组成,它可以包含任意的字母表中所有字母、数字或者字符。列…

clickhouse行转列的转换

1、原表select * from test 2、一个人的每个科目作为一行记录 改为一个人的所有科目作为一行记录 方式1 select name, sum(case when subject‘语文’ then score else 0 end) as chinese, sum(case when subject‘数学’ then score else 0 end) as math from test group by …

wangEditor v4的简单使用

当前文档是 wangEditor v4 版本的。 wangEditor v5 已经正式发布,可参考文档。 v5 发布之后,v4 将不再开发新功能。 介绍 English documentation wangEditor4 —— 轻量级 web 富文本编辑器,配置方便,使用简单。 官网&#…

TypeScript(十一) 类、对象

1. 类 1.1. 简介 TypeScript是面向对象的JavaScript。   类描述了所创建的对象共同的属性与方法。 1.2. 类的定义 class class_name { // 类作用域 }(1)定义类的关键字是class,后面紧跟类名,类可以包含以下几个模块&#xff…

PHP基础语法(上)

目录 前言 一、基础语法 1.1 标记 1.2 输出语句 1.2.1 echo 1.2.2 print 1.3 注释 1.3.1 单行注释 1.3.2 多行注释 1.4 标识符 1.5 关键字 二、数据与运算 2.1 常量 2.1.1 常量的定义和使用 2.1.2 预定义常量 2.2 变量 2.2.1 变量的赋值 2.2.2 超全局变量 2.3 数据类型 2.3.1 …

【2024美赛E题】985博士解题思路分析(持续更新中)!

【2024美赛E题】985博士解题思路分析! 加群可以享受定制等更多服务,或者搜索B站:数模洛凌寺 联络组织企鹅:936670395 以下是E题老师的解题思路(企鹅内还会随时更新文档): 2024美赛E题思路详解…

[网络安全] IIS----WEB服务器

一、 WEB服务器 WEB服务器 也叫网页服务器和 HTTP服务器使用协议: HTTP(端口:80) 或 HTTPS(端口443)浏览器:HTTP客户端网站: 一个或多个网页组成的集合 二、HTTP和HTTPS协议: HTTP : 是 HyperText Transfer Protocol(超文本传输协议)的简写,…

【CSS】css选择器和css获取第n个元素(:nth-of-type(n)、:nth-child(n)、first-child和last-child)

:nth-of-type、:nth-child的区别 一、css选择器二、:nth-of-type、:nth-child的区别:nth-of-type(n):选择器匹配属于父元素的特定类型的第N个子元素:nth-child(n):选择器匹配属于其父元素的第 N 个子元素,不论元素的类型:first-child&#xf…

字节大佬含泪吐血总结系列之 ARP 协议详解(网络层)

字节大佬含泪吐血总结系列之 ARP 协议详解(网络层) 原文地址:https://github.com/Snailclimb/JavaGuide 文章目录 字节大佬含泪吐血总结系列之 ARP 协议详解(网络层)MAC 地址ARP 协议工作原理同一局域网内的 MAC 寻址不同局域网内的 MAC 寻址 每当我们学习一个新的…

帅气的性能监控平台Grafana(Windows下使用Grafana监控系统指标与GPU指标)

帅气的性能监控平台Grafana(Windows下使用Grafana监控系统指标与GPU指标) 前情提要 系统环境准备 windows_exporter下载 nvidia_gpu_exporter下载 prometheus下载 Grafana下载 安装指导 windows_exporter安装与nvidia_gpu_exporter安装 promethe…