人脸识别模型与人类视觉识别的对比——评估人脸识别模型存在偏见是否比人类的偏见大?

1. 概述

人脸识别系统是一个几十年来一直备受关注的研究领域。而且在过去的几年中。公司和政府一直在积极引入人脸识别系统,并且我们看到越来越多的机会可以看到人脸识别系统。例如,有的系统可以随便介绍,如搜索特定人的图像(图像搜索)的系统,以及在监控摄像头上检测通缉犯的有争议的系统等等。到有争议的应用,如在监控摄像头中检测通缉犯。然而,隐私和歧视性待遇在其引入后一直是全世界关注和批评的问题。
比如说2020年,非裔美国人乔治-弗洛伊德在美国明尼阿波利斯被一名警察掐住脖子死亡,引发了种族歧视和对警察使用的人脸识别系统的批评。在全球范围内。这一事件引发了对人脸识别技术鼓励种族主义和性别歧视的批评,一些大型高科技公司一个接一个。宣布他们将停止提供该技术或停止其开发。即使在今天,在高度公开和具有社会意义的应用中,例如在司法和警察机构中,使用人脸识别系统也是有争议的。
过去,人们对人脸识别系统的偏见进行了研究。然而,目前还没有从人脸识别系统的偏差是否 "大于人类 "的角度进行报道,这个问题一直没有答案。众所周知,人脸识别系统在整体性能和处理速度方面都优于人类,但其偏差尚不为人所知。
如果人脸识别系统的偏差远远大于人类的偏差,那么我们就需要谨慎地引入人脸识别系统。比如说。例如,如果它们被用于监控摄像机,那么目标人物将处于非常不利的地位。对某一种族或性别的误认可能会导致错误的逮捕。然而,如果该系统和人类一样好,它就不是一个理想的系统,但该技术能够比人类更快、更准确地识别人脸,因此很可能有可以实际引入的应用。了解人脸识别系统中偏见的特点也可以帮助我们考虑如何处理这些偏见并成功地处理它们。新的。应创建数据集,以创建一个人类和人脸识别模型针对两个任务,识别(1:N)和验证(1:1),以评估准确性(Accuracy)和偏见。
本文评估了人类和人脸识别系统之间的偏差,这些偏差以前没有被发现。为了公平地评估偏见,本文使用了 “InterRace”。
论文地址:https://arxiv.org/abs/2107.00651

2.InterRace数据集。

本文创建了一个新的数据集–InterRace,以准确评估偏见。现有的数据集很大,很容易使用,但包含了很多数据,阻碍了人脸识别模型的训练,如下图所示,因为不同的人被标记为同一个人,包含了模糊的图像,有时在一张图像中包含多个人。此外,类似的图像被包括在画廊和测试中,这包括了在准确性评估中可能导致不合理的高准确性的数据。此外,数据集中人口统计学标签的构成比例高度倾斜,使其难以准确验证偏差。在本文中,一个新的数据集InterRace是通过使用大型数据集LFW和CelebA进行人工纠正和分类而创建的,这些数据集通常用于训练和评估人脸识别模型。

每张图片上都标有出生日期,以及原籍国、性别和肤色。出生日期、原籍国和性别是根据维基百科、杂志和采访中的公开评论来标注的,并由几个人反复核对。肤色根据皮肤亮度被标记为六类,使用的标准是菲茨帕特里克量表。最终的数据集总共有7,447张图片,包含2,545个身份信息。它由以下部分组成。浅色皮肤的人 (菲茨帕特里克:。I-III)与1,744人有肤色较深的人(Fitzpatrick: IV-VI)是1,744个四至六级)是801,和1,660名男性和885名女性。为了进行绩效评估,从这个数据集中创建了具有平衡属性的子组。

3.实验条件

识别(1:N)和验证(1:1)实验是为了比较和评估人脸识别和人的识别性能和偏差。在验证中,一个人的图像和八个相同性别和肤色的人的图像被显示为一个源图像,总共有九个图像,以评估选择一个相同人的图像的性能。在验证(1:1)中,一个源图像显示一个相同的人的图像和一个相同性别和肤色的人的图像,并评估选择一个相同人的图像的性能。对显示的两个图像进行评估,看它们是否是同一个人。

创建问题时,为每项识别和验证任务选择了78人,为12种不同的性别(2种方式)和肤色(6种方式),为每个任务准备了936个问题。此外,从中删除了可以通过脸部周围环境(背景、衣服等)识别人的图像,最后准备了901个识别问题和905个验证问题。被要求在大约10分钟内回答36个Identificatio问题和72个验证问题。问题从事先准备好的901个识别问题和905个验证问题中随机抽取,每个属性信息有3个识别问题和6个验证问题(12种方式),以避免属性信息的偏差。每个任务中的前五个问题都被使用。一个有明显相同图像对的问题(‘相同图像’)。未能正确回答这个问题的受访者被排除在分析之外,因为他们没有认真对待这个问题。那些正确回答了注意力检查问题,但调查时间极短,不到四分钟的受访者也被排除在分析之外,因为他们没有认真对待这些问题。此外,每个受访者回答的每个任务的前三个问题也被排除在分析之外,因为受访者可能需要时间来适应问题的格式。有545名年龄在18岁或以上、居住在美国的受访者。与人类不同,人脸识别模型不存在疲劳引起的注意力问题,因此它们回答了所有901个识别问题和905个验证问题。,学术模型使用了ResNet-18、ResNet-50、。MobileFaceNet、NN(CosFace)和NN(ArcFace)在CelebA(9,277张卡片)上训练。注意,与验证中使用的InterRace身份没有重叠。商业模型(API)使用AWS Rekognition、Microsoft Azure和Megvii Face++,但AWS Rekognition和MicrosoftAzure评估识别(1:N)和验证(1:1),而Megvii Face++只评估验证(1:1)。

在对人类的调查是众包的,每个用户在每个任务中,注意力检查问题都是紧接着前五个问题和紧接着最后五个问题提出的:在识别任务中,来源和画廊是相同的图像问题;在验证任务中,来源和画廊显然是不同的图像对("浅色皮肤的女人 "和 “深色皮肤的男人”);在验证任务中,来源和画廊显然是同一图像对("深色皮肤的男人 "和 “浅色皮肤的女人”)。')和

在调查中,学术和商业模型(API)被用于人脸识别模型。

4.实验结果

评估的结果显示在以下两个表格中:第一。第一个显示了人类的结果。用于绩效评估。Logistic回归结果。它表明,即使在受访者的人口统计信息受到限制的情况下,也存在对受访者的性别和皮肤类型的偏见(逻辑回归)。第二个。的人脸识别模型。用于绩效评估。逻辑回归的结果。在被调查者的属性信息不受限制的情况下。对受试者的性别和皮肤类型有偏见(逻辑回归)。有关主体的属性信息是由q(qgender和qskin type)表示的,而被访者的人口统计信息由r(rgender和rskin类型)表示。

从上述情况来看,评估结果表明

  1. 在人类和人脸识别模型中,男性的结果更好。
  2. 人类和人脸识别模型对白种人都显示出更好的结果。
  3. 人们对人口属性与自己相似的人表现得更好。
  4. 商业模型(API)具有非常高的人脸识别准确率,并且在种族或性别方面没有明显的性能差异。

5.总结

总的来说,人脸识别模型的准确率(Accuracy)高于人类,t-test/logistic regression的结果也显示,它们与人类有相同程度的统计学上的优势偏差。
然而,需要注意的是,本文中的受访者只是众口一词的人。由于他们并不是人脸识别方面的专家,因此不一定能得出结论说他们的人脸识别模型比人类更好或可与之媲美。这只是一个需要注意的是,这些是美国非专家/普通人的结果。另外,人脸识别模型只限于本文作者选择的模型,所以不知道其他人脸识别模型是否会有类似的结果。应牢记这些要点。
尽管如此,与非专家/普通人相比,人脸识别模型的表现更好,并且有类似的偏差水平,因此其实施的好处是显著的。尽管司法机构和警察对它们的使用需要进一步研究。这些结果足以让我们了解人脸识别模型的优势和劣势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/19692.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Appium安装及配置(Windows环境)

在做app相关自动化测试,需要使用appium来做中转操作,下面来介绍一下appium的环境安装配置 appium官方文档:欢迎 - Appium Documentation 一、下载appium 下载地址:https://github.com/appium/appium-desktop/releases?page3 通…

网络安全岗秋招面试题及面试经验分享

Hello,各位小伙伴,我作为一名网络安全工程师曾经在秋招中斩获🔟个offer🌼,并在国内知名互联网公司任职过的职场老油条,希望可以将我的面试的网络安全大厂面试题和好运分享给大家~ 转眼2024年秋招又快到了金…

悬剑武器库5.04版

工具介绍 悬剑5 基于“悬剑网盘”精选工具集悬剑5“飞廉”云武器库制作。 操作系统:Windows 10 专业版 锁屏密码:secquan.org 解压密码: 圈子社区secquan.org 镜像大小:33.1GB 系统占用空间63.0 GB 镜像导入 下载镜像,文末…

TinTinLand Web3 + AI 共学月|五周上手,捕获浪潮碰撞下的无限机遇

近期,斯坦福大学人文x人工智能研究所(Stanford HAI)发布了《2024 年人工智能指数报告》(Artificial Intelligence Index Report 2024),指出当前人工智能的发展已全面改变社会的前沿风向,其中据 …

使用正则表达式分割字符串

自学python如何成为大佬(目录):https://blog.csdn.net/weixin_67859959/article/details/139049996?spm1001.2014.3001.5501 split()方法用于实现根据正则表达式分割字符串,并以列表的形式返回。其作用同字符串对象的split()方法类似,所不同的就是分割…

ODBC访问达梦数据库Ubuntu18.04 x86-x64(亲测有效)

ODBC访问达梦数据库Ubuntu18.04 x86-x64 第1步:安装unixodbc驱动,使用下面命令。第2步:拷贝已经安装好的达梦数据库驱动程序第3步:配置ODBC必要的参数文件,如下图第4步:设置环境变量第5步:连接测试 说明&am…

如何 使用Cubemax配置串口1.5得停止位

title: Cubemax配置串口1.5得停止位 tags: STM32HalCubemax Cubemax里面没有这个修改停止位为1.5得 我去配置函数里面也没看见 然后我去刨基础库 发现了 1.5倍 发现 原来就是 那个寄存器的值 改成 》 0x3000 后来自己修改几笔 HAL 库里面好像也有 改之 USART_CR2_STOP_Po…

【农村电商1004】 电子商务进农村示范县名单:全面数据集等你探索!

今天给大家分享的发表在国内顶级期刊金融研究的2023年论文《农村发展电子商务能减缓资本与劳动力要素外流吗?——以电子商务进农村综合示范案例为例》使用到的重要数据集电子商务进农村综合示范政策县数据,该论文采用了双重差分法和全国县域面板数据研究…

JDK JRE JVM 三者的关系

总结: 1. jdk 中 的 javac 编译器将 .java 文件编译为 .class 字节码文件 (编译) 2. jre 执行 .class 字节码文件 (运行) 3. jre 通过 jvm 运行程序,确保程序能够在不同平台上正确执行(实现跨平…

【Spring Cloud】微服务日志收集系统-ELK+Kafka

目录 任务背景本文相关文件资料Elasticsearch特性 LogstashKibanaELKELK的缺点引入消息中间件 ELKKafkaKafka概念 ELKKafka环境搭建1.将安装素材上传至服务器 cd /usr/local/soft2.防止Elasticsearch因虚拟内存问题启动失败3.创建镜像li/centos7-elasticsearch4.创建容器5.验证…

FOC - BLDC六步换相驱动原理

文章目录 1 . 前言2 . 电机旋转原理3 . BLDC特点4 . BLDC反电动势投影位置5 . BLDC换相时刻6 . BLDC换相注意事项7 . 小结 【全文大纲】 : https://blog.csdn.net/Engineer_LU/article/details/135149485 1 . 前言 无刷直流电机在这里区分为两种,一是永磁无刷直流电…

MedSAM 学习笔记(续):训练自定义数据集

1、下载官方权重 官方的预训练权重:https://dl.fbaipublicfiles.com/segment_anything/sam_vit_b_01ec64.pth 下载后保存在:work_dir/SAM/sam_vit_b_01ec64.pth 目录 2、摆放数据集 因为MedSAM 分割模型需要对3D数据集进行切片处理,也就是对nii.gz 数据处理成 npy 格式 …

掌握这三点软文营销秘诀,快速实现品牌用户增长

在信息爆炸的时代,品牌用户如何快速实现增长已成为每个企业发展的必经之虑。而软文营销,作为品牌推广中不可或缺的一环,也正逐渐受到越来越多企业的青睐。它与传统的硬广告相比,不会直接的进行产品销售,软文更注重与读…

iOS ------ 多线程 GCD

一,GCD简介 GCD是Apple开发的一个多线程的较新的解决方案。它主要用于优化应用程序以支持多核处理器以及其他对称处理系统。它是一个在线程池模式的基础上执行的并发任务。 为什么要使用GCD? GCD!可用于多核的并行运算GCD会自动利用更多的…

Linux配置java,maven,marshalsec环境

文章目录 一. Linux配置java环境1.下载jdk文件2.解压tar.gz文件3.设置java环境变量4.验证是否成功 二. Linux配置maven环境1.下载压缩包2.解压tar.gz3. 配置环境变量 三. Linux配置marshalsec环境 一. Linux配置java环境 1.下载jdk文件 mkdir /opt/javawget https://repo.hua…

STM32使用ST-LINK下载程序中需要注意的几点

使用keil5的ST-link下载界面 前提是ST-LINK已经连接好,(下图中是没有连接ST-link设备),只是为了展示如何查看STlink设备是否连接的方式 下载前一定设置下载完成后自启动 这个虽然不是必须,但对立即看到新程序的现象…

CVE-2020-0688 远程代码执行漏洞

CVE-2020-0688 远程代码执行漏洞 漏洞产生的主要原因就是在Exchange ECP组件中发现,邮件服务在安装的过程中不会随机生成秘钥,也就是说所有默认安装的Exchange服务器中的validationKey和decryptionKey的值都是相同的,攻击者可以利用静态秘钥…

【深度学习基础】使用Pytorch搭建DNN深度神经网络与手写数字识别

目录 写在开头 一、DNN的搭建 问题描述与数据集 神经网络搭建 模型训练 模型评估 模型复用 二、手写数字识别 任务描述 数据集 神经网络搭建 模型训练 模型评估 写在最后 写在开头 本文将介绍如何使用PyTorch框架搭建深度神经网络模型。实现模型的搭建、模…

USART串口外设

USART介绍 USART:另外我们经常还会遇到串口,叫UART,少了个S,就是通用异步收发器,一般我们串口很少使用这个同步功能,所以USART和UART使用起来,也没有什么区别。 其实这个STM32的USART同步模式&a…

创新产品认定进行第三方软件鉴定测试的原因

鉴定测试报告 随着科技的飞速发展,软件产品在各个领域的应用越来越广泛,对于软件产品的质量和安全性要求也越来越高。为了确保软件产品的质量和安全性,创新产品认定进行第三方软件鉴定测试成为了一种必要手段。 一、保障产品质量 第三方软…