GAN 的内在漏洞,只看眼睛就能找出虚拟人脸?

本文转载自公众号夕小瑶的卖萌屋,专业带逛互联网算法圈的神操作

-----》我是传送门

关注后,回复以下口令:

回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读)

回复【入群】:加入卖萌屋深度学习/NLP/CV/搜广推等方向的技术交流与内推社群(大V、顶会审稿人云集)

回复【0511】:领取算法岗面试手册(刷offer神器)

回复【0424】:领取刷论文神器(挖掘每日、每月必刷重磅论文)

文 | 小戏

让我们先来看一组漂亮的小姐姐:

如果说,这四张照片里有一张并不是真人,而是由 GAN 生成的虚拟人像,大家可以看出是哪一张吗?

答案揭晓!在这一组照片中,由 GAN 生成的虚拟人像是二号小姐姐。可以看到,无论如何,目前由 GAN 及其衍生技术所生成的虚拟人像已经完全可以达到以假乱真的程度,其生成的人脸很难被人类从视觉上进行分辨。这自然是人像生成领域的一大进步,然而,这种可以被以极低成本大量生产的虚拟人像很容易被滥用于诸如虚假信息欺诈、社交媒体头像等等地方。

在这些场景下,如何从大量图片信息中分类出真实人脸与虚拟人像便成为了一个新的问题。其实初想或许会觉得这是一件很容易的二分类的问题,可以如果仔细一想一个二分类的判别器很难在 GAN 的训练机制下对分类真实人脸与虚拟人像取得良好的分类效果与鲁棒性

在这样的背景下,来自 UAlbany 的学者们另辟蹊径,提出了一种基于物理的方法,通过暴露出 GAN 模型本身与真实物理世界交互的缺陷来巧妙识别出真实人脸与虚拟人像的方法,即通过识别瞳孔的形状来判断人脸的真实与否。让我们来看看这篇论文吧!

论文题目:
EYES TELL ALL: IRREGULAR PUPIL SHAPES REVEAL GAN-GENERATED FACES

论文链接:
https://arxiv.org/abs/2109.00162

Arxiv访问慢的小伙伴也可以在 【夕小瑶的卖萌屋】订阅号后台回复关键词 【0915】 下载论文PDF~

从上图可以看到,我们的眼睛中心是虹膜与瞳孔,白色的区域是巩膜。对于一个健康的成年人而言,瞳孔的形状一般是圆形的。如上图下方左侧的图像,从正面看瞳孔趋于正圆。而论文作者发现,使用 GAN 等技术生成的人脸,其瞳孔形状是不规则的,放大由 GAN 生成的虚假人像可以清楚的看到,其瞳孔的形状呈现了明显的不规则。

论文作者推断,出现这种现象的根本原因在于,类似 GAN 等模型实质上缺乏对人眼结构的真正理解,换而言之,GAN 等模型在生成人像时,仍然缺乏从人类生理结构出发的约束。而这种机制上的缺陷为判别真实人像与虚拟人像提供了可能。

总的来说,论文提出的虚拟人像检测方法分为三步,如下图所示,对于一张输入的人像(a),首先需要定位到人像的瞳孔部分,得到如下图(b)的结果,接下来论文使用 EyeCool 算法从(b)中提取得到瞳孔掩膜(Pupil Mask),勾勒出瞳孔边界,如下图(c)所示,同时,论文提出了一种基于最小二乘的椭圆拟合方法,得到理想情况下真实人像的椭圆形瞳孔掩膜(d)(这里使用椭圆而非正圆的原因在于由于人像拍摄角度的印象,导致一般而言图片人像瞳孔趋于椭圆)。最后通过改进的考虑边界的 IoU 算法(BIoU)计算得到图像与理论上真实瞳孔形状之间的差异,从而判断输入人像是否是真实人像。

根据这种方法,作者选用 Flickr-Faces-HQ (FFHQ) 数据集的一千张人脸作为真实人脸,使用 StyleGAN2 创建了一千张虚拟人脸进行实验。

实验发现使用瞳孔形状可以有效的区分真实人脸与虚拟人脸,算法的 AUC 分数达到了0.94,其评估指标——即 BIoU 值在真实人脸与虚拟人脸之间的分布也呈现了较大的差异

我们可以看到,这篇论文提出了一个简单有效的方法区分真实人像与虚拟人像,这种方法在保证了准确率的同时,又提供了很好的可解释性,甚至抛开算法,这个思路对我们使用肉眼判断人像真实与否都有很好的实践价值

目前,无论是图像生成还是文字生成,其实质上都是一种自下而上的重复模仿,或多或少都缺乏一些如这篇论文所描述的一样真实人脸的生理约束或是自然语言领域的语法句法。如何在进行生成时能更多的考虑这样自上而下的先验信息,使得这种先验信息不仅可以作为评价真实与否的方式方法,更能作为图像或文字生成时的内在约束,或许是更为有意义的问题吧!

本文转载自公众号夕小瑶的卖萌屋,专业带逛互联网算法圈的神操作

-----》我是传送门

关注后,回复以下口令:

回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读)

回复【入群】:加入卖萌屋深度学习/NLP/CV/搜广推等方向的技术交流与内推社群(大V、顶会审稿人云集)

回复【0511】:领取算法岗面试手册(刷offer神器)

回复【0424】:领取刷论文神器(挖掘每日、每月必刷重磅论文)

萌屋作者:小戏

边学语言学边学NLP~

作品推荐

  1. 千呼万唤始出来——GPT-3终于开源!

  2. Linux 程 序 员 失 业 警 告

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478068.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 869. 重新排序得到 2 的幂(排序 全排列)

1. 题目 给定正整数 N ,我们按任何顺序(包括原始顺序)将数字重新排序,注意其前导数字不能为零。 如果我们可以通过上述方式得到 2 的幂,返回 true;否则,返回 false。 示例 1: 输入…

Spark性能优化指南——基础篇

在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作,应用范围与前景非常广泛。在美团•大众点评,已…

会议交流 | 京东硅谷首席科学家领衔,图机器学习峰会火热开启!

2021年10月10日,DataFunSummit:图机器学习在线峰会将如约而至。本次峰会的形式再次创新,由图与推荐与DataFun联合策划、京东硅谷研发中心 首席科学家 吴凌飞博士与腾讯大数据 AI平台总监 陶阳宇博士领衔参与,既包括前沿的学术分享…

召回 粗排 精排,如何各司其职?

文 | 水哥源 | 知乎saying1.AB测试几乎是系统改进的不二法则,算法做AB,开发做AB,产品做AB,运营更要做AB2.召回有点像一个甩锅侠,我不管我给的准不准,我就管我把潜在的能投的都吃进来就行3.其他环节想要提升…

LeetCode 558. 四叉树交集(递归)

1. 题目 四叉树是一种树数据,其中每个结点恰好有四个子结点:topLeft、topRight、bottomLeft 和 bottomRight。四叉树通常被用来划分一个二维空间,递归地将其细分为四个象限或区域。 我们希望在四叉树中存储 True/False 信息。四叉树用来表示…

Online Learning算法理论与实践

背景 Online Learning是工业界比较常用的机器学习算法,在很多场景下都能有很好的效果。本文主要介绍Online Learning的基本原理和两种常用的Online Learning算法:FTRL(Follow The Regularized Leader)[1]和BPR(Bayesia…

在斯坦福,做 Manning 的 phd 要有多强?

文 | 付瑶编 | 小轶博士的毕业论文是我们博士学位教育重要的一环,不仅仅是获得学位的最后一个难关,也是读博期间工作的总结展现。那么一个优秀的博士在读博期间会做出多少成果?ta 的博士论文又长什么样?今天,让我们打开…

LeetCode 655. 输出二叉树(二叉树高度二叉树遍历)

1. 题目 在一个 m*n 的二维字符串数组中输出二叉树,并遵守以下规则: 行数 m 应当等于给定二叉树的高度。列数 n 应当总是奇数。根节点的值(以字符串格式给出)应当放在可放置的第一行正中间。根节点所在的行与列会将剩余空间划分…

开源开放 | 计算机科学示意图问答数据集CSDQA(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/csdqa开源地址:http://zscl.xjtudlc.com:888/CSDQA/开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:西安交通大学(王绍伟、张玲玲、杨祎、胡欣、秦涛、魏笔凡、刘均…

数据驱动精准化营销在大众点评的实践

精准化营销一直以来都是互联网营销业务在细分市场下快速获取用户和提高转化的利器。在移动互联网爆发的今天,数据量呈指数增长,如何在移动和大数据场景下用数据驱动进行精准营销,从而提高营销效能,成为营销业务部门的主要挑战之一…

LeetCode 1104. 二叉树寻路(数学位运算)

1. 题目 在一棵无限的二叉树上,每个节点都有两个子节点,树中的节点 逐行 依次按 “之” 字形进行标记。 如下图所示,在奇数行(即,第一行、第三行、第五行……)中,按从左到右的顺序进行标记&am…

再介绍一篇最新的Contrastive Self-supervised Learning综述论文

文 | 对白源 | 对白的算法屋自监督学习(Self-supervised learning)最近获得了很多关注,因为其可以避免对数据集进行大量的标签标注。它可以把自己定义的伪标签当作训练的信号,然后把学习到的表示(representation&#…

论文浅尝 | 重新审视语言模型与知识库的关系

笔记整理:陈卓,浙江大学在读博士,主要研究方向为低资源学习和知识图谱论文链接:https://arxiv.org/pdf/2106.09231发表会议:ACL 2021动机这篇文章类似于是批判性的文章,反驳的之前EMNLP2019的一篇文章knowl…

Spark在美团的实践

本文已发表在《程序员》杂志2016年4月期。 前言 美团是数据驱动的互联网服务,用户每天在美团上的点击、浏览、下单支付行为都会产生海量的日志,这些日志数据将被汇总处理、分析、挖掘与学习,为美团的各种推荐、搜索系统甚至公司战略目标制定提…

LeetCode 958. 二叉树的完全性检验(层序遍历)

1. 题目 给定一个二叉树,确定它是否是一个完全二叉树。 百度百科中对完全二叉树的定义如下: 若设二叉树的深度为 h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第 h 层所有的结点都连续集中在…

论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答

笔记整理:陈永锐,东南大学博士论文链接:https://arxiv.org/pdf/2101.03737.pdf概述该论文处理多跳知识库问答(KBQA)任务,主要关注训练过程在中间步骤缺乏监督信号的挑战。由于这一挑战,多跳 KBQ…

打破情感分类准确率 80 分天花板!更加充分的知识图谱结合范式

文 | SeverusNLP的研究者们一直都在尝试,怎么样让模型像人类一样,学会“知识”。而最直观的想法莫过于将人类已经总结出来供机器解读的“知识体系”,及其嵌入表示作为额外的特征添加到NLP模型之中。至少,从直觉上看,将…

分布式块存储系统Ursa的设计与实现

引言 云硬盘对IaaS云计算平台有至关重要的作用,几乎已成为必备组件,如亚马逊的EBS(Elastic Block Store)、阿里云的盘古、OpenStack中的Cinder等。云硬盘可为云计算平台带来许多优良特性,如更高的数据可靠性和可用性、灵活的数据快照功能、更…

LeetCode 919. 完全二叉树插入器(层序遍历队列)

1. 题目 完全二叉树是每一层(除最后一层外)都是完全填充(即,结点数达到最大)的,并且所有的结点都尽可能地集中在左侧。 设计一个用完全二叉树初始化的数据结构 CBTInserter,它支持以下几种操作…

开源开放 | 中文相对复杂词汇识别数据集RCWI-Dataset(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/rcwi-dataset开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:北京语言大学(阙孟溪、张宇飞、于东)1. 摘要中文领域的词汇复杂度评估资源较为匮乏&#x…