[2020-ECCV]PIPAL-a Large-Scale Image Quality Assessment Dataset for Perceptual Image Restoration论文简析

[2020-ECCV] PIPAL: a Large-Scale Image Quality Assessment Dataset for Perceptual Image Restoration 论文简析

论文:https://arxiv.org/abs/2007.12142
代码及数据集:https://github.com/HaomingCai/PIPAL-dataset

概述

本文认为随着图像重建(IR)算法的快速发展(特别是一些基于GAN的模型的出现),使得现有的图像质量评价(IQA)的方法已经不能很好地评估这些图像重建方法。因此,IQA方法应当随着IR算法一起演进更新。基于此,本文提出了一个新的大型图像感知评估数据集PIPAL,并且该数据集使用了Elo评分系统来对两两图像进行比较,更新评分,这使得该数据集的评分标签可以不断地更新,以适应将来可能会出现的新型IR算法。并且,本文基于PIPAL数据集为IQA和IR提出了一种新的指标。结果显示本文的数据集和指标能更好地评价最近基于GAN的IR算法。

其借用的Elo等级分系统的一个好处是:每次接收评分者给出的标签时,并不需要评分者直接给出MOS分的绝对数值,而是请评分者在两张图像中选出较好的一张即可。这无疑降低了受访评分者评分的难度,并大大提高了了收集评分的可信度。毕竟,按照人类的主观感知对一张图像直接给出数值分数还是一件相当tricky的事情。受到个人状态、心情等方面的影响,同一个人在不同的时间对同一张图像的打分可能是不同的,但是两张图像中哪一张更好一点的判断基本是不会变的。

摘要

图像质量评价(IQA)是图像重建(IR)算法发展的关键因素。最近的基于GAN的图像重建方法取得了较大的性能提升,但是量化评估仍然是较大的挑战。尤其是,我们观察到感知质量和评估结果之间越来越不一致。由此,我们提出两个问题:一是现有的IQA方法能否客观地评估最近的IR算法?二是当致力于打败最新的benchmark,我们是否真的得到了更好地IR算法?为了回答这些问题,和促进IQA模型的发展,我们提出了一个大规模的IQA数据集,叫做Peceptual Image Processing Algorithms(PIPAL) 数据集。特别之处在于,本数据集是基于GAN的方法的结果,这在之前的数据集中是没有的。我们收集了超过113万条人类判断来使用更可靠的“Elo系统”为PIPAL图像分配主观分数。基于PIPAL,我们为IQA和SR模型提出了一种新的指标。我们的结果显示现有的IQA方法并不能很好地评估基于GAN的IR算法。使用合适的评估方法是很重要的,IQA方法应当随着IR算法的发展一起更新。最后,我们通过引入 anti-aliasing pooling 来提高基于GAN畸变的IQA网络的性能。实验证明了该方法的有效性。

PIPAL数据集

本文从以下三个方面来介绍PIPAL数据集:

  • 参考图像的收集
  • 降质方法的质量和种类
  • 主观分数的收集

参考图像的收集

从高质量图像数据集DIV2K和Flickr2K,更关注与较难重建的部分,比如高频纹理信息。我们将这些表示纹理的部分块从所选图像中切下来。所选的图像包含了各种不同的真实世界的纹理信息,包括但不限于:建筑物、动植物、人脸、文字和合成的纹理等。切下来的图像的尺寸为288。

图像降质

本数据集中有40中降质方法,分为四个子类。总览如下表:

在这里插入图片描述

  • 第一个子类包含了许多传统的降质方法。比如模糊、噪声、压缩等,即一些低层的图像编辑操作。
  • 第二个子类是一些现有算法的超分结果。这些超分算法又分为三类。传统算法、PSNR导向的算法和基于GAN的算法。传统算法在某种程度上可以理解为细节上的损失;PSNR导向的算法通常是基于深度模型的,它们比传统算法有更锐利的边缘和更好的PSNR表现;基于GAN的算法通常与细节损失的质量不太匹配,因为它们通常包含类纹理噪声,或噪声的质量,类纹理噪声在外观上与GT相似但不准确。 基于 GAN 的失真示例如下图所示。测量不正确但相似特征的相似性对于感知超分的发展非常重要。

在这里插入图片描述

  • 第三个子类包括几种去噪算法的输出。 与图像 SR 类似,所使用的去噪算法包含基于模型的算法和基于深度学习的算法。 除了高斯噪声,我们还包括 JPEG 压缩噪声去除结果。
  • 最后,我们包括混合退化的恢复结果。 如之前的工作所述,依次执行去噪和 SR 将带来新的伪影或不同的模糊效果。

总之,我们有40中降质类型和116中不同的降质等级,总共29K张降质图像。

Elo等级分系统

前人的MOS得分方法

给定失真图像,为每个失真图像提供平均意见得分 (MOS)。

  1. 早期的数据集使用“五级评级”方法,其中图像直接分为五个类别。 当评分者没有足够的经验时,使用这种方法会导致巨大的偏差。
  2. 后来,数据集通常使用瑞士评级系统通过大量成对选择来收集 MOS。 然而,这种成对 MOS 的计算方式使其依赖于特定的数据集,这意味着当两个失真图像包含在两个不同的数据集中时,它们的 MOS 分数可能会发生显着变化。
  3. 为了消除这种集合依赖效应,又有人提出仅基于成对偏好的概率来构建数据集。这种方法可以提供更准确的倾向概率。 但是,它不仅需要大量的人工判断,而且无法提供失真类型的 MOS。

ELo等级分系统

在本文提出的数据集中,我们采用 Elo 评分系统将成对偏好概率和评分系统结合在一起。 Elo 系统的使用不仅提供了可靠的人工评级,而且还减少了所需人工判断的次数。

Elo 评分系统是一种基于统计的评分方法,最初被提出用于评估国际象棋选手的水平。 我们假设两个图像 IAI_AIAIBI_BIB 之间的用户偏好遵循由他们的 Elo 分数参数化的逻辑分布logistic distribution。 给定他们的 Elo 分数 RAR_ARARBR_BRB,期望的偏好概率如下:
PA>B=11+10(RB−RA)/M,PB>A=11+10(RA−RB)/MP_{A>B}=\frac{1}{1+10^{(R_B-R_A)/M}},\ \ \ P_{B>A}=\frac{1}{1+10^{(R_A-R_B)/M}} PA>B=1+10(RBRA)/M1,   PB>A=1+10(RARB)/M1
其中 PA>BP_{A>B}PA>B 表示一个评分者会相比与 IBI_BIB 更喜欢 IAI_AIA 的概率。MMM 是分布的一个参数,在我们的数据集中 M=400M=400M=400 。一旦评分者作出了选择,我们会根据以下规则为 IAI_AIAIBI_BIB 更新Elo分数:
RA′=RA+K×(SA−PA>B),RB′=RB+K×(SB−PB>A)R'_A=R_A+K\times (S_A-P_{A>B}), \ \ \ R'_B=R_B+K\times (S_B-P_{B>A}) RA=RA+K×(SAPA>B),   RB=RB+K×(SBPB>A)
其中 KKK 是一次判断的变化步长,设置为16。SAS_ASA 表示是否选择 IAI_AIA:如果IA获胜,SA=1S_A=1SA=1,如果 IAI_AIA 失败,SA=0S_A=0SA=0。 通过数千次人工判断,每个扭曲图像的 Elo 分数都会收敛。 最后几个步骤的 Elo 分数的平均值将被指定为 MOS 主观分数。 平均操作旨在减少 Elo 变化的随机性。

例子

举个例子。 假设 RA=1500R_A = 1500RA=1500,和 Rb=1600R_b = 1600Rb=1600,那么我们有 PA>B≈0.36P_{A>B} ≈ 0.36PA>B0.36PB>A≈0.64P{B>A} ≈ 0.64PB>A0.64。 在这种情况下,如果选择 IAI_AIA,则 IAI_AIA 的更新 Elo 分数将为 RA=1500+16×(1−0.36)≈1510R_A = 1500 + 16× (1 −0.36) ≈ 1510RA=1500+16×(10.36)1510IBI_BIB 的新分数为 RB=1600+16×(0−0.64)≈1594R_B = 1600 + 16 × (0 − 0.64)≈1594RB=1600+16×(00.64)1594; 如果选择 IBI_BIB,新的分数将是RA≈1494R_A≈1494RA1494RB≈1605R_B≈1605RB1605。注意,由于选择不同图像的预期概率不同,Elo分数的值变化也会不同。 这也表明,当质量相差太大时,获胜者不会从糟糕的图像中获得很多收益。 根据上式,200 的分差表示 76% 的获胜机会,400 表示超过 90% 的机会。 最开始,我们为每个扭曲的图像分配一个 1400 的 Elo 分数。 经过多次人工判断(在我们的数据集中,我们有 113 万次人工判断),最终得到了每张图像的 Elo 分数。

采用 Elo 系统的另一个优势是我们的数据集可以是动态的,并且可以在未来扩展。 Elo 系统在电子游戏中被广泛用于评估玩家的相对水平,在电子游戏中,玩家不断变化,Elo 系统可以在少数游戏玩法中为新玩家提供评分。 回想一下,“这些 IQA 方法面临挑战”的主要原因之一是 GAN 和基于 GAN 的 IR 方法的出现。如果将来提出其他新型的图像生成技术会怎样? 人们是否需要构建一个新的数据集来包含这些新算法? 凭借 Elo 系统的可扩展特性,人们可以轻松地将新的失真类型添加到该数据集中并遵循相同的评级过程。 Elo 系统会自动调整所有失真的 Elo 分数,而不需要再对旧的重新评分。

结果

本文基于提出的 PIPAL 数据集进行了全面的研究。 首先为IQA方法建立一个基准。 通过这个基准,回答了“现有的 IQA 方法能否客观地评估最近的 IR 算法?”的问题。 然后,本文为一些最近的 SR 算法建立了一个基准,以探索 IQA 方法的发展与 IR 研究之间的关系。 我们可以得到这样的答案:“我们是否通过在这些 IQA 方法上击败基准来获得更好的 IR 算法?” 最后,我们通过与其他现有的失真类型进行比较来研究基于 GAN 的失真的特征。 最后还通过引入anti-aliasing pooling来提高 IQA 网络在基于 GAN 的失真上的性能。

实验部分有兴趣的话,请自行查阅原文吧。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/532730.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

郫都区计算机老师周俊老师,教师节,带你走进郫都教师背后的故事

点击“郫都教育”关注我们:)有这样一群人“师者,所以传道,授业,解惑也”是他们奉献一生的事业“随风潜入夜,润物细无声”是他们培养英才的责任“春蚕到死丝方尽,蜡炬成灰泪始干”是他们追求终生的信仰值此第…

(2021) 18 [代码讲解] 可执行文件

(2021) 18 [代码讲解] 可执行文件 南京大学操作系统课蒋炎岩老师网络课程笔记。 视频:https://www.bilibili.com/video/BV1HN41197Ko?p18 讲义:http://jyywiki.cn/OS/2021/slides/C8.slides#/ 背景 回顾 程序 状态机 状态机执行 状态机上的路径状…

如何学习计算机思维,刘康平:为什么我们每个人都应该学习计算思维?

不久前,微软亚洲研究院资深学术合作经理刘康平应邀在“造就”做了演讲,以下为演讲节选,由“造就”授权转载。刘康平 微软亚洲研究院资深学术合作经理以中国象棋为例,在这样一个棋局上,你怎么用最快的方式找到「将」和「…

链接与加载-NJU-JYY

(2021) 19 [代码讲解] 从零实现动态加载 南京大学操作系统课蒋炎岩老师网络课程笔记。 视频:https://www.bilibili.com/video/BV1N741177F5?p15 讲义:http://jyywiki.cn/OS/2021/slides/C9.slides#/ 背景 回顾: ELF可执行文件 只要能完成…

饥荒联机自建服务器有什么用,联机版饥荒使用专用服务器的好处 | 手游网游页游攻略大全...

发布时间:2016-02-15存档保存位置是?很多玩家对此并不是很了解,不过别着急哟,下面99单机小编就为你带来高玩分享的相关技巧心得攻略,希望大家能喜欢. 联机版的存档与单机版是不同的,由于联机版饥荒建 ...标签:游戏资讯 攻略秘籍发布时间:201…

(2021) 26 [持久化] 持久数据的可靠性:RAID和journaling

(2021) 26 [持久化] 持久数据的可靠性:RAID和journaling 南京大学操作系统课蒋炎岩老师网络课程笔记。 视频:https://www.bilibili.com/video/BV1HN41197Ko?p26 讲义:http://jyywiki.cn/OS/2021/slides/16.slides#/ 背景 回顾 文件系统 …

win10无法检验服务器出示的ssl证书,win10系统网站启用ssL安全证书的操作方法

win10系统网站启用ssL安全证书的操作方法?很多win10用户在使用电脑的时候,会发现win10系统网站启用ssL安全证书的的现象,根据小编的调查并不是所有的朋友都知道win10系统网站启用ssL安全证书的的问题怎么解决,不会的朋友也不用担心&#xff…

Nplayer本地文件拷到服务器,手把手教你简易NAS构建,手机/平板/智能电视随意调取,家庭存储云共享,有了自己的网络云盘后再也不用担心容量不够了!...

之前嫌键盘侠烦,写这些也没意义所以把账号注销了文章删除了,现在想了想我抗吧12级老蛆还喷不过这帮小兔崽子?换了skt.ruo秽土转生,求喷子和我在各评论对线。特别是匿名dog见一个怼死一个。下面是之前号写的内容原文 -#简介NAS全称…

gdb 入门

gdb 入门 简介 gdb是GNU开源组织发布的一个强大的Linux下的程序调试工具。 一般来说,GDB主要帮助你完成下面四个方面的功能: 1、启动你的程序,可以按照你的自定义的要求随心所欲的运行程序。 2、可让被调试的程序在你所指定的调置的断点…

Linux下的CUDA多版本管理

Linux下的CUDA多版本管理 关于CUDA、cuDNN等的简介和安装可参考:显卡、显卡驱动、CUDA、CUDA Toolkit、cuDNN 梳理。 CUDA多版本 有时我们会在一台机器上同时看到多个版本的CUDA,比如nvcc -V和nvidia-smi的输出就可能会不同: 在我们实验室…

ONNX初探

ONNX初探 转载自:https://blog.csdn.net/just_sort/article/details/112912272 0x0. 背景 最近看了一些ONNX的资料,一个最大的感受就是这些资料太凌乱了。大多数都是在介绍ONNX模型转换中碰到的坑点以及解决办法。很少有文章可以系统的介绍ONNX的背景…

服务器修改地址,服务器修改管理地址

服务器修改管理地址 内容精选换一换在弹性云服务器上安装完成后输入公网IP,无法连接目的虚拟机,端口无法访问工具。源端网络未连通目的端。目的端安全组未开放8084端口。目的端网络ACL禁用了8084端口。登录源端服务器后,在源端服务器中ping 目…

ONNX再探

ONNX再探 本文转自:https://blog.csdn.net/just_sort/article/details/113802330 这篇文章从多个角度探索了ONNX,从ONNX的导出到ONNX和Caffe的对比,以及使用ONNX遭遇的困难以及一些解决办法,另外还介绍了ONNXRuntime以及如何基于…

图解自监督学习(CV)

图解自监督学习(CV) 译自:https://amitness.com/2020/02/illustrated-self-supervised-learning/ 作者:Amit Chaudhary 注:译者在某些地方对原文的表述做了调整,使其适合汉语的阅读习惯,并在…

机器学习中的归纳偏置

机器学习中的归纳偏置 带着偏见看世界,否则你根本没有看待世界的方式。 本文主要参考整理自知乎问题:如何理解Inductive bias? No-Free-Lunch(NLF)定理指出学习是不可能的,除非有先验知识。通常情况下&…

【c语言数据结构笔记】1.2 数据结构

1.2数据结构 数据元素并独立 结构实体关系 形式定义&#xff08;D&#xff0c;S&#xff09; 其中D是数据元素的有限集&#xff0c;S是D上关系的有限集 eg&#xff1a;12位数&#xff1a;132423451233 分成三组四位数 次序关系<a1,a2><a2,a3> 遵守次序关系 eg&…

使用Apex进行混合精度训练

使用Apex进行混合精度训练 转自&#xff1a;https://fyubang.com/2019/08/26/fp16/ 你想获得双倍训练速度的快感吗&#xff1f; 你想让你的显存空间瞬间翻倍吗&#xff1f; 如果我告诉你只需要三行代码即可实现&#xff0c;你信不&#xff1f; 在这篇博客里&#xff0c;瓦砾…

【数据结构1.3笔记】研究内容

1.3研究内容 数据结构&#xff08;D&#xff0c;S&#xff09; {逻辑结构&#xff1a; {物理结构&#xff08;存储结构&#xff09; {数据的运算 1.逻辑结构 1 集合&#xff1a;集合&#xff0c;没有逻辑关系 2 线性结构 “一对一” 3树形结构 层次关系 4图形结构 练习&…

2019年蓝桥杯第一题

第一题 标题&#xff1a;组队&#xff08;本题总分&#xff1a;5 分&#xff09; 作为篮球队教练&#xff0c;你需要从以下名单中选出 1 号位至 5 号位各一名球员&#xff0c; 组成球队的首发阵容。 每位球员担任 1 号位至 5 号位时的评分如下表所示。请你计算首发阵容 1 号位…

深度学习编译:MLIR初步

深度学习编译MLIR初步 深度模型的推理引擎 目前深度模型的推理引擎按照实现方式大体分为两类&#xff1a;解释型推理引擎和编译型推理引擎。 解释型推理引擎 一般包含模型解析器&#xff0c;模型解释器&#xff0c;模型优化器。 模型解析器负责读取和解析模型文件&#xff…