文章目录
- 2012年-美学数据集AVA-25万-MOS1~10
- 数据集介绍
- 2015年-移动设备拍摄CLIVE-1K-MOS1~5
- 数据集介绍
- 2016年-美学数据集AADB-10K-MOS1~10
- 综述摘要
- 2017年-美学数据集FLICKR-AES-MOS1~5
- 数据集介绍
- 2018年-户外自然场景KonIQ-10K-MOS1~5
- 数据集介绍
- 标签MOS,1-5分
- 2019年-真实世界图像FLIVE(也称为PaQ-2-PiQ)-40K-MOS1~5
- 数据集介绍
- 2020年-智能手机摄影SPAQ-11K-MOS1~100
- 数据集介绍
- 标签MOS,1~100
- 2022年-多主题美学TAD66K-MOS1~10
- 数据集介绍
2012年-美学数据集AVA-25万-MOS1~10
该数据集由下面论文提出AVA: A large-scale database for aesthetic visual analysis
AVA数据集下载链接
Paperwithcode中AVA数据集的模型排名
AVA数据集的详细介绍与标签介绍
AVA数据集包含大约250,000张图像,每张图像与大约250名评分者1-10的分数分布相关。其中235,528张图像用于训练,另外20,000张图像用于测试。
数据集介绍
图像美学分析的一个数据库——AVA(Aesthetic Visual Analysis)
-
背景介绍:
- 随着视觉内容的不断增长,按照美学偏好来组织和导航这些内容变得越来越重要。
-
研究现状:
- 尽管还处于初期阶段,但关于美学偏好计算模型的研究已经显示出巨大的潜力。
-
研究需求:
- 为了推动这一领域的发展,需要有现实、多样且具有挑战性的数据库。
-
AVA数据库介绍:
- AVA数据库,它包含超过250,000张图片以及丰富的元数据。
- 每张图片都有大量的美学评分。
- 包括超过60个类别的语义标签。
- 与摄影风格相关的标签。
-
AVA的优势:
- 相对于现有的数据库,AVA在规模、多样性和注释的异质性方面具有优势。
-
洞察美学偏好:
- 通过AVA可以提供关于美学偏好的几个关键见解。
2015年-移动设备拍摄CLIVE-1K-MOS1~5
该数据集由下面论文所提出
Massive Online Crowdsourced Study of Subjectiveand Objective Picture Quality
暂时找不到下载链接,之前的下载链接已失效
数据集介绍
一个图像质量数据库——LIVE In the Wild Image Quality Challenge Database。该数据库旨在克服现有图像质量数据库的一些局限性。
-
背景:
- 大多数公开可用的图像质量数据库都是在高度控制条件下创建的,通过在高质量照片上引入分级的模拟失真来形成这些数据库。
-
问题陈述:
- 实际上,使用典型移动设备拍摄的图像通常会受到多种失真的复杂混合影响,而这些失真不一定能够很好地通过现有数据库中的合成失真来建模。
-
现有数据库的限制:
- 这些现有数据库的创建者通常会在严格控制的视觉环境中进行人类心理物理研究,以获得对图像的一组统计上有意义的人类意见评分,这导致了相对于其他类型的图像分析数据库来说数据集较小。
-
解决方案:
- 为了解决这些问题,作者设计并创建了一个包含大量现代移动设备拍摄的图像,并带有广泛多样真实失真的新数据库。这个数据库被称为LIVE In the Wild Image Quality Challenge Database。
-
结果规模:
- 数据库包含了超过350,000个评分,这些评分来自对1,162张图像进行评估的8,100多名不同个体观察者。
2016年-美学数据集AADB-10K-MOS1~10
该数据集从图像美学质量评估的综述文章中提出Image Aesthetic Assessment: An Experimental Survey
AADB数据集收集了总共由190名用户评估的10,000张图像。AADB数据集中包含了8种美学因素(平衡、颜色和谐型、趣味、景深、光照、主体、三分、颜色丰富性)的二值分类评价(在单个美学因素上的“好”与“不好”),然而其美学因素的评价过于简单,不适合用于分析美学评价的主观性与多样性。
综述摘要
-
研究目标:
- 这篇综述的目标是回顾最近用于评估图像美学质量的计算机视觉技术。也就是说,它试图总结并分析当前技术如何判断一张照片是“美”的还是“不美”的。
-
评估目标:
- 图像美学评估的目标是基于摄影规则来区分高质量的照片与低质量的照片。这些规则可以用来进行二分类(即判断一张图像是好是坏)或者质量评分(给图像打分)。
-
文献中的方法:
- 在文献中已经提出了多种尝试解决这一挑战性问题的方法。这些方法多种多样,这篇综述试图提供一个系统化的列表来整理它们。
-
方法分类:
- 综述按照视觉特征类型(手工制作的特征和深度特征)以及评价标准(数据集特性和评估指标)对这些方法进行了分类。
-
贡献与新颖性:
- 对所审查的方法的主要贡献和新颖之处进行了强调和讨论。这有助于读者了解哪些方法在现有技术上有所改进或创新。
-
深度学习的应用:
- 随着深度学习技术的出现,本文还系统地评估了对于开发稳健的深度模型以进行美学评分的有用设置。这意味着作者们探讨了如何利用深度学习技术来提高美学评估的准确性。
-
实验与基准测试:
- 实验使用了简单而坚实的基线模型来进行,并且这些模型的表现与目前最先进的技术相当。这意味着他们测试了一些基础的方法,并证明了这些方法的有效性。
-
美学操控的可能性:
- 此外,本文还讨论了通过计算方法来操控图像美学的可能性。这可能涉及到如何通过算法修改图片使其看起来更美观。
-
未来研究参考:
- 最后,作者希望他们的综述能够作为未来研究图像美学评估的一个全面参考资料来源。
2017年-美学数据集FLICKR-AES-MOS1~5
该数据集由论文提出Personalized Image Aesthetics
该数据集可以从GitHub仓库下载和详细了解
FLICKR-AES数据集由40,000张图像组成,其美学评分范围从1到5,以反映不同的图像美学水平,每个图像由5个评分者评分。173名用户评分的35263张图像作为训练集,37名用户评分的4737张图像作为测试集。
数据集介绍
-
研究背景:
- 自动图像美学评分(FLICKR-AES)随着深度学习的突破而受到越来越多的关注。
- 尽管已经有很多关于学习通用或普遍美学模型的研究,但是将个人用户的偏好纳入美学模型的研究相对较少。
-
研究目标:
- 研究人员解决了个性化美学的问题,表明个人的审美偏好与内容和美学属性之间存在强烈的相关性,因此个体对图像美学的感知与通用图像美学之间的偏差是可以预测的。
-
数据收集:
- 为了支持这项研究,研究人员首先从Flickr收集了一个大型图像数据集,并通过Amazon Mechanical Turk进行了标注。
- 另外,他们还收集了一个较小的数据集,包含真实的个人相册,并由相册的所有者进行评分。
2018年-户外自然场景KonIQ-10K-MOS1~5
该数据集于2018年收集,在当时是第一个且最大的户外自然场景的图像质量数据集,有近1万张图像。
Paperwithcode KonIQ数据集介绍和下载
数据集介绍
KonIQ-10k 是一个用于图像质量评估(IQA, Image Quality Assessment)的大型数据集,包含了10,073张带有质量评分的图片。
-
数据集规模:
- KonIQ-10k 包含了 10,073 张经过评分的图像,这表明它是一个相当大的数据集,适合用来训练或测试图像质量评估模型。
-
生态有效性:
- 这是第一个旨在生态有效性的“野外”数据库。“野外”指的是这些图像是在自然条件下获取的,而不是在实验室环境中制造的。这意味着图像中的失真(如模糊、噪声等)是真实世界中可能出现的情况,而不仅仅是人为引入的。
-
内容多样性:
- 数据集涵盖了多种多样的内容,这意味着图像可能包括不同的场景、物体、颜色等等,这有助于模型学习到不同条件下的质量评估标准。
-
质量相关指标:
- 数据集不仅包含图像本身,还包括与图像质量相关的各种度量或指标,这些信息可以帮助研究人员更好地理解图像质量的变化。
-
众包质量评分:
- 数据集中的图像质量评分是通过众包的方式获得的,即从大量的普通用户那里收集评价。具体来说,有1,459名参与者为这些图像提供了大约120万次的质量评分。
-
研究目的:
- 这些众包的数据为开发更加通用的图像质量评估模型铺平了道路。因为这些评分更接近于普通人对图像质量的看法,而非专业标准,所以使用这样的数据集训练出来的模型可能会更符合实际应用的需求。
标签MOS,1-5分
图像质量评估数据集中评分标签文件的信息如下,具体来说:
-
image_name: 图像文件的名称。这是用来唯一标识数据集中每一张图像的信息。
-
c1-c5: 每个ACR值对应的评分次数。这里的ACR(Absolute Category Rating)是指绝对分类评级,通常是一个固定的等级范围,在这里使用的是1到5的等级。例如,如果某张图片的
c5
值为100,那么意味着有100个人给这张图片评了最高的5分。 -
c_total: 对于每一张图像,总共有多少次评分记录。这个值是
c1
到c5
的总和,表示该图像总共收到了多少个评分。 -
MOS (Mean Opinion Score): 基于5点尺度的平均意见分数。这是所有评分的算术平均值,反映了大众对于图像质量的整体看法。在这个上下文中,MOS是将所有针对特定图像的评分相加后除以评分次数得到的结果。
-
SD (Standard Deviation): MOS的标准差。标准差是一种统计量,用于衡量一组数值的离散程度。在这个情况下,标准差显示了人们对同一图像质量评分的一致性或变化性。
-
MOS_zscore: 用户评分首先按用户进行标准化处理,即每个用户的评分都转换成了z分数(Z-score)。Z-score是一种统计测量,它描述了一个值与平均值之间的距离,以标准差为单位。这种标准化处理可以消除个体评分者之间可能存在的评分偏好的差异,使评分更具可比性。
2019年-真实世界图像FLIVE(也称为PaQ-2-PiQ)-40K-MOS1~5
该数据集由Facebook AI论文提出From Patches to Pictures (PaQ-2-PiQ): Mapping the Perceptual Space of Picture Quality
PaQ-2-PiQ官网介绍
PaQ-2-PiQ的Github链接 93star
Paperwithcode的PaQ-2-PiQ的排名
FLIVE下载教程
数据集介绍
-
问题背景:
- 盲/无参考感知图像质量预测是一个重要的未解决问题,对社交媒体和流媒体行业具有重大影响,每天影响数十亿观众。
- 这个问题的重要性在于,随着社交媒体和流媒体服务的普及,图像质量对用户体验至关重要,而现有的技术还无法很好地解决这一问题。
-
现有挑战:
- 目前流行的NR预测模型在处理真实世界中受到损伤的图像时表现不佳。这意味着现有的算法在实际应用中并不能有效地评估图像质量。
-
数据规模:
- 为了解决这个问题,研究者们建立了一个迄今为止最大的主观图像质量数据库,包含了大约4万张真实世界中的受损图像和12万个小块(patches),并收集了大约400万个针对这些图像的人类质量评价。
图像来源
- 图像来源AVA数据集、PASCAL VOC 数据集两个数据集
2020年-智能手机摄影SPAQ-11K-MOS1~100
SPAQ数据集由下面论文提出Perceptual Quality Assessment of Smartphone Photography
SPAQ的Github地址
SPAQ的下载链接
数据集介绍
智能手机摄影质量评估数据集SPAQ:
-
研究背景:
- 随着智能手机成为人们拍摄照片的主要工具,其摄像头的质量以及相关的计算摄影模块已成为消费者市场中评价和排名智能手机的一个实际标准。
-
研究目的:
- 进行迄今为止最全面的智能手机摄影感知质量评估研究。
-
数据库介绍(SPAQ):
- SPAQ是一个包含由66款不同智能手机拍摄的11,125张图片的数据库。每张图片都附有详细的注释信息。
-
注释信息:
- 图像质量(总体评价)。
- 图像属性(如亮度、色彩丰富度、对比度、噪点、锐度等)。
- 场景类别标签(如动物、城市风光、人物、室内场景、风景、夜景、植物、静物等)。
-
数据收集环境:
- 所有图像都是在一个受控的实验室环境中收集的人类意见。
-
附加数据:
- 记录了所有图像的可交换图像文件格式(EXIF)数据,以帮助进行更深入的分析。
标签MOS,1~100
2022年-多主题美学TAD66K-MOS1~10
该数据集由论文提出Rethinking Image Aesthetics Assessment: Models, Datasets and Benchmarks.
该数据集的Github仓库,可以下载数据集和了解数据集
TAD66K数据集包含66,000张图片,涵盖47个流行主题,每张图片都根据专门的主题评估标准,1200多人参与1到10的评分=。其中52248进行训练,另外14079进行测试。
数据集介绍
“Theme and Aesthetics Dataset with 66K images”(简称TAD66K)的数据集,该数据集是专门为图像审美分析(Image Aesthetic Analysis, IAA)设计的
-
数据集名称和规模:
- TAD66K是一个大型数据集,包含66,000张图像,旨在用于图像审美分析。
-
数据集的特点:
- 主题导向:这个数据集包含了47种流行的主题,并且所有的图像都是根据主题精心挑选的。
-
美学标准和注解:
- 除了常见的美学标准之外,TAD66K为这47种不同的主题提供了专门的美学标准。
- 每个主题的图像都是独立标注的,这意味着每个主题的图像都有自己的特定标准。
- 每张图像至少含有1200条有效的注解,这是目前最丰富的注解量之一。
-
高质量注解的价值:
- 这些高质量的注解有助于更深入地了解模型的性能,意味着研究人员可以通过这些详细的注解更好地评估和改进他们的算法或模型。