【综述整理】2015年至2022年图像美学质量评估数据集【附下载链接】

在这里插入图片描述

文章目录

  • 2012年-美学数据集AVA-25万-MOS1~10
    • 数据集介绍
  • 2015年-移动设备拍摄CLIVE-1K-MOS1~5
    • 数据集介绍
  • 2016年-美学数据集AADB-10K-MOS1~10
    • 综述摘要
  • 2017年-美学数据集FLICKR-AES-MOS1~5
    • 数据集介绍
  • 2018年-户外自然场景KonIQ-10K-MOS1~5
    • 数据集介绍
    • 标签MOS,1-5分
  • 2019年-真实世界图像FLIVE(也称为PaQ-2-PiQ)-40K-MOS1~5
    • 数据集介绍
  • 2020年-智能手机摄影SPAQ-11K-MOS1~100
    • 数据集介绍
    • 标签MOS,1~100
  • 2022年-多主题美学TAD66K-MOS1~10
    • 数据集介绍

2012年-美学数据集AVA-25万-MOS1~10

该数据集由下面论文提出AVA: A large-scale database for aesthetic visual analysis

AVA数据集下载链接

在这里插入图片描述

Paperwithcode中AVA数据集的模型排名

AVA数据集的详细介绍与标签介绍

在这里插入图片描述

AVA数据集包含大约250,000张图像,每张图像与大约250名评分者1-10的分数分布相关。其中235,528张图像用于训练,另外20,000张图像用于测试。

数据集介绍

图像美学分析的一个数据库——AVA(Aesthetic Visual Analysis)

  1. 背景介绍

    • 随着视觉内容的不断增长,按照美学偏好来组织和导航这些内容变得越来越重要。
  2. 研究现状

    • 尽管还处于初期阶段,但关于美学偏好计算模型的研究已经显示出巨大的潜力。
  3. 研究需求

    • 为了推动这一领域的发展,需要有现实、多样且具有挑战性的数据库。
  4. AVA数据库介绍

    • AVA数据库,它包含超过250,000张图片以及丰富的元数据。
    • 每张图片都有大量的美学评分。
    • 包括超过60个类别的语义标签。
    • 与摄影风格相关的标签。
  5. AVA的优势

    • 相对于现有的数据库,AVA在规模、多样性和注释的异质性方面具有优势。
  6. 洞察美学偏好

    • 通过AVA可以提供关于美学偏好的几个关键见解。

2015年-移动设备拍摄CLIVE-1K-MOS1~5

该数据集由下面论文所提出
Massive Online Crowdsourced Study of Subjectiveand Objective Picture Quality

暂时找不到下载链接,之前的下载链接已失效

数据集介绍

一个图像质量数据库——LIVE In the Wild Image Quality Challenge Database。该数据库旨在克服现有图像质量数据库的一些局限性。

  1. 背景

    • 大多数公开可用的图像质量数据库都是在高度控制条件下创建的,通过在高质量照片上引入分级的模拟失真来形成这些数据库。
  2. 问题陈述

    • 实际上,使用典型移动设备拍摄的图像通常会受到多种失真的复杂混合影响,而这些失真不一定能够很好地通过现有数据库中的合成失真来建模。
  3. 现有数据库的限制

    • 这些现有数据库的创建者通常会在严格控制的视觉环境中进行人类心理物理研究,以获得对图像的一组统计上有意义的人类意见评分,这导致了相对于其他类型的图像分析数据库来说数据集较小。
  4. 解决方案

    • 为了解决这些问题,作者设计并创建了一个包含大量现代移动设备拍摄的图像,并带有广泛多样真实失真的新数据库。这个数据库被称为LIVE In the Wild Image Quality Challenge Database。
  5. 结果规模

    • 数据库包含了超过350,000个评分,这些评分来自对1,162张图像进行评估的8,100多名不同个体观察者。

2016年-美学数据集AADB-10K-MOS1~10

该数据集从图像美学质量评估的综述文章中提出Image Aesthetic Assessment: An Experimental Survey

AADB数据集收集了总共由190名用户评估的10,000张图像。AADB数据集中包含了8种美学因素(平衡、颜色和谐型、趣味、景深、光照、主体、三分、颜色丰富性)的二值分类评价(在单个美学因素上的“好”与“不好”),然而其美学因素的评价过于简单,不适合用于分析美学评价的主观性与多样性。

综述摘要

  1. 研究目标

    • 这篇综述的目标是回顾最近用于评估图像美学质量的计算机视觉技术。也就是说,它试图总结并分析当前技术如何判断一张照片是“美”的还是“不美”的。
  2. 评估目标

    • 图像美学评估的目标是基于摄影规则来区分高质量的照片与低质量的照片。这些规则可以用来进行二分类(即判断一张图像是好是坏)或者质量评分(给图像打分)。
  3. 文献中的方法

    • 在文献中已经提出了多种尝试解决这一挑战性问题的方法。这些方法多种多样,这篇综述试图提供一个系统化的列表来整理它们。
  4. 方法分类

    • 综述按照视觉特征类型(手工制作的特征和深度特征)以及评价标准(数据集特性和评估指标)对这些方法进行了分类。
  5. 贡献与新颖性

    • 对所审查的方法的主要贡献和新颖之处进行了强调和讨论。这有助于读者了解哪些方法在现有技术上有所改进或创新。
  6. 深度学习的应用

    • 随着深度学习技术的出现,本文还系统地评估了对于开发稳健的深度模型以进行美学评分的有用设置。这意味着作者们探讨了如何利用深度学习技术来提高美学评估的准确性。
  7. 实验与基准测试

    • 实验使用了简单而坚实的基线模型来进行,并且这些模型的表现与目前最先进的技术相当。这意味着他们测试了一些基础的方法,并证明了这些方法的有效性。
  8. 美学操控的可能性

    • 此外,本文还讨论了通过计算方法来操控图像美学的可能性。这可能涉及到如何通过算法修改图片使其看起来更美观。
  9. 未来研究参考

    • 最后,作者希望他们的综述能够作为未来研究图像美学评估的一个全面参考资料来源。

2017年-美学数据集FLICKR-AES-MOS1~5

该数据集由论文提出Personalized Image Aesthetics

该数据集可以从GitHub仓库下载和详细了解

FLICKR-AES数据集由40,000张图像组成,其美学评分范围从1到5,以反映不同的图像美学水平,每个图像由5个评分者评分。173名用户评分的35263张图像作为训练集,37名用户评分的4737张图像作为测试集。

数据集介绍

  1. 研究背景

    • 自动图像美学评分(FLICKR-AES)随着深度学习的突破而受到越来越多的关注。
    • 尽管已经有很多关于学习通用或普遍美学模型的研究,但是将个人用户的偏好纳入美学模型的研究相对较少。
  2. 研究目标

    • 研究人员解决了个性化美学的问题,表明个人的审美偏好与内容和美学属性之间存在强烈的相关性,因此个体对图像美学的感知与通用图像美学之间的偏差是可以预测的。
  3. 数据收集

    • 为了支持这项研究,研究人员首先从Flickr收集了一个大型图像数据集,并通过Amazon Mechanical Turk进行了标注。
    • 另外,他们还收集了一个较小的数据集,包含真实的个人相册,并由相册的所有者进行评分。

2018年-户外自然场景KonIQ-10K-MOS1~5

该数据集于2018年收集,在当时是第一个且最大的户外自然场景的图像质量数据集,有近1万张图像。

Paperwithcode KonIQ数据集介绍和下载

数据集介绍

KonIQ-10k 是一个用于图像质量评估(IQA, Image Quality Assessment)的大型数据集,包含了10,073张带有质量评分的图片。

  1. 数据集规模

    • KonIQ-10k 包含了 10,073 张经过评分的图像,这表明它是一个相当大的数据集,适合用来训练或测试图像质量评估模型。
  2. 生态有效性

    • 这是第一个旨在生态有效性的“野外”数据库。“野外”指的是这些图像是在自然条件下获取的,而不是在实验室环境中制造的。这意味着图像中的失真(如模糊、噪声等)是真实世界中可能出现的情况,而不仅仅是人为引入的。
  3. 内容多样性

    • 数据集涵盖了多种多样的内容,这意味着图像可能包括不同的场景、物体、颜色等等,这有助于模型学习到不同条件下的质量评估标准。
  4. 质量相关指标

    • 数据集不仅包含图像本身,还包括与图像质量相关的各种度量或指标,这些信息可以帮助研究人员更好地理解图像质量的变化。
  5. 众包质量评分

    • 数据集中的图像质量评分是通过众包的方式获得的,即从大量的普通用户那里收集评价。具体来说,有1,459名参与者为这些图像提供了大约120万次的质量评分。
  6. 研究目的

    • 这些众包的数据为开发更加通用的图像质量评估模型铺平了道路。因为这些评分更接近于普通人对图像质量的看法,而非专业标准,所以使用这样的数据集训练出来的模型可能会更符合实际应用的需求。

标签MOS,1-5分

在这里插入图片描述

图像质量评估数据集中评分标签文件的信息如下,具体来说:

  1. image_name: 图像文件的名称。这是用来唯一标识数据集中每一张图像的信息。

  2. c1-c5: 每个ACR值对应的评分次数。这里的ACR(Absolute Category Rating)是指绝对分类评级,通常是一个固定的等级范围,在这里使用的是1到5的等级。例如,如果某张图片的c5值为100,那么意味着有100个人给这张图片评了最高的5分。

  3. c_total: 对于每一张图像,总共有多少次评分记录。这个值是c1c5的总和,表示该图像总共收到了多少个评分。

  4. MOS (Mean Opinion Score): 基于5点尺度的平均意见分数。这是所有评分的算术平均值,反映了大众对于图像质量的整体看法。在这个上下文中,MOS是将所有针对特定图像的评分相加后除以评分次数得到的结果。

  5. SD (Standard Deviation): MOS的标准差。标准差是一种统计量,用于衡量一组数值的离散程度。在这个情况下,标准差显示了人们对同一图像质量评分的一致性或变化性。

  6. MOS_zscore: 用户评分首先按用户进行标准化处理,即每个用户的评分都转换成了z分数(Z-score)。Z-score是一种统计测量,它描述了一个值与平均值之间的距离,以标准差为单位。这种标准化处理可以消除个体评分者之间可能存在的评分偏好的差异,使评分更具可比性。

2019年-真实世界图像FLIVE(也称为PaQ-2-PiQ)-40K-MOS1~5

该数据集由Facebook AI论文提出From Patches to Pictures (PaQ-2-PiQ): Mapping the Perceptual Space of Picture Quality

PaQ-2-PiQ官网介绍

PaQ-2-PiQ的Github链接 93star

Paperwithcode的PaQ-2-PiQ的排名

FLIVE下载教程

数据集介绍

  1. 问题背景

    • 盲/无参考感知图像质量预测是一个重要的未解决问题,对社交媒体和流媒体行业具有重大影响,每天影响数十亿观众。
    • 这个问题的重要性在于,随着社交媒体和流媒体服务的普及,图像质量对用户体验至关重要,而现有的技术还无法很好地解决这一问题。
  2. 现有挑战

    • 目前流行的NR预测模型在处理真实世界中受到损伤的图像时表现不佳。这意味着现有的算法在实际应用中并不能有效地评估图像质量。
  3. 数据规模

    • 为了解决这个问题,研究者们建立了一个迄今为止最大的主观图像质量数据库,包含了大约4万张真实世界中的受损图像和12万个小块(patches),并收集了大约400万个针对这些图像的人类质量评价。

    图像来源

    • 图像来源AVA数据集、PASCAL VOC 数据集两个数据集

2020年-智能手机摄影SPAQ-11K-MOS1~100

SPAQ数据集由下面论文提出Perceptual Quality Assessment of Smartphone Photography

SPAQ的Github地址

SPAQ的下载链接

在这里插入图片描述

数据集介绍

智能手机摄影质量评估数据集SPAQ:

  1. 研究背景

    • 随着智能手机成为人们拍摄照片的主要工具,其摄像头的质量以及相关的计算摄影模块已成为消费者市场中评价和排名智能手机的一个实际标准。
  2. 研究目的

    • 进行迄今为止最全面的智能手机摄影感知质量评估研究。
  3. 数据库介绍(SPAQ)

    • SPAQ是一个包含由66款不同智能手机拍摄的11,125张图片的数据库。每张图片都附有详细的注释信息。
  4. 注释信息

    • 图像质量(总体评价)。
    • 图像属性(如亮度、色彩丰富度、对比度、噪点、锐度等)。
    • 场景类别标签(如动物、城市风光、人物、室内场景、风景、夜景、植物、静物等)。
  5. 数据收集环境

    • 所有图像都是在一个受控的实验室环境中收集的人类意见。
  6. 附加数据

    • 记录了所有图像的可交换图像文件格式(EXIF)数据,以帮助进行更深入的分析。

标签MOS,1~100

在这里插入图片描述

2022年-多主题美学TAD66K-MOS1~10

该数据集由论文提出Rethinking Image Aesthetics Assessment: Models, Datasets and Benchmarks.

该数据集的Github仓库,可以下载数据集和了解数据集

TAD66K数据集包含66,000张图片,涵盖47个流行主题,每张图片都根据专门的主题评估标准,1200多人参与1到10的评分=。其中52248进行训练,另外14079进行测试。

数据集介绍

“Theme and Aesthetics Dataset with 66K images”(简称TAD66K)的数据集,该数据集是专门为图像审美分析(Image Aesthetic Analysis, IAA)设计的

  1. 数据集名称和规模

    • TAD66K是一个大型数据集,包含66,000张图像,旨在用于图像审美分析。
  2. 数据集的特点

    • 主题导向:这个数据集包含了47种流行的主题,并且所有的图像都是根据主题精心挑选的。
  3. 美学标准和注解

    • 除了常见的美学标准之外,TAD66K为这47种不同的主题提供了专门的美学标准。
    • 每个主题的图像都是独立标注的,这意味着每个主题的图像都有自己的特定标准。
    • 每张图像至少含有1200条有效的注解,这是目前最丰富的注解量之一。
  4. 高质量注解的价值

    • 这些高质量的注解有助于更深入地了解模型的性能,意味着研究人员可以通过这些详细的注解更好地评估和改进他们的算法或模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/57890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

信息安全工程师(72)网络安全风险评估概述

前言 网络安全风险评估是一项重要的技术任务,它涉及对网络系统、信息系统和网络基础设施的全面评估,以确定存在的安全风险和威胁,并量化其潜在影响以及可能的发生频率。 一、定义与目的 网络安全风险评估是指对网络系统中存在的潜在威胁和风险…

记一次:使用使用Dbeaver连接Clickhouse

前言:使用了navicat连接了clickhouse我感觉不太好用,就整理了一下dbeaver连接 0、使用Navicat连接clickhouse 测试连接 但是不能双击打开,可是使用命令页界面,右键命令页界面,然后可以用sql去测试 但是不太好用&#…

LeetCode_231. 2 的幂_java

1、题目 231. 2 的幂https://leetcode.cn/problems/power-of-two/ 给你一个整数 n,请你判断该整数是否是 2 的幂次方。如果是,返回 true ;否则,返回 false 。 如果存在一个整数 x 使得 n ,则认为 n 是 2 的幂次方…

6.1 特征值介绍

一、特征值和特征向量介绍 本章会开启线性代数的新内容。前面的第一部分是关于 A x b A\boldsymbol x\boldsymbol b Axb:平衡、均衡和稳定状态;现在的第二部分是关于变化的。时间会加入进来 —— 连续时间的微分方程 d u / d t A u \pmb{\textrm{d}…

CTF--Misc题型小结

(萌新笔记,多多关照,不足之处请及时提出。) 不定时更新~ 目录 密码学相关 文件类型判断 file命令 文件头类型 strings读取 隐写术 尺寸修改 文件头等缺失 EXIF隐写 thumbnail 隐写 文件分离&提取 binwalk foremo…

索引的使用和优化

索引就是一种快速查询和检索数据的数据结构,mysql中的索引结构有:B树和Hash。 索引的作用就相当于目录的作用,我么只需先去目录里面查找字的位置,然后回家诶翻到那一页就行了,这样查找非常快, 创建一个表结…

短视频矩阵系统源码开发优势,短视频矩阵系统oem部署

短视频矩阵系统就是在多个短视频平台上构建自己的内容生态,通过多平台、多账号、多内容的运营策略,实现品牌曝光、用户引流、产品销售等目的。短视频矩阵的核心在于通过矩阵式的布局,实现资源优化配置和利用,提升企业市场竞争力。…

.Net 8 Web API CRUD 操作

本次介绍分为3篇文章: 1:.Net 8 Web API CRUD 操作https://blog.csdn.net/hefeng_aspnet/article/details/143228383 2:在 .Net 8 API 中实现 Entity Framework 的 Code First 方法https://blog.csdn.net/hefeng_aspnet/article/details/1…

【C++干货篇】——类和对象的魅力(四)

【C干货篇】——类和对象的魅力(四) 1.取地址运算符的重载 1.1const 成员函数 将const修饰的成员函数称之为const成员函数,const修饰成员函数放到成员函数参数列表的后面。const实际修饰该成员函数隐含的this指针(this指向的对…

nuxt3项目创建

安装 npx nuxilatest init <project-name> 此时会出现报错&#xff0c;需要在host文件中加入 185.199.108.133 raw.githubusercontent.com 再次执行命令&#xff0c;进入安装 此处选择npm&#xff0c;出现下图表示安装成功 启动项目 执行npm run dev&#xff0c;访…

【力扣 + 牛客 | SQL题 | 每日4题】牛客大厂笔试真题SQLW6, W7, W8

1. 牛客大厂笔试真题SQLW6&#xff1a;统计所有课程参加培训人次 1.1 题目&#xff1a; 描述 某公司员工培训信息数据如下&#xff1a; 员工培训信息表cultivate_tb(info_id-信息id,staff_id-员工id,course-培训课程)&#xff0c;如下所示&#xff1a; 注&#xff1a;该公…

【大数据技术基础 | 实验五】ZooKeeper实验:部署ZooKeeper

文章目录 一、实验目的二、实验要求三、实验原理四、实验环境五、实验步骤&#xff08;一&#xff09;安装JDK&#xff08;二&#xff09;修改ZooKeeper配置文件&#xff08;三&#xff09;启动ZooKeeper集群 六、实验结果七、实验心得 一、实验目的 掌握ZooKeeper集群安装部署…

基于Netty构建WebSocket服务并实现项目群组聊天和实时消息通知推送

文章目录 前言需求分析技术预研Web端方案服务端技术 技术方案设计思路功能实现添加依赖自定义NettyServer自定义webSocketHandler使用NettyServer向在线用户发送消息 需要完善的地方 前言 我们的项目有个基于项目的在线文档编制模块&#xff0c;可以邀请多人项目组成员在线协同…

python爬虫-爬取蛋白晶体和分子结构

文章目录 前言一、环境准备二、爬取PDB蛋白结构1.下载指定数量的随机PDB2.下载指定靶标的PDB二、从ZINC爬取小分子mol2结构1.下载指定数量的随机分子2.下载指定分子三、从ChEMBL爬取小分子信息1.下载指定ID的SMILES(测试不成功,网站变成readonly了)四、总结爬虫1.查看对应的…

AMD锐龙8845HS+780M核显 虚拟机安装macOS 15 Sequoia 15.0.1 (2024.10)

最近买了机械革命无界14X&#xff0c;CPU是8845HS&#xff0c;核显是780M&#xff0c;正好macOS 15也出了正式版&#xff0c;试试兼容性&#xff0c;安装过程和之前差不多&#xff0c;这次我从外网获得了8核和16核openCore&#xff0c;分享一下。 提前发一下ISO镜像地址和open…

JavaScript完整笔记

JS引入 JavaScript 程序不能独立运行&#xff0c;它需要被嵌入 HTML 中&#xff0c;然后浏览器才能执行 JavaScript 代码。 通过 script 标签将 JavaScript 代码引入到 HTML 中&#xff0c;有两种方式&#xff1a; 内部方式 通过 script 标签包裹 JavaScript 代码 我们将 &…

安装Maven配置以及构建Maven项目(2023idea)

一、下载Maven绿色软件 地址&#xff1a;http://maven.apache.org/download.cgi 尽量不要选择最高版本的安装&#xff0c;高版本意味着高风险的不兼容问题&#xff0c;选择低版本后续问题就少。你也可以选择尝试。 压缩后&#xff1a; 打开后&#xff1a; 在该目录下新建mvn-…

SQLite 3.47.0 发布,大量新功能来袭

SQLite 开发团队于 2024 年 10 月 21 日发布了 SQLite 3.47.0 版本&#xff0c;我们来了解一下新版本的改进功能。 触发器增强 SQLite 3.47.0 版本开始&#xff0c;触发器函数 RAISE() 的 error-message 参数可以支持任意 SQL 表达式。在此之前&#xff0c;该参数只能是字符串…

SQL注入之sqlilabs靶场21-30题

重点插入&#xff1a;html表 第二十一题 分析过程&#xff1a;&#xff08;没有正确的账号密码是否能拿到Cookie&#xff1f;最后注释好像只能使用#&#xff0c;--好像无法注释&#xff09; 查看源码 这里输入账号密码处被过滤了 但Cookie被base64编码了 可以从Cookie入手 …

vue2结合echarts实现数据排名列表——前端柱状进度条排行榜

写在前面&#xff0c;博主是个在北京打拼的码农&#xff0c;工作多年做过各类项目&#xff0c;最近心血来潮在这儿写点东西&#xff0c;欢迎大家多多指教。 数据排名列表——图表开发&#xff0c;动态柱状图表&#xff0c;排名图 UI 直接搜到类似在线代码&#xff08;数据列表…