论文研读|以真实图像为参考依据的AIGC检测

前言:这篇文章介绍几篇AIGC检测的相关工作,其中前几篇文章是以真实图像的特征作为标准进行检测,最后一篇文章就当拓展一下知识边界吧~

目录

  • Detecting Generated Images by Real Images Only (202311 arXiv)
  • Let Real Images be as a Judger, Spotting Fake Images Synthesized with Generative Models (202403 arXiv)
  • 【附赠】Can You Spot the AI-Generated Images? Distinguishing Fake Images Using Signal Detection Theory (HCII 2024)


Detecting Generated Images by Real Images Only (202311 arXiv)

作者团队:Xiuli Bi, et al. 重庆邮电大学
论文链接:https://arxiv.org/abs/2311.00962
核心思想:仅仅使用真实图像作为训练数据,基于真实图像的潜在噪声模式,训练一个单分类器,进行AIGC的检测。

在这里插入图片描述

这篇文章其实是他们组另一篇文章 Detecting Generated Images by Real Images (ECCV 2022) 的改进版。ECCV 2022 那篇论文中提出来的 LNP 应用到了这篇文章中。

个人评价:刚刚读到这篇文章的时候,醍醐灌顶,单分类器恰恰解决了AIGC检测的泛化性问题呀!它把真或假问题变为真或不真问题,仅仅使用真实数据就能够判断待检测图像的真假。(但是不知道为啥和皮衣讨论的时候他的内心不为所动……)


Let Real Images be as a Judger, Spotting Fake Images Synthesized with Generative Models (202403 arXiv)

作者团队:Liang Ziyou, et al. 武汉大学
论文链接:https://arxiv.org/abs/2403.16513
核心思想:首先训练一个特征提取器,使用自监督特征映射机制,提取真实图像的同质特征和异质特征,期间使用对比学习实现两类特征的高内聚,低耦合。然后,冻结特征提取器,使用对比学习区分真实同质特征和虚假特征,并根据真实同质特征与虚假特征的差异,帮助分类器做出判断。论文题目中的Judger应该就是指的对比学习中的Anchor吧……

在这里插入图片描述

个人评价:该工作反复使用对比学习,先提炼出真实图像中的同质特征,然后根据真实图像的同质特征和虚假图像特征的差异,判断图像的真实性。个人认为这项工作的亮点在于真实图像的同质特征提取,其他的好像也没什么特别之处(个人拙见),Emmm看看它最后的归宿吧……


【附赠】Can You Spot the AI-Generated Images? Distinguishing Fake Images Using Signal Detection Theory (HCII 2024)

作者团队:Hayun Park, et al. Kwangwoon University(韩国光云大学)
论文链接:https://link.springer.com/chapter/10.1007/978-3-031-60913-8_21
核心思想:这篇偶然看到的附赠文章使用信号检测论来评估人类鉴别AIGC的能力,并从表情和行为等角度评估了不同AIGC对人类鉴别能力的影响。简单来说,信号检测论就是利用人类评估结果的混淆矩阵,计算出敏感性(d’)值和一个判定标准值β值,前者能够表明鉴别能力的高低,后者能够表明鉴别是否存在明显偏向。也是挺有意思的一个研究角度吧。

信号检测论是一种心理物理法,是关于人们在不确定的情况下如何作出决定的理论。它是信息论的一个重要分支。详细介绍见这里。


后记:最近在罗翔老师的带领下读《理想国》,苏格拉底试图说明的是这个世界上善是唯一的,所有的坏都是对善的偏离。这个世界不是善恶对决的,所有的坏只是对善的一种亏欠和偏离,就像爱因斯坦所说的那句话,“这个世界上没有寒冷,寒冷是温暖的缺失,这个世界没有黑暗,黑暗是光明的缺失,这个世界没有仇恨,仇恨是爱的缺失。” 那么,是不是虚假是对真实的一种亏欠和偏离呢?能否从这个角度,把真实当作标杆,以此来检测虚假呢?我想,这篇文章介绍的前几篇工作与这一思想不谋而合。个人认为,以真实样本作为参考的AIGC检测将会是未来的一大趋势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/26661.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析Web通信 HTTP、HTTPS 和 WebSocket

在现代Web开发中,了解和掌握HTTP、HTTPS以及WebSocket协议是非常重要的。这些协议是实现Web应用程序之间通信的基石。本文将详细介绍这三种协议,包括它们的基本概念、工作原理、优缺点以及适用场景。通过深入解析它们的特点和应用,帮助读者更好地理解和使用这些协议。 一、…

【Chrome插件】如何在Chrome插件开发中处理复杂数据结构的存储

最近俺在接触 Chrome 插件开发,需要把一个数据存放到浏览器的存储中。这个数据结构有点复杂,它包含一个 Map 和一个数组。我使用 chrome.storage.local API来存储这个数据,然后在另一个地方获取数据。保存数据的代码并没有报错,但…

代码随想录算法训练营第37天|● 56.合并区间● 738.单调递增的数字

合并区间 56. 合并区间 - 力扣&#xff08;LeetCode&#xff09; 按照左边界从小到大排序之后&#xff0c;如果 intervals[i][0] < intervals[i - 1][1] 即intervals[i]的左边界 < intervals[i - 1]的右边界&#xff0c;则一定有重叠。&#xff08;本题相邻区间也算重贴…

SpringBoot整合H2数据库并将其打包成jar包、转换成exe文件

SpringBoot整合H2数据库并将其打包成jar包、转换成exe文件 H2 是一个用 Java 开发的嵌入式数据库&#xff0c;它的主要特性使其成为嵌入式应用程序的理想选择。H2 仅是一个类库&#xff0c;可以直接嵌入到应用项目中&#xff0c;而无需独立安装客户端和服务器端。 常用开源数…

网页自动化工具入门篇之常用自动化工具

1. Selenium 优点: 功能强大&#xff0c;可以与几乎所有的现代浏览器配合使用。支持多种编程语言&#xff08;如Python, Java, C#, Ruby等&#xff09;。能够处理复杂的网页交互&#xff0c;包括按钮点击、表单填写、拖拽操作等。 缺点: 相对较慢&#xff0c;因为它是真正启动…

Linux Debian12使用podman安装pikachu靶场环境

一、pikachu简介 Pikachu是一个带有漏洞的Web应用系统&#xff0c;在这里包含了常见的web安全漏洞。 二、安装podman环境 Linux Debian系统如果没有安装podman容器环境&#xff0c;可以参考这篇文章先安装podman环境&#xff0c; Linux Debian11使用国内源安装Podman环境 三…

【Numpy】一文向您详细介绍 np.trunc()

【Numpy】一文向您详细介绍 np.trunc() 下滑即可查看博客内容 &#x1f308; 欢迎莅临我的个人主页 &#x1f448;这里是我静心耕耘深度学习领域、真诚分享知识与智慧的小天地&#xff01;&#x1f387; &#x1f393; 博主简介&#xff1a;985高校的普通本硕&#xff0c;…

[数据集][目标检测]中国象棋检测数据集VOC+YOLO格式300张12类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数)&#xff1a;300 标注数量(xml文件个数)&#xff1a;300 标注数量(txt文件个数)&#xff1a;300 标注类别…

Django后台忘记管理员的账号

使用命令启动项目&#xff1a; python manage.py runserver输入后缀/admin&#xff0c;进入后台管理员&#xff0c;如果此时忘记你先前设置的用户名与密码怎么办&#xff1f; 终端输入&#xff1a; python manage.py shell 输入以下内容&#xff0c;并查看返回结果&#xff…

用【R语言】揭示大学生恋爱心理:【机器学习】与【深度学习】的案例深度解析

目录 第一部分&#xff1a;数据收集与预处理 1.1 数据来源 1.2 数据清洗 1.3 数据探索性分析 第二部分&#xff1a;特征工程与数据准备 2.1 特征选择 2.2 特征提取 第三部分&#xff1a;机器学习模型 3.1 逻辑回归模型 3.2 决策树模型 第四部分&#xff1a;深度学习…

spark MLlib (DataFrame-based) 中的聚类算法Bisecting K-Means、K-Means、Gaussian Mixture

Bisecting K-Means 核心原理&#xff1a; Bisecting K-Means 是一种层次 K-Means 聚类算法&#xff0c;基于 Steinbach、Karypis 和 Kumar 的论文《A comparison of document clustering techniques》&#xff0c;并对 Spark 环境进行了修改和适应。 该算法通过递归地将数据集…

ui自动化中,隐式等待和显示等待什么时候使用

隐式等待 在页面刷新加载时&#xff0c;页面元素还没有出来&#xff0c;这个时候如果去找元素就会找不到报错 或者点了一个菜单&#xff0c;页面加载时 用笨办法&#xff0c;就是用sleep等待固定的时间&#xff0c;这种浪费的时间比较多&#xff0c;就可以用隐式等待&#xf…

cocos入门11:生命周期

Cocos Creator 是一个强大的游戏开发工具&#xff0c;它基于 JavaScript 或 TypeScript&#xff0c;并使用 cc.Class 系统来组织游戏逻辑。在 Cocos Creator 中&#xff0c;每个组件&#xff08;包括场景、节点和组件脚本&#xff09;都有其生命周期&#xff0c;这些生命周期函…

美业门店管理系统Java源码分享-【库存管理】的功能和作用

美业收银系统在美容行业中的作用和重要性体现在提高管理效率、提升客户满意度、降低成本、促进业务增长等方面。它为连锁美业提供了一个全面的管理工具&#xff0c;能够更好地应对市场挑战&#xff0c;提升竞争力。 美业系统中的【库存管理】在整个美容行业中起着非常重要的作…

深入理解ChatGPT工作原理

在人工智能领域&#xff0c;自然语言处理&#xff08;NLP&#xff09;技术的飞速发展让机器能够更加自然和人类进行交流。OpenAI的ChatGPT作为当前最受关注的NLP模型之一&#xff0c;其出色的对话能力引起了业界和学术界的广泛关注。本文将深入探讨ChatGPT的工作原理&#xff0…

【SpringCloud学习笔记】RabbitMQ(中)

1. 交换机概述 前面《RabbitMQ上篇》我们使用SpringAMQP来演示如何用Java代码操作RabbitMQ&#xff0c;当时采用的是生产者直接将消息发布给队列&#xff0c;但是实际开发中不建议这么多&#xff0c;更加推荐生产者将消息发布到交换机(exchange)&#xff0c;然后由exchange路由…

Scala 入门指南:从零开始的大数据开发

为什么选择学习 Scala Scala 结合了面向对象编程和函数式编程的特性&#xff0c;使其既具有 Java 的稳健性&#xff0c;又具备 Haskell 的简洁和灵活性。Scala 兼容 Java&#xff0c;运行在 JVM 上&#xff0c;这意味着你可以无缝地使用 Java 库。此外&#xff0c;Scala 是 Ap…

护眼台灯攻略:护眼台灯真的有用吗?

当前&#xff0c;近视问题在人群中愈发普遍&#xff0c;据2024年的统计数据显示&#xff0c;我国儿童青少年的总体近视率已高达52.7%。近视的人越来越多&#xff0c;近视背后还潜藏着视网膜脱离、白内障、开角型青光眼等眼部疾病&#xff0c;严重的情况甚至可能引发失明。长时间…

C++关键字

C是一种强大的、面向对象的编程语言&#xff0c;它提供了一组关键字&#xff08;keywords&#xff09;用于定义语言的基本结构和功能。这些关键字是C语法中预先定义并保留的标识符&#xff0c;它们具有特定的含义&#xff0c;不能用作变量名、函数名或其他标识符。 以下是一些…