Diffusion异常检测相关论文及代码整理

扩散模型(Diffusion Models)是一种生成模型,广泛用于图像生成、文本生成等领域。在异常检测任务中,扩散模型也可以被用来识别和检测异常数据点。该文章对近几年利用扩散模型进行异常检测的文章进行了整理:

2024

1. AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [AAAI 2024]

Github:https://github.com/sjtuplayer/anomalydiffusion

【要点】:AnomalyDiffusion是一种新型的基于扩散的少样本异常生成模型,利用大规模数据集学习的强先验信息来增强生成的真实性和准确性。
【方法】:通过空间异常嵌入和自适应焦点重新加权机制,分别解耦异常信息并重建生成异常图像与异常遮罩的适配器。
【实验】:通过大量实验证明,AnomalyDiffusion在生成真实性和多样性方面名称明显着现有方法,并有效提高了下游异常检测任务的性能。
在这里插入图片描述

2. DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [AAAI 2024]

Github:https://github.com/lewandofskee/DiAD
【内容】:本文提出了一种基于扩散模型的多类异常检测框架DiAD,通过像素空间自动编码器、潜在空间语义引导网络及特征空间预训练特征提取器,在保持图像类别和像素结构上实现了缺陷前提下的异常检测。
【方法】:通过构建一个包含像素空间自动编码器、潜在空间语义引导网络(SG网络)和特征空间预提取器的DiAD框架,该方法能够有效重建异常区域并保持原始图像的语义信息。
【实验】:在MVTec-AD和VisA数据集上的实验表明,DiAD方法在多类异常检测上超越了现有技术水平,在MVTec-AD数据集上96.8/52.6(AUROC/AP)的实现了定位和检测性能。在这里插入图片描述

3. Learning Diffusion Models for Multi-View Anomaly Detection [ECCV 2024]

【要点】:本文提出了一种多视角异常检测方法,通过训练一个视角不变的控制网络(ControlNet)以不同视角下的数据,有效实现视角异常检测的精度。
【方法】:作者使用了一种训练策略,该策略通过建立视角不变的控制网络,生成一致的特征图,以减少不同键盘条件的影响,并有效融合RGB颜色外观和3D法线几何信息。
【实验】:在Eyecandies数据集上进行了广泛的消融研究,并展示了现有方法的实验结果,改进了使用DDIM方案来基于扩散特征的记忆库在异常检测推断中的适用性。在这里插入图片描述

4. TransFusion – A Transparency-Based Diffusion Model for Anomaly Detection [ECCV 2024]

Github:https://github.com/MaticFuc/ECCV_TransFusion
【要点】:本论文提出了一种基于缺陷的扩散模型TransFusion,用于表面异常检测,利用缺陷逐渐增加的扩散过程,恢复出准确的异常区域,并保持无异常区域的细节。
【方法】:通过实现不断递增的扩散过程,实现创新的异常检测方法TransFusion。
【实验】:在VisA和MVTec AD数据集上,TransFusion取得了98.5%和99.2%的图像级AUROC,达到了最先进的性能
在这里插入图片描述

5. GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [ECCV 2024]

Github:https://github.com/hyao1/GLAD
【要点】:本文提出了一种全局和局部自适应增益模型(GLAD),通过预测特定去噪步骤以及引入合成异常样本训练,提高了无监督异常检测中图像重建的质量和准确性。
【方法】:GLAD模型通过评估内容与从扩散模型中提取的先验之间的差异,为每个预测样本一个特定的去噪融合图像步骤,并采用空间自适应特征方案以适应异常区域和正常区域的重建差异。
【实验】:在MVTec-AD、MPDD、VisA三个常用异常检测数据集整合以及PCB-Bank数据集上进行广泛实验,证明了所提方法的有效性。
在这里插入图片描述

6. R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection [ECCV 2024]

Homepage:https://zhouzheyuan.github.io/r3d-ad
【要点】:论文提出了一种名为R3D-AD的方法,通过扩散模型重建异常点,用于精确的3D异常检测,创新点在于利用扩散过程的数据分布转换完全隐藏输入的异常几何形状,并逐步学习严格的点级行为。
【方法】:方法采用基于扩散模型的重建策略,通过逐步学习来修复异常点。
【实验】:实验中利用了Patch-Gen这一新颖的3D异常模拟策略,生成真实且多样的缺陷形状,缩小训练与测试之间的领域差距。在统一的空间变换下,通过距离比较直接生成实验证明,R3D-AD在准确度和效率上超越了之前的最先进方法,在数据集上的准确度达到73.4,异常检测效率达到74.9。
在这里插入图片描述

7. CAGEN: Controllable Anomaly Generator using Diffusion Model [ICASSP 2024]

【要点】:本文提出了CAGEN,一种基于扩散模型的可控异常生成器,用于数据增强,能够生成高质量且可控的异常图像,有效提高了异常检测的性能。
【方法】:CAGEN方法通过使用二进制蒙版和文本提示控制器ControlNet模型,控制生成异常的空间定位和风格。
【实验】:在标准异常检测基准上的实验表明,所提出的数据增强方法使得AUROC/AP指标显着提高了0.4/3.1,具体使用的数据集未在抽象中回调。

8. MAEDiff: Masked Autoencoder-enhanced Diffusion Models for Unsupervised Anomaly Detection in Brain Images [2024]

【要点】:本文提出了一种用于脑图像无监督异常检测的MAEDiff模型,通过结合掩码自动编码器增强扩散模型,解决有效的医学图像重建增益大和全局信息利用不足的问题。
【方法】:MAEDiff采用分层斑块分割策略,通过在高级别斑块上重叠生成健康图像,并在低级别斑块上应用基于掩码自动编码器的机制,增强非噪声区域的条件。
在这里插入图片描述

9.AnomalyDINO: Boosting Patch-based Few-shot Anomaly Detection with DINOv2

Github:https://github.com/dammsi/AnomalyDINO
【要点】:本文提出了一种基于DINOv2的视觉级异常检测方法AnomalyDINO,用于少量样本异常检测,该方法需要额外训练数据,即可实现图像级和像素级的异常检测,并在多种设置中超越现有技术。

【方法】:AnomalyDINO通过调整DINOv2算法,利用贴片缩小性进行单次和小型样本的异常检测。

【实验】:在MVTec-AD数据集上,AnomalyDINO将单次检测的AUROC从93.1提升至96.2,证明了其在少量样本异常检测中的部分性能。
在这里插入图片描述

10.ANOMALYCLIP: OBJECT-AGNOSTIC PROMPT LEARNING FOR ZERO-SHOT ANOMALY DETECTION

Github:https://github.com/zqhang/AnomalyCLIP
【要点】:论文提出了一种名为AnomalyCLIP的方法,通过学习对象相关的文本提示来捕捉图像中的通用正常性和异常性,实现了不同领域中零样本异常检测的准确性和泛化能力。

【方法】:AnomalyCLIP方法通过改造CLIP模型,利用对象关联的文本提示来关注图像中的异常区域,而不是对象语义,从而在抽取目标数据集训练样本的情况下进行异常检测。

【实验】:作者在17个现实世界的异常检测数据集上进行了大规模实验,AnomalyCLIP在这些数据集上开展了一些零样本检测和分割性能,这些数据集的主题来自于缺陷检测和医学理论领域的具有高度听觉类的异常检测任务。
在这里插入图片描述

2023

11. Energy-Based Models for Anomaly Detection: A Manifold Diffusion Recovery Approach [NeurIPS 2023]

Github:https://github.com/swyoon/manifold-projection-diffusion-recovery-pytorch
【重点】:本研究提出了一种基于能量模型的新算法MPDR,通过利用数据中的低维结构进行异常检测,有效学习数据分配的精确边界。
【方法】:采用流形投影扩散恢复算法,首先在近似训练数据集的低维流形上扰动数据点,然后训练EBM以最大化恢复原始数据的概率。
【实验】:通过生成接近流形的负样本,并在多种数据类型(如图像、名称、声学信号)的异常检测任务上进行测试,实验结果表明MPDR算法表现出色。
在这里插入图片描述

12. DiffusionAD: Denoising diffusion for anomaly detection. arXiv, 2023.

Github:https://github.com/HuiZhang0812/DiffusionAD
【要点】:论文提出了一种名为DiffusionAD的新方法,将异常检测视为“噪声到正常”的范式,通过去噪网络和分割网络的协作,实现视觉的观察异常检测和定位,显着着提高了检测效率和性能。

【方法】:DiffusionAD包括一个噪声去子网络和一个分割子网络,共同提供高清的抓取异常检测和定位。

【实验】:在VisA和DAGM等标准及具有共识的基准数据集上进行广泛评估,结果表明DiffusionAD超越了当前最先进的检测范式,证明了其有效性和泛化能力。
在这里插入图片描述

13. Anomaly detection with conditioned denoising diffusion models. arXiv, 2023.

Github:https://github.com/arimousa/DDAD
【要点】:论文提出了一种名为Denoising Diffusion Anomaly Detection (DDAD)的新方法,该方法通过条件去噪扩散模型进行图像重建,以实现异常检测和定位,显著提高了检测的准确性和效率。

【方法】:DDAD框架包括一个条件去噪过程,该过程以目标图像为条件,引导去噪过程以生成接近目标图像的无异常重建图像。异常通过输入图像和重建图像之间的像素级和特征级比较来定位。此外,为了增强特征级比较的有效性,论文引入了一种域适应方法,利用来自条件去噪过程的几乎相同的生成示例来微调预训练的特征提取器。

【实验】:DDAD在多个数据集上进行了验证,包括MVTec和VisA基准测试,分别达到了99.8%和98.9%的图像级AUROC,展示了其在异常检测任务上的有效性和优越性能。论文还介绍了DDAD的压缩版本(DDAD-S),专为资源受限的应用设计。
在这里插入图片描述

14. Unsupervised out-of-distribution detection with diffusion inpainting. ICML, 2023.

Github:https://github.com/zhenzhel/lift_map_detect
【要点】:本文提出了一种称为Lift, Map, Detect (LMD)的无监督域外检测新方法,利用扩散模型将图像从原始流形提升并映射到域内流形,通过比较映射后的图像与原始流形的距离来识别域外数据。

【方法】:LMD方法包括三个步骤:提升(提升)、映射(映射)和检测(检测)。首先通过腐蚀操作提升图像;然后利用扩散模型将提升后的图像映射到域内流形;最后,根据映射后的图像与原始流形的距离来检测图像是否为域外数据。

【实验】:作者在多个数据集上进行了广泛的实验,结果表明LMD在域外检测任务上具有交互性。实验使用了多种生成模型——扩散模型,该模型通过学习一个渐进去噪声过程,将噪声图像逐渐映射到训练流形上。
在这里插入图片描述

15. On diffusion modeling for anomaly detection. arXiv, 2023

【要点】:
论文提出了一种新的基于扩散模型的异常检测方法Diffusion Time Estimation (DTE),该方法通过估计输入数据的扩散时间分布来识别异常,显著提高了检测效率和准确性。

【方法】:
DTE简化了传统的Denoising Diffusion Probability Models (DDPM),直接估计与异常检测相关的扩散时间,而非重建去噪图像。该方法利用深度神经网络提高推断效率,并以扩散时间的众数或均值作为异常评分。

【实验】:
在ADBench基准测试中,DTE在半监督和无监督设置下均展现出竞争力,尤其是在推理速度上远超DDPM,同时在多个数据集上检测性能优异。论文还发现,使用预训练的图像嵌入能显著提升DTE的性能。

16. Mask, stitch, and re-sample: Enhancing robustness and generalizability in anomaly detection through automatic diffusion models. arXiv, 2023.

Github:https://github.com/ci-ber/autoDDPM
【要点】:论文提出了一种名为AutoDDPM的新型方法,通过自动增强扩散模型异常检测的鲁性和泛化能力,有效克服现有扩散模型在噪声粒度控制和泛化棒性方面的掩模。

【方法】:AutoDDPM采用扩散模型生成潜在异常的初始相似图像,并与原始图像无缝集成,通过联合噪声分布重采样实现图像的调节和修复效果。

【实验】:作者在未具体提及的数据集上测试了AutoDDPM的效果,并展示了该方法在替换异常区域的同时保留健康组织方面的相应性能,显着超越了传统扩散模型的限制。在这里插入图片描述

17. Unsupervised anomaly detection in medical images using masked diffusion model. arXiv, 2023

Github:https://mddpm.github.io/
【要点】:本研究提出了一种基于遮挡遮挡的概率模型(mDDPM)的无监督异常检测方法,通过引入基于遮挡遮挡的正则化方法来解决人脑解剖复杂性和无监督生成准确性的问题。该方法在医疗应用中首次尝试了掩蔽频率建模(MFM)。

【方法】:本研究提出了一种称为mDDPM的方法,引入基于掩蔽的正则化,以重构人脑模型。其中包括掩蔽图像建模(MIM)和掩蔽频率建模(MFM)。

【实验】:本研究利用包含肿瘤和多发性淋巴瘤疾病的数据集对方法进行评估,并展示了与现有的全/弱监督基准方法相比,无监督方法的卓越性能。在这里插入图片描述

18. ImDiffusion: Imputed diffusion models for multivariate time series anomaly detection. arXiv, 2023

Github:https://github.com/17000cyh/IMDiffusion

【要点】:论文提出了一种新的多变量时间序列异常检测框架IMDIFFUSION,通过结合时间序列填充和扩散模型提高了检测的准确性和鲁棒性。

【方法】:IMDIFFUSION利用时间序列中邻近值的信息进行数据填充,并通过扩散模型捕获复杂的依赖关系,从而减少数据不确定性,增强异常检测的鲁棒性。

【实验】:作者在多个标准数据集上评估了IMDIFFUSION的性能,实验结果表明该方法在检测准确性和时效性上均基于现有的先进方法,并在微软的实际生产系统中实现了11.4 %的F1粉丝提升。
在这里插入图片描述

2022

19. AnoDDPM: Anomaly detection with denoising diffusion probabilistic models using simplex noise. CVPR, 2022.

Github:https://github.com/Julian-Wyatt/AnoDDPM
【要点】:本文提出了一种名为AnoDDPM的半扩散异常检测方法,结合了DDPM的优势和多探针单纯形噪声控制异常大小的能力,显着提升了基于重建的异常检测性能。

【方法】:AnoDDPM通过部分扩散过程和单纯噪声扩散,改进了DDPM在异常检测中的应用。

【实验】:研究使用22例T1加权MRI扫描的肿瘤数据集(CCBS Edinburgh),通过对比实验显示AnoDDPM在定性和定量上均显着超越了f-AnoGAN和高斯扩散,Sørensen–Dice系数提高了25.5% ,IoU提高了17.6%,AUC提高了7.4%。
在这里插入图片描述

20. Diffusion models for medical anomaly detection. MICCAI, 2022

Github:https://github.com/JuliaWolleb/diffusion-anomaly
【要点】:
论文介绍了一种基于去噪扩散隐式模型(DDIMs)的弱监督异常检测方法,用于医学图像分析,特别适用于只有图像级标注的情况。

【方法】:
该方法通过结合确定性的迭代噪声过程和分类器引导,实现疾病和健康图像间的转换,生成详细的异常图。

【实验】:
在BRATS2020脑肿瘤和CheXpert胸膜积液数据集上的实验结果显示,该方法能生成真实且详细的异常图,优于其他方法。在这里插入图片描述

21.f-AnoGAN: Fast unsupervised anomaly detection with generative adversarial networks

Github:https://github.com/tSchlegl/f-AnoGAN
【要点】:f-AnoGAN 是一种快速的无监督异常检测方法,利用生成对抗网络(GAN)实现,特别适用于实时异常检测应用,能够实现图像级别检测异常,并在像素级别进行定位。

【方法】:该方法采用Wasserstein训练GAN(WGAN)进行,并使用未标记的正常数据通过无监督学习对编码器进行训练。

【实验】:论文通过全面的实验评估,比较了f-AnoGAN与其他替代方法的表现,实验结果表明f-AnoGAN在异常检测任务上具有同等的准确性和实时性。数据集名称未在摘要中中扭转,但实验包括异常检测图像级别和像素级别的具体应用。
在这里插入图片描述

22.Patch SVDD: Patch-level SVDD for Anomaly Detection and Segmentation

Github:https://github.com/nuclearboy95/Anomaly-Detection-PatchSVDD-PyTorch
【要点】:
Patch SVDD是一种基于SVDD的深度学习方法,用于图像异常检测和分割,特别适合仅有图像级标注的情况。

【方法】:
结合自监督学习和多尺度检查,Patch SVDD能生成精确的异常图,定位像素级别的异常。

【实验】:
在MVTec AD数据集上,Patch SVDD在异常检测和分割任务上均优于现有方法,能生成真实且详细的异常图。

更多异常检测相关文章:

1.https://github.com/amirhossein-kz/Awesome-Diffusion-Models-in-Medical-Imaging?tab=readme-ov-file#anomaly-detection
2.https://github.com/M-3LAB/awesome-industrial-anomaly-detection?tab=readme-ov-file
https://github.com/cqylunlun/glass?tab=readme-ov-file

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/62084.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

蓝桥杯c++算法秒杀【6】之动态规划【下】(数字三角形、砝码称重(背包问题)、括号序列、异或三角:::非常典型的必刷例题!!!)

别忘了请点个赞收藏关注支持一下博主喵!!!! ! ! ! ! 关注博主,更多蓝桥杯nice题目静待更新:) 动态规划 三、括号序列 【问题描述】 给定一个括号序列,要求尽可能少地添加若干括号使得括号序列变得合…

LLM PPT Translator

LLM PPT Translator 引言Github 地址UI PreviewTranslated Result Samples 引言 周末开发了1个PowerPoint文档翻译工具,上传PowerPoint文档,指定想翻译的目标语言,通过LLM的能力将文档翻译成目标语言的文档。 Github 地址 https://github.…

三格电子—EtherNet IP转Modbus RTU网关

EtherNet/IP转Modbus RTU网关 SG-EIP-MOD-210 产品用途 SG-EIP-MOD-210网关可以实现将Modbus接口设备连接到 EtherNet/IP网络中。用户不需要了解具体的Modbus和 EtherNet/IP协议即可实现将Modbus设备挂载到 EtherNet/IP接口的PLC上,并和Modbus设备进行数据交互。拓…

【计算机网络】核心部分复习

目录 交换机 v.s. 路由器OSI七层更实用的TCP/IP四层TCPUDP 交换机 v.s. 路由器 交换机-MAC地址 链接设备和设备 路由器- IP地址 链接局域网和局域网 OSI七层 物理层:传输设备。原始电信号比特流。数据链路层:代表是交换机。物理地址寻址,交…

前端网络请求:从 XMLHttpRequest 到 Axios

​🌈个人主页:前端青山 🔥系列专栏:Vue篇 🔖人终将被年少不可得之物困其一生 依旧青山,本期给大家带来Vue篇专栏内容:前端网络请求:从 XMLHttpRequest 到 Axios 前言 在网络应用中,前后端的数据…

计算机毕业设计Python+大模型美食推荐系统 美食可视化 美食数据分析大屏 美食爬虫 美团爬虫 机器学习 大数据毕业设计 Django Vue.js

温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…

Element UI 打包探索【2】

目录 第三个命令 第四个命令 第五个命令 第六个命令 第七个命令 cross-env BABEL_ENV babel 第八个命令 总结 书📚接上文Element UI 打包探索【1】我们继续来看 第三个命令 "lint": "eslint src/**/* test/**/* packages/**/* build/**/* …

一篇保姆式centos/ubuntu安装docker

前言: 本章节分别演示centos虚拟机,ubuntu虚拟机进行安装docker。 上一篇介绍:docker一键部署springboot项目 一:centos 1.卸载旧版本 yum remove docker docker-client docker-client-latest docker-common docker-latest doc…

游戏引擎学习第23天

实时代码编辑功能的回顾 当前实现的实时代码编辑功能已经取得了显著的成功,表现出强大的性能和即时反馈能力。该功能允许开发者在修改代码后几乎立即看到变化在运行中的程序中体现出来,极大提升了开发效率。尽管目前的演示内容较为简单,呈现…

【代码pycharm】动手学深度学习v2-08 线性回归 + 基础优化算法

课程链接 线性回归的从零开始实现 import random import torch from d2l import torch as d2l# 人造数据集 def synthetic_data(w,b,num_examples):Xtorch.normal(0,1,(num_examples,len(w)))ytorch.matmul(X,w)bytorch.normal(0,0.01,y.shape) # 加入噪声return X,y.reshape…

基于Spring Boot+Unipp的博物馆预约小程序(协同过滤算法、二维码识别)【原创】

🎈系统亮点:协同过滤算法、二维码识别; 一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构:B/S架构 运行环境:win10/win11、jdk17 前端: 技术:框…

什么是 WPF 中的依赖属性?有什么作用?

依赖属性(Dependency Property)是 WPF 的一个核心概念,它为传统的 .NET 属性提供了增强功能,支持绑定、样式、动画和默认值等功能。通过依赖属性,WPF 提供了一种灵活的数据驱动的方式来处理 UI 属性。 1. 什么是依赖属…

【TS】TypeScript基本使用

什么是TypeScript? 是一种编程语言,是JavaScript的超集,过添加静态类型、类、接口和模块等功能,使得在大型应用程序中更容易进行维护和扩展,可以编译成纯JavaScript 静态类型和动态类型有什么区别? 静态…

git 命令之只提交文件的部分更改

git 命令之只提交文件的部分更改 有时,我们在一个文件中进行了多个更改,但只想提交其中的一部分更改。这时可以使用 使用 git add -p 命令 Git add -p命令允许我们选择并添加文件中的特定更改。它将会显示一个交互式界面,显示出文件中的每个更…

深度学习网络模型 MobileNet系列MobileNet V1、MobileNet V2、MobileNet V3网络详解以及pytorch代码复现

深度学习网络模型 MobileNet系列MobileNet V1、MobileNet V2、MobileNet V3网络详解以及pytorch代码复现 1、DW卷积与普通卷积计算量对比DW与PW计算量普通卷积计算量计算量对比 2、MobileNet V1MobileNet V1网络结构MobileNet V1网络结构代码 3、MobileNet V2倒残差结构模块倒残…

[极客大挑战 2019]BabySQL--详细解析

信息搜集 进入界面: 输入用户名为admin,密码随便输一个: 发现是GET传参,有username和password两个传参点。 我们测试一下password点位能不能注入: 单引号闭合报错,根据报错信息,我们可以判断…

C 语言面向对象

面向对象的基本特性:封装,继承,多态 1.0 面向过程概念 当我们在编写程序时,通常采用以下步骤: 1. 将问题的解法分解成若干步骤 2. 使用函数分别实现这些步骤 3. 依次调用这些函数 这种编程风格的被称作 面向过程…

VMware16安装macOS12【详细教程】

因为在应用上线IOS应用商店时,需要用到mac系统进行,于是就在VMware16pro虚拟机进行安装macOS12系统,安装的过程做了一个记录,希望对你有所帮助! 前言 首先需要下载好下面工具: VMware workstation pro 16…

视频推拉流EasyDSS互联网直播点播平台技术特点及应用场景剖析

在数字科技日新月异的今天,视频直播和点播已经成为互联网内容传播的重要方式之一。而互联网直播点播平台EasyDSS作为功能强大的流媒体直播点播视频能力平台,提供了一站式的视频推拉流、转码、直播、点播、时移回放、存储等视频服务,广泛应用于…

【Python】分割秘籍!掌握split()方法,让你的字符串处理轻松无敌!

在Python开发中,字符串处理是最常见也是最基础的任务之一。而在众多字符串操作方法中,split()函数无疑是最为重要和常用的一个。无论你是Python新手,还是经验丰富的开发者,深入理解并熟练运用split()方法,都将大大提升…