文献速递:(第三部分)— (超声非破坏性评估中合成和增强训练数据生成与评估的最新研究进展)

文献速递:(第三部分)— (超声非破坏性评估中合成和增强训练数据生成与评估的最新研究进展)

Title

题目

A review of synthetic and augmented training data for machine learning in ultrasonic non-destructive evaluation

机器学习在超声非破坏性评估中的合成和增强训练数据综述

01
文献速递:

介绍

注:原文篇幅较长,这里分多次进行分享。

近年来,超声检测(UT)在机器学习(ML)的应用不断增加,推动了缺陷检测和分类中更高级别的自动化和决策制定。在非破坏性评估(NDE)中,特别是在UT中应用ML,构建一个通用的训练数据集极其困难,因为需要原始和具有代表性的有缺陷样本的数据。然而,在大多数UT测试案例中,有缺陷的样本数据本质上很少,使得数据覆盖成为应用ML时的主要问题。常见的数据增强(DA)策略提供的解决方案有限,因为它们不增加数据集的变异性,可能导致对训练数据的过拟合。虚拟缺陷方法和最近在UT中应用的生成对抗神经网络(GANs)是旨在解决这一问题的复杂DA方法。另一方面,超声波动传播建模方面的成熟研究允许生成合成UT训练数据。在这一背景下,我们提出了第一个主题综述,总结了过去几十年在NDE中合成和增强UT训练数据的进展。此外,还介绍了合成UT数据生成和增强的方法概述。介绍并讨论了有限元、有限差分和弹性动力有限积分等数值方法,以及广义点源合成、高斯束叠加和铅笔法等半解析方法以及其他UT建模软件。同样,介绍并讨论了现有的一维和多维UT数据、特征空间增强和用于增强的GANs的DA方法。文章最后详细讨论了现有方法在合成UT训练数据生成和UT数据DA方面的优势和局限性,以帮助读者决定应用于特定测试案例。

*State of the art of generation and evaluation of synthetic and augmented ultrasonic training data in non-destructive evaluation*

非破坏性评估中合成和增强超声训练数据生成与评估的最新研究状态(原文第四部分)

使用模拟方法的不同途径

早期研究由于实验数据的稀缺,主要是为了验证ML方法在NDE领域的可行性。例如,通过二维有限元模型(FEM)生成超声A扫描图,用于训练简单的神经网络(NN),以识别和分类缺陷。这些研究中,超声波系统主要使用一到两个换能器,以脉冲回波或投掷-接收配置激发引导波或穿透式体波。由于当时计算能力有限,测试案例和代表性的FEM模型相对简单,元素数量有限。此外,由于计算资源稀缺,生成的数据集规模较小,仅包含几百个条目,这对于浅层NN来说可能足够。这些数据集被用于ML模型的训练和验证。

在特征向量的构建上,从模拟的A扫描图中提取了手动选择的特征,如峰值高度和峰值时间等。有些研究中,完整的采样波形被直接用作NN的输入。网络的性能取决于输入NN的特征选择的“优劣”。

为了使这些结果具有普遍性,需要更大的合成数据集。为了使数值数据与实验案例相匹配,应用了噪声增强和考虑了材料衰减。在后面还对噪声增强的更多细节进行了描述。

此外,还有研究使用NN进行梁和杆状结构的缺陷检测,通过2D-FEM和半解析模型生成频率响应曲线,直接用作训练NN的输入特征空间。还有研究比较了使用不同深度学习网络(如DNN、CNN、RNN和LSTM)检测1D波导中的裂纹。

相控阵超声换能器和卷积神经网络的结合使用。 随着UT案例的复杂性增加,相应的NDT系统(如PAUT)也在发展,产生了丰富的类似图像的UT数据。基于DNN在图像分类方面的成功,越来越多地使用这种ML框架进行NDE。与浅层学习相比,CNN可以独立学习最优特征,但通常需要更多的数据。

使用GANs(生成对抗网络)和数值方法的途径。 自2014年GANs被引入以来,使用GANs生成UT训练数据的概念首次由Virupakshappa等人提出。他们使用多物理云软件OnScale对金属块中不同缺陷类型的浸没式UT测试设置进行了建模,生成了B扫描图像数据。

**
**

讨论了使用粒子滤波器的方法

粒子滤波器(PF)基于概率方法,允许测量和模拟模型中的误差。通过将模拟数据与测量数据合并,PF估计状态变量的概率密度函数。在这里,散射分量(与缺陷几何形状相关的特定信息)被用于PF中的似然评估。该方法在超声测量中得到了成功的演示,能够仅使用单个换能器获得的一个PE信号来识别铝样品中人工缺陷的几何形状。

**
**

使用数据增强方法的途径

可以使用输入空间数据增强方法人为地扩充现有的UT数据库。具体使用的方法取决于UT数据的格式和期望的目标。最常见和广泛使用的输入空间数据增强方法之一是添加噪声或在某些情况下降低噪声。在上述几乎所有工作中,都使用了向合成UT数据中添加噪声的方法,以考虑粒子噪声和电子设备(包括换能器)的噪声,以及提高训练的鲁棒性。

这一部分详细介绍了在非破坏性评估中使用合成和增强超声波训练数据的最新研究进展,涵盖了从早期的简单模型到最新的深度学习和数据增强技术的发展。

Figure

图片

Fig. 12. Schematic overview of the framework. A CNN is fully trained using 3D simulation data (top). The simulation trained CNN is then applied to predict length, location, and orientation of embedded cracks from independent experimental ultrasound signals (bottom). Normalized A-scans were used as input to the CNN. Reprinted from Publication [186], with permission from Elsevier.

图 12. 框架的示意概览。使用3D模拟数据(顶部)完全训练一个卷积神经网络(CNN)。然后,将训练有素的模拟CNN应用于从独立的实验性超声信号中预测嵌入裂纹的长度、位置和方向(底部)。标准化的A扫描被用作CNN的输入。经Elsevier许可,转载自出版物[186]。

图片

Fig. 13. Reprint from [195] of the investigation of AGWN to the signals. (b) Location of activated values for a single time trace (b) from the first layers of a CNN trained on noisy data and noise-free data. Images used are under the CCBY-4.0 license as stated in Section 7.

图 13. 从[195]重印的对信号进行加性高斯白噪声(AGWN)调查。(b) 单个时间轨迹(b)的激活值位置,来自于在有噪声数据和无噪声数据上训练的CNN的第一层。所使用的图像根据第7节声明,遵循CC-BY-4.0许可

图片

Fig. 14. (a) Geometry of the 2D-EFIT simulation model to identify the void size and the center-to-center distance of the voids. Snapshots of the velocity field at 8 µs in three different simulation models, (a) is 0.51 mm and is 3.59 mm, (b) is 2.74 mm and is 8.99 mm, and © is 3.54 mm and is 6.24 mm. Reprint with permission from K. Nakahata.

图 14. (a) 用于识别空洞大小和空洞之间中心到中心距离的二维电场仿真模型(2D-EFIT)的几何结构。在三种不同的仿真模型中,8微秒时的速度场快照,(a)为0.51毫米且为3.59毫米,(b)为2.74毫米且为8.99毫米,©为3.54毫米且为6.24毫米。经K. Nakahata许可转载。

图片

Fig. 15. Example plots of augmented A-scans using methods of time-shifting and noise augmentation. (a + b) Time shift of ± 5 µs, ± 10 µs and original signal, (d) noise augmented signal with SNR = 5. Reprinted from Publication [110], with permission from Elsevier.

图 15. 使用时间移位和噪声增强方法增强A扫描的示例图。(a + b) 时间移位 ±5 微秒、±10 微秒和原始信号,(d) 信噪比为5的噪声增强信号。转载自出版物 [110],经Elsevier许可。

图片

Fig. 16. Examples of augmented B-scans visualized as images from the training set using the virtual defect method, from [20]. (a) Baseline B-scan image with local background noise, (b + c) Baseline image and virtual defect placed at two different positions. Images used are under the CC-BY-4.0 license as stated in Section 7.

图 16. 使用虚拟缺陷方法从训练集中将增强的B扫描可视化为图像的示例,来源于[20]。(a) 带有局部背景噪声的基线B扫描图像,(b + c) 基线图像和在两个不同位置放置的虚拟缺陷。所使用的图像根据第7节声明,遵循CC-BY-4.0许可。

图片

Fig. 17. Examples from the training set of thermoelastic ultrasound waves images from [204]. Image DA methods such as rotation, flipping, scaling and translation were applied. Images used are under the CC-BY-4.0 license as stated in Section 7.

图 17. 来自[204]的训练集中热弹性超声波图像的示例。应用了图像数据增强(DA)方法,如旋转、翻转、缩放和平移。所使用的图像根据第7节声明,遵循CC-BY-4.0许可。

图片

Fig. 18. Schematic of the proposed GAN architectures for data generation of UT B-scans. The proposed architectures DetectionGAN and SPADE-GAN differ in the generator model. Reprinted from [215] with permission from Elsevier.

图 18. 提出的用于超声B扫描数据生成的GAN架构示意图。提出的架构DetectionGAN和SPADE-GAN在生成器模型上有所不同。经Elsevier许可,转载自[215]。

图片

Fig. 19. Measured and augmented B-scan images generated using GANs. (a) measured B-scan, (b) flawed B-scan generated using the virtual defect method, (b) image generated using DetectionGAN and (d) SPADE-GAN. Reprinted from [215] with permission from Elsevier.

图 19. 使用GANs生成的测量和增强B扫描图像。(a) 测量的B扫描,(b) 使用虚拟缺陷方法生成的有缺陷的B扫描,(b) 使用DetectionGAN生成的图像和(d) SPADE-GAN。经Elsevier许可,转载自[215]。

图片

Fig. 20. Reprinted from [29] showing the Dataset collection: (a) experimental setup and defect detection method; (b) three different types, i.e. pinhole, crack, and corrosion and the nondestructive specimen in pipes; © detection signals for different defect types; (d) standardized results using absolute value normalization; (e) virtual defect method for data enhancement; (f) composition of the ultrasonic dd detection signal dataset. Images used are under the CC-BY-4.0 license as stated in Section 7.

图 20. 转载自[29],展示数据集收集:(a) 实验设置和缺陷检测方法;(b) 三种不同类型,即针孔、裂纹和腐蚀,以及管道中的无损检测样品;© 不同缺陷类型的检测信号;(d) 使用绝对值归一化的标准化结果;(e) 虚拟缺陷方法用于数据增强;(f) 超声dd检测信号数据集的组成。所使用的图像根据第7节声明,遵循CC-BY-4.0许可。

图片

Fig. 21. US-WGAN generated signals for different training epochs. Initial pulse was learned after approx 10 epochs. The reflection signal from the corrosion defect was learned after approx 3000 epochs (peak at approx 200 µs). Reprinted from [44]. Images used are under the CC-BY-4.0 license as stated in Section 7.

图 21. US-WGAN为不同训练周期生成的信号。在大约10个周期后学习到了初始脉冲。在大约3000个周期后学习到了来自腐蚀缺陷的反射信号(在大约200微秒处的峰值)。转载自[44]。所使用的图像根据第7节声明,遵循CC-BY-4.0许可。

图片

Fig. 22. Graphical representation of reviewed literature in NDE using synthetic data generation or DA methods to build UT datasets for ML models. The height of the black vertical connection bars is proportional to the number of references. Abbreviations: Direct Transmission DT, Frequency-Response FR, Guided Waves GW, Phased Array Ultrasonic Transducer PAUT, Pitch-Catch PC, Pulse-Echo PE.

图 22. 使用合成数据生成或数据增强(DA)方法构建机器学习(ML)模型的超声(UT)数据集的无损评估(NDE)文献综述的图形表示。黑色垂直连接条的高度与参考文献数量成比例。缩写:直接传输 DT,频率响应 FR,引导波 GW,相控阵超声换能器 PAUT,发射-接收 PC,脉冲回波 PE。

图片

Fig. 23. Graphical representation of the numerical and augmentation methods applied, as well as the model dimensionality of the reviewed literature on the topic. Abbreviations: Deep Convolutional Generative Adversarial Neural Network DCGAN, Elastodynamic Finite Integration Technique EFIT, Finite Element Method FEM, Boundary Integration Method BIM, Ray Methods, Spectral Finite Element Method SFEM, Time Shift TS, Data Augmentation DA.

图 23. 对所审查文献主题的数值和增强方法及模型维度的图形表示。缩写:深度卷积生成对抗神经网络 DCGAN,弹性动力学有限积分技术 EFIT,有限元方法 FEM,边界积分法 BIM,射线方法,谱有限元法 SFEM,时间移位 TS,数据增强 DA。

图片

Fig. 24. Graphical representation of the ML methods used in combination with synthetic and augmented UT training data.

图 24. 与合成和增强UT训练数据结合使用的ML方法的图形表示

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/198246.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

iOS17桌面待办事项提醒小组件,让的iPhone变身提醒神器

在现代社会,每天都有太多的事情需要处理,而我经常发现自己在繁忙中遗漏一些重要的事项。曾经,我每次都要在纸上记下要做的事情,可事后发现,这也没能解决我的忘性问题。 直到我尝试了一个新的方式,我的iPho…

韵达单号查询,韵达快递查询,用表格导出单号的详细物流信息

批量查询韵达快递单号的物流信息,并以表格的形式导出单号的详细物流信息。 所需工具: 一个【快递批量查询高手】软件 韵达快递单号若干 操作步骤: 步骤1:运行【快递批量查询高手】软件,第一次使用的伙伴记得先注册&…

DCMTK 目录结构

DCMTK 目录结构 经过编译后的DCMTK包含许多文件,在使用的时候我们需要将这些文件包含到对应的项目中,源码编译得到的文件如下: 如果你还没有成功编译,可以参考 dcmtk编译失败后的解决思路(附带编译后文件下载&#x…

【生物医学信号处理及其MATLAB应用】Chapter 1 生物医学信号概述

Chapter 1 生物医学信号概述 第一章 生物医学信号概述一、信号二、生物医学信号三、生物医学信号处理的内容三、处理生物医学信号的目的 第一章 生物医学信号概述 一、信号 ​ 信号:携带信息的物理量 ​ 来自于真实世界的信号各不相同,但大致可分为四…

【Linux】编译器-gcc/g++与调试器-gdb的使用

👀樊梓慕:个人主页 🎥个人专栏:《C语言》《数据结构》《蓝桥杯试题》《LeetCode刷题笔记》《实训项目》《C》《Linux》 🌝每一个不曾起舞的日子,都是对生命的辜负 目录 前言 1.gcc/g语法 2.gcc的使用及…

【教程】苹果推送证书的创建和使用流程详解

​ 摘要 本篇博客主要介绍了苹果推送证书的使用流程。首先,在苹果开发者中心创建推送证书,然后在应用程序中使用该证书进行消息推送。文章详细说明了创建推送证书的步骤,并提供了在应用程序中注册推送服务、发送推送消息以及处理推送消息的相…

Databend 开源周报第 122 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 支持链式函数调…

PWN学习之LLVM入门

一、基本流程 ①找到runOnFunction函数时如何重写的,一般来说runOnFunction都会在函数表最下面,找PASS注册的名称,一般会在README文件中给出,若是没有给出,可通过对__cxa_atexit函数"交叉引用"来定位: ②通…

GEE:Sobel算子卷积和Roberts算子卷积对比

作者:CSDN @ _养乐多_ 本文介绍了Sobel算子卷积和Roberts算子卷积操作的代码,并进行了图像对比,可以观察到两个算子的细微差异。 文章目录 一、Sobel算子和Roberts算子对比二、完整代码三、代码链接一、Sobel算子和Roberts算子对比 详细介绍介绍参考《遥感数字图像处理教程…

MySQL笔记-第03章_基本的SELECT语句

视频链接:【MySQL数据库入门到大牛,mysql安装到优化,百科全书级,全网天花板】 文章目录 第03章_基本的SELECT语句1. SQL概述1.1 SQL背景知识1.2 SQL语言排行榜1.3 SQL 分类 2. SQL语言的规则与规范2.1 基本规则2.2 SQL大小写规范 …

算法-02-排序-冒泡插入选择排序

一般最经典的、最常用的:冒泡排序、插入排序、选择排序、归并排序、快速排序、计数排序、基数排序、桶排序。那么我们如何分析一个"排序算法"呢? 1-分析排序算法要点 时间复杂度:具体是指最好情况、最坏情况、平均情况下的时间复杂…

算法-滑动窗口

一、滑动窗口思想 概念 在数组双指针里,我们介绍过 "对撞型" 和 "快慢型" 两种方式,而滑动窗口思想就是快慢型的特例。 实际使用 计算机网络中有滑动窗口协议(Sliding Window Protocol),该协议…

10、pytest通过assert进行断言

官方实例 # content of test_assert1.pydef f():return 3def test_function():assert f() 4def test_assert_desc():a f()# assert a % 2 0assert a % 2 0, "value was odd, should be even"解读与实操 pytest允许你使用标准python断言来验证测试中的期望和值&…

NodeJS(二):npm包管理工具、yarn、npx、pnpm工具等

目录 (一)npm包管理工具 1.了解npm 2.npm的配置文件 常见的配置属性 scripts属性*** 依赖的版本管理 3.npm安装包的细节 4.package-lock文件 5.npm install原理** 6.npm的其他命令 (二) 其他包管理工具 1.yarn工具 基本指令 2.cnpm工具 3.npx工具 (1)执行本地…

SAP中的新旧事务码

SAP中的新旧事务码 SAP随着新版本的发布,我们知道sap已经更新了很多的程序和TCODE。sap提供了很多新的TCODE来替换旧的TCODE,新TCODE有很多的新特性和新功能。在这个这种情况下,很多旧TCODE就会被废弃。我们如何查找这个替换呢? …

state_dict使用详解

在PyTorch中,state_dict是一个非常重要的概念,它是一个包含模型参数的字典对象。每个模型的state_dict都包含了该模型的所有参数(权重和偏置等),用于在训练和推理过程中重现模型的内部状态. pytorch 中的 state_dict 是…

MySQL-含json字段表和与不含json字段表查询性能对比

含json字段表和与不含json字段表查询性能对比 说明: EP_USER_PICTURE_INFO_2:不含json字段表 20200729json_test:含有json字段表 其中20200729json_test 标准ID、MANAGER_NO、PHONE_NO 为非json字段 data为json字段 2个表中MANAGER_NO、PHONE_NO都创建了各自的索引 测试…

CUDA简介, 配置和运行第一个CUDA程序(Windows和Linux)

CUDA简介 CUDA(Compute Unified Device Architecture)是由NVIDIA开发的一种通用并行计算架构。CUDA允许程序员利用NVIDIA GPU的并行计算能力,加速各种计算密集型应用程序。 CUDA技术基于GPU的并行计算原理。传统的CPU处理器拥有少量的核心&…

js中继承的方法

前言: 本人刚写了一篇原型链的封装继承多态,用家有儿女做的demo。其实我个人感觉封装和多态都容易去理解与实现。关键在于继承,js的才是比较难的,也容易让人混乱,至少我是因为继承头大过\(^o^)/~ js中有很多方法可以实现继承,这篇文章主要对继承的方法进行学习与测试。 这里…

[STM32-1.点灯大师上线】

学习了江协科技的前4课,除了打开套件的第一秒是开心的,后面的时间都是在骂娘。因为51的基础已经几乎忘干净,c语言已经还给谭浩强,模电数电还有点底子,硬着头皮上吧。 本篇主要是讲述学习点灯的过程和疑惑解释。 1.工…