基于对抗生成网络的滚动轴承故障检测方法

人工智能技术与咨询

点击蓝字 · 关注我们

来源:《人工智能与机器人研究》 ,作者华丰

关键词: 不平衡工业时间序列;异常检测;生成对抗网络;滚动轴承数据

关注微信公众号:人工智能技术与咨询。了解更多咨询!

摘要:

  摘要: 在工业系统中普遍存在样本数据不平衡现象,正常样本数量远远大于异常样本数量。而传统的机器学习算法和深度学习方法,例如朴素贝叶斯和支持向量机,在处理类不平衡问题时,很难获得较高的识别分类准确率,因为它们往往会偏向保证多数类的准确率。为此,本文提出了一种基于生成对抗网络(GAN)的异常检测方法。这个方法中的生成器结构是“编码器–解码器–编码器”的三子网,并且训练该生成器只需要从正常样本中提取特征,所以训练数据集中就不需要异常样本。此系统的异常检测结果由样本的最终得分来判别,其中异常分数由表观损失和潜在损失组成。本文方法的亮点在于可以实现在无异常样本训练的情况下对异常数据样本做检测,通过系统生成更高的异常分数来诊断故障。本项目在凯斯西储大学(CWRU)获得的基准滚动轴承数据集上验证了该方法的可行性和有效性。本文提出的方法在数据集中区分异常样本与正常样本的准确率达到了100%。

1. 项目介绍

异常检测对于现代工业系统的可靠性和安全性至关重要。及时准确的异常检测有助于预防重大事故的发生,提高生产效率。然而,工业生产中数据类不平衡的情况比较严重,在正常条件下的样本比在异常条件下的样本普遍得多,为准确诊断工业设备故障造成了巨大的障碍。此外,工业系统总是具有非线性和不确定性,这对模型训练提出了很大的挑战 [1]。

工业异常检测的数据一般是不同传感器在一定时间内记录的电流、温度等物理信号,也称为时间序列。对于工业异常检测领域,时间序列通常作为训练模型的输入数据 [2]。一般以时间序列为输入,异常检测框架通常分为特征提取和故障识别两个阶段。通过特征提取算法,将时间序列预处理为低维特征向量,送入故障检测器进行故障检测 [3]。机器学习算法作为一种强大的异常检测模式识别工具,已经成为关注的焦点,包括贝叶斯分类器、支持向量机方法等 [4]。上述方法都是假设基于类平衡的情况,然而当数据分类不平衡时这些方法难以获得较高的精度 [5]。除了数据集的类均衡假设外,标记数据也是训练阶段机器学习算法的关键。然而,在许多实际的工业系统中,来自异常情况下的样本数量往往很少。另外,当系统在正常状态下运行了很长一段时间后,突然出现异常,要准确定位异常的发生时间是极其困难的 [6]。因此,不准确的异常标签也会对异常检测的准确性产生不利的影响。

当正常和异常的标签不平衡时,机器学习方法的分类器会牺牲少数类来保证多数类的准确性,这意味着分类结果会偏向于测试样本整体的正态性 [5]。但是,对于工业系统中的异常检测,我们应该特别关注那些处于少数情况的类,如何能够准确捕捉和判别异常数据是当前工业系统中异常检测的重点。在2014年,由Goodfellow等人提出的生成对抗网络(GAN)为解决工业中类不平衡问题提供了一个新的思路。这个网络模型最先出现在“Generative Adversarial Networks”一文中,起初它被用于图像识别领域,并取得了卓越的成绩 [7]。GAN的基本思想是通过一个具有随机数据点的生成器生成原型样本,这些随机数据点满足一定的分布(如高斯分布)。在图像的异常诊断领域,已经有一些基于GAN的具有竞争力的网络架构被提出,如AnoGAN [8] 、BiGAN [9] 和GANomaly [10]。这些基于GAN的方法只训练正常图像的模型,根据正常图像和异常图像的特征分布差异来区分异常图像。从这一点出发,基于GAN的模型对于学习和识别不平衡数据集是有效的,可以防止诊断结果偏向于多数类。然而,在工业应用中,基于GAN的异常检测方法非常少见。经过类似项目的调查研究,发现依次有基于GAN网络的机械故障检测方法 [11] 和基于GAN的不平衡数据故障诊断方法 [12] 被提出。这些研究启发可以进一步研究GAN在工业故障检测方面的有效性,特别是在没有异常数据的情况下。因此针对工业时间序列的特性,本文基于GANomaly,改善了生成器整体的损失函数,以实现类不平衡场景的检测高精度。

在这项工作中,针对工业系统中异常数据的匮乏,本文提出了一种基于GAN的方法来解决智能异常检测问题。这个方法的系统由一个生成器和一个判别器组成,将生成器和判别器进行对抗训练得到训练后的模型来用于诊断。该系统的生成器基于卷积生成对抗网络,采用“Encoder-Decoder-Encoder”为结构的三子网络。为了提高诊断性能,在原始数据和GAN之间插入数据转换器对原始数据集进行预处理。通过在CWRU滚动轴承数据集的实验,验证了该方法的可行性和有效性。

本文的主要贡献如下:

a) 针对工业领域的不平衡时间序列问题,提出了一种新的基于GAN的异常检测方法。

b) 所提出的网络训练中只需要正常样本。这是一个比其他现有算法网络更贴合现实场景的网络。因为在真实的工业场景中,异常样本的数量往往非常少。实验基于CWRU的滚动轴承基准数据集进行了训练和调整,通过测试确保了该系统模型具有良好的诊断性能,并进一步验证了本文方法的有效性,使其可以作为解决工业数据类不平衡问题的新思路。

2. 项目背景

2.1. 深度学习用于智能故障诊断

随着各种工业系统中产生的时间序列数据流越来越动态、复杂和庞大,许多用于深度学习的异常检测技术得到了很好的发展。在调用这些深度学习模型的过程中,它们被赋予学习目的,但这并不意味它们清楚最终的输出特性是什么。这些黑箱旨在为特定的数据集提取特定的模式,如长短时记忆网络(LSTM),递归神经网络(RNN),卷积神经网络(CNN)。虽然上述的这些深度学习模型在异常检测方面显现出了许多卓越的性能,但在面对不平衡的数据集时,其准确率仍然不能令人满意 [13]。此外,由于数据表示的差异(如图像和时间序列),许多深度学习模型适用于图像领域,但在工业领域往往难以实施和应用。

2.2. 类不平衡问题

在基于不平衡时间序列的异常检测中,通常会考虑两种主要方法:数据级方法和算法级方法 [14]。数据级方法通常利用采样策略改变不平衡的数据分布,其中广泛使用过采样和欠采样两种策略 [15]。算法级的方法一般采用调整分类器以适应不平衡的数据,其中通常使用bagging和boost ensemble-based方法 [16]。具体的有Easy Ensemble [17] 和Balance Cascade [18] 算法被提出用于处理类不平衡问题。Easy Ensemble [17] 是通过多次从多数类样本有放回的随机抽取一部分样本生成多个子数据集,将每个子集与少数类数据联合起来进行训练生成多个模型,然后集合多个模型的结果进行判断。这种方法看起来和随机森林的原理很相似 [14]。Balance Cascade [17] 是通过一次随机欠采样产生训练集,训练一个分类器,对于那些分类正确的多数类样本不放回,然后对这个剩下的多数类样本再次进行欠采样产生第二个训练集,训练第二个分类器,同样把分类正确的样本不放回,以此类推,直到满足某个停止条件,最终的模型也是多个分类器的组合 [17]。

2.3. GAN和GANOMALY

近年来,在类不平衡图像的异常检测中,对抗训练尤其是GAN占据了越来越重要的地位。GAN最早由Goodfellow等人提出,被认为是一种无监督机器学习算法,在图像识别领域取得了突出的应用效果。GAN的网络结构如图1,使用原始数据对生成器进行训练,生成器(Generator)产生新的样本。生成器数据和真实训练数据输入到判别器(Discriminator)中,训练得到能正确区分数据类型的判别器。判别器和生成器相互对抗,生成器通过学习来产生更逼近真实数据的新样本,用于欺骗判别器,反之判别器也需要更好地区分生成数据与真实数据。自2014年以来,基于GAN的对抗性算法层出不穷,很多新的方法和框架被提出并取得了优秀的表现。

Figure 1. Structure of generate adversarial network

图1. 生成对抗网络结构

在图像分类领域中,Akcay等人提出了一种通用的异常检测体系结构GANomaly。与以往的先进方法相比,该结构在多个基准图像数据集上具有显著的优越性和有效性 [10],给予我们在工业领域的异常检测一些启发。下面是对GANomaly的简要介绍。该模型中,其生成器由“编码器–解码器–编码器”三子网构成训练半监督网络,该结构使用深度卷积生成对抗网络(DCGAN) [18],并在生成器中使用三个损失函数来捕获输入图像和潜在空间中的特征。该算法的特点之一是不考虑异常样本,并在图像数据集中实现了优异的异常检测性能。

论文的其余结构如下。第三部分提出了基于GAN的异常检测框架。第四节和第五节分别介绍了实验装置和实验结果。第六部分为结论和未来工作。

3. 项目方法

图2是本文提出的方法概述。图中可以看出在训练阶段,这个系统模型只考虑正常样本。本文使用数据转换器来对样本进行处理并提取有用的特征,这些特征经过转换可以更好的被模型学习。系统中生成器采用编码器–解码器–编码器三子网,判别器则是基于DCGAN网络结构。在检测阶段,异常样本可以通过比正常样本更高的异常分数来识别。

3.1. 方法介绍

 

Figure 2. The proposed method framework

图2. 本文方法框架

在训练的步骤中,用 DtrainDtrain 训练一个GAN-Based模型M。训练过程的目标是最小化 DtrainDtrain 中每个子数据集的输出。在训练过后,用于测试的数据集 DtestDtest 将会放入模型M。训练后的生成器将对故障样本和正常样本进行相应的编码和解码。由于训练后的网络只学习了正常数据的可能表示模式,如果用异常数据样本 DutestDtestu 作为输入,那么模型M的输出与正常输入 DvtestDtestv 的输出相比,会有很大的偏差。这个偏差值最终帮助确定异常样本的存在。

3.2. 训练的过程

本文提出的方法中其训练阶段的主要目的是正常条件下生成尽可能小的样本分数的模型。本文方法的网络结构由数据转换器、生成器和判别器三部分组成。基本网络架构用DCGAN表示。在生成器的设计中,开发了一种由“Encoder-Decoder-Encoder”组成的三子网。在将数据输入生成器之前,需要设计一个数据转换器将一维的时间序列数据转为二维的图像数据,可以帮助DCGAN更好的提取和学习样本特征。基于普适性原则,不对原始数据进行其他处理,因此任何时间序列都可以封装到这些特征中。在训练过程中,首先在正常条件下提取时间序列的特征,然后利用本文设计的异常检测器获得这些特征的数据分布和可能的代表模式。在测试阶段,将异常样本输入训练好的异常检测器,异常数据的特征分布会得到比正常样本更高的分数,以此为差异来识别和诊断。

3.2.1. 生成器和判别器

在生成器中,第一个编码器用于学习样本原始特征F的表征,第二个编码器用于生成再生特征F^。同时,解码器 GdGd 用于试图重建F^。整个过程如下:

该生成器保证了原始特征集F的特征不变的同时可以得到潜在向量Z的模式。判别器(Discriminator)采用DCGAN中引入的标准判别器网络,用于判断输入数据是真实的还是生成的。根据判别器的反馈再对生成器进行调整和训练。在定义了整个网络架构之后,本文将称述如何定义训练的损失函数。

3.2.2. 目标函数

在训练阶段,因为只训练正常数据集 DtrainDtrain,所以模型M只会获得正常数据集下的模式。但是在测试阶段,M需要通过输出更高的异常分数来确定异常样本。那就意味着 GdGd 和 GeGe 将会解码潜在表示Z和重新编码F^,这与在训练阶段获得的模式类似。之后F^和Z^将不可避免地与原来的F和Z产生差异,这样有助于我们识别异常故障。

由于生成器的结构是采用“Encoder-Decoder-Encoder”组成的三个子网络,因此生成器的最终损失函数将由欺骗损失(Fraud Loss)、表面损失(Apparent Loss)和潜在损失(Latent Loss)三部分组成,接下来将会分别对三个损失函数进行说明。

欺骗损失:在这里引入fraud loss的目的是为了诱导判别器将生成器生成的样本误判为真实的工业样本。将生成的样本输入判别器,通过判别器输出计算的fraud loss,公式如下:

3.3. 测试步骤

在测试阶段,我们的模型使用潜在损失和表面损失对检测到的测试数据样本进行评分。判定样本分数的公式可以定义为:

在这一部分中,我们使用 ωaωa, ωlωl 的比率作为合适的加权值超参数 λλ,意思是此处使用最好的训练结果,即最小的生成器损失和判别器损失。因为本文提出的方法只在正常数据样本上训练异常检测器,所以实验中的异常检测器将只学习和识别正常样本的潜在模式和数据分布。在这个判定公式中,正常样本得到的T(F)将接近于0,而对于异常样本,公式得到的值将相对大很多。在测试中,通过公式T(F)的值的波动可以很容易地找到异常。

4. 实验设置

为了评估本文方法的可行性和有效性,实验和测试将在凯斯西储大学(CWRU)获得的滚动轴承数据上进行,实验台如图3所示。

Figure 3. Testing bed in CWRU

图3. CWRU实验台

4.1. 数据集描述

这是一个基准轴承异常检测数据集,通过在电机上使用加速度计测量轴承的振动信号得到。采用电火花加工方法对电机轴承进行了故障样本创建。分别在内滚道(IR),滚动部件(i.e. Ball)和外滚道(OR)创建了直径范围在0.007英寸到0.028英寸的故障点。故障轴承被重新安装到测试电机中,并记录电机负载从0到3马力(电机速度从1720到1797 rpm)。数据集的采样频率为48 kHz,每个数据集文件由三种类型的信号组成,即驱动端加速度计信号、风扇端加速度计信号和基础加速度计信号。表1总结了实验中数据集的详细信息。

CWRU数据

信号类型

振动信号

信噪比

采样频率(kHz)

48

运转速度(rmp)

1730,1750,1772,1797

故障直径

0.007,0.014,0.021,0.028

故障类型

IR,OR,B

Table 1. Data parameters collected by CWRU

表1. CWRU数据集的参数

4.1. 数据集处理

我们将正常数据样本分为训练集和测试集两个部分。对于来源于CWRU的滚动轴承数据集,得到的初始训练数据集 DtrainDtrain 都是传感器在一段时间t内记录的样本。这些数据可以写成矩阵型式,

在项目的实际训练中发现样本的数量以及样本的多样性需要得到进一步扩充,因此采用了对初始数据进行分割的方法来处理数据集。将时间t内记录的样本进行分割,依次取连续不间断的3136个数据点作为新样本。这个新数据样本是一个1 × 3136的矩阵 Dti=[Xi1,Xi2,Xi3,⋯,Xi3136]Dti=[Xi1,Xi2,Xi3,⋯,Xi3136]。然后将数据转换成4 × 28 × 28的矩阵,此处可以理解为将一维的原始数据转变成了4张尺寸为1 × 28 × 28的图像数据作为输入模型的训练数据,经过处理得到训练集 Dtrain∈Rt×bDtrain∈Rt×b (b是训练样本的数量)。众所周知GAN这一网络模型最初就是在图像识别领域展现了优异的性能,因此对数据进行该项处理可以优化模型对样本特征的学习和提取。

对应的测试样本是 Dtest=[Dvtest,Dutest]∈Rt×(v+u)Dtest=[Dtestv,Dtestu]∈Rt×(v+u),v和u分别是正常样本和异常样本的数量。所以这个项目的样本总数n可以表示为 n=b+v+un=b+v+u。在CWRU的数据集中,实验使用正常状态条件下b = 400的样本来训练异常检测器,同时设置了v = 541和u = 383的没有标签的样本用于测试集。

4.3. 实施细节

实验的具体实施放在PyTorch中,并使用了Adam优化网络来实现本文提出的方法。首先设定训练模型的参数,初始化学习率设为 lr=0.0001lr=0.0001,动量 β1,β2β1,β2 的值分别设为0.5和0.999。对于两个数据集,每个模型在训练时epochs都设为50,batch-size即一次训练样本的数量设为32。本文提出的方法的具体网络结构在表2中进行了详细的说明。

Table 2. Model network structure

表2. 模型网络结构

Ks/S−1 = Kernel Size/Stride.

5. 实验结果

在实验时,将凯斯西储大学(CWRU)收集的滚动轴承数据输入本文方法构建的系统中,生成器经过训练集数据的训练生成初始的网络模型,接着将生成器生成的样本输入判别器,根据判别器反馈的结果,对生成器进行新的训练,直到判别器能成功被生成器生成的样本所欺骗,此时生成器的训练收敛。接着调用生成器训练后的网络模型对测试样本进行测试,得到并输出该样本数据的得分情况。所提出方法的CWRU数据集得分如图4所示。

Figure 4. CWRU data experimental results

图4. CWRU数据实验结果

从这张输出结果图中可以看出因为滚动轴承的故障情况不同,所以每种情况所得分值也明显不同。同时表示阈值的蓝色虚线清晰的分隔了正常和异常样本。红色的数值点是正常样本在生成器中的得分情况,可以清楚的看出正常样本的Scores值区间小于0.02并总体呈均匀分布,此处可以进一步验证该生成器的训练收敛了。图中紫色的点代表内滚道故障样本的得分情况,该类型样本的整体分布较为混乱,得分区间在[0.04, 0.06]之间。图中黄色的点代表外滚道故障样本的得分情况,该类型的整体得分情况最为分散。此外图中绿色的点代表滚动部件故障样本的得分情况,此故障的得分情况相较其余两种较为稳定,得分区间在[0.08, 0.10]之间。该得分结果还表明,滚动故障(图中的Ball fault)数据的模式与正常样本数据的模式最接近,而外滚道故障(图中的OR fault)与正常数据模式的差异最大。

6. 项目结论

本文提出了一种基于生成对抗网络(GAN)的针对工业时间序列不平衡的异常检测体系结构。与当前大多数的深度学习方法相比,这种体系结构的特点是只需要使用正常的数据样本进行训练,不用考虑工业系统中样本分类不均衡的问题。在异常检测之前,我们根据本项目工业数据的特征和网络模型的特点设计了一个数据转换器。然后利用“Encoder-Decoder-Encoder”构建的生成器输出较大的异常分数来检测异常样本的存在。该网络结构在CWRU滚动轴承数据集上实现了100%的测试精度。

随着工业领域技术的进步,以及设备的计算能力和存储能力的提高,工业中的传感器现在可以收集比以往更多更复杂的多元时间序列数据。在未来的工作中,针对多元的时间序列数据,如何将不同维度的信息进行融合或者如何对这些工业数据进行多进程的学习和识别,会有更多的想法和尝试。

关注微信公众号:人工智能技术与咨询。了解更多咨询!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481697.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

社会演化动力学:人类社会复杂性为何不断增加?

来源: 集智俱乐部编译:任卡娜审校:刘培源编辑:邓一雪导语在全新世(the Holocene,11700年前以来)期间,人类社会的规模和复杂性显著地增长。一代又一代的研究者试图提出不同的理论来对…

基于机器学习的网络安全态势感知

人工智能技术与咨询 点击蓝字 关注我们 来源:《计算机科学与应用》 ,作者杨怡等 关键词: 机器学习;态势感知;关联分析;攻击场景重建 摘要: 摘要: 在传统网络防御手段抵御攻击的基础上,提出了一…

「Python」为什么Python里面,整除的结果会是小数?

原文:https://www.cnblogs.com/bEngi1/p/9155297.html  ‘//’明明是整除,为什么结果不是整数,而会出现小数? 首先,关于除法有三种概念:传统除法、精确除法和地板除 1 2 3 4 5 6 7 #1、传统除法&#x…

《Nature》创新技术发现环境变化影响活细胞的RNA形状

来源:生物通通过创新技术,揭示了环境条件对活细胞中RNA动态结构的影响。这项研究是Dame Caroline Dean FRS教授和Yiliang Ding博士团队合作的结果,增加了我们对细胞水平对环境信号的反应的理解。这增加了我们利用这些知识来微调作物或开发基于…

C/C++预处理指令#define,#ifdef,#ifndef,#endif…

原文https://www.cnblogs.com/zi-xing/p/4550246.html 管理 C/C预处理指令#define,#ifdef,#ifndef,#endif… 本文主要记录了C/C预处理指令,常见的预处理指令如下: #空指令,无任何效果 #include包含一个源代码文件 #define定义宏 #undef取消…

面向制造领域人机物三元数据融合的本体自动化构建方法

面向制造领域人机物三元数据融合的本体自动化构建方法 人工智能技术与咨询 点击蓝字 关注我们 摘要 当前,智能制造面临的许多问题都具有不确定性和复杂性,单纯地利用专家经验和机理模型难以有效解决.鉴于此,面向跨层跨域的复杂制造系统网络化协同控制机制,提出一种基于本…

“中国脑计划”:向最后的前沿进发

来源:神经科技编辑:Yezi审阅:mingzlee7大脑是人类智慧的集结,是已知宇宙当中最复杂的产物,但我们对大脑认知却很晚,比如我们常说心想事成、心外无物,在很长的历史时期当中,我们都以为…

基于人机协作的无人集群搜索方法研究

基于人机协作的无人集群搜索方法研究 人工智能技术与咨询 点击蓝字 关注我们 关键词: 无人集群 ; 人机协作 ; 动态规划 ; 多Agent系统 摘要: 人与机器人交互是当前一项研究热点,人与无人集群协作搜索是人机交互的典型场景,通过结…

chatbot1_2 RNN简单实现

chatbot1.2 如何处理多义词的embedding? 每个意思一个向量,多方叠加。在某个切面与其相同意思的向量相近 如何识别和学习词组的向量? 多次出现在一起,认为是词组 如何处理未曾见过的新词? 语境平均,语…

DeepMind创始人Demis Hassabis:AI 的强大,超乎我们的想象

来源:微信公众号“雷锋网”撰文:黄楠、王玥编辑:陈彩娴有人认为 AI 已经穷途末路,但一些绝顶聪明的人还在继续求索。近日,DeepMind 的创始人 Demis Hassabis 作客 Lex Fridman 的播客节目,谈了许多有趣的观…

组网雷达融合处理组件化设计与仿真

人工智能技术与咨询 点击蓝色 关注我们 关键词: 组网雷达 ; 点迹融合 ; 航迹融合 ; 组件化设计 ; 仿真 摘要 数据融合处理是多雷达组网的核心。以典型防空雷达网为参考对象,采用组件化设计方式,将组网数据融合处理过程划分为不同的组件&…

chatbot2 RNN语言模型

基于RNN的语言模型 RNN语言模型理论基础 参考文献 cbow/skip gram 的局限性#### 解决方案 rnn模型细节 数学表示 一个输入一个输出的不是循环神经网络。 RNN语言模型实践 demo1 1A. 优化上一节课的RNN模型 在第一个版本里面,我们将上一节课的代码包装为Class&…

脑机接口:人工智能下一站?

来源:《光明日报》 作者:杨义先、钮心忻,北京邮电大学教授 随着人工智能的发展,脑机接口也逐渐从科幻走进现实。有人希望以此造就“超人”,更多的人则希望能够解决实际问题——让盲人复明、让瘫痪在床的患者重新走路…

仅活了 5 年!谷歌官宣停掉 IoT Core 服务:“现有连接将被关闭”

来源:AI前线整理:冬梅谷歌云 IoT Core 服务推出 5 年后“退役”近日,据外媒报道,谷歌宣布自 2023 年 8 月起,将关闭其物联网(IoT Core)服务,此次官宣 IoT Core 的退役,也…

tensorflow1、2会话、变量、feed、fetch、最小二乘法

第一节课 tensorboard–可以查看训练效果 安装ananconda(略) tensorflow简介 tensorflow结构 是个数据流动的趋势, graph1:默认图 graph2:W*xb->ReLU 2-1 基本计算-会话的使用 import tensorflow as tf # 创建一个常量op,1*…

《Nature》十年努力,“合成”胚胎与大脑和跳动的心脏

来源:生物通研究人员已经用小鼠干细胞创造出了模型胚胎,这些干细胞形成了大脑、跳动的心脏和身体所有其他器官的基础——这是重建生命第一阶段的新途径。小鼠胚胎的小脑由Magdalena Zernicka-Goetz教授领导的研究小组在没有卵子或精子的情况下开发了胚胎…

tensorflow3 非线性回归、mnist、简单神经网络

mnist数据集 手写数字的数据集。60000行训练数据集,10000行测试数据集下载地址:http://yann.lecun.com/exdb/mnist/index.html mnist数据集是形状为[60000,784]的张量,60000张图片,每个图片有784个像素点,这些个像素点…

【院士思维】张钹:我们正处在AI算法不可控的危险状态

来源:清华大学人工智能国际治理研究院8月19日,2022世界机器人大会主论坛正式开幕,期间,有三位院士到场,就“未来机器人:目标、路径和挑战”的主题进行了一场深刻的谈话。三位院士分别为中国科学院院士&…

tensorflow4 代价函数、dropout、优化器

这次扔使用上次的mnist数据集分类的简单版本程序,使用不同的代价函数做计算 二次代价函数 激活函数 使用二次代价函数的运行结果 # 使用二次代价函数的结果-精度 # losstf.reduce_mean(tf.square(y-prediction)) # 0.8322 # 0.8698 # 0.8818 # 0.8882 # 0.8935 #…

强化学习先驱Richard Sutton:将开发新型计算智能体

来源:机器之心编辑:陈萍、小舟DeepMind 和阿尔伯塔大学联合成立的人工智能实验室未来几年要研究什么?2017 年,DeepMind 在加拿大的 Edmonton 成立了其首个英国之外的人工智能研究实验室,并和阿尔伯塔大学大学紧密合作&…