揭秘人工智能(系列):深度学习是否过分夸大?

2012年左右,多伦多大学的研究人员首次使用深度学习来赢下了ImageNet,它是一项非常受欢迎的计算机图像识别竞赛。对于那些参与AI行业的人来说,这是一个大问题,因为计算机视觉是使计算机能够理解图像背景的学科,也是人工智能中最具挑战性的领域之一。

当然,与任何其他产生巨大影响的技术一样,深度学习成为炒作的焦点。不同的公司和组织开始应用它来解决不同的问题(或假装应用它)。许多公司开始使用深度学习和先进的人工智能技术重塑其产品和服务。

与此同时,媒体也经常撰写有关人工智能和深度学习的故事,这些故事充满误导性,并且大多是由那些对技术运作方式没有正确理解的人撰写。他们大多使用关于人工智能的耸人听闻的头条来博眼球,这些也促成了围绕深度学习的炒作。

经过媒体的炒作后,许多专家认为深度学习被夸大了,它最终会消退并可能导致另一个人工智能冬季,从而使人们对人工智能的兴趣和资金投入大幅下降。其中一些著名专家也承认,深度学习已经触底,其中包括一些深入学习的先驱者。

但根据著名数据科学家和深度学习研究员杰里米·霍华德的说法,“深度学习过度夸大”的论点有点夸张。霍华德是fast.ai的创始人,fast.ai是一个非营利性的在线深度学习课程。

今年,霍华德在USENIX Enigma会议上发表的演讲中发表了许多反对深度学习的论点。整个视频非常清楚地说明了深度学习究竟做了什么和不做什么,这个演讲可以帮助你清楚地了解该领域。

以下是霍华德演讲主要反驳的几个论点:

深度学习只是一种时尚-明年它将是另一回事(NO!)

许多人认为深度学习是突然冒出来,最终也会突然消失。

霍华德反驳解释到:“你今天在深度学习中实际看到的是几十年研究的结果,而这几十年的研究终于达到了实际上给出最先进成果的程度。”

人工神经网络的概念是深度学习算法的主要组成部分,它已存在数十年,第一个神经网络可以追溯到20世纪50年代。

但是,由于数十年的研究以及数据和计算资源的可用性,深度学习的概念已经从实验室走出并进入实际领域。

霍华德说:“利用深度学习,人们可以减少很多复杂的繁琐的事务,我们应该期待看到[深度学习]继续发展下去而不是消失。”

深度学习和机器学习是一回事(NO!)

滥用人工智能词汇很容易导致了从业人员对行业的混淆和怀疑。有人说深度学习只是机器学习的另一个别称,而其他人则认为它与其他AI技术(如支持向量机(SVM),随机森林和逻辑回归)属于同一水平。

但深度学习和机器学习并不相同,深度学习是机器学习的一个子集。通常,机器学习适用于基于训练数据的数学模型和行为规则的所有技术。ML技术已经投入生产使用了很长时间。

在深度学习之前,科学家们必须在编写“功能”或模块方面投入大量精力,这些功能可以执行模型想要执行的任务的一小部分。例如,如果你想创建一个可以检测猫的图像的AI模型,你将不得不编写较小的程序来检测猫的特征,如耳朵、尾巴、鼻子、皮毛。而且你必须使这些程序足够强大,以便从不同角度和不同光照条件下检测这些特征,并告诉不同猫种之间的差异。最后你才能在这些功能之上进行机器学习。

如果你想解决更复杂的问题,如通过MRI扫描检测乳腺癌,那么创建特征将变得更具挑战性。霍华德说:“你将需要数十名领域专家与数十名计算机程序员和数学家合作,提出这些功能概念并对其进行编程。最后使用一个经典的机器学习模型,如逻辑回归。”这项工作大概需要数年的工作。

深度学习用神经网络取代了艰苦的经典机器学习过程。霍华德将神经网络描述为“无限灵活的函数”。这意味着神经网络可以应用于机器学习解决的大多数问题,而无需通过以前必须执行的所有特定于域的特征工程。

要想神经网络解决特定问题,你需要调整其参数。为此,深度学习使用“梯度下降”,这是一种通用优化算法,可以将神经网络的参数与其想要解决的问题相匹配。

最后,深度学习利用了近年来可用的GPU和专用硬件的强大功能,以合理快速和可扩展的方式执行这些任务。

霍华德说:“只有在过去的几年里,这三件事情才能让我们真正使用神经网络来获得最先进的结果。”

因此,深度学习不是通过以前机器学习方法所涉及的专业知识密集型和容易出错的过程,而是提供样本数据(例如标记为猫图片,标记为癌症或非癌症的MRI扫描...)并训练神经元使用梯度下降的网络。神经网络比较并找到这些数据样本中的常见模式,并学习应用相同的知识来分类以前从未见过的新数据样本。

这种方法在过去几年中深入学习了最流行的人工智能技术,并引发了使用深度学习的应用程序的爆炸式增长。

深度学习只对图像识别有益(NO!)

很多人都承认深度学习是一种非常有用的人工智能技术,但很多批评者都抱怨它的使用仅限于解决涉及图像分类的问题!

“图像识别非常重要!”霍华德说。几年前,霍华德和一组研究人员在肺部CT扫描上训练了一个深度神经网络,并创建了一种算法,可以检测恶性癌症肿瘤,这个算法的结果诊断的结果与四名人类放射科医师相比,假阳性和阴性率更低。

霍华德还指出,许多问题可以重新理解为图像识别问题。例如,在中国古代游戏围棋中击败世界冠军的深度学习算法AlphaGo实际上是一个图像识别的卷积神经网络(CNN)。

“具体来说,AlphaGo所做的是看了很多在真人玩过的围棋的例子”霍华德解释道。“基本上,他们最终做了一个图像识别神经网络,他们试图学习的东西不是这张照片是猫还是狗,而是这是一张白子赢或黑赢的围棋照片。”这种方法一直是AlphaGo和许多掌握不同棋盘和视频游戏的AI算法成功的关键因素。

关键是,许多问题可以转化为图像识别问题,并通过深度学习解决。例如,霍华德深度学习课程的学生创建了一个神经网络,该网络在鼠标移动和点击的图像行为上进行训练。在这种情况下,他创建了一个卷积神经网络,试图根据这些图片预测欺诈行为。

也就是说,深度学习也证明了其超越计算机视觉和图像识别领域的价值。

霍华德指出,深度学习现在也适用于大多数自然语言处理(NLP)问题,这包括机器翻译和文本摘要等领域。NLP是一个关键组件,它可以使Siri,Alexa和Cortana等AI助手理解你的命令。(有一点要知道:深度学习对人类语言的掌握有限)

深度学习还可以解决涉及结构化数据的问题,例如电子表格中的行和列。例如,你可以为神经网络提供一组代表金融交易及结果(欺诈或正常)的行,并对其进行训练以预测欺诈性交易。

霍华德指出,深度学习也可以应用于时间序列和信号问题,例如连接到网络的不同IP地址的事件顺序或随时间收集的传感器数据。

深度学习的痛点

霍华德还指出了一些深度学习成效有限的领域,这些领域包括强化学习,对抗模型和异常检测。

一些专家认为强化学习是当前人工智能的圣杯。强化学习涉及开发AI模型而不向他们提供大量标记数据。在强化学习中,你为模型提供问题域的约束,并让它开发自己的行为规则。AlphaGo的高级版AlphaGo Zero就是使用强化学习从头开始训练自己,然后超过了AlphaGo。虽然深度强化学习是人工智能研究中比较有趣的领域之一,但它在解决现实问题方面没有明显的进展。Google Brain AI研究员Alex Irpan在深度强化学习的极限上有一篇引人深思的文章。

对抗模型是霍华德提及的另一个深度学习痛点。对抗性示例是操纵输入可能导致神经网络以非理性方式运行的实例。有很多研究人员展示了对抗性示例如何能够成为对AI模型的攻击。虽然已经做了一些努力来加强深层学习模式以对抗对抗性攻击,但到目前为止,成功有限。部分挑战源于神经网络非常复杂且难以解释的事实。

异常检测,霍华德谈到的第三个深度学习痛点也非常具有挑战性。一般概念是在基线数据上训练神经网络,并让它确定偏离基线的行为。这是在网络安全中使用AI的主要方法之一,一些公司正在探索这一概念。但是,它仍然无法将自己确立为对抗安全威胁的非常可靠的方法。

深度学习是一个黑盒子

这是一个真正令人担忧的问题,尤其是在人工智能模型被赋予关键决策的领域,例如医疗保健、自动驾驶汽车和刑事司法。那些愿意让深度学习代表他们做出决定的人需要知道推动这些决策的因素是什么?不幸的是,当你在训练神经网络时获得的性能优势会降低你在决策过程中获得的可见性。这就是深度学习通常被称为“黑匣子”的原因。

但是,现在已经有了很多有趣的研究来解释AI决策,并帮助工程师和最终用户理解影响神经网络输出的元素。

深度学习需要大量数据

一般认为,要创建一个新的深度学习模型,需要访问数百万和数十亿个带标签的示例,这就是为什么只有大型科技公司才能创建它。

“需要大量数据的说法通常不正确,因为大多数人在实践中使用迁移学习”霍华德说。

迁移学习是机器学习中的一门学科,其中一个模型获得的知识被转移到执行类似任务的另一个模型。与人类如何将知识从一个领域转移到另一个领域相比,它非常原始。但是,迁移学习在深度学习领域是一个非常有用的工具,因为它使开发人员能够用更少的数据创建新模型。

霍华德解释说:“你从一个预先训练好的[神经]网络开始,然后为你的特定任务微调权重。一般来说,如果你有大约1,000个示例,你应该能够建立一个良好的神经网络。”

你需要博士学位才​​能进行核心深度学习

深度学习是一个非常复杂的计算机科学领域,它涉及许多高级数学概念。但是在过去几年中,学术界已经创建了大量的工具和库来抽象出潜在的复杂性,并使你能够无须解决过多的数学问题来开发深度学习模型。

Fast.ai和Keras就是两个现成的库,可用于快速开发深度学习应用程序。还有很多在线课程,包括霍华德的fast.ai,Coursera和其他课程,使你能够开始深入学习编程,只需要很少的编程知识。许多具有计算机科学以外背景的人已经能够将这些课程应用于现实世界的问题。

需要明确的是,深度学习研究仍然是一个非常先进和复杂的领域,人才既稀缺又昂贵。开发新的深度学习技术的人是一些最令人垂涎​​和收入极高的研究人员。但这并不意味着其他人需要拥有相同水平的知识才能在他们的应用程序中使用这些研究项目的结果。

深度学习需要大量的计算能力

“你可能会担心你需要一个充满GPU的大房间,总的来说这并不是真的,我现在看到的绝大部分成功结果都是用一个GPU完成的。” 霍华德说

大型公司和组织进行的大型研究项目需要大量的GPU,例如一款机器人手用6144 CPU和8个GPU进行训练出来的。另一个例子是OpenAI Five,一个训练有素的AI模型,可以玩著名的Dota 2在线战斗竞技游戏,OpenAI Five是用了128,000个CPU内核和256个GPU的训练的结果。

但是,大多数实际问题都可以通过单个GPU解决。例如,你可以通过一个GPU来完成霍华德的Fast.ai课程。

总结:

我建议你观看整个视频,其中,霍华德深入研究了一些更专业的主题,例如你是否可以将深度学习应用于信息安全。重要的是我们要了解深度学习的范围和限制以及机会和优势,因为它是我们这个时代最有影响力的技术之一。深度学习不是过分夸大,也许它只是没有很好地被理解。

 


原文链接
本文为云栖社区原创内容,未经允许不得转载。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/519995.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

互联网诞生记:风起于青萍之末

戳蓝字“CSDN云计算”关注我们哦!作者 | 老姜出品 | CSDN云计算(ID:CSDNcloud)“起初阿帕创造阿帕网络。阿帕网络是空虚混沌。渊面黑暗。阿帕的灵运行在网络里面。阿帕说:‘要有一个协议。’就有了一个协议。阿帕看它是…

powerpc 汇编linux,PowerPc下的寻址模式

本篇文章主要描述了Powerpc的寻址模式,让自己对内存映射、寻址的概念理解深入些。在开始讨论寻址模式之前,让我们首先来回顾一下计算机内存的概念。可能之前已经了解了关于内存和编程的一些事实,但是由于现代编程语言正试图淡化计算机中的一些…

2018最佳GAN论文回顾(上)

我很高兴今年参加了一个研究项目,这要求我必须熟悉大量用于计算机视觉方面的深度学习领域的资料。我对过去两、三年内取得的进展感到惊讶,这真的非常令人兴奋和鼓舞,所有不同的子领域,如图像修复、对抗性样本、超分辨率或是三维重…

被神话的大数据——从大数据(big data)到深度数据(deep data)思维转变

自从阿法狗战胜人类顶级棋手之后,深度学习、人工智能变得再一次火热起来。有些人认为,深度学习的再一次兴起是源于硬件的提升、数据量的增多以及高效算法的研究。这并不完全精确,有一个基本的误解是更大的数据会产生更好的机器学习结果。然而…

spring整合rabbitMQ最新版

文章目录一、简单对象1. 依赖2. 生产者3. 消费者4. 配置文件5. spring版本二、复杂对象2.1. 生产者2.2. 消费者一、简单对象 1. 依赖 <!--spring整合rabbitmq--><dependency><groupId>org.springframework.amqp</groupId><artifactId>spring-ra…

搞定面试算法系列 | 分治算法三步走

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 江子抑转自 | 编程拯救世界主要思想分治算法&#xff0c;即分而治之&#xff1a;把一个复杂问题分成两个或更多的相同或相似子问题&#xff0c;直到最后子问题可以简单地直接求解&#xff0c;最后将子问题的解合并为原问题的…

通过FD耗尽实验谈谈使用HttpClient的正确姿势

一段问题代码实验 在进行网络编程时&#xff0c;正确关闭资源是一件很重要的事。在高并发场景下&#xff0c;未正常关闭的资源数逐渐积累会导致系统资源耗尽&#xff0c;影响系统整体服务能力&#xff0c;但是这件重要的事情往往又容易被忽视。我们进行一个简单的实验&#xf…

与“十“俱进 阿里数据库运维10年演进之路

导语 阿里巴巴集团拥有超大的数据库实例规模&#xff0c;在快速发展的过程中我们在运维管理方面也在不断的面临变化&#xff0c;从物理器到容器、从独占到混布、从本地盘到存储计算分离、从集团内到大促云资源&#xff0c;从开源的MySQL到自研分布式数据库&#xff0c;运维管控…

jmeter 压测 RabbitMQ_单机

文章目录一、MQ压测1. 资料列表2. jmeter软件包3. 插件列表二、远程服务器监控2.1. 监控声明2.2. 监控场景的区别2.3. 软件列表2.4. 插件操作2.5. 软件操作三、jmeter编写MQ脚本3.1.创建线程组3.2. 创建MQ生产者3.3. 创建MQ消费者四、监听器4.1. 聚合报告4.2. 观察树4.3. 监控五…

云+X案例展 | 民生类:纷享销客助力沃得农机构筑智能化、信息化之路

本案例由纷扬科技投递并参与评选&#xff0c;CSDN云计算独家全网首发&#xff1b;更多关于【云X 案例征集】的相关信息&#xff0c;点击了解详情丨挖掘展现更多优秀案例&#xff0c;为不同行业领域带来启迪&#xff0c;进而推动整个“云行业”的健康发展。​​​​“2004年到20…

如何“神还原”数据中心? 阿里联合NTU打造了工业级精度的仿真沙盘!

如何保障数据中心的稳定运行&#xff0c;是多年来一直困扰业界的难题。机房环境如果发生未预期变化&#xff0c;可能造成难以估计的损失。所以我们希望能构建一个“变更沙盘”&#xff0c;在真实变更之前&#xff0c;操作人员可以先在沙盘中进行试变更&#xff0c;若变更效果在…

RabbitMQ 手动签收

下面这基础地方都必须设置&#xff0c;不然无效 // 同一时刻服务器只会发一条消息给消费者channel.basicQos(1); // 消息的标识&#xff0c;false只确认当前一个消息收到&#xff0c;true确认所有consumer获得的消息 channel.basicAck(message.getMessageProperties().getDeli…

把16进制转换为ascii字符c语言,ASCII转16进制C语言

满意答案u2gseftj278推荐于 2016.03.01采纳率&#xff1a;56% 等级&#xff1a;11已帮助&#xff1a;14340人以前引别人的&#xff0c;自己懒得再写了呵呵。原理就是这样的&#xff0c;你可以直接用的//函 数 名&#xff1a;AscToHex()//功能描述&#xff1a;把ASCII转换为1…

四大维度全景揭秘阿里巴巴智能对话开发平台

在阿里巴巴智能服务事业部的X蜂会上&#xff0c;小蜜北京团队的高级算法专家李永彬&#xff08;水德&#xff09;分享了小蜜智能对话开发平台的构建&#xff0c;围绕平台来源、设计理念、核心技术、业务落地情况四大维度讲述了一个较为完整的智能任务型对话开发平台的全景。以下…

2019年技术盘点云数据库篇(二):阿里云携手MongoDB率先上线4.2数据库 云上数据库已是大势所趋...

戳蓝字“CSDN云计算”关注我们哦&#xff01;作者 | 刘丹出品 | CSDN云计算&#xff08;ID&#xff1a;CSDNcloud&#xff09;随着技术的飞速发展&#xff0c;云数据库在云计算的大背景下&#xff0c;作为一种新兴的共享基础架构方法逐渐发展起来&#xff0c;它极大地增强了数据…

Oracle 查看表空间的大小及使用情况sql语句

SELECT a.tablespace_name "表空间名称", total / (1024 * 1024) "表空间大小(M)", free / (1024 * 1024) "表空间剩余大小(M)", (total - free) / (1024 * 1024 ) "表空间使用大小(M)", total / (1024 * 1024 * 1024) "表空…

高可用、弹性动态的金融级移动架构在蚂蚁金服的演进之路

本文基于重岳在 2018 年 Arch Summit 北京站的分享内容进行总结&#xff0c;希望通过本篇文章介绍近些年来支付宝在移动端架构的上演进和思考&#xff0c;期冀能给读者们带来些许帮助。 支付宝作为国民级应用&#xff0c;当前全球用户已经超过 10 亿&#xff0c;提供了超过 200…

Android代码混淆方法,Android 代码混淆零基础入门

内容提要本篇文章主要有三个部分&#xff0c;让读者读完后能自己写规则混淆项目对Android代码怎么开启混淆做一个简单的介绍。对混淆规则做一个简单介绍&#xff1b;在混淆过后Crash日志反推代码工具retrace.bat、可视化反推工具GUI说明。对混淆的一个简单介绍&#xff1a;Andr…

oracle查询当前用户名下所有表

--SONARQUBE为用户名&#xff0c;用户名必须是大写 SELECT * from all_tables where ownerSONARQUBE;--查看当前登录的用户的表: SELECT table_name from user_tables;

JUC包中的分而治之策略-为提高性能而生

一、前言 本次分享我们来共同探讨JUC包中一些有意思的类&#xff0c;包含AtomicLong & LongAdder,ThreadLocalRandom原理。 二、AtomicLong & LongAdder 2.1 AtomicLong 类 AtomicLong是JUC包提供的原子性操作类&#xff0c;其内部通过CAS保证了对计数的原子性更新…