深度学习 AI 解释:神经网络

074e6743d16894689da8f052b110e834.png

来源:ScienceAI

编译:绿萝

在过去的 10 年里,性能最好的人工智能系统——比如智能手机上的语音识别器或谷歌最新的自动翻译器——都是由一种称为「深度学习」的技术产生的。

深度学习实际上是一种称为神经网络的人工智能方法的新名称,70 多年来一直时兴时衰。神经网络最初是由 Warren McCullough 和 Walter Pitts 于 1944 年提出的,这两位芝加哥大学的研究人员于 1952 年搬到麻省理工学院,他们有时被称为第一个认知科学系的创始成员。

神经网络是神经科学和计算机科学的一个主要研究领域,直到 1969 年,根据计算机科学的传说,他们被麻省理工学院的数学家 Marvin Minsky 和 Seymour Papert 「扼杀」了。一年后,Marvin Minsky 和 Seymour Papert 成为麻省理工学院新的人工智能实验室的联合主任。

cf95fea746745ad413de735dc286dec8.png

该技术随后在 20 世纪 80 年代复兴,在新世纪的第一个十年再次陷入衰退,并在第二个十年如火如荼地回归,主要是由于图形芯片处理能力的提高。

麻省理工学院麦戈文脑科学研究所研究员、麻省理工学院大脑、思想和机器中心、麻省理工学院脑与认知科学教授 Tomaso Poggio 说:「有一种观点认为科学中的想法有点像病毒的流行。 显然有五六种基本的流感病毒株,而且显然每一种都会在大约 25 年的时间内回归。人们被感染后会产生免疫反应,因此在接下来的 25 年内不会被感染。然后新的一代,将被同一株病毒感染。在科学中,人们会爱上一个想法,为之兴奋,将其锤死,然后免疫——他们厌倦了它。所以思想应该有同样的周期性!」

重大事项

神经网络是进行机器学习的一种手段,计算机通过分析训练示例来学习执行某些任务。通常,这些示例已经预先进行了手工标记。例如,对象识别系统可能会收到数千张带有汽车、房屋、咖啡杯等标签的图像,它会在图像中找到与特定标签一致相关的视觉模式。

神经网络以人脑为模型,由数千甚至数百万个紧密互连的简单处理节点组成。今天的大多数神经网络都被组织成节点层,它们是「前馈」的,这意味着数据只能在一个方向上通过它们。一个单独的节点可以连接到它下面一层的几个节点,从那里接收数据,并连接到它上面一层的几个节点,向那里发送数据。

对于每个传入的连接,节点将分配一个称为「权重」的数字。当网络处于活动状态时,节点在其每个连接上接收不同的数据项(不同的数字),并将其乘以相关的权重。然后将结果乘积加在一起,产生一个数字。如果该数字低于阈值,则节点不会将数据传递到下一层。如果数量超过阈值,则节点「触发」,这在当今的神经网络中,通常意味着沿其所有输出连接发送数字——加权输入的总和。

在训练神经网络时,其所有权重和阈值最初都设置为随机值。训练数据被馈送到底层——输入层——它通过后续层,以复杂的方式相乘和相加,直到最终到达输出层,彻底改变。在训练期间,权重和阈值会不断调整,直到具有相同标签的训练数据始终产生相似的输出。

头脑和机器

McCullough 和 Pitts 在 1944 年描述的神经网络有阈值和权重,但没有分层,研究人员也没有指定任何训练机制。McCullough 和 Pitts 表明,原则上,神经网络可以计算数字计算机可以计算的任何函数。结果是神经科学而不是计算机科学:重点是表明人脑可以被认为是一种计算设备。

神经网络仍然是神经科学研究的宝贵工具。例如,用于调整权重和阈值的特定网络布局或规则,再现了观察到的人类神经解剖学和认知特征,这表明它们捕获了大脑如何处理信息的某些信息。

1957 年,康奈尔大学心理学家 Frank Rosenblatt 展示了第一个可训练的神经网络——感知器。感知器的设计与现代神经网络的设计非常相似,只是它只有一层,权重和阈值可调,夹在输入层和输出层之间。

在 1959 年之前,感知器一直是心理学和计算机科学新兴学科的活跃研究领域,当时 Minsky 和 Papert 出版了一本名为《感知器》的书,该书表明在感知器上执行某些相当常见的计算会非常耗时。

「当然,如果你采用稍微复杂一点的机器——比如两层,所有这些限制都会消失,」Poggio 说。但当时,这本书对神经网络研究产生了寒蝉效应。

「你必须把这些事情放在历史背景下,」Poggio 说。「他们在争论编程——像 Lisp 这样的语言。不久之前,人们还在使用模拟计算机。当时根本不清楚编程要走的路。我认为他们有点过火了,但像往常一样,这不是黑白分明的。如果你认为这是模拟计算和数字计算之间的竞争,他们在为当时正确的事情而战。」

周期性

然而,到 20 世纪 80 年代,研究人员已经开发出修改神经网络权重和阈值的算法,这些算法对于具有不止一层的网络来说足够有效,消除了 Minsky 和 Papert 确定的许多限制,该领域迎来了复兴。

但从理智上讲,神经网络有一些不令人满意的地方。足够的训练可能会将网络的设置修改为可以对数据进行有用的分类,但这些设置意味着什么?对象识别器正在查看哪些图像特征,它如何将它们拼凑成汽车、房屋和咖啡杯的独特视觉特征?查看单个连接的权重并不能回答这个问题。

近年来,计算机科学家开始想出巧妙的方法来推断神经网络采用的分析策略。但在 20 世纪 80 年代,网络的策略难以理解。所以在世纪之交,神经网络被支持向量机取代,支持向量机是一种基于一些非常简洁「优雅」的数学的机器学习替代方法。

2cb2a610f66cc946ec4e6285f4d47e25.png

最近神经网络的复兴——深度学习革命——得益于计算机游戏行业。当今视频游戏的复杂图像和快速节奏需要能够跟上的硬件,结果就是图形处理单元 (GPU),它在单个芯片上封装了数千个相对简单的处理内核。研究人员很快就意识到 GPU 的架构与神经网络的架构非常相似。

现代 GPU 使 20 世纪 60 年代的单层网络和 20 世纪 80 年代的两到三层网络发展为今天的 10 层、15 层甚至 50 层网络。这就是「深度学习」中的「深度」所指的——网络层的深度。目前,深度学习几乎在人工智能研究的每个领域都为性能最佳的系统负责。

引擎盖下

网络的不透明性仍然令理论家感到不安,但在这方面也取得了进展。除了指导大脑、思维和机器中心 (CBMM) 外,Poggio 还领导该中心的智能理论框架研究项目。最近,Poggio 和他的 CBMM 同事发布了一个由三部分组成的神经网络理论研究。

ecf998ed3ea3a0e4a7f733be1dd09015.png

内容地址:https://cbmm.mit.edu/research/thrusts/theoretical-frameworks-intelligence

第一部分发表在《国际自动化与计算杂志》(International Journal of Automation and Computing)上,讨论了深度学习网络可以执行的计算范围,以及深度网络何时比浅层网络更具优势。

4cb6e417ce625f12d9a058dbef5c7a2e.png

论文地址:https://link.springer.com/article/10.1007/s11633-017-1054-2

第二部分和第三部分已作为 CBMM 技术报告发布,解决了全局优化问题;或保证网络找到最符合其训练数据的设置、过度拟合;或者网络变得如此适应其训练数据的细节以致无法推广到相同类别的其他实例的情况。

908d491a72d25d897c2e15488d4ca295.png

论文地址:

http://cbmm.mit.edu/sites/default/files/publications/CBMM-Memo-067.pdf

还有很多理论问题有待回答,但 CBMM 研究人员的工作,可以帮助确保神经网络最终打破使它们在七十年内受到青睐和失宠的世代循环。

参考内容:https://scitechdaily.com/deep-learning-ai-explained-neural-networks/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

65bb0779adb50a4eb966ea4a2f0950dd.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/483309.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美国国家科学院发布:材料有哪些研究前沿?

来源:中国科学院科技战略咨询研究院作者:张超星编辑:新材料在线美国国家科学院、工程院和医学科学院发布了针对材料研究的第三次十年调查——《材料研究前沿:十年调查》报告。该报告主要评估了过去十年中材料研究领域的进展和成就…

牛顿第三定律不再起作用:芝加哥大学找到了一种新系统,作用力不等于反作用力...

来源:AI科技评论作者:吴彤编辑:青暮世界上还有许多并未达到平衡的系统,比如生命,在这样的系统中,牛顿第三定律失效了。目前,芝加哥大学的研究员找到了一种思考非平衡系统中相变的新方法。牛顿第…

linux的基础知识——TCP通信状态

文章目录1.半关闭shutdown2.端口复用setsockopt2.1 程序中遇到的问题2.2 端口复用3.多路I/O转接3.1 什么是多路I/O转接服务器&#xff1f;3.2 select3.3 poll3.4 epoll3.4.1 epoll API1.半关闭shutdown 2.端口复用setsockopt 2.1 程序中遇到的问题 2.2 端口复用 #include<s…

大脑模拟AI学习策略,这项逼近反向传播的研究登上《自然-神经科学》

来源&#xff1a;机器之心编辑&#xff1a;陈萍、杜伟大脑是如何近似反向传播算法的&#xff1f;发表在《自然 - 神经科学》的一篇论文&#xff0c;研究者找到了可以生活在活体大脑并进行实时工作的等价物&#xff0c;他们提出的大脑学习算法模型可以模拟反向传播过程。每当人类…

linux的基础知识——TCP异常断开

1.TCP异常断开 1.1 心跳检测机制 1.2 设置TCP属性

普京谈“元宇宙”:这无疑是一种挑战

来源&#xff1a;参考消息网据塔斯社莫斯科11月12日报道&#xff0c;俄罗斯总统弗拉基米尔普京认为&#xff0c;“元宇宙”带来的可能性应该用于突破距离的限制&#xff0c;帮助交流和学习&#xff0c;而不是逃避现实世界的出路。普京在出席2021年“人工智能之旅”国际会议&…

论文阅读 | DasiamRPN

文献&#xff1a;DaSiamRPN: Zheng Zhu, Qiang Wang, Bo Li, Wu Wei, Junjie Yan, Weiming Hu."Distractor-aware Siamese Networks for Visual Object Tracking." ECCV (2018). [paper][github] 文章主要贡献 1.训练数据的扩充 加入Detection pair (ImageNet,COCO中…

linux的基础知识——UDP

1.UDP服务器 2.UDP处理模型 3.多播 4.分屏软件的实现

UC伯克利发现「没有免费午餐定理」加强版:每个神经网络,都是一个高维向量...

来源&#xff1a;AI科技评论作者&#xff1a;Mr Bear、杏花编辑&#xff1a;青暮经典的「没有免费午餐定理」表明&#xff1a;如果某种学习算法在某些方面比另一种学习算法更优&#xff0c;则肯定会在其它某些方面弱于另一种学习算法。也就是说&#xff0c;对于任何一个学习问题…

第二阶段团队冲刺(十)

会议内容&#xff1a; 高宇&#xff1a; 昨天制作了一个自定义的控件&#xff0c;可以实现&#xff0c;对时间的ViewText进行侦听&#xff0c;当点击时弹出自定义框&#xff0c;选择获取&#xff0c;年月日&#xff0c;并更改数据库方法 遇到的问题&#xff1a;所用的数据库查询…

专家:人工智能开始对现实世界产生重大影响

来源&#xff1a;人机与认知实验室编译&#xff1a;喻玲萧 编辑&#xff1a;王旭泉中国日报网11月8日电 据英国《卫报》报道&#xff0c;曾撰写过一本有关人工智能的权威教科书的美国科学家表示&#xff0c;在将人工智能的进步比作原子弹技术的发展时&#xff0c;专家们被自己在…

Java 添加、更新和移除PDF超链接

简介 PDF超链接用一个简单的链接包含了大量的信息&#xff0c;满足了人们在不占用太多空间的情况下渲染外部信息的需求。下面将介绍通过Java 在PDF中添加、更新和移除超链接。 &#xff08;一&#xff09;工具使用&#xff1a; Free Spire.PDF for Java 2.4.4&#xff08;免费版…

linux的基础知识——shell基础

文章目录1.什么是shell&#xff1f;2.shell历史3.编写一个shell脚本3.1创建一个.sh文件3.2 编写一个简单的脚本内容3.3 执行4.shell 数据类型和变量4.1 数据类型4.2 变量5.文件名代换6.命令代换7.算术代换8.转义字符9.单引号10.双引号1.什么是shell&#xff1f; 2.shell历史 3.…

CCF发布2020-2021中国计算机科学技术发展报告

来源&#xff1a;中国计算机学会本年度《发展报告》的组织和策划工作得到了CCF各专业委员会和广大会员的大力支持与积极响应&#xff0c;共收到23份反映不同方向进展的报告申请。CCF学术工作委员会组织评审&#xff0c;遴选出具有代表性的高水平报告共14篇。本《发展报告》包含…

欧盟「人脑计划」​最新进展:新算法模拟生物进化,为大脑如何工作提供新见解...

来源&#xff1a;ScienceAI编辑&#xff1a;凯霞2013 年&#xff0c;欧盟「人脑计划」&#xff08;Human Brain Project&#xff0c;HBP&#xff09;正式启动&#xff0c;是欧洲最大的脑科学项目&#xff0c;也是欧盟资助的最大研究项目之一。是欧盟首批为期 10 年、预算 10 亿…

linux的基础知识——shell语法

文章目录1.shell语法——条件测试1.1 条件测试1.2 条件测试2.shell语法——分支语句3.shell语法——case分支语句4.shell语法——foreach循环5.shell语法——while循环6.shell语法——break和continue7.位置参数和特殊变量8.输入输出8.1 echo8.2 管道8.3 tee8.4 文件重定向9. 函…

杨振宁:宇宙有没有造物者?

来源&#xff1a;一刻talks未来智能实验室的主要工作包括&#xff1a;建立AI智能系统智商评测体系&#xff0c;开展世界人工智能智商评测&#xff1b;开展互联网&#xff08;城市&#xff09;大脑研究计划&#xff0c;构建互联网&#xff08;城市&#xff09;大脑技术和企业图谱…

基于STM32的DS1302实时时钟模块应用及原理介绍

在嵌入式系统中&#xff0c;实时时钟模块是一个常见的功能模块&#xff0c;用于记录和管理系统的时间信息。DS1302是一款低功耗、具有多种功能的实时时钟芯片&#xff0c;被广泛应用于各种电子产品中。本文将介绍基于STM32微控制器的DS1302实时时钟模块的应用及原理&#xff0c…