新研究表明 深层神经网络的功能存在局限性

254f8bb3158ae1b7931a5afd7c92fc4f.png

GETTY IMAGES/IEEE SPECTRUM

来源:IEEE电气电子工程师

深度神经网络越来越有助于设计微芯片,预测蛋白质如何折叠,并在复杂游戏中胜过人们。然而,研究人员现在发现,这些人工智能系统的稳定性和准确度在理论上存在根本的限制。科学家们补充说,这些发现可能有助于阐明人工智能究竟有哪些可能性,以及哪些不可能。

在人工神经网络中,被称为“神经元”的部件被输入数据并协同解决问题,例如识别图像。神经网络反复调整神经元之间的联系,并观察由此产生的行为模式是否更善于找到解决方案。随着时间的推移,网络会发现哪些模式最适合计算结果。然后,它将这些作为默认设置,模仿人脑中的学习过程。如果一个神经网络拥有多层神经元,它就被称为“深层”。

尽管深度神经网络正被用于越来越多的实际应用,如分析医疗扫描和增强自动驾驶车辆的能力,但现在有压倒性的证据表明,它们往往是不稳定的——也就是说,它们接收到的数据稍有改变,就会导致结果的剧烈变化。例如,之前的研究发现,改变图像上的一个像素可以让人工智能认为马是青蛙,而医学图像可以以肉眼无法察觉的方式进行修改,并导致人工智能100%地误诊为癌症。

之前的研究表明,有数学证据表明,稳定、准确的神经网络适用于各种各样的问题。然而,在一项新的研究中,研究人员现在发现,虽然对于许多问题,理论上可能存在稳定、准确的神经网络,但矛盾的是,可能没有算法能够真正成功地计算它们。

“理论上,神经网络的限制很少,”英国剑桥大学的数学家Matthew Colbrook说。当试图计算这些神经网络时,问题就出现了。“数字计算机只能计算某些特定的神经网络,”挪威奥斯陆大学的数学家Vegard Antun说,“有时计算一个理想的神经网络是不可能的。”

这些新发现听起来可能令人困惑,好像有人说可能存在某种蛋糕,但不存在制作蛋糕的配方。剑桥大学的数学家Anders Hansen说:“我们会说这不是问题所在,而是你必须做的工具才是问题所在。”“我们的意思是,蛋糕可能有一个配方,但不管你有什么搅拌器,你都可能无法做出想要的蛋糕。此外,当你试图在厨房用搅拌器制作蛋糕时,你最终会得到一个完全不同的蛋糕。”

这些关于神经网络局限性的新发现呼应了数学家Kurt Gödel和计算机科学家Alan Turing之前关于数学局限性的研究。Antun说,他们粗略地揭示了“有些数学陈述永远无法被证明或反驳,有些基本的计算问题是计算机无法解决的”。

这项新的研究发现,一个算法可能无法为给定的问题计算出稳定、准确的神经网络,无论它能访问多少数据,或者该数据的准确性如何。Hansen说,这类似于Turin的观点,即无论计算能力和运行时间如何,计算机都可能无法解决一些问题。

Colbrook说:“计算机所能达到的目标存在固有的局限性,这些局限性也将在人工智能中体现出来。这意味着,关于具有强大特性的神经网络存在性的理论结果可能无法准确描述现实中的可能性。”

这些新发现并不表明所有的神经网络都是完全有缺陷的,但它们可能只在有限的情况下被证明是稳定和准确的。“在某些情况下,可以计算出稳定而准确的神经网络,”Antun说,“关键问题是‘在某些情况下’的部分。最大的问题是找到这些情况。目前,人们对如何做到这一点知之甚少。”

研究人员发现,神经网络的稳定性和准确性之间往往存在权衡。Hansen说:“问题是,我们既要稳定,又要准确。在实践中,对于安全关键的应用,可能需要牺牲一些精度来确保稳定性。”

作为这项新研究的一部分,研究人员开发了他们称之为快速迭代重启网络(FIRENETs)。在分析医学图像等任务时,这些神经网络可以同时提供稳定性和准确性。

这些关于神经网络局限性的新发现并不是为了阻碍人工智能研究,而是可能会刺激探索如何改变这些规则的新工作。

Colbrook说:“从长远来看,弄清楚什么可以做,什么不能做,对人工智能来说是健康的。请注意,Turing和Gödel的负面结果在数学基础和计算机科学方面引发了巨大的努力。这分别影响了现代计算机科学和现代逻辑的发展。” 例如,这些新发现意味着存在一种分类理论,用于描述哪些具有给定精度的稳定神经网络可以通过算法计算。

科学家们在3月16日的《美国国家科学院院刊》上在线详细介绍了他们的发现。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

3d94e4e6dc665f9e1ac9092a23ac4ebf.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482228.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

8 计算机组成原理第五章 中央处理器 控制器 硬布线控制器 微程序控制器

文章目录1 控制器的功能和工作原理1.1 控制器的结构和功能1.2 控制单元的输入和输出1.2.1 控制单元输入1.2.2 控制单元输出2 硬布线控制器2.1 CPU的控制方式2.2 安排微操作时序的原则(最短时间完成,参考)2.2.1 安排微操作时序-取指周期2.2.2 …

从特斯拉AI团队学到的九条方法论

来源:AI前线作者:Gary Chan译者:Sambodhi策划:李冬梅尽管 OpenAI 以其在自然语言处理上的成就而著称,而 DeepMind 则以强化学习和决策而闻名,特斯拉(Tesla)无疑是计算机视觉领域最有…

9 计算机组成原理第五章 中央处理器 指令流水线

文章目录1 指令流水线基本概念性能指标1.1 指令流水的定义1.1.1 指令分法1.1.2 指令执行时间1.2 流水线的表示方法1.3 流水线的性能指标2 指令流水线影响因素分类2.1 机器周期的设置2.2 影响流水线的因素2.2.1 数据相关(数据冲突)三种类型2.2.2 流水线影…

【赛迪智库】美国允许自动驾驶汽车取消方向盘对我国L4级自动驾驶的影响

来源:赛迪智库日前,美国国家公路交通安全管理局(NHTSA)发布了最终版的《无人驾驶汽车乘客保护规定》,其中对于由自动驾驶系统操作的车辆将不被要求配备传统方向盘等手动控制装置。新规有望促进美国L4级自动驾驶汽车商业…

10 计算机组成原理第六章 总线 总线的概念与分类 总线性能指标 总线仲裁 总线操作和定时 总线标准

文章目录1 总线的概念与分类1.1总线的定义1.2 总线的特点1.3 总线的特性1.4 总线的分类1.4.1 串行总线与并行总线1.4.2 按总线功能分类1.5 系统总线的结构1.6 总线概念与分类小结2 总线的性能指标2.1 性能指标分析2.2 总线性能指标小结3 总线仲裁3.1 总线仲裁的基本概念3.2 集中…

远程操控大脑?科学家成功利用近红外线控制老鼠的行为

GETTY IMAGES来源: IEEE电气电子工程师近日,科学家首次发明了一种非侵入性的方法来控制大脑回路——大脑中的神经元群,它们共同执行一项特定任务,成功完成了让实验室动物从远处自由移动。这项将近红外光射入大脑的新技术&#xff…

3 计算机组成原理第三章 存储系统 主存简单模型及寻址 半导体寄存器 存储器分类 主存与CPU连接 双口RAM和多模块寄存器

文章目录1 主存简单模型及寻址的概念1.1 主存储器1.1.1 存储器芯片的基本结构1.1.2 寻址2 半导体存储器2.1 半导体随机存取存储器2.1.1 DRAM的刷新2.1.2 SRAM的读周期2.1.3 SRAM的写周期2.1.4 RAM-易失性存储器2.2 ROM2.2.1 ROM分类2.2.2 半导体随机存储器小结3 存储器分类3.1 …

GPT-4 即将亮相?聊聊目前已知的一切

来源:AI 前线作者:Alberto RomeroGPT-3 首度亮相于大约两年之前的 2020 年 5 月,当时正值 GPT-2 发布的一年之后。而 GPT-2 距离最初 GPT 研究论文的发表也是相隔一年。如果这种周期性趋势继续保持不变,那 GPT-4 肯定也快跟大家见…

全职加入清华,丘成桐:为祖国、为全球数学界培养数学人才

王希勤校长为丘先生颁发聘书(照片来源:清华大学)来源:数据实战派4 月 20 日,清华大学宣布,“菲尔兹奖”首位华人得主丘成桐从哈佛大学退休,受聘清华大学讲席教授,将全职任教清华。清…

11 计算机组成原理第七章 输入/输出系统 I/O系统基本概念 外部设备

文章目录1 I/O系统基本概念1.1 I/O系统演变过程1.2 I/O系统基本组成1.3 I/O方式简介1.4 I/O系统基本概念小结2 外部设备1-输入设备 输出设备2.1 外部设备2.2 输入设备2.3 输出设备2.3.1 显示器2.3.2 打印机2.4 输出设备小结3 外部设备2-外存储器3.1 外存储器3.2 磁盘存储器3.2.…

重庆大学刘礼:因果学习与应用

来源:AI科技评论作者:刘礼编辑:维克多因果学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注。4月9日,在AI TIME青年科学家——AI 2000学者专场论坛上,重庆大学大数据与软件学院教授刘礼…

12 计算机组成原理第七章 输入/输出系统 中断系统

文章目录1 中断的基本概念2 中断请求的分类3 中断请求标记4 中断判优-实现5 中断处理过程5.1 中断处理过程-中断隐指令5.2 中断处理过程-硬件向量法5.3 中断处理过程-中断服务程序6 单重中断与多重中断6.1 单重中断与多重中断比较7 中断屏蔽技术中断屏蔽字例题8 中断系统小结1 …

神经形态计算的物理学

来源: 集智俱乐部作者:张晓雨编辑:邓一雪 摘要神经形态计算(neuromorphic computing)从脑科学汲取灵感来为信息处理创造节能硬件,并能适应高度复杂的任务。2020年发表在 Nature Reviews Physics 上的一篇文…

13 计算机组成原理第七章 输入/输出系统 I/O方式 I/O接口

文章目录1 I/O接口1.1 接口定义1.2 I/O接口的功能(以单总线为例)1.3 I/O接口的基本结构1.4 接口与端口1.5 I/O端口及其编址1.6 I/O接口的类型1.7 I/O接口小结2 I/O方式2.1 I/O方式1-程序查询方式2.1.1 程序查询方式流程图2.1.2 程序查询方式接口2.1.3 程…

参与全球人工智能创新链竞争

来源:社科院工业经济研究所作者:郭朝先,中国社会科学院工业经济研究所研究员、产业组织研究室主任、中国社会科学院大学教授、博士生导师、中国可持续发展研究会理事;方澳,中国社会科学院大学经济学院。本文首发《经济…

4 计算机组成原理第三章 存储系统 高速缓冲存储器 虚拟存储器

文章目录1 局部性原理性能分析2 Cache工作原理(简易版)3 地址映射4 替换算法4.1 替换算法(十进制)举例4.2 Cache工作原理(加强版)4.2.1写策略-命中4.2.2 写策略-未命中4.3 替换算法(二进制&…

CICC城市大脑专委会获批成立,欢迎参加专委会共同探索和研究

CICC 城市大脑专委会中国指挥与控制学会(CICC)是经国家民政部正式注册的我国指挥与控制科学技术领域的国家一级学会,是全国性科技社会组织;是中国科学技术协会的正式团体会员,接受中国科学技术协会的直接领导&#xff…

讲座文稿 | 人工智能与因果推理

来源:本文为中国人民大学明德讲坛第23期暨服务器艺术人工智能哲学第11期讲座文稿。主持人:朱锐 嘉宾:邱德钧、秦曾昌、Vincent Luizzi、袁园 主办:中国人民大学哲学与认知科学跨学科交叉平台、服务器艺术 协办:神经现…

顺序栈的介绍及实现

1 栈 从数据结构角度来讲,栈也是线性表,其操作是线性表操作的子集,属操作受限的线性表。 但从数据类型的角度看,它们是和线性表大不相同的重要抽象数据类型。 ◆ 栈是只准在一端进行插入和删除操作的线性表,该端称为栈…

内排序算法一览

文章目录1 插入排序2 希尔(shell)排序3 冒泡排序4 快速排序5 选择排序6 堆排序7 归并排序8 内排序代码一览运行结果常用排序算法时间复杂度和空间复杂度一览表排序:将一组杂乱无章的数据按一定的规律顺次排列起来,可以看作是线性表的一种操作…