PNAS新研究:剑桥学者发现,有些 AI 模型无法被计算

9b68e4cada63b69b72f97a427e7fd574.png

来源:AI科技评论

作者:Ailleurs

编辑:陈彩娴

近日,剑桥学者在《美国科学院院报》(PNAS)上发表了一篇名为“The Difficulty of Computing Stable and Accurate Neural Networks: On the Barriers of Deep Learning and Smale's 18th Problem”的文章,提出了一个有趣的发现:

研究者可以证明存在具有良好近似质量的神经网络,但不一定存在能够训练(或计算)这类神经网络的算法。

98f1edea0434a36822e5be22fa166d76.png

论文地址:

http://www.damtp.cam.ac.uk/user/mjc249/pdfs/PNAS_Stable_Accurate_NN.pdf

这与图灵的观点相似:无论计算能力和运行时间如何,计算机都可能无法解决一些问题。也就是说,哪怕再优秀的神经网络,也可能无法对现实世界进行准确的描述。

不过,这并不表明所有的神经网络都是有缺陷的,而是它们仅仅在特定情况下才能达到稳定和准确的状态。

研究团队通过引入一个经典逆问题,提出了一个分类理论,用来描述哪些神经网络可以通过算法进行计算,对「人工智能可以做什么和不可以做什么」这一历史性问题给出了一个新的答案。

同时,他们开发了一个新的模型——「快速迭代重启网络」(FIRENETs),能够在应用场景中同时保证神经网络的稳定性和准确性。一方面,FIRENETs 所计算的神经网络在对抗扰动方面具有稳定性,还能够将不稳定的神经网络变得稳定;另一方面,它在保持稳定性的前提下还取得了高性能和低漏报率。

以下是对该工作的简单介绍:

1

研究背景

深度学习 (DL) 取得了前所未有的成功,现在正全力进入科学计算领域。然而,尽管通用的逼近特性可以保证稳定的神经网络 (NN) 的存在,但当前的深度学习方法往往存在不稳定性。这个问题使得深度学习在现实生活中的落地充满危险。

比方说,Facebook(Meta)和纽约大学于2019年的 FastMRI 挑战赛中曾称,在标准图像质量指标方面表现良好的网络容易出现漏报,无法重建微小但具有物理相关性的图像异常。2020年 FastMRI 挑战赛将重点放在病理上,又指出:「这种虚幻的特征是不可接受的,尤其如果它们模拟的是正常结构,而这些结构要么不存在,要么实际上是异常的,那就非常有问题。正如对抗扰动研究所证明的,神经网络模型可能是不稳定的」。显微镜学中也存在类似的例子。

在不同的应用场景中,对误报率和漏报率的容忍度是不同的。对于具有高错误分析成本的场景,必须避免这种误报和漏报。因此,在医疗诊断等应用场景中,人工智能的「幻觉」可能存在非常严重的危险。

对于该问题,经典的近似定理表明,连续函数可以用神经网络很好地任意逼近。因此,用稳定函数描述的稳定问题往往可以用神经网络稳定地解决。这就产生了这样一个基础性问题:

为什么有些场景已被证明存在稳定、准确的神经网络,深度学习还会出现不稳定的方法和由 AI 生成的「幻觉」?

为了回答这个问题,研究者们启动了研究,希望确定深度学习在逆问题中所能达到的极限。

此外,深度学习中的神经网络还存在稳定性和准确性的权衡问题。稳定性差是现代人工智能的致命弱点,这方面也有一个悖论:尽管存在稳定的神经网络,但训练算法仍能发现不稳定的神经网络。这个基础性问题与Steven Smale 在1998年就人工智能极限提出的第18个数学问题有关。

计算稳定的神经网络并不困难,例如,零网络就是稳定的,但它准确度不高,因而不是特别有用。最大的问题是:如何计算既稳定又准确的神经网络?科学计算本身基于稳定性和准确性,然而,两者之间往往存在取舍,有时必须牺牲准确性以确保稳定性。

2

分类理论:计算稳定NN的算法的存在条件

针对上述问题,作者团队提出了一种分类理论,描述了达到一定准确度(且稳定)的神经网络可以被算法计算的充分条件。

他们从一个线性方程组欠定系统的经典逆问题出发:

45ab57a8a2aa84108c78d038fe98b2ce.png

在这里,A∈Cm ×N 表示采样模型(m < N),比如 MRI 中的下采样离散傅里叶变换,x表示未知量。矢量 e 对噪声或扰动进行建模。该方程 1 所展示的问题是许多逆问题和图像分析的基础。

基于定理1和定理2(定理详情见论文),他们指出这样一个悖论性问题:

存在从训练数据到合适的神经网络的映射,但没有训练算法(即使是随机的算法)可以从训练数据中计算神经网络的近似值。

对此,该论文的其中一位作者Hansen做了一个类比:「可能存在一种蛋糕,但却不存在制作它的配方」。他认为,问题不在于「配方」,而是在于制作蛋糕所必须的「工具」,有可能无论你使用什么搅拌机,都无法制作出想要的蛋糕,但在某些情况下,也有可能你自家厨房里的搅拌机就足够了。

那么是在什么情况下呢?研究团队对计算神经网络的算法进行了分类,解释了什么条件下计算神经网络的算法才会存在(这也可以类比为:哪些蛋糕可以用具有物理设计可能性的搅拌机来制作):

  • 定理2

计算神经网络的算法是否存在取决于期望的精度。对于任意正整数 K > 2 和 L,存在良态问题类,同时有以下情况:

a)不存在随机训练算法(即便是随机的算法)能以超过 50% 的概率计算出具有 K 位精度的神经网络;

b)存在一种确定的训练算法,可以计算具有 K-1 位精度的神经网络,但需要大量的训练数据;

c)存在一种确定的训练算法,可以使用不超过 L 个训练样本计算具有 K-2 位精度的神经网络。

这表明,一些基础性的、本质性的障碍阻止了神经网络被算法计算。这也是为什么一些场景中存在稳定而准确的神经网络,但深度学习仍会出现「幻觉」的原因。

3

FIRENETs:平衡稳定性与准确性

神经网络的稳定性与准确性之间存在权衡问题,一个稳定的神经网络在逆问题中的性能表现往往是有限的。这在图像重建中尤其突出,当前深度学习重建图像的方法会出现不稳定性,这体现在:

  • 1)在图像或抽样域中的一个微小扰动就可能在重建图像中产生严重的伪影;

  • 2)图像域中的一个微小细节可能会在重建图像中被洗掉(缺乏准确性),导致潜在的漏报。

这类线性逆问题导致深度学习方法在稳定性与准确性之间的不平衡,使得任何图像重建方法都无法在不牺牲准确性的情况下保持较高的稳定性,反之亦然。

为了解决这个问题,研究团队引入一种「快速迭代重启网络」(FIRENETs)。经证明与数值验证,FIRENETs 十分稳定。他们发现:在特定条件下,比如在 MRI中 ,有一些算法可以为方程1中的问题计算稳定的神经网络。

关键是,他们证明了 FIRENETs 对扰动具有鲁棒性,甚至可用来使不稳定的神经网络变得稳定。

FIRENETs对扰动具有鲁棒性

在稳定性测试中,团队将 FIRENETs 与V. Antun等人(2020)开发的AUTOMAP网络进行对比。如下图中的上行所示,AUTOMAP网络重建很不稳定,导致图像完全变形。下行则是使用FIRENETs网络的重建结果。即使在最差的重建结果中,它仍然保持稳定。

0a3cea69f4cc236fa04af0274fa1ea79.png

这证明了由FIRENETs算法所计算的神经网络在小波中稀疏的图像中,在对抗扰动方面具有稳定性,而且同时能够维持一定的准确性。

FIRENETs的稳定器作用

同时,FIRENETs也起到了一个稳定器的作用。比如在下图中,将来自AUTOMAP的重建输入到FIRENETs,结果显示,FIRENETs修正了AUTOMAP的输出并将重建加以稳定化。

adfbafcbb9a8d871a3e9a4fcdc597cc9.png

图注:在AUTOMAP 的末端添加一些FIRENET层使其稳定。最左边是AUTOMAP的重建。左二是x0 = Ψ( ̃y)的FIRENET 的重建。右二是 ̃y = Ax + e3时FIRENET 的重建。最右边是输入AUTOMAP 的测量值后FIRENET的重建。

FIRENETs兼具稳定性与准确性

在下图中,一个在包含椭圆形状的图像上训练的 U-Net 很稳定,但是,当添加一个原先不包含在训练集中的细节后,U-Net 的稳定性就会受到极大影响。

b049380e240bfd1d9bce647f2b5552bb.png

图注:性能有限的神经网络经过训练是可以具有稳定性的。考虑三个重建网络Φj : Cm → CN, j = 1, 2, 3。对于每一个网络,计算一个扰动值wj∈CN,旨在模拟最坏的效果,并在左列展示了一个经裁剪的摄动图像x + wj (第二至四行)。中间一列(第二至四行)显示了每一个网络的重建图像 Φj(A(x + wj))。在右列,以“Can u see it?”的文本形式测试了网络对微小细节h1的重建能力。

可以看到,在有噪声测量值条件下训练的网络对于最坏情况下的扰动保持稳定,但并不准确。相反,无噪声训练的网络是准确的,但不稳定。而FIRENET实现了二者的平衡,对于小波稀疏且在最坏情况下的稳定图像来说,它仍是准确的。

但这并不是故事的结局,在现实生活中的应用场景中,找出稳定性与精度之间的最优权衡是最重要的,这无疑需要无数种不同的技术来解决不同的问题和稳定性误差。

参考链接:

https://spectrum.ieee.org/deep-neural-network

http://www.damtp.cam.ac.uk/user/mjc249/pdfs/PNAS_Stable_Accurate_NN.pdf

https://www.pnas.org/doi/full/10.1073/pnas.2107151119

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

86691640621c7b82dbda306bdd62cc3e.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482294.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

量子计算机首次成功模拟化学反应

SHUTTERSTOCK来源&#xff1a;IEEE电气电子工程师━━━━利用谷歌的Sycamore量子处理器&#xff0c;科学家们进行了迄今为止涉及量子计算机的最大规模的化学模拟。他们采用了一种新技术&#xff0c;可能有助于抵抗量子电路中常见的噪声。量子计算机理论上可以实现量子优势&…

单链表的按位置插入和删除

单链表的插入和删除 文章目录单链表的插入和删除1 单链表插入2 单链表删除3 代码实现1 单链表插入 要想将结点s插入到ai与ai1之间&#xff0c;不需要移动数据元素&#xff0c;只需要在ai与ai1之间插入一个新的结点&#xff0c;也就是我们要插入的结点s。关键就是要修改结点p的…

DeepMind最新研究:如何将「大语言模型」 训练到最优?

来源&#xff1a;AI科技评论 作者&#xff1a;维克多Transformer的提出距离我们已经有5年的时间&#xff0c;随着模型规模的不断增长&#xff0c;性能提升也逐渐出现边际效益递减的情况。如何训练出最优性能的大模型&#xff1f;最近&#xff0c;DeepMind做了一项调查&#xf…

给计算机处理器做手术来研究大脑

来源&#xff1a;混沌巡洋舰在人类对大脑认识的历史上&#xff0c;曾经使用过很多隐喻来描述脑&#xff0c;比如齿轮机械、电话交换机、计算机等等。目前&#xff0c;“脑就像一台计算机”这个隐喻仍然占据着主导地位&#xff0c;尽管人们对于这个隐喻的贴切程度的看法存在分歧…

为什么百度查到的ip地址和ipconfig查到的不同;详解公网Ip和私网ip; 网络分类ABC类;

文章目录1.百度查到的ip和ipconfig查到的不同1.1引出问题1.2不一样的原因2.IP地址分类2.1IP类别2.1 Public IP和Private IP3.总结3.1整理上网流程3.2遗留问题1.百度查到的ip和ipconfig查到的不同 IP可以分为Public IP 和 Private IP,出现这种规划的原因在于IPv4所能表示的IP太少…

国科金:共融机器人基础理论与关键技术研究重大研究计划

来源&#xff1a;学术头条国家自然科学基金委员会现发布共融机器人基础理论与关键技术研究重大研究计划 2022 年度项目指南&#xff0c;请申请人及依托单位按项目指南中所述的要求和注意事项申请。 国家自然科学基金委员会 2022 年 4 月 2 日一、科学目标本重大研究计划瞄准国…

停止追赶最新的 RPA 趋势

来源&#xff1a;AI前线作者&#xff1a;Anupam Krishnamurthy译者&#xff1a;Phoenix策划&#xff1a;蔡芳芳本文最初发布于 anupam.de 博客&#xff0c;由 InfoQ 中文站翻译并分享。我做了 4 年的 RPA 开发者——2017 至 2021 年。在 2019 年底&#xff0c;我做了一个重要的…

请求转发与重定向的区别和执行流程

请求转发与重定向的区别和执行流程 文章目录请求转发与重定向的区别和执行流程1 请求转发与重定向区别2 现实生活的例子2.1 重定向2.2 请求转发3 重定向-流程图、代码、结果3.1 流程图3.2 代码BoyServlet3.3 代码GirlServlet3.4 web.xml文件3.5 结果4 请求转发-流程图、代码、结…

牛津大学最新调研:AI面临基准危机,NLP集中“攻关”推理测试

来源&#xff1a;AI科技评论作者:维克多人工智能&#xff08;AI&#xff09;基准为模型提供了衡量和比较的路径&#xff0c;超越基准&#xff0c;达到SOTA&#xff0c;经常成为顶会论文的标配。同时&#xff0c;有些基准确实推动了AI的发展&#xff0c;例如ImageNet 基准测试对…

Postman使用小教程--基础入门篇

文章目录1 Postman介绍2 postman基础功能介绍2.1 postman基础页面2.2 postman基础页面介绍2.2 接口测试流程和原理2.3 请求区域介绍3 导出和导入接口集3.1 导出3.2 导入4 设置环境变量4.1 环境变量优先级4.2 新建环境变量4.3 将返回值的某个数据设置为环境变量4.4 将其他的常用…

W玻色子质量实验与理论矛盾,或是十年来最重要的进展

来源&#xff1a;科学大院就在昨天&#xff0c;美国费米实验室的CDF项目在《Science》上发了篇文章&#xff0c;W玻色子质量的测量结果和标准模型预测的结果有明显差距。消息一出&#xff0c;粒子物理界炸了窝。因为这或许是十年来最重要的粒子物理进展&#xff01;这个结果意味…

Git理论教程

文章目录1 什么是Git1.1 什么是版本控制系统1.2 为什么需要版本控制系统1.3 常见的版本控制工具1.4 版本控制分类1.4.1 集中版本控制 SVN1.4.2 分布式版本控制 Git1.4.3 Git与SVN的主要区别2 Git环境配置3 Git基本理论3.1 Git三个区域3.2 Git工作流程3.3 Git项目搭建3.3.1 本地…

Science | 再创生命奇迹!日本科学家造出了不需要“父亲”的大鼠及小鼠

来源&#xff1a;【iNature】iNature从多能干细胞 (PSC) 体外生成生殖细胞可以对未来的生殖医学和动物育种产生重大影响。十年前&#xff0c;在小鼠中建立了体外配子发生。然而&#xff0c;在任何其他物种中尚未实现诱导原始生殖细胞样细胞&#xff08;PGCLCs&#xff09;产生配…

总结Vue中index.html、main.js、App.vue、index.js之间关系以及Vue项目加载流程

总结Vue中index.html、main.js、App.vue、index.js之间关系以及Vue项目加载流程 文章目录总结Vue中index.html、main.js、App.vue、index.js之间关系以及Vue项目加载流程1 vue中index.html、main.js、App.vue、index.js关系简介1.1 项目的运行入口index.html1.2 入口文件main.j…

ACM 杰出会员姬水旺:量子化学和物理的深度学习

整理&#xff1a;汪浩文校对&#xff1a;维克多量子技术和人工智能都是当前最先进的科学技术&#xff0c;前者被寄希望于拥有超强的计算能力&#xff0c;后者已经在各行各业“大杀四方”。当两者相遇会碰撞出什么样的火花&#xff1f;人工智能又能在哪些方面助力量子技术&#…

1 操作系统第一章 操作系统概念、功能、四大特征、操作系统发展与分类

文章目录1.1 操作系统概念1.2 操作系统功能1.3 操作系统四大特征1.3.1 并发1.3.2 共享1.3.3 并发性和共享区别及对应关系&#xff1a;1.3.4 虚拟1.3.5 异步1.4 操作系统的发展与分类1.4.1 手工操作阶段1.4.2 批处理阶段——单道批处理系统1.4.3 批处理阶段——多道批处理系统1.…

不能头脑一热,就布局颠覆性技术、上马未来产业

来源&#xff1a;财经国家周刊作者&#xff1a;曹方 何颖 姬少宇 张鹏近年来&#xff0c;布局、规划及培育人工智能与机器人、先进材料、新能源、生命科学、云计算和量子计算、混合现实等颠覆性技术、未来产业&#xff0c;成为不少地方政府推动当地产业结构调整、助力经济高质量…

2 操作系统第一章 操作系统体系结构、中断和异常、系统调用

文章目录1.1 指令概念及其分类1.2 操作系统体系结构&#xff1a;1.2.1操作系统内核概念1.3 中断和异常1.3.1 中断的诞生1.3.2 中断分类1.3.3 外中断的处理过程1.3.4 中断小结1.4 系统调用1.4.1 系统调用介绍1.4.2 系统调用功能1.4.3 系统调用小结1.1 指令概念及其分类 指令就是…

百年诺奖的那些争议与放弃

来源&#xff1a;数学与通识自1901年首届诺贝尔奖颁发以来&#xff0c;它已成为人们心中最崇高、最向往的奖项之一。可能没有人想要去拒绝它&#xff0c;因为它不仅仅是奖金的问题&#xff0c;还是莫大的荣誉和骄傲&#xff0c;其追求真理、造福社会、为人类文明创造价值的初心…

3 操作系统第二章 进程管理 进程定义、特征、组织、状态与转换

文章目录1 进程的定义和特征2 进程的组织3 进程的状态与转换3.1 进程的状态3.2 进程状态转换1 进程的定义和特征 引入进程的原因 为了使程序能够并发执行&#xff0c;并且可以对并发执行的程序加以描述和控制 进程定义 进程是进程实体的运行过程&#xff0c;是系统进行资源分配…