GETTY IMAGES/IEEE SPECTRUM
来源:IEEE电气电子工程师
深度神经网络越来越有助于设计微芯片,预测蛋白质如何折叠,并在复杂游戏中胜过人们。然而,研究人员现在发现,这些人工智能系统的稳定性和准确度在理论上存在根本的限制。科学家们补充说,这些发现可能有助于阐明人工智能究竟有哪些可能性,以及哪些不可能。
在人工神经网络中,被称为“神经元”的部件被输入数据并协同解决问题,例如识别图像。神经网络反复调整神经元之间的联系,并观察由此产生的行为模式是否更善于找到解决方案。随着时间的推移,网络会发现哪些模式最适合计算结果。然后,它将这些作为默认设置,模仿人脑中的学习过程。如果一个神经网络拥有多层神经元,它就被称为“深层”。
尽管深度神经网络正被用于越来越多的实际应用,如分析医疗扫描和增强自动驾驶车辆的能力,但现在有压倒性的证据表明,它们往往是不稳定的——也就是说,它们接收到的数据稍有改变,就会导致结果的剧烈变化。例如,之前的研究发现,改变图像上的一个像素可以让人工智能认为马是青蛙,而医学图像可以以肉眼无法察觉的方式进行修改,并导致人工智能100%地误诊为癌症。
之前的研究表明,有数学证据表明,稳定、准确的神经网络适用于各种各样的问题。然而,在一项新的研究中,研究人员现在发现,虽然对于许多问题,理论上可能存在稳定、准确的神经网络,但矛盾的是,可能没有算法能够真正成功地计算它们。
“理论上,神经网络的限制很少,”英国剑桥大学的数学家Matthew Colbrook说。当试图计算这些神经网络时,问题就出现了。“数字计算机只能计算某些特定的神经网络,”挪威奥斯陆大学的数学家Vegard Antun说,“有时计算一个理想的神经网络是不可能的。”
这些新发现听起来可能令人困惑,好像有人说可能存在某种蛋糕,但不存在制作蛋糕的配方。剑桥大学的数学家Anders Hansen说:“我们会说这不是问题所在,而是你必须做的工具才是问题所在。”“我们的意思是,蛋糕可能有一个配方,但不管你有什么搅拌器,你都可能无法做出想要的蛋糕。此外,当你试图在厨房用搅拌器制作蛋糕时,你最终会得到一个完全不同的蛋糕。”
这些关于神经网络局限性的新发现呼应了数学家Kurt Gödel和计算机科学家Alan Turing之前关于数学局限性的研究。Antun说,他们粗略地揭示了“有些数学陈述永远无法被证明或反驳,有些基本的计算问题是计算机无法解决的”。
这项新的研究发现,一个算法可能无法为给定的问题计算出稳定、准确的神经网络,无论它能访问多少数据,或者该数据的准确性如何。Hansen说,这类似于Turin的观点,即无论计算能力和运行时间如何,计算机都可能无法解决一些问题。
Colbrook说:“计算机所能达到的目标存在固有的局限性,这些局限性也将在人工智能中体现出来。这意味着,关于具有强大特性的神经网络存在性的理论结果可能无法准确描述现实中的可能性。”
这些新发现并不表明所有的神经网络都是完全有缺陷的,但它们可能只在有限的情况下被证明是稳定和准确的。“在某些情况下,可以计算出稳定而准确的神经网络,”Antun说,“关键问题是‘在某些情况下’的部分。最大的问题是找到这些情况。目前,人们对如何做到这一点知之甚少。”
研究人员发现,神经网络的稳定性和准确性之间往往存在权衡。Hansen说:“问题是,我们既要稳定,又要准确。在实践中,对于安全关键的应用,可能需要牺牲一些精度来确保稳定性。”
作为这项新研究的一部分,研究人员开发了他们称之为快速迭代重启网络(FIRENETs)。在分析医学图像等任务时,这些神经网络可以同时提供稳定性和准确性。
这些关于神经网络局限性的新发现并不是为了阻碍人工智能研究,而是可能会刺激探索如何改变这些规则的新工作。
Colbrook说:“从长远来看,弄清楚什么可以做,什么不能做,对人工智能来说是健康的。请注意,Turing和Gödel的负面结果在数学基础和计算机科学方面引发了巨大的努力。这分别影响了现代计算机科学和现代逻辑的发展。” 例如,这些新发现意味着存在一种分类理论,用于描述哪些具有给定精度的稳定神经网络可以通过算法计算。
科学家们在3月16日的《美国国家科学院院刊》上在线详细介绍了他们的发现。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”