在新的数学证明中,人工智能取胜

a1e14cc369ac1c130dbc7b23032261b5.png

来源:ScienceAI

编辑:绿萝

一个以 AlphaGo 等人工智能系统为原型的新计算机程序解决了组合学和图论中的几个未解决问题。

52350dba5e033b6707c8e478b3912c4e.png

去年 3 月,爱荷华州立大学(Iowa State University)的数学家 Leslie Hogben 和 Carolyn Reinhart 收到了一个惊喜。特拉维夫大学的博士后研究员 Adam Wagner 通过电子邮件告诉他们,他已经回答了他们一周前发表的一个问题——尽管不是通过任何通常的数学或蛮力计算技术。相反,他使用了游戏机。

6eea33c761e189a0e55843c7d858e420.png

论文链接:https://arxiv.org/pdf/2103.00647.pdf

「我很高兴这个问题得到了回答。很高兴 Adam 用 AI 做到了这一点。」Hogben 说。

Hogben 和 Reinhart 的问题是 Wagner  使用人工智能解决的四个问题之一。虽然 AI 以前对数学做出了贡献,但 Wagner 对它的使用却不同寻常:他将寻找 Hogben 和 Reinhart 问题的解决方案变成了一种竞赛,使用了其他研究人员在国际象棋等流行策略游戏中成功应用过的方法。

「我看到了很多关于 DeepMind 这样的公司的文章,他们创建了这些程序,可以在真正超人的水平下玩国际象棋、围棋和 Atari 游戏,」Wagner 说。「我想,如果你能以某种方式使用这些自学习算法,这些强化学习算法,并找到一种在数学中使用它们的方法,那该多好?」

Wagner 开始尝试使用类似的策略来提出反例——与数学假设相矛盾(或「反」)的例子,从而证明它是错误的。他将寻找反例重新想象成一场猜谜游戏,然后在数十个开放的数学问题上尝试了他的程序。

「我真的认为这是一项非常漂亮的工作。」悉尼大学教授 Geordie Williamson 说,他也将机器学习与数学研究相结合。

机器学习程序「教」计算机特定的能力。强化学习模型——Wagner 和 DeepMind 都使用的类型——对指令采取不干涉的方法,让计算机反复练习一项任务(如游戏)。该模型只是为了评估计算机的工作而进行干预。作为回应,计算机会在了解哪些方法会导致更好的分数时调整其策略。

强化学习已被证明是在复杂策略游戏中训练模型的有效方法。Wagner 将其应用于数学研究的愿景非常简单。

要了解如何使用强化学习来发现反例,考虑一下这个场景。假设有一个数学猜想,预测表达式 2x – x^2 对于 x 的任何实数值都是负的。这个猜想是不正确的——你可以通过产生一个 x 的值(一个反例)来证明它是错误的。(0 到 2 之间的任何数字都是反例,2x – x^2 的值在 x = 1 处达到峰值。)

为了使用强化学习做到这一点,Wagner 可能会让他的模型在一个由猜测实数 x 组成的游戏中自由发挥。玩完游戏之后,模型会收到它的分数:2x – x^2 的值。最初,由于不知道什么数字可以使分数最大化,该模型会疯狂地猜测。但是一旦模型玩了足够多的时间,一个模式就会变得明显:x 越接近 1,得分越高。通过遵循这种模式,模型一旦猜到 0 到 2 之间的数字,就不可避免地会遇到反例。

Wagner 将相同的基本方案应用于数十个问题,只是改变了计算机允许进行的分数和移动类型。所有的问题都来自离散数学,它处理分离和不同的对象——想想整数,而不是连续的数轴。

问题的离散性使 Wagner 更容易建立模型。例如,Richard Brualdi 和 Lei Cao 在 2020 年提出了一个关于矩阵的问题,其数值为 0 。计算机可以通过循环遍历每个可用点并选择 0 或 1。

「所有这些游戏都只是有限决策的有限序列,」Wagner 说。(允许无限多步骤的游戏会引入新的复杂性。)

9e178cefb59937535dc65364365a6d29.png

Brualdi 和 Cao 的问题涉及一组特定的 0-1 矩阵,他们称之为 312 模式避免(312-pattern avoiding),参考 3 x 3,「312 矩阵」,它表示混合三维向量的元素,使(a ,b,c) 变为 (c,a,b)。0-1 矩阵是 312 模式,如果无法删除它的一些行和列并最终得到 312 矩阵,则可以避免。

更具体地说,Brualdi 和 Cao 的问题是关于矩阵的一个属性,称为「permanent」(积和式),这是一个通过复杂公式获得的数字,该公式涉及所有矩阵项的相加和相乘。他们想知道哪些 312 模式避免矩阵的「permanent」值最大,以及「permanent」值可能达到多大,从而对任意大小的方阵进行猜测。

为了回答他们的问题,Wagner 为他的模型设计了一个游戏:猜一个 0-1 矩阵。一项接着一项,它选择 0 或 1。「permanent」值越大,模型的分数越高,因为没有避开 312 矩阵而被扣分。一旦矩阵为 4 x 4 或更大,该模型就会发现击败 Brualdi 和 Cao 猜测的示例。

这项新工作是一个令人兴奋的概念证明,尽管到目前为止它对数学的实际贡献并不大。

「 [模型解决的问题] 都不是超级重要的猜想。」Wagner 说。

在数学研究的许多重要方面,计算机仍然无法与人脑的能力相匹敌。在试图反驳新论文的一个猜想时,Wagner 的模型碰壁了。它的计算能力太少,无法自行找到反例。尽管如此,它还是产生了一系列猜测,使 Wagner 自己很容易找到一个。

Wagner 说:「只要看看它构建的最好的东西,如果你把它带到任何数学家那里,它不一定是图论家,你应该尝试的东西是非常明显的。」

即使对于 Brualdi 和 Cao 的示例,一旦矩阵变得太大,模型也需要一点帮助。

在数学家将他们的领域让给机器之前,如果有的话,还需要很长时间。与此同时,那些想要利用人工智能的人需要睁大眼睛寻找将其纳入研究的机会。Williamson 说,这就是其他新技术(例如电力)最终揭示其潜力的方式,他认为人工智能没有理由与众不同。

「我们没有发现问题,然后说,[我们必须用电来解决这个问题。] 我们更多的是在说,[我们能做哪些简单的小事?] 」

https://www.quantamagazine.org/in-new-math-proofs-artificial-intelligence-plays-to-win-20220307/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

9aed35ca28577ff436f2dea19a07c6af.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482427.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

day44-前端知识之HTML内容

什么是前端?什么是后端? # 任何与用户直接打交道的操作界面都可以称之为前端,前端跟python没有任何关系 比如:电脑界面,手机界面,平板界面# 暂时先理解成 幕后操作者(不直接与用户打交道)为什么要学前端? 因为全栈开发工程师就是同时懂前端和后端 1.信心满满 老子一定能学会…

车路协同让城市更智慧

来源:深城物联在高速发展的现代社会,纷繁复杂的城市道路交织成奔腾不息的交通动脉。今年,全国政协委员、百度董事长兼首席执行官李彦宏在提案中关注“智能交通”“自动驾驶”。在新一代信息技术不断发展的背景下,汽车与城市道路的…

gin-jwt对API进行权限控制

前言 之前文章简单介绍了如何运行ginvue的前后端分离开源项目,该项目是学习了Gin实践教程后结合vue-element-admin写的,该教程讲得很详细,适合入门Gin。本篇文章将介绍ginvue的前后端分离开源项目中如何使用gin-jwt对API进行权限验证。 安装g…

Michael Brostein 最新几何深度学习综述:超越 WL 和原始消息传递的 GNN

来源:前沿科技编译:OGAI编辑:陈彩娴如何突破基于 WL 测试和消息传递机制的 GNN 的性能瓶颈?且看几何深度学习旗手、牛津大学教授 Michael Brostein 如是说。图可以方便地抽象关系和交互的复杂系统。社交网络、高能物理、化学等研究…

day45-前端CSS

1.0 CSS介绍 CSS(Cascading Style Sheet,层叠样式表)定义如何显示HTML元素。 当浏览器读到一个样式表,它就会按照这个样式表来对文档进行格式化(渲染)。 2.0 CSS语法 2.1 CSS实例 每个CSS样式由两个组成部分&#xff1…

人工智能克服了类脑硬件的绊脚石

来源:ScienceAI编辑:萝卜皮当今最成功的人工智能算法——人工神经网络,松散地基于我们大脑中复杂的真实神经网络网络。但与我们高效的大脑不同,在计算机上运行这些算法会消耗巨大的能量:最大的模型在其生命周期中消耗的…

图灵奖起源

来源 : 图灵人工智能在计算机科学的世界里,也有很多带来了全球变革的超级英雄。他们都曾经辉煌一时,但逐渐被公众遗忘。于是我们想做一件事情,用直观的动漫方式,带大家认识计算机宇宙中的那些超级英雄。故事&#xff0…

吵翻了!AI 顶会设置媒体静默期,作者不信邪提前宣传被拒稿,加强盲审是促进公平还是阻止了学术交流?...

来源:AEIC学术交流中心3月2日,计算机视觉三大顶会之一的CVPR2022论文接收结果公布,在经历了漫长的社交媒体静默期后,社交媒体被论文作者刷屏了,部分作者还展示了自己的论文成果。1CVPR2022论文接收结果作为人工智能领域…

巨头们的先进封装技术解读

来源 : 图灵人工智能在上《先进封装最强科普》中,我们对市场上的先进封装需求进行了一些讨论。但其实具体到各个厂商,无论是英特尔(EMIB、Foveros、Foveros Omni、Foveros Direct)、台积电(InFO-OS、InFO-L…

猜测未来微服务架构

微服务架构 微服务的概念在2014年3月由Martin Fowler首次提出。 微服务架构解决的核心问题及其相应的开源组件如下所示: RPC框架 (Service-to-service calls) Spring Boot/Spring MVCDubbogRPCthrift服务注册和发现 (Service registration and discovery) 注册中心 …

联邦学习怎样应用在推荐系统中?

来源:知乎丨羊老头说起联邦学习,大家再熟悉不过了,由于其能在数据不移动的前提下协同训练一个全局共享的模型,迅速成为了人工智能安全领域的一个研究热点。推荐系统作为人工智能领域最振奋人心的应用之一,与联邦学习相…

红帽、Docker、SUSE 在俄罗斯停服

出品:CSDN(ID:CSDNnews)整理:苏宓继 Oracle、Google、苹果等科技公司和 React 开源项目之后,如今 Linux 发行版也牵扯进俄乌之间冲突的漩涡中。其中一个是全球最大的独立开源软件公司 SUSE,一个…

spring boot 配置动态刷新

本文测试使用的spring cloud版本为: Dalston.SR1 很多朋友只知道spring cloud config可以刷新远程git的配置到内存中, 却不知道spring cloud config的客户端可以脱离服务端使用, 更不知道spring cloud config客户端结合actuator还可以刷新本地…

深度学习撞墙了

来源:机器之心早在 2016 年,Hinton 就说过,我们不用再培养放射科医生了。如今几年过去,AI 并没有取代任何一位放射科医生。问题出在哪儿?近年来,AI 在大数据、大模型的深度学习之路上一路狂奔,但…

Transformer 会接管人工智能?

来源:ScienceAI编辑:绿萝想象一下,你去当地的五金店,在货架上看到一种新的锤子。你听说过这把锤子:它比其他锤子敲得更快、更准确,在过去的几年里,它已经淘汰了许多其他锤子,至少在大…

Nat. Commun.速递:合群者有着相似的大脑活动

来源:集智俱乐部作者:郭瑞东 作者:梁金编辑:邓一雪摘要Convergent processing of the world may be a factor that contributes to social connectedness. We use neuroimaging and network analysis to investigate the associat…

桌面推演技术前沿及发展趋势

来源:蓝海长青智库作者:吕欣、蔡梦思、陈彬,国防科技大学系统工程学院摘要桌面推演通过模拟事件场景及处置过程来提高参演人员的风险感知能力、信息研判能力、指挥决策能力和协同配合能力,被广泛应用于军事作战、应急管理和教育培…

清华大学孙茂松:自然语言处理一瞥,知往鉴今瞻未来

来源:中国人工智能学会作者:孙茂松近日,清华大学人工智能研究院常务副院长孙茂松教授亲手执笔,对自然语言处理的贡献、当前境界与未来挑战进行了深入的探讨。AI科技评论编辑组深有同感,认为此文十分值得一读&#xff0…

前端基础之jQuery

jQuery jQuery的思想,实际上很简单,八个字可以概括:选取元素,对其操作。 元素选取的表达式遵循 CSS 以及 XPath 的标准。选取结果可以是一个或多个,后面的操作针对所有被选取的元素。多个连续的操作可以用“链式”实现…

美国自动驾驶监管里程碑:新法规允许自动驾驶汽车取消方向盘

来源:AI前线编译:刘燕NHTSA 表示,这一新规迈出了“历史性”的一步,确保为配备自动驾驶系统的车辆的乘客保持同样高水平的乘员碰撞保护。这可以视为美国自动驾驶监管的一个里程碑。InfoQ 3 月 11 日消息,根据路透社的报…