最近,人工智能推进了数学研究的进程,揭示了矩阵乘法的新可能性

941728e0c2f3647f34122fac1dc021b8.gif

来源:今日头条(逻辑黑洞)

当试图找到最有效的方法时,甚至像矩阵乘法这样抽象的事情也会像游戏一样。这有点像用尽可能少的步骤来解魔方。对于矩阵乘法,即使在相对简单的情况下,每一步都可以有超过10^12个选项。

在过去的50年里,研究人员用了很多方法来解决矩阵乘法问题,所有的方法都是基于计算机搜索和人类直觉的辅助。上个月,人工智能公司DeepMind的一个团队展示了如何从一个新的方向解决这个问题,他们在《自然》杂志的一篇论文中报告说,他们已经成功地训练了一个神经网络,以发现矩阵乘法的新的快速算法。这就好像人工智能找到了一个策略来解决一个极其复杂的魔方。

似乎是为了证明这一点,在《自然》杂志的论文发表三天后,两位奥地利研究人员说明了新方法和旧方法是如何相互补充的。他们使用传统的计算机辅助搜索来进一步改进神经网络发现的一种算法。

结果表明,就像解决魔方的过程一样,通向更好算法的道路将充满曲折。

矩阵乘法

矩阵乘法是所有数学中最基本和最普遍的运算之一。要乘一对n × n矩阵,需要将这些元素以特定的组合相乘并相加,以生成第三个n × n矩阵。两个n × n矩阵相乘的标准方法需要进行n^3次乘法运算。

c2bfc39b953f1ea0447795f998101da8.png

对于具有数千行和列的较大矩阵,这个过程会非常繁琐。但在1969年,数学家沃尔克·斯特拉森发现了一种方法,可以用7步而不是8步的乘法步骤将一对2 × 2矩阵相乘,代价是引入更多的加法步骤。

736eb197218fd315ad728ca9cf6fd6e3.png

斯特拉森的算法对于一对2乘2的矩阵显得很繁琐。但它适用于更大的矩阵。这是因为矩阵的元素本身可以是矩阵。例如,一个具有20,000行和20,000列的矩阵可以被重新解构成一个2 × 2矩阵,其中四个元素都是10,000 × 10,000的矩阵。每个矩阵又可以再细分为4个5000 × 5000的矩阵,以此类推。斯特拉森可以应用他的方法在这个嵌套层次结构的每一层乘2 × 2矩阵。随着矩阵大小的增加,通过更少的乘法节省的成本也在增加。

斯特拉森的发现促使人们寻找矩阵乘法的有效算法,并由此激发了两个不同的子领域。其中一个关注的是一个原理问题:如果你想象两个n × n矩阵相乘,让n趋于无穷,在最快的可能算法中,乘法步骤的数量如何随n增长?目前的最佳缩减记录是n^2.3728596。

第二个子领域的矩阵规模较小。在斯特拉森的工作完成后不久,研究人员指出斯特拉森已经达到了一个理论极限:2 × 2矩阵的乘法运算步骤不可能少于7步。但对于所有其他矩阵大小,所需乘法的最小次数仍然是一个悬而未决的问题。针对小矩阵的快速算法可能会产生巨大的影响,因为当合理大小的矩阵相乘时,这种算法的重复迭代可能会击败斯特拉森的算法。

不幸的是,即使对于3 × 3矩阵,可能的算法数量也超过了宇宙中原子的数量。

面对如此庞大的选项,研究人员已经取得了进展,将矩阵乘法转化为一个看起来完全不同的数学问题——一个更容易由计算机处理的问题。可以将两个矩阵相乘的抽象任务表示为一种特定的数学对象:一种称为张量的三维数字数组。然后,研究人员可以将这个张量分解为基本分量的和,称为“秩1”张量;每一个都代表对应矩阵乘法算法的不同步骤。这意味着找到一个有效的乘法算法相当于在一个张量分解中最小化项的数量,项越少,所涉及的步骤越少。

通过这种方式,研究人员发现了新的算法,对于许多小的矩阵,用比标准的n^3乘法步骤更少的时间乘n × n矩阵。但是,那些不仅优于标准算法,而且优于斯特拉森的小矩阵算法的算法仍然是遥不可及的。

算法介绍

06e21a52551b45f04f3a00bbdadb4595.jpeg

DeepMind团队通过将张量分解转化为单人游戏来解决这个问题。他们从AlphaGo衍生出的深度学习算法开始,AlphaGo在2016年学会了围棋,足以击败顶尖的人类棋手。

所有的深度学习算法都是围绕着神经网络建立的:人工神经元的网络被分成几层,连接的强度可以变化,代表每一层神经元对下一层神经元的影响程度。这些连接的强度是在训练过程的多次迭代中调整的,在此过程中,神经网络学会将接收到的每个输入转换为帮助算法实现总体目标的输出。

在DeepMind的名为AlphaTensor的新算法中,输入代表通向有效矩阵乘法方案的步骤。神经网络的第一个输入是原始矩阵乘法张量,它的输出是AlphaTensor选择的第一次移动的第1个张量。该算法从初始输入中减去这个秩1张量,生成一个更新的张量,该张量作为新的输入反馈到网络中。这个过程不断重复,直到最终起始张量中的每一个元素都被降为零,这意味着不再有排在第1位的张量要去掉。

在这一点上,神经网络已经发现了一个有效的张量分解,因为它在数学上保证了所有秩1张量的和完全等于起始张量。得到它的步骤可以转换回对应矩阵乘法算法的步骤。

游戏是这样的:AlphaTensor反复地将一个张量分解为一组秩1分量。每次,如果AlphaTensor找到减少步数的方法,它就会获得奖励。但通往胜利的捷径根本不是凭直觉就能找到的。

该团队现在有了一个算法,理论上可以解决他们的问题。他们只需要先训练一下。

新路径

像所有的神经网络一样,AlphaTensor需要大量的数据进行训练,但张量分解是一个众所周知的难题。很少有研究人员可以为网络提供有效分解的例子。相反,他们通过训练算法解决更简单的逆问题来帮助算法开始:将一堆随机生成的秩1张量相加。

布朗大学的计算机科学家迈克尔·利特曼说:

他们正在利用简单的问题为困难的问题生成更多的数据。将这种向后训练过程与强化学习相结合,AlphaTensor在寻找有效分解时产生自己的训练数据,比单独的任何一种训练方法都要有效得多。

DeepMind团队训练AlphaTensor分解代表12 × 12矩阵乘法的张量。它寻找普通实数矩阵相乘的快速算法,也寻找特定于更有约束的算法,称为模2算法。

这是基于两个数字的数学,所以矩阵元素只能是0或1,并且1 + 1 = 0。

研究人员通常从这个更有限但仍然广阔的空间开始,希望这里发现的算法可以适用于实数矩阵。

经过训练,AlphaTensor在几分钟内重新发现了斯特拉森的算法。然后,它针对每种矩阵大小发现了多达数千种新的快速算法。这些算法与标准算法不同,但乘法步骤数相同。

在一些案例中,AlphaTensor甚至打破了现有的记录。它最令人惊讶的发现发生在模2算法中,它发现了一种用47个乘法步骤将4 × 4矩阵相乘的新算法,这比斯特拉森算法两次迭代所需的49个乘法步骤有所改进。它还击败了最著名的5 × 5模2矩阵算法,将所需的乘法次数从以前的98次减少到96次。

但这个新记录仍然落后于91步,而要击败使用5 × 5矩阵的斯特拉森算法需要91步。

这一引人注目的新结果引起了很多注意,一些研究人员对这种基于人工智能的对现状的改进大加赞赏。但并不是所有矩阵乘法领域的人都对此表示肯定。研究人员还强调,破纪录的4 × 4算法的即时应用将受到限制:它不仅只在模2算法中有效,而且在现实生活中,除了速度之外,还有其他重要的考虑因素。

最后的转折

e25e87bb5a8d8a0a7a23a669f72e7b21.jpeg

相对于成熟的计算机搜索方法,AlphaTensor最大的优势也是它最大的弱点:它不受人类对好的算法的直觉的约束,所以它无法解释自己的选择。这使得研究人员很难从它的成就中学习。

但这缺点没有看上去那么大。AlphaTensor结果公布几天后,奥地利约翰内斯·开普勒大学的数学家曼纽尔·考尔斯和他的研究生报告了又一进展。

当DeepMind的论文发表时,考尔斯正在使用传统的计算机辅助搜索新的乘法算法。他们的方法是通过反复调整现有的算法,希望从中节省更多的步骤。以AlphaTensor的5 × 5模2矩阵算法为起点,他们惊奇地发现,他们的方法在短短几秒钟的计算之后,就将乘法步骤从96步减少到了95步。

AlphaTensor还间接帮助他们进行了另一项改进。在此之前,考尔斯并没有费心去探索4 × 4矩阵的空间,他们认为不可能击败斯特拉森算法的两次迭代。AlphaTensor的结果促使他们重新考虑,在从头开始计算一周后,他们的方法出现了另一个47步算法,与AlphaTensor发现的算法无关。

考尔斯认为这是机器学习在发现新算法方面应用的真正试金石。他指出,寻找快速矩阵乘法算法是一个组合问题,计算机搜索,无论是否有人工辅助,都非常适合。但并不是所有的数学问题都那么容易确定。如果机器学习能够发现一个全新的算法思想,这将是一个游戏规则的改变者。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

49802ba1b5c0c44f29e4f000f918969d.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481381.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

钱学森:论技术科学

来源:远望智库预见未来论技术科学钱学森本文原刊载于1957年《科学通报》第3期一、科学的历史发展与技术科学概念的形成在人们从事生产的过程中,他们必然地累积了许多对自然界事物的经验。这些经验可以直接应用到生产上去,也可以先通过分析、整…

从量子到星空:混沌世界的隐藏秩序

导语1963年,洛伦兹用蝴蝶效应形象地展现出了混沌的魅力:亚马逊热带雨林中的一只蝴蝶偶尔扇动几下翅膀,可以在两周以后引起美国得克萨斯州的一场龙卷风。正所谓“失之毫厘,谬以千里”,混沌理论告诉我们,即使…

OpenFold更多细节公开:重新训练AlphaFold2对其学习机制和泛化能力产生新见解

编辑 | 萝卜皮AlphaFold2 彻底改变了结构生物学,能够以极高的准确性预测蛋白质结构。然而,它的实现缺乏训练新模型所需的代码和数据。这些对于解决新任务是必要的,例如蛋白质-配体复杂结构预测;可用于调查模型学习的过程&#xff…

李德毅院士:迭代的智能——从薛定谔、图灵和维纳谈开去

来源:图灵人工智能报告人:李德毅院士主持人:戴琼海院士报告时间:2022年11月24日(周四)19:30-21:00主办单位:北京信息科学与技术国家研究中心未来智能实验室的主要工作包括:建立AI智能…

未来产业最新动向及趋势展望

来源:赛迪智库、《赛迪前瞻》2022年第52期作者:彭健,无线电管理研究所副所长;滕学强 未来产业是代表未来科技和产业发展新方向且具有前瞻性和先导性的产业,市场潜力大、带动作用强,前瞻谋划未来产业已是大势…

AI都会和人类谈判了?Meta AI最新研究登上Science,LeCun称里程碑式成果

来源:明敏 羿阁 发自 凹非寺量子位 | 公众号 QbitAIAI都学会和人类谈判了?还能成功说服人类听它安排?话术一流到人类完全分辨不出它是AI。这就是Meta AI的最新成果——AI模型CICERO(西塞罗),现已登上Scienc…

我在 MIT 人工智能研究实验室工作一年学到的

来源:AI科技评论Mike Ferguson ,麻省理工学院大脑和认知科学系 (MIT BCS) 担任研究软件工程师/ML工程师。专门研究 Brain-Score(一种衡量类脑 AI 的工具)。他于 2021 年春季毕业于弗吉尼亚大学,获得计算机科学和应用数…

《科学》重磅:首次实现监测多种神经元间实时毫秒级互动!

*仅供医学专业人士阅读参考大脑的复杂之处在于众多神经元之间的协同作用,若能在同一时间显示不同神经元群体的电活动,那么将大大加深我们对于大脑功能的理解。基因编码的电压指示蛋白(GEVI)是一类在细胞膜电位变化后产生可检测信号…

冯·诺依曼的遗产:寻找人工生命的理论根源

来源:集智俱乐部 作者:东方和尚现在的人工智能研究如火如荼。然而,尽管AlphaGo Zero早已经秒杀人类智慧,但它却是冷冰冰、无生命的机器,因为它缺少一颗热血沸腾的“心”。当我们看到小虫子沿着崎岖的路面爬向食物&…

AI好奇心,不只害死猫!MIT强化学习新算法,智能体这回「难易通吃」

来源:新智元编辑:David【新智元导读】MIT强化学习新算法,根据监督稀疏程度自动调整AI智能体「好奇心」,高低难度任务通吃。人人都遇见过一个古老的难题。周五晚上,你正试图挑选一家餐厅吃饭,但没有预定。你…

2022,青年科学家最关注的基础研究是什么?

来源:科学网编辑:方圆排版:李言文:韩扬眉科学问题,起初由科学家提出,最终被科学家突破,才是一个完美的探索闭环。11月27日,“十大基础研究关键词”在2022年“青年科学家502论坛”上公…

地球能够调控自己的温度,但是……

来源:公众号“原理”地球的历史并非一帆风顺,比如,地球气候曾经历过一些巨大的变化,从全球火山活动,到全球降温的冰期,还有太阳辐射的明显波动。然而,在过去37亿年里,生命的故事却未…

连发Cell,Nature顶级期刊,揭示脊髓和脑干在触摸中令人惊讶的新作用

来源:生物通触觉对我们做的几乎所有事情都至关重要,从家里的日常工作到在可能隐藏危险的陌生地形上导航。触觉对我们做的几乎所有事情都至关重要,从家里的日常工作到在可能隐藏危险的陌生地形上导航。长期以来,科学家们一直想弄清…

2022年度“十大基础研究关键词”在深发布

来源:读特客户端11月27日,“青年科学家50论坛”发布2022年度“十大基础研究关键词”。这些关键词由“科学探索奖”的获奖人提名、投票并经科委会确认。十个关键词,体现出以获奖人为代表的中国杰出青年科学家群体,对未来科技发展的…

“信创”的热火烧到了物联网

资料来源:综合整理自互联网整理发布:物联网智库 导读产业淘沙,市场铄金,蛰伏已久的风口终究要来了。如果说今年有什么板块在下半年异军突起,信创一定榜上有名。在大热赛道表现平平的十月份,信创板块指数累计…

神经网络与图灵机的复杂度博弈

来源:集智俱乐部 作者:东方和尚1931年,天才数学家图灵提出了著名的图灵机模型,它奠定了人工智能的数学基础。1943年,麦克洛克 & 皮茨(McCulloch & Pitts)两人提出了著名的人工神经元模型…

自主可控时代,物联网呼唤怎样的操作系统?

来源:物联网智库作者:Levin导读物联网产业的竞争正在向着生态系统发展,包括互联网巨头和运营商在内的企业都在基于平台,积极布局上游关键技术和下游解决方案。根据工信部发布的数据显示,截至今年8月末,三家…

在不确定的时代,用理性的思考去对抗群体的疯狂

来源:混沌巡洋舰本文整理摘编自《群体的疯狂》 威廉伯恩斯坦著 王兴华译 中信出版集团 2022.11近两个世纪之前,一位年轻的名叫查尔斯•麦基的苏格兰人,以令人难忘的方式同时攻击上帝和玛门。他出生于1814年,是一名颇受欢迎的诗人、…

深度学习的下一个十年,延展基础科学研究变革的「角力场」

来源:AI科技评论在更大的科学命题中,有人找到了更激动人心的原动力。图灵奖获得者、前微软技术研究员 Jim Gray 通过四种范式描述了科学发现的历史演变。从基于经验主义——即对自然现象的直接观察之“第一范式”,到以数据密集型科学发现&…

AI 硬件加速的重大飞跃!可训练机器学习硬件的光学芯片

编辑 | 绿萝根据麦肯锡(McKinsey)最近的一份报告,机器学习应用每年飙升至 1650 亿美元。但在机器能够执行诸如识别图像细节等智能任务之前,必须先对其进行训练。训练现代人工智能 (AI) 系统(如特斯拉的自动驾驶仪&…