扛鼎之作!Twitter 图机器学习大牛发表160页论文:以几何学视角统一深度学习

来源:AI科技评论

作者:Michael Bronstein

编译:Mr Bear、青暮

导语:近日,帝国理工学院教授、Twitter 首席科学家 Michael Bronstein 发表了一篇长达160页的论文(或者说书籍),试图从对称性和不变性的视角从几何上统一CNNs、GNNs、LSTMs、Transformers等典型架构,构建深度学习的“爱尔兰根纲领”!本文是Michael Bronstein对论文的精华介绍。

「几何深度学习」试图从对称性和不变性的视角从几何上统一多种机器学习问题。这些原理不仅为卷积神经网络的性能突破和最近大热的图神经网络奠定了基础,也提供了一种原理性的方法来构建针对具体问题的新型归纳偏置。 

相关论文:

https://arxiv.org/pdf/2104.13478.pdf

1872 年 10 月,位于德国巴伐利亚城的埃尔兰根大学任命了一位年轻的教授。按照惯例,这位教授需要提出一项初始研究项目,而他提出的项目名称似乎有些乏味——「近期几何学研究的比较综述」。这位教授就是年仅 23 岁的 Felix Klein,他的这项初始工作就是数学史上鼎鼎大名的「爱尔兰根纲领」。

图注:Felix 和他的爱尔兰根纲领

 19 世纪,几何学蓬勃发展,该领域的学者硕果累累。在欧氏几何提出近两千年后,彭色列首次构建了射影几何,高斯、波尔约、罗巴切夫斯基提出了双曲几何,黎曼提出了椭圆几何,这说明我们可以建立一个由各种几何学组成的完整体系。然而,这些方向迅速分化为各个独立的研究领域。于是,那个时期的许多数学家纷纷思考,不同的几何学分支相互之间有何关系,究竟应该如何「定义」几何?

Klein 突破性地提出将几何定义为对不变性的研究,即研究在某类变换下保持不变的结构(对称性)。Klein 通过群论形式化定义了这种变换,并且使用群及其子群的层次对由它们产生的不同几何进行分类。因此,刚性运动群产生了传统的欧氏几何,而仿射或射影变换分别产生了仿射几何和射影几何。值得一提的是,爱尔兰根纲领仅仅局限于齐次空间,最初并不适用于黎曼几何。

图 2:Klein 的爱尔兰根纲领将几何学定义为研究在某类变换下保持不变的性质。我们通过保持面积、距离、角度、平行结构不变的刚性变换(建模为等距群)定义 2 维欧氏几何。仿射变换将保持平行结构,但并不能保证距离或面积不变。射影变换的不变性最弱,只保持交点和交比不变,对应于以上三种变换中最大的群。因此,Klein 认为射影几何是最为通用的。

爱尔兰根纲领对几何学和数学的影响是极为深远的,其影响也延伸到了其它领域(尤其是物理学),对对称性的思考使我们可以从第一性原理出发导出守恒定律(例如,举世闻名的「诺特定理」)。数十年后,人们通过规范不变性的概念(于 1954 年由杨振宁和米尔斯提出的广义形式)证明这一基本原理成功地统一了除引力之外的所有自然基本力。这就是所谓的标准模型,它描述了我们目前所知道的所有物理知识。

正如诺贝尔奖获得者、物理学家 Philip Anderson 所言:

“it is only slightly overstating the case to say that physics is the study of symmetry.’’

稍显夸张地说,物理学就是对对称性的研究。

我们认为,当下的深度(表征)学习研究领域的情况与 19 世纪的几何学研究是相似的:一方面,深度学习在过去十年间为数据科学领域带来了一场革命,它使许多之前被认为无法实现的任务成为了可能——无论是计算机视觉、语音识别、自然语言翻译或围棋游戏中都是如此。另一方面,我们现在拥有了各种适用于不同数据的神经网络架构,但是却很少发展出统一的原理。因此,我们很难理解不同方法之间的关系,这不可避免地使我们对相同的概念进行重复开发。

图注:现代的深度学习——有各种各样的架构,但是缺乏统一的原理。

与 Klein 的爱尔兰根纲领相类似,Michael Bronstein 等人在论文「Geometric deep learning: going beyond Euclidean data」(https://arxiv.org/abs/1611.08097)中引入了「几何深度学习」的概念,作为近期从几何学的角度将机器学习统一起来的尝试的总称。这样做有两个目的:首先,它提出了一个通用的数学框架,从而推导出当下最成功的神经网络架构;其次,它给出了一种有建设性的过程,以一种有条理的方法构建未来的框架。

在最简单的情况下,有监督机器学习本质上是一个函数估计问题:在训练集(例如,带有标签的狗和猫的图片)上给定某些未知函数的输出,试图从某些假设函数类别中找到一个函数 f,该函数可以很好地拟合训练数据,使模型可以预测出先前未见过的输入对应的输出。在过去的十年间,以 ImageNet 为代表的大型、高质量数据集和不增长的计算资源(GPU)使我们可以设计各种可以被用于此类大型数据集的函数。

神经网路似乎可以很好地表征函数,即使是感知机这种自建单的架构也可以在仅仅使用两层网络的情况下生成各类函数,它可以使我们以理想的准确率近似任意连续函数——该性质被称为「通用近似」(又称万能近似定理)。

图注:多层感知机是一种只包含一个隐层的通用近似器。他们可以表征阶跃函数的组合,从而以任意的精度近似任意的连续函数。

在低维空间中,该问题是近似理论中的一类已经被广泛研究的经典问题,从数学上对估计误差由精确的控制。但是在高维空间中,情况就完全不同了:显然,即使为了近似一类简单的函数(例如,李普希兹连续函数),样本数会随着维度呈指数增长,该现象被称为「维数诅咒」。由于现代机器学习方法需要处理具有数千甚至数百万个维度的数据,维数诅咒往往是存在的,使我们无法通过朴素的方式进行学习。

图注:维数诅咒示意图。对于一个由处于 d 维单位超立方体的象限中的高斯核组成的连续函数(蓝色),如果我们希望以 ε 的误差近似一个李普希兹连续的函数,则需要 ????(1/εᵈ) 的样本(红色点)。

在计算机视觉问题(例如,图像分类)中,这种现象尤为突出。即使是很小的图像也往往具有非常高的维度,但是直观地看,当我们将一张图像解析为一个输入给感知机的向量时,许多图像的结构被破坏并丢弃了。即使我们将图像仅仅平移一个像素,向量化的输入也会有很大的区别。为了使平移后的输入能够被分到同一类中,我们需要向神经网络输入大量的训练样本。

幸运的是,在许多高维机器学习问题中,我们可以使用来自于输入信号的几何学上的额外结构信息。我们将这种结构称为「对称先验」,这种通用的强大原理有助于我们应对维数诅咒问题。在图像分类的例子中,输入图像 x 不仅仅是一个 d 维向量,也是一个在某个域 Ω 上定义的信号,在本例中这个域是一个二维网格。我们通过一个对称群 ????(本例中为一个二维变换组成的群)捕获域的结构信息,该群在域中的点上进行操作。在信号 ????(Ω) 的空间中,底层域上的群操作(群的元素,????∈????)通过群表征 ρ(????) 体现。在本例中,上述操作为简单的平移操作,即一个在 d 维向量上运算的 d×d 矩阵。

图注:几何先验示意图——我们在域(网格 Ω)上定义输入信号(图像 x∈????(Ω)),其中的对称群(变换群 ????)通过群表征ρ(????) 在信号空间中进行平移操作。对函数(例如,图像分类器)如何与群进行交互的假设限制了假设类别。

输入信号底层的域的几何结构为我们试图学习的函数 f 的类别施加了架构信息。对于任意的 ????∈???? 和 x,我们可以找出不会被群的操作所影响的不变性函数,即  f(ρ(????)x)=f(x)。另一方面,有时函数具有相同的输入输出结构,并且输出以与输入相同的方式进行变换,这种函数被称为同变性函数,它满足  f(ρ(????)x)=ρ(????)f(x)。

在计算机视觉领域中,图像分类是一种典型的人们希望得到不变性函数的任务(例如,无论猫位于图像的什么位置,我们都希望将该图分类为猫);而图像分割任务的输出是一个像素级别的标签掩模,这是一种同变性函数(分割掩模需要遵循输入图像的变化)。

「尺度分离」是另一种强大的几何先验。在某些情况下,我们可以通过「同化」附近的点来构建域的多尺度层次结构(如图7 所示的 Ω and Ω’),并且生成一个由粗粒度算子 P 关联的信号空间的层次。在粗尺度上,我们可以应用粗尺度的函数。如果一个函数 f 可以被近似为粗粒度算子 P 和粗尺度函数的组合  f≈f’∘P,则  f 是局部稳定的。尽管 f 可能取决于长距离依赖,如果 f 是局部稳定的,它们可以被分解为局部交互,然后向着粗尺度传播。

图注:尺度分离的示意图,其中我们可以将细尺度函数 f 近似为粗尺度函数 f' 和粗粒度算子 P 的组合 f≈f′∘P

这两个原理为我们提供了一个非常通用的几何深度学习设计范式,可以在大多数用于表示学习的流行深度神经架构中得以体现:一个典型的设计由一系列同变层(例如,CNN 中的卷积层)组成,然后可以通过不变的全局池化层将所有内容聚合到一个输出中。在某些情况下,也可以通过采用局部池化形式的粗化过程(coarsening procedure)来创建域的层次结构。

图注:展示了一种非常通用的设计,可以应用于不同类型的几何结构(例如,网格,具有全局变换群的齐次空间,图(集合也是其中一种特例)和流形,这些结构具有全局等距不变性和局部规范对称性。基于上述原理,我们实现了目前深度学习领域中的一些最流行的架构:由平移对称导出的卷积网络(CNN),由置换不变性导出的图神经网络、DeepSets 和 Transformer,由时间扭曲不变性导出的门控 RNN(例如 LSTM 网络),以及由规范对称性导出的计算机图形和视觉中使用的 Intrinsic Mesh CNN。

这是一种非常通用的设计,可以应用于不同类型的几何结构,例如网格,具有全局变换群的齐次空间,图形(以及特定情况下的集合)和流形,这些结构具有全局等距不变性和局部规范的对称性。这些原理的实现带来了目前深度学习中的一些最流行的架构:由平移对称导出的卷积网络(CNN),由置换不变性导出的图神经网络、DeepSets和Transformers,由时间扭曲不变性导出的门控RNN(例如LSTM网络),以及由规范对称性导出的计算机图形和视觉中使用的Intrinsic Mesh CNN。

图注:几何深度学习的“ 5G”图景:网格,群(具有全局对称性的均匀空间),图(以及作为特定情况的集合)和流形,其中几何先验通过全局等距不变性(可以使用测地线表示) 和局部规范对称性显现。

最后还要重点强调的是,对称性在历史上是众多科学领域中的一个关键概念。在机器学习研究社区中,对称性的重要性早已得到普遍认可,特别是在模式识别和计算机视觉的应用中,关于等变特征检测(Equivariant Feature Detection)的研究最早可以追溯到shun'ichi Amari 和Reiner Lenz 等人的工作。在神经网络的研究历史中,Marvin Minsky 和 Seymour Papert 提出的感知器群不变性定理(The Group Invariance Theorem)对(单层)感知器学习不变性的能力提出了基本限制。这是研究多层架构的主要动机之一,并最终催生了深度学习。

相关链接:

https://towardsdatascience.com/geometric-foundations-of-deep-learning-94cdd45b451d

https://arxiv.org/pdf/2104.13478.pdf

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/484777.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

情感数据对LSTM股票预测模型的影响研究

情感数据对LSTM股票预测模型的影响研究 作者:丁纪翔 发布时间:06/28/2021 摘要:探究了情感结构化特征数据在LSTM股票预测模型中的影响。利用Pandas对所给数据进行预处理(数据载入、清洗与准备、规整、时间序列处理、数据聚合等&am…

AI芯片发展现状及前景分析

来源:专知1. AI芯片定义及技术架构1.1 AI芯片定义广义上所有面向AI应用的芯片都可以称为AI芯片。目前一般认为是针对AI算法做了特殊加速设计的芯片。现阶段,这些人工智能算法一般以深度学习算法为主,也可以包括其他浅层机器学习算法[7-8]。1.…

Tableau数据分析:NC Retail Order Data(英)Data Science Program Lab#1(GTI)

Tableau数据分析:NC Retail Order Data(英) NCSU 2021 Summer Online Data Science Author:©Sylvan Ding

解读:欧盟委员会2021年《人工智能法》提案

来源:图灵人工智能文:吴沈括(北京师范大学网络法治国际中心执行主任、博导中国互联网协会研究中心副主任)文:胡然(北京师范大学网络法治国际中心研究助理)2021年4月21日,为了将欧洲变…

《2021人脸识别行业白皮书》发布 拥挤安防还有多少空间?

来源:帮尼资讯图片来源:网络人脸识别在内的人工智能技术需求较大,这对传统安防产业带来了巨大的冲击和变革。近日,智慧芽联合罗思咨询,共同发布《2021人脸识别行业白皮书》。白皮书从人脸识别行业现状、企业聚焦和技术…

第一章 计算机系统概述 1.1 计算机发展史 [计算机组成原理笔记]

第一章 计算机系统概述 1.1 计算机发展史 本笔记参考书目: 计算机组成原理(第六版.立体化教材)白中英、戴志涛2021王道计算机组成原理视频公开课 本节重点: 计算机硬件的发展史 转载请注明文章来源! 什么是计算机系…

我国工业互联网 技术路线与发展趋势研究

来源:中国工业和信息化本文发表于《中国工业和信息化》杂志2021年4月刊总第33期作者:许雪荷 中国工业互联网研究院自2017年《国务院关于深化“互联网先进制造业”发展工业互联网的指导意见》发布以来,国家高度重视工业互联网创新发展&#…

【创新应用】小图像,大图景:AI彻底改变了显微镜技术

来源:智能研究院20 年前,计算机生物学家 Anne Carpenter 在读博士时第一次意识到她需要学习计算机编程。Carpenter 说:「在麻省理工学院和哈佛大学的博德研究所 (Broad Institute of MIT and Harvard in Cambridge) 管理实验室的时候。她记得…

历史上12篇最著名的博士论文欣赏

来源 : 学位与写作Ali Gajani在mrgreek网站分享了12篇著名学者的博士论文,分别是居里夫人的博士论文、香浓的博士论文、纳什的博士论文、德布罗意的博士论文、费曼的博士论文、爱因斯坦的博士论文、马克思的博士论文、韦伯的博士论文、萨特兰的博士论文、…

Exalogic硬件架构

1、硬件配置见如下图表。 组件名称满配半配1/4配1/8配Sun Rack II 12421111计算节点 X2-2、X3-2、X4-2、X5-2、X6-2301684存储设备 X2-2和X3-2: Dual controller Sun ZFS Storage 7320 appliance (60 TB) X4-2和X5-2: Oracle ZS3-ES storage appliance X6-2: Oracle ZS5–ES st…

AI领域五年引用量最高的10大论文:Adam登顶,AlphaGo、Transfromer上榜

来源:图灵人工智能编译:琰琰近五年来,AI学术论文的投稿量和接收量都在不断攀升,包括NeurIPS、AAAI、ACL,ICML、EMNLP等国际顶会。根据权威数据统计,NeurIPS论文收录量在2019年呈指数级增长,领先…

64 求1+2+3+...+n(发散思维能力 )

题目描述: 求123...n,要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句(A?B:C)。 解题思路: 1)利用&&的短路特性 2) 利用sizeof特性,使用公式n(n1)/2 …

Cell Reports:黄梓芮等揭示大脑皮层中通往意识的“大门”

来源:小柯生命北京时间2021年5月4日晚23时,Cell Reports在线发表美国密歇根大学一项关于前脑岛在大脑网络切换和意识通达中关键门控作用的研究——“Anterior insula regulates brain network transitions that gate conscious access”。此研究由密歇根…

DeepMind强化学习新研究:更快的知识学习,更强的环境适应

来源:AI科技评论编译:Mr Bear校对:维克多DeepMind官方博客在一篇文章“Fast reinforcement learning through the composition of behaviours”中,针对强化学习中的“从头学习”问题给予了解决方案。文章中表示,人类处…

为什么AI无法解决一般智能问题?

来源:学术头条我们什么时候才能拥有在各方面能够模仿人脑的人工智能?专家们对这个问题意见不一。但大家都同意的是,目前的人工智能系统与人类的智力相去甚远。直接表现是:AI只在特定任务中表现优异,无法将其能力扩展到…

ADT操作实例

ps.1.put(rank,value) 把当前rank的元素的数值修改 2.get(rank)获取rank的元素 3.remove(value)把向量中value剔除掉 4.size()返回元素个数 5.disordered()检测向量的有序性,是否存在紧邻的逆序对,只要返回的数值不是0,说明它尚未构成有序的序…

群雄逐鹿,谁会赢得自动驾驶之战?

来源:AI前线作者 | Timothy B.Lee译者 | 王强策划 | 刘燕自动驾驶技术行业今天正处于一种奇怪的状态。过去多年来,整个行业已经在自动驾驶技术上投入了庞大的资金,其中许多公司都拥有了看起来跑得不错的自动驾驶汽车原型。但据我所知&#xf…

ActiveMQ反序列化漏洞(CVE-2015-5254)复现

0x00 漏洞前言 Apache ActiveMQ是美国阿帕奇(Apache)软件基金会所研发的一套开源的消息中间件,它支持Java消息服务,集群,Spring Framework等。Apache ActiveMQ 5.13.0之前5.x版本中存在安全漏洞,该漏洞源于…

阿里最新研究试用因果推理方法让视觉AI更智能,入选CVPR 2021

来源:AI前线学过人类照片和鱼类照片的 AI,第一次见到美人鱼的照片会作何反应?人脸和鱼身它都很熟悉,但它无法想象一个从没见过的事物。近期,阿里巴巴达摩院将因果推理方法引入计算机视觉领域,尝试克服机器学习方法的缺…