符号主义对深度学习的意义浅谈

来源:混沌巡洋舰

符号主义人工智能经历过古典时期的专家系统阶段, 中期的知识图谱阶段, 和近期深度学习和符号主义的再次联姻。那么一个很重要的问题是符号主义为什么会复兴,它对当下的机器学习又有何意义?

参考阅读:

Reconciling deep learning with symbolic artificial intelligence: representing objects and relationswww.sciencedirect.com

首先, 当下的深度学习有三个最主要的问题,很低的数据使用效率, 泛化能力, 可解释性,都可以从符号主义得到极大帮助。这一点也不难理解, 所谓符号,多数指我们语言中那些经常被使用的抽象概念,这些概念再不同的任务和环境中被广泛使用组成新的概念,比如红色,圆形等,如果能够在不同任务中学习到这些最基本的元素, 那么无疑将极大的改善数据使用效率和泛化能力。

同时, 从视频,声音等信息中提取出的这种符号,几乎一定是和我们的自然语言有所对应,和我们的认知概念有所对应,因此,提取这些符号将极大助力模型的可解释性。从这两个角度看, 符号的确可以解决深度学习的几个根本问题。

更加重要的是,符号的使用和我们的推理认知能力极为相关,这也是为什么在第一代的人工智能时代人们如此重视符号, 因为它是逻辑思维的载体,有了符号我们可以在符号基础上罗列各种运算,进行关系预测和推理等, 对应我们日常思维中的归纳演绎等过程。

从某种意义上看,基于符号的人工智能模拟了人类的思维, 而深度学习则模拟了人类思维的硬件。这两种一定应该是相通的。然而今天看来它们却成为了独立的两个方法, 这是为什么呢?

深度学习的本质是表征学习。站在信息论的角度,它把一定的视觉听觉信息表示成高维向量,在经过若干次线性和非线性的变化抽调和任务信息无关的细节,压缩成为和任务最相关的信息表征。那么我们不禁要问这些留下的信息表征是否就是我们要的符号呢? 

答案是no。即使经过巨大的CNN我们得到猫或狗的表征,但是从没有一个研究指出这些表征里哪些神经元包含猫的形状,哪些神经元包含猫的颜色,事实上每个细胞都或多或少的表达颜色或形状,也就是一种混合的信息表达, 从神经编码的角度看这叫分布表征(distributed representation), 或混合编码(mix selectivity),从信息表征的角度看这是Entangled representation,或者说耦合的表征。

这种特性是使得每个神经元可以高效的被利用(表征不同的特征),从而用有限的细胞数去区分更多的模式;但是也使得深度网络变得不可解释, 泛化性差, 鲁棒性差。而人的神经网络经过进化和连续学习,既有深度学习这种混合编码特性,又有低维解耦的符号,这点是目前深度学习望尘莫及的。

那么有什么方法可以从深度学习里得到符合人类认知的符号系统呢?一种方法比较直接, 可以直接把深度学习的output设计成人类已知的符号比如视觉系统里的符号,颜色等,

我觉得这里有两个关键点,一个是低维,一个是解耦。所谓低维, 是说这个符号不可以太多, 所谓解耦, 是说它们要尽量独立的。低维因为可以大量复用的符号本来就没多少, 解耦因为这些符号如果是可解释的且重要的,就一定要构成一个不依赖其它符号存在的独立因子。

那么在深度学习里加入符号主义的精髓?我理解的符号主义的核心, 一是哪些是构成这个世界的正确符号, 二是该如何确定符号与符号间的关联,三是如何通过符号组合成不同的模型或场景表示。

深度学习的power在于可以通过学习的方法解决以前计算不能得到的目标, 比如这里的第一步,符号的提取。这就必须要提自编码器。自编码器宛如一个信息瓶颈,通过若干层非线性变化,把高维的时空向量压缩成几个低维变量z(latent variable), 然后再通过一个类似解码器的部分还原回原先的高维时间和空间序列, 通过这个无监督的学习过程,实现信息的压缩(z代表真实信息的编码)。普通的自编码器能够实现这个高维到低维的转化但不一定能够解耦。

而变分自编码器(VAE)就不同了, 它假定中间压缩得到的z变量要符合一个多元高斯的先验分布, 这样的分布本质就假定了z变量不同维度间的独立性,也就是不同因子的解耦,加上z的维度本身就要求低, 它极有可能就是我们所要的符号(进化生成的符号就是在信息论的角度就是最小冗余的编码)。那么z是否可以真正学到抽象独立的符号呢?这点从文章下图的实验中可以略知一二。 

在这个图中,我们尽可能的保持其它变量不变,而只改变变分自编码器中的某个独立维度, 这时我们发现当改变变分自编码器学到的表示里的某个维度数字大小发生变化,另一个维度则是手写数字的风格发生变化,显然数字大小和手写数字风格是极好理解的人类符号, 也就是非常具有鲁棒性的迁移特征,这样两个维度z某种程度构成书写数字的一个解耦的低维的独立因子图, 也就是这个任务的符号表示系统(联系因果学习)。

另一个基于无监督学习得到这种低维解耦表示的方法被称为稀疏编码, 这个理论旨在直接从数据里学习到一个字典,字典里的常用词可以最好的构建真实世界且字典最节约, 事实上稀疏编码的理论就是我们大脑处理信息的重要理论基石。

还有一类值得关注的从深度学习里得到可解释的低维符号的方法来自RNN(LSTM),这类含时间的神经网络可以从数据里学习一个原系统的动力学模型,而动力学系统内的主要变量可能就是我们需要的符号。我之前的论文用预训练的RNN进行导航,就是引导出这种低维的动力系统表示。

符号模仿的第二部涉及符号关系的建模:我们需要找到符号和符号之间的联系, 从而进一步释放符号主义的真正能力,进行关系建模和推理。实现这一步的方法也可以使用简单暴力的深度学习,这里有两类框架已经极大的接近了这一目的,一个是图关系网络, 一个是基于自注意力的transformer。

我们来看两个风格的区别和联系:

对于关系网络, 本质上我们采用的手段是学习不同符号两两相互作用的表征, 这个工作可以暴力的使用MLP来完成, 首先我们把不同符号间的关系表示成为两两一对的矩阵(全连接图), 然后我们假定存在一个巨大的MLP,只要输入两个符号的特征,就可以得到其相互关系的表征,输出相互连接。这样的系统本质假定了关系的类型是

这种假定特别适用于那些本来相互作用的形式就近似这种两两相互作用的全连接图的系统, 比如物理方程式, 两两相互作用力的表达式正是这样的形式。另一类关系表达方法更加类似于自注意力网络,事实上这类网络就是各类transformer, bert, gpt等的始祖。它得到的一个形式是:

注意这里的q, k, g之间的关系是矩阵乘法,通过query q 和 key k 的乘机我们会得到一个两两相互关系的关联矩阵。犹如“注意力" 的字面含义, 它的本质代表的是已知内容x, 那么我们需要关注哪些和x相关的内容, 或者可以理解为通过x在整个数据提取需要的信息 ,如果提取,是由q,k的形式得到的,这里假定了这种关系可以表示成矩阵乘法。

我们注意到本质上它和图关系网络是相通的,也是为什么transformer学到的其实是一个巨大的以单词为节点,以单词间的关系为边的图网络,它对一段文字的理解,也就是把文字转化为了一个单词连接图。

从这点上看, 图关系网络和transformer都在描述同一个符号关系范式 , 那就是相互作用。通过这个范式,单一符号组合成相互作用网络,从单元的特性到网络的整体属性(对应复杂系统涌现的概念)就是一个推理的过程。比如对文章进行分类, 或者对物理系统的能量或动量进行计算,对物理系统的未来进行预测等。

最后看第三点可组合性, 正是因为符号可以通过不同的关系建模组成不同的整体, 它才具有它巨大的power, 也就是用少量的符号组成无限的世界, 高维的世界。这样的组合关系可以是形式逻辑比如and, or, 也可以是计算机经典的树结构, 也可以是刚刚说的两两相互作用网络。符号间的组合关系本身事实上也是可以学习的, 比如当下一些计算机视觉的工作会强制深度网络学习这样一个可组合的表示, 然后通过图像引擎渲染, 得到一个真实的图像。这样我们就不仅具有图像识别的能力,而是真正可以随心所欲的操控图像生成,比如把一张图像里的狗变成灰狼。

几个值得关注的和符号相关的方向:

1, 因果推理

Judea Pearl 的三级因果推理框架强调了因果问题需要解决关联, 干预和反事实推理三个层次的问题, 而在三级因果框架的中心,是著名的结构因果模型。这个模型的载体正是一个符号连接的图,不同的因子对应不同的符号, 这无疑说明符号的提取就是因果推理的基础。反过来, 因果论也给符号的提取提供理论依据, 因为符号本身对独立性的要求, 就暗示了它与独立因果假设的联系。

2, 脑科学和认知框架

认知框架试图模仿人脑处理信息和完成多任务的原理绘制一个机器处理相应任务的蓝图,并用计算机实现, 自上世纪八十年代以来, 不同的派别试图改进和实现这个蓝图, 把它从计算机变得更像脑。认知框架本身包含感知, 行为, 记忆, 推理, 元认知等不同模块。

事实上这类大脑模拟的核心就是一个从符号的提取,到推理, 到计划和行为的总体框架。感知对应符号的提取, 推理对应符号间关系的求解, 计划和行为则对用利用这种符号关系图(世界模型)进行规划的能力。

如此看, 我们对大脑和认知科学的理解可以直接放到这个符号推理的系统里辅助我们设计实现这个系统 。或者, 符号推理引擎可以看成理解我们大脑工作模式的基础。

复杂系统

符号的提取如果是大脑涌现的过程,那么如何从复杂系统的角度看符号是怎么产生的?符号之间的关系又无疑构成一个复杂网络,那么如何从复杂网络的结构理论来看待符号关系建模?

一些经典的符号推理框架实现:

A. 有关符号本身的提取:

1, beta -VAE: LEARNING BASIC VISUAL CONCEPTS WITH A

CONSTRAINED VARIATIONAL FRAMEWORK

Higgins, Irina, et al. "beta-vae: Learning basic visual concepts with a constrained variational framework." (2016).

这篇文章利用一个改进的VAE框架, 从图像里提取出一个解耦的独立因子表示。就是上文中VAE与符号提取内在关系的基础。

2, Neural-Scene-Representation-and-Rendering

Eslami, SM Ali, et al. "Neural scene representation and rendering."Science360.6394 (2018): 1204-1210.

这篇文章旨在建设一个能够自发理解周围视觉场景的机器学习模型, 虽然模型全部使用深度学习框架, 但是得到的表征确实高度符号化的,不仅可以被拆分成可理解的因子,还可以通过代数运算简单的得到新的场景组合。这样神奇的效果事实上仅仅靠一个以卷积网络为主的encoder结构和卷积lstm结构为主的decoder结合的一个自编码器结构就可以实现。3, Learning to See Physics via Visual De-animation – NIPS

Wu, Jiajun, et al. "Learning to see physics via visual de-animation."Advances in Neural Information Processing Systems. 2017.

这个工作是根据图从物理运动的视频里得到物体和相应的物理状态,然后通过传统物理引擎预测物理系统的变化。而用到的方法依然是短平快的深度学习框架, 先图像切割得到object proposal, 再再不同物体的proposal基础上不同物体的物理参数,比如质量,摩擦力, 位置,速度一类。

Learning to See Physics via Visual De-animation – NIPS

4. The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences From Natural Supervision – ICLR

Mao, Jiayuan, et al. "The neuro-symbolic concept learner: Interpreting scenes, words, and sentences from natural supervision."arXiv preprint arXiv:1904.12584(2019).

视觉处理和符号融合的一个里程碑式的框架, NS-CL模型可以把图像场景转化成可以执行的符号化编码, 最后在这个符号表征基础上回答问题。

比如我们知道CNN代表的视觉网络是个黑箱, 那么如何让这个黑箱变得可解释?我们可以让CNN网络直接把图像变成一系列可解释的符号 。你可能觉得这不就是region proposal或图像切割? 

实际不是的, 因为我们想要得到的符号可以代表一个世界的最小语言体系, 检验它的最好标准是得到的符号能否让我们复原图像。这有点像一个自编码器的概念, 但是比自编码器要更容易解释。

为了做到这点,我们可以把解码器替换成一个传统的图像生成引擎, 它本身就是基于人工设定的符号, 只有我的CNN能够输出这样的人工设定的符号, 传统解码器才能work。这样的模型可以得到完全可解释的视觉系统, 在各种需要说明如何work的视觉系统里, 无疑会发挥大用。具体pipeline如下图。以下一个例子具体说明框架的运作流程:首先将问题转化为可以执行的程序,这里其实是抓住关键词shape of(对应一个符号提取算子) 然后感知模块提取图像里的物体,再通过符号提取算子(shape of)得到对应的向量, 这个向量对应具体某个物体的形状,然后这个向量和知识库(visual semantic space) 里的不同形状向量相比较,最终得到相似度最高的那个形状。此处不难看到这个semantic space和人类长期记忆的关系。

B 符号间关系的提取:

上面的文章介绍了关于用深度学习用于符号提取, 并直接使用这些符号做任务的典型例子,下面介绍包含了它的下一步, 除了提取符号还需要推理符号间的关系的作品:

1, Neural Relational Inference for Interacting Systems

Kipf, Thomas, et al. "Neural relational inference for interacting systems."arXiv preprint arXiv:1802.04687(2018).

通过图网络进行关系推理的框架, 可以用图网络来求解各类相互作用的符号间的关系并进行推理和预测。该工作的核心是把自编码器和图网络融合,从而可以用无监督学习的方法求解不同符号间的关系。

2, CLEVRER: COLLISION EVENTS FOR VIDEO REPRESENTATION AND REASONING

这篇文章同时包含了符号的提取和关系的建模, 它试图利用一个统一的模型来回答一系列不同级别的问题。当然既然是求全,模型的任务就比较简单, 它利用一个可以生成一系列碰撞视频的模拟器,然后从通过不同的filter从这些模拟器里提取物体和它们相关的符号组成(形状,大小, 颜色), 再在这些表示的基础上利用第一篇文章中的关系网络学习这些不同物体之间的关系, 从而做出预测。如此, 这个模型不仅可以回答简单的描述性问题(what),还可以回答解释,预测,反事实的问题。

Yi, Kexin, et al. "Clevrer: Collision events for video representation and reasoning."arXiv preprint arXiv:1910.01442(2019).3, Measuring abstract reasoning in neural networks

Barrett, David GT, et al. "Measuring abstract reasoning in neural networks."arXiv preprint arXiv:1807.04225(2018).

这篇文章试图用关系网络RN来解决一般性的推理问题, 有趣的是文章使用了一组人类智商测试用的任务, 并改成了可以任意生成的任务。在这个任务里, 机器可以随机的生成一个序列的图片, 图片里的元素的数量,形状,颜色可以改变,然后机器需要推到出1图和2图是如何得到三图的,也就是一组抽象的图和图之间的relation, 使用RN对图片间关系建模的模型远好于传统深度学习CNN, LSTM等。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487262.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

400多家单位、30余万科研人员,10多年奋斗!北斗卫星核心器件实现100%国产!(附:北斗研发建设历程​)...

来源:EETOP国务院新闻办公室8月3日上午10时举行新闻发布会,中国卫星导航系统管理办公室主任、北斗卫星导航系统新闻发言人冉承其介绍,工程建设提前半年完成,彰显中国速度。“北斗三号2009年11月启动建设。10余年来,工程…

深度学习败于“捷径”

来源:AI科技评论深度学习的未来在哪里?这一话题已经有过了无数讨论,大部分讨论都承认当前的深度学习还不是真正的智能,必须转向理解、常识。但是只看当前AI成功的案例,似乎还无法窥探理解。近日,来自多伦多…

互联网是由多个计算机相互连接而成,计算机网络

第一章:三类网络:电信网络有线电视网络计算机网络互联网基本特点:连通性共享计算机网络的组成:若干结点和连接这些结点的链路组成结点分类:计算机集线器交换机或路由器等互联网internet:泛指由多个计算机网…

ftp服务器PDF文件在线查看

曾做过电厂的项目,有一些功能需要和甲方的厂家对接,其中就有需要实现甲方ftp服务器上的PDF、JPG等文件的查看功能。就PDF文件为例,这里使用的是pdf插件,需要将参数通过链接发给ftp,获取到PDF文件,并在后端处…

从MEMS专利数量分析我国MEMS传感器产业现状

来源:传感器专家网MEMS传感器是采用微机械加工技术制造的新型传感器,是MEMS系统的重要分支。MEMS传感器以其优异的性能,如体积小、重量轻、成本低、功耗低、灵敏度高、可批量化生产、易于集成和实现智能化等特点,逐步取代传统机械…

配置手工模式链路聚合示例(交换机之间直连)

组网图形 图1 配置手工模式链路聚合组网图 手工模式链路聚合简介配置注意事项组网需求配置思路操作步骤配置文件 手工模式链路聚合简介 以太网链路聚合是指将多条以太网物理链路捆绑在一起成为一条逻辑链路,从而实现增加链路带宽的目的。链路聚合分为手工模式和LA…

知乎热议:科学网发布文章称「我国数学家证明 NP=P」,会带来怎样的影响?

来源:运筹OR帷幄2020年7月出版的《计算机科学》(中国计算机学会会刊)发表了国防科技大学教授、湘潭大学计算机学院特聘教授姜新文题为《哈密顿图判定问题的多项式时间算法》的论文,这标志着在数学和计算机科学领域中最为重要的难题…

2008r2服务器频繁自动重启,解决windows server 2008 更新后不断重启现象

今天遇到一台服务器提示windows2008r2系统更新失败,进入启动界面时提示:“未正确配置更新,正在还原更改,请勿关闭计算机!”,不久就再次重新启动,然后不断自动重复这个过程。从保护数据安全的角度…

【代码笔记】iOS-自定义loading(IanAlert)

一&#xff0c;效果图。 二&#xff0c;工程图。 三&#xff0c;代码。 ViewController.h #import <UIKit/UIKit.h>interface ViewController : UIViewController {//loading UIView *backViewLoad; } end ViewController.m #import "ViewController.h" //load…

专业|尧德中:脑器交互学,一个发展中的新学科

来源&#xff1a;人工智能人物尧德中专家简介&#xff1a;电子科技大学信息医学研究中心主任&#xff0c;生命科学与技术学院首任院长&#xff08;2001-2017&#xff09;&#xff1b;四川省脑科学与类脑智能研究院院长&#xff0c;神经信息科技部国际联合研究中心主任/教育部重…

服务器的创意工坊文件,Steam 创意工坊实现指南

简介Steam 创意工坊系统使用后端存储、前端网页的形式&#xff0c;便于存储、整理、排序、评分及下载游戏或应用程序。本文提供了为产品实现 Steam 创意工坊的技术细节。 在开始将 Steam 创意工坊与您的游戏整合前&#xff0c;请参见 Steam 创意工坊概览&#xff0c;了解更多您…

CCF-GAIR 2020 全球人工智能和机器人峰会今日开幕

于 2020 年 8 月 7 日-9 日召开的 2020 全球人工智能和机器人峰会&#xff08;CCF-GAIR 2020&#xff09;今日正式开幕。CCF-GAIR 2020 峰会由中国计算机学会&#xff08;CCF&#xff09;主办&#xff0c;香港中文大学&#xff08;深圳&#xff09;、雷锋网联合承办&#xff0c…

ajax获取返回随机数,AJAX

AJAXAJAX&#xff1a;即“Asynchronous Javascript And XML”(异步的JavaScript和XML)&#xff0c;是指一种创建交互式网页应用的网页开发技术&#xff0c;尤其是在一种在无需重新加载整个网页的情况下&#xff0c;能够更新部分网页的技术。传统Web开发World Wide Web(简称Web)…

Neuron:迄今为止最大的颗粒细胞数据,发现海马齿状回神经元可过滤并放大空间信息...

来源&#xff1a;brainnews小柯生命 报道北京时间2020年8月6日晚&#xff0c;奥地利科学与技术研究所 &#xff08;IST, Austria&#xff09;的科研团队在《神经元》上发表论文&#xff0c;发现海马齿状回的神经元可以过滤并且放大空间信息。 出租车司机如何在错综复杂的大街小…

u盘服务器安装win7系统安装教程,最简单的u盘装win7系统详细教程及步骤

随着技术的进步&#xff0c;越来越多的安装电脑系统的方法&#xff0c;有硬盘方式安装&#xff0c;有一键重装系统软件&#xff0c;有U盘重装系统&#xff0c;有光盘安装方法&#xff0c;那么哪种方式最安全呢&#xff1f;答案肯定是U盘安装电脑系统方式最安全&#xff0c;因为…

周志华:“数据、算法、算力”人工智能三要素,在未来要加上“知识”| CCF-GAIR 2020...

来源&#xff1a;雷锋网作者 | 李雨晨如何将“机器学习“与“逻辑推理”相结合&#xff0c;是人工智能领域的“圣杯问题””编者按&#xff1a;2020 年 8 月 7 日&#xff0c;全球人工智能和机器人峰会&#xff08;CCF-GAIR 2020&#xff09;正式开幕。CCF-GAIR 2020 峰会由中国…

ISC 2020周鸿祎:以云端大脑为核心打造国家安全反导系统

来源&#xff1a;秦安战略“进入数字孪生时代&#xff0c;网络攻击影响力更甚核弹。”在第八届互联网安全大会&#xff08;ISC 2020&#xff09;上&#xff0c;360董事长兼CEO周鸿祎说道。360董事长兼CEO周鸿祎2020伊始&#xff0c;伴随一系列新基建政策的落地&#xff0c;各行…

b站的服务器在哪个位置,b站用的是哪个云服务器

b站用的是哪个云服务器 内容精选换一换介绍常见的安全组配置示例。如下示例中&#xff0c;出方向默认全通&#xff0c;仅介绍入方向规则配置方法。不同安全组内的云耀云服务器内网互通仅允许特定 IP 地址远程连接云耀云服务器SSH远程连接Linux云耀云服务器RDP远程连接Windows云…

丘成桐讲数学简史(2小时完整视频)

转自&#xff1a;数学杂说中国数学学者对于数学历史大都厥如&#xff0c;数学历史学家的重点在于考古&#xff0c;研究的是中国古代数学的断纸残章&#xff0c;对于古代文献的处理&#xff0c;不如一般歴史学家考证严谨&#xff0c;对于世界数学发展的潮流并不清楚&#xff0c;…

AI芯片发展的前世今生

来源&#xff1a;数学与人工智能&#xff0c;以上文章观点仅代表文章作者&#xff0c;仅供参考&#xff0c;以抛砖引玉&#xff01;人工智能芯片的分类2.1 传统CPU困局自20个世纪60年代早期开始&#xff0c;CPU(中央处理器)开始出现并使用在计算机工业中。现如今&#xff0c;虽…