学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲

640?wx_fmt=png

来源:机器之心

摘要:人工智能顶会 IJCAI 2018 的主要议程于昨日在瑞典首都斯德哥尔摩开始。昨天上午,Facebook 首席人工智能科学家、纽约大学教授 Yann LeCun 在会上发表了近一个小时,以《Learning World Models: the Next Step towards AI》为主题的演讲,引起了人们的广泛关注。本文将对 LeCun 的演讲进行简要介绍。


完整演讲视频:




Yann LeCun 开场介绍说,当前几乎所有的机器学习从业者在实践中使用的都是监督式学习:向机器展示大量的样本,然后告诉机器正确的答案与内部参数,然后就能做图像识别之类的任务。而过去几年,监督式学习有了极大的成功,应用也非常广泛。下图对比了传统机器学习与深度学习各自的特点。


640?wx_fmt=png


深度学习的演讲回溯到 20 世纪 50 年代,当时 AI 社区尝试构建神经网络。建立这样略为复杂的系统,你需要两个基础的运算:线性的加权和与非线性的激活函数。这里,Yann LeCun 回顾了他们在 80 年代末期提出的用来识别数字的卷积神经网络 LeNet5,从最初的识别单个目标发展到了识别多个目标。


640?wx_fmt=png


很快,他们就建立了一个识别手写文件的系统。在 1995 年,他们在 AT&T 完成了一个商业系统来读取支票账号。经历了如下图展示的过程。Yann LeCun 介绍了,这是上一波人工智能浪潮下的极大成功示例。之后,人们就对神经网络的研究失去了兴趣。一方面是准确率的原因,还因为很多领域当时没有足够多的数据来训练学习系统。


接着,Yann LeCun 介绍说,实际上在 1996-2001 年这段时间内,他并没有研究机器学习,而是在研究其它东西,尤其是图像压缩。


640?wx_fmt=png


下图是在 21 世纪初加入 NYU 之后用模仿学习做的研究。这个研究激发了 DARPA 的 LAGR 项目。


640?wx_fmt=png


Yann LeCun 随后回顾了卷积神经网络在不同任务中的应用,包括用于自动驾驶汽车的目标检测与语义分割等。这些基于视觉的任务绝大部分都需要卷积神经网络的支持,当然也离不开并行计算设备的支持。


640?wx_fmt=png


第一个得到广泛关注与应用的卷积神经网络是 2012 年提出来的 AlexNet,它相比于 LeNet-5 最大的特点是使用更深的卷积网络和 GPU 进行并行运算。AlexNet 还应用了非常多的方法来提升模型性能,包括第一次使用 ReLU 非线性激活函数、第一次使用 Dropout 以及大量数据增强而实现网络的正则化。除此之外,AlexNet 还使用了带动量的随机梯度下降、L2 权重衰减以及 CNN 的集成方法,这些方法现在都成为了卷积网络不可或缺的模块。


640?wx_fmt=png


随后在 ImageNet 挑战赛中,卷积网络的深度与性能都逐年提升。从 12 年到 16 年,参赛者使用的卷积神经网络不断加深,错误率也逐年下降。


如下所示,牛津大学 2014 年提出了另一种深度卷积网络 VGG-Net,与 AlexNet 相比,它的卷积核更小,层级更深。谷歌同年提出了 GoogLeNet(或 Inception-v1),该网络共有 22 层,且包含了非常高效的 Inception 模块。后来到了 15 年,何恺明等人提出的深度残差网络骤然将网络深度由十几二十层提升到 152 层,且性能大幅提高。


此外,去年提出的 DenseNet 进一步解决了 ResNet 遗留下的梯度问题,并获得了 CVPR 2017 的最佳论文。DenseNet 的目标是提升网络层级间信息流与梯度流的效率,并提高参数效率。它也如同 ResNet 那样连接前层特征图与后层特征图,但 DenseNet 并不会像 ResNet 那样对两个特征图求和,而是直接将特征图按深度相互拼接在一起。


640?wx_fmt=png


那么为什么卷积神经网络在计算机视觉任务上如此高效?Yann LeCun 随后就对深度卷积网络的表征方式做了介绍。他表明对于图像数据来说,数据的信息与结构在语义层面上都是组合性的,整体图像的语义是由局部抽象特征组合而成。因此深度网络这种层级表征结构能依次从简单特征组合成复杂的抽象特征,如下我们可以用线段等简单特征组合成简单形状,再进一步组合成图像各部位的特征。


640?wx_fmt=png


卷积神经网络在目标识别、目标检测、语义分割和图像描述等领域都有非常多的应用,而这些实现很多都依赖于深度学习框架。LeCun 随后重点介绍了 PyTorch 与 Detectron,其中 PyTorch 因为采用了动态计算图而受到了广泛的关注,它也是当前发展最快的框架之一。


如下所示,Facebook AI 研究院开源的 Detectron 基本上是业内最佳水平的目标检测平台。据 LeCun 介绍,该项目自 2016 年 7 月启动,构建于 Caffe2 之上,目前支持目标检测与语义分割算法,其中包括 Mask R-CNN(何恺明的研究,ICCV 2017 最佳论文)和 Focal Loss for Dense Object Detection(ICCV 2017 最佳学生论文)等优秀的模型。


640?wx_fmt=png


最后,作为对卷积神经网络的总结,LeCun 带我们回顾了卷积神经网络的应用,包括医疗影像分析、自动驾驶、机器翻译、文本理解、视频游戏和其它学科研究。


640?wx_fmt=png


Yann LeCun 谈到当前深度学习缺乏推理能力,因此未来的一个重点发展方向就是深度学习和推理的结合。


640?wx_fmt=png


人们已经在多个方向上进行尝试。例如,在网络中增加记忆增强模块,典型的工作在下图中列出,这是实现推理的第一步。在对话模型中,由于对话的轮换和非连续的特点,通过增强记忆,有助于预测能力的提高,进而能实现长期而有效的对话。


640?wx_fmt=png


为什么要强调记忆建模的重要性呢?在强化学习中,无模型的强化学习训练需要大量的尝试才能学会一项任务。


640?wx_fmt=png


因此此类方法在游戏中表现良好,如 FAIR、DeepMind、OpenAI 等之前都已在许多游戏上实现接近甚至超越人类的 AI 系统,但这些系统并没有达到现实应用的水平。


640?wx_fmt=png


因为现实环境远远比游戏中的环境要复杂得多,无论是变量复杂度还是不确定性方面,对此,无模型的强化学习系统面对的探索空间是相当巨大的。而且,不像 AlphaGo 那样可以在计算机上模拟成千上万次比赛,现实世界环境是无法被「加速」的,有些试验还涉及很大的风险,这也大大限制了系统的训练资源。


640?wx_fmt=png


那么目前来看,人工智能到底缺少了什么?监督学习需要太多的样本,强化学习需要太多的尝试,AI 系统缺乏常识。


640?wx_fmt=png


Yann LeCun 总结了一下这两类系统的缺点:缺乏独立于任务的背景知识;缺乏常识;缺乏预测行为后果的能力;缺乏长期规划和推理的能力。简言之就是:没有世界模型;没有关于世界运行的通用背景知识。用更一般的语言来讲就是,目前的机器无法在心里想象(表征)世界,而只是像僵尸一样被气味驱使着(无意识地)行动。记忆建模只是一方面,建立完整的世界表征才是我们真正需要的。


640?wx_fmt=png


在现实应用层面,Yann LeCun 总结道,利用现有的监督学习和强化学习技术,我们可以在自驾汽车、医疗图像分析、个性化医疗、语言翻译、聊天机器人(有用但还很蠢)、信息搜索、信息检索、信息过滤以及其它领域中取得不错的进展,但仍然无法实现常识推理、智能个人助理、智能聊天机器人、家庭机器人以及通用人工智能等。


640?wx_fmt=png


然后,Yann LeCun 指出我们可以从婴儿的学习方式上获得启发。婴儿对外部世界的概念学习大部分是通过观察,仅有小部分是通过交互,而视觉比触觉、体感等能捕获更多、更完整的外部信息。那么机器如何做到这一点?其实,这种情况不止发生在人身上,动物也是如此。LeCun 随后展示了一幅婴儿和大猩猩观看魔术的图,并解释说,当违反世界模型,也就是当我们观察到一些不寻常、与世界模型不匹配的东西时,我们的注意力就会被调动(如婴儿和大猩猩看到魔术表演会大笑就是因为世界模型被违反了)。


640?wx_fmt=png


640?wx_fmt=png

接下来,LeCun 解释了突破强化学习现状的解决方法:自监督学习,它能通过输入的某一部分预测其它部分。在空间层面上包括图像补全、图像变换等,在时间层面上包括时序数据预测、视频帧预测等。


640?wx_fmt=png


Yann LeCun 总结了三类学习范式,分别是强化学习、监督学习和自监督学习,相比于强化学习和监督学习,自监督学习将输入和输出当成完整的整体。它们的区别和联系在于反馈信息的逐渐增多,模型表征复杂度、适用任务类型也大幅增加,同时任务中涉及的人类工程比重也大大减少,意味着自动化程度的增加。


640?wx_fmt=png


LeCun 还用之前经常使用的蛋糕比喻来说明三者的关系,之前蛋糕胚代表的是无监督学习,现在则被换成自监督学习。


640?wx_fmt=png


Hinton 在自监督学习领域探索了多年,LeCun 之前一直持怀疑态度,现在终于认可了这个方向。


640?wx_fmt=png


机器学习的未来不会是监督学习,当然也不会纯粹是强化学习,它应该是包含了深度模块的自监督学习。


640?wx_fmt=png


那么下一个问题是,自监督学习能够产生一般的背景知识吗?这里重点是模型需要推断出背景知识,它需要从真实世界收集的背景知识推理出当前它希望预测的任务。如下 LeCun 举了一个例子,如果接收到一个自然语句,模型应该推断出当前场景的各种背景知识。


640?wx_fmt=png


对于基于模型的经典最优控制,我们可能需要初始化一个序列来模拟世界,并通过梯度下降调整控制序列来最优化目标函数。而目前我们可以通过强化学习的方式模拟世界,这些模型不仅需要预测下一个可能的动作,同时还需要预测一系列可能的未来。


640?wx_fmt=png


接下来 Yann LeCun 介绍了使用对抗训练的视频预测。他首先展示了预测无监督学习。人类是很擅长预测的,然而机器很难预测未来会发生什么。近年来的研究中出现了一些使用「对抗训练」的成功案例,但是仍有很长的路要走。Yann LeCun 用一个纽约公寓的视频示例进行举例说明。


640?wx_fmt=png


语义分割空间的视频预测


这部分 Yann LeCun 介绍了当前语义分割预测的现状。


640?wx_fmt=png


Latent-Variable Forward Models for Planning and Learning Policies


下图展示了用于推断动作和潜在变量的模型架构。


640?wx_fmt=png


然后 Yann Lecun 展示了一个现实世界的真实案例。


640?wx_fmt=png


640?wx_fmt=png

640?wx_fmt=png


640?wx_fmt=png


最后,Yann Lecun 总结了技术和科学之间的互相驱动和促进,如望远镜和光学、蒸汽机和热力学、计算机和计算机科学等。并提出了疑问:什么相当于智能的「热力学」?


  • 人工智能和自然智能背后是否存在底层原则?

  • 学习背后是否存在简单的准则?

  • 大脑是否是进化产生的大量「hack」的集合?640?wx_fmt=png


640?wx_fmt=png


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495043.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

什么是 vuex、如何使用 vuex ?

From:https://blog.csdn.net/m0_70477767/article/details/125155540 Vuex 官网文档:https://vuex.vuejs.org/zh/ 1、Vuex 是什么 ​Vuex 是一个专为 Vue.js 应用程序开发的 状态管理模式, 采用 集中式存储 管理应用的所有组件的状态&#x…

IJCAI 2018所有奖项出炉:AlphaGo获奖,中国人论文占46%,华人一作近2/3

来源:全球人工智能IJCAI(国际人工智能联合会议)是人工智能领域历史最悠久的学术会议,也是最重要和最顶级的学术会议之一。第一届IJCAI于1969年举办,是1956年达特茅斯研讨会的延伸,也是有史以来的第一次人工…

VUE 超级详细教程

From:https://blog.csdn.net/weixin_42371679/article/details/112408800 vue 源码阅读解析:https://zhuanlan.zhihu.com/p/419896443 深入理解vue底层原理:https://blog.csdn.net/dream2222222222/article/details/103256281 Vue 源码解读…

下一代脑电图可以帮助恢复失去的大脑功能

来源:IEEE电气电子工程师学会摘要:据悉,能源部SLAC国家加速器实验室和斯坦福大学正在开发的一种装置,可以通过测量大脑对电流刺激它的疗法的反应来帮助恢复失去的大脑功能。据悉,能源部SLAC国家加速器实验室和斯坦福大…

鼓吹海

此时此刻,我坐在海堤上,现在有一些渔民挑着担子,陆陆续续要回去了。空气中弥漫着鲜海的味道,来风习习。夏天里夜幕将临,灰灰的集美大桥上,有来来往往亮着尾巴的方盒子,有的高,有的矮…

2018人工智能行业创新情报白皮书

来源:PatSnap人工智能的定义非常广泛,随着时间的推进,文公智能也将不断进化,但其本质是机器模拟人类思考行为的能力。虽然人工智能经常被分作计算机 科学的一个分支,事实上智能站在自然科学和社会科学的交叉路口&#…

前沿|Google AI提新型神经网络,对神经元进行高精度自动重建

来源:AI科技大本营7 月 16 日, Google AI 发布了一篇博客称,Google Research 部门和 Max Planck 研究所合作提出了一种新型的递归神经网络,它可以提升连接组数据进行自动分析的准确性,相比先前深度学习技术的准确性是数…

机器传奇:全球13位科学家和他们的机器人“孩子”

来源:资本实验室摘要:自古以来,人们就幻想使用自动化机械来替代人类进行某项工作,中国、希腊和罗马都有关于自动化机械的传说或历史记载。聚焦前沿科技创新与传统产业升级自古以来,人们就幻想使用自动化机械来替代人类…

使用delphi 开发多层应用(十三)使用Basic4android 直接访问kbmMW server

由于目前delphi xe2 还不直接支持Android 的开发,因此kbmMW 客户端的功能也没办法直接在Android 上运行。 由于kbmMW 为了与java 应用程序通讯,在企业版里面提供了一个JavaClinet. 具体文件名为kbmMWClient.jar。 而在basci4android 可以直接使用这个jar…

赛灵思收购深鉴科技:收购额或将3-4亿美元 A轮投资方变收购方

来源:声学在线继去年5月宣布投资中国AI初创企业深鉴科技后,自适应和智能计算企业赛灵思公司Xilinx今日宣布已经完成对深鉴科技的收购。官方消息并未对外披露此次的具体交易财务条款。不过,据业内人士对声学在线透露,此次赛灵思收购…

探Button控件的Click事件发生始末

先贴结果图&#xff1a; 点击后&#xff1a; 页面代码&#xff1a; <html xmlns"http://www.w3.org/1999/xhtml"> <head runat"server"><title></title> </head> <body><form id"form1" runat"serv…

AI大神Yann LeCun谈近期AI发展:最聪明的AI在常识方面还不如猫

来源&#xff1a;网易智能摘要&#xff1a;从虚拟助手到巨大的商业效益&#xff0c;人工智能正在重塑信息时代&#xff0c;作为著名的人工智能先驱者之一&#xff0c;Yann LeCun又是怎么看待这一领域的发展、近期的变化和潜力的呢&#xff1f;从虚拟助手到巨大的商业效益&#…

美科学基金会欲向公众征集想法

来源&#xff1a;中国科学报你有个或许会改变世界的点子&#xff1f;美国国家科学基金会&#xff08;NSF&#xff09;洗耳恭听。这个位于弗吉尼亚州亚历山大市、拥有78亿美元经费的研究机构已从科学家那里获得了很多好的研究计划。虽然这已经超出了其能资助的范围&#xff0c;但…

解决i9001WiFi频繁断线

去年年底入手Galaxy S Plus&#xff0c;玩安卓快半年时间&#xff0c;最近为了方便使用Airdroid对手机进行管理&#xff0c;在路由器中设置了IP和MAC绑定&#xff0c;却发现每隔大约1分钟或者更短时间&#xff0c;WiFi连接就会自动断开&#xff0c;求助Google&#xff0c;有一位…

专家把脉,深入分析八种前景看好的物联网业务形态

来源&#xff1a;通信世界全媒体摘要&#xff1a;物联网将会为经济带来新动力&#xff0c;对社会带来新变革&#xff0c;它的业务形态也在发展变化。未来随着更多成熟的业务场景的出现&#xff0c;会演变出更多有前景的应用形态&#xff0c;也会带来更多的市场机会。万物互联是…

人工智能产业的发展是什么样的呢?

来源&#xff1a;人工智能大健康引领AI产业发展的技术竞赛&#xff0c;主要是巨头之间的角力。由于AI产业核心技术和资源掌握在巨头企业手里&#xff0c;而巨头企业在产业中的资源和布局&#xff0c;都是创业公司所无法比拟的&#xff0c;所以巨头引领着AI发展。目前&#xff0…

个性化推荐

“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制&#xff0c;实现方法&#xff0c;其中还涉及一些基本的优化方法&#xff0c;例如聚类和分类的应用。同时在理论讲解的基础上&#xff0c;还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐…

报告 | 从20世纪70年代至今,自动驾驶汽车的发展经历了哪些历史性的变革?

来源&#xff1a;学术头条摘要&#xff1a;当今&#xff0c;无人驾驶技术已经成为整个汽车产业的最新发展方向。科研院校、汽车制造厂商、科技公司、无人驾驶汽车创业公司以及汽车零部件供应商在无人驾驶技术领域进行不断地探索。今天我们为大家梳理一下无人驾驶汽车的国内外发…

访问List的itemRenderer的组件中定义的方法

主程序文件List1.mxml: 1 <?xml version"1.0" encoding"utf-8" ?>2 <mx:Application xmlns:mx"http://www.adobe.com/2006/mxml">3 <mx:Style>4 Application5 {6 font-size:12px;7 }8 </mx:Style>…

量子力学工具箱再添利器—科学家提出高效驱动微型引擎概念

把球推上山坡需要能量。量子引擎或能通过反复测量实现同样的工作。来源&#xff1a;中国科学报要测量一个原子&#xff0c;不可能不扰动它&#xff0c;至少根据量子力学是这样的。但两名物理学家报告称&#xff0c;这一效应似乎有点麻烦&#xff0c;但它可以驱动一个微型引擎以…