“反机器学习”:人工智能突破的关键是“遗忘”

640?wx_fmt=jpeg

来源:36Kr

摘要:人工智能越来越频繁地出现在人们的生活中,而其技术上的重大进步仍然不曾明朗。


本文作者Natalie Fratto在“Machine Un-Learning: Why Forgetting Might Be the Key to AI”一文中讲述了实现人工智能战略性遗忘的三个方法。


让我们先直面那些事情一团糟的情况。你不记得自己把钥匙放在了哪里,你不记得刚刚在杂货店遇到的同事的名字因而只能磕磕绊绊地说着话,这都令你异常沮丧。然而,遗忘是人类得以生存的核心。事实上,我们必须对自己有能力做到这一点感到幸运。


对于人类来说,遗忘不仅仅意味着记忆的遗失,也意味着这也是一个帮助大脑吸收新知识并有效做出决策的积极过程。


现在,数据科学家正在应用神经科学原理改进机器学习技术,他们相信人类的大脑是完全揭开人工智能面纱的关键。


根据最近发表在《神经元》(Neuron)杂志上的一篇论文所言,人们的大脑充当着信息过滤器的角色。它能输入一大堆乱七八糟的数据,再过滤出有用的数据,然后清除所有无关的细节,从而使人们能够成功讲述一个故事或者是做出决定。这种删除未使用信息,以便为接受新信息腾出空间的行为,就如同清理计算机上的磁盘空间。


用神经生物学术语表示,当神经元之间的连接随着时间的推移变得减弱甚至是消失时,遗忘就会发生,而随着新神经元的出现,它们会重新连接海马体的回路并覆盖现有记忆。


对于人类来说,遗忘的发生带来两个好处:


  1. 它通过减少过时信息对人们产生的影响来提高决策灵活性。

  2. 它能够预防人们过度沉浸于某些过去的特定事件,提高适应能力。


人们为了有效适应发展,必须具备战略性遗忘的能力。


但是电脑又能如何呢?


这即是人工智能所面临的最大挑战之一,计算机的遗忘逻辑与人类的情况不同。深度神经网络是一系列机器学习任务中完成度最高的技术,但是它不会像人们那样去遗忘。


举个简单的例子,如果你要教一个会说英语的孩子学习西班牙语,那么他会将学习英语过程中的相关经验应用到学习西班牙语的过程中,这有可能是名词、动词时态和句子结构等,同时忽略掉那些不相关的部分,比如口音、晦涩词语和语调等。孩子们可以基于战略性遗忘策略不断地学习与重建。


神经网络的逻辑与此不同,如果一个神经网络被训练学习英语,那么其会通过调用参数解决英语问题。如果你想教它学习西班牙语,那么神经网络对于西班牙语的认知就会覆盖掉之前为英语学习所储备的知识,有效清空所有内容并从零开始。我们将其称为“灾难性遗忘”,“这是神经网络所面临的基本局限之一。”


攻克这一局限是一个全新领域,但是科学家已经在关于如何克服这种局限性所涉及的潜在理论的探索上取得了长足的进步。


人工智能学会战略性遗忘:三种方法


#1. 长短期记忆网络(LSTM,Long Short Term Memory Networks)


长短期记忆网络是一种递归式神经网络,它通过特定的学习机制决定在什么时候记住哪些信息,更新哪些信息,注意哪些信息。


用电影类比来解释长短期记忆网络工作的逻辑十分简单易懂。想象这么一种场景,一台电脑通过分析之前的场景来预测电影接下来会发生什么。在某个场景中,一个女人拿着一把刀,电脑会猜她是厨师还是杀人犯?在另一个场景中,这个女人在一个金色拱门下面同一个男人一起吃着寿司,他们是在日本还是在麦当劳?或者是能确定他们在圣路易斯?


这的确非常难以预测。


长短期记忆网络则在这一过程中帮助神经网络实现1)遗忘/记忆,2)保存,3)聚焦。


1. 遗忘/记忆:“例如,在一个场景结束后,模型应该忘记当前的位置信息、时间信息,并重置任何有关场景的特定信息。但是,如果某个角色在某个场景中死去了,那么它需要记住这个人已经不再会出现。因此,我们希望模型能够学习一种单独的遗忘/记忆机制:当新的信息出现时,它需要知道哪些信息需要保留而哪些信息需要丢弃。”


2. 保存:当模型看到一个新图像时,它需要了解这个图像的信息是否值得使用和保存。如果某个场景中一个女人走过了一个广告牌,是记住这个广告牌,还是仅仅将其视为冗余?


3. 聚集:模型需要记住电影中的这位女性是一个母亲,因为之后的场景会出现她孩子的画面。但是如果在某个场景中女人并没有出现,那么这一信息就显得不甚重要,所以在这个场景中模型不需要关注这一信息。同样,并非所有存储在神经网络长期记忆中的东西每一次都会发挥直接相关的作用。因此,长短期记忆网络需要帮助确定模型在某个特定时间需要关注哪些部分,同时将所有信息妥善保管。


#2. 弹性权重固化(EWC,Elastic Weight Consolidation)


弹性权重固化是谷歌旗下DeepMind的研究人员于2017年3月创建的一种算法,该算法模拟了一种叫做“突触整合”的神经科学过程。在突触整合过程中,人们的大脑会进行任务评估,计算众多用于执行任务的神经元的重要性,并确认一些神经元所扮演的重要角色使其对正确执行任务发挥更加重要的作用。这些关键性神经元被标记上重要程度并使其在后续任务中被覆盖的几率减小。在神经网络中也有多个如神经元的连接用于执行任务。弹性权重固化将某些连接编码标注上关键性,从而保护其不被过度写入遗忘/记忆程序。


#3. 瓶颈理论(Bottleneck Theory)


2017年秋天,在人工智能社区的一次演讲中,来自耶路撒冷希伯来大学的计算机科学家与神经学家纳夫塔利·提斯比讲述了其称之为“瓶颈理论”的观点。“其思想是,一个网络会排除掉那些无关重要的嘈杂的输入数据,这就如同通过瓶颈向其中压缩信息,只保留与一般概念最相关的特性。”


正如提斯比所解释的那样,神经网络在学习过程中需要经历两个阶段,拟合与压缩。在拟合过程中,网络对其训练数据进行标记。而在更为复杂的压缩过程中,其“将基于标记的数据信息只追踪那些具备巨大特征的信息。”而这一过程对于之后的概化过程极为重要。在此过程中,压缩是一种策略上的遗忘方式,人工智能研究人员可以在未来用其构建更强大的神经网络和框架。


正如提斯比所言,“学习过程中最重要的环节是遗忘。”


人类的大脑可能蕴藏着创造强大人工智能的图解,而如今科学家们仍然停留在如何解读这些可能的层面。


原文链接:https://hackernoon.com/machine-un-learning-why-forgetting-might-be-the-key-to-ai-406445177a80


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/495428.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

反编译资料收集

JDP 一个非常好用的Java反编译工具:官方描述“The “Java Decompiler project” aims to develop tools in order to decompile and analyze Java 5 “byte code” and the later versions.”。 官方网址:http://java.decompiler.free.fr/ &…

Java 内部类 和 匿名内部类

From:https://www.cnblogs.com/geeksongs/p/9836154.html 一,内部类 其实内部类是十分简单的,我们根据其字里行间的意义就可以知道内部类应该是一个类当中的一个类,相当于一个类进行了嵌套,就如同循环的嵌套一般。 内…

打造一个宇宙 星系模拟产生对宇宙进化惊人见解

图片来源:TNG COLLABORATION来源:中国科学报摘要:研究人员不断发展宇宙模型,并借此发现新的宇宙理论。美国加州理工学院理论物理学家Philip Hopkins喜欢跟他的同事恶作剧。作为模拟星系形成的专家,Hopkins有时会在演讲…

Scrapy 性能

参考:https://blog.csdn.net/s150503/article/details/72571680 CONCURRENT_REQUESTS 与 DOWNLOAD_DELAY Scrapy 中 CONCURRENT_REQUESTS 与 DOWNLOAD_DELAY 的联系,先建立一个项目来找CONCURRENT_REQUESTS与DOWNLOAD_DELAY的联系 以豆瓣电影top250 为例…

在CentOS6虚拟机上安装VirtualBox增强功能

1. 安装编译需要的库和头文件yum install gcc -yyum install kernel sources -yyum install kernel-devel -y2. 安装VirtualBox增强功能3. 重新启动系统转载于:https://www.cnblogs.com/wdpp/archive/2011/07/13/2386255.html

5G 发展报告:以四项技术为基础,广泛应用还需十年

来源:36Kr摘要:近年来,在5G领域的竞争非常激烈。但5G的部署与应用到底是一个什么样的过程?人们到底需要多久才能普遍用上5G技术?日前,CB Insights发表了一篇报告,在对无线技术的背景进行研究的基…

33个优秀的 jQuery 图片展示插件分享

这篇文章收集了33个优秀的 jQuery 图片插件分享给大家。jQuery 是一个非常优秀的 JavaScript 框架,使用简单灵活,同时还有许多成熟的插件可供选择,其中最令人印象深刻的应用之一就是对图片的处理,它可以让帮助你在你的项目中加入一…

安卓逆向_13 --- AndroidStudio + Smalidea 动态调试 smali 代码【APK可调试】、gradle 配置

教我兄弟学Android逆向04 动态调试smali代码:https://www.52pojie.cn/thread-658865-1-1.html From:Android Studio 3.6 调试 smali:https://blog.csdn.net/jha334201553/article/details/104494732 From:SmalideaIntelliJ IDEA/…

IEEE协会首次在京举办研讨会,王飞跃称不存在AI芯片

本文来源:网易智能摘要:6月9日至10日,IEEE SMC学会(IEEE System,Man,and Cybernetics Society)与中国自动化学会、中国科学院自动化研究所、青岛智能产业技术研究院共同在京举办IEEE人工智能与控…

Lucene提供的条件判断查询[转]

Lucene提供的条件判断查询[转] 第一、 按词条搜索 - TermQuery query new TermQuery(new Term("name","word1")); hits searcher.search(query); 这样就可以把 field 为 name 的所有包含 word1 的文档检索出来了。 第二、 “与或”搜索…

安卓逆向_14 --- 单机和弱联网游戏内购 突破口 和 思路

From:https://www.bilibili.com/video/BV1UE411A7rW?p41 Android 逆向资源收集( apk ):https://blog.csdn.net/qq_36869808/article/details/79290420 Android逆向-Android基础逆向7(内购干货集合)&#…

OpenAI最新研究:如何通过无监督学习提升「自然语言理解能力」?

来源:amazonaws.com摘要:长期以来,使用无监督(预)训练来提高区别性任务的性能表现一直是机器学习研究的一个重要目标。最近,OpenAI通过使用一个具有可扩展性的任务不可知系统,在一系列不同的自然…

安卓逆向_15( 一 ) --- JNI 和 NDK

From:较详细的介绍JNI:https://blog.csdn.net/lizhifa2011/article/details/21021177 From:https://www.jb51.net/article/126111.htm NDK 官方文档:https://developer.android.google.cn/training/articles/perf-jni JNI / NDK …

Nature:科学家成功绘制出大脑神经细胞“地图”

图片来源:Thomas Hainmller, Marlene Bartos来源:生物谷摘要:最近,一项刊登在国际杂志Nature上的研究报告中,来自弗莱堡大学的科学家们通过研究开发出了一种新型模型来解释大脑如何储存一些“有形事件”(ta…

互联网的大脑模型与原子的太阳系模型,科学史上的巨系统对比

作者:刘锋 计算机博士,互联网进化论作者科学探索中,有两种重要的促进力量,第一种是认同,会帮助研究者增强对探索方向的信心和勇气,第二种是批判,会帮助研究者获知探索路上的障碍和陷阱。10年前…

安卓逆向_15( 二 ) --- Android Studio 3.6.3 JNI 环境配置 和 so 生成开发 demo

From:Android Studio 3.0 JNI 的实现:https://blog.csdn.net/ziyoutiankoong/article/details/79696279 Android Studio 生成so包和.H文件给jni调用产生新so包。(即so包调so包):https://blog.csdn.net/sxh_android/article/details/80694291…

SQL经典语句(转载)

一、基础<?XML:NAMESPACE PREFIX O ?> 1、说明&#xff1a;创建数据库CREATE DATABASE database-name 2、说明&#xff1a;删除数据库drop database dbname3、说明&#xff1a;备份sql server--- 创建 备份数据的 deviceUSE masterEXEC sp_addumpdevice disk, testBac…

卡内基梅隆大学机器学习系副主任邢波:AI落地现在最缺的是思维方式

来源&#xff1a;亿欧摘要&#xff1a;邢波认为&#xff1a;人工智能现在最缺的不是算法和知识&#xff0c;而是落地应用的思维方式&#xff1b;数据如何被处理、系统如何被调试、资源如何配置&#xff0c;目前阶段还处于黑箱&#xff0c;很混沌的状态&#xff1b;人工智能未来…

安卓逆向_15( 三 ) --- Android NDK 开发【 jni 静态注册、JNI_OnLoad 动态注册】

Android Studio开发JNI示例&#xff1a;https://blog.csdn.net/wzhseu/article/details/79683045 JNI_动态注册_静态注册.zip : https://pan.baidu.com/s/1wpTYA9euSdPqE1Z2bA_BHA 提取码: 7h97 错误: 编码GBK的不可映射字符 ( https://blog.csdn.net/talenter111/article/de…

scrapy-redis 使 redis 不止保存 url(例如:json)

scrapy-redis 使 redis 不止保存 url&#xff1a;https://my.oschina.net/u/4382439/blog/3712637 Scrapy-redis 和 Scrapyd 用法详解&#xff1a;https://zhuanlan.zhihu.com/p/44564597 Scrapy-redis GitHub 地址&#xff1a;https://github.com/rmax/scrapy-redis scrapy…