DeepMind提出「心智神经网络ToMnet」,训练机器的「理解」能力

原文来源:arXiv

作者:Neil C. Rabinowitz、Frank Perbet、H. Francis Song、Chiyuan Zhang、S. M. Ali Eslami、Matthew Botvinick

「雷克世界」编译:嗯~阿童木呀、KABUDA


一般来说,心智理论(ToM,Premack和Woodruff于1978年提出)泛指人类理解自己与他人的心理状态,包括欲望、信仰和意图等,并基于此预测和解释他人行为的能力。我们打算对机器进行训练从而构建这样的模型。我们设计了一个心智理论神经网络——ToMnet,它使用元学习(meta-learning),通过对其所遇到的智能体的行为进行单独观察,从而构建该智能体模型。通过这个过程,它获得了一个智能体行为的强有力的先验模型,以及仅使用少量行为观察就能够更加丰富地预测特征特征和心理状态的能力。我们将ToMnet应用于在简单的gridworld环境中运行的智能体,显示它学习为来自不同群体的随机、算法和深度强化学习智能体进行建模,并且它通过了经典的ToM任务,如“SallyAnne”测试(Wimmer和Perner于1983年、BaronCohen等人于1985年提出),认识到其他人可能持有错误的世界观。我们认为这个系统,即自主学习如何在其世界中对其他的智能体进行建模,是开发多智能体AI系统、构建机器—人机交互的中介技术、推进可解释性AI发展的重要一步。


就目前而言,虽然在深度学习和深度强化学习领域取得了令人兴奋的发展成果,但有些人担心,我们对这些系统的理解已经落后了。神经网络通常被描述为不透明的、不可解释的黑盒子。即使我们对它们的权重有完整的描述,也很难掌握它们正在使用的模式以及它们可能出错的地方。随着人工智能体逐渐地进入人类世界,对于我们能够理解它们的需求也越来越大。


那我们不禁要问:“理解”另一个智能体究竟意味着什么?作为人类,我们每天都面对这一挑战,因为与我们所交流接触的人,他们的潜在特征、潜在状态和计算过程几乎完全无法访问。但我们具有非常出色的能力,我们可以对陌生人的未来行为进行预测,并推断出他们对世界的了解。我们对与他人的互动做出规划,并建立起与其之间的高效和有效沟通。

 

ToMnet架构


其他智能体的这些“理解”的一个突出特点是,他们几乎对智能体的真正潜在结构没有任何参考。我们通常不会试图估计他人神经元的活动,推断他们前额皮质的连通性,或者计划与其他人的海马体地图(hippocampal maps)动态的详细近似进行交互。认知心理学的一个重要观点是,我们的社会推理取决于其他智能体的高层次模型(Gopnik和Wellman于1992年提出)。这些模型涉及的抽象概念并未描述所观察行为的基础的详细物理机制。相反,我们理解的是他人的心理状态,例如他们的欲望、信仰和意图。而这种能力通常被描述为我们的心智理论(Premack和Woodruff于1978年提出)。尽管在某些情况下,我们也可以利用我们自己的想法对他人的想法进行模拟(例如Gordon于1986年、Gallese和Goldman于1998年提出),但我们对其他智能体的最终理解并不是通过我们的模型与机械基础事实之间1-1对应来实现的,而是由这些模型为诸如预测和规划等任务提供了多少支持(Dennett于1991年提出)实现的。

 

一个随机智能体在其中活动的gridworld示例


在本文中,我们从人的心智理论中获得灵感,并试图建立一个能够学习如何对其他智能体进行建模的系统。我们将此描述为机器心智理论(Machine Theory of Mind)。我们的目标不是提出一种智能体行为的生成式模型以及对其进行反转的算法。相反,我们的关注点在于,观察者是如何自主学习使用有限的数据为其他智能体进行建模的(Botvinick等人于2017年提出)。这将使我们的研究与以前的研究成果区分开来,以往研究依赖于将手工制作的智能体模型作为嘈杂理性的规划者(noisy-rational planners),例如,使用反向强化学习、贝叶斯推理、贝叶斯心智理论或博弈论等。与其相反的是,我们学习智能体模型,并学习如何从头开始,通过元学习来对它们进行推理。


构建一个丰富、灵活并具有高性能的机器心智理论对于AI而言可能是一个巨大的挑战。我们并不是要在这里解决所有问题。本文要传递的一个主要信息是,只要它们以正确的方式表达,构建ToM的许多初始挑战可以被视为简单的学习问题。我们这里的工作就是要弄明白这些简单公式。

 

在随机智能体上进行训练的ToMnet


这项工作具有很多的潜在应用,学习他人的丰富模型将改善复杂的多智能体任务的决策,尤其是在需要基于模型的规划和想象力的情况下(Hassabis等人于2013年,Hula等人于2015年,Liehok和Amato于2016年提出)。这些模型对于价值调整(Hadfield Menell等人于2016年提出)和灵活合作(Nowak于2006年,Kleiman-Weiner等人于2016年,Barrett等人于2017年提出)是重要的,并且可能成为未来机器伦理决策(machines’ ethical decision making)的一个组成部分(Churchland等人于1996年提出)。它们对传播学和教育学也非常有用(Dragan等人于2013年,Fisac等人于2017年,Milli等人于2017年提出),因此可以在人机交互中起到关键作用。探索产生这些能力产生的条件可以揭示我们人类能力的起源(Carey等人于2009年提出)。最终,这样的模型可能成为我们人类理解人工智能体的重要媒介。


最后,我们强烈的动机是使人类理解人工智能体,我们在此尝试了一种新颖的方法:我们试图建立一个中介系统,以减少行为空间的维度,并以更易理解的形式展现它们,而不是修改智能体结构以人类易于理解的解释方式揭示其内部状态。在这方面,对Machin ToM的追求是为了在机器和人类期望之间建立缺失的界面(Cohen等人于1981年提出)。


在本文中,我们使用元学习来构建一个系统,用来学习如何对智能体进行建模。我们通过一些列实验展示了ToMent如何在训练分布中学习智能体的通用模型,以及如何在观察一个新智能体的同时,在线构建一个特定智能体模型。ToMent可以在一系列不同类型的智能体上灵活地学习这些模型,并且对驱动这些智能体制定决策的生成过程几乎没有做出任何假设。ToMnet还可以发现行为空间内的抽象概念。


我们注意到,我们在这里进行的实验很简单,旨在说明这一系统的核心思想和功能。要将ToMnet扩展到更广阔的领域,还有许多工作要做。


第一,由于这种环境具有控制力,因此导致我们完全在gridworld内工作。我们期待将这些系统扩展到复杂的3D视觉环境中,并在其他具有丰富状态空间的POMDP中运行。


第二,我们在这里没有尝试限制观测者本身的可观测性。这显然是现实世界社交活动中的一个重要挑战,例如,我们试图确定别人知道我们所不知道的是什么时,这本质上是一个推理问题(Baker等人于2017年提出),学习如何做到这一点是ToMnet未来面临的挑战。


第三,我们希望能在其他更多维度上描述智能体的特征,例如,它们是否有生命(Scholl和Tremoulet于2000年提出),友好还是敌对(Ullman等人于2009年提出),被动的还是有计划的(Sutton和Barto等人于1998年提出)。或许更令人感兴趣的是利用ToMnet发现自然或人工种群行为的新结构的可能性,即作为一种机器人类学(machine anthropology)。


第四,心智理论对社会人而言十分重要,因为它能指导我们的社会决策。这项研究的一个重要步骤是将ToMnet放置在人工智能体内部,人工智能体必须学习执行多智能体任务。


在追求这些目标的过程中,我们预见了许多未来的需求:丰富ToMnet必须做出一系列预测;向ToMnet的智能体行为生成式模型中引入温和的归纳偏见;思考智能体如何从它们自身的经验和知识中不断总结,以便让它们的模型了解他人。解决这些问题对于推进机器心智理论是必要的,该理论可以学习负责任的社会人士所具有的丰富能力。



未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/496992.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为正式发布5G商用芯片、5G终端!

来源::5G概要:5G网络和5G终端是5G商用的两个基础条件。重大信息未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学…

linux 命令:grep、egrep、ngrep、kill、pkill、killall

1、grep 帮助:grep --help 用法:grep [OPTION]...patterns[FILE]... 示例:grep -i hello world menu.h main.c // 在每个 FILE 中搜索 patterns。 当 FILE 为 - 时,读取标准输入。 没有 FILE,读 . 参数说明&…

Gartner2018年大数据平台魔力象限:华为位置提升,阿里云和南大通用入围

来源:云头条概要:Gartner近日发布了2018年版面向分析的数据管理解决方案魔力象限。Gartner近日发布了2018年版面向分析的数据管理解决方案魔力象限。 Gartner特别指出,由于某些因素变得明朗化,具体来说涉及云计算、Hadoop逻辑数据…

sql server 2005 T-SQL BULK INSERT (Transact-SQL)

以用户指定的格式将数据文件导入数据库表或视图。 Transact-SQL 语法约定 语法 BULK INSERT [ database_name . [ schema_name ] . | schema_name . ] [ table_name | view_name ] FROM data_file [ WITH ( [ [ , ] BATCHSIZE batch_size ] [ [ , ] CHECK_CONSTRAINTS ] [ [ …

图表对比详解:亚马逊、微软和谷歌云的机器学习即服务哪家强

林鳞 编译自 KDnuggets量子位 出品 | 公众号 QbitAI对于大多数公司来说,机器学习是一项复杂而伤神的工作,花销大、对人才要求高。机器学习即服务针对这个痛点应运而生。什么是“机器学习即服务”机器学习即服务(Machine learning as a servic…

Wing IDE 5.0 破解之寻找注册码

来源:http://bbs.pediy.com/showthread.php?p1253653 一. 工具: 1. uncompyle2 2. IDA Pro 6.1 3. WingIDE 5.0本身 二. 工具安装 1. 安装Python2.7 2. 安装WinIDE 5.0 3. 解压uncompyle2,进入解压目录&#…

深度|麦肯锡176页报告!解读数字中国领先全球的秘密

来源: 前瞻产业研究院2017年12月4日,麦肯锡发布了长达176页的中国数字经济报告。报告显示,中国电子商务(2016年交易额占全球40%)和数字支付(2016年个人消费交易额交易额7900亿美元,是美国的11倍…

浅谈Springboot默认logger函数的使用

目录 前言1. logger日志2. 补充 前言 原先写过一篇logger日志函数的总结,不同的引用来源:java常见log日志的使用方法详细解析 但是为了不引入依赖包,更好的直接使用,总结了如下博文 1. logger日志 Spring Boot使用Spring框架中…

find 和 xargs 和 locate

Linux 中 find 常见用法示例:http://blog.csdn.net/freeking101/article/details/51203183 1. find 命令选项。 find 命令的一般形式为:find pathname -options [-print -exec -ok] find 命令的参数: pathname find 命令所查找的目录路径。…

用互联网大脑架构预测2018年四个科技发展趋势

作者:互联网进化论作者,刘锋博士从本世纪处开始,随着人工智能,物联网,大数据,云计算,机器人,虚拟现实,工业互联网等科学技术的蓬勃发展,互联网类脑智能巨系统…

利用DAAB 获取存储过程返回值的方法

方法一 publicstaticAdoHelper helper AdoHelper.CreateHelper("sqlDA"); publicstaticstringcs WebConfigurationManager.AppSettings["SqlServerConnectionString"]; protectedvoidPage_Load(objectsender, EventArgs e) { IDataP…

骗子、假先知们一夜暴富背后:区块链是回归互联网本来意义的唯一希望|深度

文章转载于微信公众号机器之能(ID:almosthuman2017)来源:纽约时报杂志 编译:张震、Edison、Rik“编者按”:纽约时报的这篇区块链文章探讨到核心的问题了,互联网应用层分布式架构(区块…

css 中 float 和 clear 的作用

相当于原来的 align 的作用,但能力要比 align 强的多。一旦发出float:left或float:right命令,被我浮动的对像就会向左或向右移动直到遇到边框( border) 、填充( padding) 、边界( margin )或者另一个块对象的边缘为止。 经典样式&…

深度解读:深度学习在IoT大数据和流分析中的应用

来源:网络大数据(ID:raincent_com)摘要:这篇论文对于使用深度学习来改进IoT领域的数据分析和学习方法进行了详细的综述。在物联网时代,大量的感知器每天都在收集并产生着涉及各个领域的数据。由于商业和生活质量提升方…

区块链行业报告|从交易流程到Token经济的全方位解析

来源:36氪研究院作者:孔德云 36氪研究院 分析师中国人在干嘛?首先,目前我国区块链项目只占到了全球的4.6%,相比之下,美国占了36%。由于大环境因素,通过ICO的形式,真正找到落地场景…

ps 命令详解

From:http://blog.chinaunix.net/uid-25681671-id-3201927.html 进程和作业管理命令:http://man.linuxde.net/sub/进程和作业管理 Linux 关于 进程/线程 的命令 kill 和 pgrep 和 pidof 和 awk 和 pkill 和 killall:https://blog.csdn.net…

中国将对人工智能、云计算等行业独角兽IPO即报即审

来源:21世纪经济报道摘要:2月28日下午,有媒体报道称监管层对券商作出指导,包括生物科技、云计算在内的四个行业若有“独角兽”,立即向发行部报告,符合相关规定者可以实行“即报即审”。2月28日下午&#xf…

5G的风头盖过了AI,英特尔展示未来四大应用场景 | MWC2018

来源:36Kr摘要:英特尔公司网络平台事业部副总裁Alex Quach在接受采访时表示,5G已经从实验室带到了实时现场。事实上,在MWC2018现场,英特尔则直接展示了5G网络未来可以落地的场景。5G去哪儿?去年MWC现场&…

SQL Server的游标

SQL中的游标,可以用在过程或者作业中。 Declareeventidvarchar(50) Declarecur_name cursorforselect--Selectxxxxxxxx --定义游标 opencur_name --打开游标 fetchnextfromcur_name intoeventid--将name字段存到name变量中 whilefetch_status0--执行成功 begin--其他…

腾讯首席战略官詹姆斯: 从互联网信息的永久性和稀缺性看腾讯的投资逻辑

腾讯首席战略官詹姆斯•米切尔(James Mitchell)来源:腾讯大学摘要:据不完全统计,2017年腾讯在全球投资了超过100家公司。每一年,腾讯生态圈的CEO们都会聚在一起分享最前沿的行业思考。据不完全统计&#xf…