在失败中学习,MIT新研究显示,机器可以像婴儿一样学会理解人类目标

大数据文摘出品

来源:MIT

编译:周熙

在Warneken和Tomasello关于人类社会智力的经典实验中,一个18月大蹒跚学步的幼儿看着一个男人抱着一堆书走向一个未开封的柜子。当男子到达柜子时,他笨拙地将书在柜门上撞了几下,然后发出疑惑的声音。

接下来发生了一件不可思议的事情:幼儿提出要帮忙。

在推断出男子的目标后,幼儿走到柜子前,打开柜门,让男子把书放在里面。但是,幼儿的生活经验如此有限,怎么会做出这样的推断呢?

最近,计算机科学家把这个问题重新引向了计算机:机器如何做到相同的事情呢?

工程化这种理解的关键部分可以说是我们最人性化的地方:我们的错误。

就像蹒跚学步的孩子仅仅从他的失败中就能推断出这个人的目标一样,推断我们目标的机器也需要受到我们错误行动和计划的说明。

为了在机器中捕捉这种社交智能,来自麻省理工学院计算机科学与人工智能实验室(CSAIL)和大脑与认知科学系的研究人员创造了一种能够推断目标和计划的算法,即使这些计划可能失败。

这类研究最终可用于改进一系列辅助技术、协作或护理机器人,以及Siri和Alexa等数字助理。

有关这项研究的新论文主要作者,麻省理工学院电气工程和计算机科学系的博士生Tan Zhi-Xuan 说:

"这种对错误进行解释的能力对于构建能够稳健地推断并按照我们的利益行事的机器来说可能是至关重要的。否则,人工智能系统可能会错误地推断,由于我们未能实现我们的高阶目标,这些目标毕竟不是我们想要的。我们已经看到,当算法以我们对社交媒体的反射性和无计划的使用为食,将我们引向依赖和两极化的道路时,会发生什么。理想情况下,未来的算法将认识到我们的错误、坏习惯和非理性,并帮助我们避免而不是强化它们。"

为了创建他们的模型,该团队使用了麻省理工学院最近开发的一个新的AI编程平台Gen,将符号化(人类可读型)AI规划与贝叶斯推理相结合。贝叶斯推理提供了一种将不确定信念与新数据相结合的最佳方式,被广泛用于金融风险评估、诊断测试和选举预测。

该团队的模型表现比现有的一种名为贝叶斯逆向强化学习(BIRL)的基础方法快20到150倍,该方法通过观察代理的行为来学习代理的目标、价值或奖励,并试图提前计算完整的政策或计划。新模型在推断目标方面的准确率达到了75%。

加州大学伯克利分校的Smith-Zadeh工程教授Stuart Russell说:"人工智能正处于放弃'标准模式'的过程中,在这种模式下,一个固定的、已知的目标被赋予机器。相反,机器知道它不知道我们想要什么,这意味着如何从人类行为中推断目标和偏好的研究成为人工智能的核心课题。这篇论文认真对待这一目标,重点是,它的方向是朝着建立模型进而颠覆人类从目标和偏好产生行为的实际过程。"

如何实现

虽然在推断代理的目标和欲望方面已经有相当多的工作,但这些工作大多假设代理为实现其目标而采取最佳行动。

然而,团队特别受到一种常见的人类规划方式的启发,这种方式基本上是次优的:不是提前把所有的事情都规划好,而是只形成部分计划,执行后再从新规划。虽然这样做可能会因为 "提前 "思考不足而导致错误,但也减少了认知负荷。

例如,想象你正在看你的朋友准备食物,你想通过弄清他们在做什么来帮忙。你猜测你的朋友接下来可能采取的几个步骤:也许是预热烤箱,然后做苹果派的面团。然后,你只 "保留 "与朋友实际做的事情保持一致的部分计划,然后你再重复这个过程,从那里开始提前计划几步。

一旦你看到你的朋友做了面团,你就可以把可能性只限制在烘焙食品上,并猜测他们接下来可能会切苹果,或者买一些胡桃来做馅饼。最终,你会把你朋友不可能做的菜品计划全部排除,只保留可能的计划(即派的配方)。一旦你足够确定是哪道菜,你就可以主动帮忙了。

该团队的推理算法被称为 "顺序逆向计划搜索(SIPS)",按照这个顺序来推断代理人的目标,因为它在每一步都只做部分计划,并在早期削减不可能的计划。由于该模型每次只提前几步进行计划,所以它也考虑到了代理“你的朋友(前文例子)”可能也在做同样的事情。这包括由于有限的计划而导致错误的可能性,例如在打开冰箱之前没有意识到你可能需要两只手空闲。通过提前检测这些潜在的故障,该团队希望这个模型可以被机器用来更好地提供帮助。

"我们早期的一个见解是,如果你想推断某人的目标,你不需要比他们想得更远。我们意识到,这不仅可以用来加快目标推断的速度,还可以用来从过于短视而无法成功的行动中推断出预期目标,这使得我们从扩大算法规模转向探索解决当前人工智能系统更根本的局限性的方法。"麻省理工学院首席研究科学家Vikash Mansinghka如是说,他是Tan Zhi-Xuan的联合顾问之一,同时还有麻省理工学院大脑和认知科学教授Joshua Tenenbaum。"这是我们更大的moonshot的一部分,即对18个月大的幼儿感知进行逆向工程。"

这项工作的概念建立在Tenenbaum小组早期认知模型的基础上,展示了儿童甚至是10个月大的婴儿对他人目标所做的较简单的推断如何被量化建模为贝叶斯逆向规划的一种形式。

虽然到目前为止,研究人员只在固定目标集的相对较小的规划问题中探索推理,但他们计划通过未来的工作来探索人类目标和计划的更丰富的层次结构。通过对这些层次结构进行编码或学习,机器或许能够推断出更多种类的目标,以及它们所服务的深层目的。

"虽然这项工作只代表着一小步,但我希望这项研究能够为构建真正理解人类目标、计划和价值观的机器奠定一些必要的哲学和概念基础,"Xuan说。"这种将人类建模为不完美推理者的基本方法感觉非常有前途。现在,它让我们能够推断出计划什么时候是错误的,也许它最终也会让我们推断出人们什么时候持有错误的信念、假设和指导原则。"

Zhi-Xuan、Mansinghka和Tenenbaum与电气工程和计算机科学研究生Jordyn Mann和博士生Tom Silver一起撰写了这篇论文。他们将在NeurIPS 2020上在线展示他们的成果。

相关报道:

https://www.csail.mit.edu/news/building-machines-better-understand-human-goals

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485852.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

django http404 详解

【引子】 今天在看django的官方文档的时候看到get_object_or_404这个函数感觉比较奇怪。这个主要来自于它的功能,如果要查询的对象 存在那么就返回对象;如果对象不存在那么就要报404 Not Found ;但是404 Not Found并不是它的返回值&#xff0…

这一年,科学高度不断刷新

来源:科技日报●存算一体架构在手写数字集上的识别准确率达到96.19%●截至12月14日21时,“天问一号”探测器已在轨飞行144天,飞行里程约3.6亿公里,距离地球超过1亿公里●嫦娥五号经历了11个阶段、23天的在轨工作,采集了…

python天天向上的力量三天打鱼两天晒网_017 示例3-天天向上的力量-Go语言中文社区...

一、"天天向上的力量"问题分析1.1 天天向上的力量基本问题:持续的价值一年365天,每天进步1%,累计进步多少呢?(1.01^{365})一年365天,每天退步1%,累计剩下多少呢?(0.99^{365})1.2 需求…

CNS三大刊2020年年度最佳论文全部出炉!脑科学一共4篇,我国学者入选1篇!

来源: brainnews编辑部、inature编辑部来源:生物谷旗下细胞公众号,药明康德团队旗下学术经纬公众号Cell ,Nature和Science 三大期刊2020年年度最佳论文全部公布,brainnews编辑部摘选其中跟脑科学相关的文章,跟大家一起…

Leetcode--191. 位1的个数

编写一个函数,输入是一个无符号整数,返回其二进制表达式中数字位数为 ‘1’ 的个数(也被称为汉明重量)。 示例 1: 输入:00000000000000000000000000001011 输出:3 解释:输入的二进制…

redis创建像mysql表结构_Redis数据结构列表实现

双向链表linkedlistRedis实现的是标准的双向链表。链表节点定义:链表定义:总结链表实现:1.每个节点有前后节点指针,且第一个节点的指针为NULL,最后一个节点的指针为NULL(无环)。2.对双链表进行封装,链表第一个节点和最…

神经符号系统、因果推理、跨学科交互,李飞飞、Judea Pearl等16名学者共同探讨AI未来...

来源:机器之心去年,纽约大学心理学和神经科学教授 Gary Marcus 和深度学习先驱、2018 年图灵奖得主 Yoshua Bengio 就 AI 技术的发展方向展开了一场现场辩论。今年,Gary Marcus 与 Montreal.AI 负责人 Vincent Boucher 举办了第二场辩论。这次…

Leetcode--190. 颠倒二进制位

颠倒给定的 32 位无符号整数的二进制位。 示例 1: 输入: 00000010100101000001111010011100 输出: 00111001011110000010100101000000 解释: 输入的二进制串 00000010100101000001111010011100 表示无符号整数 43261596, 因此返回 964176192&…

python意外缩进引发逻辑错误_python – IndentationError:意外的缩进错误

我是Python的新手,我得到这个错误:Traceback (most recent call last):File "/usr/local/bin/scrapy", line 4, in execute()File "/opt/local/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/site-packages/scrapy/cmdline.py&qu…

数字孪生城市应用【案例集】,附下载

来源:中国信通院等数字孪生城市经过三年的概念培育期,目前已经步入落地实施阶段,各地不同程度地推进数字孪生城市规划建设和行业应用创新实践。中国信息通信研究院联合数字孪生城市生态圈合作伙伴,在推出《数字孪生城市白皮书&…

六月中旬的心得

六月一眨眼的时间就来到了中旬,时间流逝之快让我们有些措手不及,炎热的天气更是加剧了小组里每个人的焦虑,也因此有了更大的动力与决心去完成自己的工作。 自己的工作是这个游戏的前端,需要完成的任务是做出来登录等一系列的用户界…

Leetcode--461. 汉明距离

两个整数之间的汉明距离指的是这两个数字对应二进制位不同的位置的数目。 给出两个整数 x 和 y&#xff0c;计算它们之间的汉明距离。 注意&#xff1a; 0 ≤ x, y < 231. 示例: 输入: x 1, y 4 输出: 2 解释: 1 (0 0 0 1) 4 (0 1 0 0) ↑ ↑ 上面的箭…

安乐高机器人图纸_乐高机器人拼装图纸 | 手游网游页游攻略大全

发布时间&#xff1a;2015-12-26这是一个非常酷的乐高机器人,可以绘画的机器人.意大利工程师Daniele Benedettelli制造了这个乐高机器人,称其为"LEGONARDO".他的绘画动作是通过编程实现的,他将不会停止,直到你 ...标签&#xff1a;游戏资讯 八卦杂谈发布时间&#xf…

重磅!中国微纳机器人技术取得新突破,实现肿瘤的可视化精准治疗!

来源&#xff1a;机器人大讲堂科技的发展会带动相关领域共同进步&#xff0c;在科技进步越来越快的今天&#xff0c;一项技术的进步往往会同时打开好几个领域的技术难关&#xff0c;产生连锁反应&#xff0c;科技的边界也逐渐模糊&#xff0c;以新材料石墨烯的研究为例&#xf…

心得感悟

心得感悟 软件工程 新增内容 五月底到六月中旬&#xff0c;在这段时间内团队项目终于走上正轨&#xff0c;我们的项目是做一个实验室发布平台&#xff0c;但是如果单单做成一个门户网站是远远不够的&#xff0c;于是我们在传统的门户网站上增加了部分功能&#xff08;还没有实现…

Leetcode--231. 2的幂

给定一个整数&#xff0c;编写一个函数来判断它是否是 2 的幂次方。 示例 1: 输入: 1 输出: true 解释: 20 1 示例 2: 输入: 16 输出: true 解释: 24 16 示例 3: 输入: 218 输出: false 菜鸡方法&#xff1a; class Solution { public boolean isPowerOfTwo(int n)…

java字符串数组排序_在Java中对字符串数组进行排序

允许用户使用字符串数组.他们可以向数组添加字符串,从数组中删除字符串,搜索数组中的字符串,最终他们将能够对数组进行排序.分类是搞砸我的原因.我尝试过几种不同的方法.第一种方法是将数组转换为ArrayList,并使用Collections对ArrayList进行排序,ArrayList将转换回静态类数组.…

什么是本体论?

来源&#xff1a;人机与认知实验室【世界有无本体还是互为本体&#xff1f;这是两个非常有意思的问题&#xff0c;从牛顿绝对主义角度应该有&#xff0c;从爱翁相对主义应该无&#xff0c;从未来的发展看&#xff0c;应该是“变”——也许就是“易”&#xff1f;&#xff01;主…

关于激活Windows10专业版2018长期服务版

之前重装了一次系统&#xff0c;偷懒用了小白一键重装&#xff0c;装好之后显示的是Windows10专业版2018长期服务版&#xff0c;当时也没想太多就放着用了。 然后 &#xff0c;这几天一直提示 “你的windows许可证即将过期” &#xff0c;就按照网上的一些教程来但是一直出错&…

php java 通信_PHP与Java进行通信的实现方法

缘起&#xff1a;最近做了一个电商平台与网银整合的小东西&#xff0c;程序是开源的 Ecmall的&#xff0c;网银的接口也很规范&#xff0c;给出的文档很全&#xff0c;唯一的小问题是&#xff0c;网银使用的签名和验签的lib是只有java和c的&#xff0c;对java还熟悉一些&#x…