在失败中学习,MIT新研究显示,机器可以像婴儿一样学会理解人类目标

大数据文摘出品

来源:MIT

编译:周熙

在Warneken和Tomasello关于人类社会智力的经典实验中,一个18月大蹒跚学步的幼儿看着一个男人抱着一堆书走向一个未开封的柜子。当男子到达柜子时,他笨拙地将书在柜门上撞了几下,然后发出疑惑的声音。

接下来发生了一件不可思议的事情:幼儿提出要帮忙。

在推断出男子的目标后,幼儿走到柜子前,打开柜门,让男子把书放在里面。但是,幼儿的生活经验如此有限,怎么会做出这样的推断呢?

最近,计算机科学家把这个问题重新引向了计算机:机器如何做到相同的事情呢?

工程化这种理解的关键部分可以说是我们最人性化的地方:我们的错误。

就像蹒跚学步的孩子仅仅从他的失败中就能推断出这个人的目标一样,推断我们目标的机器也需要受到我们错误行动和计划的说明。

为了在机器中捕捉这种社交智能,来自麻省理工学院计算机科学与人工智能实验室(CSAIL)和大脑与认知科学系的研究人员创造了一种能够推断目标和计划的算法,即使这些计划可能失败。

这类研究最终可用于改进一系列辅助技术、协作或护理机器人,以及Siri和Alexa等数字助理。

有关这项研究的新论文主要作者,麻省理工学院电气工程和计算机科学系的博士生Tan Zhi-Xuan 说:

"这种对错误进行解释的能力对于构建能够稳健地推断并按照我们的利益行事的机器来说可能是至关重要的。否则,人工智能系统可能会错误地推断,由于我们未能实现我们的高阶目标,这些目标毕竟不是我们想要的。我们已经看到,当算法以我们对社交媒体的反射性和无计划的使用为食,将我们引向依赖和两极化的道路时,会发生什么。理想情况下,未来的算法将认识到我们的错误、坏习惯和非理性,并帮助我们避免而不是强化它们。"

为了创建他们的模型,该团队使用了麻省理工学院最近开发的一个新的AI编程平台Gen,将符号化(人类可读型)AI规划与贝叶斯推理相结合。贝叶斯推理提供了一种将不确定信念与新数据相结合的最佳方式,被广泛用于金融风险评估、诊断测试和选举预测。

该团队的模型表现比现有的一种名为贝叶斯逆向强化学习(BIRL)的基础方法快20到150倍,该方法通过观察代理的行为来学习代理的目标、价值或奖励,并试图提前计算完整的政策或计划。新模型在推断目标方面的准确率达到了75%。

加州大学伯克利分校的Smith-Zadeh工程教授Stuart Russell说:"人工智能正处于放弃'标准模式'的过程中,在这种模式下,一个固定的、已知的目标被赋予机器。相反,机器知道它不知道我们想要什么,这意味着如何从人类行为中推断目标和偏好的研究成为人工智能的核心课题。这篇论文认真对待这一目标,重点是,它的方向是朝着建立模型进而颠覆人类从目标和偏好产生行为的实际过程。"

如何实现

虽然在推断代理的目标和欲望方面已经有相当多的工作,但这些工作大多假设代理为实现其目标而采取最佳行动。

然而,团队特别受到一种常见的人类规划方式的启发,这种方式基本上是次优的:不是提前把所有的事情都规划好,而是只形成部分计划,执行后再从新规划。虽然这样做可能会因为 "提前 "思考不足而导致错误,但也减少了认知负荷。

例如,想象你正在看你的朋友准备食物,你想通过弄清他们在做什么来帮忙。你猜测你的朋友接下来可能采取的几个步骤:也许是预热烤箱,然后做苹果派的面团。然后,你只 "保留 "与朋友实际做的事情保持一致的部分计划,然后你再重复这个过程,从那里开始提前计划几步。

一旦你看到你的朋友做了面团,你就可以把可能性只限制在烘焙食品上,并猜测他们接下来可能会切苹果,或者买一些胡桃来做馅饼。最终,你会把你朋友不可能做的菜品计划全部排除,只保留可能的计划(即派的配方)。一旦你足够确定是哪道菜,你就可以主动帮忙了。

该团队的推理算法被称为 "顺序逆向计划搜索(SIPS)",按照这个顺序来推断代理人的目标,因为它在每一步都只做部分计划,并在早期削减不可能的计划。由于该模型每次只提前几步进行计划,所以它也考虑到了代理“你的朋友(前文例子)”可能也在做同样的事情。这包括由于有限的计划而导致错误的可能性,例如在打开冰箱之前没有意识到你可能需要两只手空闲。通过提前检测这些潜在的故障,该团队希望这个模型可以被机器用来更好地提供帮助。

"我们早期的一个见解是,如果你想推断某人的目标,你不需要比他们想得更远。我们意识到,这不仅可以用来加快目标推断的速度,还可以用来从过于短视而无法成功的行动中推断出预期目标,这使得我们从扩大算法规模转向探索解决当前人工智能系统更根本的局限性的方法。"麻省理工学院首席研究科学家Vikash Mansinghka如是说,他是Tan Zhi-Xuan的联合顾问之一,同时还有麻省理工学院大脑和认知科学教授Joshua Tenenbaum。"这是我们更大的moonshot的一部分,即对18个月大的幼儿感知进行逆向工程。"

这项工作的概念建立在Tenenbaum小组早期认知模型的基础上,展示了儿童甚至是10个月大的婴儿对他人目标所做的较简单的推断如何被量化建模为贝叶斯逆向规划的一种形式。

虽然到目前为止,研究人员只在固定目标集的相对较小的规划问题中探索推理,但他们计划通过未来的工作来探索人类目标和计划的更丰富的层次结构。通过对这些层次结构进行编码或学习,机器或许能够推断出更多种类的目标,以及它们所服务的深层目的。

"虽然这项工作只代表着一小步,但我希望这项研究能够为构建真正理解人类目标、计划和价值观的机器奠定一些必要的哲学和概念基础,"Xuan说。"这种将人类建模为不完美推理者的基本方法感觉非常有前途。现在,它让我们能够推断出计划什么时候是错误的,也许它最终也会让我们推断出人们什么时候持有错误的信念、假设和指导原则。"

Zhi-Xuan、Mansinghka和Tenenbaum与电气工程和计算机科学研究生Jordyn Mann和博士生Tom Silver一起撰写了这篇论文。他们将在NeurIPS 2020上在线展示他们的成果。

相关报道:

https://www.csail.mit.edu/news/building-machines-better-understand-human-goals

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485852.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

django http404 详解

【引子】 今天在看django的官方文档的时候看到get_object_or_404这个函数感觉比较奇怪。这个主要来自于它的功能,如果要查询的对象 存在那么就返回对象;如果对象不存在那么就要报404 Not Found ;但是404 Not Found并不是它的返回值&#xff0…

这一年,科学高度不断刷新

来源:科技日报●存算一体架构在手写数字集上的识别准确率达到96.19%●截至12月14日21时,“天问一号”探测器已在轨飞行144天,飞行里程约3.6亿公里,距离地球超过1亿公里●嫦娥五号经历了11个阶段、23天的在轨工作,采集了…

python天天向上的力量三天打鱼两天晒网_017 示例3-天天向上的力量-Go语言中文社区...

一、"天天向上的力量"问题分析1.1 天天向上的力量基本问题:持续的价值一年365天,每天进步1%,累计进步多少呢?(1.01^{365})一年365天,每天退步1%,累计剩下多少呢?(0.99^{365})1.2 需求…

CNS三大刊2020年年度最佳论文全部出炉!脑科学一共4篇,我国学者入选1篇!

来源: brainnews编辑部、inature编辑部来源:生物谷旗下细胞公众号,药明康德团队旗下学术经纬公众号Cell ,Nature和Science 三大期刊2020年年度最佳论文全部公布,brainnews编辑部摘选其中跟脑科学相关的文章,跟大家一起…

redis创建像mysql表结构_Redis数据结构列表实现

双向链表linkedlistRedis实现的是标准的双向链表。链表节点定义:链表定义:总结链表实现:1.每个节点有前后节点指针,且第一个节点的指针为NULL,最后一个节点的指针为NULL(无环)。2.对双链表进行封装,链表第一个节点和最…

神经符号系统、因果推理、跨学科交互,李飞飞、Judea Pearl等16名学者共同探讨AI未来...

来源:机器之心去年,纽约大学心理学和神经科学教授 Gary Marcus 和深度学习先驱、2018 年图灵奖得主 Yoshua Bengio 就 AI 技术的发展方向展开了一场现场辩论。今年,Gary Marcus 与 Montreal.AI 负责人 Vincent Boucher 举办了第二场辩论。这次…

数字孪生城市应用【案例集】,附下载

来源:中国信通院等数字孪生城市经过三年的概念培育期,目前已经步入落地实施阶段,各地不同程度地推进数字孪生城市规划建设和行业应用创新实践。中国信息通信研究院联合数字孪生城市生态圈合作伙伴,在推出《数字孪生城市白皮书&…

安乐高机器人图纸_乐高机器人拼装图纸 | 手游网游页游攻略大全

发布时间:2015-12-26这是一个非常酷的乐高机器人,可以绘画的机器人.意大利工程师Daniele Benedettelli制造了这个乐高机器人,称其为"LEGONARDO".他的绘画动作是通过编程实现的,他将不会停止,直到你 ...标签:游戏资讯 八卦杂谈发布时间&#xf…

重磅!中国微纳机器人技术取得新突破,实现肿瘤的可视化精准治疗!

来源:机器人大讲堂科技的发展会带动相关领域共同进步,在科技进步越来越快的今天,一项技术的进步往往会同时打开好几个领域的技术难关,产生连锁反应,科技的边界也逐渐模糊,以新材料石墨烯的研究为例&#xf…

什么是本体论?

来源:人机与认知实验室【世界有无本体还是互为本体?这是两个非常有意思的问题,从牛顿绝对主义角度应该有,从爱翁相对主义应该无,从未来的发展看,应该是“变”——也许就是“易”?!主…

亚马逊首席技术官预测2021年将改变世界的八大技术趋势

来源:世界科技研究与发展2020年12月17日,亚马逊全球副总裁、首席技术官维尔纳•沃格尔(Werner Vogels)博士在亚马逊re:Invent全球大会上发表压轴演讲,分享了他对2021年科技趋势的预测。回顾2020年,Werner表…

《城市大脑全球标准研究报告2020》摘要内容

‍‍前言:《城市大脑全球标准研究报告2020》12月23在京正式发布,有近70位专家、领导和媒体记者出席了发布会,会后包括新华社、工人日报、中新社、科技日报、中国科学报、中国社会科学报、中国建设报、经济日报、中国经营报、经济观察报&#…

EasyExcel中处理内容占多个单元格

在一些业务需求中内容需要占用多个单元格的情况,如下图: 或者是这样 这样 总有一些奇怪怪的需求。 不过使用EasyExcel可以轻松处理这些变态的需求。EasyExcel中提供了ContentLoopMerge 注解就是为了处理这种问题的。下面先看看如何使用ContentLoopMe…

2021十大科技趋势来了!阿里巴巴达摩院全新发布

来源: 阿里技术阿里巴巴达摩院发布2021十大科技趋势,这是达摩院成立三年以来第三次发布年度科技趋势。2020年是不平凡的一年,经历疫情的洗礼,许多行业重启向上而生的螺旋,但疫情并未阻挡科技前进的脚步,量子…

从GPT-3到DETR,一起来盘点2020有哪些突破?

来源:深度学习技术前沿2020年是巨大飞跃的一年。从OpenAI的GPT-3,再到AlphaFold,都是令人振奋的成就。与此同时,数据科学在机器学习、自然语言处理(NLP)、计算机视觉等领域中蓬勃发展。一起来逐一盘点2020的…

我国5G基站达71.8万个,助力人工智能发展!

来源:新华社2020中国人工智能高峰论坛暨中国人工智能大赛成果发布会23日在厦门举办。论坛上,中国工业和信息化部副部长刘烈宏介绍,截至今年11月,我国累计建成5G基站71.8万个,为人工智能海量数据的成长和传输提供了坚实…

《自然》预测2021年值得关注的科学事件

来源:世界科技研究与发展作者:黄小容2020年12月22日,Nature官网发布了对2021年最值得关注科学事件的预测。1 气候变化问题卷土重来

重磅!基金委发布科研不端行为调查处理办法

编辑 ∑Gemini来源:国家自然科学基金委关于印发《国家自然科学基金项目科研不端行为调查处理办法》的通知国科金发诚〔2020〕96号各局(室)、科学部,机关党委,各直属单位:《国家自然科学基金项目科研不端行为…

不能编程、烧钱、没用?潘建伟直播回应“九章”量子计算争议

来源:腾讯科技在200秒时间内,76个光子穿过中国科学技术大学潘建伟团队精心构筑的光学网络,完成了5000万个样本的高斯玻色采样。而同样一道数学题交给世界上最顶尖 的超级计算机“富岳”,需要6亿年,差距超过了百万亿&a…

2021年,神经科学AI有这几大趋势

来源:The Next Web作者:Tristan Greene编译:科技行者新的一年正向我们招手。延续优良的革命传统,又到了发布最新一期AI专家预测报告的时候。各位受访专家将结合自己的所感所知、实验室发现以及企业动态为我们预测新一年中人工智能…