DeepMind开源Psychlab平台——搭建AI和认知心理学的桥梁(附论文和代码下载)


来源:专知

概要:DeepMind近期开源了Psychlab,这是一个利用认知心理学等领域知识来研究受控环境下人工智能体(Artificial Agent)的行为,从而模拟人类的行为。


DeepMind近期开源了Psychlab,这是一个利用认知心理学等领域知识来研究受控环境下人工智能体(Artificial Agent)的行为,从而模拟人类的行为。Psychlab通过一系列典型的任务证明其人工智能体(Artificial Agent)的行为的可靠性:包括视觉搜索、连续识别、多目标搜索等任务。同时也提供了简单实用的API,使其他研究者可以在其基础上轻松构建自己的任务。DeepMind出品必出精品!我们在文末附有paper链接和代码地址,感兴趣的读者可不要错过。专知内容组编辑整理。


Open-sourcing Psychlab


考虑一下在购物的时候,如果你没有把清单上一个商品取出,这告诉我们了什么:“关于大脑此时的功能?”。这可能表示在搜索商品列表的时候,你无法将注意力从一个商品移动到另一个商品;也可能表示记住购物清单是有困难的,也可能这两者都有。



好像单一的任务取决于多种认知能力。 我们在人工智能研究中也面临类似的问题,在这种情况下,任务的复杂性往往会使一个取得成功的agent中的个体技能难以分离。 但是了解agent特定的个体技能可能对改善其整体表现有作用。

 

为了解决这个问题,心理学家花了近150年的时间来设计严格控制的实验,目的是隔离特定的认知能力。例如,他们可能会使用两个独立的测试来分析超市的场景——一个“视觉搜索”测试,需要被测者定位图案中的特定的形状,可以用来探测注意力;同时他们可能会要求受测试者回忆列表中的东西来测试他们的记忆力。

 

我们相信可以使用类似的实验方法来更好地理解人工智能体(artificial agents)的行为。 这就是我们开发Psychlab的原因,它能直接运用认知心理学等领域的方法来研究受控环境下人工智能体的行为,Psychlab是在DeepMind实验室研究基础上建立的平台。 今天,我们开放这个平台供其他人使用。

 

Psychlab对虚拟DeepMindLab环境(virtual DeepMind Lab environment)中常用的人类心理学实验的结构进行重构。这一般包括一个参与者坐在电脑显示器前,用鼠标对屏幕上的任务做出响应。类似地,我们的环境允许虚拟主体在虚拟计算机监视器上执行任务,利用它的注视方向进行响应。这允许人类和人工因素都采取相同的实验设置,最大限度地减少实验差异。 这使得它更容易与认知心理学的文献联系起来,以便从中获得思路。

 

随着Psychlab的开源版本的发布,我们构建了一系列典型实验任务,并在虚拟计算机监视器上进行测试,我们提供灵活且易于学习的API,使其他人能够很容易构建自己的任务。

 

  • 视觉搜索(Visual search)——测试搜索目标数组的能力。

  • 连续识别(Continuous recognition)——为不断增长的物品列表测试内存。

  • 任意的视觉运动测试(Arbitrary visuomotor mapping)——测试回忆的刺激,响应配对。

  • 更改检测(Change detection)——测试当数组中更改检测对象并经过短暂延迟后目标重新出现的能力。

  • 视觉敏锐度和对比敏感度(Visualacuity and contrast sensitivity)——测试识别小对比度和低对比度刺激的能力。

  • 玻璃图案检测(Glass pattern detection)——测试全局形式感知。

  • 随机点运动判别(Randomdot motion discrimination)——检测对相关运动的感知能力。

  • 多目标跟踪(Multipleobject tracking)——测试随着时间的推移能够跟踪移动对象。

 

上述任务中的每一个任务都已被验证,表明我们的实验结果反映了认知心理学文献中的标准结果。


以“视觉搜索”任务为例。 这是一种理解人类选择性注意力的方法,已经研究了在复杂的刺激阵列中定位目标的能力,如超市货架上的一个商品。



当人们搜索“在水平条块之间的垂直取向的条块”和“在其他颜色的条块之间搜索粉色条块”的任务时,其反应时间不会根据屏幕上的条块数量改变而改变。换句话说,他们的反应时间是独立的“设定值”。 然而,当任务是“搜索不同形状和不同颜色的条块中的粉色条块时”,人的反应时间随着每增加一个条块就会增加大约50ms。 当人类在Psychlab上完成这个任务时,我们重现了这个结果。

 


这张图片说明了在Psychlab的视觉搜索任务上人类和人工代理之间反应时间的差异。

 

当我们对一个最先进的人工智能体进行同样的测试时,我们发现它虽然可以执行任务,但并没有显示人类模式(human pattern)的反应时间结果。 在这三种情况下,他们用了相同的时间来应对。 在人类视角,这些数据暗示了并行和串行关注的区别。人工智能体似乎只有并行的机制。 识别这种人类与目前的人工智能体之间的差异,为我们未来设计智能体提供了思路。

 

Psychlab被设计为认知心理学、神经科学和AI之间桥接的工具。 通过开源的方式,我们希望更多研究团队能够在自己的研究中利用它,并帮助我们进一步改进。

 

Paper链接:


https://arxiv.org/abs/1801.08116


从GitHub下载代码:


https://github.com/deepmind/lab/tree/master/game_scripts/levels/contributed/psychlab


原文链接:

https://deepmind.com/blog/open-sourcing-psychlab/


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/497422.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

扩展立方体 The Scale Cube

转自: https://akfpartners.com/growth-blog/scale-cube/ 比例立方体 2018年4月25日| 发布者:Robin McGlothin Scale Cube是用于定义微服务和扩展技术产品的模型。AKF Partners于2007年发明了Scale Cube,最初于2007年在我们的博客上在线发…

人脑动态功能网络连接模式能够鉴别个体并预测其认知功能

来源:神经科技概要:近二十年来,基于静息态功能磁共振影像的人脑连接组学快速发展,为无创研究活体人脑的功能组织规律和网络运作机制提供了重要手段,大大促进了研究者对脑认知、脑发育和脑疾病神经机制的理解。近日&…

JMS之企业消息传送

企业消息传送:消息是通过网络从一个系统异步传送给其他系统的。 客户端:使用消息传送API 的一个业务应用程序或组件(如:JMS) 集中式体系结构 分散式体系结构

达沃斯群英纵论人工智能,核心观点汇总

来源:AI科技大本营概要:一年一度的世界经济论坛年会(达沃斯论坛)上,来自不同领域的精英纷纷发表了自己对于人工智能的看法。一年一度的世界经济论坛年会(达沃斯论坛)已经召开了3天,该…

Java消息服务思维导图笔记

https://www.processon.com/view/link/610b5f201efad40724bdfae2

window计算的chk在linux下可以读,Linux系统命令从入门到完全忘记(四)

系统安全相关命令chmod概要:用于改变文件或目录的访问权限,用它控制文件或目录的访问权限。语法格式:chmod [-cfvR] [–help] [–version] mode file参数:参数说明-c当发生改变时,报告处理信息-f错误信息不输出-R处理指…

三大国有银行同时入股 AI 公司第四范式

来源:新华社概要:人工智能公司第四范式于1月26日宣布完成B+轮融资,并同时宣布获得来自中国工商银行、中国银行、中国建设银行三家国有银行及所属基金的联合战略投资。人工智能公司第四范式于1月26日宣布完成B+轮融资&a…

从语言学到深度学习NLP,一文概述自然语言处理

来源:萤火虫沙龙2概要:自然语言处理(NLP)近来因为人类语言的计算表征和分析而获得越来越多的关注。自然语言处理(NLP)近来因为人类语言的计算表征和分析而获得越来越多的关注。它已经应用于许多如机器翻译、…

Guava RateLimiter限流原理解析

来源:https://zhuanlan.zhihu.com/p/60979444 限流是保护高并发系统的三把利器之一,另外两个是缓存和降级。限流在很多场景中用来限制并发和请求量,比如说秒杀抢购,保护自身系统和下游系统不被巨型流量冲垮等。 限流的目的是通过…

脑洞大开:未来二十年将兴起的88个微型产业

来源:资本实验室概要:目前,我们正在进入一个指数级技术变革的时代。这个时代既催生出前所未有的科技巨头,其实也催生了一个微型创新的新时代。目前,我们正在进入一个指数级技术变革的时代。这个时代既催生出前所未有的…

Web 服务策略断言语言 (WS-PolicyAssertions)

原文:http://www.microsoft.com/china/msdn/library/webservices/webservices/WebServicesPolicyAssertionsLanguage(WS-PolicyAssertions).mspxWeb 服务策略断言语言 (WS-PolicyAssertions) 发布日期: 4/26/2004| 更新日期: 4/26/2004版本 1…

周志华:严肃的研究者就不该去触碰强人工智能

来源:知识分子概要:关于人工智能,长期存在两种不同的目标或者理念。关于人工智能,长期存在两种不同的目标或者理念。一种是希望借鉴人类的智能行为,研制出更好的工具以减轻人类智力劳动,一般称为“弱人工智…

guava限流器RateLimiter原理及源码分析

来源:https://www.cnblogs.com/zhandouBlog/p/11743660.html 前言 RateLimiter是基于令牌桶算法实现的一个多线程限流器,它可以将请求均匀的进行处理,当然他并不是一个分布式限流器,只是对单机进行限流。它可以应用在定时拉取接…

185页深度报告 扒一扒AI金融的老底【附下载】

来源:智东西概要:2016年,中国爆出8家独角兽,总估值964亿美元位冠全球;2017年,毕马威全球百佳金融科技企业前三甲,蚂蚁金服、众安保险、趣店,皆来自中国;过往两年&#xf…

夹娃娃动画Android,手机模拟抓娃娃

手机模拟抓娃娃让你通过手机足不出户也能感受娃娃机的乐趣,萌趣的卡通形象,清新治愈的设计风格,简单上手的玩法,赶快加入进来冲击最高分吧,点击下载手机模拟抓娃娃开始你的挑战!手机模拟抓娃娃介绍手机模拟抓娃娃游戏是一款模拟进行的真人在线抓娃娃的掌上控制的休闲…

android友盟错误日志,Taro(React-native)集成友盟错误日志分析U-App移动统计

1、先去友盟官网注册应用,获取到appkey,友盟移动统计分析U-App,这个步骤就不贴出来了,需要注意的是ios和Android 不能使用同一个appkey,需要分别创建两个应用,应用名称可以在后面加上平台名称,例…

2018年中国新零售市场研究报告——概念、模式与案例【附下载】

来源:亿欧概要:“新零售” 之“新”在于顺势下的“变化”,不应该局限于“阿里巴巴的新零售”。报告尝试从一个更宽广的视角,对当前零售业变化的背景和各种驱动因素进行分析,总结当下时间段零售行业参与者的新动作&…

[导入]ASP.NET 配置节架构

ASP.NET 配置节架构文章来源:http://blog.csdn.net/21aspnet/archive/2004/11/04/167417.aspx转载于:https://www.cnblogs.com/zhaoxiaoyang2/archive/2004/11/05/816261.html

重构--思维导图

#原图 System.out.println("https://www.processon.com/view/60fa8c441e085366ea4c2b9e?fromnew1");

谷歌Jeff Dean团队提出利用深度学习对「电子健康记录」数据进行分析,可提高医疗诊断预测的准确性

原文来源:arXiv作者:Alvin Rajkomar、Eyal Oren、Kai Chen、Andrew M. Dai、Nissan Hajaj、Peter J. Liu、Xiaobing Liu, Mimi Sun、Patrik Sundberg、Hector Yee、Kun Zhang、Yi Zhang、Gavin E. Duggan、Gerardo Flores、Michaela Hardt、Jamie Irvine…