玩电子游戏的神经网络,告诉我们大脑是如何决策的

来源:混沌巡洋舰

当你开车的时候,你的大脑会接收大量的视觉信息,并用它来做出驾驶的决定,比如什么时候刹车或者换车道。大脑需要决定在你的视野中哪些信息是做出这些决定所必需的。例如,另一辆车的位置是非常重要的,但是天空中的云彩或者那辆车的颜色并不会对你的驾驶方式产生影响。

这是在复杂的自然环境中做决定的日常例子。在面临大量感官数据和需要迅速做出决定的情况下,大脑会做什么?为了研究这个和相关的问题,研究人员可以使用我们日常生活中的模拟进行实验: 电子游戏。

加利福尼亚理工学院的一项新研究将玩Atari经典游戏的人脑扫描图像与玩相同游戏的复杂人工智能(AI)网络进行了对比。研究人员将受过训练的人工智能的行为与人类的行为进行了比较,发现人工智能中人工“神经元”的活动与人类大脑的活动十分相似。这意味着,人工智能代理可能以类似于人类大脑的方式进行类似的决策,使其成为一个很好的模型,研究人类大脑如何将高维视觉输入映射到复杂环境中的行动与决策中。

这项研究是在心理学教授 John o’ doherty 的实验室里进行的。一篇描述这项研究的论文发表在12月15日的《Neuron》杂志上。这篇论文的题目是“使用深强化学习来揭示大脑如何在高维环境中编码抽象的状态空间表征”

“人工智能和神经科学之间的互动是双向的,” o’ doherty 说。“如果我们能够发现人工智能算法与大脑有多么相似,这将帮助我们更好地理解大脑是如何解决这类难题的。相反的,如果我们能够理解大脑为什么以及如何比人工智能更有效地解决这些问题,这可能有助于指导未来更智能、更像人工智能算法的发展。”

在决策神经科学领域,许多研究使用简单的任务来检验人类是如何做决定的。例如,一个研究参与者可能被要求玩两个有不同奖金的老虎机。在实验过程中,参与者将了解哪种老虎机赚的钱更多,并相应地调整自己的行为。解决这些任务的一般学习框架被称为强化学习框架,因为决策带来的奖励结果强化了行为。

然而,强化学习框架本身并不能充分描述在更大和更复杂的任务中的决策。2015年,谷歌(Google)旗下的人工智能公司 DeepMind 开发了一种复杂的人工智能算法,称为“深度 Q网络”(Deep q Network,DQN) ,它可以学会玩几十款Atari视频游戏,达到人类或超人级的水平。

深度Q网络用于Arari游戏的示意图

该技术结合了经典的强化学习框架和最近的另一个新进展-卷积神经网络。卷积神经网络作为一个感知系统,学会在 Atari 像素空间(游戏屏幕)中检测视觉特征,这些特征可以预测奖励(得分)。这使 DQN 能够通过观察游戏中的像素来了解在给定的情况下应该采取哪些动作。重要的是,游戏规则并没有编入 DQN 代理程序; 它必须自己学习如何通过尝试和错误进行游戏,因为当代理程序得分(以及导致得分的行动)时,正确的决定会得到积极的加强。

在这项研究中,DQN 被训练玩 Atari 公司的视频游戏 Pong、 Space Invaders 和 Enduro (一款赛车游戏) ,然后它的人工神经元被用于预测行为和大脑活动,这些行为和大脑活动来自玩游戏的人类参与者的功能性磁共振成像脑部扫描进行对比。研究人员发现,大脑中涉及知觉和视觉的两个区域---- 背测视觉通路(dorsal visual pathway)和后顶叶皮层(posterior parietal cortex)的大脑活动可以用 DQN 特征来模拟。

从人脑神经编码模型分析的可视化过程。

在所有的游戏中,DQN 必须学会如何像人一样从大量的视觉输入中挑选出相关的特征。它必须将相关信息形式化的放置在状态空间中,这是一种紧凑地表示当前游戏状态中正在发生事情的方式。例如,在 Pong 中,研究人员发现 DQN 代码中的状态空间代表了球和球拍的空间位置; 它忽略了一些特征,比如背景的颜色和屏幕顶部的游戏分数。这非常类似于人类大脑在背测视觉通路中表征游戏的方式,背测视觉通路是大脑的一部分,负责识别空间中物体的位置,以引导与这些物体相关的动作。

在分布式感觉运动神经网络中,DQN 的隐层与人脑活动有惊人的相似之处,它贯穿整个背侧视觉通路,延伸至后顶叶皮层。神经状态空间表征产生于从像素空间到知觉到行动和奖励的非线性转换。在这些转换中,去除与任务无关的感官特征的信息,以反映相关的高层次特征。该研究结果揭示了在现实世界情境中任务表征的神经编码。

例如:在塞车游戏中,玩家开车越快越好,并尽量避开其他车辆。在驱车的过程中,天空从白天变成了黑夜。玩游戏的人很容易忽略这些参数,因为它们与实际游戏无关,就像我们开车时学会忽略天空中的云一样。但是,人工智能网络必须认识到,天空颜色的变化对驾驶没有影响。

研究人员发现,DQN 会忽略这些不相关的视觉特征的特征,这更好地解释了玩游戏的志愿者后顶叶皮层的大脑活动模式。后顶叶皮层是大脑中连接知觉和运动动作的部分。在太空入侵者中这个游戏中也发现了类似的现象。

虽然研究人员已经发现了 DQN 和人类大脑之间的相似之处,但两者并不完全相同。

“为了学会玩这些游戏,DQN 需要连续玩上几天,但是人类可以在几分钟内学会,”本文作者克罗斯说。“为什么人类的大脑在驾驶汽车时很容易找出相关的特征,而人工智能却很难找到?回答这个问题对人工智能研究人员来说是一个巨大的挑战。这对人工智能来说很难,由于随着背景颜色的改变,它的视觉输入会发生巨大的变化。因为神经网络只是在像素空间中“看到”数字。DQN 需要经过大量的训练,才能了解在像素空间中有显著差异的两种情况实际上在概念上是相似的,即你应该做什么。”

另一方面,克罗斯补充说,人类的大脑在整个发育过程中都在学习为日常工作挑选最重要的信息。“特别是我们感兴趣的主要区域——背测视觉通路,能够快速地独立于物体的颜色来定位物体,”他说。“此外,大脑以某种方式编码物理学的常识概念和物体典型运动方式,这使得人类能够在很少训练的情况下很好地完成各种各样的任务。所有这些都必须由 DQN 从头学习。”

近年来,其他研究已经发现了大脑和深层神经网络之间的相似性,但这些研究大多集中在物体识别,而不是主动决策。这项研究为研究复杂决策任务中的行为和大脑活动提供了一个新的框架,这个框架可能比以前在该领域使用的任务更能代表日常生活。

编译自:

https://www.pasadenanow.com/main/new-caltech-study-neural-networks-playing-video-games-teach-us-about-our-own-brains/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/485676.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2021年的第一盆冷水:有人说别太把图神经网络当回事儿

来源:数学中国图神经网络(GNN)是机器学习中最热门的领域之一,在过去短短数月内就有多篇优秀的综述论文。但数据科学家 Matt Ranger 对 GNN 却并不感冒。他认为这方面的研究会取得进展,但其他研究方向或许更重要。博客链…

JSP页面元素,内置对象及request详解

JSP的页面元素&#xff1a; a. 脚本Scriptlet 1.<% 局部变量&#xff0c;Java语句 %> 2.<%! 全局变量&#xff0c;定义方法 %> 3.<% 输出表达式 %> 一般而言&#xff0c;修改web.xml&#xff0c;配置文件&#xff0c;Java&#xff0c;需要重启tomcat服务&am…

美国科学院报告《无止境的前沿:科学的未来75年》

来源&#xff1a;科技咨询频道作者&#xff1a;刘昊 张志强 曹玲静编译&#xff1a;刘昊 张志强 曹玲静 &#xff08;中国科学院成都文献情报中心&#xff09;2020年12月17日&#xff0c;美国国家科学院出版报告《无止境的前沿——科学的未来75年》&#xff08;The Endless Fro…

jsp内置对象--response

response&#xff1a;响应对象 提供的方法&#xff1a;void addcookie(Cookie cookie);服务端向客户端增加一个cookie对象 void sendRedirect(String location) throws IOException:页面跳转的一种方式&#xff08;重定向&#xff09; void setContetType(String type) :设置…

AR增强现实技术解读

来源&#xff1a;网络 AR增强现实&#xff0c;是用户对现实世界感知的新技术。一般认为&#xff0c;AR技术的出现源于虚拟现实技术&#xff08;Virtual Reality&#xff0c;简称VR&#xff09;的发展&#xff0c;但二者存在明显的差别。传统VR技术给予用户一种在虚拟世界中完全…

人工智能十年回顾:CNN、AlphaGo、GAN……它们曾这样改变世界

来源&#xff1a;机器学习研究组订阅号过去十年间&#xff0c;人工智能技术突飞猛进&#xff0c;最疯狂的科幻小说场景现在已经成为我们生活中不可或缺的一部分。十年前&#xff0c;人们在谈论 AI 的理论化和实验&#xff0c;但这些年来&#xff0c;AI 变得更加切实了&#xff…

jsp--cookie

cookie&#xff08;客户端&#xff0c;不是内置对象&#xff09;:Cookies是服务端生成的&#xff0c;再发送给客户端保存 相当于本地缓存的作用&#xff1a; 客户端->服务端 eg&#xff1a;看一个电影&#xff0c;服务端产生发给客户端&#xff0c;第二次看就快了 作用&a…

Python学习笔记——GIF倒放处理

自动读取指定路径下所有gif格式的文件&#xff0c;利用Python图像处理库PIL下的Image、ImageSequence模块&#xff0c;批量实现gif倒放处理并保存。代码如下&#xff1a;# encoding: utf-8 import os import sys from PIL import Image, ImageSequencepath sys.path[0] …

OpenAI发布新人工智能系统:根据文字生成图像

来源&#xff1a;新浪科技据报道&#xff0c;旧金山人工智能研究公司OpenAI已经开发了一种新系统&#xff0c;能根据短文本来生成图像。OpenAI在官方博客中表示&#xff0c;这个新系统名为DALL-E&#xff0c;名称来源于艺术家萨尔瓦多达利&#xff08;Salvador Dali&#xff09…

jsp内置对象--session

session&#xff08;服务端&#xff09; session&#xff1a;会话 1. 浏览网站&#xff1a;开始->关闭 2. 购物&#xff1a;浏览&#xff0c;结算&#xff0c;付款&#xff0c;退出 3. 电子邮件&#xff1a; 浏览&#xff0c;写邮件&#xff0c;退出 以上都是session的…

python深拷贝实现原理,js递归实现深拷贝

经过小编之前关于JavaScript深拷贝实现方式的介绍&#xff0c;大家已经知道深拷贝能够实现真正意义上的数组和对象的拷贝。其实使用内置对象JSON虽然简答&#xff0c;但不能将对对象的方法深拷贝&#xff0c;因此使用递归的方式就是最实用的&#xff0c;本文介绍使用递归的方式…

梅宏院士:操作系统变迁有20年周期律,泛在计算是一片新蓝海

梅宏来源&#xff1a;观察者网作者&#xff1a;梅宏院士中国科学院院士、发展中国家科学院院士、欧洲科学院外籍院士、IEEE FELLOW&#xff0c;中国计算机学会理事长&#xff0c;北京大学信息技术高等研究院智能软件技术与应用研究中心首席科学家。信息技术发展正在进入人机物融…

IEEE CS:2021年的12大技术趋势

来源&#xff1a;笑看国际风云LOS ALAMITOS, Calif., 16 December 2020 – IEEE计算机协会&#xff08;IEEE CS&#xff09;公布了其2021技术预测报告&#xff08;2021 Technology Predictions&#xff09;&#xff0c;重点关注大流行对人类生活&#xff0c;供应链&#xff0c;…

jsp内置对象--application

appliation 全局对象 String getContextPath()&#xff1a;虚拟路径 String getRealPath(虚拟路径)&#xff1a;绝对路径&#xff08;虚拟路径 相对的绝对路径&#xff09;

D1 模拟赛

T1 note 数组开小 菜的真实 60分 题目大意&#xff1a; 一个字符串 分成若干段 使每段内都没有重复的字符 求最少的段数 思路&#xff1a; 可以贪心 1 #include<iostream>2 #include<cstdio>3 #include<cmath>4 #include<cstdlib>5 #include<cstrin…

模仿人脑视觉处理,助力神经网络应对对抗性样本

来源&#xff1a;混沌巡洋舰自从深度学习只能识别支票和信封上的手写字母以来&#xff0c;它已经取得了长足的进步。今天&#xff0c;深度神经网络已经成为许多计算机视觉应用的关键组成部分&#xff0c;从照片和视频编辑器到医疗软件和自动驾驶汽车。神经网络大致模仿了大脑的…

电子很可能具有意识

© Olhar Digital来源&#xff1a;利维坦文&#xff1a;Tam Hunt译&#xff1a;猫大郎校对&#xff1a;兔子的凌波微步2020年5月&#xff0c;“宇宙有意识吗&#xff1f;”作为标题出现在《新科学人》&#xff08;New Scientist&#xff09;周刊的一期封面上。德国慕尼黑数…

JDBC--Java Database Connectivity

1.JDBC:Java DataBase Connectivity 可以为多种关系型数据库DBMS 提供统一的访问方式&#xff0c;用Java来操作数据库 2.JDBC API 主要功能&#xff1a; 三件事&#xff0c;具体是通过以下类/接口实现&#xff1a; DriverManager &#xff1a; 管理jdbc驱动 Connection&#x…

数字孪生:连结现实与数字世界

作者&#xff1a;德勤洞察来源&#xff1a;《软件与集成电路》2020年第5期试想一下&#xff0c;你拥有一个现实世界的完美数字副本&#xff1a;数字孪生。它可以帮助你开展虚拟协作&#xff0c;快速获取传感器数据并模拟条件&#xff0c;清楚地了解假设情景&#xff0c;更能精准…

微软和谷歌的人工智能,在SuperGLUE基准测试中超越了人类

大数据文摘出品来源&#xff1a;venturebeat编译&#xff1a;千雪2019年底&#xff0c;Facebook、纽约大学、华盛顿大学和DeepMind的研究人员联合提出了SuperGLUE&#xff0c;这是人工智能的一个新基准&#xff0c;旨在总结多种语言任务的研究进展。基于一年前推出的GLUE基准&a…