DeepMind发布《星际争霸 II》深度学习环境

来源:AI 研习社

概要:上个月,DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE(《星际争霸II 》学习环境)。


StarCraft II: A New Challenge for Reinforcement Learning

星际争霸 II:增强学习的新挑战


上个月,DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE(《星际争霸II 》学习环境)。


论文描述《星际争霸II 》行动和奖励规范,并提供一个开源的Python界面,用于与游戏引擎进行通信。暴雪提供游戏输入输出的API,DeepMind又做了层基于Python的封装。


除了主要的游戏地图,他们提供了一套专注于《星际争霸II 》游戏不同元素的迷你游戏。对于主要的游戏地图,还提供了一个伴随专业玩家的游戏重播数据数据集。从该数据训练的神经网络的初始基线结果,预测游戏结果和玩家行为。



文中使用了被称为Blizzard分数的一个中间分数,这个分数包含了一个对当前资源、等级以及单位和建筑的加权和,如果玩家赢得战斗而且管理好资源,这个分数就会单调增加,失败的时候,这个分数就会减少。此外,系统还使用了一系列的特征层为AI编码相关信息,比如地形高度、相机位置、屏幕中单位的血量以及各种其他信息。


最后,提出了应用于《星际争霸II 》的规范深强化学习的初始基线结果。DeepMind之后也会发布上百万帧的选手游戏记录,这对模拟环境研究也会有很大的帮助。


class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7666666666666666" data-w="848" scrolling="no" data-src="http://v.qq.com/iframe/player.html?vid=p0552u5kaxq&width=670&height=376.875&auto=0" style="display: block; width: 670px !important; height: 376.875px !important;" width="670" height="376.875" data-vh="376.875" data-vw="670" src="http://v.qq.com/iframe/player.html?vid=p0552u5kaxq&width=670&height=376.875&auto=0"/>

 观看论文解读大概需要  6  分钟

学霸们还请自行阅读论文以获得更多细节

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498666.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国首篇Science机器人子刊!北航软体机器人实验室四年成果登上封面长篇

来源:北航新闻网、机器人大讲堂概要:通过这三项关键技术,我们成功实现了机器人样机能够像真正的䲟鱼一样牢牢吸附在物体表面,并且通过内部鳍片的主动抬起运动显著增大摩擦力。重磅惊喜,北京时间9月21日,国际…

java 控制台输入字符串_Java控制台输入字符串及字符串比较

需求描述:茵茵很喜欢研究车牌号码,从车牌号码上可以看出号码注册的早晚,据研究发现,车牌号码是按字典序发放的,现在她收集了很多车牌号码,请你设计程序帮她判断注册较早的号码。车牌号码由5个字母或数字组成…

DARPA:我们需要一种新型的芯片技术来确保人工智能的长足发展

原文作者:Dom Galeon译者:李凌概要:专家们普遍认为在21世纪20年代摩尔定律将黯然失色。同时,人工智能正在接受的测试要求他们有更强大的处理能力——接近于人脑的处理能力。简介上周三,美国国防部高级研究计划局&#…

前沿|揭开黑箱:希伯来大学计算机科学教授提出「信息瓶颈」

来源:全球人工智能概要:像大脑一样,深度神经网络也有很多层神经元。当神经元被激活时,它会发出信号,连接上面一层的神经元。如今「深度神经网络」已经学会对话、驾驶汽车、打视频游戏、玩围棋、绘画并辅助科研&#xf…

华为与英特尔开展5G互操作性测试

来源:华为概要:C-Band被认为是首批全球协同频谱之一,将提供5G的基础覆盖和带宽,是5G最主要的频段,也是全球最可能首商用的频段之一。华为与英特尔宣布启动基于3GPP标准的5G新空口互操作性测试(IODT&#xf…

java手机网站开发工具_制作网站常用的网页开发工具有哪些

我们要想制作好网站其实是离不开网站代码的HTML,我们在制作网站的时候是需要用到一些常用的网页开发工具,才能完成我们网页的编写,那么,你知道制作网站常用的网页开发工具有哪些吗?不清楚的话,下面小编和你说一说吧!一…

Natural 自然语言处理(NLP)「全解析」

原文来源: 机器人圈概要:在自然语言处理方面的研究已经延续了五十多年,而随着计算机的兴起,它的发展也早已超出了语言学的范畴。提起AI,你可能会不假思索的想到自然语言处理、人脸识别、无人驾驶等。那么,你…

大脑神经细胞也有老熟人

来源:科学网概要:观察者在没注意到熟悉的画面时,相应的神经元也会发射。但神经反应的强度和时间上与看到时的有明显差异。当人们看到认识的人图片时,比如著名的网球运动员Roger Federer或女演员Halle Berry,特定的细胞…

从生成对抗网络到更自动化的人工智能

来源:中国计算机协会作者:黄鹤 王长虎概要:“What I cannot create, I do not understand.” 这是著名物理学家费曼的一句名言。把这句话放在人工智能领域,可以理解为:要想让机器真正理解某样东西,就得让…

百度人工智能

来源:199IT互联网数据中心概要:人工智能的发展运用到生活的各个方面。

java9 揭秘 jlink_初试Java9

原标题:初试Java9Java 9 正式发布了JDK 9(http://openjdk.java.net/projects/jdk9/)有不少重要或是有意思的新特性,这里简单介绍下我的了解与尝试抛砖引玉下载oracle 官网下载即可。(http://www.oracle.com/technetwork/java/javase/downloads/jdk9-down…

前沿报告|AI系列报告之:智能计算芯片

来源:中国电子技术化标准研究院 概要:人工智能时代的到来,智能计算芯片需求旺盛颇具投资价值

java编译命令带参数_java编译命令基础知识点

我们在对计算机下达指令时,人类的语言它是不能够明白,需要通过编译的时候翻译成计算机能听懂的语言。编译过程中会调用javac命令,这点大家可能接触的不多,毕竟是是计算机程序内部运行时的操作。下面我们就编译的概念、命令带来讲解…

一文读懂工业物联网 全面起底核心玩家和技术体系

来源:智东西概要:未来10年内,全球物联网将创造10多万亿美元的价值,约占全球经济的1/10,并与城市管理、生产制造、汽车驾驶、能源环保等形成数个千亿级规模以上的细分市场。物联网进入与传统产业深度融合发展的崭新阶段…

java 枚举可以循环吗_(转载)java 枚举 循环遍历以及一些简单常见的使用

本文转载自:http://blog.csdn.net/qq_27093465/article/details/51706076 作者:李学凯什么时候想用枚举类型:有时候,在设计一个java model对象的时候,你需要一些具体的常量字符串之类的东西,这个东西又没必…

【免费获取】80+页PPT全方位解读半导体行业

来源:新材料在线概要:全方位解读半导体行业

java的构造特点_JAVA学习第八课(构造函数及其特点)

构造函数:构造函数,就是在构建 创造对象 时所调用的函数,作用就是给对象进行初始化特点:1.函数名和类名相同2.不需要定义返回值类型3.没有具体的返回值作用:给对象进行初始化注意:1.默认构造函数的特点2.多…

深度学习处在大爆炸时代的边缘

原作者:Alex Hickey译者:宋榕概要:人工智能(AI)、机器学习和深度学习的早期应用有望在短期和长期内分别取得的创造性和生产性效益。因此多数服务提供商正在逐步加大在深度学习上的投资。据Gartner咨询公司报道&#xf…

AI在行动:改变科学界的人工智能

来源:世界科学概要:社交媒体拥有数以亿计的用户,他们每年发布数以千亿计的微博和帖子,这将社会科学推向了大数据时代。人工智能“知道”星系应该是什么样的,它把一张模糊的图像(左)变成了一张清…

java web js加版本号_[Java教程]js 比较版本号(一)

[Java教程]js 比较版本号(一)0 2016-07-03 15:00:13最近群了有人问如何比较版本号,我好奇的试了一下。比较版本号,怎么办?懒人的方法是借鉴,先查网上的资料,看看有木有直接的帮过来的。而且直接便捷的好像在茫茫"…