AI单挑Dota 2世界冠军:被电脑虐哭……

 

OpenAI的机器人刚刚在 Dota2 1v1 比赛中战胜了人类顶级职业玩家 Denti。以建设安全的通用人工智能为己任的 OpenAI,通过“Self-Play”的方式,从零开始训练出了这个机器人。

 

Dota2沦陷

 

  继横扫顶级的人类国际象棋大师和围棋大师后,计算机如今在风靡全球的电子游戏Dota2中战胜了世界级的职业玩家。此前未被披露的此场对决发生于Valve奖金高达2400万美元的Dota2国际邀请赛“The International”。

 

Dendi(图左)在赛前与 OpenAI 的 GregBrockman(图右)交谈

  在这场一对一的对战中,OpenAI设计的一款机器人击败了职业玩家Danylo“Dendi”Ishutin,Dendi在此前的职业生涯中已赢得累计735449.4美元的奖金。OpenAI的机器人在首场对战中用时十分钟击败了Dendi,之后Dendi在第二局对战中退出并拒绝再战第三局。

 

  Dendi

  “请放过我吧,”赛间Dendi对机器人对手这样说道。

 

  OpenAI在电子竞技领域首度击败人类顶级玩家。这比国际象棋及围棋等游戏要复杂得多。

 

  OpenAI的CTO Greg Brockman在赛前介绍称这一款机器人通过数千次的加以指导的自我对决进行训练,并称该机器人已经击败了数个Dota2的职业玩家。Brockman在博客中称:“过去几周内,我们的机器人已经战胜过包括SumaiL(世界顶级1v1选手)及Arteezy(世界顶级overall选手)等多个顶级玩家”。

 

  “自我对决”的理念是OpenAI研发的关键。这是一种AI系统学习解决极其复杂任务的有效方法:与太弱或太强的对手对战,它都无法从中学到东西,但自身反倒是有价值的对手。Brockman介绍道:“你可以看到AI从完全的随机状态一步步发展到如今的顶级水平”。

 

  AI公司惯常用电子竞技游戏来测试他们的技术,如谷歌的DeepMind攻克“星际2”,微软的AI团队今日则宣称他们在吃豆人游戏中获取高分。

 

  OpenAI并未打算就此停止征战的脚步。他们希望在明年的参与正式的五对五比赛。与此同时他们也对外发布了此机器人,所以任何人有兴趣均可与之对战。第一个击败此机器人的玩家则可获得Valve专设的赏金。

 

  我们创造了在Dota21v1比赛中能够击败世界顶尖职业选手的AI。其完全是用self-play的方式训练,没有使用模仿学习(imitation learning)或树搜索。这对构建在混乱、包含人类行为在内的复杂场景下能够完成well-defined goals的AI系统是重要一步。

 

  Dota1v1是含有隐藏信息的复杂游戏。代理需要学习计划、进攻、花招以及误导对手。选手技巧和手速(每分钟动作)的关联不那么强烈,实际上,我们的AI“手速”只是一般人类选手的水平。

 

  想要在Dota中取胜,要求选手培养出对对手的直觉,并采取相应的策略。在上述视频中,你能看到,我们的机器人已经通过完全的self-play学会了预测其他选手的动作,并在不熟悉的场景下即兴发挥,以及如何作用于选手的单位。

 

  完全通过Self-Play的方式训练,从零达到世界顶级水平

 

  OpenAI的目标是建设安全的通用人工智能。对于AI来说,Dota是一个非常理想的试验场,竞争激烈,游戏复杂。如果想在这门游戏中获得成就,就必须推进现有技术,实现技术突破。我们现在开发了一个AI,能够在Dota的1v1比赛中击败顶尖职业选手。  

 

  Dota的规则非常复杂,如果是用规则方法,那么构建出的AI一定是个蹩脚的player。所以,我们完全采用的是自我游戏(self-play)的训练方法。刚开始训练时,AI对于自己所处的世界全无认识,而只是和自己的copy比赛,这也就意味着它和它的对手永远是旗鼓相当的。它用这个方法一点点地提升,直到达到了世界上最优秀的职业运动员的水平。TheInternational(TI)是Dota的世界锦标赛,吸引了世界各地20000名观众来观看职业运动员争夺2400万奖金。在TI上,我们派出AI和其中的多位高手进行了比赛,在比赛中,AI展现出了很强的鲁棒性和技巧,许多职业选手希望能持续和我们的AI比赛,并考虑要把它当做是一种训练手段。

 


 

不过呢, 以上AI技术都是被动AI, 什么时候主动AI出现了的话, 人类就该关进动物园了 ~

 

自我意识的AI迟早将统治地球 ~~
更多访问here

转载于:https://www.cnblogs.com/gbin1/p/7380246.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/428894.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙关键技术研究,华为鸿蒙 2.0 系统主题演讲公布,详细架构 9 月 11 日揭晓

IT之家 8 月 30 日消息 华为 9 月 10 日将举行华为开发者大会 2020,华为官网表示,“我们将与您分享 HMS Core 5.0 最新进展, 揭开 HarmonyOS 和 EMUI 11 的神秘面纱。 振奋人心的新技术,深入的交流学习机会, 更灵动的想…

JAVA经典算法40题

【程序1】 题目:古典问题:有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第四个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少? 1.程序分析: 兔子…

度度熊与邪恶大魔王

链接:http://acm.hdu.edu.cn/showproblem.php?pid6082 Problem Description 度度熊为了拯救可爱的公主,于是与邪恶大魔王战斗起来。邪恶大魔王的麾下有n个怪兽,每个怪兽有a[i]的生命值,以及b[i]的防御力。度度熊一共拥有m种攻击方…

html加注算法源码,200种加密算法(源码)

【实例简介】【实例截图】【核心代码】3way.cpp3way.h3wayval.datalgebra.cppalgebra.hasn.cppasn.hbase64.cppbase64.hbench.cppbench.hbfinit.cppblowfish.cppblowfish.hblum1024.datblum2048.datblum512.datblumgold.cppblumgold.hblumshub.cppblumshub.hcast.cppcast.hcast…

ibm量子计算机科学家,重磅!IBM发布全球首个独立商用量子计算机

原标题:【重磅】IBM发布全球首个独立商用量子计算机雷锋网消息,全球的科技巨头都在量子计算上投入了大量资源。值得关注的是,在2019 CES上,IBM宣布推出IBM Q System One,该系统是世界上首个专为科学和商业用途设计的集…

html5干货,干货:详解HTML5中常见的五大全局属性

HTML5中新增了“全部属性”的概念。所谓全局属性它是指可以对任何元素都可以使用的属性,今天为大家详细介绍三种常见的全局属性。contentEditable属性contentEditable是由微软开发。被其他浏览器反编译并投入应用的一个全局属性。它的主要功能是是否允许用户编辑元素…

江阳职高计算机应用教改实验,计算机应用课程教改模式

掌握基本的计算机操作技能几乎成为当前社会每位劳动者的必备知识。在此情况下,以就业为根本导向的高职院校更应当注重学生的计算机基本教学。“计算机应用基础”课程教学也要不断与与时俱进,这样在才能适应社会对人才的全新要求。本文主要就高职院校“计…

如何开发一个异常检测系统:异常检测 vs 监督学习

异常检测算法先是将一些正常的样本做为无标签样本来学习模型p(x),即评估参数,然后用学习到的模型在交叉验证集上通过F1值来选择表现最好的ε的值,然后在测试集上进行算法的评估。这儿用到了带有标签的数据,那么为什么不直接用监督学习对y1和y…

KVM--安装及初步使用

KVM是Kernel-based Virtual Machine的简称,是一个开源的虚拟化模块,今天我将在CentOS7的操作系统上安装KVM,以下是我的安装步骤. 一.环境信息 系统: CentOS 7.2 IP: 10.0.0.12/24 在虚拟机安装时,需要启用CPU的虚拟化功能 二. KVM安装步骤 1. 安装qemu-kvm和libvirt [rootkvm-…

中南大学和中山大学计算机专业哪个好,中山大学和中南大学哪个实力更强?一字之差,一起来看看吧!...

原标题:中山大学和中南大学哪个实力更强?一字之差,一起来看看吧!我国好大学有很多,但是各大学之间的实力参差不齐,就算是985也有很大区别,今天我们就谈一谈两个名字,比较相似的&…

Drozer快速使用指南

Drozer快速使用指南 1、简介: Drozer是一款用于测试android应用程序漏洞的安全评估工具,能够发现多种类型的安全的漏洞,免费版本的相关资源下载地址: https://www.mwrinfosecurity.com/products/drozer/community-edition/ 其中包…

Akka(19): Stream:组合数据流,组合共用-Graph modular composition

akka-stream的Graph是一种运算方案,它可能代表某种简单的线性数据流图如:Source/Flow/Sink,也可能是由更基础的流图组合而成相对复杂点的某种复合流图,而这个复合流图本身又可以被当作组件来组合更大的Graph。因为Graph只是对数据…

CSS-posiziton

1. 想要实现&#xff0c;”返回顶部”永远位于页面的右下角。需要用到position函数。CSS:层叠样式表。用到了分层的功能。 position:fixed; 永远固定在一个地方。 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8">&…

怎么用树莓派制作web服务器,用树莓派做web服务器,靠谱吗?

有点想入门树莓派&#xff0c;然后做一个小web服务器&#xff0c;放在学校内网。大家有做过类似的事情吗&#xff1f;做过&#xff0c;自己用做测试的话是没什么问题的&#xff0c;而且非常小巧&#xff0c;携带方便。买的时候注意还要搭配这三个配件1 可以用的无线网卡&#x…

笔记本如何与其他计算机共享,笔记本电脑怎么和手机共享文件

假如想要用手机打开电脑上大容量的视频或其他文件&#xff0c;但是手机的容量又比较小&#xff0c;该怎么办呢?这个时候&#xff0c;我们就可以在电脑上设置共享文件夹&#xff0c;然后在手机上通过局域网来查看该共享文件夹就可以解决这个问题。那么笔记本电脑怎么和手机共享…

服务器系统崩了能pe,系统崩溃了无法正常重装系统?教你用PE虚拟盘来解决!...

如果电脑系统损坏开不了机怎么办&#xff1f;安全模式啥的都进入不了怎么办&#xff1f;不用怕&#xff0c;小编教你用PE重装系统&#xff0c;十分简单哦。用PE系统镜像还原重装系统&#xff1a;工具&#xff1a;U盘(最好有8G及以上的容量&#xff0c;因为一个windows7以上的系…

群晖218 修改服务器名称,一次换群晖引发的各种事情——论如何榨干218+的价值【不完全版】...

一次换群晖引发的各种事情——论如何榨干218的价值【不完全版】2020-04-08 16:40:0117点赞100收藏29评论创作立场声明&#xff1a;期中考试爸妈送的……购买理由大概用了两年的DS115j&#xff0c;性能实在受不了(ARM的想啥呢)然后就换了个218然后特么发现x64的就是舒服&#xf…

文件服务器上传文件的过程,文件服务器上传文件实现过程【分享】

写本帖的目的是&#xff0c;论坛经常有咨询或反馈文件服务器问题。本帖准备把文件服务器整个的实现过程讲清楚。以方便相关问题的或达到问题自查的目的。1、文件服务器 其实是IIS的一个站点。前端(说的前端是Silverlight及WPF等的前端)是直接与文件服务器站点进行交互。其中&am…

linux下搭建mongodb副本集

1.搭建三台mongodb服务器 cd /usr/local mkdir mongodb tar -zxvf mongodb-linux-x86_64-2.6.7.tgz cd mongodb-linux-x86_64-2.6.7 mv * /usr/local/mongodb cd /usr/local/mongodb mkdir data touch logs cd bin ./mongod -dbpath/usr/local/mongodb/data -logpath/usr/local…

ajax轮询模拟websocket,Ajax轮询和SSE服务器推送数据与websocket模式的区别性学习

我们试想一下我们做个实时聊天的窗口有几种方法&#xff1f;在我们不刷新页面并且可以试试更新页面内容的方法 你这时候是不是想到了ajax没错确实可以Ajax轮询什么是轮询&#xff1f;顾名思义就是我轮着问你&#xff0c;规定一个时间然后我就问你 有新数据了吗&#xff1f; 有新…