AI单挑Dota 2世界冠军:被电脑虐哭……

 

OpenAI的机器人刚刚在 Dota2 1v1 比赛中战胜了人类顶级职业玩家 Denti。以建设安全的通用人工智能为己任的 OpenAI,通过“Self-Play”的方式,从零开始训练出了这个机器人。

 

Dota2沦陷

 

  继横扫顶级的人类国际象棋大师和围棋大师后,计算机如今在风靡全球的电子游戏Dota2中战胜了世界级的职业玩家。此前未被披露的此场对决发生于Valve奖金高达2400万美元的Dota2国际邀请赛“The International”。

 

Dendi(图左)在赛前与 OpenAI 的 GregBrockman(图右)交谈

  在这场一对一的对战中,OpenAI设计的一款机器人击败了职业玩家Danylo“Dendi”Ishutin,Dendi在此前的职业生涯中已赢得累计735449.4美元的奖金。OpenAI的机器人在首场对战中用时十分钟击败了Dendi,之后Dendi在第二局对战中退出并拒绝再战第三局。

 

  Dendi

  “请放过我吧,”赛间Dendi对机器人对手这样说道。

 

  OpenAI在电子竞技领域首度击败人类顶级玩家。这比国际象棋及围棋等游戏要复杂得多。

 

  OpenAI的CTO Greg Brockman在赛前介绍称这一款机器人通过数千次的加以指导的自我对决进行训练,并称该机器人已经击败了数个Dota2的职业玩家。Brockman在博客中称:“过去几周内,我们的机器人已经战胜过包括SumaiL(世界顶级1v1选手)及Arteezy(世界顶级overall选手)等多个顶级玩家”。

 

  “自我对决”的理念是OpenAI研发的关键。这是一种AI系统学习解决极其复杂任务的有效方法:与太弱或太强的对手对战,它都无法从中学到东西,但自身反倒是有价值的对手。Brockman介绍道:“你可以看到AI从完全的随机状态一步步发展到如今的顶级水平”。

 

  AI公司惯常用电子竞技游戏来测试他们的技术,如谷歌的DeepMind攻克“星际2”,微软的AI团队今日则宣称他们在吃豆人游戏中获取高分。

 

  OpenAI并未打算就此停止征战的脚步。他们希望在明年的参与正式的五对五比赛。与此同时他们也对外发布了此机器人,所以任何人有兴趣均可与之对战。第一个击败此机器人的玩家则可获得Valve专设的赏金。

 

  我们创造了在Dota21v1比赛中能够击败世界顶尖职业选手的AI。其完全是用self-play的方式训练,没有使用模仿学习(imitation learning)或树搜索。这对构建在混乱、包含人类行为在内的复杂场景下能够完成well-defined goals的AI系统是重要一步。

 

  Dota1v1是含有隐藏信息的复杂游戏。代理需要学习计划、进攻、花招以及误导对手。选手技巧和手速(每分钟动作)的关联不那么强烈,实际上,我们的AI“手速”只是一般人类选手的水平。

 

  想要在Dota中取胜,要求选手培养出对对手的直觉,并采取相应的策略。在上述视频中,你能看到,我们的机器人已经通过完全的self-play学会了预测其他选手的动作,并在不熟悉的场景下即兴发挥,以及如何作用于选手的单位。

 

  完全通过Self-Play的方式训练,从零达到世界顶级水平

 

  OpenAI的目标是建设安全的通用人工智能。对于AI来说,Dota是一个非常理想的试验场,竞争激烈,游戏复杂。如果想在这门游戏中获得成就,就必须推进现有技术,实现技术突破。我们现在开发了一个AI,能够在Dota的1v1比赛中击败顶尖职业选手。  

 

  Dota的规则非常复杂,如果是用规则方法,那么构建出的AI一定是个蹩脚的player。所以,我们完全采用的是自我游戏(self-play)的训练方法。刚开始训练时,AI对于自己所处的世界全无认识,而只是和自己的copy比赛,这也就意味着它和它的对手永远是旗鼓相当的。它用这个方法一点点地提升,直到达到了世界上最优秀的职业运动员的水平。TheInternational(TI)是Dota的世界锦标赛,吸引了世界各地20000名观众来观看职业运动员争夺2400万奖金。在TI上,我们派出AI和其中的多位高手进行了比赛,在比赛中,AI展现出了很强的鲁棒性和技巧,许多职业选手希望能持续和我们的AI比赛,并考虑要把它当做是一种训练手段。

 


 

不过呢, 以上AI技术都是被动AI, 什么时候主动AI出现了的话, 人类就该关进动物园了 ~

 

自我意识的AI迟早将统治地球 ~~
更多访问here

转载于:https://www.cnblogs.com/gbin1/p/7380246.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/428894.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用session实现html登录页面跳转页面跳转页面跳转,js判断登录与否并确定跳转页面的方法...

这篇文章主要介绍了js判断登录与否并确定跳转页面的方法,涉及Ajax及session使用的技巧,非常具有实用价值,需要的朋友可以参考下本文实例讲述了js判断登录与否并确定跳转页面的方法。分享给大家供大家参考。具体如下:使用session存储,确定用户是否登录&am…

7-26 Windows消息队列(25 分)

7-26 Windows消息队列(25 分) 消息队列是 Windows 系统的基础。对于每个进程,系统维护一个消息队列。如果在进程中有特定事件发生,如点击鼠标、文字改变等,系统将把这个消息加到队列当中。同时,如果队列不…

Java——操作集合的工具类:Collections

Java 提供了一个操作 Set 、List 和 Map 等集合的工具类 :Collections,该工具类里提供了大量方法对集合元素进行排序、查询和修改等操作 转载于:https://www.cnblogs.com/szj-ang/p/7383027.html

鸿蒙关键技术研究,华为鸿蒙 2.0 系统主题演讲公布,详细架构 9 月 11 日揭晓

IT之家 8 月 30 日消息 华为 9 月 10 日将举行华为开发者大会 2020,华为官网表示,“我们将与您分享 HMS Core 5.0 最新进展, 揭开 HarmonyOS 和 EMUI 11 的神秘面纱。 振奋人心的新技术,深入的交流学习机会, 更灵动的想…

shell 提示符个性化设置

提示符具体含义可参考: http://billie66.github.io/TLCL/book/zh/chap14.html Ubuntu16.04个人配置如下,供以后查阅 1 function git_branch {2 branch"git branch 2>/dev/null | grep "^\*" | sed -e "s/^\*\ //""3…

如何设置鼠标滚轮html,win7如何设置鼠标滚轮

你们知道在W7中怎么设置鼠标的滚轮吗?下面是小编带来的关于win7如何设置鼠标滚轮的内容,欢迎阅读!Win7设置滚轮方法一:首先要在电脑的左下角点击开始按钮点击开始按钮以后出现上拉菜单,在菜单上面点击控制面板点击控制面板以后进入到控制面板…

湛江高考2021成绩查询,2021广东省高中学业水平考试成绩查询(入口+方式)

2021年广东高中学业水平合格性考试成绩查询查询方式:考生登录广东省教育考试服务中心的广东教育考试服务网,通过综合查询栏目页面,按相关提示即可查询考试成绩。查询入口二:“广东省教育考试院”小程序查询方式:①在“…

A. Red and Blue Beans

题意&#xff1a;红豆子和绿豆子分在不同的篮子里。问最小的最大差是能不能比给的d小。 方法&#xff1a;尽可能用更多的篮子里。 #include<iostream> using namespace std; int main() {double a,b,k;int n;cin>>n;for (int i0;i<n;i){cin>>a>>b&…

JAVA经典算法40题

【程序1】 题目&#xff1a;古典问题&#xff1a;有一对兔子&#xff0c;从出生后第3个月起每个月都生一对兔子&#xff0c;小兔子长到第四个月后每个月又生一对兔子&#xff0c;假如兔子都不死&#xff0c;问每个月的兔子总数为多少&#xff1f; 1.程序分析&#xff1a; 兔子…

中英对照 关于计算机的科技英语,《计算机专业英语》(中英文对照).pdf

《计算机专业英语》(中英文对照)计算机专业英语Computer EnglishChapter 1 The History andFuture of Computers2009.9.1Chapter 1 The History and Future of ComputersKey points:Key points:useful terms and definitions ofuseful terms and definitions ofcomputerscomput…

[php] in_array 判断问题(坑)

<?php $arr array("Linux"); if (in_array(0, $arr)) {echo "match"; } ?> 执行以上代码&#xff0c;0和字符串是可以匹配成功的。 原因是在in_array&#xff0c;如果比较的类型不匹配&#xff0c;并且第一个参数是0&#xff0c;它会返回true&…

B. The Cake Is a Lie

题意&#xff1a;从&#xff08;1&#xff0c;1&#xff09;走到他给的点&#xff0c;只能向上和向右。int cou 0;如果向上就coux;,如果向右就couy; 题解&#xff1a;最大的cou是两条直线。最小的cou是一直转弯。 注意点&#xff1a;如果x>y 先走x;反之亦反&#xff1b; #i…

学计算机应该具备什么能力,学习计算机专业该具备那些能力?

计算机专业涵盖软件工程专业&#xff0c;主要培养具有良好的科学素养&#xff0c;系统地、较好地掌握计算机科学与技术包括计算机硬件、软件与应用的基本理论、基本知识和基本技能与方法&#xff0c;能在科研部门、教育单位、企业、事业、技术和行政管理部门等单位从事计算机教…

度度熊与邪恶大魔王

链接&#xff1a;http://acm.hdu.edu.cn/showproblem.php?pid6082 Problem Description 度度熊为了拯救可爱的公主&#xff0c;于是与邪恶大魔王战斗起来。邪恶大魔王的麾下有n个怪兽&#xff0c;每个怪兽有a[i]的生命值&#xff0c;以及b[i]的防御力。度度熊一共拥有m种攻击方…

Codeforces Round #719 (A-C)

第一题题意&#xff1a;就是不能回去&#xff1a; #include<iostream> using namespace std; int main() {int t;cin>>t;while (t--){int n,ch[1001]{0};cin>>n;string str;cin>>str;bool flag true;ch[str[0]];for (int i1;i<n;i){if (str[i]!st…

html加注算法源码,200种加密算法(源码)

【实例简介】【实例截图】【核心代码】3way.cpp3way.h3wayval.datalgebra.cppalgebra.hasn.cppasn.hbase64.cppbase64.hbench.cppbench.hbfinit.cppblowfish.cppblowfish.hblum1024.datblum2048.datblum512.datblumgold.cppblumgold.hblumshub.cppblumshub.hcast.cppcast.hcast…

ibm量子计算机科学家,重磅!IBM发布全球首个独立商用量子计算机

原标题&#xff1a;【重磅】IBM发布全球首个独立商用量子计算机雷锋网消息&#xff0c;全球的科技巨头都在量子计算上投入了大量资源。值得关注的是&#xff0c;在2019 CES上&#xff0c;IBM宣布推出IBM Q System One&#xff0c;该系统是世界上首个专为科学和商业用途设计的集…

1012 数字分类 (20 分)(C语言实现)

帮同学改的代码&#xff0c;简单易懂因为他是刚开始做 的写法&#xff1a; #include <stdio.h> #define MAX 10001 int main() {int i, n;int sum1 0;int A1 0, A2 0, A3 0, A4 0;int a[MAX];scanf("%d", &n);for (i 0; i < n; i){scanf("%…

第三次个人赛题目2 【多项式输出格式】

问题 B: 此题乃神题&#xff0c;劝你别做 时间限制: 1 Sec 内存限制: 128 MB提交: 138 解决: 8[提交][状态][讨论版]题目描写叙述 声明&#xff1a;这道题没有涉及不论什么算法&#xff01;给定函数f (1) (2) * b (3) * c (4) * d (5)。 输入 输入数据有多组。 每组数据…

html5干货,干货:详解HTML5中常见的五大全局属性

HTML5中新增了“全部属性”的概念。所谓全局属性它是指可以对任何元素都可以使用的属性&#xff0c;今天为大家详细介绍三种常见的全局属性。contentEditable属性contentEditable是由微软开发。被其他浏览器反编译并投入应用的一个全局属性。它的主要功能是是否允许用户编辑元素…