AlphaGo Zero又上《Science》封面!谷歌的人工智能又干翻人类了!

全世界只有3.14 % 的人关注了

数据与算法之美


卢sir在回顾2018年的时候,发现居然遗漏了一个“知识点”——在2018年的最后一个月, AlphaGo Zero登上了世界顶级学术期刊《科学》杂志的封面。


640?wx_fmt=jpeg


Google设计了AlphaGo(围棋机器人)的事早已经家喻户晓了,都9102年了,它怎么又出现了?


说到这,卢sir就先带大伙回顾一下AlphaGo的发展历程吧。迄今为止,AlphaGo一共有四个版本:AlphaGo Fan、AlphaGo Lee、AlphaGo Master和AlphaGo Zero。


2016年,AlphaGo Fan以5比0的战绩战胜了欧洲围棋冠军樊麾后,登上了国际学术期刊《自然》的封面,成功引起了人类的注意。


640?wx_fmt=jpeg


紧接着AlphaGo Lee又以4比1的比分战胜了围棋世界冠军、职业九段棋手李世石,成为了世界上第一个战胜围棋世界冠军的人工智能机器人。


愈战愈勇的AlphaGo又以“AlphaGo Master”的身份与中日韩数十位围棋高手进行快棋对决,创造了连续60局全胜的战绩,甚至连人类排名第一的棋手柯洁也被打成3比0。


不得不说,AlphaGo的势头的确挺猛的,仅一年的时间,就战胜了大量的世界顶尖的围棋高手,甚至还引发了“机器人打败人类开始占领地球”的言论。


不过机智的卢sir早已看破其中的奥秘,“Fan、Lee和Master”看起来是人工智能,实际上却是“人工智障”。


因为它们在比赛前就会从对手的棋局里进行全方位的学习,比如说:在任意一步时,它们就会把下一步所有可能性都罗列出来,然后一步步往后推,然后选取胜率最高的方法。


说来也搞笑,谁能想到一群围棋精英会输给一个连围棋规则都不懂的机器人呢?所以说,AlphaGo只能打有准备的仗,让它临场发挥的话,可能它连我卢sir都下不赢,更别提它能“占领地球”了。


直到2017年10月19,Deepmind(谷歌下属公司)在国际学术期刊《自然》上发表的一篇研究论文中就提到了AlphaGo的全新版本——AlphaGo Zero


640?wx_fmt=jpeg

AlphaGo Zero与前三代的最大不同是,它能从空白状态学起,在无任何人类输入的条件下,它能够迅速自学围棋。


也就是说,这次AlphaGo Zero是真的自己学会了围棋规则,系统学会渐渐从输、赢以及平局里面调整参数,让自己更懂得选择那些有利于赢下比赛的走法,而不再去分析对手的特征了。


都说新官上任三把火,AlphaGo Zero仅经过了3天的训练(自学),就以100比0的绝对优势战胜了AlphaGo Lee;经过40天训练后又把AlphaGo Master给秒杀了。


高呼着“抛弃人类经验”和“自我训练”问世的AlphaGo Zero的本领当然不只是欺负“老人家”啦,它强大的reinforcement learning(强化学习的算法)可以让它轻松的掌握国际象棋、日本将棋和中国围棋,而且每项都能当世界第一

训练2个小时,AlphaZero就碾压了日本将棋世界冠军程序Elmo;

训练4个小时,AlphaZero就战胜了国际象棋世界冠军程序Stockfish。


640?wx_fmt=gif


其中,卢sir就发现了一个细节,由于AlphaGo Zero机制从“知己知彼”变成了“百战百胜”,它下棋能力也出现相应的成长式变化,而不是一味的获胜。话不多说,直接看一组数据:

AlphaGo Zero在挑战国际象棋世界冠军Stockfish时,1000场输了155场;

在挑战日本将棋世界冠军Elmo时,胜率为91.2%;

在挑战AlphaGo的前三代时,胜率仅有61%。


那为什么AlphaGo Zero不选择和人类一较高下,而是和机器人打起了内战?


因为早在AlphaGo把人类精英棋手虐一遍之后,就宣布不再参与任何人机之间的下棋比赛,典型的装完逼就跑。


其实机器人也是不忍心了,因为早在1997年5月,人类棋手就已经被机器人血虐了——超级计算机“深蓝”打败了国际象棋棋王,世界冠军卡斯帕罗夫,这件事轰动了整个世界。


640?wx_fmt=jpeg


虽然卢sir觉得AlphaGo Zero已经有了质的突变,但还是有不少人怀疑它的真实性和可行性。


直到2018年12月,AlphaGo Zero登上世界顶级学术期刊《科学》杂志封面后,《科学》杂志官方为其正名:能够解决多个复杂问题的单一算法,是创建通用机器学习系统,解决实际问题的重要一步。


AlphaGo Zero到底是凭什么用短短一年时间从“知己知彼”变成“百战百胜”的呢?


首先,AlphaGo Zero做了一个全新的定位:重在学习,而不是急于求胜。


Deepmind采用了5000个TPU(可以简单的理解为电脑的CPU),再结合深度神经网络、通用强化学习算法和通用树搜索算法来打造了一个全能棋手。


AlphaGo Zero的学习能力也是一个动态成长的过程,每次学习一种新的棋类或者游戏都会根据难易程度来展开一段自我博弈,产生的超参数再通过贝叶斯优化进行调整。


与此同时,AlphaGo Zero的“自学”过程还有一项特别重要的任务——对自身进行神经网络训练。


训练好的神经网络,可以精准地指引一个搜索算法,就是蒙特卡洛树搜索 (MCTS) ,为每一步棋选出最有利的落子位置。每下一步之前,AlphaGo Zero的搜索对象不是所有可能性,而只是最合适当下“战况”的一小部分可能性,这就大大提升了精确性和效率性。


关于神经网络的优势,Deepmind在论文中也例举了例子。


640?wx_fmt=jpeg


上图展示的是在AlphaGo Zero执白、Stockfish执黑的一局国际象棋里,经过100次、1000次……直到100万次模拟之后,AlphaZero蒙特卡洛树的内部状态。每个树状图解都展示了10个最常访问的状态。


不怕机器人会下棋,就怕机器人产生意识和情感。


其实对于AlphaGo Zero的人工智能性质,棋手们最大的感受就是:这个家伙不按套路出牌。因为AlphaGo Zero自己学习了每种棋类,所以它并不受人类现有套路的影响,产生了独特的、且富有创造力和动态的棋风。


国际象棋世界冠军卡斯帕罗夫也在《科学》上撰文表示:“AlphaGo Zero的棋风跟我一样,具备动态、开放的风格。”


卢sir:但这样并不能掩盖你战败的事实。


640?wx_fmt=png精品课程推荐:

640?wx_fmt=png

640?wx_fmt=png

选购数学科普正版读物

严选“数学思维好物”

送给孩子的益智礼物   |   办公室神器

算法工程师成长阅读   |   居家高科技

理工科男女实用型礼物精选   

640?wx_fmt=jpeg

640?wx_fmt=jpeg640?wx_fmt=jpeg

640?wx_fmt=jpeg640?wx_fmt=jpeg

----640?点击头像关注----

640?wx_fmt=png

超级数学建模

640?wx_fmt=png

数据与算法之美

640?wx_fmt=jpeg

少年数学家

640?wx_fmt=jpeg

数锐学堂

640?wx_fmt=jpeg

惊喜酱(个人号)

640?wx_fmt=jpeg

玩酷屋COOL


640?wx_fmt=gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/302146.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【译】.NET 6 Preview 4 Released

.NET 6 Preview 4 Released我们很高兴地发布 .NET 6 Preview 4。现在,我们到 .NET 6 正式发布尚有一半。现在是再次浏览.NET 6 全部内容的好时机,就像第一篇预览文章一样。许多功能处于最终形式,而其他功能也将很快发布,因为已经为…

在终端(Terminal)中用颜色显示不同类型文件

2019独角兽企业重金招聘Python工程师标准>>> 对于从Unix/Linux平台转到Mac的同学来说,“终端”是经常要使用的一个工具。不过可能有很多人已经发现了,当我们使用ls命令来显示目录内容的时候,“终端”对于目录、可执行文件等特殊类…

马斯克要干翻人工智能,“神经蕾丝”能让每个人都能当钢铁侠

全世界只有3.14 % 的人关注了数据与算法之美爱因斯坦曾说过,“在一个崇高的目标支持下,不停地工作,即使慢,也一定会获得成功。”这不2019年刚到来,“硅谷钢铁侠”马斯克就定好了“小目标”了——“给我10年时间&#x…

都 2021 年了,竟然有人搞大数据时忽略 JSON 而去研究用 C# 把 XML 转换为 XML 的技术...

在大数据项目开发过程中,ETL(Extract-Transform-Load)是必不可少。即便目前 JSON 非常流行,开发人员也有必定会有对远古系统的挑战,而 XML 格式的数据源作为经典存在浑身上下散发着浓浓 old money 的味道。因为有 Newt…

linux c中动态申请二维数组,Linux C 编程详解第五篇:二维数组

二维数组 :存储类型 数据类型 数组名[行数][列数]列数不能够省略 , 行数可以省略数组元素的引用 : 数组名[行标][列标]练习 :1.找出二维数组中的最大值, 如果有多个最大值, 找出其位置以及数值.(不要排序).#include int main(int argc, const char *argv[]){int a[3][4] {{1,2…

js与Ajax实现浮动留言板(留言写入sqlserver数据库)

XXX.aspx页面&#xff1a; <script type"text/javascript" src"JScript/jquery.js"></script> <link rel"stylesheet" type"text/css" href"FastFeedBack/panel/jquery.panel.css"/> <link rel"s…

新一代来袭︱不只是舒适,简直是享受,Google公司用的腰靠,到底有什么秘密?...

之前小木推荐“德国MINICUTE人体工学腰垫”受到了大家一致的好评和争相购买。小木为什么推荐这一款原因是&#xff1a;据统计&#xff0c;我国腰椎病患者已经突破2亿人。30~40岁人群中&#xff0c;患有颈腰椎病的占比59.1%&#xff01;而且有着越来越年轻化的趋势&#xff0c;办…

微软放弃IE浏览器 应尽快完成国产化替代

不久前&#xff0c;微软决定在2022年6月15日彻底放弃IE浏览器&#xff0c;全线改用Microsoft Edge。微软官方表示&#xff0c;"我们宣布&#xff0c;Windows 10上的Internet Explorer的未来在Microsoft Edge中&#xff0c;Internet Explorer 11桌面应用程序将于2022年6月1…

各种流行的编程风格

2019独角兽企业重金招聘Python工程师标准>>> 在过去的N年中&#xff0c;我遇到了很多使用囧然不同风格的开发者&#xff0c;下面是我所知道的一些&#xff0c;你还知道其它的吗&#xff1f; 散弹枪编程 这种编程风格是一种开发者使用非常随意的方式对待代码。“嗯&a…

linux自动跑批,在linux中添加硬盘并在系统启动时自动挂载

前言最近搞Linux时&#xff0c;当初没有考虑完善&#xff0c;只分配了10GB的空间&#xff0c;启动mongodb时直接给我报了一个错误&#xff1a;可用空间太少&#xff0c;虽说加一个参数—smallfiles就可以解决问题&#xff0c;但这治标不治本。所以我参考Adding a New Disk Driv…

没有标题,配得上这款“俄罗斯方块”

在之前的文章时&#xff0c;马斯提到数学存在一种现象叫“梯次掉队”&#xff0c;原因在于孩子的数学思维地基没有打牢。&#xff08;传送门&#xff09;提到初中孩子需要空间想象能力时&#xff0c;很多父母疑惑为何需要&#xff1f;关于这点&#xff0c;小木给大家说明下&…

linux仿真速度快吗,Linux上安装使用最快的GPU加速的终端仿真器Alacritty

这个简单的教程展示了如何通过PPA在Ubuntu 20.04, Ubuntu 20.10, Linux Mint 20中安装最快的终端模拟器Alacritty。Alacritty是一个跨平台、GPU加速的终端模拟器&#xff0c;是现有最快的终端模拟器。可以在macOS、Linux、BSD和Windows上工作。它是一款专注于简单性和性能的免费…

使用c#接入华为云-内容审核

背景内容审核&#xff08;Content Moderation&#xff09;&#xff0c;是基于图像、文本、音视频的检测技术&#xff0c;可自动检测涉黄、涉政涉暴、涉政敏感人物、图文违规等内容&#xff0c;对用户上传的图片、文字、音视频进行内容审核&#xff0c;以满足上传要求&#xff0…

第二十五章补充内容 5 不能为0的变量

// 第二十五章补充内容 5 不能为0的变量 /*#define DEBUG #include <iostream> #include <string> using namespace std; #ifndef DEBUG #define ASSCET(x) #else #define ASSCET(x)\if(!(x))\{\cout<<"错误!ASSERT("<<#x<<")宏函…

16个让你烧脑让你晕的悖论

全世界只有3.14 % 的人关注了数据与算法之美【1】我知我无知苏格拉底有句名言&#xff1a;“我只知道一件事&#xff0c;那就是我一无所知。”这个说法本身就是悖论&#xff0c;展现了自我参照的表述&#xff08;self-referential statement&#xff09;的复杂性。而这也是西方…

linux内核修改工程环境,linux2.6.33内核移植s3c2410以和交叉环境编译搭建最终修改版.pdf...

Linux2.6.33 内核移植S3C2410 以及搭建交叉编译环境(最终修改完善版本)作者&#xff1a;胡峰 整理亍2010-3-13嵌入式实验室嵌入式助理工程师 所需软件以及工具&#xff1a;wmware workstation 虚拟机 小红帽linux gimp-2.6.4-i686-setup.exe (用亍后期的logo 画面转换)另外本人…

【Paddle 经验分享】利用PaddleHub 2.x 完成文本分类训练的坑

CSDN原文链接&#xff1a;https://blog.csdn.net/kinfey/article/details/117254781基于项目选择了PaddlePaddle 作为文本分类的基础&#xff0c;经过一周多的使用终于有所进展&#xff0c;把文本分类的相关工作做了一个简单模型。首先说说PaddlePaddle , 现在做深度学习&#…

iOS-获取当前时间的年、月、日、时、分、秒

01 //获取当前时间02 NSDate *now [NSDate date];03 NSLog(”now date is: %”, now);0405 NSCalendar *calendar [NSCalendar currentCalendar];06 NSUInteger unitFlags NSYearCalendarUnit | NSMonthCalendarUnit | NSDayCalendarUnit | NSHourCalendarUn…

Python的这几个常用库,你会用吗?

目前&#xff0c;人工智能的应用日渐广泛。而作为人工智能核心的机器学习&#xff0c;是一门多领域的交叉学科&#xff0c;专门研究计算机模拟或实现人类学习行为的方法&#xff0c;以获取新的知识或技能&#xff0c;重新组织已有的知识结构使之不断改善自身的性能。简单来说&a…

c语言 随时启停程序 按钮,单片机C语言控制单按钮启停程序(高手请进)

void IR_Receive_function(){unsigned i0,k0;if (Ir_Over){EX00; EX10; //关外部中断if (DAT[0]DAT[1]&&DAT[2]!DAT[3]){switch (DAT[3]){case 0XFF: if(inbuf1[19]‘1‘)inbuf1[19]‘0‘;else inbuf1[19]‘1‘;break;case 0XFE: if(inbuf1[20]‘1‘)inbuf1[20]‘0‘;e…