AI与人类围棋士的差距到底有多大?

来源:计算广告

四年前,谷歌旗下DeepMind公司开发的围棋人工智能AlphaGo以4-1战胜韩国大国手李世乭九段。

今天,AlphaGo在大众视野中掀起的惊涛骇浪已渐平息,AlphaGo和李世乭都已从江湖退隐。

然而,围棋界因AlphaGo而起的沧桑巨变仍在进行时。

那么,人工智能与人类棋士的差距究竟有多大呢?

柯洁当年的豪言“AlphaGo能赢李世乭,但赢不了我”又是否可信呢?

1

棋力的量化标准

自李世乭、柯洁先后不敌AlphaGo之后,人类棋士被AlphaGo超越已成共识。

不过,AlphaGo,以及其他围棋AI具体比人类棋士强多少,仍是众说纷纭。

实际上,AlphaGo的开发团队,在《自然》期刊介绍AlphaGo Zero的论文《无需人类知识的围棋大师》(“Mastering the Game of Go without Human Knowledge”)中已给出了一个量化标准。

论文中采用的量化标准基于Elo等级分系统。

Elo等级分是美国物理学家阿尔帕德·埃洛(Arpad I. Elo)在1960年发明的,最初用于量化国际象棋棋士实力。

Elo等级分基于统计学评估棋士实力。

首先,Elo赋予新参与等级分体系的棋手初始等级分。

以中国围棋职业棋手等级分为例,1995年颁布时,以当时的职业段位确定初始分。

具体标准为:九段2560分、八段2520分、七段2480分、六段2440分、五段2400分、四段2360分、三段2320分、二段2280分、初段2240分。

聂卫平、马晓春两位九段因成绩特别突出,被赋予2600分的初始分,同列榜首。

然后,Elo假设棋士的实力遵从增长分布(Logistic Distribution)。

基于这项假设,棋士之间的期望胜率可以被计算。

而在棋士每赢或输一盘棋之后,其实际胜率会偏离此前的理论计算,因此需要按照公式调整棋手的等级分。

Figure1增长分布

若有A、B两位棋手,他们的分数分别是,那么根据增长分布假设可以推算,棋手A对棋手B的胜率期望值是:

.

例如,若当前棋手A等级分是3613分,棋手B等级分是3573分,那么按照上述公式,理论上棋手A对战棋手B的胜率是55.73%,计算过程如下。

等级分差距与期望胜率的对应关系见下表:


现在A和B下了一盘棋,之后B获胜,那么系统自然需要调高B的等级分,而调低A的等级分,具体按照以下公式:

其中是棋手A调整后的分数,是棋手A的调整前分数,在这个例子里是3613分。

K是一个控制等级分变化率的常数,通常级别越高的比赛,K值越大。

这里我们取围棋比赛里常见的K=16.表示棋局结果,棋手A胜、平、负,则分别取1,0.5,0.这盘棋A输掉,所以,是A本局的期望胜率,之前我们已经计算过了,本局的是0.5573.根据公式,我们可以求出棋手A输棋以后的调整分数。

也就是说,棋手A输给B之后的新等级分是3604.08分,失去了8.92分。

相应地,棋手B得到了8.92分,其新等级分是3581.92分。

根据上述公式,棋手赢一盘棋获得的分数并不总是一样。

若棋手A的当前等级分远高于棋手B,那么A胜B获得的分数就会较少,而A负于B失去的等级分则会较多。

这种规则无疑比每局赢棋获得固定的等级分合理。

2

AlphaGo的自评等级分体系

AlphaGo论文当中使用的Elo等级分体系,其评分基准是Go Ratings等级分。

Go Ratings等级分(www.goratings.org )是由法国科学家Rémi Coulom创立的。

此等级分不具有官方地位,因而被部分棋迷调侃为“野榜”。

然而,Go Ratings等级分因其更新及时(每天更新)、范围全(包括中、日、韩、欧美等地绝大多数职业棋手)而广受棋迷欢迎。

Go Ratings等级分采用Rémi Coulom首创的WHR算法。

WHR算法在Elo算法的基础上改进,以更少的棋局就可以精确定位棋手的实力。

除此之外,WHR可以视作Elo等级分的变种。

截至2020年4月24日,Go Ratings等级分前10名的棋手见下图:

Figure 2 Go Ratings等级分

其中,韩国00后棋手申真谞以3731的高分排名第一,中国棋手柯洁以3667分排名第二。

AlphaGo的各版本量化棋力,是由DeepMind开发团队基于大样本对弈,用Elo体系评估的。

其中,与AlphaGo对战过的人类棋手李世乭、樊麾被选定为基准。

2015年10月,樊麾与初代AlphaGo(AlphaGo Fan版本)对战时,等级分为2900分左右,其与AlphaGo的比分是2-8,因此AlphaGo Fan版本的等级分被评估为3144分。

此处对AlphaGo等级分的评估也使用了WHR算法的快速定位,十局棋足够估算出AlphaGo的实力。

Figure 3 AlphaGo各版本等级分评估

在第二代AlphaGo(即AlphaGo Lee版本)与李世乭对战之前,其与初代AlphaGo之间的差距已达到让三子,因此DeepMind团队在内部测试中评估此版本等级分约为4500分。

同时,DeepMind负责人David Silver也在演讲中指出,4500分的评价有高估可能性。

果然,AlphaGo以4-1的比分战胜李世乭之后,由于李世乭当时的等级分3580分左右,DeepMind据此将第二代AlphaGo的等级分重新修订为3739分。

3

第二代AlphaGo的真实实力

DeepMind一次性将第二代AlphaGo的等级分评估下调近800分,看似匪夷所思,其实是负责任的做法。

最初的4500分评估主要基于AlphaGo不同版本间的“内战”。

从算法原理上看,第二代AlphaGo的模型是在第一代AlphaGo的基础上进一步训练改进的,因此第二代AlphaGo清楚地“了解”前代AlphaGo的弱点,特别善于对抗前代AlphaGo。

用机器学习的术语来说,这是一种过拟合(overfitting)。

Figure 4 过拟合

AlphaGo与李世乭对战输掉的那一局,是由于李世乭的“神之一挖”触发了AlphaGo一连串的低级错误。

部分科技类博主将此解读为AlphaGo出了bug,并进一步推断,如果不是这个偶发的bug,AlphaGo的实力已经远超李世乭。

其实这种解读并不准确。

纪录片《AlphaGo》忠实地记录了AlphaGo与李世乭之战的幕后故事。

在与李世乭对战之前,开发团队已经发现了AlphaGo偶然会下出愚蠢的臭棋。

并且,开发团队发现这样的问题在开赛之前已来不及修复了。

世界上最优秀的人工智能开发团队,只能祈祷AlphaGo在与李世乭正式对战时不要暴露这个问题。

从算法原理来看,神经网络训练出现问题的修复的确非常复杂。

修复一般的程序漏洞,只需要追溯与漏洞相关的逻辑,迟早能查出问题所在。

而神经网络更近似于一个黑箱,出现问题难以定位;即使对症地修改神经网络架构,或更换训练样本,效果也难以预测。

因此,AlphaGo与李世乭对战时的失误,并非偶发的bug,而是第二代AlphaGo模型的缺陷,应当被视作AlphaGo实力的一部分。

DeepMind最终将第二代AlphaGo的等级分评为3739分,不夸大、不粉饰缺陷,体现了实事求是的科学精神。

4

“AlphaGo能赢李世乭,但赢不了我”

当年李世乭在第一局输给AlphaGo之后,柯洁在微博上发出豪言壮语“AlphaGo能赢李世乭,但赢不了我”,一时引发关注热潮。

而在李世乭与AlphaGo的系列赛结束之后,李世乭则说,如果让他再与AlphaGo下五局,他至少能多赢一局。

柯洁

当时大部分人受AlphaGo排山倒海的气势震慑,认为柯洁与李世乭的自我评价过度自信。

但如果用前文提到的棋力量化标准去分析,两位顶尖棋士未必是在说大话。

柯洁发微博时,他的等级分在3630分上下波动,与DeepMind对AlphaGo 3739的评分相差约109分。

用Elo公式推算,柯洁对AlphaGo下一盘棋胜率约为35%。假设五盘棋的胜负是独立事件,那么柯洁赢下与第二代AlphaGo的概率是23.5%。

作为对比,首届新奥杯决赛,柯洁对阵彭立尧。

彭立尧在0-2落后之后,将比分扳成2-2平,并在第五局将柯洁逼到悬崖边上,几乎实现惊天逆转。

彭立尧当时的等级分比柯洁低150分,甚至比柯洁与第二代AlphaGo的差距更大!

因此,如果柯洁能够与第二代AlphaGo对战一次五番棋,那么柯洁获胜并非小概率事件。

可惜,柯洁的豪言终究只能是空想

如果说对战第二代AlphaGo,柯洁尚有两成胜率,那么柯洁在2017年真实面对第三代AlphaGo,也就是AlphaGo Master之时,则是十死无生。

AlphaGo Master的等级分是4858分,按照公式计算,柯洁的胜率是1/1176,胜利是小概率中的小概率。

需要注意的是,低于千分之一的胜率并非没有意义。

《体坛周报》报道,中国棋手陈耀烨曾在2017年中至2018年末间与国产AI“绝艺”奋战累计2139局。

起初陈耀烨即使执白,胜率也在50手就大跌,但在长期练习后能做到前50手完全不落下风,80手开始才慢慢落后,100手之后才被拉开距离。

陈耀烨在2139局的对战中甚至还赢下了两局。

2/2139的胜率与柯洁对AlphaGo Master的1/1176理论胜率接近。

DeepMind的CEO哈萨比斯曾表示,绝艺是基于AlphaGo的算法原理开发的,并且绝艺也训练了足够长的时间,所以两者的实力应当差距不大。

2/2139与1/1176这两个非常接近的数字,能够佐证哈萨比斯的判断。

5

让子棋

第三代AlphaGo Master对于人类来说已是不可逾越的高山,而DeepMind团队尚且不满足,进一步开发了第四代AlphaGo Zero。

而AlphaGo Zero甚至比AlphaGo Master更胜一筹,自评等级分达到5185分。可谓巅峰之上更有重楼。

虽然像陈耀烨这样勤勉的棋手仍在坚持平等地挑战强大的人工智能,但在更多的场合下,人类职业棋手放下了骄傲,选择受让子与人工智能对局。

让子是平衡上手与下手差距的一种围棋规则。

以人类棋士常与人工智能下的让二子棋为例,人类棋士执黑棋,棋局开始之前在棋盘上预置两枚黑子,然后轮到白棋先下。

这相当于黑棋开局额外走一步棋。

Figure 5 让二子棋

让二子对于业余爱好者来说不算多,即使实力相当的爱好者之间,下让二子棋也能互有胜负。

但对于职业棋手来说,受让二子是极大的优势。

即使顶尖职业棋手对战职业棋手中实力较弱的,让二子也很难获胜。

可以想象,像柯洁这样骄傲的天才棋手,在发觉自己要被让二子才能与人工智能抗衡之时,他的内心是何等挣扎。

在职业棋手常用的野狐对弈平台上,人工智能“绝艺”的马甲“绝艺指导A”每天接受职业棋手的挑战,规则是绝艺执白让二子,黑方贴3又1/4子。

近期,绝艺能够赢下大约95%的对局。

Figure 6 绝艺指导A

不过,绝艺指导A下的是超快棋,规则对人类棋手稍稍不利。

如果拥有更多思考时间,人类棋手会表现得更好。

李世乭的退役纪念赛,对抗韩国本土AI“韩豆”,其中第一、三局李世乭受让二子(黑贴3又1/4子),第二局分先(平等对局)。

李世乭第一局受让二子以一记手筋漂亮地擒住韩豆的大龙,仅92手就令韩豆认输。

李世乭(黑)-韩豆(白)第一局

第二局分先落败后,李世乭在第三局再次弈出妙手,觅得一锤定音的机会。

可惜随后的一着棋稍缓,被韩豆拉长战线之后,逐渐逆转局面,最终韩豆获胜。

李世乭与韩豆的两盘让二子棋打成一比一平,从进程来看双方也是互有机会。

说明让二子(黑贴3又1/4子)是当下一流棋手与准一流AI之间的合理差距。

如果是最强人类棋手对上最强AI,那么差距会进一步增加至约让二子(不贴目)。

6

结语

1997年,国际象棋世界冠军卡斯帕罗夫惜败于超级计算机“深蓝”。

今天,国际象棋顶级棋手要受让人工智能一个兵才能勉强逼和之。

而AlphaGo问世之后仅一年多,围棋手们也不得不面对受让人工智能二子方可勉强与之抗衡的现实。

其中最大的区别是,国际象棋AI可以运行在智能手机上,而围棋AI尚需运行在带有高配置显卡的电脑上。

沧桑巨变,如今职业棋士们已经习惯把AI当作老师,向人工智能学习判断和着法。

不过,即使与AI之间的差距已经拉开,棋界仍然不乏李世乭、柯洁、陈耀烨这样的勇士,坚持不懈地挑战AI。

挑战人工智能并不只是为了寻求那不足千分之一的渺茫胜率,更重要的是为了追寻职业棋士共有的人生信条——超越自我。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487962.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mariadb使用mysql驱动_MariaDB安装与使用

下载相对应的电脑版本程序等待下载完成......安装教程:双击运行设置数据库的密码等待安装完成..这样就完成安装了。安装完成,会在桌面生成这个图标双击可以直接使用下面我通过两种方式来使用MariaDB数据库(可视化,命令行)通过可视化方式使用。…

脑机接口技术重大突破!首次帮助瘫痪男子恢复运动和触觉

来源:网易智能触觉是我们感受外部世界不可或缺的感官,但许多人却因脊髓损伤或因患病瘫痪而失去这种能力。不过,最近非营利组织巴特尔研究所的研究人员宣称,他们首次利用脑机接口(BCI)技术帮助一名美国瘫痪男…

python海龟图画龙珠_火影,海贼王,七龙珠,还在为漫画书发愁!我用Python一键生成电子漫画书...

小时候看漫画都是要买书的,一本好几块钱,成本那个高啊后来可以在线看漫画,感觉真是爽不过近几年新的问题又出现了:漫画网站广告太多,更重要的是越来越多的作品、章节出于各种原因被下架、限制观看。为了提升观看体验&a…

谷歌自揭“家丑”:医疗AI实验室表现超神,临床结果却不佳

来源:澎湃新闻在医疗领域,尤其是在医学影像筛查过程中,人工智能常被描述为完美的工作者。它们能准确识别疾病,拥有人类专家级的发现能力,还不知疲倦。但与许多技术一样,在实验室取得成功是一回事&#xff0…

mysql 移植ucos_基于STM32F767的UCOSIII移植学习

(一)移植前的准备1.HAL库基本工程模板新建一个工程模块,其中包含LED驱动和串口驱动程序即可,用于验证UCOS-III系统能够正常工作。2.UCOS-III源码准备去Micrium官网下载最新的UCOSIII源码,下载地址:Micrium官网下载地址&#xff0c…

美国5G到底怎么了?

来源:网优雇佣军美国司法部长威廉巴尔(William Barr)在2月6日应华盛顿智库“战略与国际研究中心”(CSIS, Center for Strategic & International Studies)邀请,参加了“中国倡议”会议(Chin…

SQL实践篇(一):使用WebSQL在H5中存储一个本地数据库

文章目录 简介本地存储都有哪些?如何使用WebSQL打开数据库事务操作SQL执行 在浏览器端做一个英雄的查询页面如何删除本地存储参考文献 简介 WebSQL是一种操作本地数据库的网页API接口,通过它,我们可以操作客户端的本地存储。 WebSQL曾经是H…

预计2024年之前载人登月!NASA授予马斯克贝索斯公司大单

来源:小小据外媒报道,当地时间周四,美国宇航局(NASA)宣布选中埃隆马斯克(Elon Musk)旗下美国太空探索技术公司SpaceX、杰夫贝索斯(Jeff Bezos)的蓝色起源公司(Blue Origin)和Dynetics为其设计和建造月球着陆系统&#…

java 遗传算法_[原]遗传算法Java实现源代码

【Title】[原]遗传算法Java实现源代码【Date】2013-04-07【Abstract】以前学习遗传算法时,用Java实现的遗传算法程序,现整理分享出来。【Keywords】wintys、遗传、算法、algorithm、种群、基因、个体、进化、染色体、适应度、Rosenbrock【Environment】W…

理解进化的五座“桥”

来源:原理古往今来,达尔文是不是最具革命性的科学家之一?如果革命指的是把一个已经公认的学说颠倒过来,那挑战者还有很多,至少包括牛顿、爱因斯坦和量子力学的奠基者。这些物理学家超群绝伦的智慧能量,可能…

【AI】【机器人】AI与机器人的42个终极问题与解答

来源:产业智能官 未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图…

With you With me

With you With me 回来了,一起从零开始... 据说每一个敢说从零开始的都特么是个大牛(for example hiphop-Man欧阳靖)... 这些年的时间多有自己问自己,你特么到底在迷茫什么,想不通就去撞墙啊!!…

志澄观察:卫星互联网——太空经济新动力

图1 卫星互联网的组成来源:远望智库 引 言2020年04月20日国家发改委首次明确,将卫星互联网列入我国新型基础设施的范围,这项重大的战略决策,大大鼓舞了我国商业航天行业的信心。另一方面,2020年3月27日,在发展低…

一文读懂电磁学发展史[图文版]

来源:电子万花筒电磁学或称电动力学或经典电动力学。之所以称为经典,是因为它不包括现代的量子电动力学的内容。电动力学这样一个术语使用并不是非常严格,有时它也用来指电磁学中去除了静电学、静磁学后剩下的部分,是指电磁学与力…

人机智能既不是人类智能,也不是人工智能

来源:人机与认知实验室从前,一个教授,去一个穷乡僻壤里头坐船过江,就问船上的船工:你学点数学没有?没有。你学点物理没有?没有。那懂不懂计算机啊?不懂。教授感叹这三样都不会&#…

赛博朋克之后的科幻建筑是什么样的?

来源:苇草智酷粗略地浏览一下 tumblr 或 Pinterest 论坛的兴趣推送,你会发现我最近痴迷于科幻作品美学。更具体地说,我一直在想,在过去35年甚至更久时间里流行的设计美学——赛博朋克(Cyberpunk)之后&#…

牛客网java_牛客网java

1:下列代码运行的结果是什么?public classP {public static int abc 123;static{System.out.println("P is init");}}public class S extendsP {static{System.out.println("S is init");}}public classTest {public static voidma…

AMD 和 Intel 之战:CPU 哪家强?

来源:嵌入式资讯精选作者 | Paul Alcorn译者 | 弯月,责编 | 郭芮以下为译文:不论是选游戏CPU还是桌面应用的CPU,我们只有两种选择:AMD或者英特尔。两家都有各自的粉丝,所以想买CPU的人很难获得中肯的建议&a…

issubclass在python中的意思_python基础之类的isinstance与issubclass、反射

一 isinstance(obj,cls)和issubclass(sub,super)isinstance(obj,cls)检查是否obj是否是类 cls 的对象class Foo:passobj Foo()print(isinstance(obj,Foo))issubclass(sub, super)检查sub类是否是 super 类的派生类class Foo:passclass Bar(Foo):passprint(issubclass(Bar,Foo)…

华为的汽车芯片布局

来源:电子发烧友综合报道,内容参考自雷锋网、IT之家、CnBeat,转载请注明以上来源由于政策扶持,新能源汽车发展迅速,华为也开始进军新能源汽车市场,最近动作频繁,例如联合意法半导体研发汽车芯片…