AlphaGo Zero的伟大与局限——ResNet作者、旷视研究院院长孙剑深度评述

来源:Megvii旷视科技

概要:2017年10月19日,Deepmind 团队发布强化版的 AlphaGo Zero,该版本的 AlphaGo 实现了在 AI 发展中非常有意义的一步——“无师自通”,这也让去年败在未升级版本 AlphaGo Master 下的中国棋手柯洁惊呼“人类太多余了”。


2017年10月19日,Deepmind 团队发布强化版的 AlphaGo Zero,该版本的 AlphaGo 实现了在 AI 发展中非常有意义的一步——“无师自通”,这也让去年败在未升级版本 AlphaGo Master 下的中国棋手柯洁惊呼“人类太多余了”。而值得注意的是,该版本的 AlphaGo 所采用的其中一个重要环节是诞生于华人团队的深度残差网络(ResNet)。


主讲人:孙 剑


旷视科技首席科学家、旷视研究院院长


就此背景,旷视科技Face++首席科学家孙剑博士作为深度残差网络 ResNet 作者之一,特别接受了多方媒体的专访并对这次的技术升级做了详尽的阐述。在他看来,本次技术提升足够伟大,但在真实技术落地过程中却有着众多局限,并指出未来很长一段围绕大数据的训练模式和有监督的学习方法仍是主流深度学习技术应用的必需方式。


孙剑团队发表的《图像识别中的深度残差学习》

获得 CVPR 2016 最佳论文奖


两大核心要素实现


AlphaGo Zero 极简算法


“我们做研究追求极简祛除复杂。这篇文章最吸引人的地方就在于他们做的减法。首先 AlphaGo Zero 的搜索过程简化了很多,例如把以前系统中的两个网络合并成一个网络、将深度残差网络的输入做最简化。”旷视科技Face++首席科学家孙剑博士在讲到本次 AlphaGo Zero 的技术特点时说道,“此外,AlphaGo Zero 可以把19×19 棋局的二值图像直接送给神经网络,让神经网络看着棋盘做决策,简洁而优美。” 


AlphaGo Zero 学到的围棋知识(图片来源:DeepMind 论文)


孙剑博士在交流中表示,本次 AlphaGo Zero 的提升主要有两个核心要素,一个是启发式搜索,一个是深度残差神经网络,而这两个又非常完美的实现了结合。其中启发式搜索的思想非常朴素,是针对问题设计的一个高级定制版蒙特卡洛树搜索算法。另外的要素则是通过深度残差神经网络让简单的搜索算法极大的提升了效率。


深度残差神经网络(ResNet)是2015年由孙剑所带领的微软视觉计算团队率先提出,并在当年的 ImageNet 以及 MS COCO 两大技术竞赛中包揽五项冠军,其中最重要的部分就是实现了突破性的 152 层的网络深度,从而让一些非常复杂的函数做映射时的效率与有效性得到极大的提升。强大的网络使的 AlphaGo Zero 可以有能力学习并对落子概率和整体棋局有更精准的判断。


伟大与局限并存


“无师自通”短时间无法成为 AI 主流


“AlphaGo Zero 的伟大之处是第一次让机器可以不通过任何棋谱,不通过任何人类的经验,在只告诉规则的前提下就实现了成为一个围棋高手,这种无师自通的学习模式在 AI 整个发展上是非常有里程碑意义的。”孙剑博士讲到AlphaGo Zero的技术意义时指出,“但是同时这种无师自通在很多 AI 落地上也存在一些局限,因为严格意义上讲,围棋规则和判定棋局输赢也是一种监督信号,所以有人说人类无用、或者说机器可以自己产生认知,都是对 AlphaGo Zero 错误理解。”


“实际上在很多 AI 行业落地中,弱的监督学习或者所谓的无师自通还是无法在短期成为主流。”孙剑博士补充,“比如,就旷视Face++所擅长的人脸识别来讲,这个能力是人类后天学习的能力,是通过时间不断演化出来的一种生存能力,人只有具备了人脸识别能力,人类社会才能正常运转。把这种后天能力输出给机器,其实就需要人的监督信号,包括目前人工智能落地所解决的很多事情,其实都是模拟人类的一种技能,让机器实现这种任务就需要海量的数据与更多的信号输入,所以今天,甚至今后很长一段时间内,监督学习依然是 AI 研究与 AI 商业化的主流方向。”


开放与互通


旷视Face++致力推动 AI “变现”


而讲到 AI 的未来,孙剑博士谈到了开放与互通,并重点讲到每天第一件事情就是去网上开放的论文平台 ArXiv 查看是否有新的、有意思的论文、思想发出来。就 ResNet 被 AlphaGo Zero 应用这个点上,孙剑博士表示:“这次应用在 AlphaGo Zero 中的 ResNet 残差神经网络,曾获得了 CVPR 2016 的最佳论文奖。当然今天我也非常高兴看到这个技术可以应用在 AlphaGo Zero 系统中。但这个应用过程其实并不需要我们直接进行接触而是一种研究成果的交流,人工智能研究最前沿的开源与开放,才能让我们在追求更优解的过程中有很多参考与理论支撑,可以极大的提升新技术产生的周期。”


而作为旷视研究院院长,孙剑博士强调:“和全球研究机构一样,旷视研究院的工作和使命,也是不断分享、开放研究成果,但是更注重的是技术在产业中的实用性。” 2017年7月,旷视研究院团队就在 ArXiv 公开了一篇关于 ShuffleNet 的论文,ShuffleNet 是旷视专为移动端和低功耗设备设计的一种神经网络算法,其实际上也是一种对 ResNet 深度残差网络的改进,发布之后很多业内同行就已经在各自的研发中应用上了。而旷视自己在不到半年的时间里,也已经基于 ShuffleNet 推出了多款创新智能终端产品和手机人脸解锁等应用。


旷视基于移动端卷积神经网络的开发的各类应用


“不断借助创新而实现更多的创新,不断借助伟大的思想创造伟大的场景。只有不断的开放最好的认知,才能让这个行业不断成长,让更多更强的 AlphaGo Zero 产生。” 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498423.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《人类简史》作者:应对 AI 革命,要打造新的经济、社会和教育体系

来源:36氪 概要:正在进行的人工智能革命将改变几乎所有的工作,给社会和经济的发展带来机遇和挑战。一些人认为,人工智能将把人类赶出就业市场,创造一个新的“无用的阶层”;另一些人则认为,自动化…

全球厂商已向自动驾驶投入800亿美元 依然群龙无首 | 厚势

来源: 腾讯科技 概要:近日发表的一份权威研究报告指出,全球厂商已经在自动驾驶领域投资 800 亿美元,但是迄今为止,仍然没有一家明显处于领先优势的厂商。 自动驾驶和电动车成为当下科技行业两大热点之一,几…

promise的状态值_什么是Promise,Promise的三种状态

什么是Promise对象:Js中进行异步编程的新的解决方案,用于表示一个异步操作的最终完成 (或失败), 及其结果值.。语法上:promise是一个构造函数简单来说,promise对象用来封装一个异步操作并可以获取其结果语法:new Promi…

埃森哲报告:2017年数字化浪潮下的医疗行业五大趋势

来源:AI掘金志 概要:日前,埃森哲发布了《2017年数字化健康技术展望》报告,分析了数字化浪潮下的医疗护理行业的实际落地情况和发展前景,主要围绕着AI、生态系统建设、新型医疗人才挖掘、新的监督法规等五个方面进行解…

人类如何从不同角度识别物体?你需要对「小样本学习」有所了解

来源:转载自公众号「雷克世界」微信号:ROBO_AI 编译:嗯~阿童木呀、多啦A亮 概要:在视觉层次结构的较低层次,不变性使你可以识别矩形或线条,即使它是倾斜、旋转或缩放的;而在更高的层次上&#x…

摩尔定律已死?GPU会取代CPU的位置吗?

来源:全球人工智能 概要:CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。 京举办的NVIDIA GTC China会议中,无论是AI智能运算,还是服务器数据中心、智能城市&#xff…

mysql 终端模拟_mysql客户端模拟脏读、幻读和可重复读

如果操作一下时报出错误:在数据库中执行 SET GLOBAL BINLOG_FORMAT mixed;执行后可通过SELECT * FROM information_schema.GLOBAL_VARIABLES WHERE VARIABLE_NAME ‘BINLOG_FORMAT’ ;进行查看。通过客户端选择可用数据库:use db_test(模拟数据库)以下…

Nature Human Behavior:大脑对不公平的反应有助预测抑郁症

来源:生物帮、神经科技 概要:过去的研究已经表明,财富分配不均,即经济不平等,可能会促进抑郁症等精神疾病的增加。但是,这背后的机制却不为人知。 2017年10月2日,国际学术权威刊物自然出版集团旗…

这几家公司有个梦想:开发AI操作系统,让外行也成为人工智能大师

来源:科技行者 概要:未来几年人工智能会如何发展?除了阿尔法狗令人叹为观止的表现,人工智能确实也正在改变整个行业。但有一点我们是需要注意的,有必要让AI从总体上变得更加易于使用。 严格的说,Scot Barto…

mysql耦合_内聚与耦合

简单理解一下内聚和耦合。什么是模块模块就是从逻辑上将系统分解为更细微的部分,分而治之。复杂问题因为复杂性的问题,比较难解决,但是可以将复杂问题拆解为若干简单问题,逐个击破地解决这些简单问题,最后实现解决复杂…

Google CEO Sundar Pichai :“谷歌最大的威胁就是自身的成功”

作者:Dude 概要:10月9日,低调的皮柴哥接受了英国卫报的访问,在访谈期间,他分享了谷歌在人工智能上发展,也表达了对谷歌近年来发展的隐忧。 10月9日,低调的皮柴哥接受了英国卫报的访问&#xff0…

国防科技大学教授:殷建平——计算机科学理论的过去、现在与未来

来源:图灵人工智能殷建平 教授,博士生导师,国防科学技术大学计算机系主任。研究方向有:模式识别与人工智能、网络算法与信息安全。享受国务院政府特殊津贴。2015年被评为“万人计划”国家级教学名师。2009年被评为“全国优秀教师”…

《自然》杂志:关于人类未来的工作,有三个最紧迫的问题

来源:36氪 概要:机器学习会淘汰工人吗?零工经济(Gig Economy)会增加对工人的剥削吗?技能的差距能够弥补吗? 机器学习会淘汰工人吗?零工经济(Gig Economy)会增…

有史以来影响世界的颠覆性技术 | 未来的高附加值颠覆性技术产业

来源:DeepTech深科技(ID:mit-tr) 概要:没有工具,人类就是一个脆弱的物种,没有任何人种可以手无寸铁面对自然。技术伴随人类成长,从野蛮走向文明。人类历史就是一部技术史。 人类发展…

一文详解脑科学研究与产业发展方向

来源:神经科技、脑计划 概要:大脑是人体最复杂的器官,破译大脑运转密码、揭开生命之谜,是令无数科学家殚精竭虑的艰难课题。脑科学已成为21世纪最前沿的研究领域,尤其与信息科学进行交叉研究已成为脑科学发展的一个重要…

ef生成mysql字段注释_EFcore+MySql 数据迁移的时候,怎么给表结构加注释?

前言:CodeFirst运用的场景比较少,不代表CodeFirst不好,也不能和DbFirst去作比较,本来就是两个东西。吐槽:MySql.Data.EntityFrameworkCore 作为Oracle官方维护的组件,居然对EF很多API不支持或者无效&#x…

10秒一部电影,全球首个5G数据连接完成

作者:李赓 概要:2017年10月17日、也就是上周二,高通在香港高调宣布——其面向移动终端的5G调制解调器芯片组,骁龙X50 5G调制解调器芯片组完成了全球首个5G连接,同时实现了千兆级速率并在28GHz毫米波频段上的数据连接。…

idea 不打开文件提示错误_解决IDEA误删out目录下的文件导致404无法访问的问题

前言有时候IDEA下写Web项目时可能会遇到如下问题:误删out目录下的文件导致开启服务器后无法访问页面的问题新增加一个页面或添加一张图片,在项目编译运行后,未能自动更新到out\artifacts\目录下,从而导致页面无法访问,或者图片未能…

华为生态链的全方位解读

来源: 本翼资本CapitalWings 概要:华为作为目前国内ICT行业的融合性创新龙头企业,其多年经营探索的经营模式和宝贵经验使得其成为传统制造业转型的标杆,而对于新兴企业,能够越过坎坷的探索之路,直接嫁接华…

洪小文:以科学的方式赤裸裸地剖析人工智能

来源: 微软研究院AI头条 概要:要想在未来实现人工智能这项“新”技术的最大化利用,必须清楚认识到人工智能到底是什么,过去我们做了什么,今天能做什么,未来又能有什么新的发展可能。 近两年来,人…