学界 | 进化算法可以不再需要计算集群,开普敦大学的新方法用一块GPU也能刷新MNIST记录

来源:AI科技评论

概要:最近这项来自南非开普敦大学的研究就带来了新的发现,只用单块GPU的资源就进化出了理想的网络结构,还刷新了三项测试的结果。


作者按:进化算法和生成式对抗性网络GANs类似,提出时大家都觉得是很好的想法,可以帮人类极大地拓展行为和想象空间,然而找到好的、可控的实现方法却没那么简单。GANs方面现在已经有了许多的成果,但是进化算法仍然停留在较为初期的状态,无法生成大规模、复杂的网络,需要的计算资源也是在计算集群的级别上。


不过,进化算法的研究也是一步步在“进化”的,最近这项来自南非开普敦大学的研究就带来了新的发现,只用单块GPU的资源就进化出了理想的网络结构,还刷新了三项测试的结果。作者把背景和这篇论文的成果简单介绍如下。



深度神经网络是强大但是反直觉的野兽,要有丰富的经验、反复试错,才能驾驭它们得到好的表现。也有许多例子证明,神经网络的表现会随着深度的增加不断提高。这些特性加上深度学习在各个领域内越来越强的影响力都表明,能自动找到最优或者接近最优的网络结构和超参数的方法越来越重要。


不过显然,网络中每一层的特性、层与层的顺序、激活函数、全连接层里的单元数量、卷积层里卷积核的数量等等建立深度学习网络需要的参数,挑选的时候每一项都不算容易。不过现在有一个好处是,我们有丰富的计算资源,一般来说都可以尝试许多种不同的组合,找到效果比较好的。那有没有可能只用非常有限的计算资源,比如一块GPU,就取得不错的结果呢?


这篇论文就讨论了一种思路,通过进化算法,发展出优秀的神经网络。这样的神经进化算法并不是新鲜事物,大概三十年前就有人提出过,最开始是在一项跟神经网络中的连接权重相关的研究中。


神经进化算法的近期成果


下面先介绍一下神经进化算法方面的近期相关工作,跟这篇论文中的成果相比,它们都用到了很多的计算资源。E. Real 等在“Large-scale evolution of image classifiers”(arXiv:1703.01041, 2017)中提出了一种神经进化的方法,优化用于图像分类的神经网络,其中用到了含有250台计算机的并行计算集群,而在CIFAR图像数据集任务中取得了可观的成果。B. Zoph 和 Q. V. Le 则在“Neural architecture search with reinforcement learning”(arXiv:1611.01578, 2016)中用了一个综合了强化学习的循环神经网络,用来学习优秀的架构,他们一共在800个GPU上训练了800个网络。


R. Miikkulainen 等人提出了CoDeepNEAT(“Evolving deep neural networks”,arXiv:1703.00548, 2017),其中产生了一大批模型和蓝图。这些蓝图是由数个节点组成的,节点指向表征了神经网络的特定模块。这样一来,他们所提的方法就让重复结构的进化变得可能,因为蓝图可以重复使用进化后的模块。T. Desell 提出了 EXACT(“Large scale evolution of convolutional neural networks using volunteer computing” ,arXiv:1703.05422, 2017),这是一种用来部署在分布式计算集群上的神经进化算法,他们当时使用了4500台志愿参与者的计算机,进化出了12万个网络用来搞定MNIST数据集。他们的方法中没有使用池化层,也仅限于使用2维的输入和滤波器。


作者们还发现,近期有研究中只用一个GPU就可以进化出能够准确判断出监督学习任务中需要的是回归模型还是分类模型的深度神经网络,在一系列不同的任务中获得了96%的平均准确率。(E. Dufourq 和 B. A. Bassett, “Automated problem identification: Regression vs classification via evolutionary deep networks”,Annual Conference of the South African Institute of Computer Scientists and Information Technologists, ACM, 2017)这项成果是作者们的这篇论文的直接先驱,而且只要有足够的计算资源就可以无缝衔接到这篇论文中的网络优化过程中来。


基因算法


基因算法(genetic algorithm,GA)是一种可以用来解决优化问题的进化算法。首先初始化一群染色体,每个染色体都表征了优化问题的一个解决方案。然后通过一个匹配度函数评价每个染色体,以确定哪个染色体可以解决这个问题。在迭代进化模型中,基因算法会迭代很多次,可以称作“世代”(generations),一直迭代到预定义的条件达成为止(比如最大世代数目)。每一个染色体由很多个基因组成,这些基因就可以用基因操作器进行替换。经过基因操作器操作之后的染色体,就可以称为原来染色体的子代(offspring)。根据染色体群落数目的不同,可以产生多个子代。每个世代中,子代染色体都会代替现有的染色体群落。


这篇论文中,作者们使用了传统的基因算法。他们还额外增加了世代数目和网络训练中epoch的数目,用来探索最佳的epoch的数目。所用的基因算法如下图。



作者们采用基因算法的原因是,染色体的复杂程度可以根据编码的基因数目增大或者降低。基因算法相比其它进化算法还有一些好处:它们可以流畅地处理离散(比如层类型)和连续(比如学习速率)的连续空间,进行神经进化研究的时候这就是理想的选择。


EDEN


在这篇论文中,作者们提出了进化性深度网络(Evolutionary DEep Networks,EDEN),这算一种结合了基因算法和深度神经网络的的神经进化算法,用来探索神经网络架构、相关的超参数以及epoch数目的搜索空间。在这项研究中,作者们探索了例如嵌入层的优化这类的额外特征,并且提高了现有研究的复杂度。作者们希望通过EDEN解答两个问题:1,能否通过进化的方法得出总体来说较为优秀的架构和超参数用来解决许多不同的问题(并不仅限于图像识别)?2,与之前研究中使用的大规模计算集群相反,他们能否用单个GPU就达到这一目标?


作者们将EDEN接入了TensorFlow,这样新的层、函数以及其它的特征都可以轻松地被EDEN集合、应用,因为这些特征的表征函数都可以作为TensorFlow函数调用。而且,EDEN也不局限于TensorFlow,其它的现代深度神经网络框架也可以用来实现EDEN。下图就是一个EDEN的染色体在编码后得到的神经网络结构的例子。



每个EDEN染色体包含两个基因,编码学习速率和一个神经网络。图中展现的是一个用EDEN进化出的用于情绪分析的神经网络。EDEN创造了一个输出维度为120的嵌入层,其后有3个一维卷积层。EDEN进化出了滤波器的数目、每个滤波器的维度,以及每个滤波器响应的激活函数。对于最后一个层,EDEN决定使用的激活函数是sigmoid。这个染色体上的学习速率是0.0023。


下面这个动图展示了EDEN执行的过程中染色体进化的过程,要解决的问题是一个MNIST图像分类问题。这个过程中神经元群落向着一个高效的解决方案收敛,最终主要由二维卷积层组成。



实验结果


运用EDEN,在10个世代和13个训练epoch后,作者们在多项测试中分别得到的网络结果如下。



对于不同的任务,网络中进化出的学习速率和参数数目也不一样。其中EMNIST-balanced、EMNIST-digits 和 Fashion-MNIST 三项任务中取得了最好的结果,刷新了目前的最好成绩。对于CIFAR-10中低很多的表现,作者们认为原因是,由于他们这项研究关注效率更多,所以对模型的深度做出了一定限制,也就限制了CIFAR-10任务中的表现。



这张图是在MNIST任务中,网络进化到不同世代的平均匹配度变化图。其中的竖线标出的是整个群落中5%到95%的匹配度值。在进化刚开始时,群落中的匹配度有很大的不同,然后随着解决方案变好、群落收敛,匹配度的变化幅度开始减小。图中也标出了自进化开始之后,最初、中间、最终三个世代时的网络结构以及相关的超参数。


作者们表示,他们实验中只使用了一块GTX1070 GPU,训练时间6到24小时,就可以取得这样的成果,他们觉得非常满意。他们的研究也首次尝试了把神经进化用在一维卷积网络的创造中,用来解决情感分析、包括嵌入层的优化问题。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498537.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

html网页定位,HTML_定位网页元素(示例代码)

一.position属性意指:盒子的位置。四个属性:1.static:默认值,没有定位,元素按照标准文档流进行布局。2.relative:相对定位,使用相对定位的盒子位置以标准文档流进行的排办方式为基础,然后使盒子相对于他原本的位置偏移指定的距离。…

人类“换头术”现在就是一场炒作 但医学界不会放弃研究

来源:腾讯科技 概要:和换头有关的实验可能都会继续进行下去。只是从技术和伦理上讲,什么时候才是适合做人类换头术的时机,这就很难说了。 两年前,意大利神经外科医生生塞尔吉奥卡纳维罗(Sergio Canavero&am…

我的世界html导入整合包教程,《我的世界手机版》如何制作一个整合包教程攻略...

今天当乐网小编要给大家分享的是一个我的世界手机版整合包的制作教程:我的世界手机版中,很多玩家可能还不会使用单独的材质包以及存档等等,这个时候就会有比较有爱的玩家制作出整合包分享出来,整合包直接安装好久可以…

Facebook 应用机器学习团队专访:人工智能在 Facebook 中的应用

来源:AI科技大本营 作者:Steven Levy 是 Backchannel 的一名编辑。 概要:当下,应用机器学习团队(Applied Machine Learning Group)对 Facebook 的影响体现在方方面面,涉及阅读、交流方法和理解方…

转专业学计算机难嘛,大学转专业容易吗 转专业需要什么条件

大学转专业容易吗 转专业需要什么条件2018-07-23 16:45:42文/李男每年都有很多学生,因为不了解自己所填报的专业,导致上大学后想转专业。那么,大学转专业容易吗?下面小编整理了一些相关信息,供大家参考!大学…

远控时其他用户登录到这台计算机,如何远程控制另一台电脑 远程控制另一台电脑方法【详解】...

如何远程控制另一台电脑?如果是2003的系统或XP的系统的话就用windows的远程桌面功能!右击我的电脑,属性,远程,远程桌面里的框里打勾,然后选择选择远程用户管理员的话不用选,管理员已经有权限了。点确定即可。下面&…

AI技术的天花板:图灵机无法建立“自我”意识的概念

来源:财经杂志 概要:AI的实现时必须依靠计算机,但基于图灵机的AI在理论上无法超越人类智能,至少不会基于这一代的计算机技术和理论。 人工智能(AI)的基本假设是“认知即计算”。但目前对认知本质的理解不同…

创建ftp服务器后html,搭建ftp服务器需要用到固定IP吗

弹性云服务器 ECS弹性云服务器(Elastic Cloud Server)是一种可随时自助获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率三年低至5折,多种配置可选了解详情使用VNC V…

源码资本张宏江:只有算法和技术,那你一定挣不到钱

来源:拓扑社 概要::在人工智能这一拨的技术浪潮的公司,互联网不一样的地方就在于互联网基本上是商业模式驱动,搜索以前没有,to C这块是赢家通吃。这块做成熟以后进入互联网。 张宏江认为,一家传统公司要想用…

为什么计算机专业被称为宇宙机,量子计算机为何被称为宇宙中最强大的计算机...

以我们目前的技术,量子计算似乎有可能建立地球上最强大的量子计算机。这台超级计算机由干涉仪提供动力,干涉仪可以检测液体中的振动以及从一个层次移动到另一个层次的粒子。对产生量子涨落的量子位的测量存储在一个称为“球体”的量子数据存储器中。此数…

说明:最新谷歌AI智商不超过6岁研究来自中国科学院而非美国康内尔大学

最近cnBeta等多家网站报道: “据HotHardware报道称,来自美国康奈尔大学一组研究人员对各大科技公司的人工智能型语音助手进行了横向比较。研究人员发现,谷歌助手拥有目前语音助手类中最高的平均智商,IQ值约为47.28,水准…

大学计算机在线答题,大学计算机基础网上考试答题卷理论部分(含答案)

A、129B、-1C、-127D、127正确答案: C7、显示卡中的_________用于存储显示屏上所有像素的颜色信息。A、显示控制电路B、显示存储器C、接口电路D、寄存器正确答案: B8、I/O接口指的是计算机中用于连接I/O设备的各种插头/插座,以及相应的通信规程和电气特性。在目前的…

oracle即时客户端(Instant Client)安装与配置

之前的文章记录了oracle客户端和服务端的下载与安装,内容参见: 在Windows中安装Oracle_windows安装oracle 如果不想安装oracle客户端(或者是电脑因为某些原因无法安装oracle客户端),还想能够连接oracle远程服务&#…

无人零售场景、技术全解读:伪需求or真风口?

来源:智东西 概要:无人零售是不是伪需求,相关技术成熟度怎么样,行业竞争的本质是在拼什么。 无人零售,作为新零售的热点概念,采用计算机视觉、生物识别、智能算法等技术,覆盖机器人制造、支付设…

用计算机进行频谱分析时,实验四-利用FFT对信号进行频谱分析1112

实验四 利用DFT 对信号进行频谱分析一、目的要求(1) 进一步加深对线性卷积的理解和分析能力;(2) 通过编程,上机调试程序,进一步增强使用计算机解决问题的能力; (3) 掌握线性卷积与循环卷积软件实现的方法,并验证二者之…

人类的下一代计算平台——科技大发展前景下的新思考

来源:亿欧 概要:所谓的最大的下一代计算平台,在可见的未来,不会是一个如同手机般的单一平台,而是一种生态化的泛计算平台。 在可见的范围(5-10年)内,计算平台发展方向应该是“交互设…

一台计算机怎么弄2个登录桌面,一台主机两个显示器 教您电脑两个显示器怎么设置 - 云骑士一键重装系统...

有用户反馈称在前台收银,可能会用一台显示器别人可以看到,而一台显示器就收银员操作是观看,现在的电脑显卡都很强大,有些用户觉得很好玩,想要这样操作,那么电脑两个显示器怎么设置?下面给大家讲解设置电脑…

智能生态系统的产业架构与趋势研究

来源:本翼资本CapitalWings 概要:信息生态链产业自下而上可以分为:感知层—网络层—平台层—应用层;而在智能革命下,生态链的网络层和平台层会更加扁平化、融合化,本文提出了“云、管、端”一体化的智能生…

收到计算机工程与应用的退修通知,《计算机工程与应用》退修意见

初审 编辑部 2014-12-05 2014-12-03待交审稿费 编辑部 2014-12-03 2014-12-18 2014-12-05编委审稿 编委 2014-12-05 2014-12-25 2014-12-19外审 …

Google 顶级论文:机器学习系统,隐藏多少技术债?

来源: 全球人工智能 概要:随着机器学习(ML)社群持续积累了几年对于活跃系统(live systems)的经验,一种让人不舒服的趋势广泛地浮出水面:研发和部署机器学习系统相对来说是既快速又便…