【学界】深度学习如何影响运筹学?

640?wx_fmt=jpeg

来源:运筹OR帷幄

前言

最近看到一篇回答,YouTube 已将视频推荐全面改用深度学习实现。但传统上,推荐系统落在运筹学的范畴,可以归结为一个矩阵补全(matrix completion)问题,用半正定规划(SDP)里的方法,如非负矩阵分解(NMF)解决,而 YouTube 的结果显示深度学习的预测准确率比传统方法好很多、快很多。

其他运筹学的问题(如广告搜索、路径规划、定价估值、仓储物流)、形式(如 LP、CP、SDP、MIP)、和方法(如内点法、割平面法)也会遇到这样来自深度学习的挑战吗?如果会的话,将如何影响?学界和业界有哪些已有的讨论和成果?

文中提及回答:王科:YouTube 的视频推荐算法是怎样的?

:http://t.cn/RQR9nhK

这个问题比较前沿一些,原来看起来相关性不那么强的技术领域,机器学习 VS 运筹学,因为深度学习的发展和突破,变得联系越来越紧密了。
1. 运筹学简介
狭义的运筹学,往往特指采用LP/MILP/MIP/QP/NP 等数学模型建模、采用精确算法/启发式算法在线求解并得到满意方案以及进行相关理论分析的一类技术。所以,运筹学最早是作为应用数学的一个分支,服务于人们解决各行各业优化问题的一类基本数学工具而存在的。
OR/optimization两个学科近年的复兴无疑需要归功于机器学习。2005年以来,Lasso等方法的提出正好契合了贝叶斯学习的精神;2010年,Boyd 在故纸堆中重新找出分布式ADMM用来求解带约束机器学习问题(矩阵分解等等),成为了传统机器学习的标准范式(objective+regularization);2014年以来,深度学习的兴起则直接带火了一片一阶随机算法:ADAM/RMSprop 等。例如,SVM 的训练过程,本质上是求解一个 SQP问题;训练神经网络的梯度下降算法,是在使得训练误差极小化意义下的一个局部优化算法。由此可以看出,绝大部分机器学习模型的训练过程,都是首先将其建模为一个运筹学问题,然后采用相应算法来求解的。从这个角度看,机器学习(包括深度学习),是运筹学的一个应用领域。
在使用运筹学来解决各行各业形形色色问题的过程中,研究者在理论和应用层面发展出了许多类型的优化算法,也解决了不少实际问题。各类运筹学的期刊、会议有很多,每年至少有几千篇论文、专利发表出来。然而,除了几十年前已经发展比较成熟的几类经典算法(凸规划算法、动态规划、若干图算法、信任域算法、元启发式算法等)之外, @郝井华 认为,在基础算法层面,并无太大的突破。人们对具有非线性、NP-Hard特点的大规模优化问题,仍然缺少好用的处理工具和通用求解算法,往往需要研究者结合领域知识,采用模型简化和变换、分而治之等办法来近似求解。然而随着人们对深度学习研究的逐步深入,运筹学问题的求解初步的涌现出了新的思路。本文将简单的介绍运筹学和深度学习的相互影响,以及近些年涌现出的一些比较有意思的研究成果。
2. 深度学习对运筹学的影响
深度学习的出现,为运筹学领域处理上述复杂优化问题提供了一个非常有效的技术途径。在深度学习和运筹学结合之前,在运筹学的学术研究圈里,已经出现了不少『运筹学+机器学习』的案例。例如,在工业产品设计领域常使用响应曲面法(RSM)、插值法来根据有限的实验数据点来建立模型并求解;进化算法大类中,EDA(Estimation of Distribution Algorithm)
算法通过一些机器学习模型来学习编码和目标函数之间的近似关系来提升迭代效率,等等。感兴趣的同学可以 Google 一下这个领域的论文。
EDA之类的分布概率估计算法,思想非常好,但是后续并没有取得很大的成功,原因在于,复杂非线性优化问题的解空间往往非常『崎岖』,Landscape 非常复杂,通过一些常规的线性模型、核模型、神经网络等,很难对其解空间进行高精度的逼近。所以相应的优化算法,会有一些改进,但是很难有质的突破。
3. 深度学习与运筹学的对比
首先,与传统运筹学关注的问题相比,一个典型的深度学习问题参数量(待求解的变量个数M)一般很大(例如,用于视觉识别的Alexnet参数量大约在100M这个量级),而凸优化算法一般能够高效解决的变量个数一般在1k-100k这个量级。因为很多算法一旦涉及到求Hessian/Jacobian矩阵就会涉及到存储和计算效率问题了,这正是很多传统算法的瓶颈之处,而这也是新世纪以来一阶算法重新兴起的一个背景。正是由于这样的原因,LBFGS一度作为标准的优化算法在现代机器学习界应用较少:每步迭代需要一个O(M^2)变量的更新的代价太大了!
其次,机器学习以及深度学习所伴随的数据集规模(N)一般也很大,例如标准视觉toy数据集ImageNet是120万*4096,而google,Amazon,阿里巴巴等大厂的的规模则是PB级别的,这甚至已经达到传统油田,大气,金融等问题的存储规模了。数据集大小方面带来的问题也是不可忽视的,一系列的随机算法(SGD-based method)、分布式算法被提出来应对这些问题。
从计算难度的角度而言,油田、大气、金融等问题的计算一般都有很好的formulation,问题求解虽然不见得性质很好(例如解Levy Process因为跳的存在,也涉及到很多0-范数的问题,本质上还是NP-hard的),但是起码能够有一些理论的保证。而深度学习由于问题极其扭曲(深),非线性程度很高,所以求解过程收敛速度和收敛性并没有任何的保证。当然最近也有一些在比较强的假设下,浅层的神经网络到达saddle point或者local minima的一些证明,但是计算上的问题还是一个根本的困难问题。
然而,在给定大量高质量数据的前提下,深度网络和深度学习算法展现出了相比较传统机器学习模型精准得多的逼近能力,能够提供高精度的逼近效果。从本质上说,这一点就是深度学习带给运筹学的最大影响。在合适的应用场景下,通过深度网络离线学习得到高质量的逼近模型,并把它和符合问题特点的优化算法相结合,将会带来意想不到的应用效果。我相信未来几年内,这方面的论文会涌现出一大批。
从应用层面来说,机器学习在‘预测’上比传统运筹和统计模型表现好是必然的,原因是传统模型基于简单的假设,因为复杂的假设可能无法快速的解出最优解。更多的参数意味着这更好的拟合程度,虽然有过拟合的风险,但机器学习模型可以通过模型增加正则化,Bagging, Boosting等一些列方式防止过拟合,从而达到很好的预测效果。当然了,预测好并不是一个模型的全部,相对于传统的统计模型所缺少的是可解释性和insight。
4. 深度学习的发展
举个例子,博弈问题如围棋,就是一个典型的复杂优化问题。而AlphaGo 成功的本质原因,是通过深度网络离线学习得到了对于状态和落子点价值的较为准确的评估,然后在线地和搜索算法(蒙特卡洛树搜索算法)相结合,取得了突破性的效果。
最近,机器学习界也在反思,Neural Network+BP=AI这么一个打法究竟是否成立。Hinton直接就跳出来说:“BP在深度学习中不是必要的”,并且提出了一个叫Capsule的东西给大家思考。包括我们也知道有很多non-gradient的方法(粒子群蚁群优化等,一度被小圈子玩坏的领域,但是在新时代有无重新兴起的可能?而OR也确实能够给机器学习界带来很大的帮助:例如,以SMO求解SVM等对偶方法现在已经是标准思路。
5. 机器学习和整数规划结合的一些成果
整数规划作为运筹学理论体系中很重要的一部分,对解决实际工业需求中的问题提供了强有力的建模方式,但机器学习模型可以通过模型增加正则化,Bagging, Boosting等一些列方式防止过拟合,从而达到很好的预测效果。
Branch-and-Bound(B&B)和 Cutting Plane方法是求解整数规划精确解的两种常用的方法。一直以来,这两种方法对机器学习理论的发展和应用都起到非常重要的作用。例如,B&B可以用在MAP 估计、场景理解、和dependency parsing中。机器学习的发展同样对整数规划理论具有很强的推动作用,尤其在整数模型求解过程中所涉及到的决策部分,机器学习模型将越来越发挥重要的作用。
例如,在使用算法或者商用求解器求整数模型的精确解时,通常会涉及到以下三种决策:
-Cutting Plane: 会有很多有效的割平面,但如何只选择其中一部分加入求解过程中。
-Node Selection:如何在现有产生的Node中选择一个,进行下一步的松弛。
-Branching:在每个Node中,选择哪个变量进行Branch.
当前的商用求解器比如Cplex, Gurobi 和开源非商用求解器Scip在处理三种决策时,通常使用Heuristic的方法进行处理。例如,在Cut Selection中,一般使用一个多变量打分系统对每个Valid Cut进行打分做出选择,这样的处理方式是非常的主观的。现有求解器在进行Node selection 时, 通常默认使用best-bound 和best-estimate 两种方式,根本没有考虑求解模型的特性。同样的问题存在Branching rule的设计中。
机器学习的发展,为整数规划的算法中涉及到决策的部分提供了一种新的思路。比如可以通过定义合适的reward 和transition function, 可以用Online learning 算法,模拟node selection过程。可以用非监督模型对整数模型进行Danzig-Wolfe 分解。也可以通过学习Surrogate 评价函数,来学习Strong Branching过程,从而减少求解时间。
近些年,越来越多这样的成果涌现出来,但大部分成果还都是在各大计算机顶尖会议上进行发表,其中以佐治亚理工计算机系的Song Le, Bistra Dilkina团队和工业工程系George Nemhauser团队最为突出。在两个人工智能专家和传统优化大师联合指导下,组内的博士生使用最前沿的深度学习在传统整数规划领域做出了突出的成果。也从侧面证明了,运筹学要和人工智能深度的结合,才有可能突破现在理论所遇到的问题。
此外,在很多行业中,受问题规模、复杂度以及响应时间的制约,很多规划问题需要大量应用启发式规则/程序(heuristics)来近似求解。这些启发式规则/程序往往来自对系统长期的观察和思考,其质量可能对系统性能至关重要。运筹学中演化计算领域中有一个“演化规划”分支,试图利用演化计算的方法来探索和生成更优的启发式规则,如genetic programming 等,类似的研究还包括approximate
dynamic programming、决策树等。近年,这一领域越来越多的学者开始结合深度学习的方法,尤其是深度增强学习,也取得了一些有趣的进展。
6. 结论
1)运筹学学科的发展,需要在优化算法中越来越多的引入深度网络等机器学习工具,实现离线在线相结合,数据和机理相结合,以取得更好的应用效果,这是运筹学发展的必然趋势。
2)运筹学为机器学习贡献优化理论,同时吸取机器学习的理念来更好的解决传统问题,而深度学习也对现有的运筹学理论进行了新的发展。
3)运筹学和深度学习,并不是对立的两个概念&工具,在很多时候需要结合起来使用。

感谢审稿人杨昌鹏 @Changpeng Yang, 新加坡南洋理工大学/加州大学伯克利分校联合培养博士,现任顺丰科技----航空和物流优化 ,为本文添加了机器学习与整数规划结合的一些成果这一小节的内容以及对整体文章的建议和修改。

感谢审稿人 @王孟昌 阿里巴巴运筹优化算法专家-调度优化,整数规划,为本文添加了机器学习与整数规划结合的一些成果这一小节的内容以及对整篇文章的框架的处理和建议。
来源:知乎用户:深度学习如何影响运筹学?https://www.zhihu.com/question/65151551/answer/240063280

参考文献:
[1]Khalil E B. Machine Learning for Integer Programming[C]//IJCAI. 2016: 4004-4005.
[2]Khalil E B, Dilkina B, Nemhauser G L, et al. Learning to run heuristics in tree search[C]//Proceedings of the international joint conference on artificial intelligence. AAAI Press, Melbourne, Australia. 2017.
[3]He H, Daume III H, Eisner J M. Learning to search in branch and bound algorithms[C]//Advances in neural information processing systems. 2014: 3293-3301.
[4]Comments on: On learning and branching: a survey
[5]Lodi A, Zarpellon G. On learning and branching: a survey[J]. TOP, 2017: 1-30.
[6]Dai H, Khalil E B, Zhang Y, et al. Learning Combinatorial Optimization Algorithms over Graphs[J]. arXiv preprint arXiv:1704.01665, 2017.

《崛起的超级智能》一书主要阐述当今天人类为人工智能的春天到来而兴奋,为人工智能是否超越人类而恐慌的时候,一个更为庞大、远超人类预期的智能形态正在崛起,种种迹象表明50年来,互联网正在从网状结构进化成为类脑模型,数十亿人类智慧与数百亿机器智能通过互联网大脑结构,正在形成自然界前所未有的超级智能形式。这个新的超级智能的崛起正在对人类的科技,产业、经济,军事,国家竞争产生重要而深远的影响。

作者:刘锋   推荐专家:张亚勤、刘慈欣、周鸿祎、王飞跃、约翰、翰兹

未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/490258.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

抠像噪点去除 unity_这个在线抠图工具,好用又免费,告别Photoshop繁杂操作

对于经常处理图像的人来说,抠图可以算得上一个非常重要的技能,不少时候抠图的过程是非常的繁杂的。说到抠图,相信很多人首先想到的是Photoshop,确实如果说到图像处理,photoshop的确算得上是最为专业的软件,…

潘云鹤院士:AI2.0和工业经济发展智能化

中国工程院院士、浙江大学教授潘云鹤来源:走向智能论坛近日,在2019中国(杭州)工业互联网大会,中国工程院院士、浙江大学教授潘云鹤发表《AI2.0和工业经济发展智能化》主题演讲。以下来自大会演讲记录,未经本…

逐行对比两个文件内容的好用软件

WinMerge 可以官网下载或者去腾讯软件中心下载 https://pc.qq.com/detail/6/detail_1326.html 安装好之后,点击,文件—》打开 选取两个对比的文件

txt文件可存储最大值_403元可存储22.5TB文件 Quantom LTO-7磁带开售

磁带技术在1963年被创造出来,对于普通消费者来说,磁带就是用在存储歌曲,只不过随着科技进步,我们已经不在用“磁带”来听歌了,机械硬盘,闪存设备逐渐取代这种存储方式,不过磁带存储技术经过发展…

激荡十年:云计算的过去、现在和未来

来源:InfoQ云计算从 AWS 初创时的牛刀小试到如今巨大的行业和生态,从新鲜词汇变为流行语,它的十年发展经历了哪些阶段?每个阶段分别创造和发展了什么?未来云计算又将朝着哪些方向继续前行?0写在前面科学技术…

python web框架之Tornado

说Tornado之前分享几个前端不错的网站: -- Bootstraphttp://www.bootcss.com/-- Font Awesomehttp://fontawesome.io/-- bxsliderhttp://bxslider.com/-- jQuery EasyUIhttp://www.jeasyui.com/download/index.php-- jQuery UIhttp://jqueryui.com/-- parsleyjs http://…

火狐导cookie文件没反应_效率指南|实操区分FireFox火狐的国内版和国际版

Firefox分为了国内版、国际版,书签、历史记录、设置等不支持互相同步。本来想图个方便,在国内的互联网环境下,放弃了无法登录的Chrome,上车Firefox就是看中电脑、手机端(iPhone端不同步,国内Android没试过哈…

Struts2小结

Struts 2是在WebWork2基础发展而来的。 注意:struts 2和struts 1在代码风格上几乎不一样。 Struts 2 相比Struts 1的优点: 1、在软件设计上Struts 2 没有像Struts 1那样跟Servlet API 和 struts API 有着紧密的耦合。 Struts 2的应用可以不依赖于Servlet…

郭仁忠院士 | 新城市科学认知与智慧城市建设

来源:中国地理信息产业协会7月25日,郭仁忠院士在2019中国地理信息产业大会(珠海)高端论坛上作题为《新城市科学认知与智慧城市建设》的精彩报告。经郭院士授权,现将报告PPT发布分享,以飨读者。《崛起的超级…

是否顺应互联网大脑的发育趋势决定科技企业兴衰

来源:今日头条前言:本文摘录自2019年7月中信出版社出版的《崛起的超级智能:互联网大脑如何影响科技未来》为什么谷歌、脸书、亚马逊、阿里巴巴、腾讯等互联网企业发展得如此迅速,成为世界科技巨头?科大讯飞、商汤科技、…

sql 两个表列包含_Oracle数据库扩展语言PL/SQL之运算符

【本文详细介绍了Oracle数据库扩展语言PL/SQL的运算符,欢迎读者朋友们阅读、转发和收藏!】1 基本概念运算符是一个符号,告诉编译器执行特定的数学或逻辑操作。 PL/SQL 语言有丰富的内置运算符,运算符提供的以下几种类型&#xff1…

麦肯锡:企业数字化转型不要被技术“绑架”

来源:澳财网随着技术带动流程的改善和数字化时代的带来,平台经济日益兴起,视频租赁、电影、实体零售、广告和媒体、数据存储、出租车行业、餐馆和外卖、酒店和其他行业开始出现颠覆。在这个过程中,想客户之所想,急客户…

世界最大全脑神经元三维数据库建成

来源:科技日报神经元作为大脑的基础组成单元,对研究大脑的结构和功能至关重要。以往,受神经元标注和成像技术的局限,得到的图像有较高的噪声和不均匀的信号。9月15日,在东南大学举办的2019神经元重建及应用国际研讨会中…

Thinkphp js、css压缩类minify

说明:Minify 是用PHP5开发的应用,通过遵循一些Yahoo的优化规则来提高网站的性能。它会合并多个CSS或者JavaScript文件,移除一些不必要的空格和注释,进行gzip压缩,并且会设置浏览器的缓存头。Minify 在设计上和Yahoo的 …

新iPhone的黑科技:UWB技术揭秘!

来源:鲜枣课堂9月11日,苹果公司秋季发布会在乔布斯剧院举行。以iPhone 11为代表的一系列新品揭开了神秘的面纱,与“果粉”见面。新iPhone的特点和参数,相信大家通过各大媒体的介绍已经有所了解。不过有一个细节,不知道…

LeetCode——1954. 收集足够苹果的最小花园周长

通过万岁!!! 题目:这个题目比较复杂,就是给你一个坐标轴,然后让你以0,0为中心选择一个边长为整数的正方形,使得正方形中所有点坐标的绝对值之和要大于给定的neededApples。但是我们需要输出的是…

【人工智能】清华大学张钹院士:人工智能技术已进入第三代

来源:经济观察报近日,中科院院士、清华大学人工智能研究院院长张钹教授接受记者采访时认为,目前基于深度学习的人工智能在技术上已经触及天花板。从长远来看,必须得走人类智能这条路,最终要发展人机协同,人…

莫侵残日噪,正在异乡听

莫侵残日噪,正在异乡听 闷热的傍晚,出来转转,身体被热流裹着,随手抓拍一张,撤! 转载于:https://www.cnblogs.com/xxldannyboy/p/5719460.html

threadlocal get为空_面试常见知识点:ThreadLocal

老套路,先列举下关于ThreadLocal常见的疑问,希望可以通过这篇学习笔记来解决这几个问题:ThreadLocal是用来解决什么问题的?如何使用ThreadLocal?ThreadLocal的实现原理是什么?可否举几个实际项目中使用Thre…

行业观察 | 新一轮AI周期里,华为拿什么破解核心难题?

来源:财经杂志第三方研究机构OpenAI近期发布的研究显示,仅2012年以来,人们对于算力的需求增长六年就超过30万倍,平均每年增长10倍,远超摩尔定律的发展速度。面对AI算力需求的爆发式增长,华为作为AI的后入局…