斯坦福大学「黑盒学习」研究:使用神经变分推理的无向图模型,可替代「采样」 | 附NIPS 2017论文

来源:雷克世界

编译:嗯~阿童木呀、多啦A亮

概要:机器学习中的许多问题可以自然地用无向图模型的语言表达。在这里,我们提出了无向模型的黑箱学习和推理算法,优化了模型的对数似然的变分近似。我们的方法的核心是我们表示为灵活神经网络的函数q参数化配分函数的上限。


摘要:


机器学习中的许多问题可以自然地用无向图模型的语言表达。在这里,我们提出了无向模型的黑箱学习和推理算法,优化了模型的对数似然的变分近似。我们的方法的核心是我们表示为灵活神经网络的函数q参数化配分函数的上限。它在学习过程中使得配分函数成为可能,加速采样,并通过统一的变分推理框架来训练各种混合有向/无向模型。我们经验性地证明了我们的方法在几个流行的生成建模数据集上的有效性。


 

介绍


机器学习中的许多问题可以自然地用无向图模型的语言表达。无向图模型用于计算机视觉、语音识别、社会科学、深度学习等其他领域。许多基本的机器学习问题都以无向模型为中心,然而,这类分布的推理和学习会带来很大的计算挑战。

 

在这里,我们尝试通过针对无向概率图模型P的新变分推理和学习技术来解决这些挑战。我们方法的核心是,无向概率模型P的对数划分函数的上限是由一个近似分布q来表示的,我们表示为一个灵活的神经网络。当q = p时,我们的界是紧密的,对q感兴趣的类在q的参数中是凸的。最有趣的是,它导致了对数似然函数log p的下限,这使得我们能够在一个类似于黑盒变分推理的变分框架中拟合无向模型。


我们的方法相比以前的方法有了许多优点。首先,它能够以黑箱方式训练无向模型,即我们不需要知道模型的结构来计算梯度估计(例如,如在吉布斯采样中那样)。相反,我们的估计只需要评估模型的非标准化概率。在q和p联合优化时,我们的界也提供了一种在学习过程中跟踪配分函数的方法。在推理时,从我初始化的MCMC链(或者它本身可以提供样本)的无向模型中,学习的近似分布q可以用来加速采样。此外,我们的方法自然地集成了最近的有向图模型的变分推理方法。我们预计我们的方法将在自动化概率推理系统中最为有用。


作为我们如何使用这些方法的一个实例,我们研究了不同类别的混合有向/无向模型,并展示了如何在一个统一的黑箱神经变分推理框架中对它们进行训练。那些混合模型已经在早期的深度学习文献中很流行,并从神经科学的原理中获得灵感。它们对相同数量的变量也具有较高的建模能力。相当有趣的是,我们确定了设置使模型也更容易训练。


实验


对近似分布可视化

 


我们训练了限玻尔兹曼机(RBM)模型,对q的每一步执行两个梯度步骤。上图显示了混合伯努利q的每个组分的平均分布; 人们可以在其中区分各种数字的形状。这证实q确实接近于p。


加速无向模型的采样

 


模型完成训练后,我们可以用近似q来初始化一个MCMC采样链。 由于q是p的粗略近似,因此产生的链应该混合得更快。为了证实这个想法,我们在随机初始化的吉布斯(Gibbs)抽样链(顶部)以及从q(底部)样本初始化的链中绘制相邻图形样本。后一种方法在几个步骤中看起来的数字似乎是可信的,而前者产生样本是比较模糊的。


相关研究


其实,我们的研究主要启发于对变分自编码器和相关模型的黑盒变分推理,其中,涉及对由神经网络参数化的近似后验概率进行拟合。而我们的研究为无向模型提供了类似的方法。广泛应用的无向模型包括受限深度玻尔兹曼机(Restricted and Deep Boltzmann Machines)以及深度信念网络(Deep Belief Networks)。而与我们的研究最为接近的就是离散的VAE模型。然而,Rolfe试图对p(x|z)进行有效的优化,而RBM的先验p(z)是使用PCD进行优化的。在我们的研究中是使用标准技术来对p(x|z)进行优化的,并且将着重关注p(z)。


更普遍地来讲,我们的研究提出了一种替代性方法,可以替代基于采样的学习方法,而大多数无向模型的变分方法都是以推理为中心的。我们的方法可以扩展到中小型数据集,并且在混合有向/无向生成式模型(hybrid directed-undirected generative models)中最为有用。它的速度可与PCD方法媲美,并能够提供附加的益处,如分区函数追踪(partition function tracking)和加速采样。最重要的是,我们的算法是黑盒式的,并且在不需要知道模型结构的情况下就可以推导出梯度或进行分区函数评估。我们预期我们的方法将在诸如Edward这样的自动推理系统中最为有用。


另外,我们方法的可扩展性局限性主要在于,当q与P不能进行很好的拟合时,对梯度和分区函数进行蒙特卡罗评估中的高方差。在实际中,我们发现诸如拟似然(pseudo-likelihood)这样的简单度量法在诊断这个问题上是非常有效的。当用RBM先验对深度生成模型进行训练时,我们注意到弱q的引入模型崩溃了(但是训练仍然收敛)。然后我们通过增加q的复杂性并使用更多的样本解决了这些问题。最后,我们还发现q梯度的得分函数评估器不能很好地向较高的维度扩展。而更好的梯度评估器可能会进一步改进我们的方法。


结论


综上所述,本文提出了新的无向模型的变分学习和推理算法,从重要抽样和χ2散度最小化的角度出发,优化了配分函数的上限。我们的方法通过黑匣子的方式训练无向模型,并将在自动推理系统中产生作用。我们的框架在速度方面与采样方法相比具有竞争性,并且提供了额外的优点,如配分函数跟踪和加速采样。我们的方法也可以用来训练使用统一变分框架的混合有向/无向模型。最有趣的是,它使具有离散潜变量的生成模型更具表现力和更容易训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/498250.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在html中怎么设置页面边距,在打印网页时怎么设置调整页边距

在打印网页时怎么设置调整页边距今天给大家介绍一下在打印网页时怎么设置调整页边距的具体操作步骤。1. 首先打开电脑,找到想要打印的网页打开。2. 点打开之后,在页面右上角点击三横图标。3. 在弹出的选项中点击“打印”选项。4. 进入打印页面后&#xf…

果蝇大脑研究能够改进计算机相似性搜索算法

来源:cnBeta.COM 概要:一项新的研究表明对果蝇大脑的研究可能作为计算机科学算法改进的关键基础,增强搜索引擎/人工智能在“相似性搜索”算法方面的准确性。 一项新的研究表明对果蝇大脑的研究可能作为计算机科学算法改进的关键基础&#xff…

ie11不识别html5影片,IE11无法显示flash?IE11无法播放视频的解决方法

ie11无法显示flash怎么办呢?ie11无法播放视频了,ie10也出现同样的问题,这该怎么办呢?下面小编就给你带来ie11无法显示flash解决方法。方法一:关闭IE10/IE11的Active刷选功能由于Adobe Flash Player IE版采用ActiveX控件加载方式运作&#x…

物联网时代传感器厂商竞争格局揭秘

来源:WPR 概要:中国作为全球最大的传感器消费市场,物联网产业圈的构建势在必行, 据预测,“十三五”期间,我国传感器市场年均复合增长率将达到30%以上。 中国作为全球最大的传感器消费市场,物联网…

html改元素怎么保存,是否可以在NW.js中保存html元素更改?

我正在开发一个简单的应用程序,允许用户上传图像和视频,同时这样做会自动为上传并包装的每个内容生成。每个上传的图片都保留在前一个特别风格化的图片旁边。我想要的是每次上传后(图片或视频),即使我关闭我的应用程序,它仍然存在…

机器对工作、生产力及全球经济的影响

来源:亿欧 概要:计算机科学家,经济学家和行业专家谈到了包括法律政策,技术挑战和辅助技术在内的一系列话题。 本周,麻省理工学院举办了“人工智能与工作的未来”峰会,重点讨论帮助行业,政府和员…

Html如何触发闹铃,事件闹钟设置.html

事件闹钟设置$axure.utils.getTransparentGifPath function() { return resources/images/transparent.gif; };$axure.utils.getOtherPath function() { return resources/Other.html; };$axure.utils.getReloadPath function() { return resources/reload.html…

CapsNet日益火爆!Hinton大神横扫AI界的「胶囊网络」如何理解?

来源:雷克世界 编译:嗯~阿童木呀 概要:Geoff Hinton等人最近关于胶囊网络(Capsule networks)的论文在机器学习领域造成相当震撼的影响。 Geoff Hinton等人最近关于胶囊网络(Capsule networks)的…

html code box插件,VS Code常用插件

基础必备插件1、View In Browser在浏览器里预览网页必备。2、vscode-icons改变编辑器里面的文件图标,个人比较稀饭这个。其他的这里就不说了。在这里插入图片描述3、Bracket Pair Colorizer给嵌套的各种括号加上不同的颜色。在这里插入图片描述4、Highlight Matchin…

新研究旨在用“黑箱”算法解决人工智能偏差问题

来源:亿欧 概要:随着越来越多的自动化决策,能够理解AI如何思考对我们来说变得越来越重要。 随着越来越多的自动化决策,能够理解AI如何思考对我们来说变得越来越重要。从挑选股票到检查X射线,人工智能越来越多地被用来…

清华大学:刘洋——基于深度学习的机器翻译

来源:图灵人工智能 概要:机器翻译的目标是利用计算机实现自然语言之间的自动翻译。机器翻译经历了规则机器翻译、统计机器翻译、神经机器翻译。 刘洋,清华大学计算机科学与技术系副教授,博士生导师,国家优秀青年基金获…

CMU本科计算机科学,CMU计算机科学学院本科难录吗?

卡内基梅陇大学计算机科学学院难录吗?CMU各个学院最难录的一个!1、2020第一学年新生计算机科学学院本科录取率:APPLICATIONS:6,681ADMITTED:479ENROLLED:219录取率:7%2、2020年卡内基梅陇大学计算机科学学院本科录取分数要求&…

从神经科学到计算机视觉:人类与计算机视觉五十年回顾

来源:全球人工智能 概要:在过去某段时间里,研究者们可能从来没有想过创建类似人类大脑处理任务一样的系统。 如何像人类大脑一样完成一项视觉任务是复杂的,比如深度感知、目标跟踪、边缘检测等,而扫描环境和定位是大脑…

计算机维修队,浙江万里学院计算机维修队

浙江万里学院计算机维修队语音编辑锁定讨论上传视频浙江万里学院计算机维修队是在校团委、计算机与信息学院的直接关怀与支持下,于2001年成立的一个公益性学生社团。她集维修、咨询、开展活动于一体,拥有较强的技术实力。计算机维修队根本任务是在浙江万…

深度解读:美国自动驾驶技术及测试示范区现状

来源: 公安部交通管理科研所微发布 作者:袁建华、王敏、陆文杰、罗为明、郑羽强 ,道路交通集成优化与安全分析技术国家工程实验室自动驾驶测试技术研发部 当前,美、欧、日等发达国家及地区对智能网联技术的支持不仅是在政策研究、…

计算机一级考试题组成,计算机一级考试试题汇总

计算机一级考试试题汇总2017年9月计算机一级考试将于9月23日-26日进行,为帮助考生们复习备考,以下是百分网小编搜索整理的一份计算机一级考试试题汇总。A 第一部分:单选题(每小题1分共30分)注意:打开你考试文件夹中的EXCEL工作簿文…

AI吉尼斯:那些你不知道的人工智能之“最”

来源:百度AI 概要:今天我们在这里隆重召开第一届(可能也是最后一届)AI吉尼斯,为各路AI好汉颁发“世界之最”大奖杯。 《吉尼斯世界纪录大全》里的这些人类都这么拼了,服(i)务&#…

深度 | 谷歌的新CNN特征可视化方法,构造出一个华丽繁复的新世界

作者:晓凡 概要:近日,来自谷歌大脑和谷歌研究院的一篇技术文章又从一个新的角度拓展了人类对神经网络的理解,得到的可视化结果也非常亮眼、非常魔性。 深度神经网络解释性不好的问题一直是所有研究人员和商业应用方案上方悬着的一…

年增长率超50%,AI芯片竞争白热化

来源:华尔街日报 概要:随着智能手机和个人电脑销售数量减少,芯片厂商正在竞相开发人工智能产品,以推动业绩增长。 随着智能手机和个人电脑销售数量减少,芯片厂商正在竞相开发人工智能产品,以推动业绩增长。…

win7需要计算机管理员权限,Win7系统提示“需要管理员权限”如何解决?

最近有Win7系统用户反映,很经常在安装软件或者对文件进行操作的时候,系统提示“需要管理员权限”,这让用户感觉很厌烦。其实对于这个问题,可能是系统设置问题,也可能是文件本身设置了安全访问限制,只要进行…