DeepMind提出图形的「深度生成式模型」,可实现「任意」图形的生成

原文来源:arXiv

作者:Yujia Li、Oriol Vinyals、Chris Dyer、Razvan Pascanu、Peter Battaglia 

「雷克世界」编译:嗯~阿童木呀、KABUDA


一般来说,图形是基本的数据结构,它在诸如知识图、物理和社会交互、语言和化学等许多重要的实际领域中对关系结构进行简明地捕捉。在本文中,我们引入了一种强大的新方法,用于学习图形中的生成式模型,既可以捕捉它们的结构也可以捕捉到属性。我们的方法使用图形神经网络表示图形节点和边缘之间的概率依赖关系,并且原则上来说,可以学习任何任意图形上的分布。经过一系列实验,我们的结果显示,一旦经过训练之后,我们的模型可以生成高质量的合成图和真实分子图的样本,无论是在无条件数据还是条件数据的情况下都是如此。与不使用图形结构表示的基线相比,我们的模型通常表现得更好。我们还探索了学习图形生成式模型过程中所存在的关键性挑战,例如,如何在图形生成过程中处理元素的对称性和排序,并提供可能的解决方案。可以这样说,我们的研究是用于学习任意图形上生成式模型的第一个方法,也是最为通用的方法,并且为从向量和序列式的知识表示,转向更有表现力和更灵活的关系数据结构,开辟了新的研究方向。


图形是许多问题域中信息的本质性表示。例如,知识图表和社交网络中的实体之间的关系可以很好地用图形进行表示,而且它们也适用于对物理世界进行建模,例如,分子结构以及物理系统中物体之间的交互。因此,捕捉特定图形族系分布的能力在实际生活中有很多应用。例如,从图形模型中进行采样可以致使发现新的配置,而这些配置所具有的全局属性与药物发现中所需要的是一样的(Gómez-Bombarelli等人于2016年提出)。要想获得自然语言句子中的图形结构语义表示(Kuhlmann和Oepen于2016年提出),需要具有能够在图上对(条件)分布进行建模的能力。图形上的分布还可以为图形模型的贝叶斯结构学习提供先验(Margaritis于2003年提出)。


生成过程中所采取步骤的描述


我们至少从两个角度对图形的概率模型进行了广泛研究。一种方法是基于随机图形模型,将概率分配给大的图形类型(Erdos和Rényi于1960年、Barabási和Albert于1999年提出)。这些都具有很强的独立性假设,并且被设计成仅捕捉某些特定的图形属性,例如度数分布(degree distribution)和直径。虽然这些方法已被证明在对社交网络等领域进行建模时是有效的,但它们在更加丰富的结构化领域上应用还存在很大的挑战,其中,细微的结构差异在功能上可能是具有重要意义的,例如在化学中领域或自然语言中所表示的意义。


一个更具表现力但也更为脆弱的方法则是使用图形语法,它将机制从形式语言理论中泛化到非序列结构模型中(Rozenberg于1997年提出)。图语法是重写规则的系统,通过中间图的一系列转换递增地导出输出图。虽然符号图形语法(symbolic graph grammars)可以使用标准技术进行随机化或加权(Droste和Gastin于2007年提出),但从可学习性的观点来看,仍然存在两个需要解决的问题。首先,从一组未经注释的图形中引入语法是非常重要的,因为要想对可能用于构建图形的结构构建操作进行理解在算法上是很难进行的(Lautemann于1988年、Aguiñaga等人于2016年提出)。其次,与线性输出语法一样,图形语法在语言内容和要排除内容之间的区分上存在很大的困难,使得这种模型对于一些应用程序来说是不适合应用的,其中,它不适合将0概率分配给某些特定图形。


 图形传播过程的示意图(左),节点选择 fnodes模块(右)


本文引入了一种新的、富有表现力的图形模型,它不需要做任何结构性假设,也避免了基于语法的技术的脆弱性。我们的模型以类似于图形语法的方式生成图形,其中在导出过程中,新结构(特别是新节点或新边缘)被添加到现有图形中,并且该添加事件的概率取决于图形导出的历史记录。为了在导出的每个步骤中对图形进行表示,我们使用一个基于图形结构的神经网络(图形网络)表示。最近,人们对于用于学习图形表示和解决图形预测问题的图形网络(graph nets)很感兴趣。这些模型是根据所利用的图形进行构造的,并且以独立于图形大小的方式进行参数化,因此针对同构图形具有不变性,从而为我们的研究目的提供了一个很好的匹配。

 

在三组数据集中对图形模型和LSTM模型进行训练的曲线


我们在生成具有某些常见拓扑性质(例如:周期性)的随机图形,和以非条件或条件的方式生成分子图形的任务中对我们的模型进行了评估。我们提出的模型在所有的实验中都表现良好,并且比随机图形模型(random graph models)和长短期记忆网络基线(LSTM baselines)获得了更好的结果。


本文所提出的是能够生成任意图形的强大模型。然而,这些模型依然面临着许多挑战。在本文中,我们将讨论未来会面临的一些挑战及可能的解决方案。


排序


节点和边缘的排序对于学习和评估而言都很重要,在实验中,我们总是使用预定义的分配方式排序。然而,通过将排序π视为潜在的变量来学习节点和边缘的排序也许是可能的,这在未来将是一个有趣的探索方向。


长序列


图形模型所使用的生成过程通常是一个长的决策序列,如果其他形式的图形线性化是可用的(例如:SMILES),那么这样的序列通常会缩短2-3倍。这对于图形模型而言是一个很大的劣势,这不仅难以获得准确的概率,还会使训练变得更加困难。为了缓解这一问题,我们可以调整图形模型,以便使其与问题域进行更多地关联,从而将多个决策步骤和循环转为单个步骤。


可扩展性


可扩展性是对本文所提出的图形生成模型的一个挑战。图形网络使用固定的传播步骤T来上传图形中的信息。然而,大的图形往往需要使用大量的T来获取足够的信息,这会限制这些模型的可扩展性。为了解决这一问题,我们可以使用依次扫描边缘的模型(Parisotto等人于2016年提出),或许采取一些由粗到精的生成方法。


训练难度


我们发现训练这样的图形模型要比训练典型的长短期记忆网络模型更为困难,这些模型所要进行训练的序列一般比较长,并且模型结构不断变化还会导致训练不稳定。降低学习速率可以解决很多不稳定问题,但通过调整模型可以获得更加令人满意的解决方案。


本文中,我们提出了一个强大的深度生成模型,其能够通过一个序列性过程生成任意形。我们在一些图形生成问题中对它的属性进行了研究。这一模型已经展现出很大的潜力,并且与标准LSTM模型相比具有独特的优势。我们希望我们的研究成果能够促进这方面的进一步研究,进而获得更好的图形生成模型。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/496748.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

eviews曲线图怎么做_【干货速递】Eviews:你不可不知的经典问答!

更多精彩内容请关注211统计课堂计量经济学是分析啥的?01计量经济学的主要用途或目的主要有两个方面:1.理论检验。这是计量经济学用途最为主要的和可靠的方面。这也是计量经济学本身的一个主要内容。2.预测应用。从理论研究和方法的最终目的看&#xff0c…

感恩的心

不气歌(一) 他人气我我不气,我本无心他来气。 倘若生气中他计,气出病来无人替。 请来医生把病治,反说气病治非易。 茶不思来饭无味,通宵达旦不入睡。 倘你伸腿离我去,撇我一人活受罪。 奉…

Python-OpenCV 图像与视频处理

来源:https://segmentfault.com/a/1190000003742481 一直断断续续的用过几次 OpenCV,感觉熟练掌握它的使用方法已经变的非常必要了,正好找到一个很不错的英文教程,就以此为起点,详细记录一下对 OpenCV 的学习过程吧。 …

C++学习之路 | PTA乙级—— 1086 就不告诉你 (15 分)(精简)

1086 就不告诉你 (15 分) 做作业的时候,邻座的小盆友问你:“五乘以七等于多少?”你应该不失礼貌地围笑着告诉他:“五十三。”本题就要求你,对任何一对给定的正整数,倒着输出它们的乘积。 输入格式&#xf…

Java并发编程实战~并发容器

在容器领域一个容易被忽视的“坑”是用迭代器遍历容器,例如在下面的代码中,通过迭代器遍历容器 list,对每个元素调用 foo() 方法,这就存在并发问题,这些组合的操作不具备原子性。 List list Collections.synchronize…

12c oracle 激活_Windows运维之Windows server 2016 安装及ORACLE 12C 安装

本文主要向大家介绍了Windows运维之Windows server 2016 安装及ORACLE 12C 安装,通过具体的内容向大家展现,希望对大家学习Windows运维有所帮助。首先创建虚拟机,选择windows server 2016启动虚拟机,进入安装界面,语言…

工信部:筹建全国首个区块链和分布式记账标准化技术委员会

作者:李秀琴在3.15即将来临之时,我国工信部给区块链行业又带来了一大利好消息。3月12日,工业和信息化部(以下简称工信部)在官网发布公告称,其正在就筹建全国区块链和分布式记账技术标准化技术委员会事宜开展…

PowerDesigner11技巧

文章来源:http://blog.csdn.net/edeed/archive/2006/02/10/596271.aspx 1、安装PD v11.0版 2、由pdm生成建表脚本时,字段超过15字符就发生错误(oracle) 原因未知,解决办法是打开PDM后,会出现Database的菜单…

C++学习之路 | PTA乙级—— 1087 有多少不同的值 (20 分)(精简)

1087 有多少不同的值 (20 分) 当自然数 n 依次取 1、2、3、……、N 时,算式 ⌊n/2⌋⌊n/3⌋⌊n/5⌋ 有多少个不同的值?(注:⌊x⌋ 为取整函数,表示不超过 x 的最大自然数,即 x 的整数部分。) 输入…

Python 的 requests 库的用法

Python爬虫利器一之Requests库的用法:http://cuiqingcai.com/2556.html Python利用Requests库写爬虫(一):http://www.jianshu.com/p/e1f8b690b951 Python-第三方库requests详解:http://blog.csdn.net/shanzhizi/articl…

Java并发编程实战~Lock

再造管程的理由 synchronized导致死锁问题,提出了一个破坏不可抢占条件方案,但是这个方案 synchronized 没有办法解决。原因是 synchronized 申请资源的时候,如果申请不到,线程直接进入阻塞状态了,而线程进入阻塞状态…

wpf 点击按钮弹出选择框_WPF-PopupWindow wpf右下角弹出框,通过按钮调用,类似QQ CSharp C#编程 238万源代码下载- www.pudn.com...

文件名称: WPF-PopupWindow下载收藏√ [5 4 3 2 1 ]开发工具: C#文件大小: 90 KB上传时间: 2013-07-24下载次数: 19详细说明:wpf右下角弹出框,通过按钮调用,类似QQ弹出框-wpf lower right corner of the pop-up box文件列表(点击判断是否…

2018 年人工智能会怎么发展?这里有 8 个预测

来源:36氪普华永道发布了一份报告,对人工智能在2018年的发展趋势进行了研究,并做出了8项预测。人工智能非常复杂,而且发展速度很快。任何人都不可能对其未来几年的发展方向做出准确的预测。但就人工智能在2018年的发展趋势来说&am…

异常单据锁定涉及的数据库表

在软件使用过程中出现单据锁定提示,进入系统管理清除单据锁定,再进入软件还是提示单据锁定.(包括:审核凭证时提示单据锁定;不能录入期初余额,提示单据锁定;银行对帐单锁定 等情况) 造…

C 和 C++ 文件操作详解

来源:http://www.cnblogs.com/likebeta/archive/2012/06/16/2551662.html 来源:http://www.cnblogs.com/likebeta/archive/2012/06/16/2551780.html CPP 的文件操作 在C中,有一个stream这个类,所有的I/O都以这个“流”类为基础的…

redis 判断存在性_springboot + redis + 注解 + 拦截器 实现接口幂等性校验

提醒:后面有些图片模糊,请点击原文查看清晰图片一、概念幂等性, 通俗的说就是一个接口, 多次发起同一个请求, 必须保证操作只能执行一次比如:订单接口, 不能多次创建订单支付接口, 重复支付同一笔订单只能扣一次钱支付宝回调接口, 可能会多次回调, 必须处…

C++学习之路 | PTA乙级—— 1089 狼人杀-简单版(精简)

1089 狼人杀-简单版 (20 分)以下文字摘自《灵机一动好玩的数学》:“狼人杀”游戏分为狼人、好人两大阵营。在一局“狼人杀”游戏中,1 号玩家说:“2 号是狼人”,2 号玩家说:“3 号是好人”,3 号玩家说&#…

Java并发编程实战~Condition

利用两个条件变量快速实现阻塞队列呢&#xff1f; public class BlockedQueue<T>{final Lock lock new ReentrantLock();// 条件变量&#xff1a;队列不满 final Condition notFull lock.newCondition();// 条件变量&#xff1a;队列不空 final Condition notEmpty …

汽车行业最大创新仍未到来,四大力量将重塑未来汽车新纪元

来源&#xff1a; 资本实验室 作者&#xff1a;王进自第一辆福特“T”型车问世以来&#xff0c;汽车行业已经诞生了众多层出不穷、持续进化的创新成果。例如&#xff0c;制造商不断创造了新的车体风格&#xff0c;拓展了新的市场区隔&#xff0c;改进了自动换档和动力转向系…

C++学习之路 | PTA乙级——1090 危险品装箱 (25 分)(精简)

1090 危险品装箱 (25 分) 集装箱运输货物时&#xff0c;我们必须特别小心&#xff0c;不能把不相容的货物装在一只箱子里。比如氧化剂绝对不能跟易燃液体同箱&#xff0c;否则很容易造成爆炸。 本题给定一张不相容物品的清单&#xff0c;需要你检查每一张集装箱货品清单&#x…