DeepMind提出图形的「深度生成式模型」,可实现「任意」图形的生成

原文来源:arXiv

作者:Yujia Li、Oriol Vinyals、Chris Dyer、Razvan Pascanu、Peter Battaglia 

「雷克世界」编译:嗯~阿童木呀、KABUDA


一般来说,图形是基本的数据结构,它在诸如知识图、物理和社会交互、语言和化学等许多重要的实际领域中对关系结构进行简明地捕捉。在本文中,我们引入了一种强大的新方法,用于学习图形中的生成式模型,既可以捕捉它们的结构也可以捕捉到属性。我们的方法使用图形神经网络表示图形节点和边缘之间的概率依赖关系,并且原则上来说,可以学习任何任意图形上的分布。经过一系列实验,我们的结果显示,一旦经过训练之后,我们的模型可以生成高质量的合成图和真实分子图的样本,无论是在无条件数据还是条件数据的情况下都是如此。与不使用图形结构表示的基线相比,我们的模型通常表现得更好。我们还探索了学习图形生成式模型过程中所存在的关键性挑战,例如,如何在图形生成过程中处理元素的对称性和排序,并提供可能的解决方案。可以这样说,我们的研究是用于学习任意图形上生成式模型的第一个方法,也是最为通用的方法,并且为从向量和序列式的知识表示,转向更有表现力和更灵活的关系数据结构,开辟了新的研究方向。


图形是许多问题域中信息的本质性表示。例如,知识图表和社交网络中的实体之间的关系可以很好地用图形进行表示,而且它们也适用于对物理世界进行建模,例如,分子结构以及物理系统中物体之间的交互。因此,捕捉特定图形族系分布的能力在实际生活中有很多应用。例如,从图形模型中进行采样可以致使发现新的配置,而这些配置所具有的全局属性与药物发现中所需要的是一样的(Gómez-Bombarelli等人于2016年提出)。要想获得自然语言句子中的图形结构语义表示(Kuhlmann和Oepen于2016年提出),需要具有能够在图上对(条件)分布进行建模的能力。图形上的分布还可以为图形模型的贝叶斯结构学习提供先验(Margaritis于2003年提出)。


生成过程中所采取步骤的描述


我们至少从两个角度对图形的概率模型进行了广泛研究。一种方法是基于随机图形模型,将概率分配给大的图形类型(Erdos和Rényi于1960年、Barabási和Albert于1999年提出)。这些都具有很强的独立性假设,并且被设计成仅捕捉某些特定的图形属性,例如度数分布(degree distribution)和直径。虽然这些方法已被证明在对社交网络等领域进行建模时是有效的,但它们在更加丰富的结构化领域上应用还存在很大的挑战,其中,细微的结构差异在功能上可能是具有重要意义的,例如在化学中领域或自然语言中所表示的意义。


一个更具表现力但也更为脆弱的方法则是使用图形语法,它将机制从形式语言理论中泛化到非序列结构模型中(Rozenberg于1997年提出)。图语法是重写规则的系统,通过中间图的一系列转换递增地导出输出图。虽然符号图形语法(symbolic graph grammars)可以使用标准技术进行随机化或加权(Droste和Gastin于2007年提出),但从可学习性的观点来看,仍然存在两个需要解决的问题。首先,从一组未经注释的图形中引入语法是非常重要的,因为要想对可能用于构建图形的结构构建操作进行理解在算法上是很难进行的(Lautemann于1988年、Aguiñaga等人于2016年提出)。其次,与线性输出语法一样,图形语法在语言内容和要排除内容之间的区分上存在很大的困难,使得这种模型对于一些应用程序来说是不适合应用的,其中,它不适合将0概率分配给某些特定图形。


 图形传播过程的示意图(左),节点选择 fnodes模块(右)


本文引入了一种新的、富有表现力的图形模型,它不需要做任何结构性假设,也避免了基于语法的技术的脆弱性。我们的模型以类似于图形语法的方式生成图形,其中在导出过程中,新结构(特别是新节点或新边缘)被添加到现有图形中,并且该添加事件的概率取决于图形导出的历史记录。为了在导出的每个步骤中对图形进行表示,我们使用一个基于图形结构的神经网络(图形网络)表示。最近,人们对于用于学习图形表示和解决图形预测问题的图形网络(graph nets)很感兴趣。这些模型是根据所利用的图形进行构造的,并且以独立于图形大小的方式进行参数化,因此针对同构图形具有不变性,从而为我们的研究目的提供了一个很好的匹配。

 

在三组数据集中对图形模型和LSTM模型进行训练的曲线


我们在生成具有某些常见拓扑性质(例如:周期性)的随机图形,和以非条件或条件的方式生成分子图形的任务中对我们的模型进行了评估。我们提出的模型在所有的实验中都表现良好,并且比随机图形模型(random graph models)和长短期记忆网络基线(LSTM baselines)获得了更好的结果。


本文所提出的是能够生成任意图形的强大模型。然而,这些模型依然面临着许多挑战。在本文中,我们将讨论未来会面临的一些挑战及可能的解决方案。


排序


节点和边缘的排序对于学习和评估而言都很重要,在实验中,我们总是使用预定义的分配方式排序。然而,通过将排序π视为潜在的变量来学习节点和边缘的排序也许是可能的,这在未来将是一个有趣的探索方向。


长序列


图形模型所使用的生成过程通常是一个长的决策序列,如果其他形式的图形线性化是可用的(例如:SMILES),那么这样的序列通常会缩短2-3倍。这对于图形模型而言是一个很大的劣势,这不仅难以获得准确的概率,还会使训练变得更加困难。为了缓解这一问题,我们可以调整图形模型,以便使其与问题域进行更多地关联,从而将多个决策步骤和循环转为单个步骤。


可扩展性


可扩展性是对本文所提出的图形生成模型的一个挑战。图形网络使用固定的传播步骤T来上传图形中的信息。然而,大的图形往往需要使用大量的T来获取足够的信息,这会限制这些模型的可扩展性。为了解决这一问题,我们可以使用依次扫描边缘的模型(Parisotto等人于2016年提出),或许采取一些由粗到精的生成方法。


训练难度


我们发现训练这样的图形模型要比训练典型的长短期记忆网络模型更为困难,这些模型所要进行训练的序列一般比较长,并且模型结构不断变化还会导致训练不稳定。降低学习速率可以解决很多不稳定问题,但通过调整模型可以获得更加令人满意的解决方案。


本文中,我们提出了一个强大的深度生成模型,其能够通过一个序列性过程生成任意形。我们在一些图形生成问题中对它的属性进行了研究。这一模型已经展现出很大的潜力,并且与标准LSTM模型相比具有独特的优势。我们希望我们的研究成果能够促进这方面的进一步研究,进而获得更好的图形生成模型。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/496748.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

eviews曲线图怎么做_【干货速递】Eviews:你不可不知的经典问答!

更多精彩内容请关注211统计课堂计量经济学是分析啥的?01计量经济学的主要用途或目的主要有两个方面:1.理论检验。这是计量经济学用途最为主要的和可靠的方面。这也是计量经济学本身的一个主要内容。2.预测应用。从理论研究和方法的最终目的看&#xff0c…

感恩的心

不气歌(一) 他人气我我不气,我本无心他来气。 倘若生气中他计,气出病来无人替。 请来医生把病治,反说气病治非易。 茶不思来饭无味,通宵达旦不入睡。 倘你伸腿离我去,撇我一人活受罪。 奉…

Java并发编程实战~并发容器

在容器领域一个容易被忽视的“坑”是用迭代器遍历容器,例如在下面的代码中,通过迭代器遍历容器 list,对每个元素调用 foo() 方法,这就存在并发问题,这些组合的操作不具备原子性。 List list Collections.synchronize…

工信部:筹建全国首个区块链和分布式记账标准化技术委员会

作者:李秀琴在3.15即将来临之时,我国工信部给区块链行业又带来了一大利好消息。3月12日,工业和信息化部(以下简称工信部)在官网发布公告称,其正在就筹建全国区块链和分布式记账技术标准化技术委员会事宜开展…

Python 的 requests 库的用法

Python爬虫利器一之Requests库的用法:http://cuiqingcai.com/2556.html Python利用Requests库写爬虫(一):http://www.jianshu.com/p/e1f8b690b951 Python-第三方库requests详解:http://blog.csdn.net/shanzhizi/articl…

2018 年人工智能会怎么发展?这里有 8 个预测

来源:36氪普华永道发布了一份报告,对人工智能在2018年的发展趋势进行了研究,并做出了8项预测。人工智能非常复杂,而且发展速度很快。任何人都不可能对其未来几年的发展方向做出准确的预测。但就人工智能在2018年的发展趋势来说&am…

C 和 C++ 文件操作详解

来源:http://www.cnblogs.com/likebeta/archive/2012/06/16/2551662.html 来源:http://www.cnblogs.com/likebeta/archive/2012/06/16/2551780.html CPP 的文件操作 在C中,有一个stream这个类,所有的I/O都以这个“流”类为基础的…

redis 判断存在性_springboot + redis + 注解 + 拦截器 实现接口幂等性校验

提醒:后面有些图片模糊,请点击原文查看清晰图片一、概念幂等性, 通俗的说就是一个接口, 多次发起同一个请求, 必须保证操作只能执行一次比如:订单接口, 不能多次创建订单支付接口, 重复支付同一笔订单只能扣一次钱支付宝回调接口, 可能会多次回调, 必须处…

汽车行业最大创新仍未到来,四大力量将重塑未来汽车新纪元

来源: 资本实验室 作者:王进自第一辆福特“T”型车问世以来,汽车行业已经诞生了众多层出不穷、持续进化的创新成果。例如,制造商不断创造了新的车体风格,拓展了新的市场区隔,改进了自动换档和动力转向系…

echarts柱形图x轴y轴互换_数控机床在加工零件时,突然出现X、Y、Z轴失控?如何处理...

数控机床现在广泛应用于单品种大批量的零件加工中,由于稳定性强、精度高、效率高,取代了原来的普通机床。同时数控铣床、数控车床被大规模的配置到各产品自动化生产线上,实现了自动化无入管理。但在生产中由于数控机床的伺服系统出现故障&…

python beautiful soup库的用法

Python 爬虫利器二 之 Beautiful Soup 的用法:http://cuiqingcai.com/1319.html Beautiful Soup 4.2.0 文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html Python3 --- BeautifulSoup --- 节点选择器:https://www.…

Java并发编程实战~原子类

对于简单的原子性问题&#xff0c;还有一种无锁方案&#xff0c;先看看如何利用原子类解决累加器问题。 public class Test {AtomicLong count new AtomicLong(0);public void add10K() {int idx 0;while(idx < 10000) {count.getAndIncrement();}}} 无锁方案相对互斥锁…

著名物理学家斯蒂芬•霍金去世,他曾告诫人类要学会避免人工智能可能的风险

据多家媒体报道&#xff0c;著名的英国物理学家斯蒂芬霍金于3 月 14 日去世&#xff0c;享年 76 岁。霍金教授的孩子露西&#xff0c;罗伯特和蒂姆发表了声明确认了这一消息。斯蒂芬威廉霍金(Stephen William Hawking)&#xff0c;1942年1月8日出生于英国牛津&#xff0c;英国剑…

电路板上的插头怎么拔下来_空调插头一直不拔费电吗?实测一周竟然发现了真相!...

随着气温的不断走低&#xff0c;全国绝大部分城市已经进入了真正意义上的秋天。那么&#xff0c;经过了酷热一夏&#xff0c;你家的空调电源插头拔掉了吗? 说道空调&#xff0c;想必大家都知道这“家伙”可是耗电大户。尤其在七八月份&#xff0c;几乎都是24小时不停机在运行。…

C++ stringstream

参考&#xff1a;http://www.usidcbbs.com/read-htm-tid-1898.html 常见格式串 %% 印出百分比符号&#xff0c;不转换。 %c 整数转成对应的 ASCII 字元。 %d 整数转成十进位。 %f 倍精确度数字转成浮点数。 %o 整数转成八进位。 %s 整数转成字符串。 %x 整数转成小写十六进位…

Java并发编程实战~思维导图

#原图 System.out.println("https://www.processon.com/view/link/61a235be1efad425fd6ff5f6")

中国“脑计划”研究正在悄然布局

来源&#xff1a;中国科学报 作者&#xff1a;黄辛 作为“十三五”上海科研发展的重点&#xff0c;一张神奇的脑计划研究“地图”正在悄然加紧布局。日前&#xff0c;在教育部科技司、国家自然科学基金委员会政策局、华东师范大学主办的“交叉融合的教育科学基础研究”研讨会上…

JDBC链接SQLServer2005 Express

SQLServer2005的数据库链接的jar包可以到微软网站上去下载&#xff0c;驱动和链接字符串如下&#xff1a; 1: String driver "com.microsoft.sqlserver.jdbc.SQLServerDriver"; 2: String url "jdbc:sqlserver://localhost:1433;databaseNamepubs"; SQLS…

dnf时装预览怎么打开_DNF:史上最好看时装上线,大佬已经玩疯,全服都是真香的气息...

大家好&#xff01;我是风柜君&#xff0c;这次又是我来给大家带来DNF游戏内外的趣事&#xff0c;希望各位喜欢。DNF国服将在6月18日迎来第11周年庆&#xff0c;而在此之前&#xff0c;国服在6月6日的时候已经更新了一波周年庆预热活动。这次的更新除了普雷妮普通副本以外&…

深度解析:AWS、谷歌云、IBM Cloud和微软 Azure四巨头2018将会有哪些布局?

来源&#xff1a; IDC圈近来&#xff0c;公司规模已经不再是企业选择云服务商的重要因素&#xff0c;市场对云服务商优劣的判断有了多种标准。企业对全球一些大型云计算服务商&#xff08;例如亚马逊AWS&#xff0c;谷歌云平台&#xff0c;IBM Cloud和微软 Azure等&#xff09;…