笔记整理 | 陈湘楠,浙江大学在读硕士。
现有的知识图谱补全方法都在试图设计全新的学习算法,来使用已知的事实信息去推理知识图谱中的潜在语义。但随着知识图谱的广泛使用,知识图谱中的许多实体对应着应用程序系统的在线项目。但知识图谱和应用程序这两种数据源具有不同的内在特征,简单的融合策略反而会影响知识图谱的性能。本文首先基于图神经网络提出一种协同表示学习算法从应用系统中的用户交互数据中挖掘其对应的实体偏好信息,之后提出一种对抗学习方法UPGAN,将学习到的实体偏好信息用于知识图谱补全任务。
本文方法概览如下:
1.协同表示学习算法
学习以实体为导向的用户偏好
其中是用户结点初始的表示学习,
表示概览图中的结点。
表示对于实体nj在概览图中的的前向三元组。
学习用户偏好增强的实体表示
其中表示对于实体nj在概览图中的的前向三元组。
2.对抗学习
对抗学习要优化的目标函数
其中θG表示生成器G的参数,θD表示判别器D的参数。对于生成器G,通过生成候选实体,计算公式和生成器的损失函数如下:
对于判别器D,通过计算候选实体是答案的概率,计算公式和判别器的损失函数如下:
实验部分作者构建了三种不同用户交互领域的数据集:电影、音乐和书籍。并分别在这三个数据集中做链接预测任务。实验结果如下:
从实验结果中可以看出UPGAN相较于其他可比较的方法,在链接预测任务上都有明显提升,并且能更好地利用用户偏好信息。
欢迎有兴趣的同学阅读原文。
OpenKG
开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。
点击阅读原文,进入 OpenKG 网站。