论文浅尝 | 面向跨语言实体对齐的知识图谱与实体描述协同嵌入方法

640?wx_fmt=png

来源: IJCAI2018

链接: https://www.ijcai.org/proceedings/2018/0556.pdf

动机

近年来，随着多语言知识图谱嵌入(Multilingual KG embedding)的研究，实体的潜在语义表示以及跨语言知识推理等任务均取得一定成效，因此也推动了许多知识驱动的跨语言工作。然而，受限于各语言知识图谱之间较低的实体对齐(Entity alignment)程度，跨语言推理的准确性往往不够令人满意。

考虑到多语言知识图谱中具有对实体的文字性描述，文章提出一种基于嵌入(Embedding)的策略：通过利用图谱中实体的文字描述，对仅包含弱对齐（KG中的inter-language links，ILLs）的多语图谱做半监督的跨语言知识推理。

为了有效利用图谱知识以及实体的文字描述，文章提出通过协同训练(Co-train)两个模块从而构建模型KDCoE：多语言知识嵌入模块；多语言实体描述嵌入模块。

贡献

文章的贡献有：

（1）提出了一种半监督学习方法KDCoE，协同训练了多语知识图谱嵌入和多语实体描述嵌入用于跨语言知识对齐；

（2）证明KDCoE在Zero-shot实体对齐以及跨语言知识图谱补全(Cross-lingual KG Completion)任务上的有效性；

方法

1. 多语言知识图谱嵌入Monolingual KG Embeddings, KGEM

由知识模型(Knowledge Model)和对齐模型(Alignment Model)两个部分构成，分别从不同角度学习结构化知识。

知识模型：用于保留各语言知识嵌入空间中的实体和关系

文章采用了传统的TransE方法构建知识模型，并认为这种方法有利于在跨语言任务重中保持实体表示的统一性，且不会受到不同关系上下文带来的影响。其对应的目标损失函数如下：

640?wx_fmt=png

其中，L表示某种语言，(L_i，L_j)表示一组语言对，G_L表示语言 L 对应的知识图谱， 640?wx_fmt=png 反映的是图谱中三元组 (h,r,t) 之间的相异度，是一个 positive margin，[x]₊则表示取 x 的正值部分，表示一组伯努利负采样三元组，用于替换图谱三元组中的 h 和 t.

对齐模型：用于在不同语言的嵌入空间中获取跨语言关联

为了将不同语言间的知识关联起来，文章参照MTransE中的线性转换策略，其目标函数如下：

640?wx_fmt=png

其中(e, e')是一组已知的对齐实体，当知识嵌入向量的维度为 k₁时，M_ij是一个 640?wx_fmt=png 的线性转换矩阵，用于将 L_i 语言的实体向量转换为 L_j 语言。这里与 MTransE 方法不同的是，文章仅计算了跨语言实体嵌入而非三元组整体嵌入。

KGEM的目标函数：

640?wx_fmt=png

其中， 640?wx_fmt=png 是一个正超参数

2. 多语言实体描述嵌入 Multilingual Entity Description Embeddings, DEM

DEM过程包含两个部分：编码和跨语言嵌入

1) 编码：

文章使用 Attentive Gated Recurrent Unit encoder, AGRU 对多语言实体描述进行编码，可以理解为带有 self-attention 的 GRU 循环网络编码器。

文章希望利用self-attention机制使得编码器能够凸显实体描述句子中的关键信息，AGRU中的self-attention可以定义为以下公式：

640?wx_fmt=png

其中，u_t 是由 GRU 中 s_t 产生的隐藏表示，attention 权值 a_t 则是由一个 softmax 函数计算得到，反映的是单词 x_t 对于序列 X 的重要性，而后依据此权重与隐藏表示可以得到 self-attention 的输出 v_t_，|X|(输入序列的长度)用于防止 v_t 失去原有的规模。