论文浅尝 | 基于事理图谱的脚本事件预测

论文笔记整理:邱圣广,南京大学硕士,研究方向为自然语言处理。


链接:https://www.ijcai.org/proceedings/2018/0584.pdf

 

绪论

1.  脚本事件预测

脚本事件预测这个任务最早是由Chambers andJurafsky于2008年提出来的,要求给定一个事件的上下文 (context),需要从候选列表中选出接下来最可能要发生的事件,如下图所示:

这是在餐馆场景下发生的一系列事件,根据已经发生的事件,5个候选事件中下一个最可能发生的事件就是离开餐馆(leave)。

2.  亮点

现有的关于脚本事件预测的方法主要是基于事件对和事件链的,但是会存在以下缺陷,如下图所示:

给定上下文:enter,order,serve,现在要从talk和eat这两个候选事件中选出下一个最可能发生的事件。在基于事件对和事件链的方法中,如(b)所示,在训练的时候,会发现(serve,talk)一起出现的频率要高于(serve,eat),因此在预测的时候选择talk的概率会更高;而在基于事件图结构(即事理图谱)的方法中,如(c)所示,(order,serve,eat)构成了一个强联通分量,这暗示了eat更可能是正确答案。

3.  论文贡献

(1) 第一个在脚本事件预测这个任务上提出基于图结构的方法

(2) 提出一个大规模图神经网络(Scaled Graph Neural Network),从而可以对大规模稠密有向图中的事件关系进行建模,进而学习出更好的事件表示。

模型

1.  事理图谱(NEEG)的构建

(1)  从语料库中抽取事件链

从语料库中抽出所有事件链:, 其中 表示一个事件链 ,  e_i 表示事件,采用四元组的形式表示,其中 p 表示谓语动词, a0, a1,a2 分别表示谓语动词的主语、直接宾语、间接宾语; T 则是被这个事件链中所有事件共享的主人公。下面是一个事件链的例子:s_i = {T=customer, walk{T,restaurant,-}, seat(T,-,-), read(T,menu,-), order(T,food,-),serve(waiter,food,T),eat(T,food,fork)}。

(2)  根据事件链构建图谱

• 根据抽出的事件链,事理图谱就可以形式化定义成一个图结构,其中中每个节点代表事件, 中每条边表示事件之间的关系。

•        为了解决稀疏问题,在图谱中每个事件都采用一种叫做谓词语法(predicate-GR)的形式 (v_i, r_i) 来表示,其中 v_i 表示为谓语动词,r_i 表示谓语动词与链实体之间的语法依赖关系,如 eat(T,food,fork) 用 predicate-GR 表示就是 (eat,subj)。

•        然后每条有向边的权重就可以通过以下公式计算得到:

2.  大规模图神经网络(SGNN

SGNN在GGNN的基础上进行改进,在训练阶段借鉴了分治的思想,只将当前所需子图作为训练样本,从而克服了GGNN不能处理大规模图的缺陷。整个模型的框架图如下所示:

其中(a)为部分事理图谱,(b)为本次训练所需子图,(c)为网络结构图,分为三部分:表示层、GGNN、相关性计算。下面将对这三部分进行介绍:

•        表示层

将输入的事件转成向量表示(即初始化),给定一个事件,分别获得谓语动词以及参数的word embedding,即,文中采用三种不同的方法获取事件 e_i 的表示

•        GGNN

GGNN用于更新事件表示,GGNN的输入为两个矩阵:初始隐藏层,  邻接矩阵 ,n, k 分别表示上下文事件、候选事件的个数,其中:

然后通过各种门不断地进行更新、计算,最终得到所有事件的最终表示h^t

•        相关性计算

获取最终表示 后,就可以计算context和候选事件之间的相关性:

其中 g 表示相似度计算函数,常用的有以下几种:

然后给定上下文: e_1, e_2,...e_n,候选事件发生的可能性为:

选择可能性最大的候选事件。

•        Attention机制

考虑到不同context在选择候选事件的时候占有的比重应该不同,所以作者加了一个attention机制,用来计算每个context对每个候选事件的权重,最后得到新的相似度计算函数:

•        目标函数

其中  表示第 I 个 context 和第 j 个候选事件之间的相似度,y 表示正确答案的下标,margin表示的是Margin loss参数, θ 表示模型参数。

实验

1. 数据集

数据集采用的是Gigaword语料库中的NYT部分,其统计情况如下:

2. 实验结果

作者与很多baseline进行了比较,实验结果表明:

(1) 基于神经网络的模型要比传统统计学习的模型要好。

(2) 基于事件图结构的模型要优于基于事件对或事件链的模型。

(3) 加了attention能够提高实验效果,说明不同context在选择时所占权重是不同的。

(4) 作者将自己的模型与baseline方法进行了结合,实验效果有不同程度的改变。

3. 比较性实验

作者还在验证集上进行了比较性的实验,从实验结果可以看到,采用连接方式获取事件表示,以及采用欧拉距离作为相似函数的时候,模型效果最好。

结论

本文提出了一种基于事理图谱的脚本事件预测方法,通过引入一个大规模图神经网络,用来对事件关系进行建模并学习事件表示。通过实验结果表明,基于事件图结构的方法要比基于事件对、事件链的方法好。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479376.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美团集群调度系统HULK技术演进

本文根据美团基础架构部/弹性策略团队负责人涂扬在2019 QCon(全球软件开发大会)上的演讲内容整理而成。本文涉及Kubernetes集群管理技术,美团相关的技术实践可参考此前发布的《美团点评Kubernetes集群管理实践》。 一、背景 HULK是美团的容器…

LeetCode 1079. 活字印刷(全排列回溯)

文章目录1. 题目2. 解题类似题目 78 子集、 90 子集 II1. 题目 你有一套活字字模 tiles,其中每个字模上都刻有一个字母 tiles[i]。返回你可以印出的非空字母序列的数目。 示例 1:输入:"AAB" 输出:8 解释:…

EdgeBERT:极限压缩,比ALBERT再轻13倍!树莓派上跑BERT的日子要来了?

文 | Sheryc_王苏本文首发于NLP宝藏公号【夕小瑶的卖萌屋】,疯狂暗示!这个世界上有两种极具难度的工程:第一种是把很平常的东西做到最大,例如把语言模型扩大成能够写诗写文写代码的GPT-3;而另一种恰恰相反,…

论文浅尝 | 用于开放领域的问题生成

作者 | 黄焱晖单位 | 东南大学硕士研究方向 | 自然语言处理,知识图谱Learning to AskQuestions in Open-domain Conversational Systems with Typed Decoders动机本文的问题生成用于开放领域的问题生成,与传统的问题生成不同的是,在开放领域对…

Android官方开发文档Training系列课程中文版:构建第一款安卓应用之创建用户界面

原文地址:http://android.xsoftlab.net/training/basics/firstapp/building-ui.html 在这节课中,你会创建一个xml的布局文件,它包含一个Text成员和一个Button成员。在下节课中,你会学习到当Button按下后启动并发送Text成员的内容…

字节码增强技术探索

1.字节码 1.1 什么是字节码? Java之所以可以“一次编译,到处运行”,一是因为JVM针对各种操作系统、平台都进行了定制,二是因为无论在什么平台,都可以编译生成固定格式的字节码(.class文件)供JVM…

LeetCode 1137. 第 N 个泰波那契数

文章目录1. 题目2. 解题1. 题目 泰波那契序列 Tn 定义如下: T0 0, T1 1, T2 1, 且在 n > 0 的条件下 Tn3 Tn Tn1 Tn2 给你整数 n,请返回第 n 个泰波那契数 Tn 的值。 示例 1:输入:n 4 输出:4 解释&#…

Calibration: 一个工业价值极大,学术界却鲜有研究的问题!

文 | kid丶(知乎作者)编 | 夕小瑶尽管深度学习给工业界带来了一波上线春天,但是总有很多比较难的业务,模型反复迭代后准确率依然达不到预期的产品标准,难以满足用户期望。以下为工业界常见讨(si)论(b&#…

肖仰华 | 大规模、高质量的金融知识图谱,如何自动化构建?

本文转载自公众号:恒生技术之眼。◆本文根据2019恒生技术开放日肖仰华教授演讲整理◆肖仰华:复旦大学教授、博士生导师,复旦大学知识工场实验室创始人。知识图谱(Knowledge Graph, KG)本质上是一种大规模语义网络&…

Android官方开发文档Training系列课程中文版:构建第一款安卓应用之启动另一个Activity

原文地址:http://android.xsoftlab.net/training/basics/firstapp/starting-activity.html#CreateActivity 在完成了上一节课之后,你有了一个带有输入框和按钮的单屏幕Activity。在这节课中,你将会在MyActivity中添加一些代码,以…

美团点评Kubernetes集群管理实践

背景 作为国内领先的生活服务平台,美团点评很多业务都具有非常显著、规律的”高峰“和”低谷“特征。尤其遇到节假日或促销活动,流量还会在短时间内出现爆发式的增长。这对集群中心的资源弹性和可用性有非常高的要求,同时也会使系统在支撑业务…

论文浅尝 | 基于知识图谱 Embedding 的问答

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识图谱问答。来源:WSDM 2019链接:https://dl.acm.org/citation.cfm?doid3289600.3290956目前知识图谱问答(本文简写为QA-KG,question answeri…

NeurIPS 2020 | 没有乘法的神经网络,照样起飞?

文:苏剑林编:兔子酱单位:追一科技今天给大家介绍一篇1962年的论文《Computer Multiplication and Division Using Binary Logarithms》[1],作者是John N. Mitchell,他在里边提出了一个相当有意思的算法:在二…

LeetCode 1160. 拼写单词

文章目录1. 题目2. 解题1. 题目 给你一份『词汇表』(字符串数组) words 和一张『字母表』(字符串) chars。 假如你可以用 chars 中的『字母』(字符)拼写出 words 中的某个『单词』(字符串&…

MTFlexbox自动化埋点探索

1. 背景 跨平台动态化技术是目前移动互联网领域的重点关注方向,它既能节约人力,又能实现业务快速上线的需求。经过十年的发展,美团App已经变成了一个承载众多业务的超级平台,众多的业务方对业务形态的快速迭代和更新提出了越来越高…

Android官方开发文档Training系列课程中文版:添加ActionBar之设置ActionBar

导言- 添加ActionBar 原文地址:http://android.xsoftlab.net/training/basics/actionbar/index.html ActionBar是很多重要的特性之一,你可以用它实现用户的自定义行为。它提供了若干的用户界面特性,以便你的应用可以很快的提供与其它应用很…

论文浅尝 | 具有图卷积网络和顺序注意力机制的应用于目标导向的对话系统

论文笔记整理:吴涵,天津大学硕士,研究方向:自然语言处理。来源:2019 Association for Computational Linguistics论文链接:https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00284开放源码&#…

Docker的基本使用(部署python项目)+两个奇技淫巧,将 Docker 镜像体积减小 99%

两个奇技淫巧,将 Docker 镜像体积减小 99% 使用Docker运行程序 Docker的基本使用(部署python项目) 一、准备项目 我写的是一个爬取某ppt网站的代码,就一个ppt1.py是爬虫,然后,ppts是存放下载的ppt的 二、准备requirement.txt文件…

Pytorch与Tensorflow,哪个更适合你?

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

LeetCode 500. 键盘行

文章目录1. 题目2. 解题1. 题目 给定一个单词列表,只返回可以使用在键盘同一行的字母打印出来的单词。键盘如下图所示。 示例: 输入: ["Hello", "Alaska", "Dad", "Peace"] 输出: ["Alaska", &quo…