技术动态 | 一文读懂事件知识图谱

转载公众号 | 普适极客

文章来源 | 中国科学院网络数据重点实验室


【导读】随着事件这类动态知识得到越来越多的关注,学术界涌现出许多事件知识图谱相关的概念。但究竟事件知识图谱是怎么发展而来的?什么是事件知识图谱?它和其他相关概念之间有什么关系?我们怎么构建它?它有什么用?带着这些问题我们一起来简单看看中科院计算所网络数据科学与技术重点实验室近期被TKDE接收的综述文章《What is Event Knowledge Graph: A Survey》(作者:官赛萍,程学旗,白龙,张付俊,李紫宣,曾宇涛,靳小龙,郭嘉丰)。

论文链接:

https://ieeexplore.ieee.org/document/9792280

https://arxiv.org/abs/2112.15280

【事件知识图谱是怎么发展而来的?】

事件知识图谱是自然语言处理和人工智能发展的产物。它的发展历程可以划分为四个阶段,追溯到事件、事件抽取、事件关系抽取、知识图谱、事件图谱、事理图谱等。

d67c8d23ccf20704eb19bf2967096b3c.png

事件知识图谱的发展历程

【什么是事件知识图谱?】

事件知识图谱以事件为中心,包括事件和实体两类节点,事件-事件、事件-实体和实体-实体三类有向边。第二类关系表示事件的论元,边为对应论元(实体)在所连事件中扮演的角色。

b4f1c68440b8ff4b3bbe6dc50d28c442.png

事件知识图谱及其应用例子

【事件知识图谱 vs 其他相关概念】

目前有很多事件知识图谱相关的概念,比如:事件图谱、以事件为中心的知识图谱、以事件为中心的时序知识图谱、事理图谱(一开始叫Event evolutionary graph,后来演化为Event logic graph)。与事件知识图谱相比,事理图谱只关注本体层的知识,而且事件图谱和后来的事理图谱的节点是复合结构,难以处理。此外,这些事件知识图谱相关的概念都只考虑了特定有限的事件关系和事件论元。

事件知识图谱相关概念的对比

194be13cd48fa9ffb2263947ed930feb.png

【怎么构建事件知识图谱?】

如图2所示,事件知识图谱包括本体部分和实例部分。这里以事件知识图谱实例构建为例,简要介绍构建流程。完整的流程包括事件抽取、事件关系抽取、事件共指消解和事件论元补全这四步。其中前两步是基本和必须的,后两步是锦上添花的。

96093f32538752b1f5ea9e8ff8394326.png

事件知识图谱实例构建流程

事件抽取是最基本的步骤,旨在抽取出结构化的事件信息,包括事件触发词、事件类型、事件论元和对应的角色。事件抽取可以分为基于事件体系的和事件体系未知的,前者包括句子级和文档级两类,后者又称为开放域事件抽取。虽然事件抽取得到了广泛的研究,效果却难以令人满意,亟待提升该基本任务的效果。

2cf0e7d48026332016d7d1cefa5fb513.png

现有事件抽取做法

事件关系抽取抽取事件之间的关系,将事件关联起来,形成事件知识图谱。其中最重要的两类关系是事件时序和因果关系。方法从早期的基于特征的,到后来的基于神经网络的,到最近流行的基于预训练语言模型的。然而,现有方法只关注动词事件,未考虑名词事件,同时它们未将事件论元考虑在内。

e145657020088d7360bfca5f1401790e.png

现有事件关系抽取做法

相同的事件常常被多处提及,因此需要事件共指消解将指向相同现实事件的那些事件组成一组。事件共指消解可以分为文档内和文档间的事件共指消解。方法包括无监督、半监督和有监督方法。其中有监督方法又分为建模事件对的和所有前序事件一起建模的。目前这些方法大多指定所有事件有固定的相同论元,未考虑不同事件往往论元不同。此外,一些方法只进行文档内的事件共指消解,未考虑文档间的事件共指消解。

9a5998243a7243f89ec43b256ff18350.png

现有事件共指消解做法

原文本中的信息往往不完整,而事件抽取也会有遗漏,因此需要事件论元补全填充缺失的事件论元或角色。早期方法借鉴句子要素主题匹配方法。带有时间信息的事件知识图谱可以按时间组织成图序列,因此后来有方法利用基于图序列的事件要素向量表示进行事件论元补全。事件论元是典型的多元关系,多元关系补全的方法也可以应用过来。然而,现有方法只关注事件自身进行补全,未考虑事件-事件关系。此外,事件论元补全被简化为推理一个缺失的事件论元或角色,而往往事件论元和角色都是缺失的。

0694587685c3d07ef8ead5cf518e474e.png

现有事件论元补全做法

【事件知识图谱有什么用?】

基本的应用包括脚本事件预测、时序知识图谱预测、事件脉络生成等。下游应用包括搜索、问答、推荐、金融量化投资等。然而,由于事件知识图谱是一个相对比较新的概念,实际应用比较少,在实际应用中引入事件知识图谱将很有前景。

事件知识图谱应用总结

cce300f6339780db6bb7621135abeece.png

【未来研究方向】

高性能的事件获取:事件抽取和事件关系抽取的精度尤其低,阻碍了高质量事件知识图谱的构建,并且现有方法通常未考虑复杂度的问题。因此,效果好并且效率高的事件获取研究是未来至关重要的研究方向。

多模态知识处理:在现实世界中,事件可能以文本、图像、音频和视频的形式呈现,不同模态的信息可以消除歧义,相互补充。因此,多模态信息联合利用是未来的重要研究方向。

可解释事件知识图谱研究:现有研究主要用深度学习方法拟合训练数据,缺乏可解释性,不知道它们为什么和如何起作用。在实际应用中知道最终结果的解释是友好而令人信服的。未来需要研究可解释的事件知识图谱方法。

实用的事件知识图谱研究:现有的任务和方法与现实场景相差甚远。一些任务的形式化过于理想化。对于方法而言,图神经网络被广泛用在简化的任务和数据集上,使用方法类似于其在知识图谱的用法。未来方法需要关注事件及其论元的原子性,事件-事件关系和实体-实体关系。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

e7b655af056e078fbde57ff1f020d9de.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477557.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为开源CTR Benchmark,学术界SOTAs的照妖镜?

文 | 卖萌酱大家好,我是卖萌酱。众所周知,与CV、NLP不同,搜索、广告、推荐领域的学术界paper在很多问题上喜欢各玩各的,缺乏一个统一可比的benchmark。就推荐/广告中核心的CTR预估问题来讲,从传统的LR、FM到Wide&D…

LeetCode 376. 摆动序列(贪心 动态规划)

文章目录1. 题目2. 解题2.1 贪心2.2 动态规划1. 题目 如果连续数字之间的差严格地在正数和负数之间交替,则数字序列称为摆动序列。第一个差(如果存在的话)可能是正数或负数。少于两个元素的序列也是摆动序列。 例如, [1,7,4,9,2…

Spring Cloud实战小贴士:Zuul的饥饿加载(eager-load)使用

上一篇我们介绍了如何使用Ribbon的earger-load配置加速Spring Cloud中对服务接口的第一次调用。可是这样只是解决了内部服务间的调用,另外一个问题依然经常困扰我们,那就是网关到内部服务的访问。由于Spring Cloud Zuul的路由转发也是通过Ribbon实现负载…

论文浅尝 | ESimCSE:无监督句子表示对比学习的增强样本构建方法

笔记整理:高超尘,中国科学院信息工程研究所硕士动机对比学习在学习无监督句向量方面引起了广泛的关注。其中最受关注的无监督方法是unsup-SimCSE(Gao et al., EMNLP 2021)。Unsup-SimCSE使用Dropout作为数据增强方法,将相同的输入…

一份北大信科内部流传的 “CS 自救指南”

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

LeetCode 678. 有效的括号字符串(栈)

1. 题目 给定一个只包含三种字符的字符串:( ,) 和 *,写一个函数来检验这个字符串是否为有效字符串。有效字符串具有如下规则: 任何左括号 ( 必须有相应的右括号 )。任何右括号 ) 必须有相应的左括号 ( 。…

Spring Cloud实战小贴士:Ribbon的饥饿加载(eager-load)模式

我们在使用Spring Cloud的Ribbon或Feign来实现服务调用的时候,如果我们的机器或网络环境等原因不是很好的话,有时候会发现这样一个问题:我们服务消费方调用服务提供方接口的时候,第一次请求经常会超时,而之后的调用就没…

图谱实战 | 图谱问答在小米小爱中的实践探索

转载公众号 | DataFunTalk分享嘉宾:代文博士 小米 高级算法工程师编辑整理:何雨婷 湖北工业大学出品平台:DataFunTalk导读:今天的介绍会围绕以下三点展开:小爱同学应用场景信息抽取图谱问答01小爱同学应用场景介绍首先…

稀疏大模型简述:从MoE、Sparse Attention到GLaM

文 | 唐工源 | 知乎Sparsity, ..., is another important algorithmic advance that can greatly improve efficiency. 稀疏性,是(神经架构搜索)之外另一个重要的算法进步,可以大大提高效率。The use of sparsity in models is .…

LeetCode 777. 在LR字符串中交换相邻字符(双指针)

1. 题目 在一个由 ‘L’ , ‘R’ 和 ‘X’ 三个字符组成的字符串(例如"RXXLRXRXL")中进行移动操作。一次移动操作指用一个"LX"替换一个"XL",或者用一个"XR"替换一个"RX"。现给定起始字符…

Spring Cloud构建微服务架构:服务网关(过滤器)【Dalston版】

在前两篇文章:服务网关(基础)、服务网关(路由配置)中,我们了解了Spring Cloud Zuul作为网关所具备的最基本功能:路由。本文我们将具体介绍一下Spring Cloud Zuul的另一项核心功能:过…

图谱实战 | 美团基于知识图谱的个性化新闻推荐系统

转载公众号 | DataFunTalk分享嘉宾:刘丹阳博士 美团 实习生编辑整理:毛佳豪 中国平安浙江分公司(实习)出品平台:DataFunTalk导读:新闻阅读是人们日常生活中必不可少的活动,随着新闻逐渐从纸质端转变到电子端&#xff0…

为了养成NLP卷王,我画了一张路线图

又到了一年一度的校招季,与往年不同,受各种事件综合作用的影响,今年的校招季让很多应届生感到额外的寒冷和不安。但换个角度来说,企业主每年都会嚷嚷着算法岗人才供不应求。当然这里不是说应聘的人不够多,而是能过及格…

LeetCode 870. 优势洗牌(贪心 二分查找)

1. 题目 给定两个大小相等的数组 A 和 B,A 相对于 B 的优势可以用满足 A[i] > B[i] 的索引 i 的数目来描述。 返回 A 的任意排列,使其相对于 B 的优势最大化。 示例 1: 输入:A [2,7,11,15], B [1,10,4,11] 输出&#xff1…

Spring Cloud构建微服务架构:服务网关(路由配置)【Dalston版】

在上一篇《Spring Cloud构建微服务架构:服务网关(基础)》一文中,我们通过使用Spring Cloud Zuul构建了一个基础的API网关服务,同时也演示了Spring Cloud Zuul基于服务的自动路由功能。在本文中,我们将进一步…

技术动态 | Neo4j知识图谱的技术解析及案例分享

转载公众号 | DataFunTalk 合作分享:Jesus Barrasa-Neo4j-欧洲区售前和技术总监合作分享:丁可-Neo4j-亚太区高级技术顾问编辑整理:吴祺尧-加州大学圣地亚哥分校出品平台:DataFunTalk导读:Neo4j近年来与众多公司合作&am…

哈工大博士历时半年整理的《Pytorch常用函数函数手册》开放下载!内含200余个函数!...

近期有很多小伙伴在公众号后台咨询有没有关于Pytorch函数使用的学习资料。Pytorch是目前常用的深度学习框架之一,深受学生党的喜爱,小白本人也是使用的Pytorch框架。为了帮助更多小伙伴,小白学视觉团队整理了这份目前最全的Pytorch常用函数手…

LeetCode 984. 不含 AAA 或 BBB 的字符串(贪心)

1. 题目 给定两个整数 A 和 B,返回任意字符串 S,要求满足: S 的长度为 A B,且正好包含 A 个 ‘a’ 字母与 B 个 ‘b’ 字母;子串 ‘aaa’ 没有出现在 S 中;子串 ‘bbb’ 没有出现在 S 中。 示例 1&…

Spring Cloud构建微服务架构:服务网关(基础)【Dalston版】

通过之前几篇Spring Cloud中几个核心组件的介绍,我们已经可以构建一个简略的(不够完善)微服务架构了。比如下图所示: 我们使用Spring Cloud Netflix中的Eureka实现了服务注册中心以及服务注册与发现;而服务间通过Ribbo…

论文浅尝 | PASSLEAF:基于样本池的不确定性知识图谱嵌入半监督学习框架

笔记整理:陈一林,东南大学硕士,研究方向为不确定性知识图谱规则与推理。论文引用:Citation: Chen, Z.M., Yeh, M.Y. and Kuo, T.W., 2021, May. PASSLEAF: A Pool-bAsed Semi-Supervised LEArning Framework for Uncertain Knowle…