知识图谱最新权威综述论文解读:实体发现

上期我们介绍了2020年知识图谱最新权威综述论文《A Survey on Knowledge Graphs: Representation, Acquisition and Applications》的知识图谱补全部分,本期我们将一起学习这篇论文的实体发现部分。

论文地址:

https://arxiv.org/pdf/2002.00388.pdf​arxiv.org

 

 

1 实体发现

本节将基于实体的知识获取区分为若干细分任务,即实体识别,实体消歧、实体类型和实体对齐。我们称它们为实体发现,因为它们都在不同的集合下探索实体相关的知识。

1.1 实体识别

实体识别或命名实体识别(NER)是一种在文本中标记实体的任务,当它关注于特定的命名实体时。手工制作的特征,如大写模式和特定语言资源,如地名录,在许多文献中都有应用。最近的工作利用squence-to-squence结构,例如,LSTM-CNN用于学习字符级和单词级特征以及编码部分词汇匹配。Lample等人通过叠加LSTM层和CRF层,即LSTM-CRF和Stack-LSTM。近年来,MGNER提出了一个集成框架,该框架具有不同粒度的实体位置检测和对嵌套和非重叠命名实体的基于注意力机制的实体分类。

1.2 实体分类

实体分类包括粗粒度分类和细粒度分类,而后者使用树结构的类型类别,通常被视为多类别和多标签分类。为了减少标签噪声,PLE着重于正确的类型识别,提出了一种基于异质图的部分标签嵌入模型,用于表示实体提及、文本特征和实体类型及其关系。为了解决日益增长的类型集和噪声标签,Ma等人提出了一种基于原型驱动的分层信息标签嵌入方法用于zero-shot细粒度命名实体分类。

1.3 实体消歧

实体消歧或实体链接是一个统一的任务,它将提及的实体和知识图谱中的相应实体链接起来。例如,爱因斯坦在1921年获得诺贝尔物理学奖。这句话中的实体提及“爱因斯坦”应该与知识图谱中的实体爱因斯坦联系起来。目前流行的端到端学习方法都是通过实体的表示学习来实现的,例如DSRM用于实体语义关系的建模,EDKate用于实体和文本的联合嵌入。Ganea和Hofmann提出了一种基于局部上下文窗口的注意力神经模型,用于实体表示学习和模糊实体的可微消息传递。Le和Titov将实体之间的关系视为潜在变量,开发了一个端到端的神经架构,具有关系和mention-wise的规范化。

1.4 实体对齐

前面提到的任务涉及到从文本或单个知识图谱中发现实体,而实体对齐旨在融合异构知识图谱中的知识。给定E1和E2为两个不同知识图谱的两个不同实体集,实体对其是寻找一个对齐集

其中实体e1和实体e2具有等价关系。在实际中,如下图的左框所示,给出一个对齐种子的小集合(即,出现在不同的知识图谱中的同义实体)以开始对齐处理过程。

基于嵌入表示的对齐需要计算一对实体的嵌入表示之间的相似性。IPTransE在一个联合嵌入框架下将实体投影到一个统一的表示空间中,包括通过对齐的翻译模型:

线性变换模型:

参数共享:

为了解决迭代对齐中的误差积累问题,BootEA提出了一种增量学习的bootstrapping方法,以及一种用于检查新标记对齐的编辑技术。

实体的附加信息也可以被利用起来,例如,JAPE捕捉跨语言属性之间的相关性,KDCoE通过共同训练嵌入多语言实体描述,MultiKE学习实体名称、关系和属性的多个视图,与字符属性嵌入对齐。

 

往期精选:

知识图谱最新权威综述论文解读:知识图谱补全部分

对知识图谱的告白:斯坦福大学CS520课程介绍

知识图谱最新权威综述论文解读:知识表示学习部分

知识图谱最新权威综述论文解读:开篇部分

手把手教你搭建一个中式菜谱知识图谱可视化系统

 

后期,我们还会对这篇综述的其它部分进行解读。

如果对文章感兴趣欢迎关注知乎专栏人工智能遇上知识图谱“,也欢迎关注同名微信公众号“人工智能遇上知识图谱”,让我们一起学习并交流讨论人工智能与知识图谱技术。

                                                          

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482168.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jurassic-X: 让神经模型学会符号推理

来源:前沿科技解读:Antonio编辑:陈彩娴近期,一家以色列NLP研究机构AI21 Labs开发了一个名叫Jurassic-X的算法系统,它基于该实验室提出来的MRKL(它与miracle谐音)系统。Jurassic-X的前身是对标GP…

知识图谱最新权威综述论文解读:关系抽取

上期我们介绍了2020年知识图谱最新权威综述论文《A Survey on Knowledge Graphs: Representation, Acquisition and Applications》的知识图谱实体发现部分,本期我们将一起学习这篇论文的关系抽取部分。 论文地址: https://arxiv.org/pdf/2002.00388.p…

斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱

随着知识图谱在人工智能各个领域的广泛使用,知识图谱受到越来越多AI研究人员的关注和学习,已经成为人工智能迈向认知系统的关键技术之一。之前,斯坦福大学的面向计算机视觉的CS231n和面向自然语言处理的CS224n成为了全球非常多AI研究人员的入…

数学三大核心领域概述:代数、几何、分析

来源 :数学与人工智能摘选自《数学史海揽胜》有删改数学发展到现在,已经成为科学世界中拥有100多个主要分支学科的庞大的“共和国”。大体说来数学有三大核心领域:数学中研究数的部分属于代数学的范畴;研究形的部分,属…

斯坦福大学CS520知识图谱系列课程学习笔记:第二讲如何构建知识图谱

上一讲我们学习了知识图谱的一些基本概念: 斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱 本节课程关于如何构建知识图谱,因为知识图谱的构建是整个知识图谱领域的一个非常核心且基础的工程,如何将现有的数据以…

神经复杂系统前沿:关于认知大脑的两种观念

来源: 集智俱乐部作者:David L. Barack, John W. Krakauer译者:JawDrin审校:陈贺 编辑:邓一雪 导语人类的高级认知能力怎样从包含上百亿神经元的大脑复杂系统中涌现出来,是神经科学的核心问题之一。学界中存…

斯坦福大学CS520知识图谱系列课程学习笔记:第三讲高级的知识图谱是什么样的

这一讲的主题是:一些高级的知识图谱是什么样的。三位讲者分别从他们各自带领的团队构建出来的高质量的知识图谱实例出发,从中我们可以认识到一些大佬们构建的优秀的知识图谱产品有哪些特点和优势,从中对我们自己构建知识图谱也可以得到一定的…

人工智能与量子计算在新型忆阻器中的融合

EQUINOX GRAPHICS/UNIVERSITY OF VIENNA来源:IEEE电气电子工程师近年来,计算在两个主要方面取得了进展:机器学习的突破,开发出了可根据经验自动改进的算法;量子计算机的研究,从理论上证明了量子计算机比任何…

第一个关于中式菜谱的智能问答机器人小程序正式上线啦

为了满足大家对菜品烹饪的各类问题能直接得到答案的需求,我开发了目前第一个真正关于菜谱的智能问答系统,并在微信小程序发布上线。这套系统支持对于8600多种菜品的问答功能,并能实现快速问答响应,整套系统后端依托于搭建的中式菜…

数学在自然科学中不可思议的有效性

来源:数学争鸣作者:尤金维格纳翻译:鲍永成 校对:袁向东数学在自然科学中不合理的有效性1959年5月11日在纽约大学Courant数学科学讲座上的讲演作者简介:尤金维格纳(Eugene P. Wigner)美国物理学…

已嵌入微信公众号内的小图聊天机器人介绍和使用说明

小图是一个融合常识与专业知识的智能聊天机器人,进入“人工智能遇上知识图谱”公众号,并在聊天窗口中发送消息就可以开始聊天,同时支持多轮多对话,小图能够提供闲聊、生活服务咨询、智能助手、休闲娱乐、文艺女青年等17种对话聊天…

图像预训练模型的起源解说和使用示例

来源:Deephub Imba三十多年来,许多研究人员在图像识别算法和图像数据方面积累了丰富的知识。如果你对图像训练感兴趣但不知道从哪里开始,这篇文章会是一个很好的开始。这篇文章简要介绍了过去的演变,并总结了现在的一些热门话题。…

介绍一些知识图谱的实际应用类项目

目前已经有很多方法来构建知识图谱,在实际项目中,我们更加关注可以用构建好的知识图谱来干些什么,因此,我找到了网上一些对于当前知识图谱的应用的介绍,分享给大家。 1 国内外知识图谱项目 国外: 常识知…

语言生成类人工智能如何改变科学

来源:ScienceAI编辑 :萝卜皮密歇根大学安娜堡分校新兴技术治理专家 Shbita Parthasarathy 表示,从大量文本中生成流利语言的机器学习算法可能会改变科学研究的方式,但不一定会变得更好。在2022 年 4 月 27 日发布的一份报告中&…

美国最牛的100个AI团队在哪里?

来源:Forbes撰文:海外来电图片:海外来电AI领域的关键玩家都有谁?企业为了保持竞争优势,需要快速有效地扩大人工智能(AI)能力。而Vectice最新一份报告,列出了100家公司拥有增长最快的…

介绍几个专门面向中文的命名实体识别和关系抽取工具

知识图谱已经在人工智能的各个领域发挥越来越重要的作用,例如视觉问答、对话系统、推荐系统等。知识图谱构建是应用这些知识图谱的基础,而面对生活和企业中数据的爆发式增长,自动化知识图谱构建显得越来越重要。从非结构化文本中自动抽取三元…

一文梳理类脑计算的前世今生 | 中科院自动化所研究员李国齐

来源:智源社区整理:王光华编辑:李梦佳导读:众所周知,人类大脑活动是复杂而连续的动力学过程,其复杂程度远超当前算力资源所能模拟的上限。大脑约有1000亿个神经元,100万亿个突触,单个…

常识推理相关最新研究进展

以深度学习为代表的智能感知技术已经取得了突破性进展,并已在各行各业产生了巨大的价值。目前,人工智能的研究领域已经逐渐从感知智能向认知智能领域过渡,其中,深度学习无法解决的一个主要问题是常识推理问题。常识知识是人类智能…

全球半导体厂商TOP 10

来源:数据观综合编辑:蒲蒲近日,IC Insights 分析了全球主要半导体供应商(不含纯代工厂)的市场份额,并公布排名前十的半导体厂商排名。从分析情况来看,全球半导体市场份额越来越集中于排名靠前的…

常识知识在AI不同领域应用的最新研究进展

上期,我们一起学习了常识推理的最新研究进展。这次,我们一起来看看常识知识在AI不同的领域都有哪些应用,泽宇找到几篇最新或有代表性的研究和大家分享学习。 Commonsense Knowledge Aware Conversation Generation with Graph Attention Aut…