论文浅尝 | 基于多原型mention向量的文本-实体联合学习

640?wx_fmt=png

链接http://anthology.aclweb.org/P/P17/P17-1149.pdf

 

概述

在知识库和文本的联合表示中,歧义是个困扰的难题。同一个 mention 可能在不同的语境下表述不同实体,同一个实体又有多种 mention 表示,如下图。本文提出了一个新的表示方法,可以在一个联合空间学习 mention 和实体的表示,同时解决歧义问题。

640?wx_fmt=png


模型

作者提出了一个 mention sense 的概念,每一个 mention 对应一个 mention_sense,以表示当前的mention的真正含义。可以看出,mention_sense 是和实体一一对应的。作者从 wikipedia 的超链接里提取出 <m_l, e_j> 的组合,即mention超链接到某一实体。对于每一个这种组合,作者把它映射到一个 mention_sense 上:

640?wx_fmt=png


这样同一实体的 mention 会共享 mention_sense,而同一 mention 对应不同实体也会映射到不同的 mention_sense。作者把文本中的 mentionmention_sense 代替,来进行联合训练。

640?wx_fmt=png

像大图的最右侧部分描述的一样,mention_sense 可以看成是文本空间和实体空间的一个链接。联合训练的似然函数由三部分组成,均采用 CBOW/skip-gram 的语言模型来得到向量:

1、实体空间

640?wx_fmt=png

这个方法让共享邻居实体的实体词尽可能相似。

2mention空间

640?wx_fmt=png

这个方法使得指向同一实体,且共享上下文的mention_sense尽可能相似。

3、文本空间

640?wx_fmt=png

共现的词之间应尽可能相似,类似于 word2vec,只不过用 mention_sense 代替 mention

 

实体链接

640?wx_fmt=png

用上述学出的向量可以进行实体链接的工作。对于每一个实体,对所有 mention_sense 做如上计算,选出概率值最大的 mention_sense,再连接到对应的实体。因为一个句子可能包含多个实体,而全局优化代价过大,为了方便,作者假设实体和实体间独立,提出了 L2R(从左至右)和 S2C(从简至繁)的逐实体预测的方法。

 

实验

作者进行了自身对比,可以看出多实体比单一实体的效果好很多。

640?wx_fmt=png

在实体相关预测和词语相关预测上,实体和词语联合学习的方法,也比单一学习提升了一些性能。

640?wx_fmt=png

640?wx_fmt=png

最后是上述实体链接的尝试:

640?wx_fmt=png


笔记整理:王冠颖,浙江大学硕士,研究方向为关系抽取、知识图谱。




OpenKG.CN


中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

转载须知:转载需注明来源“OpenKG.CN”、作者及原文链接。如需修改标题,请注明原标题。


点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480712.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NLP预训练模型综述:从word2vec, ELMo到BERT

目录 前言 word2vec 模型 负采样 char-level与上下文 ELMo BERT 深层双向的encoding 学习句子与句对关系表示 简洁到过分的下游任务接口 前言 还记得不久之前的机器阅读理解领域&#xff0c;微软和阿里在SQuAD上分别以R-Net和SLQA超过人类&#xff0c;百度在MS MARCO…

一篇文章了解架构设计的本质

“ 大型网站的架构设计&#xff0c;涉及到的面非常多&#xff0c;并不像大家想象的那样&#xff0c;就是一个网站这么简单&#xff0c;今天抛砖引玉&#xff0c;希望大家正确看待架构设计。 什么是架构设计的本质&#xff1f; 任何系统&#xff0c;自然情况下&#xff0c;都是…

看完这篇Linux基本的操作就会了

只有光头才能变强这个学期开了Linux的课程了&#xff0c;授课的老师也是比较负责任的一位。总的来说也算是比较系统地学习了一下Linux了~~~ 本文章主要是总结Linux的基础操作以及一些简单的概念~如果不熟悉的同学可下个Linux来玩玩(或者去买一个服务器玩玩【学生版的不是很贵】…

论文浅尝 | 基于知识图的问答变分推理

Zhang Y, Dai H, Kozareva Z, et al. Variational Reasoning for Question Answering with Knowledge Graph. Proceedings of 32th AAAI 2018动机传统的知识图谱问答主要是基语义解析的方法&#xff0c;这种方法通常是将问题映射到一个形式化的逻辑表达式&#xff0c;然后将这个…

阿里P8架构师谈:分布式架构设计(文章合集)

Docker容器 阿里P8架构师谈&#xff1a;Docker简介、组成架构、使用步骤、以及生态产品 阿里P8架构师谈:Docker容器的原理、特征、基本架构、与应用场景 消息中间件 阿里P8架构师谈&#xff1a;消息中间件介绍、典型使用场景、以及使用原则 阿里P8架构师谈&#xff1a;分布…

NLP史上最全预训练模型汇总

本文转载自公众号“夕小瑶的卖萌屋”&#xff0c;专业带逛互联网算法圈的神操作 -----》我是传送门 关注后&#xff0c;回复以下口令&#xff1a; 回复【789】 &#xff1a;领取深度学习全栈手册&#xff08;含NLP、CV海量综述、必刷论文解读&#xff09; 回复【入群】&…

论文浅尝 | 基于迭代的概率规则约束的知识图谱分布式表示

Citation:Shu Guo, Quan Wang, Lihong Wang, Bin Wang, Li Guo.Knowledge Graph Embeddingwith Iterative Guidance from Soft Rules. AAAI 2018. 动机知识图谱的分布式表示旨在将知识图谱中的实体和关系表示到连续的向量空间中&#xff0c;本文考虑的问题是如何将知识库的分布…

笔记:毫米波雷达传感器,优势、应用和产业规模

信息来源&#xff1a;https://www.sohu.com/a/314806539_465219 优势 非接触式传感&#xff0c;可检测物体的距离、速度和角度信息&#xff0c;唯一可以“全天候全天时”工作的传感器系统组件(比如天线)的尺寸可以做到很小穿透性&#xff1a;穿透塑料、墙板和衣服等特殊材料高…

「优知学院」淘宝架构的前世今生(下)

“ 淘宝技术架构前世今生就是一部架构活教材&#xff0c;今天仍然由陈睿mikechen为大家解读淘宝架构。 我稍微把前面淘宝架构的三个阶段简短总结&#xff1a; 淘宝1.0 采用LAMP mysql读写操作 淘宝2.0 把mysql替换为oracle,为了使用oracle的连接池&#xff0c;php采用代理连…

学习排序 Learning to Rank:从 pointwise 和 pairwise 到 listwise,经典模型与优缺点

Ranking 是信息检索领域的基本问题&#xff0c;也是搜索引擎背后的重要组成模块。本文将对结合机器学习的 ranking 技术——learning2rank——做个系统整理&#xff0c;包括 pointwise、pairwise、listwise 三大类型&#xff0c;它们的经典模型&#xff0c;解决了什么问题&…

论文浅尝 | 从 6 篇顶会论文看「知识图谱」领域最新研究进展 | 解读 代码

本文内容源自往期「论文浅尝」&#xff0c;由 PaperWeekly 精选并重新排版整理&#xff0c;感谢 PaperWeekly。ISWC 2018■ 链接 | http://www.paperweekly.site/papers/1912■ 源码 | https://github.com/quyingqi/kbqa-ar-smcnn■ 解读 | 吴桐桐&#xff0c;东南大学博士生&a…

互联网(IT)大厂面试技巧(面经)

目录 前言 面试的正确姿势 实战 最后的总结 前言 虽然资历尚浅&#xff0c;但是也面过不少试&#xff0c;有Google、微软等外企大佬&#xff0c;也有BAT等国内巨头&#xff0c;工作的这几年也有幸当过几次面试官&#xff0c;小鹿这里呢就结合自己的亲身经历&#xff0c;聊…

「优知学院」淘宝技术架构的前世今生(上)

“ 淘宝技术架构经历从最初的LAMP架构&#xff0c;到IOE架构&#xff0c;再到分布式架构&#xff0c;再到去IOE&#xff0c;最后到现在的云计算平台架构这一变化过程在不断解决上面的技术问题&#xff0c;可以说淘宝技术架构的演变就是活生生的一本架构教科书。 这次为大家带…

十大双跨平台整体发展情况盘点

在2019年国家级双跨平台发布一年之际和新一轮遴选开场之前&#xff0c;相关媒体“从战略演进、平台发展、资源汇聚及行业应用四个维度九个细分指标”&#xff0c;对十大双跨平台整体发展情况通过“一张图”的形式做了一次盘点&#xff08;图略&#xff09;。 我们通过对图中指…

机器学习中的范数规则化之(一)L0、L1与L2范数

机器学习中的范数规则化之&#xff08;一&#xff09;L0、L1与L2范数 zouxy09qq.com http://blog.csdn.net/zouxy09今天我们聊聊机器学习中出现的非常频繁的问题&#xff1a;过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问…

模型训练慢和显存不够怎么办?GPU加速混合精度训练

目录 混合精度训练 理论原理 三大深度学习框架的打开方式 Pytorch Tensorflow PaddlePaddle 混合精度训练 一切还要从2018年ICLR的一篇论文说起。。。 《MIXED PRECISION TRAINING》 这篇论文是百度&Nvidia研究院一起发表的&#xff0c;结合N卡底层计算优化&#x…

陈睿:架构设计之数据库拆分六大原则

架构设计之数据库拆分原则 数据拆分前其实是要首先做准备工作的&#xff0c;然后才是开始数据拆分&#xff0c;我先讲拆分前需要做的事情&#xff1a; 第一步&#xff1a;采用分布式缓存redis、memcached等降低对数据库的读操作。 第二步&#xff1a;如果缓存使用过后&#xf…

模式识别之特征提取算法

说明&#xff1a;此处暂时简单介绍下各种特征提取算法&#xff0c;后续完善。 前言&#xff1a;模式识别中进行匹配识别或者分类器分类识别时&#xff0c;判断的依据就是图像特征。用提取的特征表示整幅图像内容&#xff0c;根据特征匹配或者分类图像目标。常见的特征提取算法…

ACL2020 | 对话数据集Mutual:论对话逻辑,BERT还差的很远

一只小狐狸带你解锁 炼丹术&NLP 秘籍本文为MuTual论文作者的特别约稿编辑&#xff1a;rumor酱、夕小瑶前言自然语言处理是人工智能领域的掌上明珠&#xff0c;而人机对话则是自然语言处理领域的最终极一环。以BERT为代表的预训练模型为自然语言处理领域带来了新的春天&…

大型网站系统的特点和架构设计

分布式架构 阿里P8架构师谈&#xff1a;淘宝技术架构从1.0到4.0的架构变迁 优知学院」淘宝技术架构的前世今生&#xff08;上&#xff09; 优知学院」淘宝架构的前世今生&#xff08;下&#xff09; 揭秘&#xff1a;一位亲历者眼中的淘宝技术架构发展之路 淘宝发展历程最具…