flash做的网站/百度搜索引擎工作原理

flash做的网站,百度搜索引擎工作原理,郑州百度关键词seo,上海企业制作网站有哪些内容笔记整理 | 刘克欣,天津大学硕士链接:https://arxiv.org/pdf/1911.11298.pdf动机知识图谱对于许多下游应用(例如搜索,知识问答和语义网)至关重要。然而,现有知识图谱面临不完整的问题。知识图谱补全工作能让…

笔记整理 | 刘克欣,天津大学硕士


链接:https://arxiv.org/pdf/1911.11298.pdf


动机

知识图谱对于许多下游应用(例如搜索,知识问答和语义网)至关重要。然而,现有知识图谱面临不完整的问题。知识图谱补全工作能让知识图谱变得更加完整,是目前人工智能领域的一个研究热点。现有的知识图谱补全工作大多需要大量的实体对来进行关系推断。但是,实际数据集中关系的频率分布通常具有长尾问题, 关系的很大一部分在知识图谱中只有很少的实体对。处理数量有限(数量很少)的实体对的关系是非常重要且具有挑战性的。针对上述问题,文章提出了一种少样本关系学习模型FewShot Relation Learning model(FSRL),其目的是学习一个匹配函数,该函数可以在给定每个关系的少量参考实体对的情况下,有效地推断出真正的实体对。


亮点

文章的亮点主要包括:

(1)首次提出小样本情景下的知识图谱补全任务,更适合实际场景;

(2)提出了一种融合了一些可学习神经网络模块的小样本关系学习模型解决小样本知识图谱补全问题。


概念及模型

针对小样本知识图谱预测,FSRL要解决的具体问题是:给出少量实体对(参考集)的情况下,根据给定头实体  和查询关系  预测尾实体  。

FSRL由三个主要部分组成:

(1)为每个实体编码异构邻居; 

(2)对每个关系的少量参考实体对进行汇总; 

(3)将查询对与参考集进行匹配以进行关系预测。

模型整体框架如下:

编码异构邻居

此模块功能为一个关系可感知的异构邻居编码器。基于给定头实体  的关系邻居的集合被表示为:

其中,表示背景知识图谱, , 分别表示第个关系和相应的的尾部实体。

文章引入注意力机制计算的异构邻居特征,并使用以下公式计算的embedding:

其中,分别表示预学习的的embedding。

融合小样本参考集

此部分的功能是对参考集中的每个关系的embedding进行聚合。

其中,  是一个聚合函数。

基于图的embedding,作者设计了一个循环自编码聚合器。更具体来说,实体对embeddings 被顺序喂到循环自编码器:

其中,是参考集的大小。编码器和解码器的隐藏状态和通过以下公式计算:

优化自编码器的重构损失如下:

为了形成参考集的embedding,作者聚合了所有编码的隐层状态并通过残差连接与注意力权重机制进行拓展。的计算公式如下:

其中,为聚合的embedding的维度。

匹配查询集和参考集

在前两个模块的基础上,现在可以基于参考集有效的对每个查询实体对进行匹配操作。首先通过对查询实体对和参考集分别进行操作,从而分别得到两个embedding向量:

为了衡量两个向量的相似性,作者采用了一个循环处理器 去完成多步匹配。第个过程步的如下:

其中,输入为,隐藏状态为,细胞状态为过程步后的隐层状态记为:

目标函数和模型训练

对于每一个关系,我们随机选择一些正样本实体对并把它们作为参考集。剩余的实体对作为正样本查询对。此外,也构建了负样本实体对。排列损失记为:

其中, 为标准的hinge 损失,表示安全边界距离(本文取值为5)。

最终优化函数如下:

其中,表示参考集聚合的重构损失。表示两者的权衡因子(本文取值为0.0001)。


理论分析

实验

作者采用了2个公开数据集进行实验,分别是:NELL (Mitchell et al. 2018)和Wikidata (Vrandeˇci´c and Kr¨otzsch 2014)。首先是有效性实验,模型的评价指标为:Hits@k 和 MRR。

图邻居编码器方法(GMatching)优于关系嵌入方法,表明将图局部结构和匹配网络相结合对于学习实体嵌入和预测新关系的事实是有效的。

本文提出的FSRL在所有情况下均能达到最佳性能。在NELL和Wiki数据中,相对于最佳基准方法的平均相对改进分别高达34%和15%。它证明了FSRL模型的有效性。异构邻居编码器和递归自动编码器聚合网络有利于知识图谱中的小样本关系预测。

除了所有关系预测的整体性能,我们还进行实验以评估模型对于NELL测试数据中每个关系的预测性能。在大多数情况下,FSRL的性能要优于GMatching。它证明了我们的模型对于不同的关系是鲁棒的,并且在大多数关系上都优于GMatching。

作者还进行了实验以分析小样本中每类样本数K的影响。

随着K的增加,两个模型的性能都会提高。这表明较大的参考集可以为该关系产生更好的参考集嵌入。在不同的K中,本文的模型始终优于GMatching,这证明了所提出的模型对于知识图谱中的小样本关系补全的稳定性。

文章还可视化了每个关系的正候选实体对和负候选实体对的2D嵌入。

从图中可以看出,两种方法都能很好地区分正候选和负候选的嵌入。然而,本文的模型取得了更好的性能,并且两个类的嵌入明显不同,这进一步证明了所提出的模型在可视化方面的优越性能。


总结

文章提出了一个新的小样本知识图谱补全问题,并提出了一种创新的小样本关系学习模型,即FSRL,以解决该问题。FSRL对关系感知的异构邻居编码器、递归自动编码器聚合网络和匹配网络进行联合优化。在两个公共数据集上的实验表明,FSRL方法的性能优于现有的基准方法。此外,消融研究验证了每个模型组件的有效性。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478469.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ACL 2021|美团提出基于对比学习的文本表示模型,效果提升8%

文 | 渊蒙 如寐 思睿等尽管基于BERT的模型在NLP诸多下游任务中取得了成功,直接从BERT导出的句向量表示往往被约束在一个很小的区域内,表现出很高的相似度,因而难以直接用于文本语义匹配。为解决BERT原生句子表示这种“坍缩”现象,…

Android远程调试的探索与实现

作为移动开发者,最头疼的莫过于遇到产品上线以后出现了Bug,但是本地开发环境又无法复现的情况。常见的调查线上棘手问题方式大概如下: 方法优点缺点联系用户安装已添加测试日志的APK方便定位问题需要用户积极配合,如果日志添加不全…

超硬核 ICML’21 | 如何使自然语言生成提速五倍,且显存占用减低99%

文 | 炼丹学徒编 | 小轶我们忽略掉引言和介绍,直接把工作的效果丢上来,相信就足够令自然语言生成的相关同学心动——对于任何一个已有的Transformer生成模型,只需根据本文算法更改attention的计算顺序,就可以实现成倍速度提升&…

论文浅尝 | Convolutional 2D knowledge graph embedding

笔记整理 | 孙悦,天津大学1. 介绍:知识图的链接预测是预测实体之间缺失关系的任务。先前有关链接预测的工作集中在浅,快速的模型上,这些模型可以缩放到大型知识图例如基于基于平移变换的 TransE 系列。但是,这些模型比…

sysbench在美团点评中的应用

如何快速入门数据库?以我个人经验来看,数据库功能和性能测试是一条不错的捷径。当然从公司层面,数据库测试还有更多实用的功能。这方面,美团点评使用的是知名工具sysbench,主要是用来解决以下几个问题: 统一…

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab

[中文事件抽取]DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Lab: ACL 2018DCFEE: A Document-level Chinese Financial Event Extraction System based on Automatically Labeled Training DataAuthorHang Yang, Yu…

论文浅尝 - ACL2020 | 通过集成知识转换进行多语言知识图谱补全

笔记整理 | 谭亦鸣,东南大学博士生概述预测图谱中缺失的事实(fact)是知识图谱构建与推理中的一个重要任务,近年来也被许多KG embedding研究的关注对象。虽然目前的KG embedding方法主要学习和预测的是单个图谱中的事实,但是考虑到KG之间不同规…

LsLoader——通用移动端Web App离线化方案

由于JavaScript(以下简称JS)语言的特性,前端作用域拆分一直是前端开发中的首要关卡。从简单的全局变量分配,到RequireJS实现的AMD模块方式,browserify/webpack实现的静态引用方式。前端的业务逻辑也从一个个精心按顺序…

ACL'21 | debug完的神经网络,如何测试是否仍然存在bug?

文 | Sherry回归测试熟悉软件工程的小伙伴们一定知道回归测试:修改了旧代码后,重新进行测试以确认修改没有引入新的错误或导致其他代码产生错误。它可以大幅降低系统测试、维护升级等阶段的成本。随着深度学习网络的不断发展,越来越多的系统都…

LeetCode 198. 打家劫舍(DP)

1. 题目 你是一个专业的小偷,计划偷窃沿街的房屋。每间房内都藏有一定的现金,影响你偷窃的唯一制约因素就是相邻的房屋装有相互连通的防盗系统,如果两间相邻的房屋在同一晚上被小偷闯入,系统会自动报警。 给定一个代表每个房屋存…

论文浅尝 - ACL2020 | 利用常识知识图对会话流进行显式建模

笔记整理 | 韩振峰,天津大学硕士链接:https://arxiv.org/pdf/1911.02707.pdf动机人类对话自然地围绕相关概念发展,并分散到多跳概念。本文提出了一种新的会话生成模型——概念流(ConceptFlow),它利用常识知识图对会话流进行显式建…

百度NLP、视频搜索团队招聘算法实习生!

致力于连接最靠谱的算法岗与最强的求职者招聘贴投放请联系微信xixiaoyao-1问答工作职责研发文本问答、多模态问答、阅读理解、端到端问答等技术,利用NLP理论和方法解决实际问题结合数据、算力优势,在百度的搜索、凤巢等产品和业务实现技术落地研究问答、…

人工智能在线特征系统中的数据存取技术

主流互联网产品中,不论是经典的计算广告、搜索、推荐,还是垂直领域的路径规划、司机派单、物料智能设计,建立在人工智能技术之上的策略系统已经深入到了产品功能的方方面面。相应的,每一个策略系统都离不开大量的在线特征&#xf…

论文浅尝 - ACL2020 | IntKB: 一种交互式知识图谱补全框架

笔记整理 | 谭亦鸣,东南大学博士来源: ACL 2020链接:https://www.aclweb.org/anthology/2020.coling-main.490.pdf资源:https://github.com/bernhard2202/intkb.概述知识库作为许多下游NLP任务的资源基础,存在的一个普遍缺陷是它…

预训练模型的前世今生(有福利!)

近年来,在深度学习和大数据的支撑下,自然语言处理技术迅猛发展。而预训练语言模型把自然语言处理带入了一个新的阶段,也得到了工业界的广泛关注。通过大数据预训练加小数据微调,自然语言处理任务的解决,无须再依赖大量…

LeetCode 337. 打家劫舍 III(记忆化+递归)

文章目录1. 题目1.1 相关题目:2. 解题2.1 递归2.2 记忆化递归1. 题目 在上次打劫完一条街道之后和一圈房屋后,小偷又发现了一个新的可行窃的地区。这个地区只有一个入口,我们称之为“根”。 除了“根”之外,每栋房子有且只有一个…

孵化业务快速落地与优化

海外酒店是酒旅事业群第一个孵化的业务,从2016年9月份开始到现在已经半年多的时间。在业务后台搭建、成长、优化过程中,经历了很多的思考与选择。 主要分为下面几个阶段: 初建:调研、落地,合理复用,高效自建…

TPLinker 联合抽取 实体链接方式+源码分析

关系抽取–TPLinker: https://blog.csdn.net/weixin_42223207/article/details/116425447 Tagging TPLinker模型需要对关系三元组(subject, relation, object)进行手动Tagging,过程分为三部分: (1)entity head to enti…

论文浅尝 | KGAT: 用于推荐的知识图注意力网络

笔记整理 | 李爽,天津大学链接:https://arxiv.org/pdf/1905.07854v1.pdf动机为了提供更准确、多样化和可解释的推荐,必须超越对用户-项目交互的建模,并考虑辅助信息。传统的方法,如因子分解机(FM),将其视为…

对话系统答非所问?快试试这篇ACL'21的连贯性评估大法

文 | 页眉3编 | 小轶背景当我们在绞尽脑汁地想怎么设计一个对话系统的时候,我们当然希望最后训练出来的系统能越像人越好,输出的回复很连贯,很有趣,很体贴。而其中,连贯性可以说是最基本的要求之一了,毕竟不…