论文浅尝 | 引入“引用”的语言模型

笔记整理:杨帆,浙江大学硕士,研究方向知识图谱.


640?wx_fmt=png

论文链接https://arxiv.org/pdf/1611.01628.pdf


动机

Referring expressionRE)在自然语言中十分常见,并且在信息交流中扮演了十分重要的角色,但是之前的工作并没有在语言模型中明确地引入RE,作者在这篇论文中明确对RE建模,将其纳入语言模型之中,用以提高文本生成的表现。

 

贡献

1.提出了对自然语言中的reference(引用)进行建模的框架

2.提出了第一个对引用建模的神经模型,可以根据上下文生成引用的具体表现形式

3.在三个数据集上对模型进行综合评估,验证了提出的模型比baseline表现更好

 

模型

和传统的语言模型相比不同的是,作者在每个位置引入了一个随机变量 z_i,用以决定该位置如何生成相应的单词,形式化的条件概率如下:

640?wx_fmt=png

其中 z_i 在不同的上下文中有着不同的含义。作者分别从三项具体的任务出发详细阐述了对应的模型,分别为1referenceto lists 2referenceto databases 3referenceto document context

640?wx_fmt=png

1)Reference to lists


该项任务主要考虑引用一个列表中的元素,这种任务有着很广泛的应用,比如根据文本生成对应文档,作者此处以根据食材生成食谱为例。

首先利用encoderlist中各个元素(食材)编码,将最后的输出作为decoder的初始输入,然后将decoder的每个输出与list中所有项目做attention得到640?wx_fmt=png,再利用decoder输出和attention值生成640?wx_fmt=png以及传统sequence to sequence 模型的输出640?wx_fmt=png640?wx_fmt=png可以看作一个开关,用于控制下一个单词是从list中复制还是根据softmax生成,而640?wx_fmt=png640?wx_fmt=png分别对应最终生成的单词。具体的计算过程如下:

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

2)Reference to databases

640?wx_fmt=png

此类任务基础框架和前一项任务相同,但是外部数据源从列表变为了表格(数据库),640?wx_fmt=png则通过下列过程生成。

 640?wx_fmt=png


3)Reference document context

该项任务旨在生成文本时生成对前文出现的实体的引用,当 z_i=0,下一个单词通过softmax生成,当z_i=1,下一个单词根据 h_e 生成,此处与前两项任务不同的是,前两项任务从外部数据源(列表或数据库)直接复制,而该任务是前文出现的实体变换之后得到对应的单词,概率形式如下:

640?wx_fmt=png

其中 h_e 是一个动态维护的前文出现的实体集合,当出现新的实体,则将其加入至集合之中,当实体已在集合中出现,则用其新的表示替换旧的表示,示意图如下:

640?wx_fmt=png

实验

640?wx_fmt=png

640?wx_fmt=png

640?wx_fmt=png

上述三个表格分别对应三项任务的实验结果,可以看出在语言模型中引入RE的确提升了文本生成的性能表现。



OpenKG


开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

640?wx_fmt=jpeg

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479847.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

短文本语义匹配/文本相似度框架(SimilarityNet, SimNet),基于bow_pairwise模式及框架原理介绍

用PaddlePaddle实现段文本语义匹配Simnet模型 https://aistudio.baidu.com/aistudio/projectdetail/124373 Hinge loss: https://blog.csdn.net/hustqb/article/details/78347713 原文链接:https://blog.csdn.net/qq_33187136/article/details/10677043…

卖萌屋招人啦!

萌萌的小夕突然出现~这次来寻找小伙伴一起建设小屋啦!本期提供四种通道可直达卖萌屋核心腹地!小编/作者日常:发现,拍脑袋,然后写写写外部投稿的审核与编辑基本条件:对NLP、CV、IR、Rec、Ads、DM…

LeetCode 36. 有效的数独(哈希)

文章目录1. 题目信息2. 解题2.1 暴力3次遍历查找2.2 一次遍历查找1. 题目信息 判断一个 9x9 的数独是否有效。只需要根据以下规则,验证已经填入的数字是否有效即可。 数字 1-9 在每一行只能出现一次。 数字 1-9 在每一列只能出现一次。 数字 1-9 在每一个以粗实线…

如何从0到1设计一个类Dubbo的RPC框架

之前分享了如何从0到1设计一个MQ消息队列,今天谈谈“如何从0到1设计一个Dubbo的RPC框架”,重点考验: 你对RPC框架的底层原理掌握程度。 以及考验你的整体RPC框架系统设计能力。 RPC和RPC框架 1.RPC(Remote Procedure Call&#x…

shell脚本实现命令的自动执行

背景:在我傻傻的手工执行命令整整一天手腕都有点疼之后发现shell这个大宝贝简直开心的不得了 1. 关于shell脚本的使用: 一、编写完成的shell脚本放到脚本要执行的文件的相同目录下 二、注意shell脚本的编码问题(windows和mac下编写的脚本格式…

论文征集 | 2019 Joint International Semantic Technology Conference

第九届国际语义技术联合会议将于今年十一月在美丽的杭州召开,现在征集优秀的研究论文,本届会议还专门设置了special session track,优秀论文将被推荐到SCI期刊发表,敬请赐稿!http://jist2019.openkg.cn/The Joint Inte…

阿里P8架构师谈:主流RPC框架详解,以及与SOA、SOAP、REST的区别

什么是RPC RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。 简言之,RPC使得程序能够像访问本地系统资源一样,去…

LeetCode 322. 零钱兑换(DP)

文章目录1. 题目信息2. 解题2.1 回溯穷举2.2 动态规划1. 题目信息 给定不同面额的硬币 coins 和一个总金额 amount。 编写一个函数来计算可以凑成总金额所需的最少的硬币个数。 如果没有任何一种硬币组合能组成总金额,返回 -1。 示例 1: 输入: coins [1, 2, 5], …

服务器使用

杀死用户lyli的所有进程 killall -u lyli杀是PID为19347的进程 kill -s 9 19347查看CPU的使用情况 free -h 查看进程实时情况 top一般有用的就这两个,RES是实际占了多少内存,%CPU除以100%就是占了多少块CPU

可以闭眼入的O'REILLY机器学习神书出新版了!

传说中的机器学习“四大名著”中最适合入门的一本——“蜥蜴书”新版来了!这本书的英文原版是美国亚马逊AI霸榜图书,在人工智能、计算机神经网络、计算机视觉和模式识别三大榜单中,均为榜首!国内外好评率均超过90%!读者…

论文浅尝 | 基于知识库的神经网络问题生成方法

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为跨语言知识图谱问答。来源:NLPCC2018链接:http://tcci.ccf.org.cn/conference/2018/papers/EV7.pdf问题背景与动机作者认为,目前的问题语料生成主要依赖于人…

何使用BERT模型实现中文的文本分类

原文网址:https://blog.csdn.net/Real_Brilliant/article/details/84880528 如何使用BERT模型实现中文的文本分类前言Pytorchreadme参数表算法流程1. 概述2. 读取数据3. 特征转换4. 模型训练5. 模型测试6. 测试结果7. 总结前言 Google官方BERT代码(Tenso…

LeetCode 152. 乘积最大子序列(DP)

文章目录1. 题目信息2. 解题1. 题目信息 给定一个整数数组 nums ,找出一个序列中乘积最大的连续子序列(该序列至少包含一个数)。 示例 1:输入: [2,3,-2,4] 输出: 6 解释: 子数组 [2,3] 有最大乘积 6。 示例 2:输入: [-2,0,-1] 输出: 0 解释…

YouTube深度学习推荐系统的十大工程问题

文 | 王喆源 | https://zhuanlan.zhihu.com/p/52504407这篇文章主要介绍了YouTube深度学习系统论文中的十个工程问题,为了方便进行问题定位,我们还是简单介绍一下背景知识,简单回顾一下YouTube的深度推荐系统论文Deep Neural Networks for Yo…

RPC框架的实现原理,及RPC架构组件详解

RPC的由来 随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。 单一应用架构 当网站流量很小时,只需一个应…

论文浅尝 | 时序与因果关系联合推理

论文笔记整理:李昊轩,南京大学硕士,研究方向为知识图谱、自然语言处理。来源:ACL2018链接:https://www.aclweb.org/anthology/P18-1212动机理解事件之间的时间和因果关系是一项基本的自然语言理解任务。由于原因一定先…

LeetCode 64. 最小路径和(DP)

文章目录1. 题目信息2. 解题1. 题目信息 给定一个包含非负整数的 m x n 网格,请找出一条从左上角到右下角的路径,使得路径上的数字总和为最小。 说明:每次只能向下或者向右移动一步。 示例:输入: [[1,3,1],[1,5,1],[4,2,1] ] 输出: 7 解释…

加快读博失败的10种方法

文 | 德先生源 | 知乎博士难毕,全球皆如此。差不多每个学校都有1/3到一半的博士研究生拿不到学位。读博失败不仅本人难受,导师也不好过。为了帮助自己的博士生们顺利毕业,犹他大学的Matt Might教授(计算机科学家,生物学…

要成为一个 Java 架构师得学习哪些知识以及方法?

“ 最近在架构师线下实战中,被问到最多的一个问题,就是要成为一个 Java 架构师得学习哪些知识,以及怎样才能做到架构师这个级别? 今天主要澄清几个关于架构师的几大误区。 架构师并不是人人都能做到的,如果你能走到…

论文浅尝 | 一种可解释的语义匹配复值网络

笔记整理:耿玉霞,浙江大学直博生。研究方向:知识图谱,零样本学习,自然语言处理等。论文链接:https://arxiv.org/pdf/1904.05298.pdf本文是发表在 NAACL 2019 上的最佳可解释性论文。受量子力学中数学模型的…