论文浅尝 - ACL2020 | 利用常识知识图对会话流进行显式建模

笔记整理 | 韩振峰,天津大学硕士


链接:https://arxiv.org/pdf/1911.02707.pdf


动机

人类对话自然地围绕相关概念发展,并分散到多跳概念。本文提出了一种新的会话生成模型——概念流(ConceptFlow),它利用常识知识图对会话流进行显式建模。通过将对话建立在概念空间的基础上,ConceptFlow表示潜在的对话流,它沿着常识关系在概念空间中遍历。遍历由概念图中的图注意力引导,向概念空间中更有意义的方向移动,以生成具有更多语义和信息量的响应。在Reddit会话数据集上的实验表明,ConceptFlow的有效性优于以前的知识感知会话模型和基于GPT-2的模型,同时使用的参数减少了70%,证实了显式建模会话结构的优势。


亮点

论文的亮点主要包括:

(1)ConceptFlow利用常识知识图对会话流进行了显式建模,并对所有概念提出了一种新的注意机制来引导潜在概念空间中的会话流。

(2)ConceptFlow的在生成回复的结果优于其他模型的时,其模型参数更少。

(3)设置了丰富的实验对ConceptFlow相关的内容进行探讨,对ConceptFlow的优势给出了令人信服的证据。


概念及模型

为了模拟人类对话中的概念转换,本文提出了概念流(ConceptFlow),它利用常识知识图来模拟显式概念空间中的对话流。ConceptFlow明确地将对话建模为常识知识图中的遍历:它从基础概念(如“聊天”和“未来”)开始,并通过沿着常识关系跳转到相关概念(如“交谈”和“梦想”)来生成更有意义的对话。概念图中的遍历由图注意机制引导,该机制源自图神经网络以关注更合适的概念。概念流学会沿着常识知识图中更有意义的关系来模拟对话的发展。结果,该模型能够通过从对话话语沿着常识关系跳跃到遥远但有意义的概念来“增长”基础概念;这将引导模型生成更多信息和主题响应。

ConceptFlow具体由三部分构成:概念图构建、编码潜在概念流、使用概念流生成文本。

模型整体框架如下:

概念图构建

假ConceptFlow构建一个概念图G作为每次对话的知识。它从基础概念(零跳概念)开始,这些概念出现在对话话语中,并由实体链接系统进行注释。然后ConceptFlow用一跳概念和两跳概念扩展零跳概念。零跳概念和一跳概念以及它们之间所有的关系构成了与当前对话主题密切相关的中心概念图,一跳概念和两跳概念以及它们之间的关联构成了外部图

编码潜在概念流

构造的概念图提供了概念如何与常识知识相关的显示语义,概念流利用它来模拟对话并指导回复的生成。它从用户话语开始,通过中心图到达外部图。这是从用户话语编码中心和外部概念流来建模的。

中心流编码:使用图神经网络对中心概念图进行编码,图神经网络将用户话语H的信息传递到中心概念图,即将概念编码成表达

其中指概念的嵌入表示。

      外部流编码:一跳概念到其连接的两跳概念的外部流通过注意力机制被编码为

注意力聚合三元组得到

使用概念流生成文本

为了同时考虑用户话语和相关信息,来自用户话语的文本和潜在概念流由解码器使用两个组件来合并:1)组合它们编码的上下文表示;2)从上下文表示中有条件地产生单词和概念。

      上下文表示:为了生成第t步的回复字符,首先根据话语和潜在概念流的编码计算第t步的解码得到输出上下文表达:

指第t-1步生成的字符的表示,是基于文本的表示和基于概念的表示的拼接:

基于文本的表示用标准的注意力机制读取用户话语编码:

注意力为:

基于概念的表示是中心流和外部流编码的结合:

注意力加权于中心概念表示:

注意力加权于外部流表示:

      字符生成:第t步输出表示包含来自话语文本、不同跳概念以及它们之间的注意力。解码器利用产生第t步的字符从而生成更有信息量的回复。它首先使用一个门通过选择单词、中心概念、外部概念集合来控制生成:

单词w,中心概念和外部概念的生成概率通过单词表,中心概念集合和外部概念集合计算:

实验

本文使用基于从Reddit的单轮对话数据集的多跳扩展对话数据集,使用预处理的ConceptNet 作为知识图谱。本文使用6个基线对比算法,它们来自3个类别:标准Seq2Seq、知识增强系统(MemNet、CopyNet、CCM)、微调GPT-2系统(GPT-2 lang、GPT-2 conv)。本文做个5个实验来评估从概念流生成的回复和学习到的图注意力的有效性。

回复质量

生成回复的质量用不同的度量标准从3个方面进行评估:相关性、多样性、新颖性。

表1评估回复的相关性,可以看出ConceptFlow的表现远远超过所有基线模型,ConceptFlow生成的回复更符合主题,与基本事实回复更匹配。

      表2评估回复的多样性和新颖性。ConceptFlow在生成回复的多样性和新颖性之间有很好的平衡。GPT-2的回复更加多样,也许是因为它在解码过程中的采样机制,但是与ConceptFlow相比,它的回复不那么新颖和切题。

表1和表2都是自动评估,表3是人类评估的结果,人类评估关注恰当和信息量两个方面。可以看出ConceptFlow在所有的指标下都优于其他模型,并且与GPT-2相比,它只使用了30%的参数。

多跳概念的有效性

本实验是多跳概念的消融实验,通过不同的外部概念挑选方法的对比,验证了外部概念的有效性。虽然在a中本文提出的方法(Full)不如Distract方法的表现好,但是综合b和c可以看出本文提出的方法效果最好 。

概念图的跳数

本实验研究了概念图中跳数的影响。表5显示了覆盖的黄金概念的数量随着跳数的增加而增加,然而与此同时概念的数量也随着跳数的增加而急剧增加,为了在覆盖和效率之间的平衡,本文选择两跳,并使用ConceptFlow(选择)过滤大约200个概念来构建修剪的图。

实例研究

本实验展示了几个实例,从表6可以看出本文的ConceptFlow生成的回复比CCM和GPT-2更流畅、信息更丰富。图4展示了注意力的可视化结果。

在概念上学到的注意力

本实验研究ConceptFlow对不同组的概念学习到的注意力。a展示了中心概念的注意力权重,可以看出ConceptFlow更多的黄金和零跳概念,其中包含更多有用的信息。b展示了对两跳概念的注意力,可以看出与其它两跳概念相比,ConceptFlow更关注黄金概念。

总结

本文提出的ConceptFlow将会话结构显示地建模为潜在概念空间的转换,以便生成具有更多语义和信息量的回复。本文在Reddit会话数据集上的实验说明了ConceptFlow相对于以前的会话系统的优势。研究证实ConceptFlow的优势来自于高覆盖率的潜在概念流,以及它的图注意力机制,该机制有效地将概念流引导到高度相关的概念。我们的人类评估表明,ConceptFlow在使用更少参数的同时,产生了更合适和信息更丰富的响应。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478455.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

百度NLP、视频搜索团队招聘算法实习生!

致力于连接最靠谱的算法岗与最强的求职者招聘贴投放请联系微信xixiaoyao-1问答工作职责研发文本问答、多模态问答、阅读理解、端到端问答等技术,利用NLP理论和方法解决实际问题结合数据、算力优势,在百度的搜索、凤巢等产品和业务实现技术落地研究问答、…

人工智能在线特征系统中的数据存取技术

主流互联网产品中,不论是经典的计算广告、搜索、推荐,还是垂直领域的路径规划、司机派单、物料智能设计,建立在人工智能技术之上的策略系统已经深入到了产品功能的方方面面。相应的,每一个策略系统都离不开大量的在线特征&#xf…

论文浅尝 - ACL2020 | IntKB: 一种交互式知识图谱补全框架

笔记整理 | 谭亦鸣,东南大学博士来源: ACL 2020链接:https://www.aclweb.org/anthology/2020.coling-main.490.pdf资源:https://github.com/bernhard2202/intkb.概述知识库作为许多下游NLP任务的资源基础,存在的一个普遍缺陷是它…

预训练模型的前世今生(有福利!)

近年来,在深度学习和大数据的支撑下,自然语言处理技术迅猛发展。而预训练语言模型把自然语言处理带入了一个新的阶段,也得到了工业界的广泛关注。通过大数据预训练加小数据微调,自然语言处理任务的解决,无须再依赖大量…

LeetCode 337. 打家劫舍 III(记忆化+递归)

文章目录1. 题目1.1 相关题目:2. 解题2.1 递归2.2 记忆化递归1. 题目 在上次打劫完一条街道之后和一圈房屋后,小偷又发现了一个新的可行窃的地区。这个地区只有一个入口,我们称之为“根”。 除了“根”之外,每栋房子有且只有一个…

孵化业务快速落地与优化

海外酒店是酒旅事业群第一个孵化的业务,从2016年9月份开始到现在已经半年多的时间。在业务后台搭建、成长、优化过程中,经历了很多的思考与选择。 主要分为下面几个阶段: 初建:调研、落地,合理复用,高效自建…

TPLinker 联合抽取 实体链接方式+源码分析

关系抽取–TPLinker: https://blog.csdn.net/weixin_42223207/article/details/116425447 Tagging TPLinker模型需要对关系三元组(subject, relation, object)进行手动Tagging,过程分为三部分: (1)entity head to enti…

论文浅尝 | KGAT: 用于推荐的知识图注意力网络

笔记整理 | 李爽,天津大学链接:https://arxiv.org/pdf/1905.07854v1.pdf动机为了提供更准确、多样化和可解释的推荐,必须超越对用户-项目交互的建模,并考虑辅助信息。传统的方法,如因子分解机(FM),将其视为…

对话系统答非所问?快试试这篇ACL'21的连贯性评估大法

文 | 页眉3编 | 小轶背景当我们在绞尽脑汁地想怎么设计一个对话系统的时候,我们当然希望最后训练出来的系统能越像人越好,输出的回复很连贯,很有趣,很体贴。而其中,连贯性可以说是最基本的要求之一了,毕竟不…

LeetCode 384. 打乱数组(rand)

1. 题目 打乱一个没有重复元素的数组。 示例:// 以数字集合 1, 2 和 3 初始化数组。 int[] nums {1,2,3}; Solution solution new Solution(nums);// 打乱数组 [1,2,3] 并返回结果。任何 [1,2,3]的排列返回的概率应该相同。 solution.shuffle();// 重设数组到它的初始状态[…

论文浅尝 - ACL2020 | 知识图谱补全方法的再评估

笔记整理 | 谭亦鸣,东南大学博士来源:ACL 2020链接:https://www.aclweb.org/anthology/2020.acl-main.489.pdf源码:http://github.com/svjan5/kg-reeval概述图谱补全(KGC)的目标是自动的预测大规模知识图谱…

美团数据库高可用架构的演进与设想

本文介绍最近几年美团MySQL数据库高可用架构的演进过程,以及我们在开源技术基础上做的一些创新。同时,也和业界其它方案进行综合对比,了解业界在高可用方面的进展,和未来我们的一些规划和展望。 在2015年之前,美团&…

恕我直言,很多小样本学习的工作就是不切实际的

文 | ????????????????编 | 小轶以前的小样本学习(Few-shot Learning),是需要用一个巨大的训练集训练的。测试时只给出 n-way k-shot,在这 N * k 个样本上学习并预测。我第一次看到这种任务设定的时候真是非常失望…

LeetCode 204. 计数质数(质数的倍数不是质数)

1. 题目 统计所有小于非负整数 n 的质数的数量。 示例:输入: 10 输出: 4 解释: 小于 10 的质数一共有 4 个, 它们是 2, 3, 5, 7 。2. 填表解题 2的倍数不是质数3的倍数不是质数5的倍数,7的倍数,11的倍数。。。质数的倍数不是质数 class Solution { p…

论文浅尝 | 六篇2020年知识图谱预训练论文综述

转载公众号 | AI机器学习与知识图谱本文介绍六篇有关知识图谱预训练的优秀论文,大致上可分为两类,生成学习模型和对比学习模型。其中GPT-GNN模型是生成学习模型,模型灵感来源于自然语言处理中的GPT模型;GCC,GraphCL&am…

distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse(‘setupto

distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse(‘setupto: 解决办法 1、安装scm:pip install setuptools-scm 2、 升级pip:pip install --upgrade pip 3、安装setuptools:pip install set…

客户端自动化测试研究

测试作为质量保证极其重要的一环,在移动App开发流程中起到非常关键的作用。从开发工程师到测试工程师,人人都应具备良好的测试意识,将隐患和风险在上线之前找出并解决,可以有效的减少线上事故。 美团和大众点评App作为美团点评平台…

视觉增强词向量:我是词向量,我开眼了!

文 | 橙橙子亲爱的读者,你是否被各种千亿、万亿模型的发布狂轰乱炸,应接不暇,甚至有点产生对大模型的审美疲劳?出于这个目的,今天来分享一篇研究静态词向量的小清新文章。希望大家可以在理性追热的同时,小冶…

会议交流 | 知识图谱前沿技术与热门应用

长按上图或点击『阅读原文』免费报名随着人工智能技术的发展与应用,知识图谱作为AI进步的阶梯越来越受到学术界和产业界的重视,并且已经在很多领域、场景中体现出自身的价值。从最初的互联网搜索、推荐、问答等ToC场景,逐渐进入到垂直行业ToB…

美团点评酒店后台故障演练系统

随着海量请求、节假日峰值流量和与日俱增的系统复杂度出现的,很有可能是各种故障。在分析以往案例时我们发现,如果预案充分,即使出现故障,也能及时应对。它能最大程度降低故障的平均恢复时间(MTTR)&#xf…