论文浅尝 - AAAI2020 | 多轮对话系统中的历史自适应知识融合机制

论文笔记整理:潘锐,天津大学硕士。


链接:https://www.aaai.org/ojs/index.php/AAAI/article/view/6425

来    源:AAAI 2020


论文简介

保持对话的一致性和避免内容重复是构建以知识为基础的多轮对话系统的两个关键因素。尽管一些工作倾向于将对话历史与外部知识(如个人背景信息)结合起来以提高对话质量,但它们往往忽略了将相同的知识多次融入对话会导致内容重复。这一现象的主要原因是缺乏对对话层面知识使用的有效控制。为此,本文设计了一种历史自适应知识融合机制,构建了一种有效的多轮对话模型,通过反复更新知识并逐步将其融入历史,来解决内容重复问题。


方法及模型

1、模型概述

模型由三部分组成:编码器层、历史适应层和输出层。

首先,编码器层使用Bi-GRU分别捕获外部知识、历史信息和候选答案的上下文信息。之后利用self-attention机制识别重要信息,忽略无关信息。在历史适应层中,反复更新外部知识,并逐步将其融入历史。这不仅有助于历史捕获知识,而且可以动态更新基于历史的知识。然后利用层次递归网络提取序列信息和上下文信息。最后,在输出层中计算历史记录和候选回复的相似度。

2、编码器层

编码器层负责提取上下文信息。具体地说,知识信息P、历史信息C和候选回答信息A分别由编码模块处理。编码模块由一个Bi-GRU组件和一个self-attention组件组成。在不失去一般性的情况下,,表示句子的嵌入矩阵,其中l是句子的个数,k 代表句子的长度,d 代表隐藏层的大小。

首先编码到, 然后用self-attention机制计算句子级表示。句子级表示更关注句子中的关键信息。对于每个句子

3、历史适应层

外部知识的控制和更新与对话的上下文紧密相关。本文设计了一种新的门控机制来控制外部知识信息向当前和下一轮对话的流动。一方面,该模块将知识信息集成到当前的对话中,获得知识感知的表示,这样有助于保持对话的一致性。另一方面,知识感知表示也有助于控制下一轮用于解决重复问题的知识更新。

历史知识更新

假设知识信息的初始状态为,然后根据历史信息循环更新知识。动态更新路径如下所示:


在步骤 t 更新外部知识如下:


这里使用U有两个目的:1)控制流向下一轮的知识信息。2)从话语层面选择语义相关的知识信息进行语境理解。

对于第一个目的,在和U之间进行非线性运算,得到新的表示形式。

然后,设计遗忘门来选择新旧知识表示,

设计这种架构是考虑到对话的一致性和重复性。通过运用门控机制鼓励选择与当前对话语义相关的知识,避免选择重复但不必要的知识。

对于第二个目的,将U标准化,对知识表示的每一个部分进行评分,得到知识感知的历史表示,这种表示将外部知识结合起来,以保持一致性。然后更新外部知识并逐步将其融入历史。


分层历史信息编码器

使用来自编码器层的不同GRU对上下文历史信息进行编码,并使用self-attention机制将重要信息提取到一个向量上。编码前,历史(其中)被送入GRU和self-attention结构。将最终有意义的历史表示表示为O。

4、输出层

输出层负责计算历史和候选回复的相似性,从候选回复中选择上下文一致的回复。


实验

数据集:Persona-Chat和CMUDoG dataset

Baseline:KV profile Mmeory (Zhang et al. 2018)和Transformer (Mazaré et al. 2018)

实验结果:

自动评价:用r@k和F1作为自动度量指标。

上表展示了在两个数据集上的自动评价结果,可以看到与基线相比,本文的模型有了显著的改进。r@k和F1的改进意味着所提出的模型能够更好捕获对话中的深层语义信息,并从提供的回复中选择更相关的回复。此外,模型对CMUDoG数据集的改进比Persona-Chat数据集的改进要大。原因可能是CMUDoG数据集包含更多的知识和更丰富的语义。历史自适应知识更新机制可以更好地训练,帮助对话有效地控制CMUDOG数据集上知识的使用。

人工评价:从重复性、一致性和相关性三个维度评价。

首先,本文的模型在人类评价方面优于基线,这表明了所提出的历史子女适应机制的有效性。第二,本文的模型有效减少了重复。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478600.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

高性能平台设计—美团旅行结算平台实践

本文根据第23期美团技术沙龙演讲内容整理而成。 背景 美团酒旅有很多条业务线,例如酒店、门票、火车票等等,每种业务都有结算诉求,而结算处于整个交易的最后一环不可缺少,因此我们将结算平台化,来满足业务的结算诉求。…

小程序调试技术导读

近期团队内在自研小程序,我负责开发者工具中的调试部分。调试作为面向开发者的基础能力,扮演了极为重要的角色。 本篇文章是导读文章。 调试能力从0到1一共经历了4个版本,接下来的文章将会以这4个版本为主线分别进行介绍。 初始版 上图为调试…

可交互的 Attention 可视化工具!我的Transformer可解释性有救了?

文 | Sherry视觉是人和动物最重要的感觉,至少有80%以上的外界信息是经过视觉获得的。我们看论文的时候,通过图表来确定文章的大致内容往往也是一个更高效的 说到深度神经网络的可视化,最经典的莫过于的CNN密恐图了:这种可视化方法…

ImportError: libSM.so.6: cannot open shared object file: No such file or dir

ImportError: libSM.so.6: cannot open shared object file: No such file or dir 出现错误: ImportError: libSM.so.6: cannot open shared object file: No such file or dir 解决方法: apt-get install libsm6如果你出现了上面的错误,那…

LeetCode 347. 前 K 个高频元素(哈希/优先队列)

文章目录1. 题目2. 解题2.1 哈希2.2 优先队列1. 题目 给定一个非空的整数数组,返回其中出现频率前 k 高的元素。 示例 1: 输入: nums [1,1,1,2,2,3], k 2 输出: [1,2]示例 2: 输入: nums [1], k 1 输出: [1] 说明: 你可以假设给定的 k 总是合理的&…

Lego-美团接口自动化测试实践

一、概述 1.1 接口自动化概述 众所周知,接口自动化测试有着如下特点: 低投入,高产出。比较容易实现自动化。和UI自动化测试相比更加稳定。如何做好一个接口自动化测试项目呢? 我认为,一个“好的”自动化测试项目&#…

小程序调试技术详解(基于小猴小程序)

本篇文章主要围绕小猴小程序调试技术第三版进行展开。 在上一篇导读文章中提到,小猴小程序的调试部分从无到有一共经历了3个版本。本篇文章会详细描述面向开发者的调试功能是如何实现的。 文章将会描述以下部分: 调试实现的基本通信关系结构。如何实现…

论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

论文笔记整理:王琰,东南大学硕士。来源:CIKM 2020链接:https://doi.org/10.1145/3340531.3411947研究背景与任务描述为了解决推荐系统中的数据稀疏和冷启动问题,研究人员通过利用有价值的外部知识作为辅助信息&#xf…

FedNLP: 首个联邦学习赋能NLP的开源框架,NLP迈向分布式新时代

文 | 阿毅两周前,南加大Yuchen Lin(PhD student USC and ex-research intern GoogleAI)所在的团队在Twitter官宣开源首个以研究为导向的联邦学习赋能NLP的FedNLP框架。发布数小时内就获得了647个赞,163次转发,可见其热度。我相信大…

LeetCode 380. 常数时间插入、删除和获取随机元素(哈希+vector)

1. 题目 设计一个支持在平均 时间复杂度 O(1) 下,执行以下操作的数据结构。 insert(val):当元素 val 不存在时,向集合中插入该项。 remove(val):元素 val 存在时,从集合中移除该项。 getRandom:随机返回现…

论文浅尝 - ICLR2020 | 知识图谱中数值规则的可微学习

论文笔记整理:许泽众,浙江大学博士研究生。研究方向:知识图谱,规则挖掘等。论文链接:https://openreview.net/pdf?idrJleKgrKwS本文解决的是规则的学习问题,学习出来的规则可用于知识推理任务,…

2021大厂面试高频100题最新汇总(附答案详解)

昨天在知乎上刷到一个热门问题:程序员需要达到什么水平才能顺利拿到 20k 无压力?其中一个最热门的回答是:“其实,无论你是前端还是后端、想进大厂还是拿高薪,算法都一定很重要。”为什么,算法会如此重要?不…

LeetCode 33. 搜索旋转排序数组(二分查找)

1. 题目 假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。 搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。 你可以假设数…

论文浅尝 - EMNLP2020 | 低资源跨语言实体链接中的设计挑战

论文笔记整理:谭亦鸣,东南大学博士。来源:EMNLP 2020链接:https://arxiv.org/pdf/2005.00692.pdf1.背景介绍跨语言实体链接(XEL)旨在将任一非英语文本中的实体提及匹配到英语知识库上(例如Wikip…

MSON,让JSON序列化更快

问题 我们经常需要在主线程中读取一些配置文件或者缓存数据,最常用的结构化存储数据的方式就是将对象序列化为JSON字符串保存起来,这种方式特别简单而且可以和SharedPrefrence配合使用,因此应用广泛。但是目前用到的Gson在序列化JSON时很慢&a…

屠榜各大CV任务!「百度顶会论文复现营」携Swin Transformer来袭!

目标检测刷到58.7 AP!实例分割刷到51.1 Mask AP!!语义分割在ADE20K上刷到53.5 mIoU!!!......Swin Transformer持续屠榜各大CV任务,并且均名列前茅!通过分层体系结构,带来…

百度任务型对话系统小记

意图扩展阅读: 古月哲亭: AAAI 2021 | 清华提出深度对齐聚类用于新意图发现:https://mp.weixin.qq.com/s/9dNs8TTERPdxmrVc3tF1zw 相关项目地址:https://github.com/thuiar/OKD-Reading-List 古月哲亭: 意图知识图谱的构建与应用&#xff1a…

论文浅尝 - EMNLP2020 | 跨媒体关键词预测: 多模态多头注意力和图像文本的统一框架...

论文笔记整理:柏超宇,东南大学硕士。文章链接:https://arxiv.org/pdf/2011.01565.pdf来源:EMNLP 2020动机社交媒体每天都会产生大量的内容。为了帮助用户快速捕捉所需内容,关键词预测受到越来越多的关注。尽管如此&…

从实际案例聊聊Java应用的GC优化

当Java程序性能达不到既定目标,且其他优化手段都已经穷尽时,通常需要调整垃圾回收器来进一步提高性能,称为GC优化。但GC算法复杂,影响GC性能的参数众多,且参数调整又依赖于应用各自的特点,这些因素很大程度…