论文浅尝 | 以知识图谱为基础的开放域对话生成的目标规划

笔记整理 | 韩振峰,天津大学硕士。


链接:https://ojs.aaai.org//index.php/AAAI/article/view/6474

动机

之前有关开放域对话生成的神经模型没有有效的机制来管理聊天主题,并且往往会生成不连贯的对话。受到人与人对话策略的启发,本文将多轮开放域对话生成任务分为两个子任务:明确的目标(有关主题的聊天)序列规划和通过主题阐述的目标补全。为此,本文提出了一个三层的基于知识的分层强化学习模型(KnowHRL)。对于第一个子任务,上层策略学习如何遍历知识图谱,从而规划一个高层次的目标序列,以便在对话连贯性和用户兴趣的主题一致性之间取得良好的平衡。对于第二个子任务,中层策略和下层策略协同工作,使用目标驱动的生成机制就单个主题进行深入的多轮对话。目标序列规划的能力使得聊天机器人可以针对推荐主题进行主动的开放域对话,这种类型的对话具有很多实际的应用。

亮点

KnowHRL的亮点主要包括:

(1)本文首次尝试将多轮开放域对话生成任务分为两个子任务:目标序列规划和基于对话阐述的目标补全。

(2)在知识图谱的帮助下,本文提出精确、可解释的对话状态和用于策略学习的行为。这有两种优点:一是能够很方便地设计与目标相关的奖励来优化目标和方面的规划;二是使用目标和方面的信息来知道生成更连贯和更具信息的回复。

(3)实验表明模型在用户兴趣的一致性、对话连贯性和知识准确性等方面很有效。

概念及模型

KnowHRL有三个层级策略,且能够分为两个子任务:目标序列规划和基于主题阐述的目标补全。目标序列规划:上层策略学习如何遍历知识图谱来规划目标序列,并且需要在对话连贯性和用户兴趣一致性之间取得平衡。基于主题阐述的目标补全:中层策略从当前目标节点的一跳邻居中选择一个作为主题方面;下层策略使用给定的目标和主题方面中的一个来指导下层策略生成一个深入的多轮对话。

模型整体框架如下:

  • State

状态S由对话历史g、主题方面历史f、上下文语句u和特殊符号ut组成。其中ut表示是否在上一个语句中提到了一个新的话题,是则ut=1,否则ut=0;u定义为之前对话中的两个语句。

三层策略分别有不同的行为空间,上层使用当前目标节点的所有邻居节点和用户提及的所有主题所谓行为空间;中层使用当前目标节点的所有邻居节点并删去其中已经在之前的对话中被提到的节点;下层回复向量的集合作为行为,每一个向量代表一种生成回复的方式。

  • Policy

本文使用分层策略,共分为三层,每层策略的定义如下:

上层策略:

中层策略:

下层策略:

  • Multi-mapping generator

此模块使用的现有的模型,如上图所示,其中:

损失函数:

  • Rewards

为三层策略分别设计了不同的奖励因素,其中上层策略包括:目标序列的连贯性、用户兴趣的一致性、多样性、可持续性、来自中层策略的目标补全信息。中层策略包括:主题方面连贯性、来自下层的奖励。下层策略包括:语句相关性、语句的信息量、主题方面补全。

实验

本文使用公开的知识驱动的对话数据集DuConv来预训练多映射生成器、基准模型和用户模拟器,并且此数据集提供了一个电影和名人领域的知识图谱。本文使用2个基线对比算法,CCM和CCM+LaRL。本文使用人工在Session-level和Turn-level两个纬度对模型进行了评价。

  • Session-level

从主题内一致性(Intra.)、主题间一致性(Inter.)、独特性(Dist-2)、知识准确性(K.A.)和用户兴趣一致性(Cons.)等方面对模型在Session-level的表现进行评价。表2和表3分别为模型在与用户模拟器和真实用户聊天时的得分,可以看出KnowHRL在5个指标上均达到最好的效果。

  • Turn-level

从合理性(Appr.)、信息量(Info.)量方面对模型在Turn-level的表现进行评价。表4可以看出KnowHRL在2个指标上均达到最好的效果。

总结

本文将多轮开放域对话生成任务分为两个子任务:目标序列规划和通过主题阐述的目标补全,并提出了基于知识的分层强化学习模型(KnowHRL)来展示在知识图谱上的层级目标规划如何进行聊天主题管理和回复生成。实验结果证明了KnowHRL在对话连贯性、用户兴趣一致性和知识准确性等方面达到最好的效果。

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478306.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 378. 有序矩阵中第K小的元素(二分查找)

文章目录1. 题目2. 解题2.1 暴力法2.2 二分查找1. 题目 给定一个 n x n 矩阵,其中每行和每列元素均按升序排序,找到矩阵中第k小的元素。 请注意,它是排序后的第k小元素,而不是第k个元素。 示例: matrix [[ 1, 5, 9],[10, 11,…

LeetCode 341. 扁平化嵌套列表迭代器(双栈)

文章目录1. 题目2. 双栈解题1. 题目 给定一个嵌套的整型列表。设计一个迭代器,使其能够遍历这个整型列表中的所有整数。 列表中的项或者为一个整数,或者是另一个列表。 示例 1: 输入: [[1,1],2,[1,1]] 输出: [1,1,2,1,1] 解释: 通过重复调用 next 直到…

外卖O2O的用户画像实践

美团外卖经过3年的飞速发展,品类已经从单一的外卖扩展到了美食、夜宵、鲜花、商超等多个品类。用户群体也从早期的学生为主扩展到学生、白领、社区以及商旅,甚至包括在KTV等娱乐场所消费的人群。随着供给和消费人群的多样化,如何在供给和用户…

论文浅尝 | 利用开放域触发器知识改进事件检测

笔记整理 | 申时荣,东南大学博士来源:ACL 2020源码:https://github.com/shuaiwa16/ekd.git摘要事件检测(ED)是文本自动结构化处理的一项基本任务。由于训练数据的规模小,以前的方法在unseen/标记稀疏的触发…

Beyond 预训练语言模型,NLP还需要什么样的知识?

近年来,深度学习技术已广泛应用于NLP领域,但实际应用效果往往受限于缺乏大规模高质量监督样本。2018年底,预训练语言模型横空出世,极大缓解了这个问题,通过“超大规模无监督语料上的预训练语言模型相对少量的监督样本进…

日志级别动态调整——小工具解决大问题

随着外卖业务的快速发展,业务复杂度不断增加,线上系统环境有任何细小波动,对整个外卖业务都可能产生巨大的影响,甚至形成灾难性的雪崩效应,造成巨大的经济损失。每一次客诉、系统抖动等都是对技术人员的重大考验&#…

LeetCode 324. 摆动排序 II

文章目录1. 题目2. 解题1. 题目 给定一个无序的数组 nums&#xff0c;将它重新排列成 nums[0] < nums[1] > nums[2] < nums[3]… 的顺序。 示例 1: 输入: nums [1, 5, 1, 1, 6, 4] 输出: 一个可能的答案是 [1, 4, 1, 5, 1, 6] 示例 2: 输入: nums [1, 3, 2, 2, 3,…

最全的Pycharm debug技巧

最全的Pycharm debug技巧&#xff1a; 工欲善其事&#xff0c;必先利其器。无论你的 IDE 是 IntelliJ IDEA、Pycharm、WebStorm、GoLang、还是PhpStorm &#xff0c;调试器都是标配。在遇到有问题的程序时&#xff0c;合理的利用调试器的跟踪和断点技巧&#xff0c;可以很快的…

OpenKG祝大家端午安康

—????????OpenKG祝大家端午安康????????—

两个月,刷了八千篇Arxiv,我发现……

文 | 白鹡鸰编 | 小轶从五月初到现在&#xff0c;大约刷了八千篇Arxiv之后&#xff0c;我发现我有毛病。当然&#xff0c;这是读论文上头时的牢骚&#xff0c;不是真心话&#xff0c;只是说&#xff0c;我在Arxiv上投入的精力的努力&#xff0c;与我预计的收获不成正比。故事的…

深度学习在美团的应用

近年来&#xff0c;深度学习在语音、图像、自然语言处理等领域取得非常突出的成果&#xff0c;成了最引人注目的技术热点之一。美团这两年在深度学习方面也进行了一些探索&#xff0c;其中在自然语言处理领域&#xff0c;我们将深度学习技术应用于文本分析、语义匹配、搜索引擎…

LeetCode 315. 计算右侧小于当前元素的个数(二叉查找树二分查找归并排序逆序数总结)

文章目录1. 题目2. 解题2.1 二叉查找树2.2 二分插入2.3 归并排序1. 题目 给定一个整数数组 nums&#xff0c;按要求返回一个新数组 counts。数组 counts 有该性质&#xff1a; counts[i] 的值是 nums[i] 右侧小于 nums[i] 的元素的数量。 示例: 输入: [5,2,6,1] 输出: [2,1,1…

领域应用 | 金融资管领域知识图谱的构建和应用

转载公众号 | DataFunTalk分享嘉宾&#xff1a;李渔 熵简科技 联合创始人编辑整理&#xff1a;唐汝佳出品平台&#xff1a;DataFunTalk导读&#xff1a;本次分享的主题是金融资管领域知识图谱的构建和应用&#xff0c;主要介绍如何运用大数据、AI这些技术手段&#xff0c;来帮助…

我分析了ACL21论文列表,发现对比学习已经...

文 | 花小花Posy小伙伴们&#xff0c;好久不见呀&#xff0c;小花又回来了&#xff01;最近关注对比学习&#xff0c;所以ACL21的论文列表出来后&#xff0c;小花就搜罗了一波&#xff0c;好奇NLPers们都用对比学习干了什么&#xff1f;都是怎么用的呀&#xff1f;效果怎样呀&a…

LeetCode 629. K个逆序对数组(DP)

文章目录1. 题目2. 动态规划3. 优化的DP1. 题目 给出两个整数 n 和 k&#xff0c;找出所有包含从 1 到 n 的数字&#xff0c;且恰好拥有 k 个逆序对的不同的数组的个数。 逆序对的定义如下&#xff1a;对于数组的第i个和第 j个元素&#xff0c;如果满i < j且 a[i] > a[…

快速的找出元素是否在list中 python

number [[1,2],[3,2]] num np.array(number) np.argwhere(num2) np.argwhere(num2) array([[0, 1], [1, 1]], dtypeint64) 注意&#xff1a;只能是维度相同的时候&#xff0c;才能用该方法。 om ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or nd…

论文浅尝 | 知识图谱的神经符号推理(上)

笔记整理 | 叶橄强&#xff0c;浙江大学在读硕士&#xff0c;研究方向为知识图谱的表示学习和预训练。知识图谱推理是支撑信息提取、信息检索和推荐等机器学习任务的基础组成部分&#xff0c;并且由于知识图可以看作知识的离散符号表示&#xff0c;自然可以利用符号技术做知识图…

ICML2021 | Self-Tuning: 如何减少对标记数据的需求?

文 | 王希梅&#xff0c;高敬涵&#xff0c;龙明盛&#xff0c;王建民源 | THUML本文介绍ICML2021的中稿论文&#xff1a;Self-Tuning for Data-Efficient Deep Learning&#xff0c;就“如何减少对标记数据的需求”这一重要问题给出了我们的思考。论文标题&#xff1a;Self-Tu…

美团点评Docker容器管理平台

本文是郑坤根据第14期美团点评技术沙龙“你不知道的美团云”演讲内容整理而成&#xff0c;已发表在《程序员》杂志2017年1月刊。 美团点评容器平台简介 本文介绍美团点评的Docker容器集群管理平台&#xff08;以下简称“容器平台”&#xff09;。该平台始于2015年&#xff0c;是…

Python 获取本机或者服务器的 IP 地址

获取计算机名称 hostname socket.gethostname() 获取本机 IP ip socket.gethostbyname(hostname) print(ip) 具体操作 import socket hostname socket.gethostname() ip socket.gethostbyname(hostname) print(ip)通常使用 socket.gethostname() 方法即可获取本机 IP …