IJCAI 2018:中科院计算所:增强对话生成一致性的序列到序列模型

IJCAI 2018:中科院计算所:增强对话生成一致性的序列到序列模型

你和“懂AI”之间,只差了一篇论文

号外!又一拨顶会论文干货来袭!

2018年6月9-10日,代表学术界和工业界的顶级交流盛会——由中国中文信息学会青年工作委员会和百度公司联合举办的【“ALS2018(ACL、IJCAI、AIGIR)论文预讲会”】在北京盛大举行。两天时间内,来自“情感分析”“推荐系统”“机器问答”“对话系统”等不同主题的顶级会议论文报告汇聚一堂,英雄相惜,华山论剑。

据芯君了解,本次预讲会在学术圈的火爆程度完全超出了主办方的想象,开放报名的短短几天就全面满额了,以至于主办方不得不设定条件筛选参会者。

读芯君作为本次预讲会的活动媒体,将全程跟随大会,为大家全程纪录活动中最前沿的观点,最有价值的成果,并特邀预讲会论文报告者联合为读者朋友们推出预讲会系列组文,向你展示顶会最新论文成果。

读芯术读者论文交流群,请加小编微信号:zhizhizhuji。等你。

这是读芯术解读的第56篇论文

作者:张海楠,兰艳艳,郭嘉丰,徐君,程学旗IJCAI 2018增强对话生成一致性的序列到序列模型Reinforcing Coherence for Sequence to Sequence Model in Dialogue Generation中国科学院计算所Institute of Computing Technology,Chinese Academy of Sciences【摘要】序列到序列模型(Seq2Seq)的方法在对话生成领域获得了高度关注。但目前存在一个严重的问题就是大多数现有的基于Seq2Seq的模型倾向于产生缺乏具体含义的通用回复。我们分析主要是因为Seq2Seq相当于优化Kullback-Leibler(KL)距离,因此它不惩罚那些生成概率高、真实概率低的句子。然而,真实的概率是未知的,构成了解决这个问题的挑战。我们考虑可以使用post和response一致性(即相似性)来近似真实概率,并统计了一致性分数与人工打分的关系,发现二者呈正比关系。因此我们将一致性分数作为奖励,加入到强化学习框架中,惩罚那些生成概率高但是真实概率低的句子。本文提出了三种不同类型的一致性函数,包括unlearned的相似性函数,预训练的语义匹配函数,以及端到端的对偶学习模型。实验在中文的微博数据集和英文的电影字幕数据集上均显示本文的模型可以产生更具体和更有意义的回复,无论在自动评价指标和人工评价两方面,本文的模型均好于Seq2Seq模型及其变种。

1 介绍本文重点讨论单轮对话生成问题,根据Post,可以自动生成适当的回复Response。大多数现有的神经对话模型都是基于Seq2Seq架构[Sutskever et al., 2014]的架构。递归神经网络(RNN)编码器首先将输入Post编码为固定长度的向量,然后将该向量输入到另一个RNN解码器,用该解码器进行回复生成。模型使用最大似然估计的方法进行参数学习,期望真实的概率可以通过生成的概率进行估计。

尽管Seq2Seq能够产生流畅的回复,但是这类模型经常生成通用回复,比如“我不知道”,“这是什么意思?”和“哈哈”。显然,这些回复缺乏具体的含义,用户的体验不好。通过我们的分析,主要原因是Seq2Seq的目标是等价于最小化KL距离。

但是,KL距离是不对称的,因此它不会惩罚生成概率高但真实概率低的句子。我们统计了生成句子在真实数据中的命中率:

统计结果如表1所示。

Exactly matching

Semantic matching

HitR

0.285561

0.426222

HitP

0.02419

0.03583

表1 生成语句在真实数据中的命中率和命中概率根据我们对对话数据STC的统计,Seq2Seq的完全命中率和完全命中概率分别为0.004239和0.00091。因此,我们得出一下结论:大多数生成的回复都不是真实的回复,这些回复的真实概率可能非常低。由于统计完全命中太过严格,我们还统计了语义层面的结果,当两个句子的余弦相似度足够大(本文设置0.9),就认为两个句子命中。在这种情况下的统计结果为命中率0.1449和命中概率0.01255。因此,即使我们考虑了语义层面,生成回复的真实概率仍然非常低。

在本文中,我们利用生成回复与Post的一致性分数作为对真实概率的估计,我们统计了一致性分数与人工评分(评分细则见实验)的关系,发现二者呈正相关,如图1所示。

图1 post-generation的一致性与人工评分的关系

2 模型我们提出了三种类型的一致性函数:

1.unlearned相似度函数,如余弦相似度(如图2所示),可以直接用为相关性模型。

图2 post与generation的余弦相似度一致性分数2.语义层面的文本匹配模型可被视为衡量Post和生成回复的一致性的函数。在本文中,我们使用两个预训练的语义匹配函数,即GRU双线性模型[Socher et al.,2013](如图3)和MatchPyramid [Pang et al.,2016](如图4),这是代表两种不同类型的深度语义匹配模型,即表示重点突出的方法和着重于交互的方法。

图3 GRU双线性模型

图4 MatchPyramid一致性模型3.端到端的对偶学习框架[Xia et al.,2016],它可以用来同时学习生成模型和一致性模型。对偶学习的过程如下:

1)agent1(第一个seq2seq模型)理解post,并生成G1,并把G1发送给agent2(第一个seq2seq模型)。

2)agent2是一个Response->post的模型,它收到G1,并通过自己的模型计算G1条件下生成X的概率,作为对agent1的奖赏。

3)agent1根据agent2给出的奖赏,调整自己的生成策略。

4)以上三个步骤从agent2开始,对称的重复一遍。

它的计算如下:

3 优化使用一致性分数作为奖励,融入到强化学习的框架中。学习过程将惩罚那些生成概率高但真实概率低的例子。强化学习框架如下图所示(左图是unlearned和预训练的学习框架,右图是对偶学习的学习框架):

左图的优化公式为:

右图的优化公式为:

4 实验我们在两个公开数据集上进行了实验,即中文微博数据集和英文电影字幕数据集。实验结果显示我们的模型在自动评价和人工评价下,均明显好于baselines。在表2显示了自动评价的结果,我们提出的一致性模型比baseline模型获得更高的BLUE和distinct, 更低的PPL。对偶学习模型获得了最优的效果。

人工评价的评分规则如下:

1分表示逻辑错误

2分表示不相关

3分表示通用回复

4分表示相关

5分表示像人的回复

表3展示了人工评价的结果,从结果中可以看到本文的一致性模型提高了4和5分的比例,生成更相关的回复,并且对偶学习模型的人工评价得分最高。

表4展示了一些生成的case,可以看出一致性模型可以生成更多的有趣和具体的回复。

留言 点赞 发个朋友圈我们一起探讨AI落地的最后一公里

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20180611A1YJUO00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
0
扫描二维码

扫码关注云+社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480897.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一时学习一时爽,持续学习持续爽

一只小狐狸带你解锁NLP/ML/DL秘籍作者:小鹿鹿鹿 net~net~你围棋下的这么好,斗地主应该也不错吧不敢当不敢当但是人家柯洁才得了欢乐斗地主全国第一呢那让老夫也学习学习吧~巴拉巴拉小魔仙Training。。。net net stop!你怎么斗地主还没学会&am…

基于“大中台+小前台”思想的电商系统总体架构设计

一、架构总原则 1. 大中台小前台的架构思路 2. 业务中台采用领域驱动设计(DDD),在其上构建业务能力SAAS,持续不断进行迭代演进。 3. 平台化定位,进行了业务隔离设计,方便一套系统支撑不同玩法的业务类型和便…

论文写作葵花宝典

一只小狐狸带你解锁NLP/DL/ML秘籍作者:小鹿鹿鹿论文写作套路老板说:写论文是有套路的老板说:introduction写好了,论文就成功了一半老板说:你的motivation是什么,contribution又是啥?小夕说&…

李涓子 | 机器智能加速器:大数据环境下知识工程的机遇和挑战

本文转载自公众号:数据派THU。 导读:知识图谱已经成为推动人工智能发展的核心驱动力之一。本文选自清华大学计算机科学与技术系教授、清华-青岛数据科学研究院科技大数据研究中心主任李涓子老师于201…

【HTML/CSS】CSS盒模型及其理解

1 盒模型 概念:CSS盒模型本质是一个盒子,包括:外边距margin、边框border、内边距padding、内容content 分类:标准盒模型(W3C)和怪异盒模型(IE) 标准盒模型:width的值就是…

Netty异步非阻塞事件驱动及原理详解

本文基于 Netty 4.1 展开介绍相关理论模型、使用场景、基本组件、整体架构,知其然且知其所以然,希望给大家在实际开发实践、学习开源项目方面提供参考。 Netty 是一个异步事件驱动的网络应用程序框架,用于快速开发可维护的高性能协议服…

文本预处理跑得慢?抱抱脸团队又放福利,1GB文本语料分词只需20s!

一只小狐狸带你解锁NLP/DL/ML秘籍正文素材来源:量子位缘起BERTBERT带来的并不是只有一大波paper和嗷嗷上线,还带火了一个NLP团队——Huggingface(中文译作抱抱脸)。抱抱脸团队是一个创业团队。他们的Transformers是github上最火的…

基于深度学习的FAQ问答系统

| 导语 问答系统是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。相较于搜索引擎,问答系统能更好地理解用户提问的真实意图, 进一步能更有效地满足用…

基于SpringBoot2.x、SpringCloud和SpringCloudAlibaba的企业级微服务敏捷开发系统架构

一、项目总体架构图 二、功能介绍 2.1、统一认证功能 支持oauth2的四种模式登录 支持用户名、密码加图形验证码登录 支持手机号加密码登录 支持openId登录 支持第三方系统单点登录 2.2、分布式系统基础支撑 服务注册发现、路由与负载均衡 服务降级与熔断 服务限流(url/方法级别…

征文通知 | 2018年全国知识图谱与语义计算大会

2018年全国知识图谱与语义计算大会China Conference on Knowledge Graph and Semantic Computing (CCKS 2018)2018年8月15日-18日,天津征稿截止: 2018年5月18日全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Comp…

如何让聊天机器人懂情感?这是一篇来自清华的论文

原载:Paperweekly作者:黄民烈,清华大学老师关注自然语言处理、人机对话情感分析等方向aihuangtsinghua.edu.cn当你悲伤的时候,机器人可以安慰你;当你高兴的时候,机器人为你高兴。悲你所悲,喜你所…

戴着口罩也要开心过年吖!

一只小狐狸带你解锁NLP/ML/DL秘籍素材来源于网络新的一年????就要到来了作为超(bu)高(shan)智(yan)商(ci)的程序员如何向亲朋好友证明我们是人群中最靓的仔呢小夕为你准备了专属程序员的新春祝福~~普天同庆for (;;) { print("鼠年快乐"); }(满屏的新年…

【HTML/CSS】margin塌陷和合并问题

1 margin塌陷问题 1.1 示例 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>margin塌陷</title…

集群、分布式、微服务的概念及异同

一、什么是集群&#xff1f; 集群是指将多台服务器集中在一起&#xff0c;每台服务器都实现相同的业务&#xff0c;做相同的事&#xff1b;但是每台服务器并不是缺一不可&#xff0c;存在的主要作用是缓解并发能力和单点故障转移问题。 集群主要具有以下特征&#xff1a;&…

论文浅尝 | Complex Embeddings for Simple Link Prediction

The ́o Trouillon, Johannes Welb, Sebastian Riedel, ÉricGaussier, Guillaume Bouchard . Complex Embeddings for Simple Link Prediction. In Proceedings of the 33ndInternational Conference on Machine Learning, pages 2071– 2080 (ICML2016)论文链接&#xff1a;…

详解医学顶刊《柳叶刀》最新发表新型冠状病毒研究论文

我是夕小瑶&#xff0c;一只热爱科研的小狐狸作者&#xff1a;夕小瑶&#xff0c;小鹿鹿鹿&#xff0c;QvQ前言新型冠状病毒&#xff08;2019-nCoV&#xff09;的突发恰逢春节&#xff0c;千家万户都对疫情十分关注。令人心痛的是&#xff0c;病毒带来的不止有病痛&#xff0c;…

AI学习笔记--人机对话的四种形态

AI学习笔记--人机对话的四种形态 ><div class"show-content-free"><p>最近在筹备转行 AI PM 由于之前的产品线也有做过类似 AI 的智能客服产品&#xff0c;所以打算先从人机对话这个角度入手。</p><p>以下文章结合了一些 case&#xff0c…

Spring Cloud简介,为什么需要Spring Cloud?

一、为什么需要Spring Cloud&#xff1f; 从分布式/微服务的角度而言&#xff0c;就是把我们一个大的项目分解成多个小的模块&#xff0c;这些小的模块组合起来&#xff0c;完成功能&#xff1b;而拆分出多个模块以后&#xff0c;就会出现各种各样的问题&#xff0c;而Spring C…

论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文

本文转载自公众号&#xff1a;PaperWeekly。CIKM 2017■ 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin Large-Scale Knowledge Bases■ 链接 | https://www.paperweekly.site/papers/1528■ 解读 | 罗丹&#xff0c;浙江大学硕士1. Motivation 随着语义…

NLP最佳入门与提升路线

一只小狐狸带你解锁NLP/ML/DL秘籍作者&#xff1a;夕小瑶&#xff0c;小鹿鹿鹿&#xff0c;QvQ前言对突如其来的长假感到惶恐和不安&#xff1f;紧盯2019-nCoV的最新消息却依然感觉很空虚&#xff1f;腰酸萎靡脖子僵甚至怀疑自己有点发烧&#xff1f;这是长时间没学习的症状。 …