论文浅尝 - EMNLP2020 | 基于分组式对比学习的神经对话生成

论文笔记整理:叶宏彬,浙江大学计算机博士生。


论文地址:https://arxiv.org/abs/2009.07543

摘要:近年来,神经对话问答的产生已广受欢迎。现有对话模型学习中广泛采用了最大似然估计目标(MLE)。但是,当涉及到开放域对话设置时,使用MLE目标函数训练的模型会受到低多样性问题的困扰。人类不仅可以从积极的信号中学习,而且还可以从纠正不良行为的行为中受益,在这项工作中,我们将对比性学习引入了对话生成中,其中模型明确地感知了精心选择的积极与消极之间的差异话语。具体来说,我们采用预先训练的基线模型作为参考。在对比学习期间,与参考模型相比,训练了目标对话模型以提供正样本的较高条件概率和那些负样本的较低条件概率。为了管理人类对话中普遍存在的多重映射关系,我们通过分组对偶采样来增强对比对话学习。大量的实验结果表明,所提出的基于组的对比学习框架适合于训练大量的神经对话生成模型,其性能优于基线训练方法。

动机

在本文中,我们将对比学习引入对话生成,其中模型明确地感知到选择好的正面和负面话语之间的差异。从对比学习的角度来看,对抗学习中的判别器将人类产生的反应视为正面话语,将合成反应视为负面话语。相反,这项工作将高度匹配的上下文响应对视为正样本,将不匹配的训练对视为负样本。特别是,我们利用预训练的基线模型作为参考。在对比学习期间,对于上下文c及其响应r,训练了目标对话模型,与参考模型相比,对正样本给出了更高的条件概率p(r | c),对负样本给出了更低的条件概率。如图1所示对于给定的训练实例,所提出的框架通过鼓励对话生成模型将匹配的样本对拉在一起并将不匹配的对在潜在空间中分开,从而明确考虑了人类对话中的多重映射关系。此外,从一对正样本和负样本中学习是非常简单的,但是,多映射关系在人与人之间的对话中占主导地位,在这种对话中,对于给定的上下文存在多个适当的响应,并且有时这种响应非常适合多个上下文,称为一对多和多对一的关系。这种复杂的多重映射关系在以前的学习框架中被忽略,这妨碍了有效的对话响应学习。如果将潜在高度匹配的对话对视为阴性样本,或者将离群值用作阳性样本,则可能会混淆模型。因此,为了考虑人类对话中的多重映射现象并纠正潜在的有问题的虚假学习样本,并提高训练的稳定性,我们通过分组对偶抽样来增强对比学习,其中对正负实例进行抽样 分别是上下文和响应。为了进一步描述组中实例之间的细微差异,我们使用匹配分数调整实例重要性,并优化加权损失。

图1:分组对比学习的示意图

损失函数改进

给定包含上下文响应对,由θ参数化的对话模型旨在将输入上下文c映射到输出响应r。为了实现这一点,传统的对话学习方法通过使训练样本上的条件概率pθ(r | c)最大化来搜索参数θ。

假如按以往基于正负对的对话学习做法,我们将以下损失函数最小化:

然而,在人类对话中存在多重映射关系的情况下,在对话中对正负对进行有效采样并不是那么简单,甚至存在引入错误学习样本的风险。为了处理人类对话中复杂的多重映射现象并提高训练稳定性,我们通过分组双重抽样来增强对比学习,其中分组抽样的正例和负例分别针对上下文和响应。如图2所示,对于每个训练对,它首先使用现成的会话匹配模型对一组高度匹配的示例进行采样,并对另一组与上下文和响应有关的最不匹配的话语进行采样,以建立对比示例。然后使用分组对比学习训练目标对话模型。

图2:分组式对比对话学习管道的演示

基于对比学习的损失函数更新为:

给定在开放域对话中收集的上下文响应对的匹配程度不同,对此类数据进行不加区分的训练会阻止模型感知这些样本的组内差异。因此,我们利用每个样本所附的匹配分数s来调整其实例效果对分组式对比对话学习的影响。

实验

作者在三个数据集上进行了实验。PersonaChat是一种英语数据集,包含通过Amazon Mechanical Turk收集的成对说话者之间的多轮对话。Douban包含来自受欢迎的社交网络服务-中国豆瓣小组的日常对话。OpenSubtitles包含从英语电影字幕转换而来的人与人之间的对话。基线模型和消蚀实验均证明了分组式对比学习方法在对话问答生成领域的有效性。


 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478676.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 841. 钥匙和房间(DFS/BFS)

文章目录1. 题目2. 解题2.1 DFS2.2 BFS1. 题目 有 N 个房间,开始时你位于 0 号房间。每个房间有不同的号码:0,1,2,…,N-1,并且房间里可能有一些钥匙能使你进入下一个房间。 在形式上&#xff…

容器中用uwsgi协议部署注意的问题以及用flask部署

1 表示当前容器名 一般通过 docker exec -it 容器名 /bin/bash , 进入容器内部进行操作,比如安装环境,传输文件 2 4888 容器内部访问端口地址,如果对外开放api,需要对其进行映射,比如映射成11022,11022是对外访问的端…

美团点评金融平台Web前端技术体系

背景 随着美团点评金融业务的高速发展,前端研发数量从 2015 年的 1 个人,扩张到了现在横跨北上两地 8 个事业部的将近 150 人。业务新,团队新,前端领域框架技术又层出不穷,各个业务的研发团队在技术选择上没有明确的指…

参会邀请 - CCKS2020 | 2020全国知识图谱与语义计算大会(CCKS2020)明日开幕

本文转载自公众号: 中国中文信息学会。第十四届全国知识图谱与语义计算大会将于2020年11月12日-15日在南昌召开。会议由中国中文信息学会语言与知识计算专业委员会主办,由江西师范大学承办,智源社区提供社区支持。本次会议讲习班采用线上举行…

Linux 程 序 员 失 业 警 告

文 | 小戏有多少人期待过像贾维斯一样的强人工智能?尽管老实说看当下的技术离这一期待还很遥远,但用用类似 GPT-3 这样的技术去实现些朴素的愿望似乎并没有那么困难。就在昨天,来自 Facebook 的 Elvis 在推特上发布了一个借助 OpenAI 的 GPT-…

LeetCode 707. 设计链表(List)

文章目录1. 设计一个单链表2. 双向链表1. 设计一个单链表 在链表类中实现这些功能: get(index):获取链表中第 index 个节点的值。如果索引无效,则返回-1。 addAtHead(val):在链表的第一个元素之前添加一个值为 val 的节点。插入…

用Vue.js开发微信小程序:开源框架mpvue解析

前言 mpvue 是一款使用 Vue.js 开发微信小程序的前端框架。使用此框架,开发者将得到完整的 Vue.js 开发体验,同时为 H5 和小程序提供了代码复用的能力。如果想将 H5 项目改造为小程序,或开发小程序后希望将其转换为 H5,mpvue 将是…

对比学习有多火?文本聚类都被刷爆了…

文 | 花小花Posy大家好,我是小花。对比学习的大火???? 越来越旺了,已然从CV蔓延到NLP了。今天给大家介绍的正是一篇将对比学习应用到文本聚类上的工作,NAACL21新鲜出炉的paper——《Supporting Clustering with Contrastive Learning》。…

论文浅尝 - WWW2020 | 生成多跳推理问题以改善机器阅读理解能力

论文笔记整理:谭亦鸣,东南大学博士生。来源:WWW 2020链接:https://dl.acm.org/doi/pdf/10.1145/3366423.3380114概述这篇论文关注的任务是:基于给定文本的“多跳问题生成”(多关系问题)。作者提…

记一次Vue框架升级

框架升级背景 公司目前业务迭代很快,且大部分的流量都在公众号上。然而我们公众号所使用的框架却是3年前的Vue 1.0.16。面对Vue这3年来带来的无数新特性,我们只能望洋兴叹:看得见,摸不着,因为升级这事看起来太难了。 …

谈谈NLP下一个主战场:万亿参数的预训练模型!

自从BERT诞生以来,各大互联网巨头之间就展开了预训练语言模型军备竞赛,XLNet、ERNIE、RoBERTa、T5、GPT-3....但当事情进展到号称自己是zero-shot learner的GPT-3时,批判的声音变得明显多了。这么大,能用吗?真的能做到…

人物志 | 美团女技术总监任登君:不要给自己的人生设限

在我们美团技术团队超过6000名工程师中,有众多的女同学,她们是支撑中国领先的生活服务电子商务平台不可或缺的力量。3月8日女神节,我们专访了她们的代表——美团广告平台技术负责人任登君。登君也是我们团队里目前职位最高的女性技术Leader&a…

论文浅尝 - ISWC2020 | KnowlyBERT: 知识图谱结合语言模型补全图谱查询

论文笔记整理:胡楠,东南大学博士。来源:ISWC 2020动机像Wikidata这样的现代知识图已经捕获了数十亿个RDF三元组,但是它们仍然缺乏对大多数关系的良好覆盖。同时在NLP研究的最新进展表明,可以轻松地查询神经语言模型以获…

LeetCode 92. 反转链表 II(双指针)

1. 题目 反转从位置 m 到 n 的链表。请使用一趟扫描完成反转。 说明: 1 ≤ m ≤ n ≤ 链表长度。 示例:输入: 1->2->3->4->5->NULL, m 2, n 4 输出: 1->4->3->2->5->NULL来源:力扣(LeetCode) 链接&#xf…

我对你的爱,是只为你而留的神经元

文 | 白鹡鸰有一个小轶专属神经元编 | 小轶有一个白鹡鸰专属神经元什么是苹果?红的?绿的?黄的?球状?斑点?香气?需要咬上一口才能确定?或者……其实我们在说某家技术公司?…

Android动态日志系统Holmes

背景 美团是全球领先的一站式生活服务平台,为6亿多消费者和超过450万优质商户提供连接线上线下的电子商务网络。美团的业务覆盖了超过200个丰富品类和2800个城区县网络,在餐饮、外卖、酒店旅游、丽人、家庭、休闲娱乐等领域具有领先的市场地位。平台大&a…

领域应用 | 知识图谱在小米的应用与探索

本文转载自公众号:DataFunTalk。分享嘉宾:彭力 小米编辑整理:马瑶出品平台:DataFunTalk导读:小米知识图谱于2017年创立,已支持公司了每天亿级的访问,已赋能小爱同学,小米有品、智能问…

前端应用开发架构图谱

个人整理的前端架构图谱,之后会根据这个图谱不断的完善内容。希望这个图谱可以对开发同学的知识脉络有个梳理的作用。 相关图谱文件已上传至Github:https://github.com/sahadev/front-end-architecture,后续将不定期更新。 2020年02月28日已…

丹琦女神新作:对比学习,简单到只需要Dropout两下

文 | 花小花Posy上周把 《对比学习有多火?文本聚类都被刷爆了...》分享到卖萌屋的群里后,遭到了群友们一波嫌弃安利。小伙伴们表示,插入替换的数据增强方式已经Out了,SimCSE才是现在的靓仔。snowfloating说:看完Danqi …

美团点评移动端基础日志库——Logan

背景 对于移动应用来说,日志库是必不可少的基础设施,美团点评集团旗下移动应用每天产生的众多种类的日志数据已经达到几十亿量级。为了解决日志模块普遍存在的效率、安全性、丢失日志等问题,Logan基础日志库应运而生。 现存问题 目前&#xf…