论文浅尝 - WWW2020 | 从自然语言交互中提取开放意图

论文笔记整理:娄东方,浙江大学博士后,研究方向为事件抽取。


Vedula N, Lipka N, Maneriker P, et al. Open Intent Extraction from Natural Language Interactions[C]//Proceedings of The Web Conference 2020. 2020: 2009-2020.

来源:WWW2020

链接:

https://dl.acm.org/doi/abs/10.1145/3366423.3380268

近年来,NLU和语音识别方面的技术进步促进了聊天代理(Siri, Cortana, Alexa等)的繁荣。在人机交互过程中,代理机器人需要对用户语句进行解析和理解,尤其是确定用户所表达的意图。例如,从”Please make a 10:30 sharp appointment for a haircut”识别出意图” makinga haircut appointment”。考虑到交互过程中可能有新意图类型不断涌现,该场景下它实际是一个开放意图识别问题。

现有方法中,一般将交互文本中的意图识别视为多分类问题。它在封闭意图下表现较好,但不能识别新意图或训练过程中未见的意图;且现有数据中单个语句一般只包含一个意图,很难覆盖现实多意图情形。零样本学习通过学习新类别知识以构建相应分类器,但新类别必须明确定义并构建相应知识。其他一些方法只能判断是否包含新意图,但无法给出具体描述。

Motivation

1.开放意图识别关键在于构建一个统一的schema,它既能建模当前已知意图,也能刻画新的、未知的意图。本文提出的意图schema包括两部分:(1)Action, 明确意图、任务或动作的词语;(2)Object, 是指Action实施对象实体词。

例如,语句”Please make a 10:30 sharp appointment for a haircut”中,Action为“make”,Object为“appointment”。

2.直觉地,基于Action + Object的意图schema,可将开放意图识别形式化为序列标注问题。其中,标签集合包括Action, Object, None;且抽取的意图对必须同时包含Action和Object对象。


Model

Figure 1 开放意图抽取框架OPINE

如图1所示,本文提出的OPINE框架主要包括:对抗训练,Bi-LSTM语义编码,Multi-head attention机制,带约束的CRF,生成意图等。OPINE框架相对简洁,且在各阶段都进行了精细处理。具体如下,

(1)对抗训练

为提升整体模型的鲁棒性,该框架对输入embedding添加扰动,但不改变输出标签,进而使得模型对embedding的微小变动稳健。具体而言,

在训练过程中,给embedding添加最差情况下的干扰信号。并用一阶导数进行逼近,

最终损失函数为原始数据和对抗样本分别损失的加权平均。生成的对抗样本中,只保留与原始样本embedding高于某个阈值的数据。

(2) Bi-LSTM

利用Bi-LSTM捕捉上下文语义信息。

(3) Multi-head attention

应用transformer结构中的multi-head attention机制,学习长距离依赖关系。

(4) 带约束的CRF

CRF在序列标注任务中被广泛应用,因其具备标签序列依赖建模能力。意图schema对标签序列存在约束——必须同时包含Action和Object标签。本文提出两种方法将该约束融进来:a) 适应的beam search, 如果约束条件不满足,则取下一个最有可能的序列;b) 适应的Viterbi算法,将解码问题转化为整数线性优化问题,并将约束条件加进来。

(5) 生成意图

考虑到单个语句中可能存在多个意图,这需要我们对CRF层输出的标签进一步加工,从而得到Action-Object对。本文考虑两种方法:a) 基于距离的启发式拼装,将相距较近的Action-Object配对成一个完整意图;b) 基于MLP分类器,以候选Action-Object对的词向量和距离作为MLP的输入,分类判断是否构成意图对。


Experiment

本文作者构造一个意图抽取数据集(Stack Exchange data):总共75000个问题,其中25000个问题包含抽取的意图标注结果,另50000个问题基于Stanford CoreNLP依存分析工具解析得到verb-object关系。评估步骤:(1)、基于50000个问题的解析结果对BERT模型进行调整;(2)、基于25000个问题的标注数据进行精调、测试。评价指标包括:Action结果的P, R, F1; Object结果的P, R, F1;意图对Action-Object的P, R, F1;抽取意图向量表示(所有token的GloVe向量的平均)与标注意图向量表示的余弦相似度。

Figure 2 OPINE框架在Stack Exchange data上的表现

从图2可以看到,本文提出的OPINE相较于现有SRL、依存分析等更优,抽取意图的相似度提升超过0.1。

Figure 3 OPINE在domain adaption中的表现。“+td”表示测试domain在训练过程可见,“-td”表示测试domain在测试过程中不可见

图3显示OPNIE具备较强的可迁移性,新domain情形较现有domain的表现下降幅度都在5%以下。

Figure 4 OPINE在SNIPS和ATIS上的表现

本文提出的抽取式开放意图识别框架OPINE在图4中得到充分证明,基于这种思路可学到语言的底层信息,模型具备很强的迁移性。具体而言,OPINE + classifier指基于Stack Exchange data训练的模型获取编码,给定SNIPS和ATIS的意图类别数,OPINE + classifier基于层次聚类获得最终预测标签(完全的domain迁移),在两个数据集下取得了与封闭意图识别SOTA相当的结果。具体聚类效果图如图5所示。

Figure 5 OPINE + classifier在SNIPS数据上的聚类结果

 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478840.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深度学习在文本领域的应用

背景 近几年以深度学习技术为核心的人工智能得到广泛的关注,无论是学术界还是工业界,它们都把深度学习作为研究应用的焦点。而深度学习技术突飞猛进的发展离不开海量数据的积累、计算能力的提升和算法模型的改进。本文主要介绍深度学习技术在文本领域的应…

LeetCode 1009. 十进制整数的反码(位运算)

1. 题目 每个非负整数 N 都有其二进制表示。例如, 5 可以被表示为二进制 “101”,11 可以用二进制 “1011” 表示,依此类推。注意,除 N 0 外,任何二进制表示中都不含前导零。 二进制的反码表示是将每个 1 改为 0 且…

新分类!全总结!最新Awesome-SLU-Survey资源库开源!

文 | 哈工大SCIR 覃立波、谢天宝等指导老师 | 哈工大SCIR 车万翔教授简介口语语言理解(Spoken Language Understanding,SLU)作为任务型对话系统的核心组件,目的是为了获取用户询问语句的框架语义表示(semantics frame&…

技术实践 | 用 NetworkX + Gephi + Nebula Graph 分析权力的游戏人物关系(上篇)

本文转载自公众号:Nebula Graph Community 。我们都知道《权利的游戏》在全世界都很多忠实的粉丝,除去你永远不知道剧情下一秒谁会挂这种意外“惊喜”,当中复杂交错的人物关系也是它火爆的原因之一,而本文介绍如何通过 NetworkX 访…

美团外卖Android Crash治理之路

Crash率是衡量一个App好坏的重要指标之一,如果你忽略了它的存在,它就会愈演愈烈,最后造成大量用户的流失,进而给公司带来无法估量的损失。本文讲述美团外卖Android客户端团队在将App的Crash率从千分之三做到万分之二过程中所做的大…

全栈深度学习第7期: 研究方向这么多,哪些是有有趣又潜力的呢?

一起追剧鸭简介Berkeley全栈深度学习追剧计划是由夕小瑶的卖萌屋发起的优质公开课打卡项目,通过微信群为同期追剧的小伙伴提供交流平台。关于该计划的详请见这里。Berkeley深度学习追剧群目前已有1000小伙伴加入,公众号后台回复口令 深度学习追剧 入群。…

会议交流 | 人工智能与机器学习创新峰会 - 知识图谱与图神经网络分会

人工智能与机器学习创新峰会力邀 HBAT 等大厂资深研发专家做分享和技术展望时间:9月4日下午1:30地点:浦东海神诺富特大酒店OpenKG开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技…

LeetCode 1046. 最后一块石头的重量(priority_queue 堆)

1. 题目 有一堆石头&#xff0c;每块石头的重量都是正整数。 每一回合&#xff0c;从中选出两块最重的石头&#xff0c;然后将它们一起粉碎。假设石头的重量分别为 x 和 y&#xff0c;且 x < y。那么粉碎的可能结果如下&#xff1a; 如果 x y&#xff0c;那么两块石头都…

深度学习如何均衡精度、内存、计算和通信开销?

文 | 立交桥跳水冠军知乎本文已获作者授权&#xff0c;禁止二次转载鱼与熊掌不可兼得&#xff0c;深度学习领域中的几个指标也相同。主要的指标有如下四个&#xff1a;&#xff08;1&#xff09;精度&#xff1a;自然精度是一个模型最根本的衡量指标&#xff0c;如果一个模型精…

深度学习在美团搜索广告排序的应用实践

一、前言 在计算广告场景中&#xff0c;需要平衡和优化三个参与方——用户、广告主、平台的关键指标&#xff0c;而预估点击率CTR&#xff08;Click-through Rate&#xff09;和转化率CVR&#xff08;Conversion Rate&#xff09;是其中非常重要的一环&#xff0c;准确地预估CT…

论文浅尝 - ICML2020 | 拆解元学习:理解 Few-Shots 任务中的特征表示

论文笔记整理&#xff1a;申时荣&#xff0c;东南大学博士生。来源&#xff1a;ICML2020链接&#xff1a;http://arxiv.org/abs/2002.06753元学习算法会生成特征提取器&#xff0c;这些特征提取器在进行few-shot分类时就可以达到最新的性能。尽管文献中有大量的元学习方法&…

LeetCode 304. 二维区域和检索 - 矩阵不可变(DP)

1. 题目 2. 解题 类似题目&#xff1a;LeetCode 308. 二维区域和检索 - 可变&#xff08;前缀和&#xff09; dp[i][j]数组表示 从左上角到i,j位置的所有和 sum[i1][j1]sum[i1][j]sum[i][j1]matrix[i][j]−sum[i][j]sum[i1][j1] sum[i1][j]sum[i][j1]matrix[i][j]-sum[i][j]…

论文浅尝 - ICML2020 | 对比图神经网络解释器

论文笔记整理&#xff1a;方尹&#xff0c;浙江大学在读博士&#xff0c;研究方向&#xff1a;图表示学习。Contrastive Graph Neural Network Explanation动机与贡献本文主要关注图神经网络的解释性问题&#xff0c;这样的解释有助于提升GNN的可信度&#xff0c;能够更好的理解…

这可能是最简单又有效的自监督学习方法了

文 | 王珣知乎本文已获作者授权&#xff0c;禁止二次转载从Kaiming的MoCo和Hinton组Chen Ting的SimCLR开始&#xff0c;自监督学习&#xff08;SSL&#xff09;成了计算机视觉的热潮显学。凡是大佬大组&#xff08;Kaiming, VGG&#xff0c;MMLAB等&#xff09;&#xff0c;近两…

大众点评账号业务高可用进阶之路

引言 在任何一家互联网公司&#xff0c;不管其主营业务是什么&#xff0c;都会有一套自己的账号体系。账号既是公司所有业务发展留下的最宝贵资产&#xff0c;它可以用来衡量业务指标&#xff0c;例如日活、月活、留存等&#xff0c;同时也给不同业务线提供了大量潜在用户&…

LeetCode 493. 翻转对(归并排序)

1. 题目 给定一个数组 nums &#xff0c;如果 i < j 且 nums[i] > 2*nums[j] 我们就将 (i, j) 称作一个重要翻转对。 你需要返回给定数组中的重要翻转对的数量。 输入: [1,3,2,3,1] 输出: 2输入: [2,4,3,5,1] 输出: 3来源&#xff1a;力扣&#xff08;LeetCode&#x…

论文浅尝 - ICML2020 | 通过关系图上的贝叶斯元学习进行少样本关系提取

论文笔记整理&#xff1a;申时荣&#xff0c;东南大学博士生。来源&#xff1a;ICML 2020链接&#xff1a;http://arxiv.org/abs/2007.02387一、介绍本文研究了少样本关系提取&#xff0c;旨在通过训练每个关系少量带有标记示例的句子来预测句子中一对实体的关系。为了更有效地…

美团外卖客户端高可用建设体系

背景 美团外卖从2013年11月开始起步&#xff0c;经过数年的高速发展&#xff0c;一直在不断地刷新着记录。2018年5月19日&#xff0c;日订单量峰值突破2000万单&#xff0c;已经成为全球规模最大的外卖平台。业务的快速发展对系统稳定性提出了更高的要求&#xff0c;如何为线上…

我哭了,工业界AI项目落地有多难?

文 | 皮特潘源 | CVer人工智能是近几年最火热的技术名词&#xff0c;如果不谈人工智能相当于落伍&#xff0c;但当真正进入人工智能领域时才发现&#xff0c;一开始以为“拦路虎”是算法&#xff0c;后面发现落地是一个巨大的难题。本文从作者的经历和经验教训展开&#xff0c;…

LeetCode 646. 最长数对链(区间 贪心)

1. 题目 给出 n 个数对。 在每一个数对中&#xff0c;第一个数字总是比第二个数字小。 现在&#xff0c;我们定义一种跟随关系&#xff0c;当且仅当 b < c 时&#xff0c;数对(c, d) 才可以跟在 (a, b) 后面。我们用这种形式来构造一个数对链。 给定一个对数集合&#xf…