NLP论文阅读记录 - 2021 | WOS 使用分层多尺度抽象建模和动态内存进行抽象文本摘要

文章目录

  • 前言
  • 0、论文摘要
  • 一、Introduction
    • 1.3本文贡献
  • 二.前提
  • 三.本文方法
  • 四 实验效果
    • 4.1数据集
    • 4.2 对比模型
    • 4.3实施细节
    • 4.4评估指标
    • 4.5 实验结果
      • 4.6 细粒度分析
  • 五 总结
  • 思考


前言

在这里插入图片描述

Abstractive Text Summarization with Hierarchical Multi-scale Abstraction Modeling and Dynamic Memory(2107)

在本文中,我们提出了一种新颖的抽象文本摘要方法,具有分层多尺度抽象建模和动态记忆(称为 MADY)。首先,我们提出了一种分层多尺度抽象建模方法,从多个抽象层次中捕获文档的时间依赖性,该方法通过学习低级抽象层的精细时间尺度和粗略时间尺度来模仿人类如何理解文章的过程。高级抽象层的时间尺度。通过应用这种自适应更新机制,高级抽象层的更新频率较低,并且期望比低级抽象层更好地记住长期依赖关系。其次,我们提出了一个动态键值记忆增强注意力网络来跟踪输入文档中显着方面的注意力历史和综合上下文信息。通过这种方式,我们的模型可以避免生成重复的单词和错误的摘要。对两个广泛使用的数据集进行的大量实验证明了所提出的 MADY 模型在自动评估和人工评估方面的有效性。为了重现性,我们在以下位置提交代码和数据:https://github.com/siat-nlp/MADY.git。


0、论文摘要

一、Introduction

抽象文本摘要旨在生成简洁的摘要,保留源文章的显着信息和整体含义。与从输入文档中提取最佳摘要成分的提取文本摘要相反,抽象摘要可能包含源文档中未出现的新短语和句子。抽象文本摘要由于其在自然语言处理(NLP)和信息检索(IR)中的广泛应用而最近引起了越来越多的关注。近年来,序列到序列(seq2seq)模型主导了抽象文本摘要的研究[9,15,16,18,19]。这些方法背后的总体思想是采用长短期记忆(LSTM)网络[7]来获得固定长度的句子表示,然后使用另一个 LSTM 解码器和注意力机制生成摘要。
尽管人们在抽象文本摘要方面付出了巨大的努力[1,10,19,21],但由于两个主要原因,生成准确、简洁、信息丰富的摘要在实践中仍然是一个挑战。首先,一篇文章,尤其是一篇长文档,通常由在抽象层次上讨论的多个方面组成[20]。为了理解文章中的分层多方面信息,需要分层多尺度抽象挖掘来编码不同时间尺度的时间依赖性,这是以前的方法中没有利用的。其次,序列到序列模型(seq2seq)中使用的传统注意力机制无法有效地跟踪注意力历史,以学习源文章的神经表示与相应摘要之间的动态对齐[12]。我们认为,缺乏全面的信息(注意力历史)可能会导致抽象文本摘要出现两个问题:(i)生成令人费解的单词,其中一些子主题被不必要地多次访问;(ii)生成错误的摘要,其中一些显着信息被错误地未探索。
为了缓解上述挑战,在本研究中,我们提出了一种新颖的 MADY 方法,用于具有分层多尺度抽象建模和动态记忆的抽象文本摘要。 MADY 通过研究人类如何理解具有抽象层次的文档并基于动态工作记忆编写摘要,改进了 seq2seq 模型的编码和解码步骤。在编码中,我们建议分层多尺度抽象建模 (HMAM) 模型,用于捕获源文档的多个抽象层次。具体来说,我们用不同的时间尺度对时间依赖性进行编码,这是由于高级抽象变化缓慢而低级抽象具有快速变化的特征这一事实。在解码中,我们提出了动态键值记忆增强注意力(DMA)来缓解生成重复单词和不完整摘要的问题,这使得模型能够跟踪源文档中每个显着方面的综合信息。

1.3本文贡献

总之,我们的贡献如下:
(1)我们提出了一种分层多尺度模式挖掘方法,从多个抽象层次级别捕获文档的时间依赖性。 (2)我们采用动态键值记忆增强注意力机制来更好地跟踪注意力历史和显着信息覆盖范围,通过自动区分哪些显着方面已被描述和哪些显着方面已被描述,有助于解码器克服生成重复和错误摘要的问题哪些显着方面尚未探索。 (3) 在两个基准数据集上的实验表明,所提出的 MADY 方法在自动评估和人工评估方面都明显优于强大的竞争对手。

二.前提

三.本文方法

四 实验效果

4.1数据集

4.2 对比模型

4.3实施细节

4.4评估指标

4.5 实验结果

在这里插入图片描述

4.6 细粒度分析


五 总结

在本文中,我们通过研究人类如何理解具有层次抽象级别的源文档并基于动态工作记忆编写摘要,提出了一种新颖的抽象文本摘要 MADY 模型,该模型采用分层多尺度抽象建模方法和动态记忆。两个基准数据集的实验结果表明,MADY 显着优于对比方法。

思考

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/624747.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++PCL】点云处理CPC分割

作者:迅卓科技 简介:本人从事过多项点云项目,并且负责的项目均已得到好评! 公众号:迅卓科技,一个可以让您可以学习点云的好地方 本专栏特色:根据经验和大家分享每个参数的调试规范,解决大家因为参数的问题而产生的苦恼。 目录 1.原理介绍 2.代码效果 3.源码展示

原生IP代理如何帮助跨境电商店铺做谷歌广告投放业务的?

随着全球化的发展,越来越多的电商店铺开始拓展跨境业务,而谷歌广告作为全球最大的广告平台之一,为跨境电商店铺带来了巨大的收益和商机。 然而,由于谷歌广告的地域限制和审查机制,店铺很难直接进行投放业务&#xff0…

Java、SpringBoot实现对Excel内容的读取并将Excel内容导入到数据库中(后端篇)

一、需要读取的Excel表格格式相对完整工整,且只需要写入一张表中 在读取Excel表格的需求中,有像下图的这么一种表格,它的格式工整,且表格中的列名和数据库表中的列名一一对应,如下图: Excel表:…

四大攻击类型并存,NIST 警告人工智能系统带来的安全和隐私风险

美国国家标准与技术研究院 (NIST) 近日发布了有关对抗性机器学习 (AML) 攻击和缓解措施指南, 呼吁人们再度关注近年来人工智能 (AI) 系统部署增加所带来的隐私和安全挑战,并表示这类系统目前没有万无一失的方法进行保护。 NIST指出,这些安全…

力扣日记1.14-【二叉树篇】108. 将有序数组转换为二叉搜索树

力扣日记:【二叉树篇】108. 将有序数组转换为二叉搜索树 日期:2023.1.14 参考:代码随想录、力扣 108. 将有序数组转换为二叉搜索树 题目描述 难度:简单 给你一个整数数组 nums ,其中元素已经按 升序 排列,…

开源ERP系统Odoo安装部署并结合内网穿透实现公网访问本地系统

文章目录 前言1. 下载安装Odoo:2. 实现公网访问Odoo本地系统:3. 固定域名访问Odoo本地系统 前言 Odoo是全球流行的开源企业管理套件,是一个一站式全功能ERP及电商平台。 开源性质:Odoo是一个开源的ERP软件,这意味着企…

Elasticsearch添加7.17.10IK分词器

Elasticsearch添加7.17.10IK分词器 在https://github.com/medcl/elasticsearch-analysis-ik/tree/7.x中未找到7.17.10版本的发布版本,如歌ik版本和Elasticsearch版本不同安装后无法启动。所以下载git上的源代码,并手动编译指定版本IK分词器。 &#xff…

ucloud轻量云(wordpress)配置ssl

ucloud 轻量云(wordpress)配置ssl 1、上传ssl证书到/usr/local/software/apache/conf,这里的文件名和内容与ucloud控制台下载下来的文件名和内容保持一致 2、修改httpd.conf文件 vim /usr/local/software/apache/conf/httpd.conf 找到下面两行,去掉注…

HCIP-2

Broadcast 类型查看 [R4]display ospf interface g0/0/0 OSPF Process 100 with Router ID 4.4.4.4 Interfaces Interface: 34.1.1.2 (GigabitEthernet0/0/0) Cost: 1 State: DROther Type: Broadcast MTU: 1500 Priority: 0 Designated Router: 34.1.1.1 Backup…

用ChatGPT来造一个ChatGPT:计算机领域智能问答系统实践(2)

在PHP语言中,你可以使用MySQL数据库来存储知识库,并使用PHP来实现系统的逻辑。以下是一个简单的示例: 创建数据库表: 首先,创建一个名为 computer_knowledge 的表来存储计算机知识。可以使用以下SQL语句:…

TDA4 Linux BSP ,SD卡制作

1 进入官网: Processor SDK Linux Software Developer’s Guide — Processor SDK Linux for J721e Documentation 这个版本需要 Ubuntu 22.04 支持 ~/ti-processor-sdk-linux-adas-j721e-evm-09_01_00_06/board-support/ti-linux-kernel-6.1.46gitAUTOINC5892b80…

如何实现无公网ip固定TCP端口地址远程连接Oracle数据库

文章目录 前言1. 数据库搭建2. 内网穿透2.1 安装cpolar内网穿透2.2 创建隧道映射 3. 公网远程访问4. 配置固定TCP端口地址4.1 保留一个固定的公网TCP端口地址4.2 配置固定公网TCP端口地址4.3 测试使用固定TCP端口地址远程Oracle 前言 Oracle,是甲骨文公司的一款关系…

三种引入CSS的方式

文章目录 CSS基础知识概述CSS的注释CSS的格式 三种引入CSS的方式内嵌式外链式行内式优先级 CSS基础知识 概述 Cascading Style Sheet 层叠样式表 前端三大基础之一(Html结构 CSS样式 JS动作) 最早由网景公司(Netscape)提出,在1996年受到w…

【HarmonyOS4.0】第十篇-ArkUI布局容器组件(二)

三、层叠布局容器(Stack) 堆叠容器组件 Stack的布局方式是把子组件按照设置的对齐方式顺序依次堆叠,后一个子组件覆盖在前一个子组件上边。 注意:Stack 组件层叠式布局,尺寸较小的布局会有被遮挡的风险, …

1.15 作业

使用计数型信号量设计 2,相关函数的API 一、队列: 1,创建队列函数 osMessageQueueId_t osMessageQueueNew (uint32_t msg_count, uint32_t msg_size, const osMessageQueueAttr_t *attr); msg_count : 队列中消息的最大数量,即…

并发编程之阻塞队列

目录 什么是队列? Queue接口 阻塞队列 应用场景 ArrayBlockingQueue ArrayBlockingQueue使用 ArrayBlockingQueue的原理 数据结构 入队put方法 出队take方法 LinkedBlockingQueue LinkedBlockingQueue使用 LinkedBlockingQueue原理 数据结构 入队put方…

js--every函数

every() 方法测试一个数组内的所有元素是否都能通过指定函数的测试。它返回一个布尔值。 特点: (1)若有一个不满足条件,则返回false,后面的元素都不会再执行。 (2)不会对空数组进行检测&#xf…

API接口:原理、设计与应用

一、引言 随着互联网技术的发展,应用程序之间的交互变得越来越频繁。API(应用程序编程接口)作为不同应用程序之间的桥梁,发挥着越来越重要的作用。本文将详细介绍API接口的原理、设计与应用,并通过部分代码示例帮助读…

微信小程序开发 - 必备理论知识

文章目录 小程序开发必备理论知识一、自定义组件1. 自定义组件 - 组件的创建与引用1.1 创建组件1.2 引用组件1.3 局部引用组件1.4 全局引用组件1.5 全局引用 VS 局部引用1.6 组件和页面的区别 2. 自定义组件 - 样式2.1 组件样式隔离2.2 组件样式隔离的注意点2.3 修改组件的样式…

1-1.this指针闭包作用域

课程目标 知识要点 补充知识点 面试建议 在自己简历的项目中找到面试可能会深挖的临界点 分别列出来每一个项目的基础部分,临界点,业务范围再往深了做的话能够做成什么样(这点比较难,可以在github上,或搜一搜网上有…