从论文到PPT,一键生成!从此报告不用愁!

文 | 子龙
编 | 小轶

俗话说:“行百步者半九十”,论文接受固然可喜可贺,然而这只是万里长征第一步。一份具有影响力的工作少不了一个后期的宣传,做好一个PPT绝对是一个技术活。不知道小伙伴们平时怎么做PPT,是复制粘贴长篇大论抑或提纲挈领图文并茂。直接拷贝论文固然简单,但是动辄大半页的文字实在很难让人提起兴趣,大家都明白应该抓住要点,并辅以图片,但是怎么总结文章各个板块并且合理排布呢,这又是个难题。

虽然论文千变万化,但是计算机论文的PPT往往还是比较朴实无华的,往往遵循一定的格式,从介绍模型,再从实验结论,基本上和行文对应,那么对每个板块抽取核心信息,那么就能生成一份满意的PPT。

今天介绍一篇NAACL'21的文章 D2S: Document-to-Slide Generation Via Query-Based Text Summarization 直接省去了苦思PPT细节的麻烦,提出一个基于问答抽取的方法,通过论文内容和给定标题直接生成对应的PPT。下图就展示了一个用D2S自动生成的论文介绍PPT样例。上方黑框中的是论文作者自己做的PPT,下面蓝框里的是D2S自动生成的。可以看到,文字介绍部分还是十分合理的,与配图对应,整体排版上还要优于人工制作的PPT。

论文题目:
D2S: Document-to-Slide Generation Via Query-Based Text Summarization

论文链接:
https://arxiv.org/abs/2105.03664

方法

本文将D2S(文档生成PPT)视为一个封闭领域长文本问答,即限定在计算机论文的领域中,给定论文和每页PPT的标题,从论文中抽取对应内容并加以总结,作为标题的“答案”。整个模型分为三个模块,分别是:

  • 关键词模块: PPT的排布与论文本身的各个子标题有着很大的关联,于是D2S抽取论文子标题的层次结构作为生成PPT的辅助。

  • 信息抽取模块: 这部分获得文档标题论文片段以及关键词模块中的关键词的向量表示,并作相关度排序。

  • 问答模块: 整合以上两个模块得到的关键词和信息,通过问答模型生成PPT内容。

  • 图表抽取模块: 通过论文中插图的图表介绍与每页PPT的标题计算相似度,将图表插入到对应页面。

关键词模块

论文的PPT肯定要参考原本论文,从一篇论文的各个版块的标题那里,可以大致看出一篇文章所关注的要点和行文思路,这些标题可能是最基本的“介绍”、“相关文献”、“实验”,也可能是论文所设计的模块的名称,比如Attention is all you need论文中,就有专门介绍Attention的一个部分。这些标题和子标题很自然的就形成了一个树状结构(模型图左下角),这些树状结构中的节点被提取出来,作为关键词,辅助后续的内容生成。

信息抽取模块

关键词模块只是为了后续工作提供了一定的帮助,而信息抽取模块才真正开始处理论文和PPT标题。本文采用了基于distilled BERT[1]的信息抽取模型。信息抽取模型可以根据相关程度在若干候选中给出一个排序,这个模块就是为了从论文中找到和对应PPT标题相关的片段。

训练模型

既然需要模型学习相关性,最容易想到的方法就是通过人工标注进行有监督学习,然而很难从最终完成的PPT中看出当前页面与论文中哪些地方相关,于是本文选择了一个折中的方法来训练信息抽取模型,它将当前PPT页面中的内容作为正例,将其他PPT页面中的内容作为反例,训练模型辨别这两者的区别,进而学习PPT标题和内容的相关性,所学习得到的相关性可以后续用于评估PPT标题和论文片段的相关性。

抽取片段

因为PPT页面中的内容和论文片段十分相似,于是通过上述方法训练的模型可以很好的运用于评估PPT标题和论文片段的相关性。同时,每个论文片段同时又拥有对应的标题或者子标题,即关键词模块提取到的关键词,最终每个论文片段与当前PPT标题的相关性取决于两方面:

其中分别为PPT标题、论文片段、片段对应关键词的文本特征。

问答模块

最终每页PPT中的内容由问答模块来生成,这里采用的是预训练的BART模型[2]。我们需要将“问题”和“上下文信息”提供给问答模型,这里的“问题”即每页PPT的标题,上下文信息分为两方面:

  • 关键词:将PPT标题与论文每个标题进行对应,计算两者的编辑距离(“莱文斯坦距离”[3]),若“编辑距离比值”大于0.9,则将对应标题以及其子标题纳入到上下文信息中。

其中a,b为两个字符串,d为两者的编辑距离。

  • 论文片段:即上文信息抽取模块所提供的相关论文片段。

将整合好的“问题”和“上下文”以如下格式输入到预训练的BART,得到对应PPT的内容:

图表抽取模块

没有插图的PPT是不完整的,D2S对图片的处理非常简单,直接利用信息抽取模块中训练得到的模型评估PPT标题和图片或者表格的描述文字计算相关性,进而插入到对应PPT页面内。

模型表现

本文主要评估生成PPT的两个方面:

  • 图表位置:由于是信息抽取模型,图表位置得到的是一个从最相关到最不相关的排序,论文报告了top 1,3,5的精确值,分别为:p@1=0.38, p@3=0.60, p@5=0.77。

  • PPT内容生成效果:分别通过ROUGE进行评价。

PPT内容生成效果

因为这个任务的本质是信息抽取与总结,本文对比了D2S的问答模块(记为BARTKeyword)与如下baseline:BertSummExt4、BARTSumm(本文模型去除Keyword部分)。

同时,本文还将信息抽取模块中的混合keyword的方法(Dense-Mix IR)和传统的基于离散单词对应的BM25(Classical IR)做对比。结果如下:

从结果中可以看到结合关键词的方法往往能够得到更好的效果。在信息抽取阶段引入关键词,可以更好地评估PPT标题和论文片段的相关性,进而得到更加准确的上下文,这一点从各个baseline的结果中都可以看出。在问答模块阶段,与以往单纯将论文片段作为上下文,D2S中的BARTKeyword将关键词同样输入到上下文部分,也大大地提高了Rough值。

可见,论文中的标题和子标题是一篇文章的骨架,很大程度上可以帮助针对论文内容的总结归纳工作,进而在生成PPT的任务中大有作为。

总结

本文由诸多模块组成,利用了信息抽取和问答模型对计算机领域的论文进行总结,并创造性的提出了生成PPT这样的任务,同时利用了论文各个版块的标题和子标题提供更多的信息。

萌屋作者:子龙(Ryan)

本科毕业于北大计算机系,曾混迹于商汤和MSRA,现在是宅在UCSD(Social Dead)的在读PhD,主要关注多模态中的NLP和data mining,也在探索更多有意思的Topic,原本只是贵公众号的吃瓜群众,被各种有意思的推送吸引就上了贼船,希望借此沾沾小屋的灵气,paper++,早日成为有猫的程序员!

作品推荐:

1.别再搞纯文本了!多模文档理解更被时代需要!

2.Transformer哪家强?Google爸爸辨优良!

3.预训练语言真的是世界模型?

寻求报道、约稿、文案投放:
添加微信xixiaoyao-1,备注“商务合作”

后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

 

[1] Distilled BERT: https://arxiv.org/pdf/1908.08962.pdf

[2] BART模型: https://arxiv.org/abs/1910.13461

[3] 莱文斯坦距离:https://en.wikipedia.org/wiki/Levenshtein_distance

[4] BertSummExt: https://arxiv.org/abs/1908.08345

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478421.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

资源征集 | 2021年全国知识图谱与语义计算大会开放资源征集(Resource Track)通知...

大会时间:2021年8月18日-21日,广州资源征集截止: 2021年5月20日开放的资源对促进知识图谱和语义计算相关的科学研究及企业应用十分重要。CCKS 2021将组织开放资源征集(Resource Track),旨在支持和促进学术界和工业界的…

WebView性能、体验分析与优化

在App开发中,内嵌WebView始终占有着一席之地。它能以较低的成本实现Android、iOS和Web的复用,也可以冠冕堂皇的突破苹果对热更新的封锁。 然而便利性的同时,WebView的性能体验却备受质疑,导致很多客户端中需要动态更新等页面时不得…

LeetCode 240. 搜索二维矩阵 II(二分查找 分治)

文章目录1. 题目2. 解题2.1 从左下角或者右上角开始搜索2.2 分治算法1. 题目 编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target。该矩阵具有以下特性: 每行的元素从左到右升序排列。 每列的元素从上到下升序排列。 示例: 现有矩阵 matrix 如下…

NLP哪个细分方向最具社会价值?

文 | 小戏让我们来大胆设想一个场景,老板突然发财搞到一笔钱,大手一挥给你五百万,让你去做自然语言处理的研究,你该先研究哪一个细分领域?机器翻译好像不错,信息抽取也很必要,对话系统更是 NLP …

论文浅尝 | 通过阅读实体描述进行零样本的实体链接

笔记整理 | 赖泽升,东南大学本科生来源:ACL2019动机先前实体链接的大多数工作都着重于与通用实体数据库的链接,通常希望链接到专门的实体词典,例如法律案件,公司项目描述,小说中的字符集或术语表。但这些工…

LeetCode 29. 两数相除(位运算)

1. 题目 给定两个整数,被除数 dividend 和除数 divisor。将两数相除,要求不使用乘法、除法和 mod 运算符。 返回被除数 dividend 除以除数 divisor 得到的商。 示例 1: 输入: dividend 10, divisor 3 输出: 3示例 2: 输入: dividend 7, divisor -…

Git使用的奇技淫巧

源 | Linux公社Git 版本对比相关操作[1] 输出工作区和暂存区的不同。git diff[2] 展示暂存区和最近版本的不同git diff --cached[3] 展示暂存区、工作区和最近版本的不同git diff HEAD[4] 展示本地仓库中任意两个 commit 之间的文件变动git diff <commit-id> <commit-…

Hyperloop,让发布简洁高效

Hyperloop 是什么&#xff1f; Hyperloop 是服务于美团点评客户端的组件发版、持续集成、App 打包构建、资源调度等各个环节的发布调度系统。名称起源于美国 Elon Musk 构想的 Hyperloop 超级高铁&#xff0c;象征着现代、简洁、高效。 Hyperloop 提供了一站式的平台&#xff0…

论文浅尝 | 基于潜在类别信息的实体链接

笔记整理 | 黄一凡&#xff0c;东南大学本科生来源&#xff1a;AAAI2020链接&#xff1a;https://arxiv.org/pdf/2001.01447v1.pdf一、简介作者意识到在利用预训练模型进行实体链接时&#xff0c;往往会将类别信息忽略&#xff0c;因此会导致模型将指称链接到拥有错误类别的错误…

LeetCode 166. 分数到小数(小数除法)

1. 题目 给定两个整数&#xff0c;分别表示分数的分子 numerator 和分母 denominator&#xff0c;以字符串形式返回小数。 如果小数部分为循环小数&#xff0c;则将循环的部分括在括号内。 示例 1: 输入: numerator 1, denominator 2 输出: "0.5"示例 2: 输入: …

百度飞桨弯道超车了吗?!

事情是这样的...前不久&#xff0c;小夕注意到了一份来自权威评测机构IDC发布的《2020年下半年深度学习平台市场份额报告》&#xff1a;▲IDC:2020年中国深度学习平台市场综合份额top 5立刻惊了&#xff01;印象里百度飞桨三年前还只是一个低调、小而美的深度学习框架&#xff…

美团点评酒旅数据仓库建设实践

在美团点评酒旅事业群内&#xff0c;业务由传统的团购形式转向预订、直连等更加丰富的产品形式&#xff0c;业务系统也在迅速的迭代变化&#xff0c;这些都对数据仓库的扩展性、稳定性、易用性提出了更高要求。对此&#xff0c;我们采取了分层次、分主题的方式&#xff0c;本文…

论文小综 | 文档级关系抽取方法(上)

本文作者&#xff1a;陈想&#xff0c;浙江大学在读博士&#xff0c;研究方向为自然语言处理张宁豫&#xff0c;浙江大学助理研究员&#xff0c;研究方向为自然语言处理、知识表示与推理1. 前言关系抽取(Relation Extraction, RE)是从纯文本中提取未知关系事实&#xff0c;是自…

LeetCode 621. 任务调度器(贪心)

1. 题目 给定一个用字符数组表示的 CPU 需要执行的任务列表。其中包含使用大写的 A - Z 字母表示的26 种不同种类的任务。任务可以以任意顺序执行&#xff0c;并且每个任务都可以在 1 个单位时间内执行完。CPU 在任何一个单位时间内都可以执行一个任务&#xff0c;或者在待命状…

吴恩达发起新型竞赛范式!模型固定,只调数据?!

文 | 小戏打开 Kaggle &#xff0c;琳琅满目的比赛让人目不暇接&#xff0c;研究的领域更是五花八门&#xff0c;从农林牧渔到衣食住行&#xff0c;似乎只要有数据&#xff0c;不论数据好坏&#xff0c;就可以直接使用各种机器学习的模型在其身上大展拳脚&#xff0c;从逻辑回归…

论文小综 | 文档级关系抽取方法(下)

本文作者&#xff1a;陈想&#xff0c;浙江大学在读博士&#xff0c;研究方向为自然语言处理张宁豫&#xff0c;浙江大学助理研究员&#xff0c;研究方向为自然语言处理、知识表示与推理这篇推文是文档级关系抽取方法的第二部分&#xff0c;前面的部分请移步推文“论文小综 | 文…

LeetCode 128. 最长连续序列(哈希set)

1. 题目 给定一个未排序的整数数组&#xff0c;找出最长连续序列的长度。 要求算法的时间复杂度为 O(n)。 示例:输入: [100, 4, 200, 1, 3, 2] 输出: 4 解释: 最长连续序列是 [1, 2, 3, 4]。它的长度为 4。来源&#xff1a;力扣&#xff08;LeetCode&#xff09; 链接&#…

清华姚班教师劝退文:读博,你真的想好了吗?

文 | 张焕晨编 | 琰琰源 | AI科技评论先简单介绍一下我的背景。我本科在University of Wisconsin-Madison&#xff0c;然后去CMU念了个PhD&#xff0c;主要研究数据库方向。目前回国在清华IIIS&#xff08;姚班&#xff09;做助理教授&#xff0c;并且 cofound 了Singularity D…

纠删码存储系统中的投机性部分写技术

本文已被USENIX’17年度技术大会录用&#xff0c;此处为中文简译版。 阅读英文论文完整版请点击&#xff1a;Speculative Partial Writes in Erasure-Coded Systems 多副本和纠删码&#xff08;EC&#xff0c;Erasure Code&#xff09;是存储系统中常见的两种数据可靠性方法。与…

论文浅尝 - EMNLP | 通过元强化学习实现少样本复杂知识库问答

笔记整理 | 谭亦鸣&#xff0c;东南大学博士生来源&#xff1a;EMNLP 2020链接&#xff1a;https://www.aclweb.org/anthology/2020.emnlp-main.469.pdf本文关注聚合型复杂知识图谱问答任务&#xff0c;这类复杂问题的答案通常需要经过一些集合操作得到&#xff0c;例如&#x…