在斯坦福,做 Manning 的 phd 要有多强?

57d5a054872ec811ff9f739c564f11b5.png

文 | 付瑶
编 | 小轶

博士的毕业论文是我们博士学位教育重要的一环,不仅仅是获得学位的最后一个难关,也是读博期间工作的总结展现。那么一个优秀的博士在读博期间会做出多少成果ta 的博士论文又长什么样?今天,让我们打开一篇最新的斯坦福博士的毕业论文,来看看都讲了些什么。

作者是刚刚8月份毕业于斯坦福的女博士Abigail See。Abigail 的研究方向是开放式的文本生成,导师是大名鼎鼎的 Chris Manning。目前在谷歌学术上已经拥有 2139 的引用量。同时,她也是斯坦福 AI Salon,AI woman 两个组织的主要负责人,还连续担任过是斯坦福 cs224n (NLP导论)的助教组长。

Abigail 在读博期间共计发表了 6 篇一作文章。她在博士毕业论文中对自己读博 6 年间的科研成果进行了总结。单论数量而言,平均每年一篇的产量,可能即使放之国内普通高校也不能算十分突出。难得的是篇篇高质量,其中不乏引用量 1700+ 的超高影响力论文,以及获得最佳论文提名的高认可度工作

db0d596b084faa0499729f49e7174296.png
▲Abigail See 读博期间的一作论文

博士论文标题
NEURAL GENERATIONOF OPEN-ENDED TEXT AND DIALOGUE

论文链接
https://purl.stanford.edu/hw190jq4736

作者主页
https://cs.stanford.edu/people/abisee/

0dc3ddb6683668bd237df22af8afa16b.png工作概述3b0ee5ea5e9b345f6e0774e804df0eb3.png

Abigail 博士期间的研究方向在开放式文本生成,但具体应用的下游任务并不集中,主要涉及 摘要对话故事生成 三类。在这三个子领域上,作者对自己的 contribution 总结如下:

  • 摘要:提出指针生成器模型(pointer-generator network)来提高复制的准确性,以及一个覆盖机制来减少生成摘要的重复。

  • 对话:通过收集大规模用户评价,揭示了机器人行为(如重复、特异性、话题停留和提问)和用户质量判断之间的关系,改善用户体验

  • 故事生成:描述了大规模预训练和解码算法对生成文本的句法、语义、结构和文体方面的影响。作为成果,作者部署研究了一个生成式聊天模型,能够通过分析机器人与用户的交互,确定了机器人的主要错误类型、与用户不满的关系,从而改善对话系统。

01ae9aa450c330b16e425723bd663bc5.png文章架构05117bd4e5c1af78ce121174ab5f7eec.png

作者在毕业论文中分为了5大部分来主要叙述自己的研究工作分别是:

  • 引言

  • 研究背景

  • 指针生成网络

  • 控制聊天对话的属性

  • 预训练对故事生成的影响

  • 用户聊天对话中的不满

引言和背景介绍部分我们就略去不表了,主要关注后面四个部分。

指针生成网络概述

本章节中主要叙述了作者构建的指针生成网络 Pointer-Generator的相关工作。该文发表于ACL'17,目前引用量已达1700+。对 NLG 有过了解的同学想必都听说过。

相关论文:
Get to the point: Summarization with pointer-generator networks

论文链接:
https://arxiv.org/pdf/1704.04368.pdf

Pointer-Generator 构建了一个融合网络以及指针网络的混合模型,既允许通过指针复制单词,也允许从固定词汇表中生成新的单词。把sequence-to-sequence模型应用于摘要生成时存在两个主要的问题:(1)难以准确复述原文的事实细节、无法处理原文中的未登录词(OOV);(2)生成的摘要中存在重复的片段。针对这两个问题,本文提出的融合了seq2seq模型和pointer network的pointer-generator network以及覆盖率机制(coverage mechanism),在CNN/Daily Mail数据集上,相比于state-of-art,ROUGE分数提升了两个点。

33d188b73cda0229817dcee3422c88e2.png

控制聊天对话的属性

相关论文:
What makes a good conversation? How controllable attributes affect human judgments

论文链接:
https://arxiv.org/pdf/1902.08654.pdf

作者提出:一个好的对话需要有以下特性:简洁与细节 持续主题与更换主题 问问题和回答问题,对应四种属性:重复性、独特性、回复相关性和问与答。在这部分内容中作者旨在设计通用且易于调整的的控制方法,研究了两种控制方法条件训练(conditional Traning)和加权解码(weighted decoding)。使用条件训练和加权解码来控制四个属性:repetition重复性、secificity特异性、response-relatedness反映相关性和question-asking提问。在测试该任务改进的效果子作者对28种模型配置进行了大规模的人工评估,并进行了人机对话以进行比较。

9b5a8db1ab76ca9ae4d61adb4d7d916d.pngb44d30e814dfec1ea8706970cfea3fa8.png

预训练对故事生成的影响

相关论文:
Do Massively Pretrained Language Models Make Better Storytellers?

论文链接:
https://arxiv.org/pdf/1909.10705.pdf

在大规模语料中训练得到的预训练语言模型在很多NLP任务中都取得了较好的表现,但是在开放文本生成中的能力仍未被明确。一些实验结果虽然展现了其潜在的能力,但是并没有关于预训练模型在文本生成的能力的具体研究。作者通过在WritingPrompts-1024上评估,对比了GPT2-117与Fusion model等模型在故事生成的表现。通过多种指标评估生成文本后,研究人员发现了一些可以很好生成故事的模型,以及一些表现不太好的模型。虽然 GPT2-117 在语境上更好,对事件的顺序更敏感,而且使用了更多不常用的词汇,但是它在使用最大似然解码算法时只能生成重复的、没有多样性的文本。

18f4fc8a2590b27cadf19b173e966f28.png

用户聊天对话中的不满

相关论文:
Understanding and predicting user dissatisfactionin a neural generative chatbot

论文链接:
https://sigdial.org/sites/default/files/workshops/conference22/Proceedings/pdf/2021.sigdial-1.1.pdf
🏆 Nominated for Best Paper Award

神经生成对话代理已经显示出越来越多的能力进行简短的闲谈对话,神经生成可以实现更强大的社交聊天机器人,能够比以前基于规则或基于检索的对话系统灵活地讨论更广泛的主题。然而,它们在实际部署中的表现-尤其是在嘈杂的环境中与内在动机的用户对话,却没有得到很好的研究。

5c10dedb385e29c099e2e85bd7fb3cea.png

作者对一个神经生成模型进行了详细的案例研究,该模型部署在Chirpy Cardinal (Alexa Prize socialbot)上,在一系列的实验中,发现了不够明确的话语是生成错误的主要来源,如忽略、幻觉、不清楚和重复。除此之外,作者证明了不满意的用户话语可以作为半监督学习信号来改进对话系统,训练了一个predictor用于改进下一轮来减少不满,并通过人类评价表明,作为一个排名函数,它选择了更高质量的神经生成的话语。

f6d82a3f1140b31d1ff08382f7745f1e.png

ebfbfb2467c5fdacb7645bfdf9e752f7.png小结273b3afd67596fd5e970c5c6eff087d2.png

当我们打开论文来看作者在读博期间的研究工作,虽然她在读博期间的论文数量并不算多,但是每一篇章的质量都很高,不仅获得过最佳论文的提名,而且有引用量高达1700的文章,即使有的论文没有太高的引用量,也是对在该领域有深刻影响,是立足所研究课题长远发展的角度进行科研工作。比起快速切换热点来迎合顶会的青睐,她选择了坚定沿着自己的思路,来创立自己的学术宇宙。对一个普通研究生来说,能有一两篇顶会论文已实属不易。但如果志存高远,以领域内的贡献要求自己,你将会看到不一样的峰顶。Chris Manning 和他的 phd 给我们树立了一个很好的榜样。

博士毕业文是各位攻读博士学位的同学获取学位必须经历的一道难关,除了学术态度之外,写作的技巧也非常重要。通过这次的拜读经历,小编总结了几条tips分享给大家:

(1)梳理脉络:博士毕业论文篇幅较大,如果作者脉络梳理的不够清晰,不仅会显得研究工作、学术思路杂乱无章,而且会导致读者一头雾水,读不透论文的内容。

(2)内容组织 :毕业论文是在读博期间几年围绕课题开展的研究的集合,框架的设定、章节的展开都应与你的研究历程关联,层层剥茧,互为支撑。

(3)凸出重点:支撑大论文写作的研究内容和数据的数量会非常庞大,将与论文相关性较弱的数据剔除,删掉旁支末节,以此来突出自己的主要研究重点及关键实验结果。

(4)撰写细节:在大篇幅写作中,搭配不当、语义重估、语序颠倒等错误的出现不是罕事,这些会对你的论文将会非常的减分。因此,一定要多检查几遍细节。除此之外,论文中的图片也是一种重要的成果展展示,控制所有图片的颜色、尺寸、图中文字的字体、字号,使得你的论文看起来整洁统一。

bbd9bde11441dbdfeea633a5ef57fd69.png后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

a20105a8977d47f09f5d9696d4038a14.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/478059.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 655. 输出二叉树(二叉树高度二叉树遍历)

1. 题目 在一个 m*n 的二维字符串数组中输出二叉树,并遵守以下规则: 行数 m 应当等于给定二叉树的高度。列数 n 应当总是奇数。根节点的值(以字符串格式给出)应当放在可放置的第一行正中间。根节点所在的行与列会将剩余空间划分…

开源开放 | 计算机科学示意图问答数据集CSDQA(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/csdqa开源地址:http://zscl.xjtudlc.com:888/CSDQA/开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:西安交通大学(王绍伟、张玲玲、杨祎、胡欣、秦涛、魏笔凡、刘均…

数据驱动精准化营销在大众点评的实践

精准化营销一直以来都是互联网营销业务在细分市场下快速获取用户和提高转化的利器。在移动互联网爆发的今天,数据量呈指数增长,如何在移动和大数据场景下用数据驱动进行精准营销,从而提高营销效能,成为营销业务部门的主要挑战之一…

LeetCode 1104. 二叉树寻路(数学位运算)

1. 题目 在一棵无限的二叉树上,每个节点都有两个子节点,树中的节点 逐行 依次按 “之” 字形进行标记。 如下图所示,在奇数行(即,第一行、第三行、第五行……)中,按从左到右的顺序进行标记&am…

再介绍一篇最新的Contrastive Self-supervised Learning综述论文

文 | 对白源 | 对白的算法屋自监督学习(Self-supervised learning)最近获得了很多关注,因为其可以避免对数据集进行大量的标签标注。它可以把自己定义的伪标签当作训练的信号,然后把学习到的表示(representation&#…

论文浅尝 | 重新审视语言模型与知识库的关系

笔记整理:陈卓,浙江大学在读博士,主要研究方向为低资源学习和知识图谱论文链接:https://arxiv.org/pdf/2106.09231发表会议:ACL 2021动机这篇文章类似于是批判性的文章,反驳的之前EMNLP2019的一篇文章knowl…

Spark在美团的实践

本文已发表在《程序员》杂志2016年4月期。 前言 美团是数据驱动的互联网服务,用户每天在美团上的点击、浏览、下单支付行为都会产生海量的日志,这些日志数据将被汇总处理、分析、挖掘与学习,为美团的各种推荐、搜索系统甚至公司战略目标制定提…

LeetCode 958. 二叉树的完全性检验(层序遍历)

1. 题目 给定一个二叉树,确定它是否是一个完全二叉树。 百度百科中对完全二叉树的定义如下: 若设二叉树的深度为 h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第 h 层所有的结点都连续集中在…

论文浅尝 | 通过学习中间步骤的监督信号改进多跳知识库问答

笔记整理:陈永锐,东南大学博士论文链接:https://arxiv.org/pdf/2101.03737.pdf概述该论文处理多跳知识库问答(KBQA)任务,主要关注训练过程在中间步骤缺乏监督信号的挑战。由于这一挑战,多跳 KBQ…

打破情感分类准确率 80 分天花板!更加充分的知识图谱结合范式

文 | SeverusNLP的研究者们一直都在尝试,怎么样让模型像人类一样,学会“知识”。而最直观的想法莫过于将人类已经总结出来供机器解读的“知识体系”,及其嵌入表示作为额外的特征添加到NLP模型之中。至少,从直觉上看,将…

分布式块存储系统Ursa的设计与实现

引言 云硬盘对IaaS云计算平台有至关重要的作用,几乎已成为必备组件,如亚马逊的EBS(Elastic Block Store)、阿里云的盘古、OpenStack中的Cinder等。云硬盘可为云计算平台带来许多优良特性,如更高的数据可靠性和可用性、灵活的数据快照功能、更…

LeetCode 919. 完全二叉树插入器(层序遍历队列)

1. 题目 完全二叉树是每一层(除最后一层外)都是完全填充(即,结点数达到最大)的,并且所有的结点都尽可能地集中在左侧。 设计一个用完全二叉树初始化的数据结构 CBTInserter,它支持以下几种操作…

开源开放 | 中文相对复杂词汇识别数据集RCWI-Dataset(CCKS2021)

OpenKG地址:http://openkg.cn/dataset/rcwi-dataset开放许可协议:CC BY-SA 4.0 (署名相似共享)贡献者:北京语言大学(阙孟溪、张宇飞、于东)1. 摘要中文领域的词汇复杂度评估资源较为匮乏&#x…

提升 NLP 实战技能的一点建议

作为最典型的 AI 领域之一,NLP 这些年也是越来越热门,基本上是各大厂必备了。随着 OpenAI 等技术的诞生、迁移学习等技术的成功应用,使得 NLP 技术在搜索、推荐、信息流、互联网金融、社交网络等领域不断发展壮大。与此同时,NLP 工…

深入FFM原理与实践

FM和FFM模型是最近几年提出的模型,凭借其在数据量比较大并且特征稀疏的情况下,仍然能够得到优秀的性能和效果的特性,屡次在各大公司举办的CTR预估比赛中获得不错的战绩。美团技术团队在搭建DSP的过程中,探索并使用了FM和FFM模型进…

LeetCode 993. 二叉树的堂兄弟节点(层序遍历)

文章目录1. 题目2. 解题2.1 层序遍历2.2 递归查找1. 题目 在二叉树中,根节点位于深度 0 处,每个深度为 k 的节点的子节点位于深度 k1 处。 如果二叉树的两个节点深度相同,但父节点不同,则它们是一对堂兄弟节点。 我们给出了具有…

论文浅尝 | IRW:基于知识图谱和关系推理的视觉叙事框架

笔记整理:孙悦,天津大学 链接:https://www.aaai.org/AAAI21Papers/AAAI-3382.XuC.pdf动机视觉叙事是生成一个短篇故事来描述有序图像流的任务。与视觉字幕不同,故事不仅包含事实描述,还包含未出现在图像中的想象概念。…

薅羊毛 Colab使用外部数据的7种方法!

文 | Coggle源 | Coggle数据科学Colab作为非常强大且优惠的计算平台,一直广受大家喜爱。可以随时随地使用,还有免费的GPU可以薅羊毛。那么如何在Colab中使用外部数据集,来完成竞赛呢,本文将给出几种常见的方法。方法1:…

高可用性系统在大众点评的实践与经验

背景 所谓高可用性指的是系统如何保证比较高的服务可用率,在出现故障时如何应对,包括及时发现、故障转移、尽快从故障中恢复等等。本文主要以点评的交易系统的演进为主来描述如何做到高可用,并结合了一些自己的经验。需要强调的是&#xff0c…

图灵奖大佬+谷歌团队,为通用人工智能背书!CV 任务也能用 LM 建模!

文 | ZenMoore编 | 小轶图灵奖大佬 Geoffrey Hinton 的团队和 Google Brain 团队近日发布新工作 Pix2seq,将 CV 经典任务 目标检测 转换为了语言模型的下游任务。这就很有意思了朋友们!因为这是一个很一般化的范式!也就是说,不光是…