吐血整理:论文写作中注意这些细节,能显著提升成稿质量

fdfc43502ce903780fa745d67ab7ffd7.png

文 | python
编 | 小轶

97203653a4f55e43c6201c9c0ef31247.png前言5767c2a343ff54e170a053ee0810391f.png

不知诸位在科研的起步阶段,是否曾有过如下的感受:

  • 总感觉自己写的论文就是和自己读过的论文长得不太一样,也不知道为啥。

  • 投稿的时候,审稿人也总是 get 不到论文的核心,只揪着论文的次要细节不放

在本文中,笔者吐血整理大量的论文写作小细节。从格式到内容上帮你提升论文的清晰度和易读性,可以显著缓解论文写完后导师不爱看,评审看不懂等症状。

本文适合对LaTeX基本语法有所了解的同学食用。

2e77a8a69e3009d6326c42651691245e.png

c8daf46e6f4b0128b01d3040f1d442b3.png符号篇154cc4de20dd85b63a3868eb74693b2b.png

数学公式中的字母

  • 标量符号用小写拉丁字母表示。为避免混淆字母 l 和数字 1 ,字母 l 可用 \ell 替代。

  • 有结构的值,如句子、树、图等,用 \boldsymbol(e.g. )。

  • 向量值小写加粗。拉丁字母用\mathbf(e.g. ),希腊字母用\boldsymbol(e.g. )。

  • 矩阵大写加粗。拉丁字母用\mathbf(e.g. ),希腊字母用\boldsymbol(e.g. )。

  • \boldsymbol{x} 组成的集合用\mathcal{X}(),a 组成的集合用 A(a A)。

  • 数域用\mathbb{R}(),\mathbb{Z}()。

f4a597f20afb3056a9bd952540667f2d.png

标点符号

  • 数学公式中的省略号用\ldots,例如:

  • LaTeX中英文引号的打法是: ``''c729825f0bffe6880c2cb7afe9a5b48f.png

  • 尽量避免用引号标记较长的文本,比如 case study 中的例子。因为引号的理解是上下文相关文法,引用文本过长不易把握引号的边界。Case study 中的例子可以用 \textit{} 标记。

  • 网络链接用 \url{} 标记。

b56e30e4d5f9d7a50de50d4a8855cb9d.png公式篇f920ea5ffd86ac2a345dcf5e37acbc7f.png

  • 使用 align 表示一组公式,一般情况下以等号对齐会更好看。对齐方式:每个公式的等号处加 &。

  • (建议,有争议)只对refer的公式加编号,align中,可以用\nonumber去掉编号

  • 公式中的 softmax,proj,enc 等,超过一个字母的变量或符号,要用正文字体,即写成 \textrm{softmax} 或 \textit{FFN}。很多函数有现成的符号,例如:\arg,\max,\sin,\tanh。

  • 公式中的括号,要用\left,\right 进行标记。如 \left(\right),\left{ \right}。<>、|| 这种括号也是一样的。括号中的分割可以搭配\middle。

错误的例子:softmax 中间的迷之空格,pro和j之间的迷之空格。2ef7dd0522f22df0b5c73cf488c4e99f.png

部分正确的例子:还没有加粗,公式5的乘号也还没有改,只是展示一下align,以及\textrm的影响。e35f8eb7d9b17f1926fa1d5232462bd1.png

概率相关的例子27926f50f4e34003d353dae63cf53c62.png

2f740de85cd520d92205b438545bd39a.png表格篇2f14112c1f3c716779340fd421e58a1a.png

表格的大小、换行

  • 用 \centering 居中

  • 用 p{2cm} 固定列宽

  • 用\small,\scriptsize,\footnotesize,\tiny 调整字号

  • 用\setlength{\tabcolsep}{8pt} 调整列间距

  • 用\multirow,\multicolumn 合并单元格

  • 用\toprule,\bottomrule, \midrule, \cmidrule画出好看的分隔线

示例:e9f5690940c5cae60c4153d961734552.png

表格对齐

  • 展示数据的列,如果数据不等长,请右对齐。(下图左边是错误地做左对齐的示例,右边为正确的)6e7ae93849db8cd589c47361bb4e7951.png

  • 表格中的加粗请使用 \textbf{},而非\bf。上图右边中,14.10的加粗就错误地使用了\bf,导致对齐出现问题(这一问题仅在某些模板中存在),而17.24的加粗就使用了\textbf{}。

4aa4243180118c3f05bf7694f02fb43f.png词汇篇a65334b320c54af8fafebe9b8b34632b.png

避免过于绝对和模糊的表达:

以下词汇除了极特殊情况外,不要出现(→后是可供替代的词):

  • obvious (→ straightforward)

  • always (→ generally)

  • never (→ rare)

  • avoid (→ alleviate)

  • meaning, semantic, better, simple, easy, trivial ...

单复数

  • phenomenons  →  phenomena

  • 不可数名词:evidence 等。

专有名词的大小写

核心原则:符合习惯,与提出者尽量一致,第一次提时全称在前。常用词一般不大写,除非语义和词本意不同(比较少见,同时也尽量避免)。

  • CNN,LSTM

  • graph attention network (GAT),pre-trained language model (PLM)

  • FEVER,ConceptNet,SQuAD,BiDAF,FEVER score,Wikipedia

b97e09c51129c4f44f9dadabfe538214.png句子篇2514efac671813bfbafbfe9833dd7aaa.png

表述尽量具体,避免贴标签

核心在于,要讲清楚提出的方法到底改善了哪里,是什么导致的这个结果。而不要总是说提出的方法提升了分数,提升了某部分分数,相对什么提升了分数。这种贴标签的话,可以有,但一定不能通篇都是。

示例1

  • 贴标签:a simple yet effective approach to solve this problem, which improves performance and robustness.

  • 具体:a simple yet effective approach to help XXX to learn/recognize XXX

示例2

  • 贴标签:experiments show that our model achieves state-of-the-art performance.

  • 不太具体(用于摘要):experiments show that our model can XXX, and outperform exisiting methods in literature.

  • 具体(用于总结):experiments show that our model can make better and full use of XXX, especially those XXX ones, thus achieving state-of-the-art performance.

一句话尽量只说一件事

分割前:全都混在一起,读起来总有一种:“我是谁?我在哪?我在干什么?”的迷惑。

To connect XXX using relations XXX, we train a classifier on XXX, where the sizes of training/validation/test instances are A/B/C, and we finally obtain a accuracy of XXX on the test set.

分割后:做了什么,怎么做的,过程细节,结果效果。四句分开说。

We predict the relations between XXX, linking XXX. Specifically, we train a classifier using XXX. The sizes of training/validation/test instances are A/B/C, respectively. The results show that our method obtains the accuarcy of XXX on the test set.

注意句子间的逻辑

主要需要明确,每句话想表达什么。表达的这个内容的前序铺垫都清楚了么结论和条件之间是否有直接因果关系?或者比较间接但也铺垫充分了?尤其包含对于thus,therefore等因果指示词的句子,需要更加注意。

以及,段落开头的句子是否可以概括段落的核心思想段落中每句话是否都和这个思想相关?有没有跑题?

其实,在处理段与段及章节之间的逻辑时,也都是类似的思路。

b0bb9f24973cfd6a1015014fc92b13c6.png他山之石25dec785a59506e3b651fcc7970d3c0b.png

以下是笔者多年珍藏的各路大佬给出的写作建议,这次也一并分享出来,以供大家参考。

1. 机器翻译学术论文写作方法和技巧:清华大学刘洋老师在CWMT-2014上做的经典报告,以机器翻译的视角,从选题开始,给大家讲解了论文写作的方法和技巧。

http://nlp.csai.tsinghua.edu.cn/~ly/talks/cwmt14_tut.pdf

2. 如何端到端地写科研论文?:复旦大学的邱锡鹏老师在CCL-2018的student workshop上做的报告。

https://xpqiu.github.io/slides/20181019-PaperWriting.pdf

3. 论文写作的易读性原则:刘一佳同学, 阿里巴巴达摩院的阿里星大神,在NLPCC-2018上做的报告。

http://yjliu.net/cv/res/2018-08-19-nlpcc-sws.compressed.pdf

4. 哥伦比亚大学的Henning Schulzrinne老师的一些学术随笔,其中也有一个论文写作的collection。

http://www.cs.columbia.edu/~hgs/etc/writing.html

5. 哈佛大学的Whitesides老师从写提纲的角度切入讲解如何撰写学术论文。

https://onlinelibrary.wiley.com/doi/pdf/10.1002/adma.200400767

6. 如何让摘要吸引人?Nature论文摘要模板值得收藏。

https://zhuanlan.zhihu.com/p/158574876

7. 支付宝研究员王益的建议:“学好语文,才能写好代码”(很多观点对写论文同样适用)

https://zhuanlan.zhihu.com/p/157243326

不管是本文谈到的细节,还是上面大佬们给出的写作建议,都只是一种风格而已,可以参考,但没有必要死守。各家有各家之言。论文写作的首要目的是支撑、凸显核心论点,而在这一前提下,保持一致最为重要。

萌新可以考虑以本文,或上面提到的某位大佬的材料中的写作风格为起点,在和导师、师兄/师姐的磨合中,逐渐形成自己的写作风格。而熟手也可以参考本文,吸收部分建议,融入到自己的风格中,作进一步完善。

写作最重要的还是经验。多写、多练、多总结、多思考、多听取导师的建议,相信你的写作水平会突飞猛进。让你的导师不再看你文章时心急得抓耳挠腮;让评审不会迷失在糟糕的写作中,能够一眼看出你的贡献点,打出 strong accept!

23ea7d78fc9c16b4fa1afe01b6f9d7fc.png萌屋作者:python

北大毕业的NLP博士。日常写点论文,码点知乎,刷点leetcode。主要关注问答、对话、信息抽取、预训练等方向。力扣国服第一python选手(经常掉下来)。知乎 ID 是 Erutan Lai, leetcode/力扣 ID 是 pku_erutan,欢迎没事常来逛逛。

作品推荐

  1. 恕我直言,你的实验结论可能严重依赖随机数种子!

  2. AllenAI 发布万能问答系统 MACAW!各类题型样样精通,性能大幅超越 GPT-3!

7f3231f13f56f5d9e99c97180327d3b0.png后台回复关键词【入群

加入卖萌屋NLP/IR/Rec与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

346248ae5114af9fb8754bfb46aa30aa.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477854.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 1237. 找出给定方程的正整数解

1. 题目 给出一个函数 f(x, y) 和一个目标结果 z&#xff0c;请你计算方程 f(x,y) z 所有可能的正整数 数对 x 和 y。 给定函数是严格单调的&#xff0c;也就是说&#xff1a; f(x, y) < f(x 1, y) f(x, y) < f(x, y 1)函数接口定义如下&#xff1a; interface Cu…

基于Wi-Fi的室内定位在美团总部的实践和应用(上)

室内定位技术的商业化必将带来一波创新高潮&#xff0c;尤其是在O2O领域&#xff0c;各种基于此技术的应用将出现在我们的面前。我们可以想象一些比较常见的应用场景&#xff0c;比如在大型商场里面借助室内导航快速找到目标商铺&#xff0c;商店根据用户的具体位置向用户推送更…

LeetCode 1266. 访问所有点的最小时间(数学)

1. 题目 平面上有 n 个点&#xff0c;点的位置用整数坐标表示 points[i] [xi, yi]。请你计算访问所有这些点需要的最小时间&#xff08;以秒为单位&#xff09;。 你可以按照下面的规则在平面上移动&#xff1a; 每一秒沿水平或者竖直方向移动一个单位长度&#xff0c;或者…

Coding Party 邀你出战!飞桨黑客马拉松线下场来啦

12月4-5日&#xff0c;这48H&#xff0c;与100开发者HACK Together“黑客”很酷&#xff1f;和“黑客”一起“战斗”是种什么样的体验&#xff1f;你参与这场“战斗”了吗&#xff1f;PaddlePaddle Hackathon 2021飞桨黑客马拉松&#xff0c;由百度飞桨联合深度学习技术及应用国…

技术动态 | 「知识图谱嵌入技术研究」最新2022综述

转载公众号 | 专知知识图谱(KG)是一种用图模型来描述知识和建模事物之间关联关系的技术. 知识图谱嵌入(KGE)作为一 种被广泛采用的知识表示方法,其主要思想是将知识图谱中的实体和关系嵌入到连续的向量空间中,用来简化操作, 同时保留 KG 的固有结构.它可以使得多种下游任务受益…

全球仅3000人通过的TensorFlow开发人员认证到底有多香!

现在&#xff0c;我们每个人都已经习惯了社交网络&#xff0c;随时随地都能进行微信、QQ语音和视频通话。那么&#xff0c;你是否发现在不同场景下&#xff0c;这些社交软件音频、视频都是那么的流畅&#xff0c;这背后是什么科技在支撑这“声”与“话”的美好呢&#xff1f;这…

LeetCode 1043. 分隔数组以得到最大和(DP)

1. 题目 给出整数数组 A&#xff0c;将该数组分隔为长度最多为 K 的几个&#xff08;连续&#xff09;子数组。分隔完成后&#xff0c;每个子数组的中的值都会变为该子数组中的最大值。 返回给定数组完成分隔后的最大和。 示例&#xff1a; 输入&#xff1a;A [1,15,7,9,2,…

图谱实战 | 安全领域知识图谱建设与典型应用场景总结

转载公众号 | 老刘说NLP 安全知识图谱是网络安全领域专用知识图谱&#xff0c;也是知识图谱应用于安全业务的重要工业尝试。当前&#xff0c;安全领域中存在大量的业务数据&#xff0c;建模需求以及应用需求&#xff0c;了解安全领域知识图谱的建设方法以及典型应用场景&#x…

Hadoop安全实践

前言 在2014年初&#xff0c;我们将线上使用的 Hadoop 1.0 集群切换到 Hadoop 2.2.0 稳定版&#xff0c; 与此同时部署了 Hadoop 的安全认证。本文主要介绍在 Hadoop 2.2.0 上部署安全认证的方案调研实施以及相应的解决方法。 背景 集群安全措施相对薄弱 最早部署Hadoop集群时并…

论文浅尝 | KGQR: 用于交互式推荐的知识图谱增强Q-learning框架

笔记整理&#xff1a;李爽&#xff0c;天津大学链接&#xff1a;https://dl.acm.org/doi/pdf/10.1145/3397271.3401174动机交互式推荐系统(IRS)以其灵活的推荐策略和考虑最佳的长期用户体验而备受关注。为了处理动态用户偏好&#xff0c;研究人员将强化学习(reinforcement lear…

收藏清单:史上最全java自动化测试工具汇总

xUnit frameworks 单元测试框架 JUnit - 常用的测试框架TestNG - 测试框架 Test Data Supplier - TestNG DataProvider封装&#xff0c;让数据的生成更加灵活 TDD \ ATDD \ BDD 工具 JBehave - Behaviour-Driven Development (BDD)测试框架. BDD是从 test-driven development…

LeetCode 1014. 最佳观光组合

1. 题目 给定正整数数组 A&#xff0c;A[i] 表示第 i 个观光景点的评分&#xff0c;并且两个景点 i 和 j 之间的距离为 j - i。 一对景点&#xff08;i < j&#xff09;组成的观光组合的得分为&#xff08;A[i] A[j] i - j&#xff09;&#xff1a;景点的评分之和减去它…

聊聊推荐系统的高阶特征交叉问题

文 | 水哥源 | 知乎Saying1. DCN看起来给了我们很好的允诺&#xff0c;但是细细想来是有一些问题的&#xff0c;这里也可以参考大佬的意见2. 高阶FM的核心设计是先element-wise乘&#xff0c;再对embedding求和。核心优化方法是利用计算中的冗余构建递推关系&#xff0c;然后使…

COS系统的前端演变和发展

背景 美团COS&#xff1a;全称美团网核心业务系统部&#xff0c;以持续整合O2O线下资源&#xff0c;共建高效率、低成本的供应链系统&#xff0c;高效推动O2O生态环境建设为业务目标&#xff0c;负责美团网核心业务系统的建设和管理。 COS系统&#xff0c;伴随着美团3年多的发展…

OpenKG 祝大家元宵节快乐!

OpenKGOpenKG&#xff08;中文开放知识图谱&#xff09;旨在推动以中文为核心的知识图谱数据的开放、互联及众包&#xff0c;并促进知识图谱算法、工具及平台的开源开放。点击阅读原文&#xff0c;进入 OpenKG 网站。

LeetCode 1262. 可被三整除的最大和(DP)

1. 题目 给你一个整数数组 nums&#xff0c;请你找出并返回能被三整除的元素最大和。 示例 1&#xff1a; 输入&#xff1a;nums [3,6,5,1,8] 输出&#xff1a;18 解释&#xff1a;选出数字 3, 6, 1 和 8&#xff0c;它们的和是 18&#xff08;可被 3 整除的最大和&#xff…

LeetCode 1253. 重构 2 行二进制矩阵(贪心)

1. 题目 给你一个 2 行 n 列的二进制数组&#xff1a; 矩阵是一个二进制矩阵&#xff0c;这意味着矩阵中的每个元素不是 0 就是 1。第 0 行的元素之和为 upper。第 1 行的元素之和为 lower。第 i 列&#xff08;从 0 开始编号&#xff09;的元素之和为 colsum[i]&#xff0c;…

论文浅尝 | ExCAR: 一个事件图知识增强的可解释因果推理框架

笔记整理&#xff1a;朱珈徵&#xff0c;天津大学硕士链接&#xff1a;https://aclanthology.org/2021.acl-long.183.pdf动机因果推理旨在理解因果之间的一般因果相关性&#xff0c;对于各种人工智能应用都有很大的价值。先前的研究主要是基于从手工注释的因果事件对中归纳出的…

从ACL2021看对比学习在NLP中的应用

本文首发于微信公众号”夕小瑶的卖萌屋“文 | 花小花Posy源 | 夕小瑶的卖萌屋最近关注对比学习&#xff0c;所以ACL21的论文列表出来后&#xff0c;小花就搜罗了一波&#xff0c;好奇NLPers们都用对比学习干了什么&#xff1f;都是怎么用的呀&#xff1f;效果怎样呀&#xff1f…

美团性能优化之路——性能指标体系

前言 在互联网网站百花齐放的今天&#xff0c;网站响应速度是用户体验的第一要素&#xff0c;其重要性不言而喻&#xff0c;这里有几个关于响应时间的重要条件&#xff1a; 用户在浏览网页时&#xff0c;不会注意到少于0.1秒的延迟&#xff1b;少于1秒的延迟不会中断用户的正常…