总说(历年美赛优秀论文可获取)
数模的题型千变万化,我今天想讲的主要是一些「画图」、「建模」、「写作」和「论文结构」的思路,这些往往是美赛阅卷官最看重的点,突破了这些点,才能真正让你的美赛论文更上一层楼,还有需要研读历年美赛优秀论文,文末可以获取美赛数学建模历年获奖论文。
画图篇
数学建模比赛,但是我首先提的是画图,为什么呢?因为就像高考阅卷一样,考官在每份论文上花的时间其实很少。2020年美赛20948支队伍参赛,考官要按时给出阅卷分数,压力还是很大的。所以,在考官极短的阅卷时间里,要抓住考官的眼球,多欣赏你的论文几分钟,图像这种高信息量表达方式的重要性可想而知。
论文的思维导图
根据我阅读往年O奖、M奖论文的经验,不少论文都会在Introduction部分将自己的论文结构以思维导图的方式呈现出来,以方便考官对论文结构一目了然。记住一个原则:「方便考官,也是在给自己方便。」
添加图片注释,不超过 140 字(可选)
上面是我队两年参赛的思维导图,其他的一些论文的思维导图的画法也可以参考往年其他论文。画思维导图总的原则是:「要能体现论文的建模结构和逻辑思路」(将几个大模型串联起来),「关系线路不要太复杂」,「在不拥挤的前提下尽可能多地展现主要方法」。画图的工具可以采用Edraw或者其他一些画图软件,记住:「颜值和清晰至上。」
概念图
在论文里,有时需要你去体现一些机理关系或者演化图,这时候写一大段话不如直接用图来表示,既方便考官,也为论文颜值加分。最典型的例子的19年A题养龙的那篇将插图画的极为精美的O奖论文。我这里为了避免侵权,还是只用自己队的论文举例。
为了体现生态环境的演变,我们曾画了这么一幅图
添加图片注释,不超过 140 字(可选)
而为了体现环境污染对人类的影响,我们也曾画过“食物网”
添加图片注释,不超过 140 字(可选)
在给官方的一封信附件里,我们给出了这么一副倡导环境保护的图
添加图片注释,不超过 140 字(可选)
在19年国赛时,我们也画过油泵的系统分析图
添加图片注释,不超过 140 字(可选)
概念图的画图要求是: 「简明扼要地体现你想表达的目的的同时颜值至上。」 画图软件同样是根据自己的需求自选,我们常用的是Edraw和PPT等。
数据分析图
数据分析图可能是美赛中使用得最多的一类图,最常见的是折线图,柱形图,但是如果通篇都只是这两种,未免会显得很单调。如果有一个好的结果,但展现不出来效果,其实是挺难受的。同样是以我的亲身参赛论文为例,这里我介绍另外几种使用得比较多的图, 体现密度分布的热力图
添加图片注释,不超过 140 字(可选)
体现多个维度比较的雷达图
添加图片注释,不超过 140 字(可选)
体现相对比例的饼状图
添加图片注释,不超过 140 字(可选)
体现相对比例又能突出中心主题的旭日图
添加图片注释,不超过 140 字(可选)
当然还有漏斗图,箱型图以及组合图等。希望大家的数据图和结果图不要过于单调,当然也不要为了追求画很多很炫的图而生造很多图出来,否则可能造成喧宾夺主的结果。要知道,美赛的篇幅还是很重要的,太大的或者不重要的图建议放在附录里。画图的方式有PPT,EXCEL,编程绘图等。
建模篇
画图虽然很重要,但是不可置否的是,建模依然是整个数学建模过程中,最重要的环节之一,一篇文论如果没有采用合适的模型,那么不论如何也无法真正获得成功的。
数学建模的过程实际上可以分为:「将现实问题抽象为数学模型,通过算法求解数学模型,根据求解结果给出问题答案,再用现实信息去验证求解的答案」四个步骤。但实际上在美赛中应该怎么去做呢?
初阶建模——套用模型
相信做数学建模的同学手上都或多或少地有基本建模书籍,每本书都大大小小罗列着几十个模型。做比赛时,很多同学就会根据题目类型去找一个看起来比较搭配的模型去套用,写一些公式,把别人程序里的数据改变一下就万事大吉。这样的方法不是错了,实际很多数模选手都是从这一条路上走过来的,比如我大一建模时,就喜欢拿着下面的一张图建模,像极了模式识别机器人。书上有 的东西,我在进阶篇里面都不会讲,只讲自己的建模体悟。
添加图片注释,不超过 140 字(可选)
以2020数据来看,美赛的M奖及其以上的获奖比例仅为10%左右,算上H奖也不过30%多,而O奖更是低至0.18%左右,要在这么多队伍中脱颖而出,只靠套模型显然是不够的。
进阶建模——改创模型
真正做过比赛的人会发现,有一些比赛题目你发现根本没有办法套用现有的模型,或者是你的模型库里面缺乏类似的模式。这时候,有些人会强行套用一个不合适的模型,这种方法我认为是非常不合适地,如果被考官注意到,会给你的论文打上一个“胡乱建模”的标签,这对整体印象来看简直是致命伤。另外一种方式是,自己改造现有模型或者直接进行机理分析创造模型,这种方法由于原创性高,不容易和其他队伍撞车,在叙述清楚和逻辑清晰的前提下,是很容易获得考官的青睐的。 这里举一个我实战过的具体例子,20年美赛E题的第一任务:
添加图片注释,不超过 140 字(可选)
翻译一下,题目让你建立一个模型,分析什么样的一次性塑料品使用水平,可以在不造成环境恶化的情况下被消除。需要考虑垃圾来源,现有污染现状以及处理垃圾的手段。 这个问题看似简单,但其实建模起来非常难。因为其中的很多量都没有办法量化,比如说污染水平,环境恶化,垃圾来源和处理手段,在没有办法量化的情况下是难以抽象为数学符号进而建模的。 在查阅论文时,我们找到了在生态学中存在环境承载量(简记为)(受到垃圾的来源和处理方式影响)和环境承载力(简记为)(环境本身的状态决定)两个概念,分别刻画环境目前受到的各种环境污染和环境本身能够在自我恢复的情况下承受的最大污染水平。基于这两个前提,我们考虑到了环境本身的演化情况,建立了环境承载量和环境承载力的时间序列模型。其中,环境承载量是根据外部垃圾污染、垃圾处理以及现存垃圾水平动态变化,环境承载力受到承载力变化因子((环境承载量-环境承载力)的函数,用类逻辑斯蒂函数拟合)的影响变化。建立了如下的模型,
添加图片注释,不超过 140 字(可选)
最后,我们定义环境承载率()为环境承载量➗环境承载力,通过不同的污染来源对环境的影响,对其进行加权求和,
再通过给出了三种典型的环境变化,最终给出了在不造成环境恶化的一次性塑料使用水平的阈值,进而回答了问题(通过环境承载力的变化来定义环境是否恶化)。
添加图片注释,不超过 140 字(可选)
可以看到的是,我们的建模其实并不是非常严谨,较真起来甚至有一些东西无法解释,但是从整体思路和大的方向来看是没有问题的。所以自己改创模型其实没有你想的那么难,最重要的一点是要「自圆其说」。根据基本的共识(这里的共识生态环境具有一定的自我恢复能力)和一些学界目前的知识,通过形式化和数学化的语言对其进行定性,定量和半定量的分析建模,其实便可以推出一些大体可以自洽的模型,不用追求毫无漏洞(因为大部分的我们都做不到),但是要做到能够自圆其说。
建模进阶——组合模型篇
在初阶建模里提到的基础模型大家手上的资源都差不多,如果只是套用模型那么很可能就和别的队伍撞车了,这样的文章考官每天可能要看几十上百篇,怎么能够脱颖而出呢?一个最好用又最有用的思路就是组合模型。组合技才是真正的高阶方法,用的好绝对可以让考官认为你的建模水平远超常人。那么如何组合模型呢?生搬硬凑肯定是不行的,模型组合,其间的学问可大着呢?
我这里举一个例子,主要是想体现组合模型的思路。
-
要预测一个某个抽象量的变化。 你有什么思路呢? 知道这个量的历史数据,然后「通过函数拟合进行预测」?这显然是简单但是又实在乏善可陈的一种方法。 再高明一点,通过「时序分析模型进行预测」?看起来好一些了,但是真正能满足这类模型对周期性等要求的情况在建模比赛中其实碰到的可能性比较低。 充分利用其他信息! 有一些其他具体量的数据是比较好预测的,比如可能通过政策或者其内在的一些规律进行预测,然后通过「多元线性回归」等方法(如果存在类似的关系),建立起具体量和抽象量的关系,通过预测具体量进而给出抽象量的预测,听起来不错了!别忘记要做「数据预处理」,进行归一化哦! 能不能更好一些?如果我们想利用尽可能多的外部信息,但是某些具体量之间相关度又可能比较高,不符合多元线性回归对自变量相互无关的要求呢?引入「聚类方法」对相似量之间进行整合怎么样呢?可不可以引入「主成分分析」呢?刚好可以去除他们之间的相关性! 如果抽象量和具体量之间的关系式随着时间的推移不稳定,又该怎么办呢?。。。。。。
这样问下去,你在要解决一个又一个的问题的同时,就要引入一个又一个的模型,这个过程流畅而自然,截至我们已经可以把单一的预测模型与多元回归模型,主成分分析或聚类模型和时序预测模型等结合起来了,看起来是不是比最初的想法精致和合理很多了呢?
「其实数学建模就是这样,数学模型永远只是对真实世界的近似而已,要让你的近似更加贴近真实,那么适当增加模型的复杂度是必然的,这便是我认为的组合模型法的第一性原理所在。」 模型组合法给数学建模增加了活力,但是比赛依然需要套路,哪些模型常常可以合理地结合在一起以及怎么去描述模型的选择,这些是需要平时积累的,希望大家在准备比赛时,多进行这方面的思考、实践和总结。
写作与论文结构篇
模型建好了,如果没有好的写作,依然无法在美赛中脱颖而出。有万贯家财,却又草履布衣,谁又能知道呢?这里主要讲一下摘要的写作,写作的一些注意事项和论文的结构安排。
摘要写作
摘要是论文的脸面,是考官第一眼看到的东西。心理学告诉我们,第一印象对人们形成对人或事物的总印象具有较大影响。所以,写好摘要至关重要,甚至极大影响了考官后续是否会认真阅读你的论文。那么摘要该怎么写?
去官网下载最新的摘要页,摘要页上的基本信息要有题号和队伍控制号。每年的摘要页和要求可能存在变化,一般来说,字数控制在1/2-2/3页是比较合适的篇幅。
首先,是标题。一个好的标题可以引入注目,这个相信经历过高考语文作文的同学的会深有感悟。标题一般要体现你要解决的问题和用到的主要方法。但是有些时候如果方法过于冗长不好归纳,那么不建议将标题写的过长,比如我队20年的O奖论文标题是「全球一次性塑料危机」,简明扼要,主题突出。
添加图片注释,不超过 140 字(可选)
其次是第一段,第一段主要内容是背景介绍和文章的主要工作。常见的写作套路句式大家可以自己去总结好论文的写法。比如:「“….(Background). To better understand and tackle these problems, this paper focuses on …, … and… ”」
然后是主体部分,一般根据问题或者模型分为三段或四段。这部分的写法有很多,但是我最推崇的还是根据问题来写,一个大问题写一段,这样的思路满足之提到的原则:「方便考官,也是在给自己方便。「因为考官有一个特别关注的点,就是」你论文的完成度怎么样」,你的论文是否回答了题目提出的问题。所以一个大问题写一段,最能够方便考官进行核对。记住,「一定要证明直接回答题目问题!」
具体的写作思路是“为了达到什么目的/解决什么问题,我们建立了一个什么模型。(为了节约篇幅,模型第一次写的时候用全称,后面再次提到用简称,比如Environment Bearing Rate Model (EBRM))。首先,我们分析了什么,得到了什么结果;其次,我们推导了什么,取得了什么成果;最后,我们总结前面的模型,…。(正面直接回答问题))”。
每一段的大体思路都是这样,但是根据问题的重要程度和具体形式会进行形式的变换和篇幅的控制。
最后是收尾部分,一般是说你们根据建模分析,给某某组织写了一封倡导信之类的东西,以及加上对自己模型的「简要」评价,比如通过某某测试,发生模型的鲁棒性非常强。
注意,论文的结果数据(比如预测结果等)一定要放进摘要,对于模型、方法和重要结果可以加粗。
文章内部
文章内部的结构就更是五花八门了,不过有一些通用的结构是必须有的,比如背景介绍,问题假设和符号表示等。具体的结构可以总结参考其他好论文的优点,强强结合,「打造自己的特色」(这个很关键,没有特色的论文是最容易被淹没和默默无闻的,这里给出我们O奖论文的目录)。
添加图片注释,不超过 140 字(可选)
具体文章内部的写法,和个人的英语写作能力有关,如果自己写作能力不好或者时间不足,建议直接Google translate或者有道翻译。但是翻译这是讲技术的,你必须把中文的逻辑写的顺畅,翻译出来的英语才能用,而且用之前一定要检查翻译出来的内容和你想表达的意思是否一致。
总的原则是,坚持学术英语写作标准。
-
简明扼要地介绍内容,不要拖沓。
-
每一个模块下面都要有总起段,介绍这部分讲什么,结束时也要承前启后,介绍这部分得到什么结论下部分将继续介绍什么。
-
每一级标题要是同一等级的事物。
-
图的标题放下面,表的标题放上面。
-
公式要编号。
-
背景和motivations多引用别的知名材料,让大佬为你背书。
-
用最清晰,最直观的方式展现你的思路和结果。重要的东西能用图表示,就不要写字。
-
在介绍notation的时候,不要忘记单位。
论文的写作还有很多坑,就不再一一叙述,大家可以在写论文的时候自己实践总结。
资源篇
工欲善其事,必先利其器。拥有好的资源是快速高质量完成论文的利器。
拿到题目,首先去查询相关论文,Google Scholar和学校的官方数据库将给你很大的帮助,查到一篇匹配度高的优质论文,将对你的建模思路甚至数据来源提供非常大的帮助;另外题目的附件里提到的参考文献一定要去看甚至网状展开(根据其参考文献),这是最快捷有效地找数据和背景的方式了;
平时要多准备材料,论文模板、历年获奖论文、经典程序的储存、好看的图、写作的套话(模型的优缺点,模型假设和摘要套路),再备上几本可供参考的建模书籍,那么你就可以开始你的美赛征程了!
历年美赛获奖论文获取