ICM B题:光伏发电
该题目出题的难度与方向都与美赛ICM的题型高度相似,将本次竞赛当做美赛的练手赛,个人认为是非常合适的一种选择。同时28号就可以出成绩,也可以在美赛前实现查漏补缺,提前预祝大家比赛顺利,美赛都可以取得好成绩。下面,我们开始详细的解读一下本次竞赛的B题。
B题本次的难度远低于A题,这势必会导致B题的选题认识会比A题多很多,但是比赛的最终成绩是获奖率。无论都是每个赛题选择人数多少,每个赛题获奖的人数都是50%,因此不存在选择人少的赛题好获奖这种情况,都是比例获奖。我可以保证跟着本人的思路,获奖是没有任何问题的,至于能获得什么奖项,主要还是看对于每一问选择的模型复杂度的高低以及队伍可视化的能力。基本每一问都会给两三种实现方式,上中下三种实现方式,即使最简单的方式,也是可以保证获奖的。但是很难保证获得很好的奖项。
数据收集
在正式开始题目之前必须明白,对于美赛这种ICM题目,很大程度的上的难点并不在于题目本身而是,需要我们自行收集数据,由于大家之前没有自己找过数据,所以这一关会难倒很多很多的人群。本团队会为大家收集一套完整的数据,供大家选择。至于选择这套数据集中的何种数据,就因队伍而已,因此一千个队伍可能有一千种选择方式。所以,从一开始的选择数据开始,大家就会各不相同。因此,无需担心查重率过高的问题。
本文目前,已经为大家收集了问题一和问题四的数据,如下所示。稍后也将为大家专门收集关于光伏发电相关的数据,完成对于问题三四的数据收集。
(注释:大家如果需要其他,数据集中没有的数据,欢迎大家留言,我们会尽力帮大家收集)
问题一、中国的电力供应与许多因素相互作用。请研究它们之间的关系,并预测中国从2024年到2060年电力供应的发展趋势。
问题一本质是一个问题,两个步骤,一进行相关性分析,二进行预测。需要注意的是本题的主体是电力供应,不是本文的主旨光伏发电。因此,我们只需要研究电力供应就可以。首先,我们需要选择合适的指标,对于电力供应有很多相关的指标,这里每个人选择的都不会一模一样,因此这也是大家论文不用的地方。我下面给大家一个大致的方向,首先就是历史的电力供应数据(该数据在国家统计局收集到,在1.5更新中,文件名为‘水电、火电、核电、风电生产量’),其次就是一些与电力供应相关的数据经济数据(GDP、人口增长等)、工业化进程数据、电力结构(煤炭、天然气、可再生能 源等)、经济增长率、城市化率、家庭消费水平等(以上大部分数据都可以在1.5更新中,文件名为“1269个中国宏观指标”找到)后续也会补充一些这方面的宏观数据。
确定收集到的数据指标后,就是整理数据。建议大家可以绘制几张折线图(图一这种的)等,完成对收集到数据的描述,对于数据预处理,包括缺失值处理、异常值处理、数据降维等。异常值处理,首先判定数据分布方式,对于正态分布的数据利用3西格玛原则判定异常值;非正态分布的数据利用箱型图判定异常值。对于判定的异常值进行剔除处理,变为缺失值。
对缺失值,两部分既有数据收集本身所有的,还有就是异常值处理带来的异常值。这里比较建议大家选择线性插值(平均值插值、克里斯插值等都是可以的)。对于较高维度的数据,还可以选择就降维处理。处理完数据后,需要对进行第一小问的回答,即判定关系。这属于关联分析模型,根据变量的个数不用刻意直接选择不用的方式。这里,个人比较建议直接使用person进行相关性分析即可。
第二小问,预测模型可以根据自行收集的数据的需求进行选择,数模常见的预测模型见下表。个人比较推荐的三种预测模型,分别为
方案一:y与多个x 建立多元回归模型
使用该方法的原因,是之前已经完成了多个x之间的分析,可以直接顺理成章的建立多元回归模型。这种方式比较顺滑,比较容易懂,但是预测精度会比较低。
方案二:单一预测模型 例如 LSTM、BP、随机森林可能会比较合适
使用该模型,复杂度比方案一要好一些,精度也很好。模型整体度没有方案一好
方案三:建立加权平均预测(arima、lstm、多元回归模型),个人最喜欢的模型,模型复杂度很高,但是主要问题就是篇幅很长,可能25页的篇幅限制会超出限制。有点自卖自夸的嫌疑,但是这个就是我们保奖模版的预测模版。该模型也是本次我论文写作的模型,下面是其原理图,会在更新的视频里面进行说明,看不懂的,只能使用方案一、二。
问题二、在建设光伏电站时需要考虑许多因素。这需要考虑成本和收益,以及地理和照明条件。请选择一个区域,讨论在那里建设光伏电站的可行性。
问题二,可行性。可以看做一个班级30个人算综测,找出最好的几个人。属于评价模型。难点还是在于数据的收集。目前还在收集阶段,收集完后,会为大家重新在更新一下问题二的思路。
至于评价模型选择,个人推荐客观评价模型,主要推荐用三个,以下是三个的优缺点,仅供参考
- 主成分分析法:本次我将选择的方法,可视化会很好,但是模型复杂度不高,
- 基于熵权法的理想解法:复杂度很好,但是可视化不好
- 层次分析法:可视化、复杂度都不错。但是是主观模型,信服度不好
问题三、如果您想在中国建设多个光伏电站,请结合中国的地理资源和投资能力、成本和收入因素,中国光伏发电的最大潜力是什么?换句话说,中国的最大光伏发电量是多少?
问题三,最大光伏发电量是多少,极大值的求解。类似于我们之前做过的数学应用题,如何安排计划,使得利润最大一样。按着分类分属于优化模型,对于该模型,主要在于决策变量、目标函数、约束条件三个要素。该问题需要有一定优化模型基础,起码知道一些,没学过的可以去看一下B站发布的“保奖十课时免费版”优化模型部分,一小时左右,学一些之后。在求解就会好很多,起码就可以看懂思路了。
本身知道什么是决策变量、目标函数、约束条件三个要素的就可以不用学习了,直接求解就行了。该问题毫无疑问,目标函数 一定是max 光伏发电量。需要设置决策变量,以及约束条件。约束条件可以根据大家的理解,例如题干最后一句转换效率可达到25%以上,就可以变为不等式约束。本次我也将写一个示例,在明早之前发布的论文中。至于决策变量与其他约束条件,还需要由收集的数据决定。目前数据还在收集,,收集完后,会为大家重新在更新一下问题三的思路。
问题四、为了实现中国政府到2060年实现碳达峰和碳中和的战略目标,用清洁能源替代燃煤发电是一个绝妙的想法。这个想法能实现吗?请研究中国光伏发电可持续发展的战略规划,并回答这个备受期待的问题。
问题四,在光伏发电的基础上引入了碳排放,该问题思路与2023年研赛D题问题有些类似,因此目前问题四直接给大家收集到了当时比赛的数据。稍后也会进一步更新相关数据。该问题类似于一种开放式的问题,直接看来其实并不分属任何模型分类,换而言之什么模型都可以进行求解。下面我简单的进行具体说明。
预测方向,我们在收集数据的基础上,抛出光伏发电的影响,直接进行碳排放的预测,评估一下,是否可以2035、2060年的碳达峰以及碳中和,在引入光伏发电这一指标进行二次预测。比较二者的结果,从而得出中国光伏发电可持续发展对碳达峰和碳中和的影响,这也是本次我将采用的方式。
优化方向,我们既然已经有了目标,即尽可以快的实现2035、2060年的碳达峰以及碳中和。因此可以设定目标函数,即用的时间尽可以少,或者直接在2035、2060恰好达到目标,在这个约束的前提下,考虑应该如何发展光伏可以使得,我们最后的成本最低等。
评价方向,直接列举出几种不同的方案,进行比较评价。
问题五、根据您的研究结果,请给中国政府写一封一页的信。
根据您的研究结果,请给中国政府写一封一页纸的信。
这封信应基于前四个问题的研究结果,简要概述主要发现和建议。信件应突出以下几点:
- 当前电力供应和清洁能源发展现状。
- 光伏发电的潜力和挑战。
- 实现碳峰值和碳中和目标的战略建议。
- 对政府政策和投资的建议。
这封信应以清晰、简洁的语言写成,以便政府决策者能够快速理解并考虑所提的建议。
下面是论文要求的解读:
您的 PDF 解决方案不应超过 25 页总计(尽量不要超过25页的限制,虽然这是限制很难达到,超出这个限制会有一定的扣分,但是格式分百分制评分最多只有十分,如果为了不超出限制而少写模型,导致80分的模型建立与求解扣分就会得不赏失,需要自行控制其中的平衡),应包括:
- 一页摘要表。
- 目录。
- 完整的解决方案。
- 一封一页的信。
- 参考文献列表。
注意:比赛有 25 页的限制。您提交的所有内容都计入 25 页的限制(摘要表、目录、报告、一页信、参考文献列表和任何附录)。您必须引用报告中使用的想法、图片和其他材料的来源。