需要完整资料,请关注WX:“小何数模”!
本次钉钉杯大数据挑战赛的赛题已正式出炉,无论是赛题难度还是认可度,该比赛都是仅次于数模国赛的独一档,可以用于国赛前的练手训练。考虑到大家解题实属不易,为了帮助大家取得好成绩,在国赛建模前打好基础,下面学长就赛题给出个人浅析,供大家参考!
从赛题难度来看,个人认为赛题难度从难到易依次为B>A。
首先是A题:烟草营销案例数据分析。该赛题要求对烟草销售数据进行分析和预测,需要构建两个不同类型的时间序列预测模型分别对香烟品牌的未来销量和销售金额进行预测,然后构建集成学习模型对A5香烟品牌的销量和销售金额进行联合预测。这需要对时间序列分析和集成学习有较好的理解和应用能力,能够选择合适的模型类型、参数和结构,并进行数据预处理和模型训练。此外,还需要对预测结果进行评估和比较,选择最优的模型,难度适中。
其次是B题:医疗门诊患者及用药数据案例分析。该赛题要求对医疗门诊患者及用药数据进行分析和预测,针对康复医学科一、二病房构建两个不同类型的时间序列预测模型来预测门诊收入数据,然后结合这两个模型构建集成学习模型对康复医学科三病房的门诊收入数据进行预测。与初赛A相比,初赛B的数据背景和问题场景相对较为具体,涉及的变量较少,但同样需要对时间序列预测和集成学习有深入的理解和实践能力。对学生的综合能力要求较高,整体难度相比A略大一些。
综上所述,A题要求对烟草销售数据进行分析和预测,需要运用时间序列预测模型和集成学习模型,这需要参赛队伍具备对数据的理解和处理能力,能够选择合适的模型并进行参数调整。;B题要求对医疗门诊患者及用药数据进行分析和预测,同样需要构建时间序列预测模型和集成学习模型。虽然数据背景相对具体,但也需要对医疗数据的特点有一定的了解。
总的来说,这两道题都需要参赛队伍具备一定的统计学和数据分析基础,能够运用相关知识和技能解决实际问题。但A题相较于B题来说难度适中,适合有一定统计学和数据分析基础的参赛队伍。因此,本次学长将会同时针对A题和B题进行建模助力,具体助攻资料,请关注WX:“小何数模”!(需要完整A和B题资料请关注并回复:“24钉钉杯”,获取资料链接!)
下面是A和B题具体思路分析:
受限于篇幅,需要完整资料,请关注WX:“小何数模”!