大家好呀,认证杯数学建模开始了,来说一下选题建议以及思路吧:
首先定下主基调,
本次mathorcup数学应用挑战赛推荐大家选择C题,难度方面:A≈B>D>C。
我们预计4.13日晚上前更新完毕C完整论文,其他题目不做。
精力有限,以下只是简略的图文版初步思路,更详细的视频版完整讲解请移步:
2024mathorcup妈妈杯详细思路讲解!(内含CB题代码和图片)_哔哩哔哩_bilibili
OK,接下来讲一下C和B题的思路。
C题物流网络分拣中心货量预测及人员排班
问题1:建立货量预测模型,对57个分拣中心未来30天每天及每小时的货量进行预测,将预测结果写入结果表1和表2中。
问题2:过去90天各分拣中心之间的各运输线路平均货量如附件3所示。若未来30天分拣中心之间的运输线路发生了变化,具体如附件4所示。根据附件1-4,请对57个分拣中心未来30天每天及每小时的货量进行预测,并将预测结果写入结果表3和表4中。
问题3:假设每个分拣中心有60名正式工,在人员安排时将优先使用正式工,若需额外人员将使用临时工。请基于问题2的预测结果建立模型,给出未来30天每个分拣中心每个班次的出勤人数,并写入结果表5中。要求在每天的货量处理完成的基础上,安排的人天数(例如30天每天出勤200 名员工,则总人天数为6000)尽可能少,且每天的实际小时人效尽量均衡。
问题4:研究特定分拣中心的排班问题,这里不妨以SC60为例,假设分拣中心SC60当前有200名正式工,请基于问题2的预测结果建立模型,确定未来30天每名正式工及临时工的班次出勤计划,即给出未来30天每天六个班次中,每名正式工将在哪些班次出勤,每个班次需要雇佣多少临时工,并写入结果表6中。每名正式工的出勤率(出勤的天数除以总天数30)不能高于85%,且连续出勤天数不能超过7天。要求在每天货量处理完成的基础上,安排的人天数尽可能少,每天的实际小时人效尽量均衡,且正式工出勤率尽量均衡。
思路:
C题:
1. 货量预测
数据分析
· 首先,需要对历史货量数据进行详细的分析。这包括识别数据中的季节性变化、趋势、以及可能的周期性因素。
· 进行探索性数据分析(EDA),确定数据的分布、异常值、缺失值等。
模型建立
· 时间序列分析: 可以使用ARIMA模型、季节性ARIMA(SARIMA)或者指数平滑方法。这些模型能够很好地捕捉时间序列数据的趋势和季节性特征。
为每个分拣中心建立日预测模型。考虑到每个分拣中心的数据量和特征可能有所不同,我们需要先检查每个分拣中心的数据,然后为每个分拣中心独立建立模型。
1. 数据整理:将数据按分拣中心进行分组。
2. 模型建立:针对每个分拣中心的数据分别拟合SARIMA模型。
3. 模型评估:评估每个模型的性能,确保预测的准确性。
4. 预测:使用每个分拣中心的模型进行未来30天的日预测。
问题二
详细思路:
针对第二问,我们需要考虑新的运输线路变化并对未来30天每个分拣中心的每天及每小时货量进行预测。
分析步骤:
1. 数据整理:
o 加载并检查附件3和附件4的数据,这些数据包含了运输线路的平均货量和变化情况。
o 将附件1的货量数据与附件3和附件4的线路数据整合,分析线路变化对货量的潜在影响。
2. 建模策略:
o 时序分析:对每个分拣中心继续使用时序预测模型,如SARIMA,考虑到了时间依赖性。
o 线路调整因素:考虑线路变化对货量分配和预测的影响,可能需要调整模型以反映这些变化。
3. 模型调整:
o 根据附件3中的线路平均货量和附件4中的变化情况,调整每个分拣中心的预测模型。
o 如果某条线路的货量有显著变化,调整相关分拣中心的货量预测以反映这一变化。
4. 预测实施:
o 使用调整后的模型,为每个分拣中心预测未来30天每天及每小时的货量。
o 考虑使用模拟或其他统计方法来估计线路变化对货量预测的影响。
问题三:未来30天每个分拣中心每个班次的出勤人数安排
思路:
1. 数据整理与准备:
o 从问题二中获取每个分拣中心每天及每小时的货量预测数据。
o 确定每个班次的时间范围,并计算每个班次的总货量。
2. 人员需求估算:
o 根据正式工和临时工的小时人效(25包裹/小时和20包裹/小时),计算每个班次所需的最少人数。
o 优先考虑使用正式工,不足部分由临时工补充。
3. 优化模型建立:
o 目标是最小化总人天数,并尽量保持每天的实际小时人效均衡。
o 使用线性规划或整数规划来实现人员调度,确保每天的工作需求得到满足。
4. 执行与输出:
o 实施优化模型,得到每天每个班次的正式工和临时工出勤计划。
建模过程:
1. 定义变量:为每个分拣中心、每天、每个班次定义正式工和临时工的变量。
2. 构建约束:
o 每个班次的人员数量必须足以处理预测的货量。
o 正式工的使用应优先于临时工。
o 实现每天工作负载的平衡。
3. 目标函数:最小化总人天数,同时尝试平衡工作负载。
4. 求解优化问题:使用线性规划或整数规划求解器求解模型。
问题四:SC60分拣中心的详细排班计划
思路:
1. 数据预处理:
o 同样使用问题二的预测结果,特别关注SC60分拣中心。
o 计算SC60每个班次的货量需求。
2. 排班规则实施:
o 根据工作法规,设计班次安排,确保每名正式工的出勤率不超过85%,且连续出勤天数不超过7天。
3. 优化模型:
o 使用高级优化技术(如混合整数线性规划),考虑正式工和临时工的不同效率,安排每日班次。
o 目标是最小化人天数,平衡正式工的出勤率,确保小时人效均衡。
建模过程:
1. 定义变量:
o 对每名正式工每天的班次出勤定义一个二进制变量。
o 对每个班次的临时工数量定义一个整数变量。
2. 构建约束:
o 每名正式工每天只能安排一个班次,且连续工作不超过7天。
o 出勤天数不超过30天的85%。
o 每个班次的总人数必须满足货量处理需求。
3. 目标函数:最小化总人天数,并尽可能使正式工的出勤率均衡。
4. 求解优化问题:使用优化求解器求解模型,并将结果格式化输出。
再大概讲讲B题吧:
B:甲骨文智能识别中原始拓片单字自动分割与识别研究
问题1:对于附件1(Pre_test文件夹)给定的三张甲骨文原始拓片图片进行图像预处理,提取图像特征,建立甲骨文图像预处理模型,实现对甲骨文图像干扰元素的初步判别和处理。
问题2:对甲骨文原始拓片图像进行分析,建立一个快速准确的甲骨文图像分割模型,实现对不同的甲骨文原始拓片图像进行自动单字分割,并从不同维度进行模型评估。其中附件2(Train文件夹)为已标注分割的数据集。
问题3:利用建立的甲骨文图像分割模型对附件3 (Test文件夹)中的
200张甲骨文原始拓片图像进行自动单字分割,并将分割结果放在“Test_results.xlsx”中,此文件单独上传至竞赛平台。
问题4:基于前三问对甲骨文原始拓片图像的单字分割研究,请采用合适的方法进行甲骨文原始拓片的文字识别,附件4 (Recognize文件夹)中给出了部分已标注的甲骨文字形(不限于此训练集,可自行查找其他资料,如使用外部资料需在论文中注明来源),请对测试集中的50 张甲骨文原始拓片图像进行文字自动识别,并以适当结果呈现。
B题:
1. 数据准备:
o 数据预处理:图像可能需要进行大小标准化、去噪、增强对比度等处理,以提高后续识别的准确性。
2. 文字分割:
o 分割方法选择:可以使用传统的图像处理方法如阈值分割、边缘检测等,或者使用深度学习中的卷积神经网络(CNN)来进行图像中文字的区域检测。
o 模型训练:如果选择使用机器学习方法,需要使用标注好的拓片图像训练模型,学习如何从复杂背景中分割出单个字符。
3. 文字识别:
o 识别技术选择:可以使用光学字符识别(OCR)技术,或者更高级的深度学习方法如循环神经网络(RNN)或变压器(Transformer)模型来进行字符识别。
o 模型训练和应用:同样,需要大量标注的数据来训练模型,然后用训练好的模型来识别新的拓片图像中的文字。
4. 模型优化与评估:
o 性能评估:使用如准确率、召回率和F1分数等统计指标来评估文字分割和识别的性能。
o 优化迭代:根据评估结果调整模型参数或尝试新的模型架构,以提高识别准确性。
5. 实现工具与技术:
o 编程语言:推荐使用Python,因为它在数据科学和机器学习领域有广泛的支持。
o 库和框架:可以使用OpenCV进行图像处理,TensorFlow或PyTorch进行深度学习模型的开发和训练。
接下来,我们将进行图像预处理步骤,通常包括:
1. 读取图像。
2. 转换为灰度图,以减少处理复杂度。
3. 应用阈值处理,以分离文字和背景。
4. 通过形态学操作如膨胀和腐蚀进一步优化图像。
给大家看一下目前部分结果:
OK,上述思路的文档领取、视频讲解以及后续的完整成品论文预定请点击我的下方个人卡片查看↓: