作为数学建模的编程手还掌握一些各类模型常用算法,数学建模评价类模型、分类模型、预测类模型比较常用的方法总结如下:
接下来对这些比较典型的模型进行详细进行介绍说明。
一、评价模型
在数学建模中,评价模型是比较基础的模型之一,通常根据问题的特点和需求,设计合适的评价标准和指标,对不同方案或模型的性能进行评估和比较,以帮助做出决策。典型模型包括:层次分析法、模糊综合评价、熵值法、TOPSIS法、数据包络分析、秩和比法、灰色关联法。
1、层次分析法
(1)基本思想
AHP层次分析法是一种解决多目标复杂问题的定性和定量相结合进行计算决策权重的研究方法。它通过构建层次结构,将复杂的决策问题分解成多个层次,并使用专家判断和比较来确定各个因素的权重,从而得出最终决策结果。比较有效地应用于那些难以用定量方法解决的课题。
(2)分析步骤
- 第一步:构造判断矩阵;
- 第二步:计算权重;
- 第三步:一致性检验。
(3)软件操作使用SPSSAU进行层次分析法,输入判断矩阵即可:
判断矩阵解读:门票相对于景色来讲,重要性更高,所以为3分;相反,景色相对于门票来讲,则为0.33333分。交通相对于景色来更重要为2分,其余类似下去。
AHP层次分析详细说明及案例操作解读请点击查看下方帮助手册:
AHP层次分析法帮助手册
2、模糊综合评价
(1)基本思想
模糊综合评价是一种处理具有模糊信息的评价方法。在模糊综合评价中,将模糊的评价指标通过隶属度函数转化为隶属度,然后根据权重给予不同指标不同的重要性。最后,通过对隶属度进行加权求和,得到一个综合评价结果。模糊综合评价方法能够有效处理不确定性和模糊性的问题,适用于现实世界中的复杂决策。
(2)分析步骤
- 第一步:确定评价指标和评语集;
- 第二步:确定权重向量矩阵A和构造权重判断矩阵R;
- 第三步:计算权重并进行决策评价。
(3)软件操作上传数据至SPSSAU系统,分析页面右侧选择【模糊综合评价】,将变量拖拽到右侧相应的分析框中,点击“开始分析”,操作如下图:
模糊综合评价详细说明及案例操作解读请点击查看下方帮助手册
模糊综合评价帮助手册
3、熵值法
(1)基本思想
熵值法是一种客观赋权法,用于确定各个指标在综合评价中的权重。熵值是不确定性的一种度量。信息量越大,不确定性就越小,熵也就越小;信息量越小,不确定性越大,熵也越大。因而利用熵值携带的信息进行权重计算,结合各项指标的变异程度,利用信息熵这个工具,计算出各项指标的权重,为多指标综合评价提供依据。
(2)分析步骤
- 第一步:数据标准化;
- 第二步:非负平移;
- 第三步:计算权重并进行决策评价。
(3)软件操作
上传数据至SPSSAU系统,分析页面右侧选择【熵值法】,将变量拖拽到右侧相应的分析框中,点击“开始分析”,操作如下图:
熵值法详细说明及案例操作解读请点击查看下方帮助手册
熵值法帮助手册
4、TOPSIS法
(1)基本思想
TOPSIS法是一种基于距离和相似性度量的多属性决策方法。TOPSIS法首先将多个备选方案与理想解进行比较,计算每个备选方案与理想解之间的相似性和距离。然后根据计算结果,评估和排序各个备选方案,选择最佳的方案。TOPSIS法能够较好地处理多属性决策问题,特别适用于需要考虑多个评价指标的情况。
(2)分析步骤
- 第一步:准备好数据,并且进行同趋势化处理(需要研究者自行处理);
- 第二步:数据归一化处理解决量纲问题(数据处理->生成变量,通常选择‘平方和归一化’);
- 第三步:找出最优和最劣矩阵向量(SPSSAU自动处理);
- 第四步:分别计算评价对象与正理想解距离D+或负理想解距离D-;
- 第五步:结合距离值计算得出接近程序C值,并且进行排序,得出结论。
(3)SPSSAU软件操作
上传数据至SPSSAU系统,分析页面右侧选择【TOPSIS法】;将变量拖拽到右侧分析框中;点击“开始分析”,操作如下图:
TOPSIS法详细说明及案例操作解读请点击查看下方帮助手册
TOPSIS法帮助手册
5、数据包络分析
(1)基本思想
数据包络分析DEA是一种多指标投入和产出评价的研究方法。其应用数学规划模型计算比较决策单元(DMU)之间的相对效率,对评价对象做出评价。
(2)分析步骤
- 第一步:确定决策单元与评价指标;
- 第二步:DEA模型选择;
- 第三步:计算效率评价;
- 第四步:效率分析和改进。
(3)SPSSAU软件操作
将数据上传至SPSSAU系统,分析页面右侧选择【DEA】,将变量拖拽到右侧相应分析框中,选择“DEA类型”,点击“开始分析”,操作如下图:
数据包络分析DEA详细说明及案例操作解读请点击查看下方帮助手册
数据包络分析DEA帮助手册
6、秩和比法
(1)基本思想
秩和比(RSR)方法是一种基于排序的模型比较方法。其实质原理是利用了RSR值信息进行各项数学计算,RSR值介于0~1之间且连续,通常情况下,该值越大说明评价越‘优’。
(2)分析步骤
- 第一步:列出原始数据,一行代表一个评价对象,一列代表一个评价指标。最终为m*n矩阵;
- 第二步:对m*n矩阵即原始数据进行计算秩值;
- 第三步:利用Step2的秩值,计算得到RSR值和RSR值排名;
- 第四步:列出RSR的分布表格情况并且得到Probit值;
- 第五步:计算回归方程;
- 第六步:进行排序,并且进行分档等级。
(3)软件操作
上传数据至SPSSAU系统,分析页面右侧选择【秩和比】,将变量拖拽到右侧相应分析框中,选择“编制方法”、“档次数量”,点击“开始分析”,操作如下图:
秩和比详细说明及案例操作解读请点击查看下方帮助手册
秩和比帮助手册
7、灰色关联法
(1)基本思想
灰色关联分析法通过研究数据关联性大小(母序列与特征序列之间的关联程度),通过关联度(即关联性大小)进行度量数据之间的关联程度,从而辅助决策的一种研究方法。
(2)分析步骤
- 第一步:确定母序列和特征序列,且准备好数据格式;
- 第二步:针对数据进行无量纲化处理(通常情况下需要);
- 第三步:求解母序列和特征序列之间的灰色关联系数值;
- 第四步:求解关联度值;
- 第五步:对关联度值进行排序,得出结论。
(3)软件操作
将数据上传至SPSSAU系统,分析页面右侧选择【灰色关联法】;将变量拖拽到右侧相应分析框中,选择“量纲化方式”,点击“开始分析”,操作如下图:
灰色关联法详细说明及案例操作解读请点击查看下方帮助手册
灰色关联法帮助手册
二、分类模型
数学建模的分类模型是指根据已知的分类标号将输入的数据集建立分类的数据挖掘方法。分类的目标是将数据的每个个案都尽可能准确地预测到一个目标分类中。典型模型包括K-means聚类、Fisher判别分析、二元logistic回归、决策树、随机森林、神经网络分类、K近邻算法等。
1、K-means聚类
(1)基本思想
K-means算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。因为需要计算距离,所以决定了K-means算法只能处理数值型数据,而不能处理分类属性型数据。
(2)分析步骤
- 第一步:K-means算法首先需要选择K个初始化聚类中心
- 第二步:计算每个数据对象到K个初始化聚类中心的距离,将数据对象分到距离聚类中心最近的那个数据集中,当所有数据对象都划分以后,就形成了K个数据集(即K个簇)
- 第三步:接下来重新计算每个簇的数据对象的均值,将均值作为新的聚类中心
- 第四步:最后计算每个数据对象到新的K个初始化聚类中心的距离,重新划分
- 第五步:每次划分以后,都需要重新计算初始化聚类中心,一直重复这个过程,直到所有的数据对象无法更新到其他的数据集中。
(3)软件操作
将数据上传至SPSSAU系统,分析页面右侧选择【聚类】;将变量拖拽到右侧相应分析框中,点击“开始分析”,操作如下图:
添加图片注释,不超过 140 字(可选)
补充:SPSSAU在进行聚类分析时,将相应的数据类型放入右边的分析栏中,可自动识别数据进行定量or定类or混合数据的聚类分析。
- 当仅进行定量数据分析时,SPSSAU默认使用K-means聚类方法进行聚类;
- 当仅进行定类数据分析时,SPSSAU默认使用K-modes聚类方法进行聚类;
- 当进行混合型(定量+定类)数据分析时,SPSSAU将使用K-prototype聚类方法进行聚类。
聚类分析详细说明及案例操作解读请点击查看下方帮助手册
聚类分析帮助手册
2、Fisher判别分析
(1)基本思想
Fisher判别分析基本思想是通过将样本投影到一条直线上,使得同类样本间的距离尽可能小,不同类样本间的距离尽可能大,从而实现对样本的分类。
(2)软件操作
将数据上传至SPSSAU系统,分析页面右侧选择【判别分析】;将变量拖拽到右侧相应分析框中
判别分析详细说明及案例操作解读请点击查看下方帮助手册判别分析帮助手册
3、二元logistic回归
(1)基本思想
二元logistic回归分析是一种常用的分类方法,其基本思想是通过建立一个逻辑回归模型来对样本进行分类。将预测变量的线性组合转化为一个在0到1之间的概率值,然后以此概率值作为分类的依据。相对于其他分类方法,二元logistic回归分析具有模型简单、参数可解释性强等优点,在实际应用中得到了广泛的使用。
(2)分析步骤
第一步:建立二元logistic回归模型;第二步:对模型进行评估;第三步:应用模型进行分类预测。
(3)软件操作
将数据上传至SPSSAU系统,分析页面右侧选择【二元logit回归】;将变量拖拽到右侧相应分析框中,点击“开始分析”,操作如下图:
添加图片注释,不超过 140 字(可选)
二元logistic回归分析详细说明及案例操作解读请点击查看下方帮助手册
二元logistic回归分析帮助手册
4、机器学习
决策树、随机森林、神经网络、K近邻算法、朴素贝叶斯、支持向量机可归类为机器学习进行分类的这一类,有关六类典型机器学习算法可以下面这篇以往文章:
六种机器学习算法大揭秘:从决策树到神经网络,小白也能轻松掌握!
三、预测模型
1、ARIMA预测
(1)基本思想
ARIMA模型是最常见的时间序列预测分析方法,适用于平稳时间序列数据。它包括三个部分:自回归(AR)、差分(I)和移动平均(MA)。SPSSAU可以智能地找出最佳的AR模型,I即差分值和MA模型,并且最终给出最佳模型预测结果。当然,研究人员也可以自行设置自回归阶数p,差分阶数d值和移动平均阶数q,然后进行模型构建。
(2)软件操作
ARIMA预测详细说明及案例操作解读请点击查看下方帮助手册
ARIMA预测帮助手册
2、指数平滑法
(1)基本思想
指数平滑法常用于数据序列较少时使用,且一般只适用于中短期预测。对于长期趋势或复杂非线性关系的数据可能表现不佳。指数平滑可以继续拆分为一次平滑、二次平滑、三次平滑;一次平滑法为历史数据的加权预测,二次平滑法适用于具有一定线性趋势的数据,三次平滑法适用于具有一定曲线关系时使用。如果不设置平滑方法,SPSSAU将自动运行三种平滑方法,选择最优效果时对应的平滑方法。
指数平滑法中,初始值S0和平滑系数alpha是两个参数,用于确定预测模型的初始状态和对过去观察值的权重。
(2)软件操作
指数平滑法详细说明及案例操作解读请点击查看下方帮助手册:
指数平滑法帮助手册
3、灰色预测模型
(1)基本思想
灰色预测模型可针对数量非常少(比如仅4个),数据完整性和可靠性较低的数据序列进行有效预测。其利用微分方程来充分挖掘数据的本质,建模所需信息少,精度较高,运算简便,易于检验,也不用考虑分布规律或变化趋势等。但灰色预测模型一般只适用于短期数据、有一定指数增长趋势的数据进行预测,不建议进行长期预测。
(2)软件操作
灰色预测模型详细说明及案例操作解读请点击查看下方帮助手册
灰色预测模型帮助手册
4、马尔科夫预测
(1)基本思想
马尔可夫预测是一种基于马尔可夫链的预测方法。马尔可夫链是一个随机过程,具有马尔可夫性质,即未来状态的概率只取决于当前状态,与过去状态无关。马尔可夫预测利用这种性质来进行未来事件的预测。
马尔可夫预测涉及3个术语名词。
(2)软件操作
马尔可夫预测详细说明及案例操作解读请点击查看下方帮助手册
马尔科夫预测帮助手册
5、机器学习预测
机器学习是一种强大的技术,用于从数据中学习模式和规律,并利用这些知识进行预测。
有关六类机器学习算法说明,上周已经写过详细介绍,在此不再进行赘述。可点击下方文章进行学习:六种机器学习算法大揭秘:从决策树到神经网络,小白也能轻松掌握!