1、距离聚类(系统聚类)(常用,需掌握)
优点
①将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类
②是一种探索性的分析方法,分类结果不一定相同
例如:主要用于样本数据的初步处理
缺点
(1)用户需要先指定K,但到底指定K为多少是不知道的。
(2)对初值敏感。不同的初始化中心很容易导致不同的聚类结果。
(3)对于孤立点数据敏感。
2、关联性聚类(常用,需掌握)
3、层次聚类,密度聚类(DBSCAN)
6、贝叶斯判别(统计判别方法,需掌握)
7、费舍尔判别(训练的样本比较多,需掌握)
8、模糊识别(分好类的数据点比较少)
预测模型
1、灰色预测模型(必须掌握)
2、微分方程预测(高大上、备用)
要求:
①无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据的关系。
②微分方程关系较为复杂,微分方程的解比较难以得到,如果数学功底不是很好的一般不会选择使用。
③由于方程的建立是以局部规律的独立性假定为基础,当作为长期预测时,误差较大
3、回归分析预测(必须掌握)
4、马尔科夫预测(备用)
要求
1、一个序列之间没有信息的传递,前后没联系,数据与数据之间随机性强,相互不影响;(今天的温度与昨天、后台没有直接联系)
2、不仅要能够指出事件发生的各种可能结果,而且还必须给出每一种结果出现的概率(预测后天温度高、中、低的概率,只能得到概率)
3、一般计算状态转移概率,状态为定类(“畅销”、“一般”、“滞销”)
丰收预测,天气预报
与马尔科夫链预测互补,至少有2个点需要信息的传递,AR模型、MA模型ARMA模型,周期模型,季节模型等
6、小波分析预测(高大上)
7、神经网络预测(备用)
大量的数据,不需要模型,只需要输入和输出,黑箱处理,建议作为检验的办法
评价模型
1、模糊综合评判(经常用,需掌握)
评价一个对象优良中差等层次评价,评价一个学校等,不能排序
2、主成分分析(数据降维)(经常用,需掌握)
特点:
①将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法
②主成分保留了原始变量绝大多数信息
③主成分的个数大大少于原始变量的数目
⑤每个主成分都是原始变量的线性组合
例如:找出某个事件的前几个主要影响因素
评价多个对象的水平并排序,指标间关联性很强
3、层次分析法(AHP)(经常用,需掌握)
特点:①层次权重决策分析②较少的定量信息③多目标、多准则或无结构特性④适用于难以完全定量的复杂系统例如:做出某种决策需要考虑多方面的因素做决策,去哪旅游,通过指标,综合考虑做决策
4、多属性决策
特点:①利用已有的决策信息②对一组(有限个)备选方案进行排序或择优③属性权重和属性值为参考值例如:投资决策、项目评估、维修服务、武器系统性能评定、工厂选址、投标招标、产业部门发展排序和经济效益综合评价等
5、秩和比综合评价法(经常用,需掌握)
评价各个对象并排序,指标间关联性不强
6、优劣解距离法(TOPSIS法)
7、投影寻踪综合评价法
揉合多种算法,比如遗传算法、最优化理论等
8、方差分析、协方差分析等(经常用,需掌握)
方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的产量有无影响,差异量的多少;(1992年,作物生长的施肥效果问题)
协方差分析:有几个因素,我们只考虑一个因素对问题的影响,忽略其他因素,但注意初始数据的量纲及初始情况。(2006年,艾滋病疗法的评价及预测问题)
优化模型
线性规划
特点:①用于辅助人们进行科学管理②求线性目标函数在线性约束条件下的最大值或最小值③三要素:决策变量、约束条件、目标函数例如:工厂分配资源生产使得利润最大化
非线性规划
整数规划
动态规划
多目标规划
遗传算法
直接对结构对象进行操作,不存在求导和函数连续性的限定;
具有内在的隐并行性和更好的全局寻优能力;
采用概率化的寻优方法,不需要确定的规则就能自动获取和指导优化的搜索空间,自适应地调整搜索方向。
全局搜索能力差,容易受参数的影响
模拟退火算法
优点是能很好的处理约束,
能很好的跳出局部最优,最终得到全局最优解,
全局搜索能力强;
关联与因果模型
1、灰色关联分析方法(样本点的个数比较少)
特点:①少量的、不完全的信息②用于对未来的预测③能够处理不确定量,使之量化,并寻求系统的运动规律例如:在社会、经济、科学技术等诸多领域进行测、决策、评估、规划控制、系统分析与建模
6、标准化回归分析
若干自变量,一个因变量,问哪一个自变量与因变量关系比较紧密
2024年第九届数维杯竞赛报名正式开启
该竞赛已成为数学建模行业内仅次于国赛和美赛后的又一项全国性数模竞赛,已被众多高校列为国家级二类竞赛,在国内高校中是作为国赛大型热身、保研、综合测评、创新奖学金等评定竞赛之一。