基于机器学习的后疫情时代中国民航客运量的预测研究|bp神经网络在线学习_在线学习

从2021年的情况看，民航旅客运输量比2019年下降1/3，回升动力仍不明显。

摘要

随着我国社会经济的不断发展，人们对于日常出行的需求逐渐从安全转移到舒适，因此，中国民航业在此大背景下有了长足的进步。但是好景不长，随着近年来的新冠疫情肆虐全球，中国民航业的发展也受到了一定的冲击，再加上不久之前发生的“3.21”东航MU5735航空器飞行事故，打破了中国长达12年的安全飞行纪录，人们对于以后出行是否乘坐飞机或多或少也有了新的看法。民航客运量不仅是反映民航业运输繁忙程度的参考，也是制定运输生产计划、研究运输发展的主要指标。所以使用科学的方法进行客运量的预测，就显得尤为重要，而由于上述种种原因，对中国民航客运量的预测也更具有实际意义。

关键词：中国民航客运量；灰色模型；BP神经网络模型；机器学习；熵权法

一、绪论

（一）研究背景

伴随着近日来发生的“3.21”东航MU5735航空器飞行事故，短期内将会对我国航空业产生较大影响。首先是改变乘客的交通出行方式，至少短期来看，很多旅客都有可能选择高铁或者汽车出行。其次从2020年发生疫情以来，因为疫情的影响乘客大幅减少，航空业本来就受到了很大的重创，各大航空公司收入已经减少了很多，飞机事故会使各大航空公司更加雪上加霜。

综上所述，鉴于我国民航业近日来受到来自各方面自然以及人为因素的影响，科学合理地预测民航客运量就显得格外重要。

（二）研究意义

宏观意义：民航客运量的预测是科学合理地规划全国客运系统的重要前提。民航客运量的预测对于自身来说，能够更好地确定未来民航客运量的发展方向；同时，对于其他运输方式来说，可以分担它们客运量的压力。合理规划未来交通系统的设施，可以使中国的交通更好地顺应经济发展的趋势，对中国国民经济的正常发展起到重要影响。

微观意义：民航客运量的多少直接决定了一个航空公司的主要收益，也影响着航空公司今后的发展以及走向。预测民航客运量可以帮助各大航空公司科学的制定业绩目标，帮助其管理层有效的开展对下阶段工作的规划，使其对照自身现状找寻不足，更好地应对未来的机遇与挑战。

（三）文献综述

多年来，国内外学者纷纷对民航客运量开展了众多研究工作，成果颇丰。

1.统计建模方面：本文不仅选取了传统建模方式，而且采用了多种机器学习的建模方式进行对比，完成模型的拟合以及对民航客运量的预测，进一步提高了只考虑单一建模方式的精度。

3.政策效果方面：针对我们建立的模型，考虑了后疫情时代，疫情冲击的影响在逐渐降低，在此基础上，我们做出了对后疫情下民航客运量的预测，以及提出了对后疫情下中国民航的发展对策。

二、影响民航客运量的指标体系的构建

（一）影响民航客运量的因素

说明：目前我国运输业主要是以公路运输、铁路运输、水路运输和航空运输四种方式为主。通过收集的数据来看，每年水路运输业的客运量都维持基本保持平稳，认为对本论文的研究影响不大，所以此变量不予选取。

（二）中国民航客运量的选取

1．指标数据的选取

本文以民用航空客运量(万人)——X0为解释变量，选取了14个变现良好、具有代表性的影响因素作为被解释变量，并且通过检验认为不存在内生性。

（2）民航内部因素：从结果来看，民航内部的指标整体对民航客运量的影响都较为显著。

（3）经济因素：对于本文选取的4个宏观经济指标，除了居民交通消费价格指数不显著以外，其他三个因素均呈现显著的影响。

（4）旅游业发展状况：从旅游业来看，国内旅游总收入对民航客运量的影响最为显著。

三、实证分析

（一）中国民航年度客运量数据整理

（二）中国民航客运量的灰色模型的构建

1．灰色关联度分析

我们选取了1990年至2020年31个的民航客运量数据以及上述过程中提到的14个影响因素数据进行灰色预测，民航客运量即为参考数列，14项影响因素为比较数列。

2．灰色预测模型的建立

灰色预测是利用较小的样本，进行预测。本小节我们采用2011年到2020年一共10年的民航客运量数据，进行建模。对于灰色预测模型来说，训练集和验证集的数据个数要求一致，并且2015年是供给侧改革的实现点，对于此研究更有意义，能更好的对比供给侧改革对民航客运量的影响，所以我们采用2011-2015年的数据作为训练集样本，对模型进行建模；取2016-2020年的数据作为验证集，对上步建好的模型进行验证。

我们用2016年到2020年的数据记性模型验证，验证结果如下：

从结果上来看，当没有出现异常值的情况下，模型预测效果较好，误差可以接受；但是，当数据中出现异常值时，或者偏离趋势过多时，模型的估计误差较大。

3.GM(1,1)模型在描述单调的变化过程中变现良好，更适合对具有较强规律性的序列进行建模[14]，此次数据出现非单调的发展趋势，经过调试GM(2,1)会有更好的表现。采用python软件建立GM(2,1)的结果如下：

从此次结果来看，相比较GM(1,1)，当数据出现偏离时，该模型可以及时捕捉到变化趋势，预测误差也有所改善。所以我们认为GM(2,1)的表现更好，可以采用此模型进行预测。

（三）中国民航客运量的BP神经网络模型的构建

1．数据的收集

2．数据的准备与探索

在训练神经网络模型时，为防止模型由于数据量级的差异，在计算时出现饱和现象或造成误差过大，我们对原始数据采用了标准化处理，将所有的数据调制到0~1之间，然后再将这31年的数据分为训练数据和测试数据：1990年至2017年的28组数据作为训练数据，2018年至2020年的3组数据作为测试数据。

3．基于训练数据进行建模

我们采用经验公式[15]确定隐含层个数：

4．评估BP神经网络模型的性能

我们使用MATLAB语言基于测试数据生成预测数据，进一步评估模型的性能。

5．BP神经网络预测结果的比较

由上面两个图，可以直观的看出无论是训练集还是测试集拟合效果都比较理想。我们将利用训练好的BP神经网络模型预测的数值、相对误差、绝对误差整理为下表。通过数据直观的说明了我们的模型预测效果较好。

（四）中国民航客运量的其他机器学习模型的构建

通过传统的灰色预测模型和BP神经网络机器学习模型，我们发现当遇到趋势突变的情况，传统的模型无法很好的对未来趋势进行预测。所以，本节我们利用其他机器学习构建模型，从而对未来民航客运量做出预测。

我们采用随机森林，梯度提升树（GBDT）、CatBoost、支持向量机（SVM）四个模型，结果如下：

（五）中国民航客运量的组合模型的构建

我们将这些机器模型进行训练和验证后，利用熵权法确定他们的比重，对不同机器学习下得到的模型进行组合。

我们利用2018-2020年的数据作为验证集，模型回归情况如下：

从拟合曲线以及相对误差的结果结果上看，传统的灰色预测无法更好的对未来进行预测，机器学习表现更加良好。此外，可以看到BP-SVM组合模型，在2020年面对疫情的冲击时，可以有更好的表现，但是可能综合三年的预测效果，BP神经网络构造的单一模型会表现更好一点。

（六）不同模型的预测结果的比较

虽然从相对误差的结果来看，在2020年组合模型表现更好一些，但是从平均绝对误差（MAE）、平均相对误差（MAPE）的结果来看，BP神经网络模型的这两个指标表现都是最佳的。

（七）中国民航客运量的预测

本文计划对2021年至2027年的中国民航年度客运量进行预测。利用整理好的1990年至2020年的31各年度数据，选用BP神经网络模型计算出预测值。

我们在对模型预测的时候，做出了一定的假设：在后疫情时代，我国的经济逐渐复苏，疫情对民航客运量的冲击逐渐减少。在上述假设的基础上，由BP神经网络预测2021年的民航客运量为44201.7488万人次。我们通过进一步的数据搜集，得到2021年的民航客运量的真实值为44000万人次。对比两者，可以更加直观的看出BP神经网络模型预测的误差为0.458%。通过对比预测数据，发现BP神经网络预测模型的误差仍然是最小的，进一步验证了此模型的可靠性和有效性。

从BP神经网络预测的结果来看，相比疫情发生之前，后疫情时代的民航客运量增长率不会有那么高，但是总体趋势还是比较客观。我们预计在2024年民航客运量会再次突破50000万人次，可能在2028年便会突破60000万人次，逐步恢复到2018-2019年的水平。

四、结论与对策

（一）结论

本文通过研究得出以下结论：

（1）就灰色预测系统而言：

人均GDP、居民消费水平等宏观经济指标方面与民航客运量的灰色关联系数更大，说明宏观经济对于民航业的发展尤为重要，民航业受宏观经济环境的影响很大；对比来看，其他竞争交通方式与民航客运量的灰色关联系数较小，说明两者之间关系相对疏远，这些因素对民航客运量影响的权重不大。

对于构建好的GM(1,1)和GM(2,1)模型，我们分别计算了预测数据的相对误差。当未出现重大突发事件之时，模型预测误差可以接受，但是当到2020年，遇到疫情时，我们明显发现模型无法很好的捕捉变化趋势，导致相对误差骤然增加，预测效果很不理想。

（2）就机器学习而言：

我们通过对BP神经网络、随机森林，梯度提升树（GBDT）、CatBoost、支持向量机（SVM）这五种机器学习分别对数据进行模拟和验证，又选取BP神经网络和支持向量机通过熵权法进行加权组合，得到BP-SVM组合模型。根据绝对误差、相对误差、平均绝对误差（MAE）以及平均相对误差（MAPE）这四个指标的综合表现，选定BP神经网络模型作为最终的预测模型。

通过模型的预测，我们计算了2021-2027年的预测值，增长值以及同比增长率。从数据中我们可以看出，在后疫情之下，民航的客运量呈现着稳步增长的趋势，虽然没有疫情之前的大幅增长，但是在面对疫情的冲击之下，只要民航采取合理的措施，相信民航的发展会更加的可观。

（二）中国民航发展对策

中国民航业要在后疫情时代实现可持续发展，需要扩大内需和消费，积极主动地寻求新的发展模式。尽管受到疫情的影响，中国民航业还是展现出了一定的韧性，这不仅仅是因为中国客观上存在着巨大的消费市场，更重要的是，中国民航业采取了许多创新的营销策略。这些战略在极大程度上扩大内需的同时，也带来了市场价格下移等重大问题。疫情的缓解并不是中国民航业成功突围的关键，整个行业的彻底变革、业务结构的优化和服务成本的降低才是达成全面深化民航改革的关键，才能进一步扩大有效供给，增强充分满足潜在需求的持续发展能力。

中国民航业要在后疫情时代实现可持续发展，需要重塑增长方式，在创新和融合发展上实现突破。这就要求行业不仅要在学习他国在后疫情时代的“自救”方式基础上，创新符合自身的生产方式和融合发展模式，还要扩大与其他行业的合作交流，在政策法规和社会治理方面实现突破，从而有效提升中国民航业的全要素生产率，更好地协调“安全与发展”的关系。

THE END

基于机器学习的后疫情时代中国民航客运量的预测研究

BP神经网络的学习机制

神经网络的鲁棒性范文

学习笔记BP神经网络刘通1997

基于机器学习的后疫情时代中国民航客运量的预测研究

神经网络辅助的GPS/INS组合导航滤波算法研究AET

神经网络BP网络wu（干货分享）

医学图像处理论文15篇

《中国煤炭杂志》官方网站