基于机器学习的后疫情时代中国民航客运量的预测研究

从2021年的情况看,民航旅客运输量比2019年下降1/3,回升动力仍不明显。

摘要

随着我国社会经济的不断发展,人们对于日常出行的需求逐渐从安全转移到舒适,因此,中国民航业在此大背景下有了长足的进步。但是好景不长,随着近年来的新冠疫情肆虐全球,中国民航业的发展也受到了一定的冲击,再加上不久之前发生的“3.21”东航MU5735航空器飞行事故,打破了中国长达12年的安全飞行纪录,人们对于以后出行是否乘坐飞机或多或少也有了新的看法。民航客运量不仅是反映民航业运输繁忙程度的参考,也是制定运输生产计划、研究运输发展的主要指标。所以使用科学的方法进行客运量的预测,就显得尤为重要,而由于上述种种原因,对中国民航客运量的预测也更具有实际意义。

关键词:中国民航客运量;灰色模型;BP神经网络模型;机器学习;熵权法

一、绪论

(一)研究背景

伴随着近日来发生的“3.21”东航MU5735航空器飞行事故,短期内将会对我国航空业产生较大影响。首先是改变乘客的交通出行方式,至少短期来看,很多旅客都有可能选择高铁或者汽车出行。其次从2020年发生疫情以来,因为疫情的影响乘客大幅减少,航空业本来就受到了很大的重创,各大航空公司收入已经减少了很多,飞机事故会使各大航空公司更加雪上加霜。

综上所述,鉴于我国民航业近日来受到来自各方面自然以及人为因素的影响,科学合理地预测民航客运量就显得格外重要。

(二)研究意义

宏观意义:民航客运量的预测是科学合理地规划全国客运系统的重要前提。民航客运量的预测对于自身来说,能够更好地确定未来民航客运量的发展方向;同时,对于其他运输方式来说,可以分担它们客运量的压力。合理规划未来交通系统的设施,可以使中国的交通更好地顺应经济发展的趋势,对中国国民经济的正常发展起到重要影响。

微观意义:民航客运量的多少直接决定了一个航空公司的主要收益,也影响着航空公司今后的发展以及走向。预测民航客运量可以帮助各大航空公司科学的制定业绩目标,帮助其管理层有效的开展对下阶段工作的规划,使其对照自身现状找寻不足,更好地应对未来的机遇与挑战。

(三)文献综述

多年来,国内外学者纷纷对民航客运量开展了众多研究工作,成果颇丰。

1.统计建模方面:本文不仅选取了传统建模方式,而且采用了多种机器学习的建模方式进行对比,完成模型的拟合以及对民航客运量的预测,进一步提高了只考虑单一建模方式的精度。

3.政策效果方面:针对我们建立的模型,考虑了后疫情时代,疫情冲击的影响在逐渐降低,在此基础上,我们做出了对后疫情下民航客运量的预测,以及提出了对后疫情下中国民航的发展对策。

二、影响民航客运量的指标体系的构建

(一)影响民航客运量的因素

说明:目前我国运输业主要是以公路运输、铁路运输、水路运输和航空运输四种方式为主。通过收集的数据来看,每年水路运输业的客运量都维持基本保持平稳,认为对本论文的研究影响不大,所以此变量不予选取。

(二)中国民航客运量的选取

1.指标数据的选取

本文以民用航空客运量(万人)——X0为解释变量,选取了14个变现良好、具有代表性的影响因素作为被解释变量,并且通过检验认为不存在内生性。

(2)民航内部因素:从结果来看,民航内部的指标整体对民航客运量的影响都较为显著。

(3)经济因素:对于本文选取的4个宏观经济指标,除了居民交通消费价格指数不显著以外,其他三个因素均呈现显著的影响。

(4)旅游业发展状况:从旅游业来看,国内旅游总收入对民航客运量的影响最为显著。

三、实证分析

(一)中国民航年度客运量数据整理

(二)中国民航客运量的灰色模型的构建

1.灰色关联度分析

我们选取了1990年至2020年31个的民航客运量数据以及上述过程中提到的14个影响因素数据进行灰色预测,民航客运量即为参考数列,14项影响因素为比较数列。

2.灰色预测模型的建立

灰色预测是利用较小的样本,进行预测。本小节我们采用2011年到2020年一共10年的民航客运量数据,进行建模。对于灰色预测模型来说,训练集和验证集的数据个数要求一致,并且2015年是供给侧改革的实现点,对于此研究更有意义,能更好的对比供给侧改革对民航客运量的影响,所以我们采用2011-2015年的数据作为训练集样本,对模型进行建模;取2016-2020年的数据作为验证集,对上步建好的模型进行验证。

我们用2016年到2020年的数据记性模型验证,验证结果如下:

从结果上来看,当没有出现异常值的情况下,模型预测效果较好,误差可以接受;但是,当数据中出现异常值时,或者偏离趋势过多时,模型的估计误差较大。

3.GM(1,1)模型在描述单调的变化过程中变现良好,更适合对具有较强规律性的序列进行建模[14],此次数据出现非单调的发展趋势,经过调试GM(2,1)会有更好的表现。采用python软件建立GM(2,1)的结果如下:

从此次结果来看,相比较GM(1,1),当数据出现偏离时,该模型可以及时捕捉到变化趋势,预测误差也有所改善。所以我们认为GM(2,1)的表现更好,可以采用此模型进行预测。

(三)中国民航客运量的BP神经网络模型的构建

1.数据的收集

2.数据的准备与探索

在训练神经网络模型时,为防止模型由于数据量级的差异,在计算时出现饱和现象或造成误差过大,我们对原始数据采用了标准化处理,将所有的数据调制到0~1之间,然后再将这31年的数据分为训练数据和测试数据:1990年至2017年的28组数据作为训练数据,2018年至2020年的3组数据作为测试数据。

3.基于训练数据进行建模

我们采用经验公式[15]确定隐含层个数:

4.评估BP神经网络模型的性能

我们使用MATLAB语言基于测试数据生成预测数据,进一步评估模型的性能。

5.BP神经网络预测结果的比较

由上面两个图,可以直观的看出无论是训练集还是测试集拟合效果都比较理想。我们将利用训练好的BP神经网络模型预测的数值、相对误差、绝对误差整理为下表。通过数据直观的说明了我们的模型预测效果较好。

(四)中国民航客运量的其他机器学习模型的构建

通过传统的灰色预测模型和BP神经网络机器学习模型,我们发现当遇到趋势突变的情况,传统的模型无法很好的对未来趋势进行预测。所以,本节我们利用其他机器学习构建模型,从而对未来民航客运量做出预测。

我们采用随机森林,梯度提升树(GBDT)、CatBoost、支持向量机(SVM)四个模型,结果如下:

(五)中国民航客运量的组合模型的构建

我们将这些机器模型进行训练和验证后,利用熵权法确定他们的比重,对不同机器学习下得到的模型进行组合。

我们利用2018-2020年的数据作为验证集,模型回归情况如下:

从拟合曲线以及相对误差的结果结果上看,传统的灰色预测无法更好的对未来进行预测,机器学习表现更加良好。此外,可以看到BP-SVM组合模型,在2020年面对疫情的冲击时,可以有更好的表现,但是可能综合三年的预测效果,BP神经网络构造的单一模型会表现更好一点。

(六)不同模型的预测结果的比较

虽然从相对误差的结果来看,在2020年组合模型表现更好一些,但是从平均绝对误差(MAE)、平均相对误差(MAPE)的结果来看,BP神经网络模型的这两个指标表现都是最佳的。

(七)中国民航客运量的预测

本文计划对2021年至2027年的中国民航年度客运量进行预测。利用整理好的1990年至2020年的31各年度数据,选用BP神经网络模型计算出预测值。

我们在对模型预测的时候,做出了一定的假设:在后疫情时代,我国的经济逐渐复苏,疫情对民航客运量的冲击逐渐减少。在上述假设的基础上,由BP神经网络预测2021年的民航客运量为44201.7488万人次。我们通过进一步的数据搜集,得到2021年的民航客运量的真实值为44000万人次。对比两者,可以更加直观的看出BP神经网络模型预测的误差为0.458%。通过对比预测数据,发现BP神经网络预测模型的误差仍然是最小的,进一步验证了此模型的可靠性和有效性。

从BP神经网络预测的结果来看,相比疫情发生之前,后疫情时代的民航客运量增长率不会有那么高,但是总体趋势还是比较客观。我们预计在2024年民航客运量会再次突破50000万人次,可能在2028年便会突破60000万人次,逐步恢复到2018-2019年的水平。

四、结论与对策

(一)结论

本文通过研究得出以下结论:

(1)就灰色预测系统而言:

人均GDP、居民消费水平等宏观经济指标方面与民航客运量的灰色关联系数更大,说明宏观经济对于民航业的发展尤为重要,民航业受宏观经济环境的影响很大;对比来看,其他竞争交通方式与民航客运量的灰色关联系数较小,说明两者之间关系相对疏远,这些因素对民航客运量影响的权重不大。

对于构建好的GM(1,1)和GM(2,1)模型,我们分别计算了预测数据的相对误差。当未出现重大突发事件之时,模型预测误差可以接受,但是当到2020年,遇到疫情时,我们明显发现模型无法很好的捕捉变化趋势,导致相对误差骤然增加,预测效果很不理想。

(2)就机器学习而言:

我们通过对BP神经网络、随机森林,梯度提升树(GBDT)、CatBoost、支持向量机(SVM)这五种机器学习分别对数据进行模拟和验证,又选取BP神经网络和支持向量机通过熵权法进行加权组合,得到BP-SVM组合模型。根据绝对误差、相对误差、平均绝对误差(MAE)以及平均相对误差(MAPE)这四个指标的综合表现,选定BP神经网络模型作为最终的预测模型。

通过模型的预测,我们计算了2021-2027年的预测值,增长值以及同比增长率。从数据中我们可以看出,在后疫情之下,民航的客运量呈现着稳步增长的趋势,虽然没有疫情之前的大幅增长,但是在面对疫情的冲击之下,只要民航采取合理的措施,相信民航的发展会更加的可观。

(二)中国民航发展对策

中国民航业要在后疫情时代实现可持续发展,需要扩大内需和消费,积极主动地寻求新的发展模式。尽管受到疫情的影响,中国民航业还是展现出了一定的韧性,这不仅仅是因为中国客观上存在着巨大的消费市场,更重要的是,中国民航业采取了许多创新的营销策略。这些战略在极大程度上扩大内需的同时,也带来了市场价格下移等重大问题。疫情的缓解并不是中国民航业成功突围的关键,整个行业的彻底变革、业务结构的优化和服务成本的降低才是达成全面深化民航改革的关键,才能进一步扩大有效供给,增强充分满足潜在需求的持续发展能力。

中国民航业要在后疫情时代实现可持续发展,需要重塑增长方式,在创新和融合发展上实现突破。这就要求行业不仅要在学习他国在后疫情时代的“自救”方式基础上,创新符合自身的生产方式和融合发展模式,还要扩大与其他行业的合作交流,在政策法规和社会治理方面实现突破,从而有效提升中国民航业的全要素生产率,更好地协调“安全与发展”的关系。

THE END
1.BP神经网络入门实践:使用Python实现BP神经网络简介:BP神经网络,即反向传播神经网络,是一种用于监督学习的典型人工神经网络模型。本压缩包包含了一个基于Python的简单BP神经网络实现,为初学者提供了一个理解神经网络基本原理和编程技能的平台。该实现涵盖关键概念如激活函数、损失函数、梯度下降法以及反向传播算法。学生可以通过实践了解网络结构定义、权重初始化、前向https://blog.csdn.net/weixin_42509507/article/details/142975625
2.神经网络学习之BP神经网络腾讯云开发者社区神经网络学习 之 BP神经网络 大家好,又见面了,我是你们的朋友全栈君。 上一次我们讲了M-P模型,它实际上就是对单个神经元的一种建模,还不足以模拟人脑神经系统的功能。由这些人工神经元构建出来的网络,才能够具有学习、联想、记忆和模式识别的能力。BP网络就是一种简单的人工神经网络。 本文具体来介绍一下一种https://cloud.tencent.com/developer/article/2091134
3.在线网课学习课堂《神经网络理论及应用(北工商)》单元测试考核在线网课学习课堂《神经网络理论及应用(北工商)》单元测试考核答案.docx,注:不含主观题 第1题 判断题 (1分) 人工神经元是一个多输入、多输出的信息处理单元 第2题 判断题 (1分) 人工神经元数学模型决定该节点本身的信息处理能力 第3题 单选题 (1分) 人工神经网络的激活函数https://max.book118.com/html/2022/0429/8132040142004075.shtm
4.机器学习.周志华《5神经网络》2> 确定神经网络参数,常用算法为BP算法。 足够多的隐含层神经元的RBF可以以任意精度逼近任意连续函数。 自适应谐振理论(ART)网络 ART(Adaptive Resonance Theory)自适应谐振理论网络是竞争型学习的重要代表,无监督学习策略,该网络由比较层、识别层、识别层阈值和重置模块构成。ART比较好的缓解了竞争型学习中的“可塑性http://681314.com/A/gxXXJnNdP3
5.bp神经网络shap模型bp神经网络模型应用1、神经网络BP模型 一、BP模型概述 误差逆传播(Error Back-Propagation)神经网络模型简称为BP(Back-Propagation)网络模型。 Pall Werbas博士于1974年在他的博士论文中提出了误差逆传播学习算法。完整提出并被广泛接受误差逆传播学习算法的是以Rumelhart和McCelland为首的科学家小组。他们在1986年出版“Parallel Distributedhttps://blog.51cto.com/u_16213711/8114595
6.简单易学的机器学习算法—神经网络之BP神经网络在知道了BP神经网络的特点后,我们需要依据信号的前向传播和误差的反向传播来构建整个网络。 1、网络的初始化 假设输入层的节点个数为n,隐含层的节点个数为 ,输出层的节点个数为m。输入层到隐含层的权重,隐含层到输出层的权重为wjk,输入层到隐含层的偏置为aj,隐含层到输出层的偏置为bk。学习速率为 https://www.cda.cn/view/20626.html
7.深入理解BP神经网络对神经网络进行训练,我们应该尽量将net的值尽量控制在收敛比较快的范围内。 四、揭秘有监督的BP神经网络学习过程: 流程图 初始化和样本随机选取 计算隐含层相关数据 误差计算1 误差计算2 反向传播1 反向传播2 全局误差和迭代 五、BP算法直观解释 情况1 https://www.jianshu.com/p/6ab6f53874f7
8.深度学习之美BP算法双向传,链式求导最缠绵(入门系列之八8.1 BP神经网络极简史 在神经网络(甚至深度学习)参数训练中,BP(Back Propagation)算法非常重要,它都占据举足轻重的地位。在提及BP算法时,我们常将它与杰弗里?辛顿(Geoffrey Hinton)的名字联系在一起。但实际上,辛顿还真不是第一个提出BP算法的人,就像爱迪生不是第一个发明电灯的人一样。但人们记住的,永远都是https://maimai.cn/article/detail?fid=1606544098&efid=DO6xH595x1H7XbUijSEk8w
9.基于数值模拟和机器学习的汽车碰撞代理模型采用机器学习算法建立代理模型,可以大幅度提高计算效率。目前尚未见到采用代理模型预测汽车碰撞过程的碰撞力-位移关系的报道。笔者以某型皮卡车为对象,建立整车三维有限元模型,模拟汽车对刚性墙碰撞和两车相向对撞的动态过程,得到碰撞力-位移曲线,并基于BP神经网络和数值模拟结果建立代理模型。采用碰撞代理模型,可以快速得到http://qks.cqu.edu.cn/html/cqdxzrcn/2021/2/20210209.htm