收稿日期:2024年1月23日;录用日期:2024年2月26日;发布日期:2024年5月9日
摘要
关键词
双十一,销售额,预测
MachineLearning-BasedSalesPredictionforTmallDoubleEleven
XinghuiPan
SchoolofEconomics,GuizhouUniversity,GuiyangGuizhou
Received:Jan.23rd,2024;accepted:Feb.26th,2024;published:May9th,2024
ABSTRACT
Inrecentyears,thedevelopmentofe-commercehasshownapositivetrend,andvariouse-commerceplatformsareorganizingdifferentpromotionalactivitiestoboostsales.Tmall’sDoubleElevenShoppingFestivalstandsoutamongnumerouspromotionaleventsduetoitssignificantdiscountsandpromotionalefforts.Thecrucialquestionishowtobetterutilizeexistingsalesdatatoseekgreaterprofits.Thisarticle,basedonTmall’sDoubleElevensalesdatafrom2009to2023,employslinearregressionmodelsandtimeseriesmodelstopredictthesalesfortheyear2024.TheforecastresultsindicatethatthesalespredictionsforTmall’sDoubleElevenin2024are3294.2billionyuanand3211.70billionyuan,respectively,usingthelinearregressionandtimeseriesmodels.Althoughtheaccuracyofthemodelsisinfluencedtoacertainextent,thesalesforTmall’sDoubleElevenstillshowanupwardtrend.PredictingthesalesforTmall’sDoubleElevenin2024notonlyprovidesacasesampleforsalesresearchbutalsoaidsbusinessesinmakinginformeddecisions,therebyimprovingprofitabilityandrationalinventorymanagement.
Keywords:DoubleEleven,Sales,Prediction
ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY4.0).
1.引言
2.文献综述
2.1.预测技术理论
2.2.预测技术应用实例
国内外的大量研究学者不仅从理论层面研究预测技术的应用原理及方法,而且还将理论联系实际,将所研究的各种预测模型运用到实际中,现如今已在很多的领域进行了预测,并对现实生活产生了有利的影响。
赵万金等人(2014)[5]通过对地震储层及含油气预测技术进行研究,指出裂缝是碳酸盐岩、火山岩中重要的油气储集空间,也是大部分非常规油气的重要储存地方,将理论模型与测井岩石物理分析进行结合的方法用于预测油气地震,同时对已有的模型进行改进进而克服了测井岩石物理直接应用带来的片面性,对非常规油气地震勘探技术的预测对现实生活具有重要的意义。
左宪章等人(2010)[6]指出对军事装备进行有效的质量监控和故障预测是技术保障中一个尤为重要的部分。他们通过集成智能故障预测技术、智能BIT、基于支持向量机的故障预测技术、智能故障预测系统、基于无线传感网络的远程分布式智能故障预测系统等方法对军事故障进行预测,对提高部队的战斗力和保障效率至关重要,同时也可以避免因不足维修而导致的事故发生。
2.3.销售预测
杨道文等人(2014)[9]通过提高预测模型的精确度的角度出发,采用了Elman神经网络对销售额进行预测分析,经过研究后,研究结果显示,基于Elman神经网络的商品销售额预测能够较好的反应商品销售额的变化趋势,且提高了预测精度,验证了该方法在商品销售额中的可行性。相比于BP神经网络,采用Elman神经网络对商品销售额建模和预测能很好地反应商品的销售额的变化趋势,并且还进一步提高了预测精度。
黄文明等人(2023)[10]在对企业的销量预测方法进行研究,在销量预测研究的过程中,加入了销售产品的图片信息,研究图片信息的特征表示方法,利用包括图片特征在内的信息进行商品销量预测,目的在于销量预测的精度,从而为企业的管理决策提供支持,降低市场的不确定性。
钱永渭[11]等人(2011)采用神经网络理论对罐装饮料自动售货机销售额的预测进行了数学建模,采用BP神经网络实现了罐装饮料自动售货机销售额的预测,并通过隐层神经元和输入层神经元个数的确定以及训练算法性能对比验证了所设计模型和方法的可行性和有效性,为罐装饮料自动售货机的管理工作提供了一种新的方法。
2.4.简单评述
3.1.数据预处理
数据预处理是将数据库中的数据进行简化,除去那些重复的数据,并运用一定的手段对数据进行处理,从而可以直接转化为我们需要的数据,是一种将所收集到的重复数据、残缺数据、错误数据等按照统计学的方法进行剔除或者修正的过程。
3.1.1.缺失值的处理
对于所收集到的数据,总是会出现某一部分数据的缺失,这时我们就需要对缺失的数据进行处理。对于从数据源中取得的缺失值,可以利用该列的平均值、最大值、最小值、中位数或更为复杂的概念估计值等来填补缺失值,从而可以达到清理的目的。
3.1.2.重复值的处理
在数据库中属性相同的数据称为重复记录,此种情况可以将相同的两个数据或者两个变量合并为一条记录。
3.1.3.错误值处理
有些时候,我们所收集到的数据并不正确,可能会存在一些错误的数据,这时,我们就需要对这些错误值进行处理。可以运用所学的统计理论知识对这些异常值进行判断,可以通过偏差分析来看其偏度和峰度、描述性统计来看分位数和方差分析来看波动大小来识别数据的分布图或者回归方程的值。
3.2.模型概况
3.2.1.线性回归模型
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量之间相互依懒的定量关系的一种统计分析方法。在线性回归中,数据使用线性预测函数来建模,并且这些未知的模型参数是通过数据来估计的[12]。
一般来说,线性回归模型都可以通过最小二乘法求出其方程,从而可以得到待估参数,可以根据解释变量的值来预测目标变量。它的一般形式为:
公式的矩阵形式为:
如果X是满秩矩阵,则可以用最小二乘法计算回归系数,公式为:
计算出回归系数之后,就得到了模型的参数,下一步就可以进行建模预测。
3.2.3.支持向量机回归模型
支持向量机(supportvectormachine,简称SVM)是一种基于统计学习理论的新型学习机,是由前苏联教授Vapnik最早提出的,与传统的学习方法不同,支持向量机是结构风险最小化方法的近似实现。这是一类按监督学习方式对数据进行二元分类的广义线性分类器,在应用分类和回归分析中表现优异,特别是应用于样本数量小,非线性以及高维度的场景中。
支持向量机实现的思想是:通过某种事先选择的非线性映射将输入向量X映射到一个高维特征空间Z,在这个空间中构造最优分类超平面,从而使正例和反例样本之间的分离界限达到最大。从概念上说,支持向量是那些离决策平面最近的数据点,它们决定了最优分类超平面的位置。通常上来说,支持向量机的思想是建立在两个数学运算上:一是输入向量到高维特征空间的非线性映射,特征空间对输入和输出都是隐藏的;二是构造一个最优超平面用于分离在上一步中发现的特征[15]。
4.预测模型实证分析
4.1.实验环境
借助pyhton作为程序运行平台,并导入pyhton的分析数据库pandas、numpy,图形化工具matplotlib,作为数据导入、矩阵变换处理以及图形化显示的工具,利用sklearn库作为机器学习模型训练的算法库,对2024年天猫双十一的销售额进行预测。
4.3.模型构建
4.3.1.线性回归模型
Figure1.Linearregressionmodelprediction
Table1.Predictedvaluesofdifferentmodelsinlinearregression
Figure2.TimeserieschartofTmall’sdoubleelevensalesrevenue
Figure3.AutocorrelationplotofTmall’sdoubleelevensalesrevenue
Figure4.PartialautocorrelationplotofTmall’sdoubleelevensalesrevenue
Table2.ForecastresultsoftheARIMAmodel
4.4.影响因素分析
就2009~2023年的销售额数据来看,销售额呈现出逐年递增的态势,并且就模型预测的未来三年数值来看,预测值亦是呈现增加的倾向。这主要源于不断增大的网购群体、陆续加强的促销力度、方便快捷的物流体系。
在网购群体上,科技和互联网的普及推动了网购群体的扩大。消费者越来越青睐网购的便捷性,可随时访问商品,实现高效购物。智能手机和网络速度的提升提供了流畅的购物体验,电子支付的安全性也增加了信心。不断增大的网购群体反映了数字化时代的生活方式变革,未来将继续受益于科技和社会的发展。
在物流体系上,随着发展完善的运输网络和仓储设施,包括航空、铁路、公路、海运等多种运输方式,以及现代化的仓储设施,先进的信息技术支持通过物流管理软件和智能设备,实现商品实时跟踪和管理,提高效率。灵活的配送服务如快递和同城配送,满足消费者对快速送达的需求,提升购物体验。这种物流体系不仅加速商品流通、降低成本,还提高库存周转率,减少积压,降低经营风险。总体而言,方便快捷的物流体系是现代商业运作的基础,对提升消费者体验和企业竞争力至关重要。
4.5.发展趋势分析
随着互联网的飞速发展,人们购物的选择逐渐增多,就现如今的电商规模及购物群体的消费心理来看,未来双十一销售主要有以下三个发展趋势。
直播带货成为未来发展趋势。随着网络科技的不断发展,直播带货已成为未来商业发展的重要趋势。通过实时直播形式,商品展示更生动,消费者互动更密切,购买过程更直观。直播带货打破了传统零售模式的局限,使商品销售更具个性化和情感化,同时提高了销售转化率和用户粘性。
理性消费成为大趋势。在信息时代,消费者对产品和服务的选择更加理性和谨慎。理性消费强调价值观念、品质和实用性,而非盲目追求。消费者更注重产品的性价比、品牌背后的价值观、产品的环保性和社会责任等方面。这一趋势推动了企业提高产品质量、加强品牌建设和社会责任,形成了可持续发展的商业模式。
电商流量在分散。随着电商市场竞争的加剧,电商平台的流量已不再集中于少数头部平台,而是逐渐分散到多个垂直领域。这种分散的趋势使得更多的小型和中小型电商平台有机会崭露头角,提高了市场竞争度,促进了市场多元化和创新发展。同时,对于电商企业来说,拓展多渠道、多平台的销售渠道成为发展的必然选择。