基于机器学习的天猫双十一销售预测MachineLearning

收稿日期:2024年1月23日;录用日期:2024年2月26日;发布日期:2024年5月9日

摘要

关键词

双十一,销售额,预测

MachineLearning-BasedSalesPredictionforTmallDoubleEleven

XinghuiPan

SchoolofEconomics,GuizhouUniversity,GuiyangGuizhou

Received:Jan.23rd,2024;accepted:Feb.26th,2024;published:May9th,2024

ABSTRACT

Inrecentyears,thedevelopmentofe-commercehasshownapositivetrend,andvariouse-commerceplatformsareorganizingdifferentpromotionalactivitiestoboostsales.Tmall’sDoubleElevenShoppingFestivalstandsoutamongnumerouspromotionaleventsduetoitssignificantdiscountsandpromotionalefforts.Thecrucialquestionishowtobetterutilizeexistingsalesdatatoseekgreaterprofits.Thisarticle,basedonTmall’sDoubleElevensalesdatafrom2009to2023,employslinearregressionmodelsandtimeseriesmodelstopredictthesalesfortheyear2024.TheforecastresultsindicatethatthesalespredictionsforTmall’sDoubleElevenin2024are3294.2billionyuanand3211.70billionyuan,respectively,usingthelinearregressionandtimeseriesmodels.Althoughtheaccuracyofthemodelsisinfluencedtoacertainextent,thesalesforTmall’sDoubleElevenstillshowanupwardtrend.PredictingthesalesforTmall’sDoubleElevenin2024notonlyprovidesacasesampleforsalesresearchbutalsoaidsbusinessesinmakinginformeddecisions,therebyimprovingprofitabilityandrationalinventorymanagement.

Keywords:DoubleEleven,Sales,Prediction

ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY4.0).

1.引言

2.文献综述

2.1.预测技术理论

2.2.预测技术应用实例

国内外的大量研究学者不仅从理论层面研究预测技术的应用原理及方法,而且还将理论联系实际,将所研究的各种预测模型运用到实际中,现如今已在很多的领域进行了预测,并对现实生活产生了有利的影响。

赵万金等人(2014)[5]通过对地震储层及含油气预测技术进行研究,指出裂缝是碳酸盐岩、火山岩中重要的油气储集空间,也是大部分非常规油气的重要储存地方,将理论模型与测井岩石物理分析进行结合的方法用于预测油气地震,同时对已有的模型进行改进进而克服了测井岩石物理直接应用带来的片面性,对非常规油气地震勘探技术的预测对现实生活具有重要的意义。

左宪章等人(2010)[6]指出对军事装备进行有效的质量监控和故障预测是技术保障中一个尤为重要的部分。他们通过集成智能故障预测技术、智能BIT、基于支持向量机的故障预测技术、智能故障预测系统、基于无线传感网络的远程分布式智能故障预测系统等方法对军事故障进行预测,对提高部队的战斗力和保障效率至关重要,同时也可以避免因不足维修而导致的事故发生。

2.3.销售预测

杨道文等人(2014)[9]通过提高预测模型的精确度的角度出发,采用了Elman神经网络对销售额进行预测分析,经过研究后,研究结果显示,基于Elman神经网络的商品销售额预测能够较好的反应商品销售额的变化趋势,且提高了预测精度,验证了该方法在商品销售额中的可行性。相比于BP神经网络,采用Elman神经网络对商品销售额建模和预测能很好地反应商品的销售额的变化趋势,并且还进一步提高了预测精度。

黄文明等人(2023)[10]在对企业的销量预测方法进行研究,在销量预测研究的过程中,加入了销售产品的图片信息,研究图片信息的特征表示方法,利用包括图片特征在内的信息进行商品销量预测,目的在于销量预测的精度,从而为企业的管理决策提供支持,降低市场的不确定性。

钱永渭[11]等人(2011)采用神经网络理论对罐装饮料自动售货机销售额的预测进行了数学建模,采用BP神经网络实现了罐装饮料自动售货机销售额的预测,并通过隐层神经元和输入层神经元个数的确定以及训练算法性能对比验证了所设计模型和方法的可行性和有效性,为罐装饮料自动售货机的管理工作提供了一种新的方法。

2.4.简单评述

3.1.数据预处理

数据预处理是将数据库中的数据进行简化,除去那些重复的数据,并运用一定的手段对数据进行处理,从而可以直接转化为我们需要的数据,是一种将所收集到的重复数据、残缺数据、错误数据等按照统计学的方法进行剔除或者修正的过程。

3.1.1.缺失值的处理

对于所收集到的数据,总是会出现某一部分数据的缺失,这时我们就需要对缺失的数据进行处理。对于从数据源中取得的缺失值,可以利用该列的平均值、最大值、最小值、中位数或更为复杂的概念估计值等来填补缺失值,从而可以达到清理的目的。

3.1.2.重复值的处理

在数据库中属性相同的数据称为重复记录,此种情况可以将相同的两个数据或者两个变量合并为一条记录。

3.1.3.错误值处理

有些时候,我们所收集到的数据并不正确,可能会存在一些错误的数据,这时,我们就需要对这些错误值进行处理。可以运用所学的统计理论知识对这些异常值进行判断,可以通过偏差分析来看其偏度和峰度、描述性统计来看分位数和方差分析来看波动大小来识别数据的分布图或者回归方程的值。

3.2.模型概况

3.2.1.线性回归模型

线性回归是利用数理统计中回归分析,来确定两种或两种以上变量之间相互依懒的定量关系的一种统计分析方法。在线性回归中,数据使用线性预测函数来建模,并且这些未知的模型参数是通过数据来估计的[12]。

一般来说,线性回归模型都可以通过最小二乘法求出其方程,从而可以得到待估参数,可以根据解释变量的值来预测目标变量。它的一般形式为:

公式的矩阵形式为:

如果X是满秩矩阵,则可以用最小二乘法计算回归系数,公式为:

计算出回归系数之后,就得到了模型的参数,下一步就可以进行建模预测。

3.2.3.支持向量机回归模型

支持向量机(supportvectormachine,简称SVM)是一种基于统计学习理论的新型学习机,是由前苏联教授Vapnik最早提出的,与传统的学习方法不同,支持向量机是结构风险最小化方法的近似实现。这是一类按监督学习方式对数据进行二元分类的广义线性分类器,在应用分类和回归分析中表现优异,特别是应用于样本数量小,非线性以及高维度的场景中。

支持向量机实现的思想是:通过某种事先选择的非线性映射将输入向量X映射到一个高维特征空间Z,在这个空间中构造最优分类超平面,从而使正例和反例样本之间的分离界限达到最大。从概念上说,支持向量是那些离决策平面最近的数据点,它们决定了最优分类超平面的位置。通常上来说,支持向量机的思想是建立在两个数学运算上:一是输入向量到高维特征空间的非线性映射,特征空间对输入和输出都是隐藏的;二是构造一个最优超平面用于分离在上一步中发现的特征[15]。

4.预测模型实证分析

4.1.实验环境

借助pyhton作为程序运行平台,并导入pyhton的分析数据库pandas、numpy,图形化工具matplotlib,作为数据导入、矩阵变换处理以及图形化显示的工具,利用sklearn库作为机器学习模型训练的算法库,对2024年天猫双十一的销售额进行预测。

4.3.模型构建

4.3.1.线性回归模型

Figure1.Linearregressionmodelprediction

Table1.Predictedvaluesofdifferentmodelsinlinearregression

Figure2.TimeserieschartofTmall’sdoubleelevensalesrevenue

Figure3.AutocorrelationplotofTmall’sdoubleelevensalesrevenue

Figure4.PartialautocorrelationplotofTmall’sdoubleelevensalesrevenue

Table2.ForecastresultsoftheARIMAmodel

4.4.影响因素分析

就2009~2023年的销售额数据来看,销售额呈现出逐年递增的态势,并且就模型预测的未来三年数值来看,预测值亦是呈现增加的倾向。这主要源于不断增大的网购群体、陆续加强的促销力度、方便快捷的物流体系。

在网购群体上,科技和互联网的普及推动了网购群体的扩大。消费者越来越青睐网购的便捷性,可随时访问商品,实现高效购物。智能手机和网络速度的提升提供了流畅的购物体验,电子支付的安全性也增加了信心。不断增大的网购群体反映了数字化时代的生活方式变革,未来将继续受益于科技和社会的发展。

在物流体系上,随着发展完善的运输网络和仓储设施,包括航空、铁路、公路、海运等多种运输方式,以及现代化的仓储设施,先进的信息技术支持通过物流管理软件和智能设备,实现商品实时跟踪和管理,提高效率。灵活的配送服务如快递和同城配送,满足消费者对快速送达的需求,提升购物体验。这种物流体系不仅加速商品流通、降低成本,还提高库存周转率,减少积压,降低经营风险。总体而言,方便快捷的物流体系是现代商业运作的基础,对提升消费者体验和企业竞争力至关重要。

4.5.发展趋势分析

随着互联网的飞速发展,人们购物的选择逐渐增多,就现如今的电商规模及购物群体的消费心理来看,未来双十一销售主要有以下三个发展趋势。

直播带货成为未来发展趋势。随着网络科技的不断发展,直播带货已成为未来商业发展的重要趋势。通过实时直播形式,商品展示更生动,消费者互动更密切,购买过程更直观。直播带货打破了传统零售模式的局限,使商品销售更具个性化和情感化,同时提高了销售转化率和用户粘性。

理性消费成为大趋势。在信息时代,消费者对产品和服务的选择更加理性和谨慎。理性消费强调价值观念、品质和实用性,而非盲目追求。消费者更注重产品的性价比、品牌背后的价值观、产品的环保性和社会责任等方面。这一趋势推动了企业提高产品质量、加强品牌建设和社会责任,形成了可持续发展的商业模式。

电商流量在分散。随着电商市场竞争的加剧,电商平台的流量已不再集中于少数头部平台,而是逐渐分散到多个垂直领域。这种分散的趋势使得更多的小型和中小型电商平台有机会崭露头角,提高了市场竞争度,促进了市场多元化和创新发展。同时,对于电商企业来说,拓展多渠道、多平台的销售渠道成为发展的必然选择。

THE END
1.FinetunedLanguageModelsAreZeroShotLearners预训练设置:pretrained on a collection of web documents (including those with computer code), dialog data, and Wikipedia, tokenized into 2.49T BPE tokens with a 32k vocabulary using the SentencePiece library. Around 10% of the pretraining data was non-English. https://zhuanlan.zhihu.com/p/618629129
2.T*姓名: *工号: *电话号码: *部门: 无锡工厂 T-Learning 平台是在哪里搭建的 SAP ORACLE TEAMS APP 无锡工厂 T-Learning 平台请来的首位培训师是? 张老师 李老师 徐老师 冯老师 2020世界经历了哪些黑天鹅事件?【多选题】 新冠疫情 澳I洲山火 非洲蝗灾 https://www.wjx.cn/vj/mPgticX.aspx
3.2024中国企业服务最新的软件行业名单库(0514)人称T客E-learning学习平台 网易云课堂、云学堂、即刻学堂、网龙多学、魔学院、新风向、知学云、时代光华、云朵课堂、睿泰集团、企学宝、学友科技 电商系统 微盟软件、同徽软件、万里牛、聚水潭、管易云 采购系统 云徙科技、用友软件、商越、同徽软件、企企通 B2B供应链系统 https://www.shangyexinzhi.com/article/19528843.html
4.石嘴山市第七小学英语课程社区T: Today we will learn M7U1 I don’t believe it! 2. Text learning (1)T: Today is Daming’s birthday,his grandma gives him a present. Do you want to know something about the present? Ss:… Look, lisren and answer ◇ What is the present?---A DVD. (领学DVD) ◇https://kcsq.nxeduyun.com/index.php?r=teach/achievement/info&sid=810362&id=52977
5.CAR-- CD-19 和 BCMA靶点的新一代CAR-T疗法 在血液系统恶性肿瘤和多发性骨髓瘤中的临床研究及开发进展 新药研发合作及人工智能创新: -- 促进来源于中国的高质量研发创新, 开放式创新模式,加速新药研发策略及新药研发外部合作新模式 -- 人工智能,深度学习与机器学习平台结合新药研发,临床开发及医疗产业的应用与合作创https://www.bio-equip.com/news.asp?ID=453079318
6.东北大学主页平台宋克臣中文主页MultiRGB-T Saliency Detection via Low-rank Tensor Learning and Unified Collaborative Ranking [J]. IEEE Signal Processing Letters, 2020, 27,1585-1589. (paper) (code and datasets) IFFNet A novel information flow fusion network (IFFNet) method is proposed for the RGB-T cross-modal images. The http://faculty.neu.edu.cn/songkechen/zh_CN/zdylm/395574/list/index.htm
7.AWS云服务亲自聆听 AWS 专家和思想领袖对生成式人工智能数据、云运维、网络和内容分发、Amazon Q 企业版以及迁移和现代化等重要主题的深入探讨。 了解所有会议 re:Invent 博客 查看re:Invent 2024 的更多热门公告 机器学习 隆重推出 Amazon SageMaker HyperPod 配方 http://aws.amazon.com/
8.日本最高设计奖GOODDESIGNAWARD2021百件获奖作品精彩出炉70、教育设施 梅光学院大学The Learning Station CROSSLIGHT 获奖公司/组织:Baiko Gakuin 77、冰淇淋 yuttari vanilla 获奖公司/组织:LOTTE.CO.,LTD 颠覆常识的不易融化的冰淇淋。在供应或享用作为旅游产业、公共教育、食品及农业文化的重要平台,创建了一个慢食社区,推广传统饮食文化,支持当地产品https://www.digitaling.com/articles/621312.html
9.elearning平台系统专家新为软件新为是e-learning平台解决方案领导品牌,15年专注,6000多家企事业单位和140多所高校成功案例,是国内专业的学习平台、考试系统和移动学习平台提供商,提供在线学习系统,在线考试系统、企业网络学院、移动学习平台、培训会议系统和培训管理系统等e-learning产品。http://www.newv.com.cn/
10.温县智慧教育云平台Boy: You did really well on the last English test, didn’t you, Meiping? Meiping: Yeah, I did OK. Boy: Well, how did you study for it? Meiping: By making words cards. Boy: Maybe I’ll try that. So, how do you study for a test, Peter? https://www.wxeduyun.cn/index.php?r=space/person/blog/view&sid=561ebac570bc48f9b257562b1d45ae3f&id=3144
11.deeplearning.ainotebook + data + solutions and video link it's impossible to upload 3 big files, yolo.h5, ResNet50.h5, imagenet-vgg-verydeep-19.mat, download from link: https://pan.baidu.com/s/1ggaDEV5 password:o7rb Repo forked form github: https://github.com/robbertliu/deeplearning.ai-andrewhttps://gitee.com/Mei_HW/deeplearning.ai-andrew-ng
12.www.edx.org/Submit your search query SearchSubmit your search query Take online courses from260+ world-class universities and companies You set the goal. We'll mark the path. Career progress isn't always linear. So when your industry evolves or your plans change, edX is the education destination that workhttps://www.edx.org/
13.learningthingsIn addition, we alwayskeeplearningnewthingsandwe have acquired rich experience in development of mobile OA (Office Automation), AR (Augmented Reality), somatic game (motion[] hydom.cn hydom.cn 近年来我们在棋牌游戏、3D益智游戏、AR现实增强、体感平台、移动办公系统方面积累了丰富而成熟的经验, 深http://cn.linguee.com/%E8%8B%B1%E8%AF%AD-%E4%B8%AD%E6%96%87/%E7%BF%BB%E8%AD%AF/learning+things.html
14.核心用户不是K12群体,而是面向成年人的非学历职业技能培训平台tj-learning学习服务X tj-promotion促销服务X tj-media媒资服务√ tj-data数据服务O tj-remark评价服务X **3.1.**企业开发模式 Git私服git.tianji.comtjxt/12332110880 Jenkins持续集成jenkins.tianji.comroot/12318080 RabbitMQmq.tianji.comtjxt/12332115672 https://github.com/small-xiexu/tjxt/
15.腾讯云面向高校专业建设提供的一站式教学练训平台 集成腾讯热门产品技术 采取微服务架构,具备高灵活性和扩展性,底层集成云服务器、人工智能API、TI-ONE、微搭、腾讯云BI、raydata等10余款热门产品和技术,持续提升学员创新实践能力。 基于企业案例实训课程 拥有丰富的实训项目案例,案例来自智慧工业、教育、医疗、金融、智能制造等https://tlearning.cloud.tencent.com/
16.企业培训系统elearning企业在线学习平台企业培训方案问鼎云学习,企业在线学习一站式服务商,提供企业在线培训平台系统搭建、e-learning平台建设、企业内训系统开发,企业在线学习平台运营等服务,支持企业培训管理、员工在线学习、企业培训考试,组织知识共享,助力企业打造专属线上培训学习平台系统。https://www.wdxuexi.com/
17.TUV南德知识服务线上课程TüV南德知识服务线上学习平台是现代和面向未来的先进培训方式。传统培训内容与新技术的结合,能帮助您提高专业培训和职业继续教育中的学习灵活性和效率。数字化的学习方式能使课中准备及培训后的跟进更加容易,从而助您实现更持久、有效的学习成果。 线上课程 https://www.tuvsud.cn/zh-cn/services/training/cn/e-learning
18.基于一致性的半监督语义分割方法:刷新多项SOTA,还有更好泛化性2). Ablation Learnings. 我们使用 VOC 数据集中 1/8 的 ratio 来进行消融实验。原本的 MT 我们依照之前的工作使用了 MSE 的 loss 方式。可以看到, conf-CE 带来了接近 3 个点的巨大提升。在这之后, T-VAT (teacher-based virtual adversarial training)使 student 模型的一致性学习更有效率, 它对两个架构https://www.thepaper.cn/newsDetail_forward_19379122
19.gzoftju/gzoft202308011423431:精选了千余项目,包括机器学习对未标注样本进行低熵预测,并与标注样本混合进行TMix。MixText可以挖掘句子之间的隐式关系,并在学习标注样本的同时利用无标注样本的信息。超越预训练模型和其他半监督方法 beyondguo/label_confusion_learning 利用标签之间的混淆关系,提升文本分类效果。利用标签信息时能够充分考虑标签之间的重叠或者依赖关系。 AIRobotZhanghttps://openi.pcl.ac.cn/gzoftju/gzoft202308011423431
20.CyberC2024(IEEETCCC)征稿:第16届网络分布式计算与知识发现国际会议主办方:IEEE计算机协会计算机通信技术委员会(TCCC) (https://cs-tccc.org/) 网站:www.Cyberc.org 出版方:IEEE (EI & Explore) 截止日期:2024年6月1日 提交途径: EDAS平台在线提交:https://edas.info/N32344 发送至邮箱:Papers@cyberc.org并在题目中标明"CyberC 2024 Submission". https://www.eet-china.com/mp/a314105.html
21.解析DeepMind采用双Q学习(DoubleQ注意到在 argmax 中行动的选择仍旧取决于在线的权重θ_t。这表示,如同 Q-学习中那样,我们仍然会根据当前值来估计贪心策略的值。然而,我们使用了第二个权重集合θ'_t来公平地衡量这个策略的值。第二个权重的集合可以对称式地通过交换θ和θ'的更新。https://www.jianshu.com/p/193ca0106aa5
22.imagebasedonchannelattentionandtransferlearning式中:β1=0.9,β2=0.999,gt=▽θft(θ)代表随机目标函数ft(θ)关于θ的梯度,t是当前时间,t-1代表前一时刻。m^t和n^t分别是对mt、nt的修正,m^t=mt1?β1t,n^t=nt1?β2t,用来实现无偏估计; β1和β2为矩估计指数的衰减速率,θ是模型参数,η是步长,权值θt的更新公式为 θt+1=θt?ηnhttps://www.oejournal.org/article/doi/10.12086/oee.2021.200045
23.T/AHAI012T/AHAI 012-2024发布 2024年发布单位 中国团体标准当前最新T/AHAI 012-2024 适用范围 本文件界定了面向终身学习的个性化学习与测评系统的术语和定义、缩略语,并规定了系统框架、设计要求和非功能性要求。本文件适用于面向终身学习的个性化学习与测评系统(以下简称“系统”)的设计。Thttps://www.antpedia.com/standard/1991201760.html