美团配送系统架构演进实践

美团配送自成立以来,业务经历了多次跨越式的发展。业务的飞速增长,对系统的整体架构和基础设施提出了越来越高的要求,同时也不断驱动着技术团队深刻理解业务、准确定位领域模型、高效支撑系统扩展。如何在业务高速增长、可用性越来越高的背景下实现系统架构的快速有效升级?如何保证复杂业务下的研发效率与质量?本文将为大家介绍美团配送的一些思考与实践。

物流行业的发展离不开商业的发展,近些年,商业的变革为物流发展创造了新的机会。电商的兴起有效带动了快递行业的飞速发展,直接造就了顺丰、四通一达这样的快递公司。而近年来O2O商业模式的兴起,尤其是外卖、生鲜等到家场景的发展促进了同城即时配送的快速发展。

与物流领域下的其他分支不同,同城即时配送具有如下特点:

行业的流程再造一般离不开两个因素:

技术方面,AI与大数据的应用逐步普及,基于人工智能可以对配送难度、ETA、骑手能力精确评估。GPS的快速发展与GIS厂商能力的不断开放,使得基于LBS的应用大大降低了开发成本。基础设施方面,得益于国家的持续投入,移动网络的质量不断提升,成本逐年下降,也间接促使智能手机几乎实现了全民覆盖。

市场方面,由于中国人口具有超大规模性的特点,人群聚集度高,外卖等到家场景在各大城市尤其是一线城市的需求持续增强。用户对于外卖的安全、时效、配送员的服装、礼貌用语等都有更高的要求。

在这两个因素的共同作用下,促成了同城即时配送行业的发展。而对于同城即时配送业务而言,履约能力与运营效率是研发团队要重点解决的两个问题:

美团配送系统架构的演进过程可以分为三个阶段:

试错阶段,需要快速探索业务模式到底是不是一个方向,这个阶段不要期望很多事情都想得很清楚,用户和市场会快速反馈结果。所以,对于技术团队而言,这个阶段最主要的能力是快。抢夺市场,唯快不破。

从系统架构角度,MVP阶段只需要做粗粒拆解,我们按照人、财、物三大领域将系统做了初步服务划分,以保证后续的业务领域都可以从这三个主领域中分离、继承。

顺便提一下当时团队的组织形式,研发团队按项目制组织,大家共同维护一套系统。当时团队中无QA岗位,由PM、RD共同保证开发质量,一天发布二十几次是常态。

进入这个阶段,业务和产品已经得到了市场的初步验证,的确找到了正确的方向。同时,业务发展增速也对研发团队的能力提出了更高的要求,因为这个阶段会有大量紧急且重要的事情涌现,且系统可用性、扩展性方面的问题会逐步凸显,如果处理不当,就会导致系统故障频发、研发效率低下等问题,使研发疲于奔命。

这个阶段从架构层面我们重点在思考三个方面的问题:

解决以上问题的整体思路为化繁为简(理清逻辑关系)、分而治之(专业的人做专业的事)、逐步演进(考虑ROI)。

在整体架构上,我们将配送系统拆解为履约系统、运营系统和主数据平台。

运营系统(图左上侧)方面,需求长期多而杂,架构设计上需要先想清楚配送的运营系统应该管什么、不应该管什么。在长期的项目开发中,我们从业务战略与组织架构出发,在明确业务战略目标和阶段策略下,梳理每个业务团队/岗位的核心职责、考核目标、组织之间的协作流程,最终整理出现阶段配送运营管理的中心为四个领域:

除了履约、运营两个系统的架构设计外,架构设计层面还有一个非常关键的问题,即履约、运营系统的边界与职责如何划分的问题。个人理解这个问题可能是O2O类业务在规模化阶段最关键的架构设计问题,如果不能有效解决将为系统的可用性、扩展性埋下巨大隐患。履约、运营两个方向的业务需求和技术职责有较大差异,且多数数据的生产都在运营系统,最核心最关键的应用在履约系统。虽然各自的领域职责是清晰的,但对于具体的需求边界上不见得简单明了。对此,我们借鉴了MDM思路,提出了主数据平台(图下侧)的概念,重点解决履约系统与运营系统的合作与边界问题。

主数据是企业信息系统中最基础的业务单位数据,对于配送而言是组织、岗位、人员、商家、用户、城市等数据。与之对应的是业务数据,例如:订单、考勤、薪资等。主数据有两个最关键的特征:

主数据管理并非一蹴而就,是伴随业务发展逐步迭代的。早期系统较简单,上游系统直接从DB中读取数据并应用。这种方案在系统逐步复杂之后,容易出现多个团队开发互相影响,不利于系统扩展,并且在可用性上有很大风险。为此我们专门成立的主数据的团队,独立拆分了主数据服务,并把所有对于数据的访问收回到服务上。在此基础上,经过不断的迭代和演进,最终我们吸收了CQRS(CommandQueryResponsibilitySegregation)和MDM(MasterDataManagement)的思想,将整个主数据平台逐步划分成四个部分:

可用性建设是一个长期项目。考虑到ROI,起步阶段重点完成事前的流程建设,即上线规范等一系列线上操作流程,这个工作在早期能够规避80%的线上故障。在流程规范跑通并证实有效之后,再逐步通过系统建设提升人效。

容灾能力建设上,首先思考的问题是系统最大的风险点是什么。从管理的角度来看,职责的“灰色地带”通常是系统质量容易出现风险的地方。因此,早期最先做的容灾处理是核心依赖、第三方依赖的降级,优先保证一旦依赖的服务、中间件出现问题,系统自身具备最基本的降级能力。

第二阶段我们提出了端到端的容灾能力。首先,我们建设了业务大盘,定义了实时监控核心业务指标(单量、在线骑手数等),通过这些指标能够快速判断系统是不是出了问题。其次,我们在核心指标上扩展了关键维度(城市、App版本、运营商等),以快速评估问题有多大影响。最后,我们通过Trace系统,将服务间的调用关系与链路级成功率可视化展现,具备了快速定位问题的根因在哪的能力。

对于一个规模快速增长的业务,系统的容量规划是一个长期命题。容量规划的关键点是评估与扩容。

评估方面,在业务发展早期我们一个架构师就能够完全掌控整个系统,采用静态评估的方式基本可以衡量系统容量。随着系统复杂度逐渐提升,我们逐步引入了Trace、中间件容量监控等工具辅助评估容量,由架构师团队定义容量评估主框架,由各团队细化评估每个子系统的容量。当业务已经变得非常复杂时,没有任何一个人或团队能够保证精确完成容量评估,这时我们启动了场景压测、引流压测、全链路压测等项目,通过流量标记+影子表+流量偏移+场景回放等手段,实现了通过线上流量按比例回放压测的能力,通过系统报告精确评估容量与瓶颈点。

扩容方面,我们分阶段依次实施了冗余备份(主从分离)、垂直拆分(拆分核心属性与非核心属性)、水平拆分(分库分表)、自动归档。

运营系统涉及一个业务运营管理的方方面面,我们在业务领域上除了明确目标、过程、运力、资金四个领域外,打造了一套运营系统集成解决方案集合。研发通过持续投入精力在平台化服务或组件的长期建设上,使每个垂直的运营系统扩展性得到保证,从而不断提升研发效率。以工作流场景为例,通过动态表单+流程平台的方式,统一各类业务流、审批流的工程实现,各类管理动作的效率与质量可量化,找到流程阻塞节点,自动化部分流程环节,通过技术手段不断降低人工成本。

业务发展不断成熟之后,业务的各类运营管理动作会趋于精细化。这个阶段,业务对于产品技术有更高要求,期望通过产品技术创新不断打造技术壁垒,保持领先优势。配送的业务特点天然对AI应用有很强的需求,大到供给调整,小到资源配置,都是AI发挥效力的主战场。对于工程层面,需要持续思考的问题是如何更好地实现AI的业务应用。为此我们重点提升了几方面的能力:

仿真平台的核心是打造“沙箱环境”,配送的服务业属性要求用户、商家、骑手深度参与服务过程,因此算法的线上试错成本极高。对于仿真平台的建设上,我们删减掉调度系统的细枝末节,粗粒度的构建了一套微型调度系统,并通过发单回放、用户、商家、骑手实体建模、骑手行为模拟等方法模拟线上场景。每次仿真会产出算法的KPI报告,实现算法效果的离线预估。

算法策略的效果,主要依赖于算法模型和特征数据的质量。为此我们围绕模型和特征,打造了一站式算法数据平台,提供从数据清洗、特征提取,模型训练、线上预测到算法效果评估的全方位数据闭环解决方案,为机器学习和深度学习算法模型在配送各个业务线落地提供支撑。

本文为美团配送技术团队的集体智慧结晶,感谢团队每一名成员的努力付出。如果你对业务分析、领域模型感兴趣,欢迎联系yinyongjun@meituan.com。

THE END
1.电商运营工作计划(通用12篇)电商运营工作计划 篇6 一、电子商务项目组织架构搭建及岗位职责(第一步) 电子商务平台团队成员是关系整个项目启动推进与后续运营的关键,需要专人构建。 1、项目负责人:整体运营。 2、网站架构管理:网站的整体构架与内容优化。 3、美工:网站的页面设计与页面的人性化互动沟通。 https://www.yuwenmi.com/fanwen/jihua/3016317.html
2.线上运营BU组织架构及职责.pdf线上运营BU组织架构及职责.pdf,萨仙舍线上运营BU组织架构及职责 一、 组织架构 运营总监 1人 运营副总监 1人 运营助理1人 活动策划2人 美工1人 商务拓展1人 数据分析1人 财务1人 网络推广1人 文案3人 视频编辑 1人 插画师 1人 团队人数共计:14人(组建初期设置5人,视业务https://max.book118.com/html/2022/0612/6203052210004155.shtm
3.企业怎么组建自己的网络运营团队?一共需要几人?5不同的企业有不同的目标和战略,因此团队规模和人员配置也会有所不同。一般来说,一个基础的网络运营团队需要有以下职位:1. 内容运营:负责规划和执行企业网站的内容,包括撰写、编辑、发布和推广。需要具备创意、写作和策划能力,以及对行业和目标受众的了解。2. 社交媒体运营:负责管理和推广企业在社交媒体平台上https://baijiahao.baidu.com/s?id=1789664777351247983&wfr=spider&for=pc
4.直播运营团队架构图与岗位职责说明书.pptx提供数据支持架构图解析直播运营团队架构图解析:对架构图中的每个要素进行详细解释,如团队成员的职责、协作关系等直播运营团队架构图:展示直播运营团队的组织结构、职责分工和协作关系直播运营团队架构图要素:包括团队名称、团队成员、职责分工、协作关系等直播运营团队架构图应用:在实际工作中如何应用架构图,如团队协作、https://m.renrendoc.com/paper/303693960.html
5.市场部组织架构图思维导图模板集团公司市场中心组织架构图参考,市场总监必备 市场部组织架构 组织架构图 企业架构 部门管理 市场运营 市场部组织结构图 作者其他创作 大纲/内容 首席战略官品牌战略方向统筹及监管 品牌总监品牌营销运营主管理 高级策划经理品牌策略规划;品牌核心项目策划;团队人员建设;品牌推广费用计划分配; 品牌策划经理品宣相关https://processon.com/view/604f2f2af346fb348a9155bb
6.如何搭建电商运营团队架构(电商运营管理干货)如何搭建电商运营团队架构(电商运营管理干货) 电商运营团队职能 运营中心主要职能 运营部职能 负责团队内部资源的由上到下的整合,计划,组织,跟进团队的运营事务,掌控全局,综合统筹,把控团队方向。 商品部职能 根据市场销售趋势,定制销售货品,预见市场流行趋势,快速准确下单订货,跟进货品到货周期,分析货品数据,注意商品的https://www.niaogebiji.com/article-125335-1.html
7.商业计划书(通用15篇)1、团队状况 启动团队由5个部门构成:技术部、运营部、市场部、客服部、公关部。 2、团队架构 技术部工作构成,基本工作内容如下: (1)技术 A、完成网上平台建设/维护; B、负责网上平台新产品和功能开发; C、负责网上平台运行管理; D、负责网站的稳定运行 https://www.ruiwen.com/gongwen/jihuashu/254003.html
8.网站运营的计划书范文(精选10篇)1、团队状况 启动团队由5个部门构成:技术部、运营部、市场部、客服部、公关部。 2、团队架构 技术部工作构成,基本工作内容如下: A、技术 完成网上平台建设/维护; 负责网上平台新产品和功能开发; 负责网上平台运行管理; 负责网站的稳定运行; B、运营部 https://www.unjs.com/fanwenku/198760.html
9.[通用]外贸创业计划书5篇为创建一个专注于XX领域的外贸企业,通过市场分析、商业模式、组织架构与团队、运营计划、财务预测以及风险评估与应对等方面的全面规划,实现企业的可持续发展。我们相信,在团队的共同努力下,本企业将成为外贸行业的佼佼者。 外贸创业计划书 篇2 随着全球化的深入发展,国际贸易日益繁荣。作为新时代的大学生,我们拥有独特https://www.qunzou.com/wend/waimaochuangyejihuashujt3m.html
10.软件平台运营部门组织架构mob64ca12e58adb的技术博客软件平台运营部门的有效组织架构,不仅能够推动软件的良好运营,还能为用户提供极致的使用体验。每个团队都扮演着不可或缺的角色,他们分别通过用户支持、数据分析、产品管理、市场营销和技术支持等多种方式,相互协作,共同确保平台的成功运营。 通过这种层次分明的组织架构,我们可以看到,软件平台的运营不仅仅是技术问题,更涉及https://blog.51cto.com/u_16213386/12157107
11.网络营销的策划方案四、团队建立 (一)组织架构 1.XXXX所生产的产品属于工业品,且所需产品的客户是企业性质或商家,那么结合以上分析情况,公司产品在电子商务领域里发展应选择B2B网络平台运营作为核心。以B2B网络运营平台为主,并根据行业及产品的分析报告选择其它网络平台进行有效推广。 https://www.oh100.com/a/202305/6744003.html
12.瘦身秘籍!银行组织如何通过创新机制变革实现“敏捷落地”(下篇)特点:组织架构上调整团队设置逻辑,但保留部门界限,更有利于敏捷的进一步推广,建立专业化的人才池,但需要对组织架构进行一定程度的梳理与重组。 3. “敏捷部落” 按照“敏捷小组”划分组织架构中的事业群组,各小组负责相关目标端到端的实施。更适合在传统架构包袱较轻、项目制运作基础较好、人才储备充足具备敏捷能力、且https://www.yicai.com/news/101147837.html
13.如何制定公司运营管理方案(精选12篇)由于目前艺人总体情况不理想,运营人员应给予艺人支持与鼓励,增加艺人的自信心,协助艺人找出问题并改正,充分激发艺人的潜力。 如何制定公司运营管理方案 2 根据公司目前市场开发情况及郑州家装市场情况,特制定以下方案。 一、市场部组织架构: 注:市场部助理职责: https://www.jy135.com/guanli/147970.html
14.公司如何提升经营管理能力如何提升经营管理发展优化组织结构可以提高工作效率、降低成本,提升公司整体运营效能。通过对组织架构进行梳理和优化,明确部门和岗位职责,避免资源浪费和重复劳动。 2.建设高效的绩效考核体系 建立科学、公平的绩效考核体系,可以激励员工努力工作、发挥潜能,提高整体经营管理水平。合理的奖惩机制也能够有效地推动员工的积极性,提高工作效率。 https://www.chanjet.com/lker/659368a5e4b0dd556e868643.html?a=mkting&c=sempzgw
15.如何理解四力中的「组织力」?腾讯智慧零售“零售企业的数字化转型,20%是技术问题,80%是管理问题”是普遍的行业共识。这对于私域业态建设也同样适用。在腾讯智慧零售四力增长模型中,“组织力”要解决的正是从顶层设计到组织架构,以及团队协同与资源整合等方面的问题。 相比于以往的线上电商、线下门店等独立渠道,私域的区别在于“线上线下一体、全渠道协同”。https://retail.tencent.com/article/detail/AP1668664961
16.全渠道零售的组织架构和部门分工有的零售老总,看到新的组织架构和角色分工描述以后,就开始对本公司的人力资源进行简单盘点。心里可能马上就产生以下两个困惑: 1、 现有的团队都是线下运营基因,角色工作经验和运营能力都不具备线上运营要求,更别说是线上线下协同运营的业务;如果做这样的转型升级,是要换掉这部分人吗? https://www.niutoushe.com/46315
17.罗戈网别说“中台”理念了,我们来看案例淘宝后来业务方向是内容化,社区化、本地服务化,因此在中台基础上,诞生了内容平台,能同时支持所有业务的内容生产、内容管控、内容的检索、内容的组织等等。 最后,玄难总结阿里电商业务中台的核心逻辑: 1、电商业务中台由一系列业务能力标准、运行机制、业务分析方法论,配置管理和执行系统以及运营服务团队构成的体系,提供http://www.logclub.com/articleInfo/ODY0OC1jNzc5ODZmMA==
18.总经理年终总结(精选21篇)为了更好地应对这些挑战,我们制定了一些新的.计划和策略。我们将加强团队协作和沟通,提高工作效率和质量。我们将改进流程和制度,优化组织架构和人员配置。我们将更好地利用技术和数据,提高决策的准确性和及时性。我们还将关注员工的职业发展和福利,提高员工满意度和忠诚度。 https://www.fwsir.com/Article/html/Article_20230224133451_2438357.html