案例丨中国移动一级业务支撑系统网状网PaaS之路

这些系统都是做为独立项目单独建设的。然而,近几年随着大数据、云计算、容器化、微服务、平台战略等新技术和新概念的层出不穷和快速发展,在业务支撑、架构能力、平台扩展性等方面对旧有的烟囱式建设的业务支撑系统提出了巨大的挑战。

企业在IT平台的建设、开发和维护的过程中,经常会被以下问题所困扰:开发环境管理复杂,开发、测试、生产环境无法进行有效隔离,无法实现自动化的安装部署和应用维护,业务的环境和配置依赖问题常常会给系统迁移带来很大的麻烦;X86化加大了系统的运维压力,日常升级部署工作繁杂巨大,开发/测试/运维人员之间相互抱怨。

特别是随着移动X86化推进,资源数量急速膨胀。怎样实现资源集中有效管理,资源动态灵活调配,提高对资源的可监控可管理能力对现有系统构架提出了挑战。

另一方面,随着移动融合业务发展,尤其是互联网业务的发展,对系统水平弹性动态扩展、业务连续性保障、故障迅速恢复提出高要求。因此,企业迫切需要引入新的技术和管理方式来应对云计算时代所带来的变革,旧有的平台技术架构亟待升级,开发管理流程亟待优化。

做为一级业务支撑中心,怎么实现所有系统的统一资源分配和调度,怎么实现原有烟囱系统的资源共享,怎么实现开发/测试/生产部署的有效分离,怎么实现整个X86集群的统一监控是支撑中心亟待解决的问题。针对以上问题,中国移动业务支撑系统部业务支撑中心(以下简称业务支撑中心)在2015年开始了PAAS平台的摸索,希望通过试点积累PAAS平台的建设和运维经验,为未来建设一级系统PAAS平台打下基础。

网状网做为整个一级业务支撑系统的核心系统,是中国移动内外部信息传输交换、服务管控、数据处理、业务支撑、运营开放为一体的综合信息交换枢纽,是连接中国移动集团、31个省公司、各一级业务平台、服务公司、合作伙伴等内外部各应用系统,并对外提供服务的桥梁,是中国移动的企业数字神经网络。目前承载200多个平台的接入,支撑业务达到2000多个,包含金融,客服,业务订购,互联网等各类的业务。峰值业务量目前达到10亿笔/每天,每月结算金额在60多亿。

系统承载业务具有容量大,实时性强,波动剧烈,增长迅速,重要性强,客户影响大,无状态业务居多等特点。非常适合做PAAS平台的试点。

业务支撑中心和网状网项目技术团队经过大量的研讨,创新的提出了APU(ApplicationProcessUnit)的概念,把资源和应用有效的结合在一起,解决未来的系统的发展和管理瓶颈,并申请了专利。而且通过深入的技术研究和实践探索,在Docker基础上通过增强接口和管理功能,实现了APU概念的落地。结合Kunbernet做为集群管理平台,搭建了能够承载网状网系统的PAAS平台试点。实现了整个平台的容器化改造和集群的部署,管理和监控。

目前适用于容器集群管理和大规模部署的,并且得到大规模生产验证的开源产品有:Kubernetes、ApacheMesos。这两个平台各有特点:

2015年,谷歌公布多年以来的容器集群方面的秘密:Google早些年构建了一个管理系统,它可以用来管理集群、容器、网络以及命名系统。第一个版本被称为Brog,后续版本称为Omega。目前每秒会启动大约7000个容器,每周可能会超过20亿个容器。利用在容器技术上的实践经验和技术积累,Google构建了Kubernetes(简写K8s)。

Kubernetes是一个全新的基于容器技术的分布式架构的集群管理解决方案,Kubernetes具有完备的集群管理能力,包括多层次的安全防护和准入机制、多租户应用支撑能力、透明的服务注册和服务发现机制、内建智能负载均衡器、强大的故障发现和自我修复能力、服务滚动升级和在线扩容能力、可扩展的资源自动调度机制,以及多粒度的资源配额管理能力。

目前Kubernetes生态环境热度很高,发展很快。

Mesos最早由美国加州大学伯克利分校AMPLab实验室开发,Mesos是分布式系统内核,它可以将不同的机器整合在一个逻辑计算机上面。当你拥有很多的物理资源并想构建一个巨大的静态的计算集群的时候,Mesos就派上用场了。有很多的现代化可扩展性的数据处理应用都可以在Mesos上运行,包括Hadoop、Kafka、Spark等,同时你可以通过容器技术将所有的数据处理应都运行在一个基础的资源池中。

如果你拥有已经存在的多个工作任务(Hadoop、Spark、Kafka等),那Mesos提供了一个将不同工作任务相互交错的框架。

在技术选型中我们最终选择以KubernetesDocker为基础的搭建PAAS平台方案。其优点是已经过Google十多年的生产验证,成熟度高,支持裸机、VM等混合部署,适合多种应用场景,Kubernetes可以用最快的、最简单的、最轻量级的方式来解决目前存在的问题,并帮助进行面向集群的开发。而且很多厂商已经开始支持Kubernetes,例如微软、IBM、RedHat、CoreOS、MesoSphere、VMWare等。社区的热度很高,功能也在快速的增强中。

在PAAS平台稳定之后,逐步开始考虑一级业务支撑系统的DCOS平台的建设,整合Mesos和Kubernetes,构建一个稳定性强,支持复杂业务场景,强大弹性扩展能力的电信行业DCOSPaas平台,为未来的业务快速发展打下坚实的基础。

本方案规划以网状网为先行实践范例,尽可能考虑其通用性和普适性,根据业务特点,对业务类型和架构模型进行抽象,归类出典型的应用场景和架构模型进行方案设计,为其他系统的快速迁移提供参考和最佳实践。

PAAS平台建议架构视图如下图所示:

承载网状网系统的PAAS平台总体技术架构如下:

Ku8Manager可视化管理平台负责安装,部署,监控,运维,分析。

Kubernetes集群由两类节点组成,Master和Node。Master上运行etcd、APIServer、ControllerManager和Scheduler四个组件,后三个组件构成了Kubernetes的总控中心,负责对集群中所有资源进行管控和调度。Node上运行Kubelet、Proxy和DockerDaemon三个组件,负责对本节点上的Pod的生命周期进行管理。

以开源技术Docker、Kubernetes为核心引擎,在其基础上自主开发了Ku8Manager可视化管理控制台,Ku8Manager可视化管理平台提供简便的一键式自动化安装、部署配置、基于容器、应用、服务、资源等不同视角的综合监控、系统管理和安全管理。PAAS的功能框架如下图所示:

针对电信行业的特点,我们对Kubernetes做了很多的功能改造和增强,以适用于大规模的生产部署和管理。

【1】高可用多数据中心之间的服务动态扩展

场景一:多集群的统一服务部署:由Kubernetes管理平台自动化部署模块统一对各数据中心进行服务自动化安装部署。可以定义同一个服务在不同数据中心的Kubernetes集群统一部署,并且可以定义在每个cluster部署服务的容器实例的比例。比如按6:4的比例在clusterA和ClusterB上部署服务。

场景二:灰度升级:由Kubernetes管理平台自动化部署模块统一对各数据中心自动化进行服务升级。可以实现先在一部分集群部署新版本,稳定之后再平滑升级全部的节点。

场景三:动态集群间业务调整:业务高峰期当一个数据中心容量不足时,由Kubernetes管理平台自动进行服务动态扩展,启动容灾数据中心的部分服务来支撑业务。

场景四:业务高可用:当主数据中心发生故障(如网络故障)时,由Kubernetes管理平台自动进行容灾切换,由容灾数据中心自动接管所有业务服务。实现高可用的数据中心。

【2】集群的Master节点高可用

缺省的Kubernetes集群只有一个master节点,当Master节点崩溃的时候将会造成整个集群无法管理,因此在生产中我们实现了三节点的高可用master集群,保证了整个集群的高可用:

【3】网络方案的改造

标准KubernetesDocker的组网方案是通过软负载均衡flannel。该类型方案会带来30%以上的网络性能损耗,在高吞吐量的应用中不可接受。因此对标准方案做了如下的改造提升系统性能::

【4】先进的DockerIMAGE全生命周期管理

对DockerIMAGE进行统一管理,提供DockerIMAGE的参考模型和流程指导,DockerIMAGE模板规划、设计、生成及Pod生成的管理流程如下图所示:

【5】先进的持续集成和灰度发布全过程管理

持续集成可以让团队在持续集成的基础上收到反馈并加以改进,不必等到开发的后期才寻找和修复缺陷。通过持续集成工具Jenkins,持续、自动地构建/测试软件项目,监控定时执行的任务。实现持续集成和灰度发布的全过程管理,核心工作流程如下:

【6】Ku8Manager可视化管理平台提供一键式自动化安装、部署和配置功能

集群自动化安装主界面如下图所示,可以几分钟完成几十台机器的集群安装:

【7】应用视角的服务部署发布

在Kubernetes集群中,以Service、Pod、容器的分级视图进行综合管理。新Node加入非常简单,通过相应的参数调整,即可在秒级实现容量的动态调整,如下图所示:

【8】基于基于服务的的立体化综合监控

传统的网管系统,因为一台机器上部署很多应用和实例,所以很难把资源的占用和业务有效匹配起来。但是实现容器化改造之后,每个业务的容器占用的资源能一目了然的看出来,有效的解决了对业务-》资源占用的有效监控。

分两种视图:

1)主机视图:从设备的角度,查看总体上主机CPU、内存的占用情况,保证每台主机是可用的:

2)服务视图:从业务的角度,查看每个业务的Docker容器对CPU、内存关键性能指标,从而能很轻松的看出每个业务对总体资源的占用情况。监控指标如下图所示:

中国移动一级业务支撑系统PAAS平台所承载的网状网系统应用集群包括移动总部和31省公司,网状网四期之后由1200台X86服务器组成的多个集群,分布在全国。中国移动网状网应用集群架构如下图所示:

THE END
1.中国移动通信集团重庆有限公司全业务支撑中心中国移动通信集团重庆有限公司全业务支撑中心的最新招投标信息;中国移动通信集团重庆有限公司全业务支撑中心发布最全相关的招标信息;采招网为各级政府采购、招标代理机构、招标企业、供应商提供强大的专业招标采购信息查询和相关服务!https://www.bidcenter.com.cn/newssearchyz-76059508.html
2.中国移动通信集团湖北有限公司业务支撑中心本招标项目为(项目名称:中国移动湖北公司***年无线运维工作台项目,招标编号: HBYD***),招标人为 中国移动通信集团湖北有限公司,招标代理机构为 中捷通信有限公司 。项目资金由招标人自筹,资金已落实。项目已具备招标条件,现进行公开(中国移动通信集团湖北有限公司业务支撑中心在正文中 ) https://www.qianlima.com/common/agents_info.jsp?id=21044295
3.中国移动实习报告范文(通用8篇)我于20xx年7月27日进入中国移动通信集团新疆股份有限公司石河子市分公司实习,我分配到政企客户部信息化中心实习,至今已经两个月时间。在这两个月里我主要负责违章通、行业手机报、集团彩铃等集团产品,并学习office办公及公文写作,学习路由配置、网络维护等,了解MAS服务器。在师傅的带领和指导下很快就熟悉了基本业务,在https://www.yjbys.com/shixi/shixibaogaofanwen/1070612.html
4.记荣获'全国五一劳动奖状'的中国移动四川公司业务支撑中心cqvip:“五一”国际劳动节前夕。中国移动通信集团四川有限公司业务支撑中心计费组的员工们。激动地迎回了“全国五一劳动奖状”。在这个金光闪闪的奖牌背后,凝结https://www.zhangqiaokeyan.com/academic-journal-cn_communication-information-technology_thesis/0201275649081.html
5.中国移动公布“一先两优”表彰名单澎湃号·政务澎湃新闻15. 辽宁公司政企业务发展中心党总支 16. 辽宁公司中国移动位置服务中心系统支撑部党支部 17. 吉林公司吉林市永吉分公司党支部 18. 吉林公司延边州珲春分公司党支部 19. 黑龙江公司齐齐哈尔龙江分公司党支部 20. 黑龙江公司黑河爱辉分公司党支部 21. 上海公司西区分公司市场部党支部 https://www.thepaper.cn/newsDetail_forward_8068906
6.中国移动信息技术中心中国移动信息技术中心 为顺应中国移动IT领域改革要求,中国移动整合原集团公司业务支撑系统部、中国移动(深圳)有限公司、南方基地IT支撑中心、政企公司M域等建设团队,于2018年1月设立“中国移动信息技术中心”。负责统筹管理全网IT工作,并承担集中化IT系统的运营和支撑。 https://it.10086.cn/aboutus/profile/
7.中国移动业务运营支撑发展规划中国移动业务运营支撑 发展规划 中国移动通信集团公司 业务支撑系统部 提纲 业务运营支撑的定位 从计费业务中心到业务支撑系统部 IT支撑的演进 业务运营支撑的规律探究 从IT成长历史看IT整合 通信网研发与运营研发的差异 IT支撑的价值 09年业务支撑环境分析 计费业务中心的定位 计费业务中心的主要职责是满足业务部门的需https://doc.mbalib.com/view/3e2096e9b47f8b296185cb2d485b6c02.html
8.中国移动业务支撑系统简介(BOSSBASSBOMC4A及VGOP)转载自 笨鸟博客 业务支撑系统(Business Support Systems,简称BSS)主要应用于通信行业,通过该系统对用户执行相应业务操作。它采用省中心/全国中心两级https://www.jianshu.com/p/9db1d5f5923c
9.中国移动通信有限公司F5本工程中国移动通信有限公司F5-1全网集客业务运营支撑运营中心等12项装饰装修工程已由中国移动通信有限公司以信息港中心立项批复[2022]30号批准建设,招标人为中国移动通信有限公司,建设资金来自国有企业单位自筹资金(中央),出资比例为100%。本工程已具备招标条件,现对该工程的监理与相关服务进行公开招标。 https://ggzyfw.beijing.gov.cn/jyxxggjtbyqs/20221223/3805850.html
10.中国移动深圳公司校园招聘最新信息在中国移动支撑网的优化更新中,深圳公司测评中心发挥了不可替代的作用。 支撑网监控中心:支撑网监控中心以“提升中国移动业务支撑网运营质量”为目标,秉承“集中监控、协助调度、优化共享”的理念,建立了涵盖客户感知、业务应用、系统平台的全方位监控体系,为中国移动31省业务支撑提供专业化监控服务,有效推进业务支撑网https://xiaoyuan.zhaopin.com/Company/CC000119796
11.中国移动一级业务支撑系统网状网PaaS之路资源为了既支撑业务创新,又保证现有的生产安全运行,中国移动集团公司启动了B-BOSS试点工程的建设:在选定的试点省份建设独立的商业客户支撑系统(Business & Operation Support System for Business Customer,简称B-BOSS),将现有的BOSS系统定位为零售客户支撑系统(Business & Operation Support System for Retail Customer,简称R-https://download.csdn.net/download/weixin_38650951/15471910
12.中国移动商业客户业务运营支撑系统(B中国移动商业客户业务运营支撑系统(B-BOSS)业务框架.docx,中国移动商业客户业务运营支撑系统(B-BOSS) 业务框架 与传统的BO 所效劳支撑的零售客户市场相比,商业客户市场在客户数量,产品和效劳种类,定价策略,计费和客服要求和分销模式方面都有很大不同。为了适应商业客户https://m.book118.com/html/2023/0625/7056033055005125.shtm
13.华为携手中国移动亮相2015年世界移动通信大会[西班牙,巴塞罗那,2015年3月6日] 华为今日宣布,在巴塞罗那举办的2015年世界移动通信大会期间,携手中国移动以及多家产业阵营重要合作伙伴全面展示4G端到端商用解决方案,以及4G演进、5G创新领域的解决方案与关键技术。 华为全面支撑中国移动展台4G亮点业务展示 https://www.huawei.com/cn/news/2015/03/hw_416067
14.中国移动设计院:基于大数据的人工智能运维服务支撑方案为了优化网络运维的工作模式,提升网络运维准确性及效率性,提出集中维护支撑服务项目,基于人工智能(Artificial Intelligence)的运维解决方案旨在强调实现以维护为中心,依托大数据挖掘技术与深度学习算法, 实现问题早发现,由被动处理问题改为积极预防问题,从而提高整体资源的利用率和维护效率。 https://www.51cto.com/article/608979.html