ofo容器pass架构分享云原生运维社区

1.1我们先来了解一下paas到底是什么?

PaaS是Platform-as-a-Service的缩写,意思是平台即服务,首先,在了解Paas之前需要知道什么是云计算,云计算是指基于互联网网络,通过虚拟化(xenOpenStack)统一管理和调度计算,国内厂商如:阿里云/aws/ucloud/等等目前云计算三大类:

1.基础设施即服务(IaaS)2.平台即服务(PaaS)3.软件即服务(SaaS)

1.2企业为什么需要一个PaaS?

平台即服务(PaaS)PaaS提供应用服务引擎,将软件研发测试和运维的平台作为一种服务提供,应用程序接口,开发人员基于这些服务构建业务应用。从运维和开发角度来说,这意味着无需运维搭建环境,开发也不会因为不同平台兼容性方面遇到困扰。

2.1平台简介

2.2Dashboard

2.3应用服务

2.4定时任务

2.5配置中心

2.6CI/CD

2.7资源审计监控

2.8高级功能

我们team在高并发业务场景下做了哪些优化

选择比较适合的实例规格或机器型号.云服务器需支持多队列网卡

3.2系统层面优化

操作系统优化:支持大并发,单集群2000节点K8s&容器层面优化:支持大并发,基础镜像制作优化等等Principle:最小权限,优先跑满容器资源限制docker宿主目录直接跑在默认/var/lib/docker下长期跑下来会导致系统盘异常。导致down机等。因此我们做了一下调整,自定义镜像(lvm)增加可扩展性

3.3内核参优化docker进程异常Dead状态atcentos7.4*增加fs.may_detach_mounts

总结:我们做了大量业务压测,以及云平台slb、ecsidc机器做了大量的性能调优,对业务的优化,配合开发同学做了大量的debug才使得我们业务能在容器稳定的运行

在某某天一个凌晨4点,突然接到短信报警,此时大家都在深睡,早上八点起床后发现收到了两条报警,一条是磁盘80%的告警,一条是磁盘恢复的报警,我们可以想象一下哈,如果你业务部署到了服务器,将会发生什么,4-8点完全可以吧机器磁盘空间写满,导致业务异常。机器oom为什么容器会自动恢复呢。原因和简单,kubernetes自带有异常的pod自动驱逐,当磁盘空间大于百分之80他会判定这个pod是有问题的。

解释:本地磁盘是一个BestEffort资源,kubelet会在DiskPressure的情况下,kubelet会按照QoS进行评估。如果Kubelet判定缺乏inode资源,就会通过驱逐最低QoS的Pod的方式来回收inodes。如果kubelet判定缺乏磁盘空间,就会通过在相同QoS的Pods中,选择消耗最多磁盘空间的Pod进行驱逐。

4.1要说到kubernetes,就一定要聊聊etcd,他存储了于整个kubernetes的信息

etcd是一个高可用的键值存储系统,主要用于共享配置和服务发现。etcd是由CoreOS开发并维护的,灵感来自于ZooKeeper和Doozer,它使用Go语言编写,并通过Raft一致性算法处理日志复制以保证强一致性。etcd可以用于配置共享和服务发现。

4.2etcd主要分为四个部分:

HTTPServer:用于处理用户发送的API请求以及其他etcd节点的同步与心跳信息请求

Store:存储,用于处理etcd支持的各类功能的事务,包括数据索引,节点状态变更,事件处理与执行等。它是etcd对用于提供的大多数API功能的具体实现

Raft:Raft强一致算法的具体实现,是etcd的核心

WAL:WriteAheadLog(日志先行),WAL是一种实现事务日志的标准方法。etcd通过WAL进行持久化存储,所有的数据在提交之前都会事先记录日志a.Snapshot:防止数据过多而进行的状态快照b.Entry:存储的具体的日志内容

4.3etcd中的术语:

4.4Raft状态机

Raft集群中的每个节点都处于一种基于角色的状态机中。具体来说,Raft定义了节点的三种角色:Follower、Candidate和Leader。

这三种角色状态之间的转换,如下图:

一个Raft集群包含若干个服务器节点;通常是5个,这允许整个系统容忍2个节点的失效。在任何时刻,每一个服务器节点都处于这三个状态之一:领导人、跟随者或者候选人。在通常情况下,系统中只有一个领导人并且其他的节点全部都是跟随者。跟随者都是被动的:他们不会发送任何请求,只是简单的响应来自领导者或者候选人的请求。领导人处理所有的客户端请求(如果一个客户端和跟随者联系,那么跟随者会把请求重定向给领导人)

每次成功选举,新的Leader的Term(任届)值都会比之前的Leader增加1。当集群中由于网络或者其他原因出现分裂后又重新合并的时候,集群中可能会出现多于一个的Leader节点。此时,Term值更高的节点才会成为真正的Leader。

4.5etcdclient

主要包含以下几个功能:

4.6.etcd运维、与备份

二、添加节点

1.准备新机器,将上一步生成的配置文件变量,写到新节点,尤其是集群状态为existing。(目标节点的数据目录要清空)

2.生成用于集群节点通信的SSL证书

3.生成用于客户端和节点通信的证书

4.启动并检查

三、生产环境建议

建议采取多台etcd集群至5台,保证多个节点挂掉不会影响使用

四、etcd备份

配合cronjobnfs或云共享储存建议分钟级别保留

4.7.etcd监控

推荐promtheus+grafana可自定义promtheusetcd报警规则,或grafanaalert插件报警等等

监控是整个运维环节,乃至整个产品生命周期中最重要的环、事前及时预警发现故障、事后提供数据追查定位问题,分析业务指标等等坚持业务指标采集是代码的部分原则不不动摇,提高指标覆盖率监控方式和指标要标准化。

5.1.定制容器基础监控规则、规范。比如cpu阀值、内存阀值、磁盘阀值等等、高峰期robot自动巡检报告5.2.监控选型:promtheus、zabbix等等

一个kubernetes集群的dashborad基本信息

指定podcpumem监控

5.4pod自动扩容提醒和异常pod(crashloopbackoff)报警(钉钉报警)

5.5业务监控、podcpu内存监控高峰期自动钉钉发送无人值守

6.1案例一

异常:authentication.k8s.io:0xc820374f50]isalreadyregisteredkubectlthrowinggroupisalreadyregisterederror原因:kubectl版本与Kubernetes版本不一致导致的解决:选择相应的kubectl版本重新安装

6.2案例二异常:kubelet:E052917:40:11.74109514358fs.go:418]Statfsfailed.Error:nosuchfileordirectory

原因:由于安装docker时宿主目录被软链overlayfs清理container不完整导致的

解决:安装kubernetes集群时docker需要配置好宿主目录不要软链

6.3案例三

异常:svcip变化导致无法访问,1.9.4之前的惊天大BUG

解决:升级kubernetes至1.9.3或更高1.9.2的bug

6.4案例四异常:做线上cordon节点的时候服务不可以用,导致某云slb无法转发到节点的容器业务服务

原因:一般设置cordon的之后就会drain做排水调度,在ServiceController里面确实会将unschedulable的节点从service上移除,这个是目前kubernetes的机制

解决:做cordon操作时选择在业务低峰期,比如凌晨操作,分批操作不要一下子全部cordon

常用技巧

查看TCP/UDPsockets状态ss-an|grepLISTENnetstat-sEST,CLOSE-WAIT,TIME-WAIT,SYN_RECV发送TCPRST可以避免进入TIME-WAIT状态Tcpdump网络抓包,网络故障分析tcpdump-vv-ieth0portxx-X-s0tcpdump-vv-s0-ieth0portxx-w/tmp/xx.pcap

THE END
1.发布助力任务平台:任务发布全攻略4. 合理利用平台功能:充分利用平台提供的任务管理、支付结算等功能,提高任务发布的效率和效果。 六、结语 通过发布助力任务平台,我们能够更高效地找到具备相应技能的提供方来满足我们的需求。无论是个人还是企业用户都能在这个平台上获得所需的帮助和服务。随着互联网技术的不断发展与普及,相信这类平台将会为我们的生活https://w.liulianga.com/article/detail/2273
2.在线平台深度评测,揭秘最适合您的选择网站搭建4、Weebly:操作简单,适合初学者和中小型企业。 5、Zyro:提供免费域名和SSL证书,适合初创企业和个人。 选择在线平台时,需充分考虑自身需求、平台功能、界面美观、响应速度、技术支持等因素,通过对比热门平台,您一定能找到最适合自己需求的在线平台,祝您顺利,事业蒸蒸日上!http://www.fengzhengtop.com/wzdj/844602.html
3.线上培训直播app平台开发主要功能介绍源码交付视频产品详细介绍 线上培训直播APP平台作为现代远程教育的重要工具,集成了多种功能以满足教育机构、讲师和学员之间的多样化需求。以下是线上培训直播APP平台开发的主要功能介绍: 一、直播功能 实时视频直播: 讲师可以通过APP进行实时视频直播授课,学员可以实时观看。 http://guangzhou.11467.com/info/33778489.htm
4.山阴论心第十八讲:TCLab线上心理学研究平台的功能介绍和使用演示TC Lab致力于让实验设计更加简单、让被试获取更加便利、让研究成本变得更低。讲座将详细介绍如何使用TC Lab线上心理学研究平台的各项功能并予以演示,让我们一起拭目以待TC Lab线上心理学研究平台。http://sxpsys.com/index/notice/detail/id/351.html
5.抖店开放平台服务商若拒绝退款,商家可申请平台仲裁,平台将会参考服务商填写的拒绝理由及凭证、商家提供的证据进行仲裁。 平台通过商家退款请求后,商家预计在3个工作日内收到退款。 服务商可提供的材料可包括但不限于: 官方沟通工具的聊天截图 三方沟通工具的聊天截图(参考证据) https://op.jinritemai.com/docs/guide-docs/1042/2441
6.开课功能介绍1share?热门线上购物云端学院1share1share? 拥有弹性的带宽使用方式、更低且合理的费用负担,包括职员管理、学员管理、课程试听、课程介绍、最新消息、储值点数管理、线上报名与咨询、各班图库等等许多实用设计。 1share? 的功能十分强大,能够让补习班、教育机构、企业甚至个人瞬间成为最优质且完整的云端学院。 https://1share.itraining.com.tw/1share_class_functions-cn.php
7.你我金融怎么样好用吗你我金融平台功能优势介绍你我金融是一个线上的网络金融理财平台。现在的线上贷款平台数不胜数,你我金融又有哪些功能和平台优势呢?下面小编也带来了相关介绍,感兴趣的小伙伴可以来了解下。 产品特色 你我金融是一款无视央行征信的平台,只要借款人芝麻分在600以上就可以申请,最高额度为5000元,纯线上操作,无抵押无担保,通过手机就可以完成https://shouyou.3dmgame.com/gl/54784.html
8.线上电子发票服务平台在线电子发票服务平台,一键开票便捷快速,让某金云会计虽然也是云版的财务软件,但是不仅支持财务功能,还打通了基础的进销存功能,比较适用对于有进销存管理需求的小微企业,如果只需要做财务账的,一定程度上会造成功能的浪费,具体大家可以结合实际情况去选择。 线上电子发票服务平台其他竞品介绍信息免费获取 马上试用 相关推荐https://h.chanjet.com/yxwz/5edbde9653a38.html
9.线上打分评分小程序免费制作方法分享!Hi现场免费微信墙关于hi现场平台介绍: Hi现场互动是一款简单、免费、好玩的现场互动大屏幕制作工具,给活动现场来宾带来科技、炫酷、便捷的互动新体验的现场互动大屏服务软件。 借助微信平台,hi现场互动为大屏幕和手机提供交互平台,将PC端内容通过大屏幕同步展示给现场用户,实现游戏、抢红包、文字、图片、视频、抽奖、投票、签到等多种互https://www.hixianchang.com/info/article-46336.html
10.打通对账的最后一公里——对账管理平台数字化转型对账涉及大量的业务判断逻辑,不同的线上电商平台、线下渠道有不同的对账要求,对账规则多样化、复杂化。如何规避传统开发技术,实现开发量大、交付速度慢、无法及时响应业务变化所带来的问题? 对账管理平台功能介绍 元年对账管理平台覆盖“3 大应用场景”,包括“3 大核心功能”。 https://xie.infoq.cn/article/eb67f398b9c44424c172525d7
11.湛江市知识产权信息公共服务平台功能服务介绍南方+湛江市知识产权信息公共服务平台(下称“平台”)是湛江市知识产权信息公共服务节点建设的成果之一,为湛江市的知识产权信息的公共服务提供了线上支撑。平台目前已正式上线运行,首期开发了知识产权检索、专利数据库、统计简报、知识产权服务指南、线上培训平台、专利开放许可专区和维权援助等功能。平台的网址是: https://static.nfapp.southcn.com/content/202309/05/c8067908.html
12.文旅部评选:全国最好10个智慧旅游适老化案例流程,完成老年人智慧旅游新基建建设;打造“水韵江苏”数字文旅综合服务平台,推出各类适合老年人出游的数字旅游年卡、精品线路、景区和文博场馆预约服务,为老年人量身定制丰富多彩的旅游项目;线上实名预约线下持社保卡入园入馆、享受精品线路服务,进一步丰富第三代社保卡的服务场景,一卡兼容看病、出行、旅游、付款功能。https://www.d-arts.cn/article/article_info/key/MTIwMzk1MDg0NzaD34FosKzKcw.html
13.上一篇12349智慧养老简介(12349智慧养老服务端)12349智慧养老服务端app是为了解决老年人线上购物和线上购物问题,线上平台有很多优惠券可以使用,还有很多生活小帮手,功能多多非常实用,快来下载吧。 12349智慧养老服务端软件介绍 12349,作为国内智慧养老领跑企业,是中国最早将信息技术与传统行业进行深度融合,运用大数据,互联网技术,实现社会资源优化配置的创新型企业。 https://www.0775qc.com/83443.html
14.开办线上旅行社的步骤详解,让你轻松掌握创业流程!只有不断适应市场变化和创新发展才能保持竞争力并实现可持续发展。 总之开办线上旅行社是一个具有广阔前景的创业机会。通过了解市场需求、选择合适的平台、搭建专业团队、优化产品功能和服务、制定营销策略以及关注行业动态和政策法规等方面的努力你可以成功开办自己的线上旅行社并实现创业梦想。https://jiameng.baidu.com/content/detail?id=451597509268&from=search
15.抖音百应平台是什么?有什么功能运营技巧自媒体这篇文章主要介绍了抖音百应平台是什么,有什么功能的相关资料,脚本之家小编觉得这篇文章对于那些还不了解抖音百应平台的小伙伴来说很有参考价值,一起来看看吧。 GPT4.0+Midjourney绘画+国内大模型 会员永久免费使用! 【如果你想靠AI翻身,你先需要一个靠谱的工具!】 https://www.jb51.net/zimeiti/816903.html