揭秘:深信服在软件定义存储上有哪些核心能力与技术创新?存储在线

按:智能是不是继闪存存储之后数据存储行业又一个大的发展机遇呢?

2019年人工智能的发展和应用进入了新阶段,对存储厂商来说,新的数据存储方案都必须有智能元素,或是让存储服务智能应用,或是让存储本身具备智能能力。

老牌数据存储公司是这样,新兴起的数据存储公司也是如此。不同的是,后者作为智能时代下应运而生者,可以更无所顾忌地迎接智能技术的发展浪潮。当然,只靠新技术是不行的,还需要有扎实的基本功才能让智能在存储上发挥真正的价值。

2019年中国数据与存储峰会上,深信服基础架构BU(新IT业务)市场总经理兼CTO陈小亮介绍了深信服基于软件定义的企业级分布式存储EDS的核心能力。我们来看看,作为存储领域新入局者,深信服是怎么做的?

以下内容根据峰会现场演讲速记整理:

新数据新需求

“新数据”的新特点对存储提出了新的需求,总结为以下五点:

第一,当数据变大变多了之后,需要有更大的存储空间,往往需要PB级空间来存储这些结构化和非结构化数据。

第二,深信服认为,未来80%以上的数据都会是非结构化数据。这些非结构化数据的特点是占用空间很大,增长非常快速,要求存储有超大规模扩展性。

第四,数据量变大之后对整个存储底层的可靠性要求更高了。比如出现故障之后,要求存储能将海量数据快速恢复。

新数据,呼唤智能云存储

听深信服谈存储大家可能会有疑虑,深信服过去是做安全的,什么时候开始做存储了,做得怎么样?

其实,早在2013年,深信服就成立了独立的存储研发部门,当时主要进行软件定义存储的一个布局,并在当年就推出了分布式块存储,把分布式块存储应用到了桌面云上。2015年,分布式块存储又被运用到了超融合上。截至目前,深信服分布式块存储服务的桌面云终端用户达到了95万,超融合用户达到了5,000多家。

五年来,深信服在存储领域积累了大规模部署和实施的经验。2018年年底,深信服基于技术积累发布了独立了分布式存储产品,同时加大了在研发上的投入。目前,深信服存储业务的独立研发人员达到了300多人,其中30%是硕博学历,海内外顶尖博士20多位。这些博士给深信服带来了很多高端技术突破,目前深信服已获得的存储技术专利有68个,同时申请中的专利有30多个,成果显著。

深信服企业级分布式存储EDS四大核心能力

五年来,深信服持续打造存储核心能力,总结下来有四大核心能力。

1.海量数据存储和扩展能力

海量数据在存储和使用时通常会面临两个问题:第一是元数据索引效率非常低的问题。元数据记录了文件的各种信息,对文件进行的所有操作都会修改、增加、删除元数据。元数据传统的存储方式采用的是目录式,所谓目录式是指类似从树干到树枝到树叶的关系,效率非常低下。面对几千万甚至上亿文件的时候,访问效率非常低,系统几乎不可用。第二是数据容量扩展的问题。

深信服针对元数据问题的解决方案是打造元数据分布式数据库;针对数据扩容问题的解决方案是采用弹性扩展架构,实现数据自动平衡。

深信服面向元数据管理而设计的数据库系统,针对海量元数据管理场景做了很多技术优化与创新。这些优化主要解决了索引慢的问题,去除了在元数据使用过程当中一些不必要的IO或者资源消耗。如通过自研的一致性框架,将多次写入变成一次性写入。

这些技术优化与创新使得系统能够轻松管理一百亿以上的文件,整个索引效率提升了一百倍。过去查询一个文件可能要几分钟甚至几小时,现在可以做到秒级,就能将文件调用出来。

在扩展性方面,深信服存储EDS系统采用全对称的分布式线性扩展架构,最大可扩展到五千节点,并且扩展的操作非常简单,只要在集群里面把新的存储节点加进去,后台会自动进行数据的迁移和数据的平衡。

由于加入了智能自适应的功能,整个扩展过程当中不需要人为干预。而且,在数据同步过程中,系统能智能感知到业务的压力,自动调整迁移策略和迁移节奏,避免迁移时对业务产生影响。

2.数据高可靠保障能力。

深信服发现大多数数据保护会面临这样两个问题:第一个问题,数据保护往往是借助各种收费软件来实现,这样做首先是比较复杂,其次是需要额外购买软件,成本也比较高。第二个问题是,当数据出现故障后,平台自愈效率低,自动化程度低。

针对第一个问题,深信服用五大类38种高可靠机制来保护数据。

第二类是在主机层面,由包括服务器和网络的硬件构成冗余架构,而且对故障处理和隔离都做了专项优化,可以缩小故障范围以及避免部分其他问题。

第三类在数据保护层面,有被动的保护机制,如多副本、纠删码等;也有主动的防御机制,如硬盘亚健康检测、数据巡检等,通过主动和被动相结合的方式给数据提供更高的可靠性。

第四类主要是在管理层面,使用AI技术来实现数据管理的智能化,智能地进行故障诊断。

最后是在方案层面,通过快照、备份、多中心容灾层、异地复制等功能,实现跨集群容灾建设。

五大类38种高可靠机制带来了怎样的优势呢?

首先,使得整个数据保护更加全面立体,对各个故障点都有了应急保护措施。

其次,是性价比更高,硬件方面采用的是相对低成本的标准化硬件,软件方面不需要额外购买第三方收费工具。通过软件机制和优化最终达到同样高品质数据保护方案的性能和安全级别。

同时,五大类38种高可靠机制形成了一个事前、事中、事后的数据保护框架。事前通过数据的校验、巡检提前发现数据风险并自动修复。事中通过多副本、纠删码确保数据不会丢失。事后是可以在故障之后实现数据快速修复与重建。

3.高性能,实时响应能力

在性能方面,存储也面临两个问题:

第一个问题就是当文件数量上升到几千万甚至上亿之后,性能衰减得非常厉害,访问速度非常慢。

第二个问题在于各种业务对于性能的需求不一样,为此,传统做法是购买多套不同类型的存储。深信服认为未来数据中心的趋势是只需要一套存储,它同时具备高吞吐、低时延的需求,但这样的存储需要做大量的性能优化,优化才是关键所在。

在性能优化方面,深信服做了高性能分层技术框架,框架分为数据层、缓存层,以及协议层,针对每一层的优化都有助于提升性能,最终做到用低成本的硬件实现高性能。主要的优化方向有三点:

第一点是分层本身。分层的核心其实是要智能感知业务,然后,基于业务需求对不同IO采取不同的处理机制。如果是随机小IO的话,需要先写到分布式缓存层,将小IO合并完以后再写到容量层;如果是连续的大IO,则直接写到容量层里。

第二点是分层算法。分层算法里最核心的是数学算法,深信服的数学算法博士们几年来持续优化算法,使得热力图算法的缓存命中率高达80%以上,高命中率可以大大提高效率和性能。

第三点是自适应条带化。自适应条带化是指将一个大的数据块切分成几个小的数据块,然后分散到多块硬盘里面去,最终目的是提高存储性能。

通过多项优化,深信服的分布式存储系统EDS在结构化和非结构化数据场景中的性能都有了大幅提升。

4.基于AI的高效的管理能力

传统的存储管理需要依靠大量的手工运维,随着存储设备越来越多,管理复杂度呈指数级上升。同时,随着存储设备越来越老,维护越来越困难,故障定位越来越困难。深信服认为,未来的运维一定是往自动化智能化方向发展。

深信服第一阶段构建了全自动化运维体系,可以把平时常用的50%的操作都变为自动化任务。全自动化运维能做到什么程度呢?

比如一键智能管理功能,通过一个按钮就可以对软硬件进行全方位的检测,并显示故障原因以及解决方案。又比如可以通过全局热备空间,在硬盘出现故障时,快速恢复数据,自动进行数据修复,整个过程是全自动化完成的。

第二阶段构建了智能运维,深信服的人工智能大数据分析和统计分析团队做了许多创新,主要有以下三点:

第一点——故障预测,尤其是硬盘的故障预测。存储系统里有大量的硬盘,这些硬盘非常容易损坏,智能运维系统可以做硬盘亚健康检测,可以在硬盘没有出现故障之前提前15天识别出问题,通知用户及时更换,深信服现在把硬盘亚健康检测的准确率提升到了98.5%。

第二点——趋势分析,智能运维系统可以给出性能和容量上的规划建议,动态合理地对资源进行分配,而避免过去要靠人工计算预测的麻烦,避免出错或者浪费的情况。

第三点——智能的应用优化,不同业务应用对性能的需求是不一样的,智能运维系统可以在后台自动感知业务的特点,自动在后台进行调整,包括调整IO的路径,调整资源配置。整个过程当中不需要人工干预,使得业务体验和资源利用达到最优的状态。

THE END
1.什么是事件驱动,“实时”有多快?如果将这个场景转换为软件系统,那么你关注的一切都和时间有关:响应时间、完成时间、访问时间、启动时间等。 这些时间由用户或访问应用程序定义。 备注 在实时系统中,各项任务应在规定的期限内执行其功能。 你还应时刻注意系统内的运行状况。 因此,请务必关注显而易见的事项,即所设置时间的日志记录、监视和测量。 https://docs.microsoft.com/zh-cn/training/modules/deploy-real-time-event-driven-app/2-event-driven-example
2.最高响应比的计算方法详解(最高响应比如何计算)问题:最高响应比如何计算 答案: 最高响应比是一种在计算机调度算法中常用的评估指标,尤其在进程调度中,它能够帮助系统更公平、高效地分配资源。以下是最高响应比计算方法的详细解析。 首先,我们需要明确什么是响应比。响应比是衡量进程等待时间与估计的执行时间的比值,通常用来评估进程的优先级。其计算公式为: 响应比https://www.zaixianjisuan.com/jisuanzixun/zuigaoxiangyingbidejisuanfangfaxiangjie.html
3.最高响应比优先算法相对于SJF算法和SRT算法,则更注重等待时间和服务时间之间的平衡,从而避免出现长任务对系统的影响。 4. HRRN的应用场景 HRRN算法适用于各种应用场景,特别是在要求系统响应快速的场合,如操作系统、网络通信、实时控制等领域。在这些场景下,通过使用HRRN算法可以提高系统的响应速度,减少任务的响应时间。http://kaoshi.educity.cn/rk/htjizkfkc8.html
4.智能报警系统:实时预警和快速响应智能报警系统是一种基于大数据、人工智能和计算机科学技术的系统,它的主要目的是实时预警和快速响应。在现代社会,智能报警系统已经广泛应用于各个领域,例如安全监控、交通管理、气候变化监测、金融风险预警等。智能报警系统可以帮助人们更快速地发现问题,并采取措施进行处理,从而提高工作效率和降低风险。 https://blog.csdn.net/universsky2015/article/details/135809157
5.在实时操作系统里面随便怎么写代码都能硬实时吗?众所周知,硬实时的概念,其核心并非追求速度的极致,而是确保系统能在预定的、可重复的时间范围内给予确定的响应。这意味着,实时系统的正确性不仅在于计算逻辑的正确,更在于结果的产生时间是否符合预期。以汽车为例,当发生碰撞时,安全气囊必须在极短的时间内弹开,否则可能无法起到应有的保护作用。 https://cloud.tencent.com/developer/article/2411178
6.实时调度算法:高效应对实时系统的挑战新闻动态最早截止时间优先(Earliest Deadline First,EDF)算法是最常见的实时调度算法之一。它根据任务的截止时间来决定任务的执行顺序,优先选择截止时间最早的未完成任务进行执行。 EDF算法的优点是简单易懂,能够保证系统在任何时刻都能满足所有任务的截止时间要求。然而,EDF算法也存在一些缺点。首先,它可能会导致任务的响应时间较http://xacbs88.com/post/6113.html
7.响应比计算公式计算响应比可以帮助我们评估系统的执行效率,了解任务在系统中的调度情况,以及优化系统性能。 响应比的计算公式如下: 响应比 = (等待时间 + 服务时间)/ 服务时间 其中,等待时间是指一个任务在系统中等待服务的时间,而服务时间是指任务实际获得服务的时间。 为了更好地理解响应比的意义,我们可以通过一个生动的例子来https://wenku.baidu.com/view/5af773017cd5360cba1aa8114431b90d6c858996.html
8.实时调度算法开源通宝实时调度算法 对于什么是实时系统,POSIX 1003.b作了这样的定义:指系统能够在限定的响应时间内提供所需水平的服务。而一个由Donald Gillies提出的更加为大家接受的定义是:一个实时系统是指计算的正确性不仅取决于程序的逻辑正确性,也取决于结果产生的时间,如果系统的时间约束条件得不到满足,将会发生系统出错。http://blog.chinaunix.net/uid-24549279-id-262087.html
9.Java性能权威指南学习笔记临渊羡鱼不如退而结网3.GC算法及响应时间测试 快速小结 1.衡量标准是响应时间或吞吐量,在Throughput收集器和Concurrent收集器之间做选择的依据主要是有多少空闲CPU资源能用于运行后台的并发线程。 2.通常情况下,Throughput收集器的平均响应时间比Concurrent收集器要差,但是在90%响应时间或99%响应时间这几项指标上,Throughput收集器比Concurrenthttps://www.iteye.com/blog/bsr1983-2357030
10.程序员不得不会的计算机科班知识——操作系统篇(上)操作系统是实时操作系统(RTOS)是指当外界事件或数据产生时,能够接受并以足够快的速度予以处理,其处理的结果又能在规定的时间之内来控制生产过程或对处理系统做出快速响应。 调度一切可利用的资源完成实时任务,并控制所有实时任务协调一致运行的操作系统。提供及时响应和高可靠性是其主要特点。 https://article.juejin.cn/post/7221142199391043643
11.liblfzncnn回声消除回声消除的英文NSAF算法 MATLAB代码实现 房间脉冲响应 近端语音信号 远端语音信号 麦克风信号 频域自适应滤波器(FDAF) 回声回波增强(ERLE) 不同步长值的影响 回声回波损耗增强比较 使用分区减少延迟 开源的音频处理库 Speex:开源语音编解码器 Opus互动音频编解码器 WebRTC(实时通信) https://blog.51cto.com/u_16213645/10934104
12.位置式PID算法和增量式PID算法的差异位置式PID算法与增量式PID算法在计算方式、系统响应、控制效果等方面存在明显差异。两种算法各有优势,应根据具体的控制需求选择合适的算法。位置式PID算法适用于快速响应和实时性要求高的系统,而增量式PID算法则更适用于对稳定性和抗干扰能力要求高的系统。https://m.eefocus.com/e/1713067.html
13.流域治理视角下,构建弹性城市排水系统实时控制策略借鉴国外相关经验,按照系统实际控制(管理)的范围,将实时控制系统分成局部响应控制、全局优化控制和流域联合调度三种级别。 ①局部响应控制:定位于单个汇水分区,实现本区域厂-网就地响应控制,只利用本地或相邻传感器的实时监测数据,通过内置的控制算法计算出控制动作,进而通过执行器实现对受控过程的控制。这种控制方式一般适https://www.h2o-china.com/news/313406.html
14.实时算法(精选十篇)文献[7]采用Surfacelet变换和隐马尔科夫树模型(HTM)相结合的方法,考虑时间域和空间域的多种特征,建立烟雾三维的HTM模型,并用SVM进行训练检测,此算法复杂度较高,实时性较差。 LBP纹理特征[8]越来越多地被利用来检测目标。Yuan[9]利用LBP和LBPV检测烟雾,然而这种方法不能很好适应光照变化,并且LBP特征向量长255,计算https://www.360wenmi.com/f/cnkeyip6p1f5.html
15.杭州市总工会借助“数字化”手段,打通医保、卫健大数据,AI算法自动计算补助金额,线上“一站式”解决在职职工医疗互助补助申请、审核发放,实现医疗补助应补尽补。上线8天,已累计办理3886人次,发放补助183.4万余元。 窗口到“指尖”的实时响应 “线上补助太方便了!只要动动手指就可以,没想到速度这么快。”来自北干街道企业女职工https://www.hzgh.org/newsview101503.htm
16.实时算法论文范文9篇(全文)实时预警的架构是将预警系统建立在实时数据库之上, 即对生产过程进行连续监视。因此实时预警涉及生产数据采集方面的压缩和解压缩算法, 数据进入预警引擎之前的、以提高数据有效性为目的的预处理算法, 以及预警引擎中的规则推理算法。限于篇幅, 本文讨论数据预处理过程中的几个典型算法。 https://www.99xueshu.com/w/ikeylbaxbqaw.html
17.虚拟电厂,豹变前夜从市场机制看,我国电力交易市场尚处于试点起,虚拟电厂的运营仍以邀约制下的需求侧响应为主要模式,因此当前情况下更接近于美国模式。欧洲虚拟电厂利用软件算法设定电力现货市场的竞价策略,实现交易收益的最大化。但我国电力市场处于起步阶段,目前仅有广东省对电力现货交易实行了试点,当电力供给出现缺口或存在调峰调频需求时https://wallstreetcn.com/articles/3664491
18.基于文件分时索引的大规模流量实时IoT终端识别算法实验中, 在不损失IoT终端识别算法精度条件下, 仅消耗少量磁盘, 可将内存消耗降低92%. 实验结果表明, 该技术能够用于实时IoT终端识别框架中.关键词: 物联网(IoT) IoT终端识别 异常检测 网络流量 Real-Time IoT Terminal Identification Algorithm for Large-Scale Flow Based on Time-Sharing Index of Fileshttps://c-s-a.org.cn/html/2021/2/7785.html
19.基于五Ⅰ算法的模糊系统的响应能力期刊[6]李洪兴,尤飞,彭家寅,等.基于某些模糊蕴涵算子的模糊控制器及其响应函数[J].自然科学进展.2003,(10).DOI:10.3321/j.issn:1002-008X.2003.10.011. [7]王国俊.模糊推理的全蕴涵三I算法[J].中国科学(E辑).1999,(1).43. [8]潘海玉,裴道武,陈仪香.基于三Ⅰ算法的模糊系统的响应能力[J].控制理论与应用.https://d.wanfangdata.com.cn/periodical/gcsxxb201901002