揭秘:深信服在软件定义存储上有哪些核心能力与技术创新?存储在线

按:智能是不是继闪存存储之后数据存储行业又一个大的发展机遇呢?

2019年人工智能的发展和应用进入了新阶段,对存储厂商来说,新的数据存储方案都必须有智能元素,或是让存储服务智能应用,或是让存储本身具备智能能力。

老牌数据存储公司是这样,新兴起的数据存储公司也是如此。不同的是,后者作为智能时代下应运而生者,可以更无所顾忌地迎接智能技术的发展浪潮。当然,只靠新技术是不行的,还需要有扎实的基本功才能让智能在存储上发挥真正的价值。

2019年中国数据与存储峰会上,深信服基础架构BU(新IT业务)市场总经理兼CTO陈小亮介绍了深信服基于软件定义的企业级分布式存储EDS的核心能力。我们来看看,作为存储领域新入局者,深信服是怎么做的?

以下内容根据峰会现场演讲速记整理:

新数据新需求

“新数据”的新特点对存储提出了新的需求,总结为以下五点:

第一,当数据变大变多了之后,需要有更大的存储空间,往往需要PB级空间来存储这些结构化和非结构化数据。

第二,深信服认为,未来80%以上的数据都会是非结构化数据。这些非结构化数据的特点是占用空间很大,增长非常快速,要求存储有超大规模扩展性。

第四,数据量变大之后对整个存储底层的可靠性要求更高了。比如出现故障之后,要求存储能将海量数据快速恢复。

新数据,呼唤智能云存储

听深信服谈存储大家可能会有疑虑,深信服过去是做安全的,什么时候开始做存储了,做得怎么样?

其实,早在2013年,深信服就成立了独立的存储研发部门,当时主要进行软件定义存储的一个布局,并在当年就推出了分布式块存储,把分布式块存储应用到了桌面云上。2015年,分布式块存储又被运用到了超融合上。截至目前,深信服分布式块存储服务的桌面云终端用户达到了95万,超融合用户达到了5,000多家。

五年来,深信服在存储领域积累了大规模部署和实施的经验。2018年年底,深信服基于技术积累发布了独立了分布式存储产品,同时加大了在研发上的投入。目前,深信服存储业务的独立研发人员达到了300多人,其中30%是硕博学历,海内外顶尖博士20多位。这些博士给深信服带来了很多高端技术突破,目前深信服已获得的存储技术专利有68个,同时申请中的专利有30多个,成果显著。

深信服企业级分布式存储EDS四大核心能力

五年来,深信服持续打造存储核心能力,总结下来有四大核心能力。

1.海量数据存储和扩展能力

海量数据在存储和使用时通常会面临两个问题:第一是元数据索引效率非常低的问题。元数据记录了文件的各种信息,对文件进行的所有操作都会修改、增加、删除元数据。元数据传统的存储方式采用的是目录式,所谓目录式是指类似从树干到树枝到树叶的关系,效率非常低下。面对几千万甚至上亿文件的时候,访问效率非常低,系统几乎不可用。第二是数据容量扩展的问题。

深信服针对元数据问题的解决方案是打造元数据分布式数据库;针对数据扩容问题的解决方案是采用弹性扩展架构,实现数据自动平衡。

深信服面向元数据管理而设计的数据库系统,针对海量元数据管理场景做了很多技术优化与创新。这些优化主要解决了索引慢的问题,去除了在元数据使用过程当中一些不必要的IO或者资源消耗。如通过自研的一致性框架,将多次写入变成一次性写入。

这些技术优化与创新使得系统能够轻松管理一百亿以上的文件,整个索引效率提升了一百倍。过去查询一个文件可能要几分钟甚至几小时,现在可以做到秒级,就能将文件调用出来。

在扩展性方面,深信服存储EDS系统采用全对称的分布式线性扩展架构,最大可扩展到五千节点,并且扩展的操作非常简单,只要在集群里面把新的存储节点加进去,后台会自动进行数据的迁移和数据的平衡。

由于加入了智能自适应的功能,整个扩展过程当中不需要人为干预。而且,在数据同步过程中,系统能智能感知到业务的压力,自动调整迁移策略和迁移节奏,避免迁移时对业务产生影响。

2.数据高可靠保障能力。

深信服发现大多数数据保护会面临这样两个问题:第一个问题,数据保护往往是借助各种收费软件来实现,这样做首先是比较复杂,其次是需要额外购买软件,成本也比较高。第二个问题是,当数据出现故障后,平台自愈效率低,自动化程度低。

针对第一个问题,深信服用五大类38种高可靠机制来保护数据。

第二类是在主机层面,由包括服务器和网络的硬件构成冗余架构,而且对故障处理和隔离都做了专项优化,可以缩小故障范围以及避免部分其他问题。

第三类在数据保护层面,有被动的保护机制,如多副本、纠删码等;也有主动的防御机制,如硬盘亚健康检测、数据巡检等,通过主动和被动相结合的方式给数据提供更高的可靠性。

第四类主要是在管理层面,使用AI技术来实现数据管理的智能化,智能地进行故障诊断。

最后是在方案层面,通过快照、备份、多中心容灾层、异地复制等功能,实现跨集群容灾建设。

五大类38种高可靠机制带来了怎样的优势呢?

首先,使得整个数据保护更加全面立体,对各个故障点都有了应急保护措施。

其次,是性价比更高,硬件方面采用的是相对低成本的标准化硬件,软件方面不需要额外购买第三方收费工具。通过软件机制和优化最终达到同样高品质数据保护方案的性能和安全级别。

同时,五大类38种高可靠机制形成了一个事前、事中、事后的数据保护框架。事前通过数据的校验、巡检提前发现数据风险并自动修复。事中通过多副本、纠删码确保数据不会丢失。事后是可以在故障之后实现数据快速修复与重建。

3.高性能,实时响应能力

在性能方面,存储也面临两个问题:

第一个问题就是当文件数量上升到几千万甚至上亿之后,性能衰减得非常厉害,访问速度非常慢。

第二个问题在于各种业务对于性能的需求不一样,为此,传统做法是购买多套不同类型的存储。深信服认为未来数据中心的趋势是只需要一套存储,它同时具备高吞吐、低时延的需求,但这样的存储需要做大量的性能优化,优化才是关键所在。

在性能优化方面,深信服做了高性能分层技术框架,框架分为数据层、缓存层,以及协议层,针对每一层的优化都有助于提升性能,最终做到用低成本的硬件实现高性能。主要的优化方向有三点:

第一点是分层本身。分层的核心其实是要智能感知业务,然后,基于业务需求对不同IO采取不同的处理机制。如果是随机小IO的话,需要先写到分布式缓存层,将小IO合并完以后再写到容量层;如果是连续的大IO,则直接写到容量层里。

第二点是分层算法。分层算法里最核心的是数学算法,深信服的数学算法博士们几年来持续优化算法,使得热力图算法的缓存命中率高达80%以上,高命中率可以大大提高效率和性能。

第三点是自适应条带化。自适应条带化是指将一个大的数据块切分成几个小的数据块,然后分散到多块硬盘里面去,最终目的是提高存储性能。

通过多项优化,深信服的分布式存储系统EDS在结构化和非结构化数据场景中的性能都有了大幅提升。

4.基于AI的高效的管理能力

传统的存储管理需要依靠大量的手工运维,随着存储设备越来越多,管理复杂度呈指数级上升。同时,随着存储设备越来越老,维护越来越困难,故障定位越来越困难。深信服认为,未来的运维一定是往自动化智能化方向发展。

深信服第一阶段构建了全自动化运维体系,可以把平时常用的50%的操作都变为自动化任务。全自动化运维能做到什么程度呢?

比如一键智能管理功能,通过一个按钮就可以对软硬件进行全方位的检测,并显示故障原因以及解决方案。又比如可以通过全局热备空间,在硬盘出现故障时,快速恢复数据,自动进行数据修复,整个过程是全自动化完成的。

第二阶段构建了智能运维,深信服的人工智能大数据分析和统计分析团队做了许多创新,主要有以下三点:

第一点——故障预测,尤其是硬盘的故障预测。存储系统里有大量的硬盘,这些硬盘非常容易损坏,智能运维系统可以做硬盘亚健康检测,可以在硬盘没有出现故障之前提前15天识别出问题,通知用户及时更换,深信服现在把硬盘亚健康检测的准确率提升到了98.5%。

第二点——趋势分析,智能运维系统可以给出性能和容量上的规划建议,动态合理地对资源进行分配,而避免过去要靠人工计算预测的麻烦,避免出错或者浪费的情况。

第三点——智能的应用优化,不同业务应用对性能的需求是不一样的,智能运维系统可以在后台自动感知业务的特点,自动在后台进行调整,包括调整IO的路径,调整资源配置。整个过程当中不需要人工干预,使得业务体验和资源利用达到最优的状态。

THE END
1.智能运维:提升效率与响应速度的关键能力一个高效、智能的运维系统不仅能够确保企业IT环境的稳定运行,还能在出现问题时迅速响应,最小化业务中断的影响。本文将深入探讨现代运维系统应具备的关键能力,包括告警分析、自定义拓扑、可视化大屏、智能报表、多种通知通道、系统管理、对接管理、审计日志、个人工作台以及知识库等。https://blog.csdn.net/MXsoft618/article/details/143829970
2.问题触发的算法模型响应机制探索第一是问题体系构建和模型准备。针对某一行业或领域,坚持以原发问题为导向,厘清问题浮现的源头,收集历史问题多源数据,通过垂直行业大模型训练并建立覆盖问题浮现监测、问题识别、问题提炼和问题响应能力的算法模型(库),并构建问题标准化体系(指标库)。以12345政务热线场景为例,问题浮现的源头主要有12345电话呼入https://baijiahao.baidu.com/s?id=1795660738039516857&wfr=spider&for=pc
3.forMac中文激活版实时光线追踪3D渲染软件提高了对材料变化的实时响应能力 对材质所做的更改现在将立即显示在实时视图中,从而更容易调整和完善材质。在此处了解有关材料的更多信息。 快速查找节点 在“材质图”中按Q键可以快速轻松地找到要添加的节点。在此处了解有关材质图的更多信息。 RAL颜色库 http://www.macsky.net/63474.html
4.CAN总线系统的时间动态:CAN与CANopen的实时能力与局限性在前文中,我们探讨了具有实时能力的嵌入式通信系统的基本要求——平衡实时响应、安全性和保障。本篇文章将重点介绍CAN与CANopen的实时能力和局限性。 控制器局域网(CAN)协议是各个行业众多应用的基础,每个应用都有其独特的实时需求。CANopen和J1939等著名示例强调了该协议的多种适应性,以满足特定需求。值得注意的是,https://www.elecfans.com/d/2299139.html
5.广州市工业和信息化局关于印发《广州市虚拟电厂实施细则》的通知b、具备实时响应能力的用户优先; c、评价得分高的用户优先; d、应邀时间早的用户优先。 其中,c中评价得分等于电力用户、负荷聚合商最近3次参与响应评价得分平均值;初次响应用户评价得分默认为1;已响应次数小于3次时,按实际响应平均得分计算。 D、广州供电局于日前(D-1)12:30前,告知用户邀约响应执行方案。 https://www.gz.gov.cn/gfxwj/sbmgfxwj/gzsgyhxxhj/content/post_7364052.html
6.深入探讨嵌入式操作系统的定义特性及应用嵌入式操作系统的设计初衷是为了实现高效的资源管理和实时响应能力,这对于需要精确控制和快速反应的应用场景尤为重要。例如,在汽车行业,嵌入式操作系统用于控制发动机管理系统、信息娱乐系统以及高级驾驶辅助系统(ADAS),确保车辆的安全性和性能。 立即定制飞书模板,推动业务发展 二、嵌入式操作系统的历史与发展 2.1 https://www.feishu.cn/content/embedded-operating-system-definition-features-applications
7.“十三五”时期我国应如何大力提高电力需求侧响应能力?自动需求响应不存在任何的人工介入,通过接受价格或激励信号触发预编程好的需求响应策略,当用户不愿接受这种响应策略时也可以选择退出。自动需求响应大大提高了需求响应的准确性和可靠性,从而提高了负荷侧提供辅助服务的品质和能力。因此,根据价格或激励的实时信息动态调整负荷的自动需求响应是必然的发展趋势,也是需求响应https://shoudian.bjx.com.cn/news/20161221/798365.shtml
8.CDP与人工智能的结合应用2.2 实时响应能力 CDP与人工智能的结合可以实现实时数据分析,企业能够快速响应市场变化。例如,利用AI技术对客户行为数据进行实时分析,企业能够及时调整营销策略,以应对市场需求的变化。 2.3 个性化体验提升 AI能够处理和分析大量客户数据,为每个客户提供个性化的推荐和服务。这种个性化体验不仅提升了客户满意度,也增强了客户https://www.hypers.com/content/archives/4876
9.供应链竞争力主要体现在哪些方面?需求响应能力就是订单交付能力,其中:定制化产品产量的占比, 能够反映企业适应大规模定制经济的能力; 定制化产品销售额占比, 能够反映企业定制化经济占企业总销售额的比重; 准时交货订单比例, 能够反映企业以顾客需求为中心的管理能力; 顾客满意度, 能够反映顾客对企业提供的产品、服务的认可程度。 https://maimai.cn/article/detail?fid=1812454367&efid=fi39uGoM4Dr7nnXhBMIHPw
10.部署ddos防御系统时,应考虑哪些因素3. 自动化与实时响应能力 DDoS攻击往往在短时间内爆发,手动应对可能无法及时阻止攻击。一个有效的DDoS防御系统应具备高水平的自动化和实时响应能力,能够在攻击发生时自动检测并启动防御机制。这包括实时流量监控、自动流量清洗以及根据攻击模式动态调整防御策略等功能。 https://www.kkidc.com/market/9176.html
11.构建能源企业新一代网络安全保障能力腾讯云开发者社区长亭科技新一代网络安全保障方案包括网络攻防和欺骗防御两项核心技术能力。 基于网络攻防技术的核心思路,针对能源企业不同类型的应用场景,以攻击者思维模拟恶意软件攻击、入侵目标系统、窃取数据等行为,测试企业安全防御能力和响应能力。对演练过程中收集到的数据和情报进行分析,可以评估企业安全体系的弱点和缺陷,发现潜在的https://cloud.tencent.com/developer/news/1053019
12.Matter标准焕发智能家居新机遇,内存成为决胜关键对智能家居来说,实时响应能力是影响用户体验的关键一环。每一个消费者都希望在呼唤语音助手后,便能迅速得到回应。因此,这一需求对内存读取速度和存储容量都提出了较高的要求。 目前的智能家居设备大多采用DDR内存来提升设备的性能和响应速度。例如,需要实时传输音频数据进行快速缓存和处理的智能音箱应用,DDR内存可以提供https://www.eet-china.com/info/70673.html
13.外贸公司erp系统有哪些选择一套优秀的erp系统可以帮助企业实现信息化管理,提升效率和职业化。不同的erp系统在功能上也有差异,需要根据外贸公司的实际需求来选择。总体来说,某n某you的erp系统是一款值得推荐的erp系统,它具有良好的功能、数据安全性、实时响应能力和可扩展性。 △某业某财产品截图 https://h.chanjet.com/ask/1bee420cfb5b1.html
14.OLAP的特征十大功能及其应用价值2. 快速响应能力 OLAP系统强调快速响应能力,能够在用户要求的时间内对大部分分析请求做出反应。这得益于其专门的数据存储格式、大量的事先运算以及特别的硬件设计,确保了数据查询的高效性。 3. 可分析性 OLAP系统能够处理与应用相关的各种逻辑分析和统计分析,用户无需编程即可定义新的专门计算,并将其作为分析的一部分https://selectdb.com/info/blog/908
15.科技能力持续领跑!菜鸟智慧园区项目供应链计划等多个项目入选通过菜鸟提供的车辆预约调度系统、门禁道闸系统、智能地磅系统、智能安全监控系统、访客管理系统以及智慧地磅、场内物流运营平台等一系列软硬件产品,乖宝宠物聊城工厂成功实现智能化管理升级:系统实现毫秒级处理数据,并可以根据分析实时响应,自动化程度也得到大幅提升。基于前期合作取得的积极成果,目前,乖宝宠物正与菜鸟一起https://www.cainiao.com/4768.html
16.12种微服务模式Jowin'sterritory.的技术博客7. 事件驱动架构模式:为您的微服务提供实时响应能力 您是否正在寻找一种方法来增强微服务的响应能力和适应性?事件驱动架构模式可以提供帮助!此模式利用事件来触发服务中的操作,从而实现实时响应并促进服务之间的松散耦合。 为什么事件驱动架构模式会改变游戏规则?通过将事件用作触发器,您可以最大限度地减少服务之间的直接https://blog.51cto.com/jowin/7396611
17.ATP提供近实时响应能力的NAND闪存解决方案,迎接数据驱动5G时代的对于要求低延迟和快速吞吐量的5G应用,ATP提供了超快的可移动和嵌入式闪存存储解决方案,可提供近实时的响应能力。例如,具有8通道PCIe Gen3 x4接口的M.2 2280 NVMe模块可提供3,420 / 3,050 MB / s的顺序读/写性能,而3D TLC SD / microSD卡具有4KB页面管理和SLC缓存算法。与传统解决方案相比,允许1 / 2随机https://www.atpinc.com/cn/blog/SSD-hardware-requirements-for-5G
18.广东:力争2025年市场化需求响应削峰能力达到最高负荷的5%健全电力需求响应市场化机制,提升需求响应能力,支持用户侧储能、电动汽车充换电基础设施、分布式发电等用户侧可调节资源,以及负荷聚合商、虚拟电厂运营商、综合能源服务商等参与市场化需求响应,打造实时可观、可测、可控的需求响应系统平台,力争2025年广东省市场化需求响应削峰能力达到最高负荷的5%。http://www.stcn.com/article/detail/873936.html
19.老人聊天机器人智能123BOT智能聊天机器人作为一款创新的人工智能产品,具有智能对话能力、个性化定制服务和跨平台应用等特点。它在客服、教育和销售等领域都有广泛的应用。与传统的客服和人工智能产品相比,123BOT智能聊天机器人具有节省成本、提升用户体验和实时响应等优势。随着技术的不断进步,123BOT智能聊天机器人有望在未来发展壮大,为人们http://chatgpt.cmpy.cn/article/5467042.html
20.探析美军网络防御装备新技术发展的五大方向二、实时响应网络威胁,提升威胁智能自动处理能力 网络空间攻击行动以接近光速传播和实施,并且能够对特定目标造成整体性的影响,这种瞬间和整体攻击能力也成为网络空间军事行动的特质。人工智能和自动化的技术发展为美军网络安全带来了新的发展机遇,成为美军提升网络安全能力的倍增器。在网络安全主动防御智能检测方面,基于人工智https://www.secrss.com/articles/23580