万字长文解读最新最全的大数据技术体系图谱!

从这张图谱可以看到,大数据技术体系可以归纳总结为数据分析应用技术、数据管理技术、基础技术、数据安全流通技术四大方向,每个方向大数据技术的产生都有其独特的背景。

1、基础技术:主要为应对大数据时代的多种数据特征而产生

大数据时代数据量大,数据源异构、数据时效性高等特征催生了高效完成海量异构数据存储与计算的技术需求。面对迅速而庞大的数据量,传统集中式计算架构出现难以逾越的瓶颈,传统关系型数据库单机的存储及计算性能有限,出现了规模并行化处理(MPP)的分布式计算架构,如分析型数据库GreenGreenplum。

面对分布式架构带来的海量分布式系统间信息协同的问题,出现了以Zoomkeeper为代表的分布式协调系统;为了将分布式集群中的硬件资源以一定的策略分配给不同的计算引擎和计算任务,出现了Yarn等集群管理及调度引擎;面对海量计算任务带来的管理复杂度大幅提升问题,出现了面向数据任务的灵活调度工作流平台。

面向海量网页内容及日志等非结构化数据,出现了基于ApacheHadoop和Spark生态体系的分布式批处理计算框架;面向对于时效性数据进行实时计算反馈的需求,出现了ApacheStorm、Flink等分布式流处理计算框架。

面对大型社交网络、知识图谱的应用要求出现了以对象关系存储和处理为核心的分布式图计算引擎和图数据库,如GraphX、neo4j等;面对海量网页、视频等非结构化的文件存储需求,出现了mongoDB等分布式文档数据库;面向海量设备、系统和数据运行产生的海量日志进行高效分析的需求,出现了influxdb等时序数据库;面对海量的大数据高效开放查询的要求,出现了以Redis为代表的K-V数据库。

面向大规模数据集的高效、可靠及低成本的存取问题,出现了HDFS、OpenIO等分布式文件存储和对象存储解决方案。

2、数据管理类技术:助力提升数据质量与可用性

技术总是随着需求的变化而不断发展提升,在较为基本和急迫的数据存储、计算需求已经在一定程度满足后,如何将数据转化为价值成为了下一个主要需求。

最初,企业与组织内部的大量数据因缺乏有效的管理,普遍存在着数据质量低、获取难、整合不易、标准混乱等问题,使得数据后续的使用存在众多障碍,在此情况下,用于数据整合的数据集成技术,如DataX、用于数据架构管理的数据建模技术,如ERWIN,用于数据资产管理的元数据技术,如Apacheatlas,纷纷出现。

3、数据分析应用技术:发掘数据资源的内蕴价值

各种用以发掘数据价值的数据分析技术纷纷出现,包括ECHARTS、BI工具为代表的简单统计分析与可视化展现技术,以传统机器学习、基于深度神经网络的深度学习、图分析引擎为基础的挖掘分析建模技术等等。

4、数据安全流通技术:助力安全合规的数据使用及共享

在数据价值释放初现曙光的同时,数据安全问题也愈加凸显,数据泄露、数据丢失、数据滥用等安全事件层出不穷,对国家、企业和个人用户造成了恶劣影响,如何应对大数据时代下严峻的数据安全威胁,在安全合规的前提下共享及使用数据成为了备受瞩目的问题、访问控制、身份识别、数据加密、数据脱敏等传统数据保护手段正积极向更加适应大数据场景的方向不断发展,同时,侧重于实现安全数据流通的隐私计算技术也成为了热点发展方向。

一、基础技术

1、流计算

产品举例:

STORM:一个开源的分布式实时计算框架,可以以简单、可靠的方式进行大数据流的处理

SparkStreaming:接收实时输入的数据流,并将数据拆分为一系列批次,然后进行微批处理,SparkStreaming能够将数据流进行极小粒度的拆分,使得其能够得到接近于流处理的效果,但其本质上还是批处理

Flink:一种针对流数据批数据的计算框架,其把批数据看作流数据的一种特例,延迟性较低(毫秒级),且能够保证消息传输不丢失不重复

2、批量计算

批量计算是指对静态数据的批量处理,即当开始计算之前数据已经准备到位,主要用于数据挖掘和验证业务模型,包括MapReduce、spark、hive等等。

HadoopMapReduce:一种编程模型,用于大规模数据集(大于1TB)的并行运算,概念'Map(映射)'和'Reduce(归约)'是它们的主要思想,极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上

spark:拥有HadoopMapReduce所具有的优点,但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的场景

hive:基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制

3、图计算

以图作为数据模型来表达问题并予以解决的过程,包括GraphLab、GraphX、Giraph及Gelly等等。

GraphX:一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求

Giraph:Facebook搞的图计算引擎,基于hadoop,编程模型接近于Pregel,主要卖点是支持大图

4、分布式协调系统

分布式协调技术主要用来解决分布式环境当中多个进程之间的同步控制,让他们有序的去访问某种临界资源,防止造成'脏数据'的后果,主要包括Zoomkeeper、eureka、consul等等。

Zoomkeeper:一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等

eureka:Eureka是Netflix开发的服务发现框架,本身是一个基于REST的服务,主要用于定位运行在AWS域中的中间层服务,以达到负载均衡和中间层服务故障转移的目的

consul:google开源的一个使用go语言开发的服务发现、配置管理中心服务。内置了服务注册与发现框架、分布一致性协议实现、健康检查、Key/Value存储、多数据中心方案,不再需要依赖其他工具

5、集群管理及调度

主要负责将集群中的硬件资源以一定的策略分配给不同的计算任务,主要包括Ambori、MESOS、YARN等等。

Ambori:一种基于Web的工具,支持ApacheHadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、Hbase、Zookeeper、Sqoop和Hcatalog等等

MESOS:可以将整个数据中心的资源(包括CPU、内存、存储、网络等)进行抽象和调度,让应用共享集群资源,并无需关心资源的分布情况

YARN:一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处

6、工作流管理

工作流含义很广,这里指能对各种数据任务进行灵活编排和调度的工具,包括Airflow、nifi、Oozie等等,很多企业大数据工作流管理都跟自身的数据开发管理平台紧耦合。

nifi:Apache支持下基于可视化流程设计的数据分发平台,是大数据的搬运、提取、推送、转换、聚合、分发的开源软件工具,能够与Hadoop生态系统的大数据存储和各种文件、REST服务、SOAP服务、消息服务等联合使用,构成一体化的数据流服务

Oozie:起源于雅虎,主要用于管理与组织Hadoop工作流。Oozie的工作流必须是一个有向无环图,实际上Oozie就相当于Hadoop的一个客户端,当用户需要执行多个关联的MR任务时,只需要将MR执行顺序写入workflow.xml,然后使用Oozie提交本次任务,Oozie会托管此任务流

7、图数据库

NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷,主要包括ArangoDB、neo4j、OrientDB等等。

ArangoDB:一个原生多模型数据库,兼有key/value键/值对、graph图和document文档数据模型,提供了涵盖三种数据模型的统一的数据库查询语言,并允许在单个查询中混合使用三种模型

neo4j:一个高性能的NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中,Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性

OrientDB:一个开源的多模型NoSQL数据库,支持原生图形、文档全文、响应性、地理空间和面向对象等概念。它使用Java编写,速度非常快:在普通硬件上,每秒可存储220,000条记录。对于文档数据库,它还支持ACID事务处理

8、文档数据库

文档数据库被用来管理文档,在传统的数据库中,信息被分割成离散的数据段,而在文档数据库中,文档是处理信息的基本单位,包括mongoDB、CouchDB、MarkLogic等等。

mongoDB:一个基于分布式文件存储的数据库。由C语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案,它支持的数据结构非常松散,是类似json的bson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是它支持的查询语言非常强大

CouchDB:一个开源的面向文档的数据库管理系统,可以通过RESTfulJavaScriptObjectNotation(JSON)API访问。术语“Couch”是“ClusterOfUnreliableCommodityHardware”的首字母缩写,它反映了CouchDB的目标具有高度可伸缩性,提供了高可用性和高可靠性,即使运行在容易出现故障的硬件上也是如此

MarkLogic:一种NoSQL数据库,能同时储存结构化和非结构化数据解决方案,包括JSON、XML、RDF、坐标、二进制数据(PDF、图片、视频)等等,而不仅仅是结构化的数据存储

9、时序数据库

influxdb:一个由InfluxData开发的开源时序型数据库。它由Go写成,着力于高性能地查询与存储时序型数据

10、分析型数据库

面向分析应用的数据库,与传统的数据库不同,它可以对数据进行在线统计、数据在线分析、随即查询等操作,是数据库产品一个重要的分支,主要包括Greenplum、VERTICA、GBASE等等。

VERTICA:一款基于列存储的MPP(massivelyparallelprocessing)架构的数据库

Clickhouse:一款MPP架构的列式存储数据库,其从OLAP场景需求出发,定制开发了一套全新的高效列式存储引擎,并且实现了数据有序存储、主键索引、稀疏索引、数据Sharding、数据Partitioning、TTL、主备复制等丰富功能。以上功能共同为ClickHouse极速的分析性能奠定了基础

11、KV数据库

是一种以键值对存储数据的一种数据库,类似java中的map。可以将整个数据库理解为一个大的map,每个键都会对应一个唯一的值。key-value分布式存储系统查询速度快、存放数据量大、支持高并发,非常适合通过主键进行查询,但不能进行复杂的条件查询,主要包括redis、TAIR及memcached等等。

redis:一个开源的使用ANSIC语言编写、遵守BSD协议、支持网络、可基于内存、分布式、可选持久性的键值对(Key-Value)存储数据库,并提供多种语言的API

TAIR:是阿里云数据库Redis企业版,是基于阿里集团内部使用的Tair产品研发的云上托管键值对缓存服务。Tair作为一个高可用、高性能的分布式NoSQL数据库,专注于多数据结构的缓存与高速存储场景,完全兼容Redis协议

memcached:是一个自由开源的、高性能、分布式内存对象缓存系统。

12、文件存储

文件存储的数据是以一个个文件的形式来管理,操作对象是文件和文件夹,存储协议是NFS、SAMBA(SMB)、POSIX等,它跟传统的文件系统如Ext4是一个类型的,但区别在于分布式文件存储提供了并行化的能力,主要包括HDFS、ceph、GlusterFS等等。

HDFS:指被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem),是一个高度容错性的系统,适合部署在廉价的机器上,能提供高吞吐量的数据访问,非常适合大规模数据集上的应用

ceph:是一个统一的分布式存储系统,设计初衷是提供较好的性能、可靠性和可扩展性

GlusterFS:一个可扩展的网络文件系统,相比其他分布式文件系统,GlusterFS具有高扩展性、高可用性、高性能、可横向扩展等特点,并且其没有元数据服务器的设计,让整个服务没有单点故障的隐患

13、对象存储

也称为基于对象的存储,是一种数据存储,其中每个数据单元存储为称为对象的离散单元。对象可以是离散单元,类似于pdf,音频,图像或视频文件。这些对象实际上可以是任何类型的数据和任何大小的数据。对象存储中的所有对象都存储在单个平面地址空间中,而没有文件夹层次结构。一个对象通常包含三个部分:对象的数据、对象的元数据以及一个全局唯一的标识符(即对象的ID),采用分布式架构,容量和处理能力弹性扩展,存储协议是S3、Swift等,主要包括OpenIO、MINIO及Cloudreve等等。

OpenIO:一个开源的对象存储解决方案,用于大规模面向性能要求的低延迟的存储架构,特别为体积小量大的存储对象,发布容易,添加存储设备无需对数据进行重新分配

MINIO:GlusterFS创始人之一AnandBabuPeriasamy发布新的开源项目。Minio兼容Amason的S3分布式对象存储项目,采用Golang实现,客户端支Java,Python,Javacript,Golang语言。Minio可以做为云存储的解决方案用来保存海量的图片,视频,文档。由于采用Golang实现,服务端可以工作在Windows,Linux,OSX和FreeBSD上

Cloudreve:一款国人开发的开源免费的网盘系统,借助Cloudreve你能够快速搭建起公私兼备的网盘。Cloudreve支持使用七牛云存储、阿里云OSS、又拍云、AmazonS3等对象存储作为存储后端,也支持本地服务器、远程服务器和OneDrive等作为存储后端,另外也支持aria2离线下载

二、数据管理技术

1、元数据管理

元数据管理统一管控业务元数据、技术元数据、管理元数据等等,并面向开发人员、最终用户提供元数据服务,对业务系统和数据分析平台的开发、维护过程提供支持,元数据管理软件包括Apacheatlas等等,各个行业大多有自己独特的元数据管理软件。

Apacheatlas:为组织提供开放式元数据管理和治理功能,用以构建其数据资产目录,对这些资产进行分类和管理,并为数据分析师和数据治理团队提供围绕这些数据资产的协作功能

MetaCube:普元发布的全面支撑自服务的大数据治理平台

2、数据集成

DataX:DataX是阿里开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能

Kettle:一款国外开源的ETL工具,纯Java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)

3、数据建模

数据建模指的是对现实世界各类数据的抽象,包括建立数据库实体以及各实体之间的关系等等,主要包括的产品为erwin、PowerDesigner等等。

erwin:业界领先的数据建模解决方案,提供一个简单的,可视化界面来管理复杂的数据环境

PowerDesigner:Sybase的企业建模和设计解决方案,采用模型驱动方法,将业务与IT结合起来,可帮助部署有效的企业体系架构,并为研发生命周期管理提供强大的分析与设计技术

三、数据分析应用技术

1、BI工具

BI即商业智能,无需编程的数据可视化工具,是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策,包括tableau、FineBI、PowerBI、spagobi、QuickBI、QlikView、iCharts、Grow、Visme、Datawrapper等等。

tableau:人人可用的数据可视化分析工具

FineBI:帆软新一代自助大数据分析BI工具

PowerBI:微软用于分析数据和共享见解的一套可视化业务分析工具

spagobi:开源商业智能套件

QuickBI:阿里轻量级自助BI工具服务平台

2、数据可视化开发工具

更为灵活的可视化编程开发工具,包括ECHARTS、D3.js、Plotly、Chart.js、GoogleCharts、EmberCharts、Chartist.js、Antv等等。

ECHARTS:最初由百度团队开源,基于JavaScript的数据可视化图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表

D3.js:用于数据可视化的开源的JavaScript函数库,被认为是很好的JavaScript可视化框架之一

Plotly:一个知名的、功能强大的数据可视化框架,可以构建交互式图形和创建丰富多样的图表和地图

Antv:蚂蚁金服全新一代数据可视化解决方案,致力于提供一套简单方便、专业可靠、无限可能的数据可视化最佳实践

3、数据挖掘平台

提供机器学习训练和发布的平台,数据挖掘可视化成为一种趋势,包括Angel、KNIME、RapidMiner、IBMSPSSModeler、OracleDataMining、SASDataMining、ApacheMahout、SparkMLlib、Python/R、PAI等等。

Angel:腾讯、香港科技大学等联合研发的使用Java和Scala语言开发,面向机器学习的高性能分布式计算框架

KNIME:一个用户友好、可理解、全面的开源数据集成、处理、分析和探索平台,它有一个图形用户界面,帮助用户方便地连接节点进行数据处理

RapidMiner:一款不需要编程就可以进行数据分析和数据挖掘的软件,简单易学,人机界面也十分友好

IBMSPSSModeler:以图形化的界面、简单的拖拽方式来快速构建数据挖掘分析模型著称,,它允许您在不编程的情况下生成各种数据挖掘算法

OracleDataMining:是OracleSQLDeveloper的一个扩展,数据分析师通过它能够查看数据、构建和评估多个机器学习/数据挖掘模型以及加速模型部署

SASDataMining:提供了一个易于使用的GUI,其描述性和预测性建模提供了更好的理解数据的见解,还包括可升级处理、自动化、强化算法、建模、数据可视化和勘探等先进工具

ApacheMahout:ApacheSoftwareFoundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序

Python/R:大家都懂的

4、深度学习引擎

提供深度学习训练和发布的平台,包括TensorFlow、PP飞浆、caffe2、Theano、keras、MXNet等等。

TensorFlow:一个使用数据流图(dataflowgraphs)进行数值计算的开源软件库,可以看成是一个嵌入Python的编程语言,你写的TensorFlow代码会被Python编译成一张图,然后由TensorFlow执行引擎运行

Theano:Theano是一个比较低层的库,它支持自动的函数梯度计算,带有Python接口并集成了Numpy,这使得它从一开始就成为了通用深度学习领域最常使用的库之一,由于它不支持多GPU和水平扩展,已然开始被遗忘

PyTorch:一个开源的Python机器学习库,本质上是Numpy的替代者,而且支持GPU、带有高级功能,可以用来搭建和训练深度神经网络

caffe2:PyTorch有优秀的前端,Caffe2有优秀的后端,整合起来以后可以进一步最大化开发者的效率

keras:一个由Python编写的开源人工神经网络库,是一个非常高层的库,可以作为Tensorflow、Microsoft-CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化,Keras强调极简主义——你只需几行代码就能构建一个神经网络

Deeplearning4j:为Java和Java虚拟机编写的开源深度学习库,是广泛支持各种深度学习算法的运算框架

PP飞浆:百度一个集深度学习核心框架、工具组件和服务平台为一体的技术先进、功能完备的开源深度学习平台

MXNet:亚马逊的一款设计为效率和灵活性的深度学习框架。它允许你混合符号编程和命令式编程,从而最大限度提高效率和生产力

cntk:微软出品的一个开源的深度学习工具包,可以运行在CPU上,也可以运行在GPU上。CNTK的所有API均基于C设计,因此在速度和可用性上很好

5、图分析

图分析使用基于图的方法来分析连接的数据,可以查询图数据,使用基本统计信息,可视化地探索图、展示图,或者将图信息预处理后合并到机器学习任务中,图分析引擎包括Gephi、NodeXL等等。

Gephi:是开源免费跨平台基于JVM的复杂网络分析软件,其主要用于各种网络和复杂系统,因它简单、易学、出图美观而备受青睐

NodeXL:是一个功能强大且易于使用的交互式网络可视化和分析工具,它以MSExcel(Excel2007或者Excel2010)模板的形式,利用MSExcel作为数据展示和分析平台

Palantir:是一种人和机器的高效结合的平台,它是一个数据分析平台,通过图(graphs)、地图(maps)、统计(statistics)、集合(settheory)论分析结构或非结构化数据

四、数据安全流通技术

1、隐私计算

指在保证数据提供方不泄露敏感数据的前提下,对数据进行分析计算并能验证计算结果的信息技术。广义上是指面向隐私保护的计算系统与技术,涵盖数据的产生、存储、计算、应用、销毁等信息流程全过程,想要达成的效果是使数据在各个环节中“可用不可见”,包括PrivateJoin&Compute、crypten、FedAI及FEDLEARNER等等。

crypten:Facebook开源的多方安全计算(MPC)的框架,其底层依赖于深度学习框架PyTorch

FedAI:联邦学习生态是一个促进AI多方建模的技术社区,使用联邦学习技术能够满足用户隐私保护、数据安全、数据保密和政府法规的要求

FEDLEARNER:字节跳动开源的联邦机器学习平台

2、数据脱敏

指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏在,主要包括DATPROF、IRI、ShardingSphere等等。

DATPROFPRIVACY:提供了一种掩盖和生成用于测试数据库的数据的智能方法,它以一种非常简单且经过验证的方式为子集数据库提供了获得专利的算法

IRI:IRI是一家成立于1978年的美国ISV,以CoSort快速数据转换,FieldShield数据屏蔽和RowGen测试数据产品而闻名。IRI还将这些捆绑在一起,并将数据发现,集成,迁移,治理和分析整合到一个称为Voracity的大数据管理平台中

ShardingSphere:ApacheShardingSphere是一套开源的分布式数据库中间件解决方案组成的生态圈,数据脱敏模块属于ShardingSphere分布式治理这一核心功能下的子功能模块。它通过对用户输入的SQL进行解析,并依据用户提供的脱敏配置对SQL进行改写,从而实现对原文数据进行加密,并将原文数据(可选)及密文数据同时存储到底层数据库。在用户查询数据时,它又从数据库中取出密文数据,并对其解密,最终将解密后的原始数据返回给用户

3、身份认证

指通过一定的手段,完成对用户身份的确认,身份验证的方法有很多,基本上可分为:基于共享密钥的身份验证、基于生物学特征的身份验证和基于公开密钥加密算法的身份验证,主要包括CAS、KEYCLOAK、Kerberos等等。

KEYCLOAK:一个为浏览器和RESTfulWeb服务提供SSO的集成

通过《白皮书》的指引,我们对于整个大数据技术体系会有一个基本了解,当然还会有缺失,比如数据分析应用技术大类中缺少了OLAP、基础技术中缺少了HTAP这种混合数据库等等,但已经比较全面了。

虽然我们没法也没必要去理解和掌握每一项大数据技术,但知道有这个技术的存在,大致知道其价值,从而在需要的时候想到它,无论是对于数据管理者或者是技术架构师,都是很重要的。

THE END
1.Springboot计算机毕业设计图书管理系统的设计与实现51ct5本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。 系统程序文件列表 项目功能: 用户,图书分类,图书信息,图书借阅,图书归还,图书预定,过期提醒 开题报告内容 基于Spring Boot的图书管理系统设计与实现开题内容报告 https://blog.csdn.net/ck3024/article/details/144287008
2.云原生存储方案设计:从容器持久化到分布式存储,数据存储架构设计通过对容器持久化数据需求的分析和分布式存储方案的介绍,我们可以得出结论:在云原生环境中,采用分布式存储方案能够更好地满足持久化数据的存储需求,保证数据的安全性和可靠性。因此,合理选择和设计适合自己应用场景的分布式存储方案将对云原生应用的性能和稳定性产生积极的影响。https://www.jianshu.com/p/b6247a40e35f
3.通过关系型数据库实现数据持久化应用数据持久化数据管理通过关系型数据库实现数据持久化 数据可靠性与安全性 数据可靠性与安全性概述 数据库备份与恢复 数据库加密 基于设备分类和数据分级的访问控制 文件管理 文件管理概述 应用文件 应用文件概述 应用沙箱目录 应用文件访问与管理 应用文件访问 应用文件上传下载 应用及文件系统空间https://developer.huawei.com/consumer/cn/doc/development/harmonyos-guides-V2/data-persistence-by-rdb-store-0000001505752421-V2
4.学校图书馆管理信息系统开发的可行性研究报告(通用10篇)该次系统开发的对象是银杏酒店管理学院,开发该系统的目的主要是对有关读者,书籍,借书,还书,存书等方面的信息进行统一管理,本系统结构分为读者信息管理模块、书籍信息管理模块、借阅信息管理模块和管理者信息管理模块。图书馆信息化是对信息管理系统化、科学化要求甚高的单位。通过该系统图书馆在很多个方面的效率都得到https://www.360wenmi.com/f/fileiv3v59e5.html
5.德国发布《德国国家区块链战略》海外视窗2.2 联邦政府正在试行一种基于区块链的能源设施与公共数据库的连接 2019年5月,联邦政府进行了一项可行性研究“基于区块链的能源设施注册和管理——智能电表网关”。研究结果将在今年年底公布。最近发布的中期报告形势乐观,在其积极结果的支持下,联邦政府已经开始准备试点基于区块链的能源设施与公共数据库的连接。项目阶段https://www.fjlib.net/zt/fjstsgjcxx/hwsc/202003/t20200304_431838.htm
6.计算机毕业设计开题报告(通用10篇)在日常办公中,通常会遇到许多常用的数据,比如邮件地址、日程助手、日常记事等,这些数据通常凌乱不堪,在需要时不知道存放在何处,从而影响工作效率。因此,我们设计了能满足这种需求的系统——中小企业办公自动化管理系统。 通过中小企业办公自动化管理系统对企业日常办公进行管理,满足了企业日常办公管理各方面的需求,实现了https://www.ruiwen.com/kaitibaogao/5228693.html
7.学生管理系统总体设计报告.docx学生管理系统总体设计报告《学生管理系统总体设计报告》篇一学生管理系统总体设计报告引言学生管理系统是教育机构中不可或缺的信息化工具,它的设计与实现直接关系到学生信息的准确性、教学管理的效率以及决策的科学性。本报告将详细介绍学生管理系统的总体设计,包括系统背景、目标、功能模块、技术选型、数据库设计、用户界面https://www.renrendoc.com/paper/324613576.html
8.数据库课程设计工资管理系统20240514063532.pptx免费在线预览全文 数据库课程设计工资管理系统 目录contents引言需求分析系统设计系统实现系统演示与操作指南课程总结与展望 01引言 目的设计并实现一个高效、稳定、易用的工资管理系统,以满足企业对员工工资管理的需求,提高工资核算的准确性和效率。背景随着企业规模的扩大和人力资源管理的复杂化,传统的手工处理工资核算的方https://max.book118.com/html/2024/0514/5223332223011210.shtm
9.MCA2024升级内容马士兵教育官网在数据库专题阶段, 我们 将深入学习各种数据库技术,包括MySQL、Oracle、PostgreSQL、Apache ShardingSphere、Mycat2和Neo4J 等技术栈,内容包括不限于数据库的基本操作和性能调优,数据库的底层原理,以及高级数据库操作优化内容。 通过这个阶段的学习,学员将具备数据库管理和优化的能力,能够设计复杂的数据库架构、解决数据库https://www.mashibing.com/white_paper/mca
10.知识产权信息范文11篇(全文)这三类信息蕴含了丰富的情报源,包括人的情报源,如技术人员;文献情报源,如期刊文章、报告等;混合情报源,如新闻发布会;网络情报源,如网络数据库(既有收费的商业数据库,也有免费的公共数据库)。它们是企业知识产权信息化管理的基础。 2 知识产权组合方式(信息加工) https://www.99xueshu.com/w/ikeye1ilweo2.html
11.Java项目开发全程实录(第三版)带目录完整pdf[22MB]电子书下载《Java项目开发全程实录(第3版)》以进销存管理系统、企业内部通信系统、企业人事管理系统、酒店管理系统、图书馆管理系统、企业快信、欣想电子商城、超市管理系统、企业门户网站、棋牌游戏系统之网络五子棋等10个实际项目开发程序为案例,从软件工程的角度出发,按照项目的开发顺序,系统、全面地介绍了J2SE和J2EE项目的开发流https://www.jb51.net/books/631514.html
12.基于.NET平台开发的图书管理系统本文介绍了以VS 2019(Microsoft Visual Studio 2019)为主要的开发工具,基于.NET平台开发的一套图书管理系统,主要运用了微软的http://ASP.NETMVC技术,它可以在Windows下正常运行,使用MySQL作为为数据库,IIS(Internet Information Services)网络信息服务作为应用服务器。该系统主要实现的功能有:管理员对账户进行管理;对图书https://zhuanlan.zhihu.com/p/529713299
13.图灵课堂Java就业培训教程视频课程大纲17-3 Redis持久化 17-4 Jedis代码操作 17-5 Jedis连接池 17-6 redis案例 第十八章: 就业课(2.023-1 MyCat与数据库集群 23-2 Nginx 第二十四章: 就业课-容器技术 24-1Docker 13-1 视频处理 13-2 媒资与课程计划关联 第十四章: 就业课(2.0)-媒资管理系统集成 https://www.tulingxueyuan.cn/tlzx/tljc/796.html
14.上海市育鹰学校“基于“基于教学改革融合信息技术的新型教与学支撑平台选用开放、可持续发展的技术架构,搭建稳定、灵活、开放的基础服务;实现业务数据整合共享,为师生提供一站式服务。 图:育鹰学校信息化建设总体规划 2.2.2.现有应用系统的情况 学校目前建设了图书馆系统、云课堂、教学资源库等业务系统,满足多媒体信息制作和宣传、数字创意课程的建设和实施。 http://www.yuying.edu.sh.cn/info/1076/8592.htm
15.支持事务的分布式NoSQL——FoundationDB腾讯云开发者社区FoundationDB集群具有用于管理关键系统元数据和群集范围编排的控制面板,以及用于事务处理和数据存储的数据面板,如下图所示。 控制平面 控制平面负责将关键系统元数据(即事务系统配置)持久化在协调器上。这些协调器形成一个Paxos组,并选举出一个集群控制器。集群控制器监控集群中的所有服务器,并维护三个进程:序列器、数据https://cloud.tencent.com/developer/article/2329183
16.浪潮云海首席科学家张东:面向一云多芯的系统设计方法其中,资源管理通过软件定义提供计算、存储、网络和安全等硬件资源抽象,以虚拟机、容器、裸金属(bare metal)等粒度为应用提供资源封装及运行环境;运行程序按照分层解耦分为资源层、平台层和应用层,例如,承载用户业务的应用程序、资源管理程序;数据状态是指程序运行所依赖的内存瞬时数据、数据库持久化数据及流量状态等。 https://www.cet.com.cn/itpd/itxw/3465583.shtml
17.java仓库信息管理系统基于java仓库管理系统本设计为一个基本的仓库管理系统,程序功能比较简单,贴近实际。系统对企业中常见的出库、入库、库存管理等商业活动以及相关的供应商等基本信息都进行了有效的管理。因而具有普遍的适用性,能够满足一般企业仓库的需要。本系统是采用My SQL数据库管理软件和My SQL作为系统的开发平台,使用Java语言进行程序开发。拥有友好的用户https://blog.51cto.com/u_14224/6781252