大数据平台概要设计说明书

大数据泛指巨量的数据集,因可从中挖掘出有价值的信息而受到重视。《华尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技

,20002014年将是2001年

信息爆炸不自今日起,但近年来人们更加感受到大数据的来势迅猛。一方面,网民数量不断增加,另一方面,以物联网和家电为代表的联网设备数量增长更快。2007年全球有5亿个设备联网,人均0.1个;2013年全球将有500亿个设备联网,人均70个。随着宽带化的发展,人均网络接入带宽和流量也迅速提升。全球新产生数据年增40%,即信息总量每两年就可以翻番,这一趋势还

1.2

1.3对象及范围

1、开发人员、DBA、测试人员;

2、研发主管领导、产品人员;

1.4参考资料

1、《大数据处理体系架构》

2、《HBaseTheDefinitiveGuide》

3、《》

4、《

2.

2.1

2.2

Kettle4.3

MySQL5.1

硬件环境:8核16G内存PC服务器8台

2.3基本设计思路和处理流程

1、按照数据分析的实时性,分为在线数据分析和离线数据分析。

2、在线数据分析:往往要求系统在数秒内返回上亿行数据的分析,从而才能达到不影响用户体验的目的。

4体系5、

2.4系统结构

大数据运算系统架构图

大数据平台系统功能图

系统功能图逻辑说明1)

生产系统的源数据通过sqoop,flume,Kettle等获取后保存在Kafka消

息队列中或者保存到hadoop的hdfs系统中。2)

调度系统负责自身的控制功能,通过读取调度控制的配置信息调用驱动

系统传递过来的模版信息,读取模版信息,并执行相应的驱动操作。日志存储

统计分析

数据应

Hadoop(HDFS、HBASE)

在线计算:

Storm流计算框架离线计算:

Hadoop(Map/Reduce、Hive、pig)

日志采集

日志采集系统Flume

数据服务

数据提取,报表展现,

统计、分析数据存储,数据接口MongoDB、MySql

大数据平台功能结构图

大数据平台功能结构图说明:

2)计算平台分为基础运算部分,模版管理部分,驱动代理部分,系统调度部分。3)计算平台分为离线计算与实时计算两种形式。

4)计算平台基于模版的功能开发,实际应用中做到模版的热插拔,对于功能需求只需要开发相应的模版,并部署上计算平台即可应用。

2.5尚未解决的问题

3.模块/功能设计

3.1调度模块

设计思路

一:调度模块实现功能思路

二:流程说明以及注意事项:

1、任务与步骤采用配置表的方式保存在mysql中,调度程序定时扫描任

务表,判断是否有启动的任务,如果有启动的任务,则启动任务。

2、调度任务需要判断任务中步骤之间的依赖关系,根据依赖关系判断是

否可以执行下一步的执行步骤。

3、一个任务中可以包含多个步骤,每个步骤为一个具体的任务,步骤与

步骤直接存在依赖关系。

4、对于具体的执行任务将由驱动代理自动完成。

流程图

处理逻辑

1、调度任务启动后扫描任务配置表,看任务配置表是否存在需要处理的任务信息,如果不存在需要处理的任务信息,则线程执行休眠,否则执行步骤2;

2、生成数据日期,并检查任务依赖关系,如果依赖关系未执行完,则现成等待操作,等待依赖的任务执行完成,如果依赖关系都执行完,则获取符合条件的任务,执行步骤3:

3、读取任务信息表,获取任务信息,根据任务信息读取步骤信息,执行相应的

步骤操作,执行步骤4;

4、根据步骤信息的配置获取需要执行的相应的模版信息,调用驱动代理程序执行相应的功能,执行步骤5;

5、驱动代理程序执行模版初始化,初始化完成后获取相应的参数数据,并根据模版类型选择具体的驱动程序,执行相应的操作。

6、判断该任务的下步骤是否执行完成,如果未执行完成,则执行步骤3,继续下一个步骤的执行,否则执行步骤7;

7、写步骤完成信息表,判断是否还存在要执行的任务,如果没有等待,存在需要执行的任务则执行步骤3.

3.2驱动代理模块

一:计算驱动模块实现功能思路

2、基于业务模版的设置操作,调度执行业务模版,不关心模版具体业务形态。

3、一个驱动应用包含四个步骤:1)删除不用的数据;2)加载数据;3)运算;4)导出结果文件。

4、提供监控需要的相应信息。

5、对于文件的操作,会涉及到多个文件或者目录操作,多个文件或者目录以逗号分隔,对文件操作中涉及到一些按照小时,天,月份的文件命名的操作,配置中以特殊字符进行替换。

THE END
1.图书管理系统软件设计说明书.pdf软件设计说明书 1.介绍 1.1目的 这篇文档是在图书管理系统概要设计书基础上,对概要设计中产生的功能模块进行过 程描述,设计功能模块的内部细节,包括算法和详细数据结构,为编写源代码提供必要的 说明。 1.2范围 介绍了图书管理系统的登录系统、注册系统、浏览图书系统、借阅预订系统。 https://m.book118.com/html/2024/0510/5241304132011204.shtm
2.图书管理系统的概要设计说明书和详细设计说明书概要设计说明书是软件开发过程中的重要文档之一,它是在需求分析和系统设计之后,对系统进行总体设计的阶段。概要设计说明书的主要内容包括系统的结构设计、模块划分、数据结构和算法设计等。以下是图书管理系统概要设计说明书的主要内容: 系统结构设计 图书管理系统主要由用户界面、业务逻辑层、数据访问层和数据存储层四个https://wenku.csdn.net/answer/6f20ebc2391b4471bee3dbcbd272ed2f
3.图书管理系统概要设计说明书瓯雅爱分享的技术博客需求分析说明书、概要设计说明书、详细设计说明书部分样例 以下是需求分析说明书、详细设计说明书、概要设计说明书样例,需要的朋友来信联系。rjgczj@ 概要设计说明书 需求分析说明书 详细设计说明书 x系统 系统功能 java概要设计说明书范例 # Java概要设计说明书范例与解析在软件开发中,概要设计说明书是贯穿整个软件开https://blog.51cto.com/u_16434577/9232126
4.图书管理系统说明书6篇(全文)在下一阶段的详细设计中,程序设计员可参考此概要设计报告,在概要设计对图书借阅管理系统所做的模块结构设计的基础上,对系统进行详细设计。在以后的软件测试以及软件维护阶段也可参考此说明书,以便于了解在概要设计过程中所完成的各模块设计结构,或在修改时找出在本阶段设计的不足或错误。 https://www.99xueshu.com/w/file9ehwbg3j.html
5.图书管理系统概要设计说明书.doc.1编写目的本说明是任务管理项目软件产品的总体设计和实现说明,记录了系统整体实现上技术层面上的考虑,并且以需求说明作为依据,同时该文档将作为产品实现、特性要求和控制的依据。软件开发小组的每一位参与开发成员应该阅读本说明,以清楚产品在技术方面的要求和实现策略,本手册将进行技术评审和技术的可行性检查,同时为下https://www.iteye.com/resource/zcf0808-1209064
6.图书管理系统概要设计报告图书管理系统概要设计报告八篇.docx篇三:图书管理系统概要设计说明书图书管理系统概要设计说明书学生姓名:赵明学号:08101044025学院:计算机科学学院班级:计算机科学与技术四班一、引言1.1编写目的本文档的编写是为了完善图书管理系统软件的开发途径和应用方法。以求在最短的时间高效的开发图书管理系统。1.2背景本项目的名称:图书管理系统开发软件。本项目的任务https://www.renrendoc.com/paper/268101583.html
7.系统说明书Word模板系统说明书Word模板下载熊猫办公网站共为您提供10000个系统说明书设计素材以及精品系统说明书Word模板下载,汇集全球精品流行的系统说明书Word完整版模板,下载后直接替换文字图片即可使用,方便快捷的不二选择。https://m.tukuppt.com/wordmuban/xitongshuomingshu.html
8.软件工程实验报告:图书管理系统腾讯云开发者社区2.2 内容要求 1)对所设计和实现的系统进行可行性分析,提交可行性分析报告; 2)对系统进行需求分析,可以选择传统的分析方法或者面向对象的分析方法,提交软件需求规格说明书(SRS); 3)在SRS的基础上进行软件的概要设计和详细设计,提交软件设计文档; 4)遵循上述文档的要求,实现软件; 5)对所实现系统进行软件测试,完成软https://cloud.tencent.com/developer/article/2119064
9.软件详细设计说明书模板大全实用工具详细设计说明书又可称程序设计说明书。编制目的是说明一个软件系统各个层次中的每一个程序 (每个模块或子程序)的设计考虑,如果一个软件系统比较简单,层次很少,本文件可以不单独编写,有关内容合并入概要设计说明书。 很多同学刚开始做软件详细设计时不知道如何编写详细设计说明书,本文提供各类软件详细设计说明书模板供参https://www.gaoxiaobo.com/tools/198.html
10.图书管理系统项目总结(精选14篇)图书馆管理系统的主要功能在于对纸质书籍和期刊的管理,因此对于数字资源缺乏兼容性。随着数字图书馆和数字资源的迅速发展,不少图书馆在数字资源建设上的费用正逐步超过纸质资源,但现有的图书馆管理系统却无法整合这数字资源,数字资源和纸质资源、传统的文献服务与现代数字信息资源的服务是处于隔离状态的,对于图书馆整合馆藏https://www.hrrsj.com/gongzuozongjie/xiangmuzongjie/831296.html
11.图书管理系统详细设计说明.doc文档介绍:该【图书管理系统详细设计说明 】是由【lajie】上传分享,文档一共【25】页,该文档可以免费在线阅读,需要了解更多关于【图书管理系统详细设计说明 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印https://m.taodocs.com/p-966032126.html
12.图书管理系统接口设计(图书管理系统技术方案)本篇文章给大家谈谈图书管理系统接口设计,以及图书管理系统技术方案对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。今天给各位分享图书管理系统接口设计的知识,其中也会对图书管理系统技术方案进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧! 本文目录一览: 1、图书馆管理系统设计论文 https://www.eolink.com/news/post/52904.html
13.图书馆管理系统er图第三章图书管理系统设计分析 §4.1应用需求分析 图书管理系统需要满足来自三方面的需求,这三个方面分别是图书借阅者、图书馆工作人员和图书馆管理人员。图书借阅者的需求是查询图书馆所存的图书、个人借阅情况及个人信息的修改;图书馆工作人员对图书借阅者的借阅及还书要求进行操作,同时形成借书或还书报表给借阅者查看确https://www.zboao.com/cgal/9078.html
14.可行性分析研究报告(精选10篇)该项目是以依托万亩果园农业观光基地并充分利用身处龙泉山脉得天独厚的自然生态环境,采用现代化的农业生产运作模式进行经营管理,辅以旅游设施和服务,经过精心规划设计和施工,将农业的生产、生态与生活三者结合,形成一片富有田园情趣和地方特色的现代化农业科技生态观光园。 https://www.ruiwen.com/gongwen/baogao/829650.html