CDALEVELⅡ?数据分析师考试?纲

考试题型:客观题(单选+多选)+上机建模题

考试内容:第一阶段,90分钟,客观题(单选+多选),上机答题;第二阶段120分钟,案例操作,自行携带电脑操作,案例数据将统一提供CSV文件。

针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。

1.领会:考生能够领会了解规定的知识点,并能够了解规定知识点的内涵与外延,了解其内容要点和它们之间的区别与联系,并能做出正确的阐述、解释和说明。

a.大数据分析基础(1%)

b.Python基础(5%)

c.Linux&Ubuntu操作系统基础(2%)

a.Hadoop安装配置及运行机制解析(2%)

b.HDFS分布式文件系统(2%)

c.MapReduce理论及实战(2%)

d.Hadoop生态其他常用组件(6%)

a.数据库导论(2%)

b.MySQL理论及实战(3%)

c.HBase安装及使用(3%)

d.Hive安装及使用(5%)

e.Sqoop安装及使用(3%)

a.数据挖掘的基本思想(2%)

b.数据挖掘基本方法介绍(2%)

c.有监督学习算法(4%)

d.无监督学习算法(2%)

a.Spark基础理论(2%)

b.SparkRDD基本概念及常用操作(3%)

c.Spark流式计算框架SparkStreaming、StructuredStreaming(5%)

d.Spark交互式数据查询框架SparkSQL(5%)

e.Spark机器学习算法库SparkMLlib基本使用方法(15%)

f.Spark图计算框架GraphX(5%)

a.数据可视化入门基础(1%)

b.Python数据可视化入门(2%)

c.Python高级数据可视化方法(1%)

a.利用HDFSShell操作HDFS文件系统(1%)

b.利用HiveSQL进行数据清洗(2%)

c.利用Sqoop进行数据传输(1%)

d.利用SparkSQL进行数据读取(2%)

e.利用SparkMLlib进行机器学习建模(8%)

f.利用Python进行建模结果数据可视化(1%)

Hive中的数据库概念、修改数据库

创建表、管理表、外部表、分区表、删除表

Hive中的命令语句是类SQL语句

SELECT…FROM语句

使用列值进行计算、算术运算符、使用函数、列别名、嵌套SELECT语句、WHERE语句、groupby语句、集合运算、多表连接、内连接、外连接、笛卡尔积连接、orderby语句、抽样查询、视图。

Sqoop是一个数据转储工具,它能够将HadoopHDFS中的数据转储到关系型数据库中,也能将关系型数据库中的数据转储到HDFS中。

Sqoop链接数据库需要JDBC的支持

Sqoop的安装方法从HadoopHDFS向MySQL导入数据从MySQL向HadoopHDFS导入数据

说明:推荐学习书目中考生可根据自身需求选择性学习。参考书目不需全部学完,根据考纲知识点进行针对性学习即可。

THE END
1.数据挖掘的应用嘲有哪些数据挖掘的应用场景主要有: 1、金融公司、银行的分析场景; 2、医疗保健领域和保险领域; 3、在交通运输领域中的应用; 4、数据挖掘在医学领域的应用; 5、教育; 6、制造工程。此外可以利用大数据实现智能交通、环保监测、城市规划和智能安防。车辆监控,车辆调度,通过流量分析,进行公交线路调整,通过大数据分析预测路段车辆https://www.linkflowtech.com/news/2012
2.数据挖掘的应用嘲都有哪些?数据挖掘的应用场景都有哪些? 1.教育领域 数据挖掘技术的应用已经渗入到教育教学的各个方面,如支持教育科学决策、实施个性化教育、对学生的学业成绩进行评估等。数据挖掘的实际应用逐渐突破了传统的教学模式,改善了教学效果,促进了教学质量的提升。 2.风控领域https://m.hqqt.com/webnews/16092935968229.html
3.研究丨嘲:大数据挖掘的新标准这些数据为用户生活提供了便利,但数据剩余、数据滥用和隐私暴露问题却成为了新时期的焦点。要使得这些数据更好的为受众所用,需要真正的找到目标受众。新媒体时代,要真正的找到目标受众,就要确定受众的精准方向,保证他们长期的忠诚度和深度卷入,因此,提出基于场景的大数据挖掘概念。https://www.51cto.com/article/520776.html
4.数据挖掘的实践案例:如何将理论知识应用到实际问题中数据挖掘是一种利用统计学、机器学习、操作研究、知识发现和数据库等方法从大量数据中发现新的、有价值的信息和知识的过程。数据挖掘可以帮助企业更好地理解市场、优化业务流程、提高产品质量、提高客户满意度等。数据挖掘的应用范围广泛,包括市场营销、金融、医疗保健、生物信息学、气候变化等领域。 https://blog.csdn.net/universsky2015/article/details/135803267
5.挖掘数据应用嘲有哪些帆软数字化转型知识库挖掘数据的应用场景有商业决策、市场营销、风险管理、客户关系管理、医疗健康、金融服务、物流管理、智能制造、公共服务和教育等。商业决策是其中应用最广泛且最重要的一个方面,通过数据挖掘,企业可以识别出市场趋势、客户需求和竞争对手的动向,从而制定更精确的商业策略。比如,零售企业可以利用数据挖掘分析消费者的购买行为https://www.fanruan.com/blog/article/569103/
6.人工智能算法的应用嘲有哪些问答人工智能算法的应用场景非常广泛,包括但不限于以下几个方面:1. 自然语言处理:人工智能算法可以用于自动翻译、文本情感分析、语音识别、机器翻译、信息抽取等任务。2. 机器学习和数据挖掘:人工智能算法可以用于数据分类、聚类、回归分析、推荐系统等任务。3. 图像识别和计算机视觉:人工智能算法可以用于图像分类、目标检测https://www.yisu.com/ask/66526168.html
7.遗传算法应用嘲有哪些数据挖掘 BML Codelab基于JupyterLab 全新架构升级,支持亮暗主题切换和丰富的AI工具,详见使用说明文档。 遗传算法的应用场景有:1.欺骗深度学习(通过生成某些混乱的图片对模型进行欺骗)。2.生成正则表达式(控制正则表达式的长度)。3.机器人路径规划(路径探索)。4.诗词生成等方面(进行语义加权)5.函数优化(优化函数的最https://aistudio.baidu.com/aistudio/projectdetail/5108440
8.计算机视觉五大核心研究任务全解:分类识别检测分割人体分析实例分割:更细致地在视频中对单个实例进行分割,应用场景包括医学影像、智能监控等。 2.5.4 视频摘要与高亮检测 视频摘要与高亮检测的目的是从大量视频数据中提取关键信息。 基于关键帧的方法:选择具有代表性的帧作为摘要,用于快速浏览或索引。 基于学习的方法:如使用强化学习选择精彩片段,应用于自动生成比赛精彩时刻回放https://developer.aliyun.com/article/1424822
9.(转载)微软数据挖掘算法应用嘲介绍ThinkDifferentMicrosoft关联规则算法就是用来挖掘关联关系的典型算法 需求场景: 关联规则算法是在大量数据事例中挖掘项集之间的关联或相关联系,它典型的应用就是购物篮分析,通过关联规则分析帮助我们发现交易数据库中不同的商品(项)之间的联系,找到顾客购买行为模式,如购买某一个商品对其它商品的影响。进而通过挖掘结果应用于我们的超市https://www.cnblogs.com/littlewu/p/6063402.html
10.工信部发布5G+工业互联网应用嘲和应用行业本文总结了“5G+工业互联网”在协同研发设计、远程设备操控、设备协同作业、柔性生产制造、现场辅助装配、机器视觉质检、设备故障诊断、厂区智能物流、无人智能巡检和生产现场监测十大典型应用场景和电子设备制造业、设备制造业、钢铁行业、采矿行业和电力行业5个重点行业的典型应用情况,向更多行业和企业应用“5G+工业互联网http://yunrun.com.cn/news/3801.html
11.国网浙江电力:多嘲绿氢应用示范,探路“双碳”新支柱千百年来,如何挖掘能源,为我所用,一直是人类孜孜以求的目标。在经济高质量发展和“双碳”目标稳步推进的背景下,氢能因具有终端清洁低碳属性和跨界应用潜力,在构建清洁低碳安全高效的能源体系,助力能源电力行业实现绿色转型之路上,正成为聚光灯下的“金矿”。https://www.thehour.cn/news/565042.html
12.各种机器学习的应用嘲分别是什么?雷峰网雷锋网按:本文作者xyzh,本文整理自作者在知乎问题《各种机器学习的应用场景分别是什么?》下的回答, 雷锋网获其授权发布。 关于这个问题我今天正好看到了这个文章,讲的正是各个算法的优劣分析,很中肯。 正好14年的时候有人做过一个实验[1],比较在不同数据集上(121个),不同的分类器(179个)的实际效果。 https://www.leiphone.com/news/201712/RqsxWpjPOPFy6Qm4.html