CDALEVELⅡ?数据分析师考试?纲

考试题型:客观题(单选+多选)+上机建模题

考试内容:第一阶段,90分钟,客观题(单选+多选),上机答题;第二阶段120分钟,案例操作,自行携带电脑操作,案例数据将统一提供CSV文件。

针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。

1.领会:考生能够领会了解规定的知识点,并能够了解规定知识点的内涵与外延,了解其内容要点和它们之间的区别与联系,并能做出正确的阐述、解释和说明。

a.大数据分析基础(1%)

b.Python基础(5%)

c.Linux&Ubuntu操作系统基础(2%)

a.Hadoop安装配置及运行机制解析(2%)

b.HDFS分布式文件系统(2%)

c.MapReduce理论及实战(2%)

d.Hadoop生态其他常用组件(6%)

a.数据库导论(2%)

b.MySQL理论及实战(3%)

c.HBase安装及使用(3%)

d.Hive安装及使用(5%)

e.Sqoop安装及使用(3%)

a.数据挖掘的基本思想(2%)

b.数据挖掘基本方法介绍(2%)

c.有监督学习算法(4%)

d.无监督学习算法(2%)

a.Spark基础理论(2%)

b.SparkRDD基本概念及常用操作(3%)

c.Spark流式计算框架SparkStreaming、StructuredStreaming(5%)

d.Spark交互式数据查询框架SparkSQL(5%)

e.Spark机器学习算法库SparkMLlib基本使用方法(15%)

f.Spark图计算框架GraphX(5%)

a.数据可视化入门基础(1%)

b.Python数据可视化入门(2%)

c.Python高级数据可视化方法(1%)

a.利用HDFSShell操作HDFS文件系统(1%)

b.利用HiveSQL进行数据清洗(2%)

c.利用Sqoop进行数据传输(1%)

d.利用SparkSQL进行数据读取(2%)

e.利用SparkMLlib进行机器学习建模(8%)

f.利用Python进行建模结果数据可视化(1%)

Hive中的数据库概念、修改数据库

创建表、管理表、外部表、分区表、删除表

Hive中的命令语句是类SQL语句

SELECT…FROM语句

使用列值进行计算、算术运算符、使用函数、列别名、嵌套SELECT语句、WHERE语句、groupby语句、集合运算、多表连接、内连接、外连接、笛卡尔积连接、orderby语句、抽样查询、视图。

Sqoop是一个数据转储工具,它能够将HadoopHDFS中的数据转储到关系型数据库中,也能将关系型数据库中的数据转储到HDFS中。

Sqoop链接数据库需要JDBC的支持

Sqoop的安装方法从HadoopHDFS向MySQL导入数据从MySQL向HadoopHDFS导入数据

说明:推荐学习书目中考生可根据自身需求选择性学习。参考书目不需全部学完,根据考纲知识点进行针对性学习即可。

THE END
1.数据分析与数据挖掘概述数据分析与挖掘1.什么是数据分析与数据挖掘技术? 所谓数据分析,即对已知的数据进行分析,然后提出一些有价值的信息。比如统计出平均数、标准差等信息,数据分析的数据量有可能不会太大。而数据挖掘,是指对大量的数据进行分析和挖掘,得到一些未知的有价值的信息等,比如从网站的用户或用户行为数据中挖掘出潜在需求信息,从而对网站进行改https://blog.csdn.net/weicao1990/article/details/79535991
2.数据挖掘VS数据分析:区别联系及应用嘲在数据科学的世界里,数据挖掘和数据分析是两大基础概念。尽管它们经常被混为一谈,但它们的目的、方法和应用场景存在明显的差异。作为一名在这个领域有多年实践经验的从业者,我经常见到新手对此感到困惑。今天,我们来深入探讨这两个概念的区别与联系,帮助 https://www.cda.cn/view/204818.html
3.《数据挖掘与数据分析(财会)》数据挖掘与数据分析概述数据挖掘与数据分析概述 目录CONTENTS1.1数据分析和挖掘概念的进化历程1.2数据挖掘1.3数据分析与挖掘的应用领域1.4数据分析与挖掘1.5数据挖掘的流程与挖掘经典算法1.6数据分析1.7SmartbiMining企业数据挖掘平据分析与挖掘工具1.8.常用的数1.9.数据挖掘与分析对财会工作的影响 https://m.book118.com/html/2023/1206/8104107102006013.shtm
4.论述数据挖掘与数据可视化分析的区别与联系数据挖掘和可视化之前在「数据分析岗」的文章提到,会写一期有关「数据挖掘岗」的文章。 本次结合最近学的统计推断,来波简单的实战。 首先请教了两位从事过数据挖掘的大佬,简单说了下什么是数据挖掘。 让小F和大家对数据挖掘有个认识,毕竟这可是大佬的切身体会!!! 当然也感谢我司的大佬给出的建议,小F也是受益颇多。 https://blog.51cto.com/u_16099170/9487255
5.什么是数据挖掘,与数据分析的区别。王利头数据挖掘与数据分析的区别 虽然数据挖掘和数据分析都涉及数据,但两者之间存在着关键区别: 目标:数据挖掘寻求发现隐藏模式和见解,而数据分析着重于提取已知或预定义的信息。 技术:数据挖掘利用更先进的算法和技术,而数据分析通常采用更通用的统计和可视化方法。 https://www.wanglitou.cn/article_47185.html
6.数据分析与数据挖掘课程的主要内容从两条主线开展,一条围绕数据科学的体系:数据收集、数据预处理、数据存储、数据分析、数据挖掘、数据可视化、数据产品等;一条围绕着人工智能的诸多专题方向,简要包括:人工智能的宏观概念,数据分析基础,数据挖掘,机器学习,深度学习,神经网络,统计分析,前沿跟踪等。 https://i.study.uestc.edu.cn/DATAM/menu/teaching-programme
7.数据分析与数据挖掘的区别数据分析与数据挖掘是两个密切相关但有所区别的概念。 1. 定义 数据分析(Data Analysis) 数据分析是指对数据进行收集、清洗、转换和建模的过程,目的是发现数据中的模式、趋势和关联,以支持决策制定。数据分析可以是描述性的,也可以是预测性的。 数据挖掘(Data Mining) https://www.elecfans.com/d/3747485.html
8.数据挖掘与分析报告范文7篇.docx数据挖掘与分析报告范文 第一篇可以肯定,这东西跟数学和算法有关,而且很难既然很难,那么就要付出更大的努力去学习了,去图书馆找书,找了好久发现 老师经常说的 hadoop 都被借完了,只好找了本数据挖掘教程 dataminingatutorihttps://www.renrendoc.com/paper/234470348.html
9.数据挖掘与分析的六种经典方法论6、数据挖掘与分析的“七步法” “七步法”分为七个步骤,分别是:业务理解、数据获取、数据探索、模型构建、模型评估、策略输出、应用部署。“七步法”更侧重从乙方的视角来完成用数据挖掘及其应用的闭环。 -END-https://www.niaogebiji.com/article-30475-1.html
10.数据挖掘和数据分析的区别数据分析更多采用统计学的知识,对源数据进行描述性和探索性分析,从结果中发现价值信息来评估和修正现状。数据挖掘不仅仅用到统计学的知识,还要用到机器学习的知识,这里会涉及到模型的概念。数据挖掘具有更深的层次,来发现未知的规律和价值。 数据挖掘的概念 https://www.dongao.com/cma/zy/202406204447304.html
11.数据挖掘与分析:概念与算法中文pdf扫描版[79MB]电子书下载《数据挖掘与分析:概念与算法》是专注于数据挖掘与分析的基本算法的入门图书,内容分为数据分析基础、频繁模式挖掘、聚类和分类四个部分,每一部分的各个章节兼顾基础知识和前沿话题,例如核方法、高维数据分析、复杂图和网络等。每一章最后均附有参考书目和习题。 https://www.jb51.net/books/693044.html
12.数据分析网【脑图】电商类APP的数据门户/数据产品的功能框架脑图 【地图】数据分析师职业发展必备知识地图 最新文章 行业资讯 大数据 数据分析 数据挖掘 人工智能 数据产品 数据报告 数据报告 艾媒咨询:2024年中国自助餐行业消费者行为洞察数据 近年来,中国自助餐行业发展迅速,消费者行为呈现出多样化趋势。随着消费者对健康饮食和个https://www.afenxi.com/
13.数据挖掘数据挖掘的定义 1.技术上的定义及含义 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义:数据源必须是真实的、https://baike.esnai.com/view.aspx?w=%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98
14.科学网—数据挖掘(Datamining)简介数据挖掘与常规数据分析方法最大的区别有两点:其一,前者自动化程度较高;其二,前者适用性高。这里说是区别,而不用优点,是因为这两点有时也会转化成为数据挖掘的缺点:其一,常规分析中靠大脑完成的推理,演算,假设和简化也是一种理解数据的过程,把这一过程让于计算机,也许真的会与宝藏擦肩而过;其二,普遍性的方法有时https://blog.sciencenet.cn/blog-200199-750526.html
15.数据向(三)数据建模数据挖掘数据分析异同在看数据建模相关概念时,有两种截然不同的说法,我尝试将它们总结如下: - 在大数据领域,指的是将业务抽象为数据表以及表与表之间关系的过程; - 在数据分析领域,更多的含义指的是“数学建模”,即找到输入和输出之间的规律的过程; 数据挖掘与数据分析 数据分析其实是更大的概念,但是如果单拎出来和数据挖掘进行对比时https://www.jianshu.com/p/19ba60261f17