CDALEVELⅡ?数据分析师考试?纲

考试题型:客观题(单选+多选)+上机建模题

考试内容:第一阶段,90分钟,客观题(单选+多选),上机答题;第二阶段120分钟,案例操作,自行携带电脑操作,案例数据将统一提供CSV文件。

针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。

1.领会:考生能够领会了解规定的知识点,并能够了解规定知识点的内涵与外延,了解其内容要点和它们之间的区别与联系,并能做出正确的阐述、解释和说明。

a.大数据分析基础(1%)

b.Python基础(5%)

c.Linux&Ubuntu操作系统基础(2%)

a.Hadoop安装配置及运行机制解析(2%)

b.HDFS分布式文件系统(2%)

c.MapReduce理论及实战(2%)

d.Hadoop生态其他常用组件(6%)

a.数据库导论(2%)

b.MySQL理论及实战(3%)

c.HBase安装及使用(3%)

d.Hive安装及使用(5%)

e.Sqoop安装及使用(3%)

a.数据挖掘的基本思想(2%)

b.数据挖掘基本方法介绍(2%)

c.有监督学习算法(4%)

d.无监督学习算法(2%)

a.Spark基础理论(2%)

b.SparkRDD基本概念及常用操作(3%)

c.Spark流式计算框架SparkStreaming、StructuredStreaming(5%)

d.Spark交互式数据查询框架SparkSQL(5%)

e.Spark机器学习算法库SparkMLlib基本使用方法(15%)

f.Spark图计算框架GraphX(5%)

a.数据可视化入门基础(1%)

b.Python数据可视化入门(2%)

c.Python高级数据可视化方法(1%)

a.利用HDFSShell操作HDFS文件系统(1%)

b.利用HiveSQL进行数据清洗(2%)

c.利用Sqoop进行数据传输(1%)

d.利用SparkSQL进行数据读取(2%)

e.利用SparkMLlib进行机器学习建模(8%)

f.利用Python进行建模结果数据可视化(1%)

Hive中的数据库概念、修改数据库

创建表、管理表、外部表、分区表、删除表

Hive中的命令语句是类SQL语句

SELECT…FROM语句

使用列值进行计算、算术运算符、使用函数、列别名、嵌套SELECT语句、WHERE语句、groupby语句、集合运算、多表连接、内连接、外连接、笛卡尔积连接、orderby语句、抽样查询、视图。

Sqoop是一个数据转储工具,它能够将HadoopHDFS中的数据转储到关系型数据库中,也能将关系型数据库中的数据转储到HDFS中。

Sqoop链接数据库需要JDBC的支持

Sqoop的安装方法从HadoopHDFS向MySQL导入数据从MySQL向HadoopHDFS导入数据

说明:推荐学习书目中考生可根据自身需求选择性学习。参考书目不需全部学完,根据考纲知识点进行针对性学习即可。

THE END
1.数据挖掘的主要技术和应用数据挖掘(Data Mining)是一种利用统计学、机器学习、数据库、算法等方法从大量数据中发现隐藏的模式、规律和知识的科学。数据挖掘技术广泛应用于商业、金融、医疗、科学等领域,为决策提供有价值的信息和洞察,提高了企业的竞争力和效率。 在本文中,我们将从以下几个方面进行阐述: https://blog.csdn.net/universsky2015/article/details/137300243
2.数据挖掘七种常用的方法汇总腾讯云开发者社区数据挖掘七种常用的方法汇总 (Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可https://cloud.tencent.com/developer/article/1892597
3.常见的数据挖掘方法有哪些帆软数字化转型知识库回归分析(Regression Analysis):回归分析旨在建立变量之间的关系模型,以预测一个变量的值。线性回归是最常见的回归技术,适用于预测连续性变量。除了线性回归,其他回归方法如多项式回归、岭回归和Lasso回归等也被广泛应用于不同的数据挖掘场景。回归分析能够帮助企业进行销售预测、风险评估等。 https://www.fanruan.com/blog/article/615481/
4.数据挖掘分类方法及其应用数据挖掘的分类方法数据挖掘分类方法及其应用 数据挖掘的分类方法 利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。 分类 分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库https://blog.51cto.com/u_14457/6370878
5.R语言数据挖掘方法及应用(薛薇著)完整pdf扫描版[188MB]电子书下后续围绕数据挖掘应用的四大核心方面,安排了数据预测篇:立足数据预测未知,数据分组篇:发现数据中的自然群组,数据关联篇:发现数据的内在关联性,离群数据探索篇:发现数据中的离群点。每篇下各设若干章节,各章节从简单易懂且具代表性的案例问题入手,剖析理论方法原理,讲解R语言实现,并给出案例的R语言数据挖掘代码和结果https://www.jb51.net/books/630445.html
6.数据挖掘:方法与应用数据挖掘:方法与应用_12178975.pdf 252页大小:61.42 MB 字数:约小于1千字 发布时间:2017-10-01发布于河南 浏览人气:51 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)数据挖掘:方法与应用_12178975.pdf 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 https://max.book118.com/html/2017/0930/135272984.shtm
7.如何进行数据挖掘(数据挖掘方法与应用)数据挖掘是从大量数据中通过算法和统计模型提取模式与知识的过程,它广泛应用于商业智能、金融分析、市场分析、医疗诊断等领域,以下是进行数据挖掘的步骤和方法: (图片来源网络,侵删) 1. 确定问题和目标 在任何数据挖掘项目开始之前,必须明确你希望通过数据挖掘解决的问题以及你的目标是什么,这将指导后续的数据收集和分https://www.kdun.com/ask/490583.html
8.清华大学出版社图书详情本书主要根据作者近几年在清华大学面向研究生和本科生开设的“数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系编写而成。本书系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、http://www.tup.tsinghua.edu.cn/booksCenter/book_09444801.html
9.利用数据挖掘的知识挖掘方法?Worktile社区8.5 模型应用与结果解释 总结:通过对数据挖掘的概念、技术分类、常用算法和应用案例等内容的介绍,可以了解数据挖掘在各个领域中的重要作用,以及其面临的挑战和发展趋势。同时,了解数据挖掘的基本流程和方法,有助于更好地应用于实际问题中。数据挖掘作为一门重要的数据分析技术,将在未来的发展中发挥越来越大的作用,为https://worktile.com/kb/ask/85519.html
10.数据挖掘:方法与应用(第2版)(豆瓣)我来说两句 短评 ··· 热门 / 最新 / 好友 还没人写过短评呢 我要写书评 数据挖掘:方法与应用(第2版)的书评 ··· ( 全部0 条 ) 论坛 ··· 在这本书的论坛里发言 当前版本有售 ··· 当当网 33.20元 购买纸质书 + 加入购书https://book.douban.com/isbn/978-7-302-60144-9/
11.数据挖掘:方法与应用数据挖掘方法与应用 作者:徐雪琪 ISBN:9787302550624 出版社:清华大学出版社 出版年:2020 数据挖掘 :方法与应用 作者:徐华 ISBN:9787302369011 出版社:清华大学出版社 出版年:2014 化学数据挖掘方法与应用 作者:陆文聪 ISBN:9787122127082 出版社:化学工业出版社 出版年:2012 Clementine数据挖掘方法及应用 作者:薛微https://www.las.ac.cn/front/book/detail?id=ff2780104f7944caad3eaea53534ec3b
12.数据挖掘:方法与应用中图分类号查询中国图书馆分类法数据挖掘 : 方法与应用 — 徐华编著 序号相关图书著者出版年 1机器学习导论(土)埃塞姆·阿培丁(Ethem Alpaydin)著2016 2数据挖掘技术与应用陈燕编著2016 3数据科学朝乐门编著2016 4MATLAB R2015a数字图像处理丁伟雄编著2016 5机器学习与R语言(美) Brett Lantz著2015 https://www.clcindex.com/book/view/96E48EFAEF5CEA1DC9AA066DFD7C956E/
13.数据挖掘及其在金融中的应用一个形象的比喻,数据挖掘就好比企业的诊断医生和指南针,能从企业的业务数据中发现企业的问题所在,并辅助决策者指明决策的方向。 一、数据挖掘认识 1、数据挖掘的由来 我们今天面对的数据量已足够大,数据类型也多种多样,并且还在不增地增长,这点应该已经形成共识。比如高度结构化的关系数据库、面向特定应用的事务数据https://www.jianshu.com/p/474504df2bdd
14.数据挖掘论文常用的数据挖掘方法主要有决策树(Decision Tree)、遗传算法(Genetic Algorithms)、关联分析(Association Analysis).聚类分析(C~smr Analysis)、序列模式分析(Sequential Pattern)以及神经网络(Neural Networks)等。 三、数据挖掘的实际应用 由于数据挖掘市场还处于起步的阶段,但是发展很快。在国外有一些著名的大公司对数据挖https://www.unjs.com/lunwen/f/20220924130749_5650839.html
15.NMath应用教程:医学与数据挖掘方法详解控件新闻SIGA是世界领先的传染病预防与药物研发公司。使用NMath的曲线拟合功能,SIGA科学家们成功创建了一个“剂量—反应”的逻辑曲线模型。像这种X-Y型的曲线拟合模型在医学相关领域,还有很多类似的应用。 数据挖掘应用——层次聚类 层次聚类是统计分析中的一个常用算法,其算法简单、快速而且能有效地处理大数据集,所以在数据挖https://www.evget.com/article/2012/12/6/18226.html
16.浅析数据挖掘技术在审计中的运用澎湃号·媒体澎湃新闻四、使用数据挖掘技术的常用方法路径 在数据库中,利用数据挖掘技术,不但可以完善、丰富数据库应用,还能为用户决策提供数据支持。常用的数据挖掘技术有:统计分析、关联分析、聚类分析、预测分析、离群点检测等。 (一)统计分析 统计分析法指通过对研究对象的规模、速度、范围、程度等数量关系的分析研究,认识和揭示事物间https://www.thepaper.cn/newsDetail_forward_15006269
17.数据挖掘原理方法及Python应用实践教程本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部 分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14https://thinktank.sciencereading.cn/booklib/v/bookPreview/122/248/2976381.html
18.数据挖掘VS机器学习,你了解多少?如今,获取数据比以往任何时候都更容易,但从数据中生成见解和信息正变得更具挑战性。企业经常发现自己处于一种情况,他们拥有的数据远远超过他们所知道的数据,这可能会适得其反,导致无所作为。 数据挖掘和机器学习是企业将这些庞大的数据库转化为有用信息的两种主要方法。 https://www.fromgeek.com/telecom/509859.html