CDA认证考试题库2

在使用历史数据构造训练集(Train)集、验证(Validation)集和检验(Test)时,以下哪个样本量分配方案比较适合?

A.训练50%,验证0%,检验50%

B.训练100%,验证0%,检验0%

C.训练0%,验证100%,检验0%

D.训练60%,验证30%,检验10%

2、答案(A)

一个累积提升度曲线,当深度(Depth)等于0.1时,提升度为(Lift)为3.14,以下哪个解释正确

A.根据模型预测,从最高概率到最低概率排序后,最高的前10%中发生事件的数量比随机抽样的响应率高3.14

B.选预测响应概率大于10%的样本,其发生事件的数量比随机抽样的响应率高3.14

C.根据模型预测,从最高概率到最低概率排序后,最高的前10%中预测的精确度比随机抽样高3.14

D.选预测响应概率大于10%的样本,其预测的精确度比随机抽样高3.14

3、答案(C)

在使用历史数据构造训练(Train)集、验证(Validation)集和检验(Test)集时,训练数据集的作用在于

A.用于对模型的效果进行无偏的评估

B.用于比较不同模型的预测准确度

C.用于构造预测模型

D.用于选择模型

4、答案(D)

B.加大了处理的难度

5、答案(C)

D.以上均不对

6、答案(B)

B.根据是否缺失,生成指示变量,仅使用指示变量作为解释变量

7、答案(B)

B.卡方检验

D.T检验

8、答案(A)

以下哪个方法可以剔除多变量情况下的离群观测

9、答案(C)

以下哪种变量筛选方法需要同时设置进出模型的变量显著度阀值

A.向前逐步法

B.向后逐步法

C.逐步法

D.全子集法

10、答案(A)

A.R方

B.调整R方

C.AIC

D.BIC

11、[答案B.]

将复杂的地址简化成北、中、南、东四区,是在进行?

A.数据正规化(Normalization)B.数据一般化(Generalization)C.数据离散化(Discretization)D.数据整合(Integration)

12、【答案(A)】

13、[答案B.]

A.最小信赖度(MinimumConfidence)

B.最小支持度(MinimumSupport)

C.交易编号(TransactionID)

D.购买数量

14、[答案B.]

A.买B商品的顾客中,有60%的顾客会同时购买A

B.买A商品的顾客中,有60%的顾客会同时购买B

C.同时购买A,B两商品的顾客,占所有顾客的60%

D.两商品A,B在交易数据库中同时被购买的机率为60%

15、【答案(B)】

下表为一交易数据库,请问A→C的支持度(Support)为:

A.75%B.50%C.100%D.66.6%

TID

ItemsBought

1

A,B,C

2

A,C

3

A,D

4

B,E,F

16、【答案(D)】

下表为一交易数据库,请问A→C的信赖度(Confidence)为:

17、[答案D.]

A.BCAB.CABC.BACD.CBA

18、[答案C.]

A.调整隐藏层个数

B.调整输入值

C.调整权重(Weight)

D.调整真实值

19、[答案A.]

B.买打印机后过一个月会买墨水夹

C.买计算机所获得的利益

D.以上皆非

20、[答案D.]

如何利用「体重」以简单贝式分类(NaiveBayes)预测「性别」?

A.选取另一条件属性

B.无法预测

C.将体重正规化为0~1之间

D.将体重离散化

21、[答案B.]

22、[答案B.]

简单贝式分类(NaiveBayes)可以用来预测何种数据型态?

23、[答案B.]

A.输入层节点个数设定为3

B.隐藏层节点个数设定为0

C.输出层节点个数设定为3

D.隐藏层节点个数设定为1

24、[答案B.]

A.信用卡发卡银行侦测潜在的卡奴

B.基金经理人针对个股做出未来价格预测

C.电信公司将人户区分为数个群体

D.以上皆是

25、[答案D.]

小王是一个股市投资人,手上持有某公司股票,且已知该股过去历史数据如下表所示,今天为预测2/6的股价而计算该股3日移动平均,请问最近的3日移动平均值为多少?

日期

股价

2/1

10

2/2

12

2/3

13

2/4

16

2/5

19

A.11B.13C.14D.16

26、[答案C.]

下列哪种分类算法的训练结果最难以被解释?

A.NaiveBayes

B.LogisticRegression

C.NeuralNetwork

D.DecisionTree

27、[答案B.]

数据遗缺(NullValue)处理方法可分为人工填补法及自动填补法,下列哪种自动填补法可得到较准确的结果?

A.填入一个通用的常数值,例如填入"未知/Unknown"

B.把填遗缺值的问题当作是分类或预测的问题

C.填入该属性的整体平均值

D.填入该属性的整体中位数

1、(AB)

对于决策类模型、以下哪些统计量用于评价最合适?

A.错分类率

B.利润

C.ROC指标

D.SBC

2、(BD)

对于估计类模型、以下哪些统计量用于评价最合适?

B.极大似然数

C.ROC统计量

3、(AB)

以下哪个变量转换不会改变变量原有的分布形式

A.中心标准化

B.极差标准化

C.TURKEY打分

D.百分位秩

4、(AB)

连续变量转换时,选取百分位秩而不选用最大最小秩的原因

A.避免模型在使用时,值域发生明显变化

B.避免输入变量值域变化对模型预测效果的影响

5、(BC)

立刻扫码

看更多数据分析师认证试题

——学数据分析技能一定要了解的大厂入门券,CDA数据分析师认证证书!

CDA(数据分析师认证),与CFA相似,由国际范围内数据科学领域行业专家、学者及知名企业共同制定并修订更新,迅速发展成行业内长期而稳定的全球大数据及数据分析人才标准,具有专业化、科学化、国际化、系统化等特性。

同时,CDA全栈考试布局和认证体系已得到社会认可,并由为IBM、华为等提供全球认证服务的PearsonVUE面向全球提供灵活的考试服务。

THE END
1.数据挖掘150道试题(转)数据挖掘期末试题(1)数据挖掘期末试卷13.上题中,等宽划分时(宽度为50),15又在哪个箱子里? (A) A 第一个 B 第二个 C 第三个 D 第四个 14.下面哪个不属于数据的属性类型:(D) A 标称 B 序数 C 区间 D相异 在上题中,属于定量的属性类型是:? A 标称 B 序数 C 区间 https://blog.csdn.net/2401_87557053/article/details/143729160
2.数据挖掘与分析考试题库(含答案).docx数据挖掘与分析考试题库(含答案)选择题1.数据挖掘的主要功能是什么?A.挖掘数据潜在的信息B.对数据进行记录和处理C.提高数据存储的效率D.对数据进行分类和排序Answer:A2.下列哪种算法不属于聚类算法?A.K-MeansB.BP神经网络C.DBSCAND.层次聚类Answer:B3.数据挖掘中使用最多的算法是什么?A.决策树B.关联规则C.神https://www.renrendoc.com/paper/356549094.html
3.专业课《数据挖掘与分析》考试题目题库及答案+重点知识梳理总结好了,小马目前收集了,一千多个专业,几乎所有的大学专业都有哦,真的是一个宝藏资料库呢,并且资料也会一直持续去更新哦。 以上就是专业课 《数据挖掘与分析》 考试题目题库及答案+重点知识梳理总结+名词解释+《数据挖掘与分析》重点笔记的内容! 获取方式:专业课 《数据挖掘与分析》 考试题目题库及答案+重点知识梳https://www.meipian.cn/4zk0c1ip
4.2021年中国大学慕课《中小学教师数据素养》课程期末考试题库及答案2021年中国大学慕课《中小学教师数据素养》课程期末考试题库及答案2021年中国大学慕课MOOC《中小学教师数据素养》课程期末考试题库及答案每位学员抽到的题目不一样,此题库包含95?98%的题目,请用电脑答题,并用手机WPS翻开文件查找功能在此题库内查询正确答案(因平台有https://www.yxfsz.com/view/1585090603741450241
5.统计学期末答案考试题库2024春本文分类:章节期末题库2024春 本文标签:统计学 浏览次数:239次浏览 发布日期:2024-05-04 23:48:53 上一篇 >开心说日语期末答案考试题库2024春 下一篇 >数据挖掘期末答案考试题库2024春 嘉兴技师学院-智慧树知到 期末考试答案,单元章节测试答案,见面课答案,绪论第*章答案 https://www.wkebb.com/c/97bf7780d5d85595fc9a61b47398c10f.html
6.Python期末试题题库完整.pdfPython基础知识教材是python基础入门知识笔记和Python基础的知识点复习试题,Python期末试题题库完整版,内含答案,包括经典例题,实验题(含答案),知识要点等内容,需要的朋友可下载试试! 内容 python基础入门知识: 1、简介 2.基础知识 3.开发案例 python 期末考试复习题(带答案) https://www.iteye.com/resource/qq_20232875-14045696
7.期中期末试卷题库课件网课盐考研考证招聘课后答案太原理工大学 数据挖掘 试题 太原理工大学《数据挖掘》考试题库 太原科技大学 2022年 液压元件 补考试卷 求山西农业大学习思想试卷 太原理工大学 概率统计 14试题 山西农业大学 linux 月考试卷3套含答案 太原理工大学软件15级数据结构期末 太原理工大学 数据结构 复习 https://www.aizhugong.com/
8.数据挖掘期末试题及答案完整版本文档为数据挖掘课程的期末试题及答案完整版,共分为两部分: 试题 1.简述数据挖掘的含义,及其在实际应用中的主要应用场景。 2.数据挖掘的分类有哪些?分别说明其特点和应用场景。 3.什么是关联规则挖掘?具体方法是什么? 4.简述聚类分析的含义,及其在实际应用中的主要应用场景。 5.什么是K-means算法?其具体流程是https://wenku.baidu.com/view/a9aee58501020740be1e650e52ea551811a6c940.html
9.人工智能训练师数据标注员理论考试题库(含答案)人工智能训练师-数据标注员理论考试题库(含答案) 一、单选题 1.下面不属于容灾解决方案的是()。 A、备份解决方案 B、主备双活容灾解决方案 C、双活容灾解决方案 D、两地三中心容灾解决方案 答案:A 2.()是在开发预测模型时减少输入变量数量的过程 A、云计算 B、特征选择 C、机械化 D、区块链 答案:B 3.(https://www.ddwk123.cn/?p=525495
10.全国计算机一级《MSOffice》操作题题库及答案(精选8套)计算机是我们现在重要的科技,要考计算机证的你做好准备了吗,以下是小编为大家整理的全国计算机一级《MS Office》操作题题库及答案,仅供参考,希望能够帮助大家。 全国计算机一级《MS Office》操作题题库及答案7套 1 一、基本操作题 1、在考生文件夹下GPOPPUT文件夹中新建一个名为HUX的文件夹。 https://www.oh100.com/kaoshi/ncre1/tiku/289685.html
11.搜题宝:职业资格考试试题与答案库搜题宝是专业的搜题找答案平台,为高效的解决广大学生作业、考试试题答案而努力,也为高效解决各类职业资格考试试题答案而努力https://www.ixueyi.com/
12.数据挖掘题库及答案数据挖掘考试题库# 数据挖掘题库及答案的实现指南## 一、流程概述在创建一个数据挖掘题库及答案的项目之前,必须先了解整个项目的流程。下面的表格展示了各个步骤:| 步骤 | 描述 ||---|---|| 1 | 确定项目需求 || 2 | 设计数 python 数据挖掘 ci pmp考试题库及答案 【PMP考试题库及答案】—— 悉数解答PMP考试全方位https://blog.51cto.com/u_16213670/7633156
13.大数据技术与应用专业技能考核标准及题库大数据技术与应用专业 技能考核标准及题库 岳阳职业技术学院 2019 年 10 月 7 日 1 目录 第一部分数据分析基本要求: (1)能使用数据挖掘工具完成数据的展示,预测,存储等; (2)能编写逻辑清晰的分析虽然不同考试题目的技能侧重点有所不同,但完成任 10 务的工作量和难易程度基本相同.各模块和项目的https://jxgz.yvtc.edu.cn/tools/download.ashx?site=main&id=63
14.大数据工程技术人员理论考试复习题库(200题)2.运用基于计算机的方法,包括新技术,从而在数据中获得有用知识的整个过程,就叫做数据挖掘。 对错 3.旋转是指选择维中特定区间的数据或者某批特定值进行分析。 对错 4.数据可视化,是关于数据视觉表现形式的科学技术研究。 对错 5.多维数据模型是从多角度多层次进行数据查询和分析的的数据库模型。 对错 https://www.wjx.cn/xz/284096275.aspx
15.刷刷题官网大学职业资格刷题搜题APP题库错题本制作如何制作自己的在线小题库 > 手机使用 分享 反馈 收藏 举报 参考答案: 考点: 地方时与区时的区别及计算 专题: 分析: (1)春分到秋分之间,北半球昼长夜查看完整题目与答案 网店数据分析技术主要包括( ) A. 数据仓库技术 B. 数据挖掘技术 C. 商业智能 D. 数据存储技术 查看完整题目与答案 运营https://www.shuashuati.com/ti/e185c066eb3d46dcb5bf35368503f8a4.html