数据挖掘七十八道选择题

2.以下两种描述分别对应哪两种对分类算法的评价标准?(A)

(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。

(b)描述有多少比例的小偷给警察抓了的标准。

A.Precision,Recall

B.Recall,Precision

C.Precision,ROC

D.Recall,ROC

3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)

A.频繁模式挖掘

B.分类和预测

C.数据预处理

D.数据流挖掘

4.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B)

A.分类

C.关联分析

D.隐马尔可夫链

5.什么是KDD?(A)

B.领域知识发现

C.文档知识发现

D.动态知识发现

A.探索性数据分析

B.建模描述

D.寻找模式和规则

A.根据内容检索

11.下面哪种不属于数据预处理的方法?(D)

A变量代换

B离散化

C聚集

D估计遗漏值

12.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?(B)

A第一个

B第二个

C第三个

D第四个

13.上题中,等宽划分时(宽度为50),15又在哪个箱子里?(A)

14.下面哪个不属于数据的属性类型:(D)

A标称

B序数

C区间

D相异

15.在上题中,属于定量的属性类型是:(C)

16.只有非零值才重要的二元属性被称作:(C)

A计数属性

B离散属性

C非对称的二元属性

D对称属性

A嵌入

B过滤

C包装

D抽样

C映射数据到新的空间

19.考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是(C)

A2

B3

C3.5

D5

20.下面哪个属于映射数据到新的空间的方法?(A)

A傅立叶变换

C渐进抽样

D维归约

21.熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是:(B)

A1比特

B2.6比特

C3.2比特

D3.8比特

22.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D)

A0.821

B1.224

C1.458

D0.716

23.假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:(A)

A18.3

B22.6

C26.8

D27.9

24.考虑值集{12243324556826},其四分位数极差是:(A)

A31

B24

C55

D3

25.一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:(A)

A一年级

B二年级

C三年级

D四年级

A等高线图

B饼图

C曲面图

D矢量场图

27.在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:(D)

A有放回的简单随机抽样

B无放回的简单随机抽样

C分层抽样

D渐进抽样

B.捕捉到的新数据会覆盖原来的快照;

29.关于基本数据的元数据是指:(D)

C.基本元数据包括日志文件和简历执行处理的时序调度信息;

D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息.

30.下面关于数据粒度的描述不正确的是:(C)

B.数据越详细,粒度就越小,级别也就越高;

C.数据综合度越高,粒度也就越大,级别也就越高;

D.在测试之前没必要制定详细的测试计划.

33.OLAP技术的核心是:(D)

A.在线性;

B.对用户的快速响应;

C.互操作性.

D.多维分析;

34.关于OLAP的特性,下面正确的是:(D)

(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性

A.(1)(2)(3)

B.(2)(3)(4)

C.(1)(2)(3)(4)

D.(1)(2)(3)(4)(5)

35.关于OLAP和OLTP的区别描述,不正确的是:(C)

A.OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.

B.与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.

C.OLAP的特点在于事务量大,但事务内容比较简单且重复率高.

36.OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是:(D)

A.OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性;

B.由于OLAM的立方体和用于OLAP的立方体有本质的区别.

C.基于WEB的OLAM是WEB技术与OLAM技术的结合.

D.OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作.

37.关于OLAP和OLTP的说法,下列不正确的是:(A)

A.OLAP事务量大,但事务内容比较简单且重复率高.

C.OLTP面对的是决策人员和高层管理人员.

D.OLTP以应用为核心,是应用驱动的.

A、4

B、5

C、6

D、7

A、无向无环

B、有向无环

C、有向有环

D、无向有环

41.频繁项集、频繁闭项集、最大频繁项集之间的关系是:(C)

A、频繁项集频繁闭项集=最大频繁项集

B、频繁项集=频繁闭项集最大频繁项集

C、频繁项集频繁闭项集最大频繁项集

D、频繁项集=频繁闭项集=最大频繁项集

42.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含(C)

A、1,2,3,4

B、1,2,3,5

C、1,2,4,5

D、1,3,4,5

43.下面选项中t不是s的子序列的是(C)

A、s=<{2,4},{3,5,6},{8}>t=<{2},{3,6},{8}>

B、s=<{2,4},{3,5,6},{8}>t=<{2},{8}>

C、s=<{1,2},{3,4}>t=<{1},{2}>

D、s=<{2,4},{2,4}>t=<{2},{4}>

44.在图集合中发现一组公共子结构,这样的任务称为(B)

A、频繁子集挖掘

B、频繁子图挖掘

C、频繁数据项挖掘

D、频繁模式挖掘

45.下列度量不具有反演性的是(D)

A、系数

B、几率

C、Cohen度量

D、兴趣因子

46.下列__(A)__不是将主观信息加入到模式发现任务中的方法。

THE END
1.数据挖掘概念(AnalysisServices该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务转换为下列问题: 您在查找什么?您要尝试找到什么类型的关系? 您要尝试解决的问题是否反映了业务策略或流程? 您要通过数据挖掘模型进行预测,还是仅仅查找受关注的模式和关联? https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
2.什么是数据挖掘?初学者指南什么是数据挖掘?初学者指南 引言 在信息时代的今天,我们生活在一个数据爆炸的世界中。从社交媒体的帖子到在线购物记 录,从医疗健康数据到金融交易信息,数据无处不在。这些数据的增长速度之快,使得从数据中提 取有价值信息的需求变得日益迫切。 数据挖掘,作为一种从大量数据中提取隐藏模式和知识的技术,已经成为商业https://blog.csdn.net/m0_67484548/article/details/142624697
3.数据挖掘指什么意思帆软数字化转型知识库数据挖掘指什么意思 数据挖掘指的是从大量数据中提取有用信息和知识的过程,其核心技术包括模式识别、数据分析、机器学习、统计分析等。数据挖掘的主要目标是通过分析数据来发现隐藏的模式和关系,从而为决策提供支持。在实际应用中,数据挖掘被广泛应用于商业、医疗、金融、市场营销等领域。例如,在市场营销中,数据挖掘可以https://www.fanruan.com/blog/article/572886/
4.数据挖掘中CRISPDM过程模型指的是什么呢?问答CRISP-DM过程模型:通用的CRISP-DM过程模型包括六个月来解决数据挖掘主要问题的阶段。https://developer.aliyun.com/ask/442316
5.数据挖掘的三大支柱数据挖掘六大功能karen的技术博客数据挖掘一般是指从大量数据中通过算法搜索出隐藏于其中的信息的过程,也认为数据挖掘是一个完整的知识发现,包括数据清理、建模、评估等过程。 2.数据挖掘功能 数据挖掘主要的功能是从现有的信息中提取数据的模式和模型。数据挖掘可以从多种数据来源中提取信息,然后从信息中挖掘出相关的模式和内在联系。数据挖掘可以用来https://blog.51cto.com/u_12187/7471322
6.数据库的数据是指什么王利头1. 什么是数据库中字段的类型? 数字、字符、布尔值、复合类型和 BLOB。 2. 什么是数据约束? 确保数据准确性和一致性的规则和限制。 3. 什么是数据挖掘? 从大型数据库中提取有价值信息的的技术。 4. 什么是视图? 从一个或多个表中派生的虚拟表,提供数据的一个特定视角。 https://www.wanglitou.cn/article_57191.html
7.数据挖掘是指从大量数据中获取潜在有用的并且可以被人们理解的5.___目的是挖掘随时间变化的数据对象的变化规律和趋势,并对其建模,进而为相关决策提供参考。6.数据集合中存在的一些数据对象,它们与其余绝大多数数据的特性或模型不一致,找出这些数据对象的过程称为___。 题目标签:数据集数据挖掘变化规律如何将EXCEL生成题库手机刷题 如何制作自己的在线小题库 > 手机使用 https://www.shuashuati.com/ti/83953875da5d4c8ebd7672d9cd88a385.html?fm=bd7290bf01482882bc578b858119169222
8.[笔记]财务如何挖掘数据一、什么是数据挖掘? 1、 数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的知识的过程。 2、 数据挖掘的程序 3、 数据分析与数据挖掘的对比 数据分析 定义:是对数据进行分析,是指根据分析目的,用适当的统计分析方法及工具http://www.360doc.com/content/23/1216/11/18390204_1107747268.shtml
9.用来检测用户与网站的互动数据的数据挖掘是指()。用来检测用户与网站的互动数据的数据挖掘是指()。 A.网络文本挖掘 B.网络内容挖掘 C.网络使用挖掘 D.网络结构挖掘 答案 查看答案 更多“用来检测用户与网站的互动数据的数据挖掘是指()。”相关的问题 第1题 以下哪一项不是网络数据挖掘的技术之一()。https://www.xuesai.cn/souti/ECF3C4F2.html
10.祝融张辽1)本部分涉及率土深层数据(公式来自深层数据挖掘者“自由指挥官”) 2)对于祝融前3回合伤害率的计算: 1.普攻+分兵期望总伤害率:991.95% 2.火兽期望伤害率:168% 3)祝融的增减伤值 1.火兽均增伤指火兽160%增伤的伤害,均分到3回合 2.在面对不同对手时,敌方也存在不同减伤(后文分析) https://ds.163.com/article/6236cf0e744247000192a85d
11.数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的隐含的数据挖掘分析是指从海量的数据中抽取感兴趣的(有价值的、隐含的、以前没有用但是潜在有用信息的)模式和知识。()https://www.shangxueba.cn/hangye/A470DAAC.html
12.数据挖掘的四种方法理想股票技术论坛数据挖掘的四种方法是指在数据分析过程中常用的四种技术手段,包括聚类分析、关联规则挖掘、分类算法和预测模型。这些方法可以帮助我们从大量的数据中提取有价值的信息和知识,为决策提供支持和指导。聚类分析用于将数据集划分为不同的群组,关联规则挖掘用于寻找不同项之间https://www.55188.com/tag-04603614.html
13.数据挖掘概念与方法(精选八篇)空间数据挖掘[1 - 3]是指从空间数据库中抽取没有清楚表现出来的隐含的知识和空间关系, 并发现其中有用的特征和模式的理论、方法和技术。它是多种技术和学科交叉的新领域, 综合了机器学习、数据库技术、模式识别、统计、地理信息系统等领域的有关技术。针对空间数据的特点, 空间数据挖掘可发现空间分布规律、空间关联https://www.360wenmi.com/f/cnkey6cf58u0.html