盐城数据挖掘考试内部选拔考题及答案

1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)

A.关联规则发现

B.聚类

C.分类

D.自然语言处理

2.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)

A.频繁模式挖掘

B.分类和预测

C.数据预处理

D.数据流挖掘

3.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B)

A.分类

C.关联分析

D.隐马尔可夫链

4.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A)

A.探索性数据分析

B.建模描述

C.预测建模

D.寻找模式和规则

5.下面哪种不属于数据预处理的方法?(D)

A变量代换B离散化C聚集D估计遗漏值

6.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?(B)

A第一个

B第二个

C第三个

D第四个

7.只有非零值才重要的二元属性被称作:(C)

A计数属性

B离散属性C非对称的二元属性D对称属性

8.以下哪种方法不属于特征选择的标准方法:(D)

A嵌入B过滤C包装D抽样

A特征提取B特征修改C映射数据到新的空间D特征构造

10.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D)

A0.821

B1.224

C1.458

D0.716

11.假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:(A)

A18.3

B22.6

C26.8

D27.9

B.捕捉到的新数据会覆盖原来的快照;

C.数据仓库随事件变化不断删去旧的数据内容;

13.关于基本数据的元数据是指:(D)

C.基本元数据包括日志文件和简历执行处理的时序调度信息;

D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息.

14.下面关于数据粒度的描述不正确的是:(C)

A.粒度是指数据仓库小数据单元的详细程度和级别;

B.数据越详细,粒度就越小,级别也就越高;

C.数据综合度越高,粒度也就越大,级别也就越高;

D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.

15.设X={1,2,3}是频繁项集,则可由X产生__(C)__个关联规则。

A、4

B、5

C、6

D、7

16.概念分层图是__(B)__图。

A、无向无环

B、有向无环

C、有向有环

D、无向有环

17.频繁项集、频繁闭项集、最大频繁项集之间的关系是:(C)

A、频繁项集频繁闭项集=最大频繁项集

B、频繁项集=频繁闭项集最大频繁项集

C、频繁项集频繁闭项集最大频繁项集

D、频繁项集=频繁闭项集=最大频繁项集

18.在图集合中发现一组公共子结构,这样的任务称为(B)

A、频繁子集挖掘

B、频繁子图挖掘

C、频繁数据项挖掘

D、频繁模式挖掘

19.决策树中不包含一下哪种结点,A,根结点(rootnode)B,内部结点(internalnode)C,外部结点(externalnode)D,叶结点(leafnode)(C)

20.以下哪项关于决策树的说法是错误的(C)

A.冗余属性不会对决策树的准确率造成不利的影响

B.子树可能在决策树中重复多次

C.决策树算法对于噪声的干扰非常敏感

D.寻找最佳决策树是NP完全问题

21.在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为(B)

A.基于类的排序方案

B.基于规则的排序方案

C.基于度量的排序方案

D.基于规格的排序方案。

22.在SQLServer数据库中,有一个产品表products,你想按照价格从小到大的顺序显示所有产品的名称(productname)和价格(price),可以实现该功能的T-SQL语句是(A)。(选择一项)

(A)SELECTproductname,pricefromproductsorderbypriceASC

(B)SELECTproductname,pricefromproductsorderbypriceDESC

(C)SELECTproductnameandpricefromproductsorderbyprice

(D)SELECTproductnameandpricefromproductsorderbypriceDESC

23.你是公司的SQLserver数据库管理员。你管理一个数据库,其中有一个产品表Products,记录公司的产品信息,你想删除过期的产品信息,应该用(D)语句。(选择一项)

(A)select(B)insert(C)update(D)delete

24.下列哪条语句可以完成删除数据库中某个视图的操作:(D)

A.Delete*fromview_Name

B.Deletefromview_Name

C.DeleteviewTable_Name

D.DropviewTable_Name

25.下列哪条语句可以完成将表xjb中的数据按Class(班级)分组统计出各个班的总人数

显示出来:(B)

A.Select*fromxjbgroupbyclass

B.SelectClass,总人数=count(Class)fromxjbgroupbyclass

C.SelectClass,总人数=count(Class)fromxjborderbyclass

D.Select*fromxjbOrderbyclass

26.在SQL中,建立表用的命令是(B)。

A.CREATESCHEMA

B.CREATETABLE

C.CREATEVIEW

D.CREATEINDEX

27.下列四项中,不正确的提法是(C)。

A.SQL语言是关系数据库的国际标准语言

B.SQL语言具有数据定义、查询、操纵和控制功能

C.SQL语言可以自动实现关系数据库的规范化

D.SQL语言称为结构查询语言

28.在SQL语言中,建立存储过程的命令是(A)

A、CREATEPROCEDURE

B、CREATERULE

C、CREATEDURE

D、CREATEFILE

29.数据库管理系统的英文缩写是(A)。

A.DBMSB.DBSC.DBAD.DB

30.向用户授予操作权限的SQL语句是(D)。

A.CTEATEB.REVOKEC.SELECTD.GRANT

二、多选题(每题1分,共20题)

1.通过数据挖掘过程所推倒出的关系和摘要经常被称为:(AB)

THE END
1.数据挖掘概念(AnalysisServices与以下关系图的突出显示相同,数据挖掘过程的第一步就是明确定义业务问题,并考虑解答该问题的方法。 该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务转换为下列问题: 您在查找什么?您要尝试找到什么类型的关系? https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
2.数据挖掘的分析方法可以划分为关联分析序列模式分析分类分析和数据挖掘是从大量数据中提取有用信息的方法,主要分为四种分析方式:关联分析、序列模式分析、分类分析和聚类分析。在本指南中,我们将详细介绍这四种方法的实现过程,并提供相应的代码示例。 数据挖掘流程 首先,我们需要明确数据挖掘的基本流程,如下表所示: 流程图 https://blog.51cto.com/u_16213297/12863680
3.数据挖掘基础知识解析:关联规则发现与分类算法评价标准详解1. 一家超市研究了销售记录数据,发现购买啤酒的人很可能也会购买尿布。这属于什么类型的数据挖掘问题? (一个) A.关联规则发现 B. 聚类 三、分类 D.自然语言处理 2. 哪两个分类算法的评价标准对应于以下两个描述? (一个) (a) 警察抓小偷,描述被警察抓到的人有多少是小偷的标准。 http://www.yl101.com/detail/id/87990.html
4.数据挖掘数据挖掘面试题汇总测测你的专业能力是否过关1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D.自然语言处理 2. 以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 https://cloud.tencent.com/developer/article/1045567
5.数据挖掘研究(精选十篇)数据挖掘是指从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程, 这些信息的表现形式为:规则、概念、规律及模式等。它可帮助决策者分析历史数据及当前数据, 并从中发现隐藏的关系和模式, 进而预测未来可能发生的行为。数据挖掘的过程也叫知识发现的过程。 https://www.360wenmi.com/f/cnkey7ouwjk5.html
6.python数据挖掘算法的过程详解python这篇文章主要介绍了python 数据挖掘算法,首先给大家介绍了数据挖掘的过程,基于sklearn主要的算法模型讲解,给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下+ 目录 1、首先简述数据挖掘的过程 第一步:数据选择 可以通过业务原始数据、公开的数据集、也可通过爬虫的方式获取。 第二https://www.jb51.net/article/238548.htm
7.数据挖掘的过程和方法数据挖掘的过程和方法 我折腾了好久数据挖掘这事儿,总算找到点门道。说实话,一开始我也是瞎摸索。 我先跟你说啊,数据挖掘嘛,第一步得确定目标。这就好比你要去旅行,你得先知道你想去哪对吧。我之前就没整明白这个,随便找了些数据就开始挖,结果挖出来的东西根本没什么用,白忙活一场。所以说确定好你要挖掘https://wenku.baidu.com/view/7f1168947075a417866fb84ae45c3b3567ecddb0.html
8.好书推荐《数据挖掘技巧》数据挖掘一般是从大量的数据中通过计算机算法,去搜索隐藏于其中信息的过程。用通俗的话说,就是面临大量的数据,使用数据挖掘工具“探勘”一遍之前,审计人员不一定有明确的目标,挖掘出来的结果也不一定在审计人员的预料之中。数据挖掘作为一种新的计算机审计方法,能够辅助审计人https://mp.weixin.qq.com/s?__biz=MzU0ODk2NjA0Nw==&mid=2247509056&idx=3&sn=efa3fad8b2f29bc4520c0acc7354b793&chksm=fbb5ffb0ccc276a6cbbf6d12458f702a0a731627617b65747658b89c3bbcd90cde9b3f9a9192&scene=27
9.数据挖掘包括()等处理过程数据挖掘包括()等处理过程A.数据准备B.数据挖掘C.模式模型的评估与解释D.信息巩固与应用的答案是什么.用刷刷题APP,拍照搜索答疑.刷刷题(shuashuati.com)是专业的大学职业搜题找答案,刷题练习的工具.一键将文档转化为在线题库手机刷题,以提高学习效率,是学习的生产力工具https://www.shuashuati.com/ti/20ad9e3f8beb42a59c2102cbe09f96f0.html
10.数据分析报告(精选15篇)⑤假设数据模型。 ⑥ 实际数据挖掘工作(data mining)。 ⑦ 测试和验证挖掘结果(testing and verfication)。 ⑧ 解释和应用(interpretation and use)。 由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化https://www.ruiwen.com/fenxibaogao/8204699.html
11.数据分析报告范文(精选10篇)由上述步骤可看出,数据挖掘牵涉了大量的准备工作与规划工作,事实上许多专家都认为整套数据挖掘的过程中,有80%的时间和精力是花费在数据预处理阶段,其中包括数据的净化、数据格式转换、变量整合,以及数据表的链接。可见,在进行数据挖掘技术的分析之前,还有许多准备工作要完成。 https://mip.wenshubang.com/baogao/155767.html
12.校园网数据中心论文12篇(全文)总之,随着云计算和其他技术迅猛发展,数据中心技术必须克服即将出现的所有挑战,数据中心基础设施也需要不停迭代,数据中心优化的四个关键要素分别是:人员、资源、技术和环境。每个要素通过关键指标反映运行维护服务的条件和能力,将业务导向放在首位,就是对人员、资源、技术和过程这四个关键要素的提升,从而有效实现云计算运维https://www.99xueshu.com/w/ikeyjaq7nr4o.html
13.数据挖掘教程:什么是数据挖掘?技术,工艺数据挖掘”的英文缩写是?数据挖掘是从庞大的数据集中寻找潜在有用模式的过程。它是一种多学科技能,使用机器学习,统计学和AI来提取信息以评估未来事件的概率。从数据挖掘中获得的见解用于营销,欺诈检测,科学发现等。 数据挖掘就是要发现数据之间隐藏的、未被怀疑的、以前未知但有效的关系。数据挖掘也称为数据中的知识发现(KDD),知识提取,数据https://blog.csdn.net/qq_22182989/article/details/125719155
14.基于MapReduce的增量数据挖掘研究AET摘要: 频繁项集挖掘是数据挖掘过程中的重要部分,传统数据挖掘算法中常用Apriori算法和FP增长算法来挖掘频繁项集。在实际应用中,传统算法往往不能用于频繁更新的数据库,采用IMBT数据结构能从不断更新的数据库中挖掘频繁项集,但是这将导致存储空间不足和运行效率低下的问题。基于MapReduce的增量数据挖掘能够有效解决这些http://www.chinaaet.com/article/218164
15.软考高级——信息系统项目管理师(第4版)思维导图模板数字化管理。数字化管理是企业通过打通核心数据链,贯通制造全场景、全过程,基于数据的广泛汇聚、集成优化和价值挖掘, T化、剧新门千里北业战略决策、产品研发、生产制造、经营管理、市场服务等业务活动,构建数据驱动的高效运营管理新模式。 车联网 车联网是新一代网络通信技术与汽车、电子、道路交通运输等领域深度融合https://www.processon.com/view/654c455f8f11b40fe56ece43
16.数据仓库与数据挖掘技术—数据挖掘分类及过程模型数据挖掘:首先根据对问题的定义明确挖掘的任务或目的,如分类、聚类、关联规则发现或序列模式发现等。然后选择算法 结果解释与评估:对发现的模式进行可视化,或者把结果转换为用户容易理解的其他表示形式 Fayyad过程模型从某种意义上来说是面向理论,偏向技术的模型,而不是面向工程、面向应用的模型。虽然有模型的评估,但侧重https://www.jianshu.com/p/da25173289b9
17.数据挖掘的步骤包括什么数据挖掘是一个通过特定算法对大量数据进行处理和分析,以发现数据中的模式、趋势或关联性的过程。下面详细介绍数据挖掘的步骤包括什么? 1、数据收集 首先,需要收集与待挖掘主题相关的数据。可能涉及从各种来源(如数据库、文件、网络等)获取数据,并将其清洗、整合到一个统一的格式中。 https://www.pxwy.cn/news-id-81213.html