1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)
A.关联规则发现
B.聚类
C.分类
D.自然语言处理
2.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C)
A.频繁模式挖掘
B.分类和预测
C.数据预处理
D.数据流挖掘
3.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?(B)
A.分类
C.关联分析
D.隐马尔可夫链
4.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(A)
A.探索性数据分析
B.建模描述
C.预测建模
D.寻找模式和规则
5.下面哪种不属于数据预处理的方法?(D)
A变量代换B离散化C聚集D估计遗漏值
6.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?(B)
A第一个
B第二个
C第三个
D第四个
7.只有非零值才重要的二元属性被称作:(C)
A计数属性
B离散属性C非对称的二元属性D对称属性
8.以下哪种方法不属于特征选择的标准方法:(D)
A嵌入B过滤C包装D抽样
A特征提取B特征修改C映射数据到新的空间D特征构造
10.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D)
A0.821
B1.224
C1.458
D0.716
11.假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:(A)
A18.3
B22.6
C26.8
D27.9
B.捕捉到的新数据会覆盖原来的快照;
C.数据仓库随事件变化不断删去旧的数据内容;
13.关于基本数据的元数据是指:(D)
C.基本元数据包括日志文件和简历执行处理的时序调度信息;
D.基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息.
14.下面关于数据粒度的描述不正确的是:(C)
A.粒度是指数据仓库小数据单元的详细程度和级别;
B.数据越详细,粒度就越小,级别也就越高;
C.数据综合度越高,粒度也就越大,级别也就越高;
D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.
15.设X={1,2,3}是频繁项集,则可由X产生__(C)__个关联规则。
A、4
B、5
C、6
D、7
16.概念分层图是__(B)__图。
A、无向无环
B、有向无环
C、有向有环
D、无向有环
17.频繁项集、频繁闭项集、最大频繁项集之间的关系是:(C)
A、频繁项集频繁闭项集=最大频繁项集
B、频繁项集=频繁闭项集最大频繁项集
C、频繁项集频繁闭项集最大频繁项集
D、频繁项集=频繁闭项集=最大频繁项集
18.在图集合中发现一组公共子结构,这样的任务称为(B)
A、频繁子集挖掘
B、频繁子图挖掘
C、频繁数据项挖掘
D、频繁模式挖掘
19.决策树中不包含一下哪种结点,A,根结点(rootnode)B,内部结点(internalnode)C,外部结点(externalnode)D,叶结点(leafnode)(C)
20.以下哪项关于决策树的说法是错误的(C)
A.冗余属性不会对决策树的准确率造成不利的影响
B.子树可能在决策树中重复多次
C.决策树算法对于噪声的干扰非常敏感
D.寻找最佳决策树是NP完全问题
21.在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为(B)
A.基于类的排序方案
B.基于规则的排序方案
C.基于度量的排序方案
D.基于规格的排序方案。
22.在SQLServer数据库中,有一个产品表products,你想按照价格从小到大的顺序显示所有产品的名称(productname)和价格(price),可以实现该功能的T-SQL语句是(A)。(选择一项)
(A)SELECTproductname,pricefromproductsorderbypriceASC
(B)SELECTproductname,pricefromproductsorderbypriceDESC
(C)SELECTproductnameandpricefromproductsorderbyprice
(D)SELECTproductnameandpricefromproductsorderbypriceDESC
23.你是公司的SQLserver数据库管理员。你管理一个数据库,其中有一个产品表Products,记录公司的产品信息,你想删除过期的产品信息,应该用(D)语句。(选择一项)
(A)select(B)insert(C)update(D)delete
24.下列哪条语句可以完成删除数据库中某个视图的操作:(D)
A.Delete*fromview_Name
B.Deletefromview_Name
C.DeleteviewTable_Name
D.DropviewTable_Name
25.下列哪条语句可以完成将表xjb中的数据按Class(班级)分组统计出各个班的总人数
显示出来:(B)
A.Select*fromxjbgroupbyclass
B.SelectClass,总人数=count(Class)fromxjbgroupbyclass
C.SelectClass,总人数=count(Class)fromxjborderbyclass
D.Select*fromxjbOrderbyclass
26.在SQL中,建立表用的命令是(B)。
A.CREATESCHEMA
B.CREATETABLE
C.CREATEVIEW
D.CREATEINDEX
27.下列四项中,不正确的提法是(C)。
A.SQL语言是关系数据库的国际标准语言
B.SQL语言具有数据定义、查询、操纵和控制功能
C.SQL语言可以自动实现关系数据库的规范化
D.SQL语言称为结构查询语言
28.在SQL语言中,建立存储过程的命令是(A)
A、CREATEPROCEDURE
B、CREATERULE
C、CREATEDURE
D、CREATEFILE
29.数据库管理系统的英文缩写是(A)。
A.DBMSB.DBSC.DBAD.DB
30.向用户授予操作权限的SQL语句是(D)。
A.CTEATEB.REVOKEC.SELECTD.GRANT
二、多选题(每题1分,共20题)
1.通过数据挖掘过程所推倒出的关系和摘要经常被称为:(AB)