试题列表
单选题
题型:单选题客观题分值2分难度:简单得分:2
1
某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )
A
关联规则发现
B
聚类
C
分类
D
自然语言处理
正确答案:A
题型:单选题客观题分值2分难度:中等得分:2
2
以下两种描述分别对应哪两种对分类算法的评价标准?( )
(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
(b)描述有多少比例的小偷给警察抓了的标准。
A
Precision,Recall
B
Recall,Precision
C
Precision,ROC
D
Recall,ROC
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
3
下列不属于分析与挖掘的数据类型的是()。
A
数据库数据
B
数据分析
C
数据矩阵
D
事务数据
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
4
目的是缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果的是()。
A
数据清洗
B
数据集成
C
数据变换
D
数据归约
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
5
目前数据分析和数据挖掘面临的挑战性问题不包括()。
A
数据类型的多样性
B
高维度数据
C
离散点数据
D
数据分析与数据挖掘结果的可视化
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
6
下列应用中,哪一个不属于数据分析与数据挖掘的应用()。
A
商务智能
B
搜索引擎
C
辅助医疗
D
垃圾邮件识别
正确答案:D
题型:单选题客观题分值2分难度:简单得分:2
7
假设12个销售价格记录已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等宽划分时(宽度为50),15又在哪个箱子里?( )
A
第一个
B
第二个
C
第三个
D
第四个
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
8
假设12个销售价格记录已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?( )
A
第一个
B
第二个
C
第三个
D
第四个
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
9
下面哪种不属于数据预处理的方法?( )
A
变量代换
B
离散化
C
聚集
D
估计遗漏值
正确答案:D
题型:单选题客观题分值2分难度:简单得分:2
10
用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?( )
A
根据内容检索
B
建模描述
C
预测建模
D
寻找模式和规则
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
11
建立一个模型,通过这个模型根据已知的变量值,来预测其他某个变量值属于数据挖掘的哪一类任务?( )
A
根据内容检索
B
建模描述
C
预测建模
D
寻找模式和规则
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
12
为数据的总体分布建模,把多维空间划分成组等问题,属于数据挖掘的哪一类任务?( )
A
探索性数据分析
B
建模描述
C
预测建模
D
寻找模式和规则
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
13
使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?( )
A
探索性数据分析
B
建模描述
C
预测建模
D
寻找模式和规则
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
14
什么是KDD?( )
A
数据挖掘与知识发现
B
领域知识发现
C
文档知识发现
D
动态知识发现
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
15
当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )
A
分类
B
聚类
C
关联分析
D
隐马尔科夫链
正确答案:B
题型:单选题客观题分值2分难度:一般得分:2
16
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( )
A
频繁模式挖掘
B
分类和预测
C
数据预处理
D
数据流挖掘
正确答案:C
题型:单选题客观题分值2分难度:中等得分:2
17
考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是( )。
A
2
B
3
C
3.5
D
5
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
18
下面不属于创建新属性的相关方法的是( )。
A
特征提取
B
特征修改
C
映射数据到新的空间
D
特征构造
正确答案:B
题型:单选题客观题分值2分难度:中等得分:2
19
假设有学生考试成绩的值:60,45,33,77,80,100,100,90,70,65,找出这组数据的中列数( )。
A
66.5
B
100
C
82.5
D
78
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
20
数值属性的相异性不包括( )。
A
牛顿距离
B
欧几里得距离
C
闵可夫斯基距离
D
切比雪夫距离
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
21
假设有学生考试成绩的值:60,45,33,77,80,100,100,90,70,65,找出这组数据的中位数( )。
A
100
B
73.5
C
78.5
D
55
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
22
下列的类型,哪一个不属于属性的分类( )。
A
标称属性
B
集合属性
C
二元属性
D
数值属性
正确答案:B
题型:单选题客观题分值2分难度:一般得分:2
23
以下哪种方法不属于特征选择的标准方法( )。
A
嵌入
B
过滤
C
包装
D
抽样
正确答案:D
题型:单选题客观题分值2分难度:中等得分:2
24
只有非零值才重要的二元属性被称作( )。
A
计数属性
B
离散属性
C
非对称的二元属性
D
对称属性
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
25
属于定量的属性类型是( )。
A
标称
B
序数
C
区间
D
相异
正确答案:C
题型:单选题客观题分值2分难度:一般得分:2
26
下面哪个不属于数据的属性类型。( )
A
标称
B
序数
C
区间
D
相异
正确答案:D
多选题
题型:多选题客观题分值2分难度:中等得分:2
1
基本统计图形显示有()
A
箱图
B
饼图
C
频率直方图
D
散点图
正确答案:A;B;C;D
题型:多选题客观题分值2分难度:中等得分:2
2
数据分散度量有()
A
极差
B
分位数
C
四分位数
D
方差
E
标准差
正确答案:A;B;C;D;E
题型:多选题客观题分值2分难度:中等得分:2
3
分析与挖掘的数据类型有()
A
数据库数据
B
数据仓库数据
C
事务数据
D
数据矩阵
E
图和网状数据
F
其它类型的数据
正确答案:A;B;C;D;E;F
填空题
题型:填空题客观题答案不允许乱序分值4分难度:一般得分:4
1
数据预处理的方法包括 、、、 。
第1空分值:2分
第2空分值:2分
第3空分值:2分
第4空分值:2分
正确答案:数据清理;数据集成;数据变换;数据归约
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:2
2
数据分析与数据挖掘的方法有 、 、、 。
第1空分值:2分
第2空分值:2分
第3空分值:2分
第4空分值:2分
正确答案:频繁模式;分类与回归;聚类分析;离群点分析
简答题
题型:简答题主观题分值6分难度:简单得分:6
1
阐述二元属性的状态以及每种状态表示的含义。
题型:简答题主观题分值6分难度:简单得分:6
2
什么是极差、分位数、方差?
题型:简答题主观题分值7分难度:简单得分:7
3
数据预处理的主要方法有哪些?每个方法的主要内容是什么?
题型:简答题主观题分值7分难度:简单得分:7
4
简述均值、中位数、众数和中列数的定义。
题型:简答题主观题分值8分难度:简单得分:8
5
什么是数据分析和数据挖掘?简单论述他们之间的区别和联系。
评论0