试题列表
单选题
题型:单选题客观题分值2分难度:一般得分:2
1
决策树中不包含以下哪种节点( )。
A
根节点
B
叶结点
C
外部节点
D
内部节点
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
2
下列哪个描述是正确的( )。
A
回归和聚类都是无指导的学习
B
回归和聚类都是有指导的学习
C
回归是无指导的学习,聚类是有指导的学习
D
回归是有指导的学习,聚类是无指导的学习
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
3
以下( )算法是关联规则挖掘。
A
Apriori
B
K-Means
C
ID3
D
DBSCAN
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
4
以下哪个算法是分类算法()。
A
EM
B
K-Mean
C
DBSCAN
D
C4.5
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
5
关于欠拟合,下面哪个说法是正确的( )。
A
训练误差较大,测试误差较小
B
训练误差不变,测试误差较大
C
训练误差较大,测试误差较大
D
训练误差较小,测试误差较大
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
6
一般,K-NN最近邻方法在( )的情况下效果较好。
A
样本呈团状分布
B
样本较多但典型性不好
C
样本较少但典型性好
D
样本呈链状分布
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
7
当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题( )。
A
关联规则
B
主成分分析
C
分类
D
聚类
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:中等得分:2
8
下列关于凝聚层次聚类的说法,说法正确的是( )。
A
空间复杂度
B
算法的终止条件是仅剩下一个簇
C
具有全局优化目标函数
D
一旦两个簇合并,该操作还能撤销
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
9
以下哪个分类方法可以较好地避免样本的不平衡问题()。
A
KNN
B
Bayes
C
SVM
D
神经网络
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
10
影响基本K-均值算法的主要因素有( )。
A
模式相似性测度
B
样本的数量
C
聚类准则
D
样本输入顺序
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
11
一监狱人脸识别准入系统用来识别对待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求( )。
A
层次聚类问题
B
二分类问题
C
K-中心点聚类问题
D
多分类问题
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:中等得分:2
12
“点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是( )。
A
模型预测准确率不高,我们需要做点什么改进模型
B
模型预测准确率已经很高了,我们不需要做什么了
C
以上都不对
D
无法下结论
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
13
以下哪个聚类算法不属于基于网格的聚类算法()。
A
BIRCH
B
MAFIA
C
WaveCluster
D
STING
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
14
关联规则的评价指标是( )。
A
Kappa统计、显著性检验
B
平均绝对误差、相对误差
C
支持度、置信度
D
均方误差、均方根误差
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
15
BIRCH是一种()。
A
分类器
B
关联分析算法
C
聚类算法
D
特征选择算法
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
16
以下哪种技术对于减少数据集的维度会更好( )。
A
删除不同数据趋势的列
B
删除缺少值太多的列
C
删除数据差异较大的列
D
都不是
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
17
简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。
A
非互斥聚类
B
层次聚类
C
模糊聚类
D
划分聚类
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:简单得分:0
18
以下哪项关于决策树的说法是错误的()
A
决策树算法对于噪声的干扰非常敏感
B
子树可能在决策树中重复多次
C
寻找最佳决策树是NP完全问题
D
冗余属性不会对决策树的准确率造成不利的影响
学生答案:A
老师点评:寻找最佳决策树是NP完全问题。 这是正确的。寻找最优的决策树(即在所有可能的树中找到具有最小错误率或最高准确率的树)是一个NP完全问题,意味着其计算复杂度随着数据量的增长而急剧增加,通常不可能在多项式时间内找到最优解。 子树可能在决策树中重复多次。 这也是正确的。在决策树的构建过程中,相同的子树结构可能会因为数据中的重复模式或相似性而多次出现。 冗余属性不会对决策树的准确率造成不利的影响。 这是错误的。冗余属性(即对目标变量没有预测作用或与其他属性高度相关的属性)会增加决策树的复杂度,可能导致过拟合,从而降低模型在未见数据上的准确率。虽然一些决策树算法(如C4.5)有处理冗余属性的机制(如通过信息增益率来选择属性),但冗余属性的存在本身仍然是一个潜在的问题。 决策树算法对于噪声的干扰非常敏感。 这是正确的。决策树算法对噪声数据较为敏感,因为噪声数据可能导致决策树在训练数据上过拟合,从而降低了模型的泛化能力。
题型:单选题客观题分值2分难度:简单得分:2
19
我们想在大数据集上训练决策树,为了使用较少时间,我们可以( )。
A
增加学习率
B
增加树的深度
C
减少树的深度
D
减少树的数量
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:简单得分:2
20
以下不属于影响聚类算法结果的主要因素有( )。
A
已知类别的样本质量
B
分类准则
C
特征选取
D
模式相似性测度
学生答案:A
老师点评:
填空题
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
1
惰性学习法主要包括:
第1空分值:2分
第2空分值:2分
第3空分值:2分
学生答案:K最近邻分类法(KNN);局部加权回归法;基于案例的推理
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
2
分类的基本过程:
第1空分值:2分
第2空分值:2分
学生答案:学习阶段;分类阶段
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
3
层次聚类方法可分为:
第1空分值:2分
第2空分值:2分
学生答案:凝聚层次聚类;分裂层次聚类
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
4
支持向量机的3种模型可分为:
第1空分值:2分
第2空分值:2分
第3空分值:2分
学生答案:线性可分支持向量机;线性支持向量机;非线性支持向量机
题型:填空题客观题答案不允许乱序分值10分难度:简单得分:10
5
回归分析的步骤 。
第1空分值:2分
第2空分值:2分
第3空分值:2分
第4空分值:2分
第5空分值:2分
学生答案:确定变量;建立预测模型;进行相关分析;计算预测误差;确定预测值
简答题
题型:简答题主观题分值10分难度:简单得分:10
1
画出BP神经网络原理图,并简述BP神经网络算法流程包括哪些步骤。
题型:简答题主观题分值6分难度:简单得分:5
2
简述K-均值算法的基本过程。
题型:简答题主观题分值4分难度:简单得分:4
3
简述基于聚类的方法的目的以及它的特点是什么。
题型:简答题主观题分值10分难度:困难得分:10
4
【案例分析题】
聚类评价指标的计算:某池塘有1400条鲤鱼、300只虾、300只鳖。
1. 现在以捕到鲤鱼为目的,若撒网后捕捉到700条鲤鱼、200只虾、100只鳖,那么评价指标:正确率、召回率和F值分别是多少?
2. 如果把池子里的所有的鲤鱼、虾和鳖都一网打尽,则此时评价指标:正确率、召回率和F值分别是多少?




评论0