2023年秋江苏开放大学数据挖掘技术第3次形考作业

微信小程序
资源下载
下载价格10

试题列表
单选题
题型:单选题客观题分值2分难度:中等得分:2
1
下列关于凝聚层次聚类的说法,说法正确的是( )。
A
算法的终止条件是仅剩下一个簇
B
空间复杂度
C
具有全局优化目标函数
D
一旦两个簇合并,该操作还能撤销
正确答案:A
题型:单选题客观题分值2分难度:一般得分:2
2
决策树中不包含以下哪种节点( )。
A
内部节点
B
根节点
C
外部节点
D
叶结点
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
3
以下哪种技术对于减少数据集的维度会更好( )。
A
删除不同数据趋势的列
B
删除数据差异较大的列
C
删除缺少值太多的列
D
都不是
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
4
以下哪个聚类算法不属于基于网格的聚类算法()。
A
WaveCluster
B
BIRCH
C
MAFIA
D
STING
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
5
以下哪个算法是分类算法()。
A
EM
B
DBSCAN
C
C4.5
D
K-Mean
正确答案:C
题型:单选题客观题分值2分难度:一般得分:2
6
关联规则的评价指标是( )。
A
均方误差、均方根误差
B
Kappa统计、显著性检验
C
支持度、置信度
D
平均绝对误差、相对误差
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
7
以下哪项关于决策树的说法是错误的()。
A
寻找最佳决策树是NP完全问题
B
冗余属性不会对决策树的准确率造成不利的影响
C
子树可能在决策树中重复多次
D
决策树算法对于噪声的干扰非常敏感
正确答案:D
题型:单选题客观题分值2分难度:简单得分:2
8
一监狱人脸识别准入系统用来识别对待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求( )。
A
K-中心点聚类问题
B
二分类问题
C
多分类问题
D
层次聚类问题
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
9
以下哪个分类方法可以较好地避免样本的不平衡问题()。
A
Bayes
B
神经网络
C
KNN
D
SVM
正确答案:C
题型:单选题客观题分值2分难度:中等得分:2
10
“点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是( )。
A
模型预测准确率已经很高了,我们不需要做什么了
B
模型预测准确率不高,我们需要做点什么改进模型
C
以上都不对
D
无法下结论
正确答案:D
题型:单选题客观题分值2分难度:简单得分:2
11
关于欠拟合,下面哪个说法是正确的( )。
A
训练误差较小,测试误差较大
B
训练误差较大,测试误差较大
C
训练误差较大,测试误差较小
D
训练误差不变,测试误差较大
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
12
我们想在大数据集上训练决策树,为了使用较少时间,我们可以( )。
A
增加学习率
B
减少树的深度
C
增加树的深度
D
减少树的数量
正确答案:B
题型:单选题客观题分值2分难度:一般得分:2
13
影响基本K-均值算法的主要因素有( )。
A
聚类准则
B
样本的数量
C
模式相似性测度
D
样本输入顺序
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
14
一般,K-NN最近邻方法在( )的情况下效果较好。
A
样本较少但典型性好
B
样本呈团状分布
C
样本较多但典型性不好
D
样本呈链状分布
正确答案:A
题型:单选题客观题分值2分难度:简单得分:2
15
当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题( )。
A
主成分分析
B
聚类
C
关联规则
D
分类
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
16
下列哪个描述是正确的( )。
A
回归是无指导的学习,聚类是有指导的学习
B
回归是有指导的学习,聚类是无指导的学习
C
回归和聚类都是无指导的学习
D
回归和聚类都是有指导的学习
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
17
简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。
A
模糊聚类
B
划分聚类
C
非互斥聚类
D
层次聚类
正确答案:B
题型:单选题客观题分值2分难度:简单得分:2
18
BIRCH是一种()。
A
特征选择算法
B
关联分析算法
C
分类器
D
聚类算法
正确答案:D
题型:单选题客观题分值2分难度:简单得分:2
19
以下不属于影响聚类算法结果的主要因素有( )。
A
分类准则
B
模式相似性测度
C
已知类别的样本质量
D
特征选取
正确答案:C
题型:单选题客观题分值2分难度:简单得分:2
20
以下( )算法是关联规则挖掘。
A
K-Means
B
ID3
C
Apriori
D
DBSCAN
正确答案:C
填空题
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
1
支持向量机的3种模型可分为:
第1空分值:2分
第2空分值:2分
第3空分值:2分
正确答案:线性可分支持向量机;线性支持向量机;非线性支持向量机
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
2
层次聚类方法可分为:
第1空分值:2分
第2空分值:2分
正确答案:凝聚层次聚类;分裂层次聚类
题型:填空题客观题答案不允许乱序分值6分难度:简单得分:6
3
惰性学习法主要包括:
第1空分值:2分
第2空分值:2分
第3空分值:2分
正确答案:K最近邻分类法(KNN);局部加权回归法;基于案例的推理
题型:填空题客观题答案不允许乱序分值4分难度:简单得分:4
4
分类的基本过程:
第1空分值:2分
第2空分值:2分
正确答案:学习阶段;分类阶段
题型:填空题客观题答案不允许乱序分值10分难度:简单得分:10
5
回归分析的步骤     。
第1空分值:2分
第2空分值:2分
第3空分值:2分
第4空分值:2分
第5空分值:2分
正确答案:确定变量;建立预测模型;进行相关分析;计算预测误差;确定预测值
简答题
题型:简答题主观题分值7分难度:简单得分:7
1
简述K-均值算法的基本过程。

答案


题型:简答题主观题分值6分难度:简单得分:6
2
阐述统计方法的离群点检测的优缺点。

答案


题型:简答题主观题分值5分难度:简单得分:5
3
简述基于聚类的方法的目的以及它的特点是什么。

答案


题型:简答题主观题分值12分难度:困难得分:12
4
【案例分析题】
聚类评价指标的计算:某池塘有1400条鲤鱼、300只虾、300只鳖。
1. 现在以捕到鲤鱼为目的,若撒网后捕捉到700条鲤鱼、200只虾、100只鳖,那么评价指标:正确率、召回率和F值分别是多少?
2. 如果把池子里的所有的鲤鱼、虾和鳖都一网打尽,则此时评价指标:正确率、召回率和F值分别是多少?

答案

点点赞赏,手留余香 给TA打赏

AI创作

评论0

请先

2023年春江苏开放大学大学英语(B)(1)过程性考核作业4
2023年春江苏开放大学大学英语(B)(1)过程性考核作业4
2分钟前 有人购买 去瞅瞅看
长镜头的美学特征是什么?
长镜头的美学特征是什么?
5分钟前 有人购买 去瞅瞅看
过A点作长度为30mm,α=450的正平线AB,已知B点在A点的右上方。(请在白纸上手工绘制后,拍照,在作业文档中插入图片后提交)
过A点作长度为30mm,α=450的正平线AB,已知B点在A点的右上方。(请在白纸上手工绘制后,拍照,在作业文档中插入图片后提交)
8分钟前 有人购买 去瞅瞅看
支持多种货币
支持多种货币付款,满足您的付款需求
7天无忧退换
安心无忧购物,售后有保障
专业客服服务
百名资深客服7*24h在线服务
发货超时赔付
交易成功极速发货,专业水准保证时效性

站点公告

课程作业辅导,有需要加下方微信

显示验证码

社交账号快速登录