试题列表
单选题
题型:单选题客观题分值7分难度:简单得分:7
1
下列关于数据治理的表述错误的是()
A
数据治理可理解为对数据管理的管理
B
数据治理关注组织架构、制度、流程这些管理要素的整合和执行
C
数据质量管理是数据治理核心模块之一,影响数据资产的应用价值
D
在数据治理中,数据标准模块主要负责确保隐私、保密性和适当的访问权限等
正确答案:D
题型:单选题客观题分值7分难度:简单得分:7
2
我们对性别字段(取值为“M”,“F”和“unknown”)进行编码:
gender={“M”, “F”, “unknown”} ——> gender={0,1,2}
上述使用的特征编码类型是( )
A
One-Hot编码
B
哑变量编码
C
数值编码
D
变量编码
正确答案:C
题型:单选题客观题分值7分难度:简单得分:7
3
在Pandas中,使用下列哪个函数实现等距离散化()
A
cut()
B
Binarizer()
C
qcut()
D
LabelEncoder()
正确答案:A
题型:单选题客观题分值7分难度:简单得分:7
4
下列选项中关于异常值处理叙述错误的是()
A
若确定异常值对分析的影响是负面的,删除异常值是最简便的方法
B
可将异常值视为缺失值处理
C
欺诈检验中,若异常值存在,应将其删除
D
并不是所有的异常值都是无意义的,部分数据工作就是围绕异常值
正确答案:C
题型:单选题客观题分值8分难度:简单得分:8
5
Python中,调用Sklearn的哪个函数可以填补缺失值( )
A
StandardScaler()
B
qcut()
C
MinMaxScaler()
D
Imputer()
正确答案:D
题型:单选题客观题分值8分难度:简单得分:8
6
在Python中,Pandas模块中的 qcut() 方法可以用于( )
A
等频离散化
B
标准化
C
二值化
D
等距离散化
正确答案:A
多选题
题型:多选题客观题分值8分难度:简单得分:8
1
下列关于填补法的表述错误的是()
A
若数据集中某一样本或者特征缺失不多,可用特定值替代缺失值
B
当列特征是离散值时,应采用平均数填充、中位数填充、回归模型填充
C
当列特征是连续值时,应采用列特征的众数填充
D
当列特征前后取值有关联时,可采用向前填充、向后填充
正确答案:B;C
题型:多选题客观题分值8分难度:简单得分:8
2
下列选项属于数据缺失机制类型的有()
A
完全随机缺失
B
随机缺失
C
连续随机缺失
D
非随机缺失
正确答案:A;B;D
题型:多选题客观题分值8分难度:简单得分:8
3
下列选项属于判断异常值的方法的是()
A
散点图
B
3σ法则
C
箱线图
D
线性回归
正确答案:A;B;C
题型:多选题客观题分值8分难度:简单得分:8
4
数据稽核主要是指对数据质量评估标准的哪些指标进行检查()
A
完整性
B
一致性
C
准确性
D
及时性
正确答案:A;B
题型:多选题客观题分值8分难度:简单得分:8
5
下列哪些因素会影响数据的质量()
A
信息因素
B
流程因素
C
技术因素
D
管理因素
正确答案:A;B;C;D
题型:多选题客观题分值8分难度:简单得分:8
6
下列哪些选项属于数据治理的目标()
A
提高数据质量
B
保证数据安全
C
实现数据资源在各组织机构部⻔的共享
D
从数据中获取最优的价值
正确答案:A;B;C;D
题型:多选题客观题分值8分难度:简单得分:8
7
下列选项属于数据离散化方法的是( )
A
二值化
B
等距法
C
等频法
D
映射法
正确答案:A;B;C
评论0