试题列表
单选题
题型:单选题客观题分值3分难度:一般得分:3
1下列选项中,( )是评价数据质量的核心准则。
A完整性
B准确性
C适用性
D简洁性
正确答案:C
题型:单选题客观题分值3分难度:一般得分:3
2下列说法中,关于清洗重复值的说法正确的是( )
A清洗重复值的基本思想是“分而合之”
B清洗重复值的基本思想是“排序”
C清洗重复值的基本思想是“排序和合井”
D清洗重复值的基本思想是“合并”
正确答案:C
题型:单选题客观题分值3分难度:一般得分:3
3下列选项属于名义型特征的是( )
A景点名称={天坛,北海,故宫、⾹⼭}
B成绩={88,92,83,95}
C质量⽔平={⼀级,⼆级,三级,四级}
D半径={7.64,7.44,7.23,7.39}
正确答案:A
题型:单选题客观题分值3分难度:一般得分:3
4下列选项中,描述不正确的是( )。
A数据清洗的目的是为了提高数据质量
B异常值一定要删除
C可使用drop_duplicates()方法删除重复数据
Dconcat()函数可以沿着一条轴将多个对象进行堆叠
正确答案:B:
题型:单选题客观题分值3分难度:一般得分:3
5
请阅读下面一段程序:
from pandas import Series
import pandas as pd
from numpy import NaN
series_obj = Series([None, 4, NaN])
pd.isnull(series_obj)
执行上述程序后,最终输出的结果为( )。
A
0 True
1 False
2 True
B
0 True
1 True
2 False
C
0 False
1 True
2 True
D
0 True
1 True
2 True
正确答案:A
题型:单选题客观题分值3分难度:一般得分:3
6下列选项中,可以删除缺失值或空值的是( )。
A.isnull()
B.notnull()
C.dropna()
D.fillna()
正确答案:C
题型:单选题客观题分值3分难度:一般得分:3
7下列选项中,描述不正确是( )。
Aconcat()函数可以沿着一条轴将多个对象进行堆叠
Bmerge()函数可以根据一个或多个键将不同的DataFrame进行合并
C可以使用rename()方法对索引进行重命名操作
Dunstack()方法可以将列索引旋转为行索引
正确答案:D
题型:单选题客观题分值3分难度:一般得分:3
8
请阅读下面一段程序:
import numpy as np
import pandas as pd
ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])
ser_obj.sort_values()
执行上述程序后,最终输出的结果为( )。
A
4 -3.0
5 2.0
0 4.0
3 5.0
2 6.0
1 NaN
B
1 NaN
2 6.0
3 5.0
0 4.0
5 2.0
4 -3.0
C
5 2.0
0 4.0
3 5.0
2 6.0
4 -3.0
1 NaN
D
0 4.0
1 NaN
2 6.0
3 5.0
4 -3.0
5 2.0
正确答案:A
题型:单选题客观题分值3分难度:一般得分:3
9下列说法错误的是( )
A必须删除异常值
B可以对缺失值进⾏插补
C对数据进⾏标准化,消除量纲的影响
D数据离散化是⼀种数据转换的⽅式
正确答案:A
题型:单选题客观题分值3分难度:一般得分:3
10下列选项表述错误的是( )
A数据清洗包括缺失值处理、异常值处理、数据转换等⼏个⽅⾯
B数据的初步处理是对数据进⾏整合、分组等操作
C检测异常值的⽅法可以基于统计、距离、密度、模型等
D缺失值最好的处理⽅式是直接删除
正确答案:D
填空题
题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2
1
常见的数据质量问题主要包括缺失值、以及错误值等问题。
第1空分值:2分
正确答案:重复值
题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2
2
stack()方法可以将列索引转换为。
第1空分值:2分
正确答案:行索引
题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2
3
技术是提高数据质量的有效方法。
第1空分值:2分
正确答案:数据清洗
题型:填空题客观题答案不允许乱序分值4分难度:一般得分:4
4
concat()函数的堆叠方式有横向堆叠和,连接方式有内连接和。
第1空分值:2分
第2空分值:2分
题型:简答题主观题分值12分难度:一般得分:12
1请简述数据预处理的常用操作。
2简述数据清洗的基本流程。
题型:简答题主观题分值36分难度:一般得分:36
3
现有如下图所示的两组数据,其中 A组中B列数据存在缺失值,并且该列数据为int类型,B组中的数据均为str类型。接下来,请对这些数据进行以下操作:
(1)使用DataFrame创建这两组数据。
(2)现在需要使用B组中的数据对A组中的缺失值进行填充并保持数据类型一致。
(3)将合并后A组中索引名为key的索引重命名为D。
请将程序写在下面的文本框内。
请先
!