• 游客 下载了资源 国家开放大学网络管理与维护综合实训实训 1 使用Windows 故障转移群集功能实现高可用的文件服务器。
  • 游客 下载了资源 国家开放大学网络管理与维护综合实训实训 1 使用Windows 故障转移群集功能实现高可用的文件服务器。
  • 游客 购买了资源 国家开放大学网络管理与维护综合实训实训 1 使用Windows 故障转移群集功能实现高可用的文件服务器。
  • 游客 下载了资源 2023年上半年教师资格证考试《教育知识与能力》(中学)题参考答案
  • 游客 下载了资源 国家开放大学网络管理与维护综合实训实训 2 使用AD证书服务实现安全的企业网站访问
  • 游客 购买了资源 国家开放大学网络管理与维护综合实训实训 2 使用AD证书服务实现安全的企业网站访问
  • 游客 下载了资源 爱普生Epson PM-A840 驱动
  • 游客 下载了资源 爱普生Epson LQ-735K 打印机驱动
  • 游客 下载了资源 惠普hp打印机驱动安装Officejet Pro7740
  • 游客 下载了资源 惠普hp打印机驱动安装Officejet Pro7740

2025年春江苏开放大学数据采集与预处理第三次形考作业

试题列表

单选题

题型:单选题客观题分值3分难度:一般得分:3

1下列选项中,( )是评价数据质量的核心准则。

A完整性

B准确性

C适用性

D简洁性

正确答案:C

题型:单选题客观题分值3分难度:一般得分:3

2下列说法中,关于清洗重复值的说法正确的是( )

A清洗重复值的基本思想是“分而合之”

B清洗重复值的基本思想是“排序”

C清洗重复值的基本思想是“排序和合井”

D清洗重复值的基本思想是“合并”

正确答案:C

题型:单选题客观题分值3分难度:一般得分:3

3下列选项属于名义型特征的是( )

A景点名称={天坛,北海,故宫、⾹⼭}

B成绩={88,92,83,95}

C质量⽔平={⼀级,⼆级,三级,四级}

D半径={7.64,7.44,7.23,7.39}

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

4下列选项中,描述不正确的是( )。

A数据清洗的目的是为了提高数据质量

B异常值一定要删除

C可使用drop_duplicates()方法删除重复数据

Dconcat()函数可以沿着一条轴将多个对象进行堆叠

正确答案:B:

题型:单选题客观题分值3分难度:一般得分:3

5

请阅读下面一段程序:

from pandas import Series

import pandas as pd

from numpy import NaN

series_obj = Series([None, 4, NaN])

pd.isnull(series_obj)

执行上述程序后,最终输出的结果为( )。

A

0 True

1 False

2 True

B

0 True

1 True

2 False

C

0 False

1 True

2 True

D

0 True

1 True

2 True

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

6下列选项中,可以删除缺失值或空值的是( )。

A.isnull()

B.notnull()

C.dropna()

D.fillna()

正确答案:C

题型:单选题客观题分值3分难度:一般得分:3

7下列选项中,描述不正确是( )。

Aconcat()函数可以沿着一条轴将多个对象进行堆叠

Bmerge()函数可以根据一个或多个键将不同的DataFrame进行合并

C可以使用rename()方法对索引进行重命名操作

Dunstack()方法可以将列索引旋转为行索引

正确答案:D

题型:单选题客观题分值3分难度:一般得分:3

8

请阅读下面一段程序:

import numpy as np

import pandas as pd

ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])

ser_obj.sort_values()

执行上述程序后,最终输出的结果为( )。

A

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

1 NaN

B

1 NaN

2 6.0

3 5.0

0 4.0

5 2.0

4 -3.0

C

5 2.0

0 4.0

3 5.0

2 6.0

4 -3.0

1 NaN

D

0 4.0

1 NaN

2 6.0

3 5.0

4 -3.0

5 2.0

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

9下列说法错误的是( )

A必须删除异常值

B可以对缺失值进⾏插补

C对数据进⾏标准化,消除量纲的影响

D数据离散化是⼀种数据转换的⽅式

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

10下列选项表述错误的是( )

A数据清洗包括缺失值处理、异常值处理、数据转换等⼏个⽅⾯

B数据的初步处理是对数据进⾏整合、分组等操作

C检测异常值的⽅法可以基于统计、距离、密度、模型等

D缺失值最好的处理⽅式是直接删除

正确答案:D

填空题

题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2

1

常见的数据质量问题主要包括缺失值、以及错误值等问题。

第1空分值:2分

正确答案:重复值

题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2

2

stack()方法可以将列索引转换为。

第1空分值:2分

正确答案:行索引

题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2

3

技术是提高数据质量的有效方法。

第1空分值:2分

正确答案:数据清洗

题型:填空题客观题答案不允许乱序分值4分难度:一般得分:4

4

concat()函数的堆叠方式有横向堆叠和,连接方式有内连接和。

第1空分值:2分

第2空分值:2分

题型:简答题主观题分值12分难度:一般得分:12

1请简述数据预处理的常用操作。

答案

2简述数据清洗的基本流程。

答案

题型:简答题主观题分值36分难度:一般得分:36

3

现有如下图所示的两组数据,其中 A组中B列数据存在缺失值,并且该列数据为int类型,B组中的数据均为str类型。接下来,请对这些数据进行以下操作:

IMG_256

(1)使用DataFrame创建这两组数据。

(2)现在需要使用B组中的数据对A组中的缺失值进行填充并保持数据类型一致。

(3)将合并后A组中索引名为key的索引重命名为D。

请将程序写在下面的文本框内。

答案

资源下载
下载价格10
点点赞赏,手留余香 给TA打赏

评论0

请先
支持多种货币
支持多种货币付款,满足您的付款需求
7天无忧退换
安心无忧购物,售后有保障
专业客服服务
百名资深客服7*24h在线服务
发货超时赔付
交易成功极速发货,专业水准保证时效性

站点公告

开放大学课程作业辅导,有需要扫码加微信

显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录