江苏开放大学数据采集与预处理第三次形考作业

2025年秋江苏开放大学数据采集与预处理第二次形考作业江苏开放大学数据采集与预处理第二次BBS讨论江苏开放大学数据采集与预处理第一次BBS讨论 2025年秋江苏开放大学数据采集与预处理形成性综合大作业 2025年秋江苏开放大学数据采集与预处理第四次形考作业 2025年秋江苏开放大学数据采集与预处理第三次形考作业 2025年秋江苏开放大学数据采集与预处理第一次形考作业

试题列表

单选题

题型：单选题客观题分值3分难度：一般得分：3

1下列选项中，（）是评价数据质量的核心准则。

A完整性

B准确性

C适用性

D简洁性

正确答案：C

题型：单选题客观题分值3分难度：一般得分：3

2下列说法中,关于清洗重复值的说法正确的是（）

A清洗重复值的基本思想是“分而合之”

B清洗重复值的基本思想是“排序”

C清洗重复值的基本思想是“排序和合井”

D清洗重复值的基本思想是“合并”

正确答案：C

题型：单选题客观题分值3分难度：一般得分：3

3下列选项属于名义型特征的是（）

A景点名称={天坛，北海，故宫、⾹⼭}

B成绩={88，92，83，95}

C质量⽔平={⼀级，⼆级，三级，四级}

D半径={7.64，7.44，7.23，7.39}

正确答案：A

题型：单选题客观题分值3分难度：一般得分：3

4下列选项中，描述不正确的是（）。

A数据清洗的目的是为了提高数据质量

B异常值一定要删除

C可使用drop_duplicates()方法删除重复数据

Dconcat()函数可以沿着一条轴将多个对象进行堆叠

正确答案：B：

题型：单选题客观题分值3分难度：一般得分：3

请阅读下面一段程序：

from pandas import Series

import pandas as pd

from numpy import NaN

series_obj = Series([None, 4, NaN])

pd.isnull(series_obj)

执行上述程序后，最终输出的结果为（）。

0 True

1 False

2 True

0 True

1 True

2 False

0 False

1 True

2 True

0 True

1 True

2 True

正确答案：A

题型：单选题客观题分值3分难度：一般得分：3

6下列选项中，可以删除缺失值或空值的是（）。

A.isnull()

B.notnull()

C.dropna()

D.fillna()

正确答案：C

题型：单选题客观题分值3分难度：一般得分：3

7下列选项中，描述不正确是（）。

Aconcat()函数可以沿着一条轴将多个对象进行堆叠

Bmerge()函数可以根据一个或多个键将不同的DataFrame进行合并

C可以使用rename()方法对索引进行重命名操作

Dunstack()方法可以将列索引旋转为行索引

正确答案：D

题型：单选题客观题分值3分难度：一般得分：3

请阅读下面一段程序：

import numpy as np

import pandas as pd

ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])

ser_obj.sort_values()

执行上述程序后，最终输出的结果为（）。

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

1 NaN

2 6.0

3 5.0

0 4.0

5 2.0

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

4 -3.0

1 NaN

0 4.0

1 NaN

2 6.0

3 5.0

4 -3.0

5 2.0

正确答案：A

题型：单选题客观题分值3分难度：一般得分：3

9下列说法错误的是（）

A必须删除异常值

B可以对缺失值进⾏插补

C对数据进⾏标准化，消除量纲的影响

D数据离散化是⼀种数据转换的⽅式

正确答案：A

题型：单选题客观题分值3分难度：一般得分：3

10下列选项表述错误的是（）

A数据清洗包括缺失值处理、异常值处理、数据转换等⼏个⽅⾯

B数据的初步处理是对数据进⾏整合、分组等操作

C检测异常值的⽅法可以基于统计、距离、密度、模型等

D缺失值最好的处理⽅式是直接删除

正确答案：D

填空题

题型：填空题客观题答案不允许乱序分值2分难度：一般得分：2

常见的数据质量问题主要包括缺失值、以及错误值等问题。

第1空分值：2分

正确答案：重复值

题型：填空题客观题答案不允许乱序分值2分难度：一般得分：2

stack()方法可以将列索引转换为。

第1空分值：2分

正确答案：行索引

题型：填空题客观题答案不允许乱序分值2分难度：一般得分：2

技术是提高数据质量的有效方法。

第1空分值：2分

正确答案：数据清洗

题型：填空题客观题答案不允许乱序分值4分难度：一般得分：4

concat()函数的堆叠方式有横向堆叠和，连接方式有内连接和。

第1空分值：2分

第2空分值：2分

题型：简答题主观题分值12分难度：一般得分：12

1请简述数据预处理的常用操作。

答案

2简述数据清洗的基本流程。

答案

题型：简答题主观题分值36分难度：一般得分：36

现有如下图所示的两组数据，其中 A组中B列数据存在缺失值，并且该列数据为int类型，B组中的数据均为str类型。接下来，请对这些数据进行以下操作：

（1）使用DataFrame创建这两组数据。

（2）现在需要使用B组中的数据对A组中的缺失值进行填充并保持数据类型一致。

（3）将合并后A组中索引名为key的索引重命名为D。

请将程序写在下面的文本框内。

答案

资源下载

下载价格10 元

VIP免费升级VIP

立即购买

申请退款

点点赞赏，手留余香给TA打赏

2025年秋江苏开放大学数据采集与预处理第三次形考作业

评论0

2026年春江苏开放大学形势与政策060112专题一专题二专题三专题四合集答案

2026年春江苏开放大学文献检索与论文写作060930第三次过程性作业答案

2025年秋江苏开放大学形势与政策060112专题一——四（合集答案）

2025年秋江苏开放大学形势与政策060112专题四测试题答案

2025年秋江苏开放大学形势与政策060112专题三测试题答案

2025年秋江苏开放大学形势与政策060112专题二测试题答案

2025年秋江苏开放大学形势与政策060112专题一测试题答案

2025年秋江苏开放大学入学教育060917作业三答案

2025年秋江苏开放大学毕业教育060918作业三答案

2025年秋江苏开放大学计算机应用基础 060019第三次形成作业（Excel 数据处理综合技能实践）

2025年秋江苏开放大学马克思主义基本原理060111过程性考核作业3（5-8单元）答案

2025年秋江苏开放大学计算机应用基础060019期末理论测试（综合测试）答案

2025年秋江苏开放大学计算机应用基础060019第四次形成作业（PowerPoint操作）

2025年秋江苏开放大学毕业教育060918作业二

2025年秋江苏开放大学入学教育060917过程性作业二

2025年秋江苏开放大学马克思主义基本原理060111过程性考核作业1答案

繁简切换

返回顶部

猜你喜欢

评论0

繁简切换

返回顶部

社交账号快速登录

社交账号快速登录

社交账号快速登录