江苏开放大学数据采集与预处理第三次形考作业

微信小程序
资源下载
下载价格10

试题列表

单选题

题型:单选题客观题分值3分难度:一般得分:3

1下列选项中,( )是评价数据质量的核心准则。

A完整性

B准确性

C适用性

D简洁性

正确答案:C

题型:单选题客观题分值3分难度:一般得分:3

2下列说法中,关于清洗重复值的说法正确的是( )

A清洗重复值的基本思想是“分而合之”

B清洗重复值的基本思想是“排序”

C清洗重复值的基本思想是“排序和合井”

D清洗重复值的基本思想是“合并”

正确答案:C

题型:单选题客观题分值3分难度:一般得分:3

3下列选项属于名义型特征的是( )

A景点名称={天坛,北海,故宫、⾹⼭}

B成绩={88,92,83,95}

C质量⽔平={⼀级,⼆级,三级,四级}

D半径={7.64,7.44,7.23,7.39}

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

4下列选项中,描述不正确的是( )。

A数据清洗的目的是为了提高数据质量

B异常值一定要删除

C可使用drop_duplicates()方法删除重复数据

Dconcat()函数可以沿着一条轴将多个对象进行堆叠

正确答案:B:

题型:单选题客观题分值3分难度:一般得分:3

5

请阅读下面一段程序:

from pandas import Series

import pandas as pd

from numpy import NaN

series_obj = Series([None, 4, NaN])

pd.isnull(series_obj)

执行上述程序后,最终输出的结果为( )。

A

0 True

1 False

2 True

B

0 True

1 True

2 False

C

0 False

1 True

2 True

D

0 True

1 True

2 True

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

6下列选项中,可以删除缺失值或空值的是( )。

A.isnull()

B.notnull()

C.dropna()

D.fillna()

正确答案:C

题型:单选题客观题分值3分难度:一般得分:3

7下列选项中,描述不正确是( )。

Aconcat()函数可以沿着一条轴将多个对象进行堆叠

Bmerge()函数可以根据一个或多个键将不同的DataFrame进行合并

C可以使用rename()方法对索引进行重命名操作

Dunstack()方法可以将列索引旋转为行索引

正确答案:D

题型:单选题客观题分值3分难度:一般得分:3

8

请阅读下面一段程序:

import numpy as np

import pandas as pd

ser_obj = pd.Series([4, np.nan, 6, 5, -3, 2])

ser_obj.sort_values()

执行上述程序后,最终输出的结果为( )。

A

4 -3.0

5 2.0

0 4.0

3 5.0

2 6.0

1 NaN

B

1 NaN

2 6.0

3 5.0

0 4.0

5 2.0

4 -3.0

C

5 2.0

0 4.0

3 5.0

2 6.0

4 -3.0

1 NaN

D

0 4.0

1 NaN

2 6.0

3 5.0

4 -3.0

5 2.0

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

9下列说法错误的是( )

A必须删除异常值

B可以对缺失值进⾏插补

C对数据进⾏标准化,消除量纲的影响

D数据离散化是⼀种数据转换的⽅式

正确答案:A

题型:单选题客观题分值3分难度:一般得分:3

10下列选项表述错误的是( )

A数据清洗包括缺失值处理、异常值处理、数据转换等⼏个⽅⾯

B数据的初步处理是对数据进⾏整合、分组等操作

C检测异常值的⽅法可以基于统计、距离、密度、模型等

D缺失值最好的处理⽅式是直接删除

正确答案:D

填空题

题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2

1

常见的数据质量问题主要包括缺失值、以及错误值等问题。

第1空分值:2分

正确答案:重复值

题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2

2

stack()方法可以将列索引转换为。

第1空分值:2分

正确答案:行索引

题型:填空题客观题答案不允许乱序分值2分难度:一般得分:2

3

技术是提高数据质量的有效方法。

第1空分值:2分

正确答案:数据清洗

题型:填空题客观题答案不允许乱序分值4分难度:一般得分:4

4

concat()函数的堆叠方式有横向堆叠和,连接方式有内连接和。

第1空分值:2分

第2空分值:2分

题型:简答题主观题分值12分难度:一般得分:12

1请简述数据预处理的常用操作。

答案

2简述数据清洗的基本流程。

答案

题型:简答题主观题分值36分难度:一般得分:36

3

现有如下图所示的两组数据,其中 A组中B列数据存在缺失值,并且该列数据为int类型,B组中的数据均为str类型。接下来,请对这些数据进行以下操作:

IMG_256

(1)使用DataFrame创建这两组数据。

(2)现在需要使用B组中的数据对A组中的缺失值进行填充并保持数据类型一致。

(3)将合并后A组中索引名为key的索引重命名为D。

请将程序写在下面的文本框内。

答案

点点赞赏,手留余香 给TA打赏

AI创作

评论0

请先

图所示为用扳手拧紧螺栓,试问此结构的装配工艺性如何?应该如何改进,请说明理由。(请在答题区直接输入答案,上传附件不得分)
图所示为用扳手拧紧螺栓,试问此结构的装配工艺性如何?应该如何改进,请说明理由。(请在答题区直接输入答案,上传附件不得分)
10分钟前 有人购买 去瞅瞅看
本题是应用实践题,请到讨论区“破冰之旅”中下载《实验3指导书——数据库完整性和安全控制》和《实验报告3——数据库完整性和安全控制》,阅读实验指导书,根据实验步骤和提示进行实验,填写好实验报告,以附件形式提交到这里。
本题是应用实践题,请到讨论区“破冰之旅”中下载《实验3指导书——数据库完整性和安全控制》和《实验报告3——数据库完整性和安全控制》,阅读实验指导书,根据实验步骤和提示进行实验,填写好实验报告,以附件形式提交到这里。
10分钟前 有人购买 去瞅瞅看
求立体表面上其他个点的投影。
求立体表面上其他个点的投影。
10分钟前 有人购买 去瞅瞅看
支持多种货币
支持多种货币付款,满足您的付款需求
7天无忧退换
安心无忧购物,售后有保障
专业客服服务
百名资深客服7*24h在线服务
发货超时赔付
交易成功极速发货,专业水准保证时效性

站点公告

课程作业辅导,有需要加下方微信

显示验证码

社交账号快速登录