2026年春江苏开放大学数据采集与预处理060749第四次形考作业

试题列表
单选题
题型:单选题客观题分值2分难度:一般得分:2
1下列选项中,关于transform()方法说法正确的是( )。
Afunc参数可以传入多个内置函数
B不会与原数据保持相同形状
C会对产生的标量值进行广播操作
Dfunc参数只能传入内置函数
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
2下列选项中,关于groupby()方法说法不正确的是( )。
A分组键可以是列表或数组,但长度不需要与待分组轴的长度相同
B可以通过DataFrame中的列名的值进行分组
C可使用series或字典分组
D可以使用函数进行分组
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
3在OpenRefine界⾯,下列哪个选项能够查看数据集data中是否含有缺失值?( )
Adata.cell
Bdata.index
CisNull(data)
Ddata.value
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
4OpenRefine不⽀持下列那种⽂件格式?( )
Apy⽂件
Bjson⽂件
Ccsv⽂件
Dtsv⽂件
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
5下列选项表述不正确的是( )。
A可以在OpenRefine界面的Language Settings 选项处进行语言的选择
B可以在命令行使用ctrl+c命令退出OpenRefine软件
COpenRefine使用的是计算机的8000端口
DOpenRefine使用的是计算机的3333端口
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
6在openrefine的内建语言中,能将string s转换为小写的是( )。
AtoUppercase(string s)
BstartsWith(string s,string sub)
CtoLowercase(string s)
DendsWith(string s, string sub)
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
7以下关于MySQL的说法错误的是( )。
AMySQL是一个跨平台的数据库系统: Windows , Mac OS , Linux 和 Unix 均适⽤。
BMySQL是没有服务器的,不需要服务器进程或系统来操作。
CMySQL是一个开源软件。
DMySQL⾮常灵活,适⽤于⼩到中型的数据处理。
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
8Weka使⽤什么编程语⾔进⾏开发?( )
APython
BJava
CC
DC++
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
9下列选项中,关于apply()说法不正确的是( )。
A可以接收多个函数
B可以使用自定义函数
C返回的结果一定与原数据的形状相同
D可以使用广播功能
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
10在OpenRefine界⾯,下列哪个变量不属于 GREL 语⾔?( )
Arow
Bvalue
Cgrad
Dcell
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
11OpenRefine的⼯作⽅式是?( )
A单元格
B矩阵
C图
D列和字段
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
12下列选项中,关于agg()方法使用不正确是( )。
Aagg()方法中func参数只能传入一个函数
Bagg()方法中func参数可以传入多个函数
Cagg()方法中func参数可以传入自定义函数
Dagg()方法不能对产生的标量值进行广播
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
13下列哪个⼯具不能实现数据清洗功能?( )
AWeka
BOpenRefine
Cphotoshop
DExcel
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
14
请阅读下面一段程序:
import pandas as pd (pd.DataFrame([[2, 3],] * 3, columns=[‘A’, ‘B’])).apply(lambda x: x + 1)
执行上述程序后,最终输出的结果为( )。
A
A B
0 3 2
1 3 2
2 3 2
B
A B
0 2 3
1 2 3
2 2 3
C
A B
0 3 4
1 3 4
2 3 4
D
A B
0 4 3
1 4 3
2 4 3
正确答案:D
题型:单选题客观题分值2分难度:一般得分:2
15下列选项表述错误的是( )。
A通过专有的操作语句,可以对数据库中的数据进行操作
B数据库通常分为关系型数据库和非关系型数据库
C关系型数据库具有高扩展性和高性能的优点
D数据库可以通过降低数据的冗余度减小数据的存储空间
学生答案:C
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
16下列哪个选项不属于Weka集合的数据挖掘功能?( )
A搭建神经⽹络
B数据预处理
C关联规则挖掘
D数据可视化
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
17下列选项表述错误的是( )。
A关系型数据库具有容易理解、使用方便、安全性能高等优点
B非关系型数据库具有读写性能高、存储数据格式多样等优点
C在数据量较大的情况下,关系型数据库在查询速度上通常不及非关系型数据库
D非关系型数据库比关系型数据库安全性能高,而且提供多种数据存储格式
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
18下列选项表述不正确的是( )。
AOpenRefine支持撤销操作
BOpenRefine支持多种数据导入方式
COpenRefine支持多种格式的数据文件
DGREL为OpenRefine的内建语言,不能与正则表达式结合进行数据转换
学生答案:D
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
19关于MySQL中的数据类型,下列选项表述不正确的是( )。
ATEXT表示最大长度为64KB的可变长度字符串。
BCHAR(length)表示最大长度为length的可变长度字符串。
CVARCHAR(length)表示最大长度 为length的可变长度字符串。
DDATE和TIME都可以作为日期型数据。
学生答案:B
老师点评:
简答题
题型:简答题主观题分值12分难度:一般得分:12
1
现有表douban,表内有若干条出版社数据信息。 id为出版社编号,publish_ name列为出版社名称,book_number列为出版书籍数量,publish_ link为出版社链接网址。

请使用select和like语句查询出名字以北京开头的出版社名称( publish_ name)。并提交与判定SQL语句。

答案


题型:简答题主观题分值12分难度:一般得分:12
2请简述常用的分组方式。

答案


题型:简答题主观题分值38分难度:一般得分:37
3
现有如下图所示的学生信息,请根据图中的信息完成以下操作:

(1)根据年级信息为分组键,对学生信息进行分组,并输出大一学生信息。(18分)
(2)分别计算出四个年级中身高最高的同学。(10分)
(3)计算大一学生与大三学生的平均体重。(10分)
请将程序写在下面的文本框内。

答案

资源下载
下载价格10
客服QQ:1668639739
点点赞赏,手留余香 给TA打赏

评论0

请先
  • u******* 下载了资源 江苏开放大学园林施工图设计形考作业二
  • 游客 下载了资源 2008年广东公务员考试《行测》真题答案及解析
  • 1******* 投稿收入增加5块钱
  • 游客 购买了资源 2026年春江苏开放大学行政法与行政诉讼法060194第一次形考作业答案
  • u******* 下载了资源 2025年秋江苏开放大学机械制图050081第三次形成性考核作业答案
  • u******* 登录了本站
  • 游客 下载了资源 高中英语密卷+答案
  • u******* 加入了本站
  • 1******* 投稿收入增加1块钱
  • 游客 购买了资源 分析下图中移出断面图的画法错误,将正确的图形画在指定位置。
  • u******* 加入了本站
  • 1******* 登录了本站
  • 1******* 投稿收入增加1块钱
  • 游客 购买了资源 分析下图中移出断面图的画法错误,将正确的图形画在指定位置。
  • h*****9 加入了本站
  • u******* 加入了本站
点击浏览器地址栏的⭐图标收藏本页
需要托管,代写作业,论文扫码加微信
显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录