2025年秋江苏开放大学数据采集与预处理第四次形考作业

试题列表

单选题

题型:单选题客观题分值2分难度:一般得分:2

1下列选项中,关于groupby()方法说法不正确的是( )。

A分组键可以是列表或数组,但长度不需要与待分组轴的长度相同

B可以通过DataFrame中的列名的值进行分组

C可以使用函数进行分组

D可使用series或字典分组

正确答案:A

题型:单选题客观题分值2分难度:一般得分:2

2下列选项中,关于agg()方法使用不正确是( )。

Aagg()方法中func参数只能传入一个函数

Bagg()方法中func参数可以传入多个函数

Cagg()方法中func参数可以传入自定义函数

Dagg()方法不能对产生的标量值进行广播

正确答案:A

题型:单选题客观题分值2分难度:一般得分:2

3下列选项中,关于transform()方法说法正确的是( )。

A不会与原数据保持相同形状

B会对产生的标量值进行广播操作

Cfunc参数只能传入内置函数

Dfunc参数可以传入多个内置函数

正确答案:B:

题型:单选题客观题分值2分难度:一般得分:2

4

请阅读下面一段程序:

import pandas as pd (pd.DataFrame([[2, 3],] * 3, columns=[‘A’, ‘B’])).apply(lambda x: x + 1)

执行上述程序后,最终输出的结果为( )。

A

A B

0 3 2

1 3 2

2 3 2

B

A B

0 2 3

1 2 3

2 2 3

C

A B

0 3 4

1 3 4

2 3 4

D

A B

0 4 3

1 4 3

2 4 3

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

5下列选项中,关于apply()说法不正确的是( )。

A可以使用自定义函数

B可以接收多个函数

C可以使用广播功能

D返回的结果一定与原数据的形状相同

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

6下列选项表述错误的是( )。

A数据库可以通过降低数据的冗余度减小数据的存储空间

B通过专有的操作语句,可以对数据库中的数据进行操作

C数据库通常分为关系型数据库和非关系型数据库

D关系型数据库具有高扩展性和高性能的优点

正确答案:D

题型:单选题客观题分值2分难度:一般得分: 2

7下列选项表述错误的是( )。

A关系型数据库具有容易理解、使用方便、安全性能高等优点

B非关系型数据库具有读写性能高、存储数据格式多样等优点

C在数据量较大的情况下,关系型数据库在查询速度上通常不及非关系型数据库

D非关系型数据库比关系型数据库安全性能高,而且提供多种数据存储格式

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

8以下关于MySQL的说法错误的是( )。

A.MySQL是一个开源软件。

B.MySQL⾮常灵活,适⽤于⼩到中型的数据处理。

C.MySQL是没有服务器的,不需要服务器进程或系统来操作。

D.MySQL是一个跨平台的数据库系统: Windows , Mac OS , Linux 和 Unix 均适⽤。

正确答案:C

题型:单选题客观题分值2分难度:一般得分:2

9关于MySQL中的数据类型,下列选项表述不正确的是( )。

A.VARCHAR(length)表示最大长度 为length的可变长度字符串。

B.TEXT表示最大长度为64KB的可变长度字符串。

C.CHAR(length)表示最大长度为length的可变长度字符串。

D.DATE和TIME都可以作为日期型数据。

正确答案:C

题型:单选题客观题分值2分难度:一般得分:2

10下列哪个⼯具不能实现数据清洗功能?( )

AExcel

BOpenRefine

CWeka

Dphotoshop

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

11Weka使⽤什么编程语⾔进⾏开发?( )

AC

BC++

CPython

DJava

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

12下列哪个选项不属于Weka集合的数据挖掘功能?( )

A数据预处理

B关联规则挖掘

C搭建神经⽹络

D数据可视化

正确答案:C

题型:单选题客观题分值2分难度:一般得分:2

13OpenRefine的⼯作⽅式是?( )

A单元格

B图

C列和字段

D矩阵

正确答案:C

题型:单选题客观题分值2分难度:一般得分:2

14OpenRefine不⽀持下列那种⽂件格式?( )

Acsv⽂件

Btsv⽂件

Cjson⽂件

Dpy⽂件

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

15在OpenRefine界⾯,下列哪个变量不属于 GREL 语⾔?( )

Avalue

Brow

Ccell

Dgrad

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

16在OpenRefine界⾯,下列哪个选项能够查看数据集data中是否含有缺失值?( )

Adata.index

Bdata.value

Cdata.cell

DisNull(data)

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

17下列选项表述不正确的是( )。

AOpenRefine使用的是计算机的3333端口

B可以在命令行使用ctrl+c命令退出OpenRefine软件

C可以在OpenRefine界面的Language Settings 选项处进行语言的选择

DOpenRefine使用的是计算机的8000端口

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

18下列选项表述不正确的是( )。

AOpenRefine支持多种格式的数据文件

BOpenRefine支持多种数据导入方式

COpenRefine支持撤销操作

DGREL为OpenRefine的内建语言,不能与正则表达式结合进行数据转换

正确答案:D

题型:单选题客观题分值2分难度:一般得分:2

19在openrefine的内建语言中,能将string s转换为小写的是( )。

AstartsWith(string s,string sub)

BendsWith(string s, string sub)

CtoUppercase(string s)

DtoLowercase(string s)

正确答案:D

简答题

题型:简答题主观题分值12分难度:一般得分:12

1请简述常用的分组方式。

答案

题型:简答题主观题分值12分难度:一般得分

2

现有表douban,表内有若干条出版社数据信息。 id为出版社编号,publish_ name列为出版社名称,book_number列为出版书籍数量,publish_ link为出版社链接网址。

IMG_256 请使用select和like语句查询出名字以北京开头的出版社名称( publish_ name)。并提交与判定SQL语句。

答案

题型:简答题主观题分值38分难度:一般得分

3

现有如下图所示的学生信息,请根据图中的信息完成以下操作:

IMG_256

1)根据年级信息为分组键,对学生信息进行分组,并输出大一学生信息。(18分)

(2)分别计算出四个年级中身高最高的同学。(10分)

(3)计算大一学生与大三学生的平均体重。(10分)

请将程序写在下面的文本框内。

答案

 

资源下载
下载价格10
点点赞赏,手留余香 给TA打赏

评论0

请先
  • 游客 下载了资源 2019年上半年教师资格证考试《高中信息技术》题解析
  • 游客 下载了资源 2010年国家录用公务员考试《申论》真题卷及答案(副省级)
  • 游客 下载了资源 2015年广东公务员考试《行测》真题乡镇卷答案及解析
  • 游客 下载了资源 爱普生Epson EPL-N3000 驱动
  • 游客 下载了资源 2011年424公务员联考《申论》卷及参考答案(福建、广西、四川、江苏、辽宁、天津、海南、江西、湖南、湖北、山西、黑龙江、贵州、重庆、陕西、云南、山东)
  • 游客 下载了资源 爱普生Epson LX-300+ 打印机驱动
  • 游客 下载了资源 2014年国家录用公务员考试《申论》真题卷及答案(地市级)
  • 游客 下载了资源 2015年黑龙江省公务员录用考试《行测》真题(边远地区卷)答案及解析
  • 游客 下载了资源 2007年广西公务员考试《行测》真题答案及解析
  • 游客 下载了资源 2007年广西公务员考试《行测》真题答案及解析
  • 游客 下载了资源 爱普生Epson Stylus C60 打印机驱动
  • u******* 签到打卡,获得1元奖励
  • 游客 下载了资源 2021年公务员多省联考《申论》题(天津区县卷)及参考答案
  • 游客 下载了资源 2007年广西公务员考试《行测》真题答案及解析
  • 游客 下载了资源 2007年广西公务员考试《行测》真题答案及解析
  • 游客 下载了资源 爱普生Epson Artisan 1430 驱动
点击浏览器地址栏的⭐图标收藏本页
需要托管,代写作业,论文扫码加微信
显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录