• u******* 加入了本站
  • 游客 购买了资源 已知某建筑公司2001——2007年所完成的产值和利润见下表。 试用一元线性回归法预测当产值为1900万元时,该企业实现的利润。
  • u******* 加入了本站
  • 游客 购买了资源 2025年春江苏开放大学文学概论060060第一次过程性考核作业
  • 游客 购买了资源 代寫國立空中大學作業
  • 游客 下载了资源 江苏开放大学测试技术综合性大作业
  • 游客 购买了资源 江苏开放大学测试技术综合性大作业
  • 游客 购买了资源 某企业2015年1-11月份某商品的销售量见下表
  • u******* 下载了资源 江苏开放大学表演综合技能训练提交音频或视频。为自己设置一个明确的任务,完成一出完整的新学的剧目,不短于5分钟。
  • u******* 购买了资源 江苏开放大学表演综合技能训练提交音频或视频。为自己设置一个明确的任务,完成一出完整的新学的剧目,不短于5分钟。

在线网课学习课堂《高级大数据系统》单元测试考核答案

接受学堂在线答案投稿,因为学堂在线销量高,卖出去佣金丰厚接受学堂在线答案投稿,因为学堂在线销量高,卖出去佣金丰厚
2025-04-28

注:不含主观题
第1题
wget命令可用于下载文件
第2题
more命令的-s参数可用于合并文件中的多个连续空行
第3题
head命令可从文件中任意一行开始读取文件
第4题
cat命令的那个参数可以在读取文件时将文件中的TAB字符转化成^I
A
-T
B
-A
C
-b
D
-E
第5题
grep命令的-l参数可用于在查询多文件时只输出包含匹配字符的文件名
第6题
grep的-r参数可用于在查询多文件时,迭代的查询文件夹内的文件
第7题
grep的pattern中加上$表示正则表达式从段首开始匹配
第8题
利用grep统计文件中不包含某一模式的文字的行数,需要用到以下那些命令?
A
-o
B
-v
C
-c
D
-i
第9题
grep ‘line.*empty’ 会匹配下列哪些行?
A
this line is empty
B
this line empty
C
this line.empty
D
this lineempty
第10题
grep ‘line.+empty’ 不会匹配下列哪一行?
A this line is empty
B this line +empty
C this line.empty
D this lineempty
第11题
利用grep匹配文件中的gray或者grey,pattern可以为
A
‘gre∥ay’
B
‘gre|ay’
C
‘gr(e|a)y’
D
‘gray∥grey’
第12题
awk中-F参数可用于指定分隔符,将每一行按照分隔符进行分列
A
正确
B
错误
第13题
awk中-f参数可用于从脚本文件中读取awk命令
A
正确
B
错误
第14题
test.txt文中如下则cat test.txt | awk ‘{print NR,NF}’的输出为
A 正确
B 错误
第15题
test.txt文件中的内容如下:某一命令的输出为则该命令可能为:
A awk ‘{print $2 “\t” $4}’ test.txt | sort -k2
B awk ‘{print $3 “\t” $4}’ test.txt | sort -n -k2
C awk ‘{print $2 “\t” $4}’ test.txt | sort -n -k2
D awk ‘{print $2 “\t” $4}’ test.txt | sort -n -k1
第16题
下列哪些是常用的登陆服务器的工具?
A
putty
B
winSCP
C
sshfs
D
ssh
第17题
下列哪些命令从头开始读取一个文件?
A
head
B
more
C
tail
D
less
第18题
file命令用来确定文件的大小
第19题
wc命令可以用来查看文本文件中的单词数
第20题
ls的-A参数可以用来查看文件名以.开始的隐藏文件
Running Commands on a Single Machine–作业

第1题
设置HISTIMEFORMAT变量,如export HISTTIMEFORMAT=’%F %T ‘,可以在使用history命令式同时输出时间戳
第2题
!!命令可用于再次执行上一条命令
第3题
中存储了上一条命令的运行结果,?中存储了上一条命令的运行结果,?等于1表示上一条命令执行成功
第4题
crontab的-l参数可用于显示某个用户的crontab文件内容
第5题
last命令可用于显示最近登陆过的用户
第6题
下列哪条语句输出所有由我运行的程序的PID?
A
ps aux | grep -v `whoami` | awk ‘{print $2}
B
ps aux | grep `whoami` | awk ‘{print $2}’
C
ps | grep `whoami` | awk ‘{print $2}’
D
ps aux | grep `whoami` | awk -F ‘{print $2}”
Using a Linux Cluster–作业

第1题
通过生成ssh密钥,可以不用密码登陆linux服务器
第2题
下列哪个工具可以在多台服务器上同时执行命令?
A
pscp
B
pssh
C
pslurp
D
pnuke
Storage for Big Data Computing: Distributed file system–作业

第1题
下列哪些属于分布式文件系统?
A
HBase
B
Spark
C
MapReduce
D
KFS
第2题
在处理数据的能力上,分布式文件系统相比于单机最大的优点是能够并行处理数据。
第3题
在存储文件方式上,传统文件系统和DFS:
A
两者都以文件形式存储数据
B
前者以文件形式存储数据,后者以固定大小的块单元存储数据
C
前者以文件形式存储数据,后者以文件和固定大小的块单元形式存储数据
D
两者都以block或者chunk形式存储数据
File system and GFS–作业

第1题
分布式事务处理的特性包括哪些
A
持久性
B
隔离性
C
原子性
D
一致性
第2题
分布式系统设计包括
A
容错,design for fault
B
数据/服务可靠性
C
多数据中心的数据一致性
D
可扩展性
E
尽可能的满足ACID特性
E
第3题
下面关于GFS集群的叙述中,正确是
A
GFS所有的元数据都存放在chunkserver上
B
GFS所有的元数据都是放在硬盘上的
C
一个GFS集群包括一个master和大量chunkserver
D
其他选项均不正确
第4题
GFS中,客户与master的交换只限于对元数据(metadata)的操作,所有数据方面的通信都直接和chunkserver联系 。
Understanding HDFS using Legos–作业

第1题
关于HDFS,下面说法正确的是:
A
HDFS中的文件以块序列的形式存储
B
存储的文件块都有相同的大小
C
文件块为了故障容错而被复制
D
HDFS中的文件是一次写的
E
名字节点周期性地接受集群中数据节点的心跳和块报告,一个心跳的到达表示这个数据节点是正常的
E
第2题
HDFS适用于要求低延时访问的应用程序。
第3题
HDFS中一个文件备份在多个位置的好处有哪些?
A
改善服务的伸缩性
B
提高了容错能力
C
保证文件的完整性
D
保证文件的透明性
第4题
对于HDFS中的名字节点,下面说法正确的是:
A
文件被分割成一个或多个块,被存储在一组名字节点中
B
名字节点可以对命名空间的文件或目录操作,如打开,关闭,重命名等
C
名字节点可以处理来自文件系统客户对读写请求,以及执行块的创建,删除等操作
D
名字节点可以确定块与数据节点等映射
File System Implementation and DFS–作业

第1题
HDFS中典型的块大小是64MB,一个HDFS文件可以被被切分成多个64MB大小的块,如果需要,每一个块可以分布在不同的数据节点上。
第2题
以下关于HDFS叙述错误的是?
A
一个客户端创建一个文件的请求会立即转发到名字节点。
B
当本地文件堆积到一个HDFS块大小的时候,客户端才会通知名字节点。
C
名字节点构造包括数据节点ID和目标数据块标识的报文,用它回复客户端的请求。
D
当文件关闭时,本地临时文件中未上传的残留数据就会被转送到数据节点。
第3题
当Job Tracker宕掉时,Namenode会发生什么?
A
当Job Tracker失败时,集群也随之宕机
B
当Job Tracker失败时,集群仍然可以正常工作,只要Namenode没问题。
C
当Job Tracker失败时,集群始终不会受到影响。
第4题
Hadoop集群可以运行的几个模式有:
A
单机(本地)模式
B
伪分布式模式
C
全分布式模式
第5题
“jps”命令的用处?
A
检查Namenode是否正常工作
B
检查Datanode是否正常工作
C
检查Task Tracker是否正常工作
D
检查Job Tracker是否正常工作
What is MapReduce and why

第1题
jobtracker和tasktracker都可以管理整个系统内的任务
第2题
mapreduce系统中如节点故障、网络不通的问题都可以由系统自动管理
第3题
数据读入在mapreduce的那个阶段产生?
A
Map
B
Reduce
Processing pattern–作业

第1题
Map阶段生成的结果通过网络直接传输给reduce节点
第2题
通过自定义partition过程,用户可以自定义每个key将被分配到的reducer
第3题
具有同一个key的key/value对可能被分配到不同的reduce上
Hadoop–作业

第1题
Map, Partition和Reduce阶段都存在对Local Storage的读写
第2题
Fair Scheduling对小任务更公平
第3题
MapReduce处理的数据通常只存储在一台服务器上
Algorithms in MapReduce–作业

第1题
MapReduce中search任务可以只用map实现
第2题
统计最流行的单词时,可以通过提前去除出现频率低的单词,来提高程序效率
第3题
利用Partition行数,Map和Reduce阶段不做任何操作即可实现排序功能
第4题
通过串联多个MapReduce过程,可以实现复杂的数据处理功能
Background–作业

第1题
Spark的核心API支持下列哪几种语言
A
Java
B
C/C++
C
Ruby
D
Scala
E
Python
第2题
Spark 生态体系中,包括以下哪几种计算框架
A
Streaming
B
Storm
C
MLlib
D
Graphx
第3题
Spark运行在现有的分布式文件系统(HDFS)之上。
第4题
Spark大部分是用那种语言编写的
A
Scala
B
C++
C
Java
D
C
Spark–作业

第1题
Spark 一切都以Resilient Distributed Dataset(RDD)为基础
第2题
弹性数据集(RDD)的transformation操作表示对数据集的操作延迟执行,而Action操作表示执行对数据集的操作。
第3题
弹性数据集(RDD)可以从下列哪些对象转换过来?
A
其他RDD转换而来
B
Linux单机文件系统中的数据
C
HDFS中存储的数据集
D
Hbase中的数据
第4题
RDD cache默认的存储级别(StorageLeve)是什么
A
MYMORY_AND_DISK
B
MEMORY_ONLY
C
MEMORY_ONLY_SER
D
DISK_ONLY
Use Spark for data mining–作业

第1题
以下针对RDD的操作中,属于Transformation的操作有哪些?
A
map()
B
filter()
C
count()
D
union()
第2题
以下针对RDD的操作中,属于Action的操作有哪些?
A
collect()
B
reduce()
C
save()
D
cogroup()
第3题
下列哪些模式可以运行Spark?
A
Local
B
Standalone
C
Mesos
D
YARN
Spark data processing–作业

第1题
在Spark的运行架构中,一个Job包含多个Task(被送到executor上的工作单元)组成的并向计算,往往由Transformation产生
第2题
在Spark的任务处理中,Master节点充当哪些角色
A
任务和资源调度
B
节点管理
C
执行Executor进程
D
RDD graph
第3题
Spark运行任务过程中的Stage是由下列哪个过程产生的?
A
RDD Objects
B
DAGScheduler
C
TaskScheduler
D
Worker
Experiment in Spark–作业

第1题
在Spark计算的过程中,可以直接使用 Local files 和 DFS files 作为数据源来生成原始 RDD。
Introduction to streaming data processing–作业

第1题
哪些是流式数据处理的特征?
A
秒级延迟
B
输入是流式数据源
C
整合了batch和interactive操作
第2题
哪些应用需要用到streaming data processing?
A
社交媒体
B
Web data
C
入侵检测数据
Storm–作业

第1题
Storm中的Bolt既可以处理收到的Tuples,也可以创建新的Tuples流。
第2题
哪些是 Apache Storm 提供的默认系统管道(system pipelines)?
A
AlertPipeline
B
ErrorSearchPipeline
C
GraphiteWriterPipeline
D
MonitorMetricPipeline
E
SelfTestPipeline
E
Spark streaming–作业

第1题
Data Pipeline 允许超级用户部署、启动、停止以及编辑预定义的系统管道。
第2题
如果nodes失效,那么storm和spark streaming在处理数据时都会丢失状态信息。
NoSQL introduction–作业

第1题
目前世界上主流的存储系统大部分还是采用了关系型数据库,关系型数据库的主要优点是
A
事务处理上能够保持数据的一致性
B
读写快且成本低
C
数据更新的开销很小
D
可以进行Join等复杂的查询
第2题
“NoSQL”系列数据库与传统的关系型数据库相比,优点有哪些
A
支持事务性操作
B
Scale 特性,支持简单的扩展
C
快速的读写
D
低廉的成本
第3题
关系型数据库所使用的定义严格、基于模式的方法是无法快速容纳新的数据类型的,对于非结构化或者是半结构化的数据更是无能为力。而NoSQL提供的数据模型则能够很好地处理非结构化/半结构化数据
第4题
由于NoSQL数据库是分布式、水平扩展的,非常容易实现动态的可伸缩性。
Common Advantages–作业

第1题
在下列哪些生产环境的需求驱动下,使用“NoSQL”系列数据库比较合适
A
数据库表schema经常变化
B
数据库表字段是复杂数据类型
C
高并发数据库请求
D
海量数据的分布式存储
第2题
“NoSQL”系列的数据库根据数据的存储模型和特点可以分为很多类,其中属于“key-value”存储类型的是
A
Berkeley DB
B
Memcache DB
C
Redis
D
Tokyo Cabinet/Tyrant
第3题
属于图存储类型的“NoSQL”数据库有哪些
A
Neo4J
B
MongoDB
C
FlockDB
D
db4o
Bigtable–作业

第1题
BigTable是一个大规模管理半结构化/非结构化而设计的分布式存储系统,可以扩展到PB级数据和上千台服务器。
第2题
BigTable的时间戳是第一级索引。
第3题
如图所示,我查询”thu/”cs:foo”/8,返回的值是多少
A
m
B
y
C
d
D
w
Master Startup–作业

第1题
BigTable依赖于Google的几项技术,用GFS来存储日志和数据文件;按SSTable文件格式存储数据;用Chubby管理元数据。
第2题
Chubby是一种高可用的分布式锁服务,Chubby有几个活跃副本,同时有几个主副本提供服务,
A
6 2
B
5 1
C
3 1
D
2 1
第3题
Bigtable集群包括三个主要部分:一个供客户端使用的库,一个主服务器(master server),许多片服务器(tablet server)。客户端需要读写数据时,直接与片服务器联系。
HBase–作业

第1题
下列哪个不属于HBase的特点
A
构建在HDFS上的分布式列存储系统;
B
典型的文档存储的数据块系统
C
Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储
D
HBase将数据按照表、行和列进行存储
E
Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力
第2题
HBase 为每个值维护了多级索引,即:<key, column family, column name, timestamp>
What is GraphDB and Graph data processing–作业

第1题
GraphDB的特性是对关系进行操作。
第2题
以下哪些场景或系统中的数据可以构成graph?
A
Internet
B
Web
C
社交网络
D
推荐系统
Graph systems

第1题
在Graph并行系统中,一个结点的值只受相邻结点的影响,因此可以根据局部值就可以做更新。
Example of a GraphDB–作业

第1题
GraphLab通过对节点和边进行划分,然后通过对节点进行update,来进行原子化操作,从而达到对图进行分布式处理的目标。
Mahout–作业

第1题
下列哪些是聚类算法?
A
K-means
B
神经网络
C
K-medoids
D
DBScan
E
KNN
F
Decission Tree
Case Study: Recommendatio作业

第1题
用户的评价如下,根据slope one算法,计算John对item A的评价为:
item A  item BLeo
5
3Marria
3
4
John
?
3.5
A 3
B 3.5
C 4
D 4.33
Recommendation in Mahout–作业

第1题
下列哪些是mahout中的java接口?
A
UserSimilarity Interface
B
NeighborhoodSimilarity Interface
C
DataModel Interface
D
DataAbstraction Interface

资源下载
下载价格6
点点赞赏,手留余香 给TA打赏

AI创作

评论0

请先
支持多种货币
支持多种货币付款,满足您的付款需求
7天无忧退换
安心无忧购物,售后有保障
专业客服服务
百名资深客服7*24h在线服务
发货超时赔付
交易成功极速发货,专业水准保证时效性

站点公告

开放大学课程作业辅导,有需要扫码加微信

显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录