作业说明:
1.做作业之前首先在封面填上自己的学号和姓名。
2.学习完第4-5章之后完成本次作业,本次作业占考核总成绩的10%。
作业内容:
一、选择题(1~5为单选题,6~10为多选题)
1. 在HBase中,负责管理Region分配、负载均衡以及集群状态的核心组件是( )。
A. RegionServer
B. ZooKeeper
C. HMaster
D. HDFS NameNode
2. HBase中的WAL(Write-Ahead Log)主要作用是( )。
A. 加速读取操作
B. 在RegionServer故障时保证数据不丢失
C. 存储元数据信息
D. 执行Compaction操作
3. 关于HBase的StoreFile(即HFile),以下说法正确的是( )。
A. StoreFile是内存中的数据结构
B. StoreFile是不可变的,一旦写入就不能修改
C. StoreFile支持随机写入
D. StoreFile由MemStore直接提供服务
4.当客户端需要访问HBase中的某一行数据时,它首先会查询哪个表来定位该行所在的Region?( )
A. ROOT表
B. META表
C. 用户自定义表
D. hbase:namespace表
5. 使用hbase shell命令行工具,下列哪个命令可以查看当前集群中所有表的状态?( )
A. list
B. status
C. describe ‘table_name’
D. scan ‘hbase:meta’
6. HBase的Region分裂(Split)过程会涉及到以下哪些操作?( )
A. 将父Region下线以停止服务
B. 在HDFS上创建两个新的子Region目录
C. 更新.META.表,删除父Region记录并添加两个子Region记录
D. 立即触发一次Major Compaction
7. 关于HBase的MemStore,以下描述正确的是( )。
A. MemStore是RegionServer内存中用于缓存写入数据的组件
B. 当MemStore达到一定阈值时,其数据会被刷新(Flush)到磁盘形成StoreFile
C. 同一个Region中的不同列族共享同一个MemStore
D. MemStore中的数据是按RowKey排序的
8. 下列哪些是HBase官方提供的运维或数据管理工具?( )
A. hbck (HBase fsck)
B. CopyTable
C. Spark SQL
D. Export/Import
9. HBase的RegionServer主要由以下哪些部分构成?( )
A. WAL (HLog)
B. 多个Region
C. BlockCache
D. Master进程
10.关于HBase的读写路径,以下说法正确的是( )。
A. 写请求首先写入WAL,然后进入MemStore
B. 读请求会同时检查BlockCache、MemStore和StoreFile
C. 所有读写请求都必须经过HMaster
D. StoreFile中的数据是按列存储的
二、判断题()
1. HBase的.META.表自身也会被分区,并且其位置信息存储在ZooKeeper中。( )
2. Minor Compaction会将一个Region内所有StoreFile合并成一个,并清理所有已删除的数据。( )
3. HMaster的主要职责包括处理客户端的读写请求。( )
4. Region的拆分是由RegionServer发起并向HMaster报告的。( )
5. HFile是HBase底层存储的实际文件格式,其内部采用了块(Block)结构进行组织。( )
三、简答题
1. 简述HBase中一次完整的写入(Put)操作的流程。
答:
2.HBase为什么采用LSM-Tree(Log-Structured Merge-Tree)作为其核心存储模型?这种模型有什么优缺点?
答:
3.请列举并简要说明HBase中保证高可用性和数据一致性的关键机制。
答:




评论0