浙江电大大数据技术-0002

微信小程序
内容查看
查看价格3

=大数据技术-0002
试卷总分:100 测试时间:–
单选题 |判断题 |多选题
1.
奈奎斯特采样定理指出采样频率应该大于信号中最高频率的( A )倍时,采样之后的数字信号才能够完整地保留原始信号中的信息。
2
4
6
3
2.
下列哪项不属于常用的大数据抽取方法( C )
全量数据抽取
增量数据抽取
批量数据抽取
文件型数据抽取
3.
大数据环境下的隐私担忧,主要表现为(A )
个人信息的被识别与暴露
用户画像的生成
恶意广告的推送
病毒入侵
4.
NoSQL数据库中最常用的存储方式是(A  )。
键值存储方式
按地址存储方式
文档存储方式
列存储方式
5.
大数据的5个“V”特性是数据量、多样性、(  A )、速度、真实性。
稀疏性
关联性
实用性
价值
6.
以下组件中不属于HADoop生态系统的组件:(C  )
MApREDuCE
HDFS
OrAClE
HBAsE
7.
下列演示方式中,不属于传统统计图方式的是( D )
柱状图
饼状图
曲线图
网络图
8.
回归分析主要用于哪种情境( A )
商品的库存数量预测分析
调查问卷的效度检验报告
不同班级在英语得分上是否存在差异
根据用户特征进行市场细分。
9.
CyBEr空间是指以计算机技术、现代通信网络技术、( B  )等信息技术的综合运用为基础,以知识和信息为内容的新型空间。
电子技术
虚拟现实技术
软件技术
人工智能
10.
数据清洗的方法不包括( D)。
缺失值处理
噪声数据清除
一致性检查
重复数据记录处理
11.
一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库.因此分布式数据库具有物理上的独立性.逻辑上的一体性扩展性等特点。√

×
12.
分类就是自动将数据象分成多个类或簇,划分的原则是在同一个簇中的数据象具有较高的相似度,而不同簇中的数据象相似度差别较大。×

×
13.
大数据技术和云计算技术是两门完全不相关的技术。×

×
14.
HADoop和sTorm都属于大数据处理工具,两者具备数据实时分析功能。×

×
15.
当两条不同的线出现了交叉点时,相交的问题就产生了。我们需要注重非交叉点信息的可视化展现。×

×
16.
余弦值越接近0,就表明夹角越接近0°,也就是两个向量越相似,当夹角等于0°时,即两个向量相等,称为余弦相似性。×

×
17.
离线数据分析是指将待分析的数据先存储于硬盘中,然后进行数据分析,离线数据分析用于较复杂和耗时的数据分析和批处理。√

×
18.
传统数据获取与大数据获取的唯一区别是前者数据量小,后者数据量大。×

×
19.
大数据仅仅是指数据的体量大。×

×
20.
分箱平滑法是一种数据局部平滑方法,它是通过考察所有的数据来平滑存储数据。×

×
21.
基于约简维数的大小分类,维数约简可以分为(ABD  )、(   )和(  )。
硬维数约简
可视化
统计维数约简
软维数约简
22.
网站内部数据主要有(  AC )和(   )。
日志数据
寄存器数据
数据库数据
内存数据
23.
下列哪些属于流式数据源(  ABC )。
传感器数据
卫星图像数据
互联网及WEB流量
保存于硬盘中的各类文档
24.
大数据的主要特征表现为( ABCD )。
数据类型多
处理速度快
数据容量大
商业价值高
25.
由大及小的数据展现方式是先给出一个( BC )的画面,可以引导读者具体深入到一个(  )的点。
一般
整体
聚焦
局部
26.
天猫分析人员希望通过聚类方法定位代商家刷信用级别的违规者,以下那种操作 不应该进行:( BD )
对变量进行标准化
对变量进行百分位秩或 TukEy正态性转换
对变量进行因子分析或变量聚类
对变量进行分箱处理

点点赞赏,手留余香 给TA打赏

AI创作

浙江电大农业灾害与减灾形考-0002
浙江电大农业灾害与减灾形考-0002
5分钟前 有人购买 去瞅瞅看
支持多种货币
支持多种货币付款,满足您的付款需求
7天无忧退换
安心无忧购物,售后有保障
专业客服服务
百名资深客服7*24h在线服务
发货超时赔付
交易成功极速发货,专业水准保证时效性
显示验证码

社交账号快速登录