单选题 下列不属于大数据项目实施工作流程的是(  )。

A、 项目规划阶段
B、 数据治理阶段
C、 项目设计阶段
D、 系统运维阶段
下载APP答题
由4l***1o提供 分享 举报 纠错

相关试题

单选题 哪些不是引起 Hive 数据倾斜的原因?(  )

A、

数据在节点存储上分布不均

B、

运算中Key 值分布不均

C、

业务数据本身存在分布不均

D、

Hive中表数量的多少 

单选题 企业使用大数据平台基于( )做分析报表。

A、 MongoD
B、 BI
C、 Hive
D、 SQL

单选题 MapReduce 中可能引起负载问题的原因有哪些?(  )

A、

MapReduce需要处理的数据量过大 

B、

数据本身的格式问题,例如:文档格式混乱

C、

DataNode节点与 Map 节点不在一起

D、

Map中 Key 值选取和设定问题,导致 Key 值过于集中 

单选题 下列不属于数据存储技术的是( )。

A、 MySQL
B、 Storm
C、 HDFS
D、 HBase

单选题 下面哪些不是引起 Spark 负载不均的原因?(  )

A、

Spark读入的数据源是倾斜的 

B、

Shuffle阶段 Key 值过于集中 

C、

在数据过滤阶段需要处理的数据量差异

D、

Spark的运行方式差异 

单选题 Hive 数据倾斜的表现?( )

A、 Hive 建表后数据无法导入
B、 Hive 无法启动
C、 Hive sql 语句运行异常直接退出
D、 Hive 运算任务为报错单长期卡在 99%

单选题 以下哪种情况容易引发 HDFS 负载不均问题?(  )

A、

HDFS中存储的文件大小不一,小文件太多

B、

HDFSBlock 的大小设置不合理 

C、

Data各数据节点磁盘规格和空间大小有差异 

D、

NameNode与 DataNode 节点在同一物理服务器上

单选题 下列大数据特点中错误的是( )。

A、 数据体量大
B、 数据种类多
C、 处理速度快
D、 价值密度高