多选题 Spark具有以下哪几个主要特点?

A、 运行速度快
B、 容易使用
C、 通用性
D、 运行模式单一
下载APP答题
由4l***0g提供 分享 举报 纠错

相关试题

单选题 Spark生态系统组件Spark Streaming的应用场景是?

A、墓于历史数据的数据挖掘
B、图结构数据的处理
C、基于历史数据的交互式查询
D、基于实时数据流的数据处理

单选题 在Spark生态系统组件的应用场景中,下列哪项说法是错误的?

A、Spark应用在复杂的批量数据处理
B、Spark SQL是基于历史数据的交互式杳询
C、SSpark Streaming是基于历史数据的数据挖掘
D、Graphx是图结构数据的处理

单选题 下列说法错误的是?

A、RDD (Resillient Distributed Dataset) 是运行在工
作节点 (workerNode)的一个进程,负责运行TaSK
B、Application是用户编写的Spark应用程序
C、一个Job包含多个RDD及作用于相应RDD上的各种
操作
D、Directed Acyclic Graph反映RDD之间的依赖关系

单选题 下列关于Scala特性的描述,错误的是哪一项?

A、Scala语法复杂,但是能提供优雅的APl计算
B、Scala具备强大的并发性,支持函数式编程,可以更好地支持分布式系统
C、Scala兼容Java,运行速度快,且能融合到Hadoop生态圈中
D、Scala是Spark的主要编程语言

单选题 下列说法哪项有误?

A、相对于Spark来说,使用Hadoop进行迭代计算非常
耗资源
B、Spark将数据载入内存后,之后的迭代计算都可以直接使用内存中的中间结果作运算,避免了从磁盘
中频繁读取数据
C、Hadoop的设计遵循"一个软件栈满足不同应用场景”的理念
D、Spark可以部署在资源管理器YARN之上,提供一站
式的大数据解决方案

单选题 下列关于Spark的描述,错误的是哪一项?

A、Spark最初由美国加州伯克利大学 (UCBerkeley)的A
MP实验室于2009年开发
B、Spark在2014年打破了Hadoop保持的基准排序纪录
C、Spark用十分之一的计算资源,获得了比Hadoop快3倍的速度
D、Spark运行模式单一

单选题 下列关于RDD说法,描述有误的是?

A、一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合
B、每个RDD可分成多个分区.每个分区就是一个数据
集片段
C、RDD是可以直接修改的
D、RDD提供了一种高度受限的共享内存模型

单选题 下列关于Spark的描述,错误的是哪一项?

A、使用DAG执行引擎以支持循环数据流与内存计算析
B、可运行于独立的集群模式中,可运行于Hadoop中也可运行于Amazon EC2等云环境中
C、支持使用Scala、Java、Python和R语言进行编程,但是不可以通过Spark Shell进行交互式编程
D、可运行于独立的集群模式 中,可运行于Hadoop中,也可运行于Amazon EC2等云环境中