单选题 map 转换操作是( )

A、 对 RDD 中的元素进行排序,返回一个新的 RDD
B、 过滤出满足条件的元素,返回一个新的 RDD
C、 将多个 RDD 合并成一个 RDD
D、 对 RDD 中的每个元素应用一个函数,返回一个新的 RDD
E、 对 RDD 中的元素进行去重,返回一个新的 RDD
下载APP答题
由4l***jb提供 分享 举报 纠错

相关试题

单选题 搭建 Spark 集群的步骤不包括( )

A、安装 Java 环境
B、下载并解压 Spark 安装包
C、配置 Spark 环境变量
D、安装 Python 编译器
E、配置集群节点信息

单选题 在认识 Spark 时,发现 Spark 的生态系统中,用于实时流处理的组件是( )

A、Spark SQL
B、Spark Streaming
C、MLlib
D、GraphX
E、Spark Core

单选题 Spark 运行时,累加器(Accumulator)的主要作用是( )

A、向 Executor 广播数据
B、存储中间结果
C、调度任务执行
D、实现分布式的累加计算
E、从 Executor 收集数据

单选题 搭建 Spark 集群时,不可以作为集群节点的操作系统是( )

A、Linux
B、Windows Server
C、macOS
D、Solaris
E、Android

单选题 Spark 最初诞生于( )

A、谷歌公司
B、亚马逊公司
C、苹果公司
D、微软公司
E、伯克利大学 AMPLab

单选题 以下哪项不是 Spark 的特点

A、运行速度快
B、容易使用
C、通用性差
D、运行模式多样
E、可扩展性强

单选题 在认识 Spark 时,以下关于 Spark 核心模块的说法错误的是( )

A、Spark Core 提供基本的功能和抽象
B、Spark SQL 用于结构化数据处理
C、Spark Streaming 用于实时流处理
D、MLlib 是专门的图计算库
E、GraphX 是图计算库

单选题 Spark 运行架构中,负责集群资源管理的组件是( )

A、Driver
B、Executor
C、ResourceManager
D、DataSource
E、TaskScheduler