单选题 stage的task数量是由什么决定的
A、partition
B、job
C、stage
D、taskscheduler
单选题 Spark SQL 是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型
A、DataFrames
B、Table
C、DataSet
D、RDD
单选题 Spark也可以不依赖于第三方的资源管理和调度器,它实现了()作为其内置的资源管理和调度框架
A、Standalone
B、YARN
C、Mesos
D、redis
单选题 spark中资源管理的主节点
A、master
B、worker
C、application
D、driver
单选题 关于累加器,下面哪个是错误的
A、支持加法
B、支持数值类型
C、可并行
D、不支持自定义类型
单选题 task运行在下面哪里个选项中Executor上的工作单元
A、driver
B、master
C、worker
D、cluster
单选题 worker组件在spark 的任务调度中具有以下哪个作用
A、计算数据
B、存储数据
C、运送数据
D、心跳检测
单选题 DataFrame和RDD最大的区别是什么
A、科学统计支持
B、多了schema
C、存储方式不一样
D、外部数据源支持