多选题 下面关于 Spark MLlib 库的描述正确的是:

A、 MLlib 库从 1.2 版本以后分为两个包:spark.mllib 和 spark.ml
B、 spark.mllib 包含基于 DataFrame 的原始算法 API
C、 spark.mllib 包含基于 RDD 的原始算法 API
D、 spark.ml 则提供了基于 RDD 的、高层次的 API
下载APP答题
由4l***tw提供 分享 举报 纠错

相关试题

单选题 Hadoop 有多种浏览 HDFS 文件目录的方式,下列方式错误的是:

A、通过 HDFS 命令
B、通过 Web 浏览器
C、通过 Eclipse 中的 Project Explorer
D、通过 SSH 客户端工具

单选题 以下哪个是 MapReduce 的适用场景?

A、适用于海量流数据的处理
B、适用于海量数据的批处理
C、可以实现秒级结果返回
D、可以应对多步骤复杂的数据处理

单选题 Hadoop 配置文件中,yarn-site.xml 文件的作用是:

A、保存从节点信息
B、配置 YARN 框架
C、配置 MapReduce 框架
D、配置 Hadoop 的 HDFS 系统的命名

单选题 关于 NameNode 和 DataNode 描述错误的是:

A、NameNode 存储元数据信息,DataNode 存储数据文件
B、DataNode 维护 block 列表信息,并上报给 NameNode
C、NameNode 维护文件、block 和 DataNode 之间的映射关系
D、客户端同时向多个副本的 DataNode 传输数据

单选题 HDFS 的命名空间不包含:

A、文件
B、目录
C、
D、字节

单选题 下列说法错误的是:

A、Map 函数将输入的元素转换成 <key,value> 形式的键值对
B、MapReduce 框架采用了 Master/Slave 架构,包括一个 Master 和若干个 Slave
C、Hadoop 框架是用 Java 实现的,MapReduce 应用程序则一定要用 Java 来写
D、不同的 Map 任务之间不能互相通信

单选题 客户端是通过 级寻址来定位 Region。

A、
B、
C、
D、

单选题 下列文件不属于 Hadoop3.x 集群部署时必需配置的是:

A、worker
B、hadoop-env.sh
C、profile
D、yarn-site.xml