单选题 MapReduce中的map阶段的数据是由()决定的

A、 OutputFormat
B、 InputFormat
C、 FileInput
D、 FileOutput
下载APP答题
由4l***ce提供 分享 举报 纠错

相关试题

单选题 为销售报表展示开发一个MapReduce作业,Mapper输入数据的Key是年份(IntWritable),Value表示商品标识(Text)。下列哪一项决定该Mapper的数据类型?

A、 JobConf.setMapInputKeyClass与JobConf.setMapInputValuesClass
B、HADOOP_MAP_DATATYPES环境变量
C、随作业一起提交的mapper-specification.xml文件
D、 InputFormat格式类

单选题 关于 SecondaryNameNode 哪项是正确的?

A、 它是 NameNode 的热备
B、它对内存没有要求
C、它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间
D、SecondaryNameNode 应与 NameNode 部署到一个节点

单选题 MapReduce的<key,value>存储模型能够存储什么数据?

A、文件数据
B、二进制
C、字符串
D、任意格式

单选题 .MapReduce框架提供了一种序列化键/值对的方法,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是

A、 实现Writable接口的类是值
B、实现WritableComparable接口的类可以是值或键
C、Hadoop的基本类型Text并不实现WritableComparable接口
D、 键和值的数据类型可以超出Hadoop自身支持的基本类型

单选题 .以下四个Hadoop预定义的Mapper实现类的描述错误的是

A、IdentityMapper实现Mapper,将输入直接映射到输出
B、InverseMapper实现Mapper,反转键/值对
C、 RegexMapper实现Mapper,为每个常规表达式的匹配项生成一个(match, 1)对
D、 TokenCountMapper实现Mapper,当输入的值为分词时,生成(taken, 1)对

单选题 下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是

A、FSDataInputStream扩展了DataInputStream以支持随机读
B、为实现细粒度并行,输入分片(Input Split)应该越小越好
C、一台机器可能被指派从输入文件的任意位置开始处理一个分片
D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

单选题 在Hadoop MapReduce框架中,任何值类型

A、需要实现Writable接口
B、需要实现Comparable 接口
C、需要实现WritableComparable接口
D、不需要实现任何接口

单选题 以下关于MapReduce说话错误的是?

A、Map和reduce是他们的主要思想
B、用于大规模数据集的串行运算
C、极大的方便了编程人员不会分布式编程
D、都是从函数式和矢量编程语言借来的特性