单选题 关于自定义数据类型,下列说法正确的是(D)

A、 自定义数据类型必须继承Writable接口
B、 自定义MapReduce的key需要继承Writable接口
C、 自定义MapReduce的value需要继承WritableComparable接口
D、 自定义数据类型必须实现readFields(DataInputdatainput)方法
下载APP答题
由4l***vf提供 分享 举报 纠错

相关试题

单选题 关干HiveSQL运行原理,描述不正确的选项有?(A)

A、所有HQL都会转化为MapReduce任务执行
B、DDL语句不提交任务到MapReduce,而是直接操作元数据
C、对于selectcount(*)fromtable操作,一定会启reduce任务
D、对于select*fromtable语句不会启MapReduce

单选题 下列文件格式那个不是Hive文件的存储格式?(D)

A、TextFile格式
B、SequenceFile格式
C、RCFILE格式
D、DOCX格式

单选题 关于HiveSQL基本操作描述正确的是?(A)

A、创建外部表时需要指定external关键字
B、一旦表创建好,不可再修改表名
C、一旦表创建好,不可再修改列名
D、一旦表创建好,不可再增加新列

单选题 在Hadoop官方的示例程序包hadoop-maprecduceexamples-2.6.4.jar中,封装了一些常用的测试模块。可以获得文件中单词长度的中位数的模块是(C)。

A、wordcount
B、wordmean
C、wordmedian
D、wordstandarddeviation

单选题 不属于Hive优点的选项是?(D)

A、提供与SQL相近的语法,容易上手,可以非常容易地完成数据ETL
B、适合处理结构化的数据
C、存储格式灵活多样,有较强的扩展性
D、适用于海量结构化数据分析汇总,查询速度非常快

单选题 2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?

A、“TheGoogleFileSystem”
B、“MapReduce:SimplifiedDataProcessingonLargeClusters”
C、“Bigtable:ADistributedStorageSystemforStructuredData”
D、“TheHadoopFileSystem”

单选题 关与Hive与传统关系型数据库的对比,错误的是?(B)

A、Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据库存储量会有上限
B、由于Hive基于大数据平台,所以查询效率比传统数据库快
C、传统关系型数据库的索引机制发展的已经非常成熟,而Hive的索引机制还很低效
D、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错、高可靠

单选题 下列(B)情况适合添加Combiner。

A、MapReduce程序求平均值
B、MapReduce程序求和
C、MapReduce程序求中位数
D、MapReduce程序对数据进行排序