单选题关于自定义数据类型,下列说法正确的是(D)

A、自定义数据类型必须继承Writable接口

B、自定义MapReduce的key需要继承Writable接口

C、自定义MapReduce的value需要继承WritableComparable接口

D、自定义数据类型必须实现readFields(DataInputdatainput)方法

由4l***vf提供分享举报纠错

相关试题

单选题关干HiveSQL运行原理,描述不正确的选项有?(A)

A、所有HQL都会转化为MapReduce任务执行

B、DDL语句不提交任务到MapReduce,而是直接操作元数据

C、对于selectcount(*)fromtable操作,一定会启reduce任务

D、对于select*fromtable语句不会启MapReduce

单选题下列文件格式那个不是Hive文件的存储格式?(D)

A、TextFile格式

B、SequenceFile格式

C、RCFILE格式

D、DOCX格式

单选题关于HiveSQL基本操作描述正确的是?(A)

A、创建外部表时需要指定external关键字

B、一旦表创建好,不可再修改表名

C、一旦表创建好,不可再修改列名

D、一旦表创建好,不可再增加新列

单选题在Hadoop官方的示例程序包hadoop-maprecduceexamples-2.6.4.jar中,封装了一些常用的测试模块。可以获得文件中单词长度的中位数的模块是(C)。

A、wordcount

B、wordmean

C、wordmedian

D、wordstandarddeviation

单选题不属于Hive优点的选项是?(D)

A、提供与SQL相近的语法,容易上手,可以非常容易地完成数据ETL

B、适合处理结构化的数据

C、存储格式灵活多样,有较强的扩展性

D、适用于海量结构化数据分析汇总,查询速度非常快

单选题 2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?

A、“TheGoogleFileSystem”

B、“MapReduce:SimplifiedDataProcessingonLargeClusters”

C、“Bigtable:ADistributedStorageSystemforStructuredData”

D、“TheHadoopFileSystem”

单选题关与Hive与传统关系型数据库的对比,错误的是?(B)

A、Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据库存储量会有上限

B、由于Hive基于大数据平台,所以查询效率比传统数据库快

C、传统关系型数据库的索引机制发展的已经非常成熟,而Hive的索引机制还很低效

D、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错、高可靠

单选题下列(B)情况适合添加Combiner。

A、MapReduce程序求平均值

B、MapReduce程序求和

C、MapReduce程序求中位数

D、MapReduce程序对数据进行排序