完整版hadoop例题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

选择题

1、关于MapReduce的描述错误的是()

A、MapReduce框架会先排序map任务的输出

B、通常,作业的输入输出都会被存储在文件系统中

C、通常计算节点和存储节点是同一节点

D、一个Task通常会把输入集切分成若干独立的数据块

2、关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()

A、安装linux或者在Windows下安装Cgywin

B、安装java

C、安装MapReduce

D、配置Hadoop参数

3、关于基于Hadoop的MapReduce编程的环境配置,下面哪一步是不必要的()

A、配置java环境变量

B、配置Hadoop环境变量

C、配置Eclipse

D、配置ssh

4、下列说法错误的是()

A、MapReduce中maperconbiner reducer 缺一不可

B、在JobConf中InputFormat参数可以不设

参数可以不设MapperClass中JobConf、在C.

D、在JobConf中OutputKeyComparator参数可以不设

5、下列关于mapreduce的key/value对的说法正确的是()

A、输入键值对不需要和输出键值对类型一致

B、输入的key类型必须和输出的key类型一致

C、输入的value类型必须和输出的value类型一致

D、输入键值对只能映射成一个输出键值对

6、在mapreduce任务中,下列哪一项会由hadoop系统自动排序()

A、keys of mapper's output

B、values of mapper's output

C、keys of reducer's output

D、values of reducer's output

7、关于mapreduce框架中一个作业的reduce任务的数目,下列说法正确的是()

A、由自定义的Partitioner来确定

B、是分块的总数目一半

C、可以由用户来自定义,通过JobConf.setNumReducetTask(int)来设定一个作业中reduce的任务数目

D、由MapReduce随机确定其数目

8、MapReduce框架中,在Map和Reduce之间的combiner的作用是()

A、对Map的输出结果排序

、对中间过程的输出进行本地的聚集B.

C、对中间结果进行混洗

D、对中间格式进行压缩

9、MapReduce框架分为Map和Reduce,下列对Reduce阶段叙述正确的是()

A、主要分为shuffle和sort这2个阶段

B、这个阶段过程中,key的分组规则是不可更改的

C、其中的shuffle 和sort是同时进行的

D、Reduce 数目的增加不会增加系统的开销

10、Hadoop中,Reducer的三个阶段是()

A、Shuffle——Sort——Reduce

B、Shuffle——Reduce——Sort

C、Reduce——Shuffle——Sort

D、Sort——Shuffle——Reduce

11、请问在Hadoop体系结构中,按照由下到上顺序,排列正确的是()

Pig Hive Crunch都是运行在MapReduce , Spark ,或者Tez之上的处理框架

Avro是一个克服了Writable部分不足的序列化系统

A、Common Hive HDFS

B、Common MapReduce Pig

C、HDFS MapReduceHBase

HDFS Avro HBase

、D.

12、关于Hadoop下列说法错误的是()

A、HDFS采用了Master/Slave的架构模型

B、Namenode负责维护文件系统的命名空间

C、Datanode执行比如打开、关闭、重命名文件操作

D、HDFS暴露了文件系统的命名空间,允许用户以文件的形式在上面存储数据

13、下面哪个选项不是我们需要Hadoop的主要原因()

A、我们需要处理PB级别的数据

B、为每个应用建立一个可靠的系统是很昂贵的

C、几乎每天都有结点坏掉

D、把一个任务分割成多个子任务的方式是不好的

14、hadoop中下面哪项操作是不需要记录进日志的()

A、打开文件

B、重命名

C、编译文件

D、删除操作

15、hadoop中,下面关于向文件系统中添加一个文件的过程,错误的是()

A、需要创建路径的父目录

B、需要创建一个新的INode文件

C、将新的INode文件加入到name space中去

中去EditLog、将所有操作记录到D.

16、在安装配置好Hadoop集群后,查看Namenode节点的端口是以下哪个()

A、50030

B、50070

C、60010

D、60030

17、下面哪个不是Hadoop的输出数据格式()

A、文本输出

B、二进制输出

C、单一输出

D、多输出

18、要在HDFS的根目录中建立一个叫hadoo的目录,下面哪一条命令是正确的()

A、mkdirhadoo

B、mkdir /hadoo

C、hadoopmkdirhadoo

D、hadoop fs –mkdir /hadoo

19、下面有关NameNode 安全模式(safe mode)说法错误的是()

A、name space处于安全模式时只能被读取

B、NameNode 启动时自动进入安全模式

相关文档
最新文档