hadoop大数据技术与应用第1章练习题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章

一、单选题

1、下面哪个选项不属于Google的三驾马车?(C )

A、GFS

B、MapReduce

C、HDFS

D、BigTable

2、大数据的数据量现在已经达到了哪个级别?(C )

A、GB

B、TB

C、PB

D、ZB

3、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?( A )

A、“The Google File System”

B、“MapReduce: Simplified Data Processing on Large Clusters”

C、“Bigtable: A Distributed Storage System for Structured Data”

D、“The Hadoop File System”

4、下面哪个选项不是HDFS架构的组成部分?( C )

A、NameNode

B、DataNode

C、Jps

D、SecondaryNameNode

5、Hadoop能够使用户轻松开发和运行处理大数据的应用程序,下面不属于Hadoop特性的是(C )

A、高可靠性、高容错性

B、高扩展性

C、高实时性

D、高效性

6、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?( B )

A、“The Google File System”

B、“MapReduce: Simplified Data Processing on Large Clusters”

C、“Bigtable: A Distributed Storage System for Structured Data”

D、“The Hadoop File System”

7、建立在Hadoop文件系统之上的分布式的列式数据库?(A )

A、HBase

B、Hive

C、YARN

D、Mahout

二、判断题

1、海量数据就是大数据。( ×)

2、Google公司的GFS、MapReduce、BigTable是开源的。( ×)

3、MapReduce是的最早提出是Google为了解决PageRank的问题( √)

4、Apache Hadoop的HDFS、MapReduce、HBase是开源的。( √)

5、Hbase是非关系型数据库,是面向列的。( √)

6、Hadoop的发行版除了社区的Apache Hadoop外,Cloudera、Hortonworks、MapR、EMC、IBM、Intel、华为等公司都提供了自己的商业版本。( √)

三、填空题

1、MapReduce采用“分而治之”的思想,简而言之,MapReduce就是“分散任务,汇总结果”。

2、2006年,Google公司发表了论文“Bigtable: A Distributed Storage System for Structured Data”是用来处理海量数据的一种非关系型数据库。

3、Hadoop源自始于2002年的Apache Nutch项目,创始人是Doug Cutting 。

四、多选题

1、Hadoop大数据有哪两大核心技术?( AD )

A、分布式存储

B、数据采集

C、可视化

D、分布式处理

2、大数据有哪些特性?( ABCD )

A、数据量大

B、数据种类繁多

C、计算速度快

D、价值密度低

3、块副本位置选择的策略服务两大目标( AC )

A、最大化数据可靠性

B、最大化计算可靠性

C、最大化数据高效性

D、最大化计算高效性

4、下列关于HDFS对文件分块存储的作用描述正确的是(ABCD)

A、有利于负载均衡

B、便于并行处理

C、最小化寻址开销

D、支持大规模文件存储

相关文档
最新文档