hadoop大数据技术与应用第1章练习题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
一、单选题
1、下面哪个选项不属于Google的三驾马车?(C )
A、GFS
B、MapReduce
C、HDFS
D、BigTable
2、大数据的数据量现在已经达到了哪个级别?(C )
A、GB
B、TB
C、PB
D、ZB
3、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?( A )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters”
C、“Bigtable: A Distributed Storage System for Structured Data”
D、“The Hadoop File System”
4、下面哪个选项不是HDFS架构的组成部分?( C )
A、NameNode
B、DataNode
C、Jps
D、SecondaryNameNode
5、Hadoop能够使用户轻松开发和运行处理大数据的应用程序,下面不属于Hadoop特性的是(C )
A、高可靠性、高容错性
B、高扩展性
C、高实时性
D、高效性
6、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?( B )
A、“The Google File System”
B、“MapReduce: Simplified Data Processing on Large Clusters”
C、“Bigtable: A Distributed Storage System for Structured Data”
D、“The Hadoop File System”
7、建立在Hadoop文件系统之上的分布式的列式数据库?(A )
A、HBase
B、Hive
C、YARN
D、Mahout
二、判断题
1、海量数据就是大数据。( ×)
2、Google公司的GFS、MapReduce、BigTable是开源的。( ×)
3、MapReduce是的最早提出是Google为了解决PageRank的问题( √)
4、Apache Hadoop的HDFS、MapReduce、HBase是开源的。( √)
5、Hbase是非关系型数据库,是面向列的。( √)
6、Hadoop的发行版除了社区的Apache Hadoop外,Cloudera、Hortonworks、MapR、EMC、IBM、Intel、华为等公司都提供了自己的商业版本。( √)
三、填空题
1、MapReduce采用“分而治之”的思想,简而言之,MapReduce就是“分散任务,汇总结果”。
2、2006年,Google公司发表了论文“Bigtable: A Distributed Storage System for Structured Data”是用来处理海量数据的一种非关系型数据库。
3、Hadoop源自始于2002年的Apache Nutch项目,创始人是Doug Cutting 。
四、多选题
1、Hadoop大数据有哪两大核心技术?( AD )
A、分布式存储
B、数据采集
C、可视化
D、分布式处理
2、大数据有哪些特性?( ABCD )
A、数据量大
B、数据种类繁多
C、计算速度快
D、价值密度低
3、块副本位置选择的策略服务两大目标( AC )
A、最大化数据可靠性
B、最大化计算可靠性
C、最大化数据高效性
D、最大化计算高效性
4、下列关于HDFS对文件分块存储的作用描述正确的是(ABCD)
A、有利于负载均衡
B、便于并行处理
C、最小化寻址开销
D、支持大规模文件存储