《大数据技术原理与操作应用》第1章习题答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章

单选题

1、下列选项中,最早提出“大数据”这一概念的是()。

•A、贝恩

•B、麦肯锡

•C、吉拉德

•D、杰弗逊

参考答案:

B

答案解析:

暂无解析

2、下列选项中,哪一项是研究大数据最重要的意义()。

•A、分析

•B、统计

•C、测试

•D、预测

参考答案:

D

答案解析:

研究大数据,最重要的意义是预测。

3、Hadoop1.0中,Hadoop内核的主要组成是()。

•A、HDFS和MapReduce

•B、HDFS和Yarn

•C、Yarn

•D、MapReduce和Yarn

参考答案:

A

答案解析:

Hadoop1.0中,Hadoop内核的主要是由HDFS和MapReduce两个系统组成。

4、在HDFS中,用于保存数据的节点是()。

•B、datanode

•C、secondaryNode

•D、yarn

参考答案:

B

答案解析:

暂无解析

多选题

1、下列选项中,属于Google提出的处理大数据的技术手段有()。

•A、MapReduce

•B、MySQL

•C、BigTable

•D、GFS

参考答案:

A,C,D

答案解析:

Google提出了三个处理大数据的技术手段,分别是MapReduce、BigTable和G FS。

2、下列选项中,属于Hadoop优势的有()。

•A、扩容能力强

•B、可靠性

•C、低效率

•D、高容错性

参考答案:

A,B,D

答案解析:

Hadoop具有扩展能力强、成本低、高效率、可靠性、高容错性的优势。

3、下列选项中,属于Hadoop版本系列的有()。

•A、Hadoop4

•B、Hadoop2

•C、Hadoop1

参考答案:

B,C,D

答案解析:

Hadoop主要分为Hadoop1、Hadoop2、Hadoop3三个系列的多个版本。

判断题

1、大数据提供的是一些描述性的信息,而创新还是需要人类自己实现。

•对

•错

参考答案:

答案解析:

暂无解析

2、JobTracker只负责执行TaskTracker分配的计算任务。

•对

•错

参考答案:

答案解析:

TaskTracker只负责执行JobTracker分配的计算任务。

3、大数据在医疗行业中可以有效控制疾病的发生。

•对

•错

参考答案:

答案解析:

在医疗行业中,大数据可以有效预防预测疾病。

4、在HDFS中,namenode用于决定数据存储到哪一个datanode节点上。

•对

•错

参考答案:

答案解析:

暂无解析

5、Hadoop是Apache顶级的开源项目。

•对

•错

参考答案:

答案解析:

暂无解析

6、Hadoop的开源社区版比较著名的是Cloudera公司的CDH版本。

•对

•错

参考答案:

答案解析:

Hadoop的商业版比较著名的是Cloudera公司的CDH版本。

填空题

1、马云曾经说过未来的时代将不是IT时代,而是【】时代。

参考答案:

【DT】

答案解析:

暂无解析

2、【】中引入了资源管理框架Yarn。

参考答案:

【Hadoop2.x】

答案解析:

暂无解析

3、大数据的四大特征是体量大(Volume)、【】、速度快(Velocity)和【】。参考答案:

【多样(Varity)】【价值(Value)】

答案解析:

暂无解析

4、在Hadoop1.x版本中,MapReduce是由一个【】和多个TaskTracker组成。参考答案:

【JobTracker】

答案解析:

暂无解析

5、大数据在金融行业中的具体表现为【】、【】、决策支持、服务创新以及产品创新。参考答案:

【精准营销】【风险管控】

答案解析:

暂无解析

6、大数据的分为【】、非结构话数据和【】。

参考答案:

【结构化数据】【半结构化数据】

答案解析:

大数据的分为结构化数据、非结构话数据以及半结构化数据。

简答题

1、简述大数据在零售行业应用的具体表现。

参考答案:

大数据在零售行业的具体表现有三个,分别是精准定位零售行业市场、支撑行业收益管理以及挖掘零售业新需求。

答案解析:

暂无解析

2、简述Hadoop生态体系常见的子系统。

参考答案:

Hadoop生态体系中常见的子系统有HDFS分布式文件系统、MapReduce分布式计算框架、Yarn资源管理框架、Sqoop数据迁移工具、Mahout数据挖掘算法库、H Base分布式存储系统、Zookeeper分布式协作服务、Hive基于Hadoop的数据仓库以及Flume日志收集工具。

答案解析:

暂无解析

相关文档
最新文档