hadoop习题册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章大数据概述
1.互联网的发展分为______个阶段。
A.一 B.三 C.二 D.四
2.下列不属于大数据特点的是()。
A.种类和来源多样化
B.数据量巨大
C.分析处理速度快
D.价值密度高
3.互联网发展的第_____个时代为智能互联网。
A.3.0
B.4.0
C.1.0
D.2.0
4.关于大数据叙述不正确的一项是()。
A.大数据=“海量数据”+“复杂类型的数据”
B.大数据是指在一定时间对内容抓取、管理和处理的数据集合
C.大数据可以及时有效的分析海量的数据
D.数据包括结构化数据、半结构化数据、结构化数据。
5.下列数据换算正确的一项为()。
A.1YB=1024EB
B.1TB=1024MB
C.1PB==1024EB
D.1024ZB=1EB
6.结构化数据的表现形式为______。
A.文本
B.视图
C.二维表
D.查询
7.结构化的数据,先有________,再有_________.
A.数据结构
B.结构数据
C.内容结构
D.结构内容
8.结构化的数据,先有________,再有_________.
A.数据结构
B.结构数据
C.内容结构
D.结构内容
9.软件是大数据的_________。
A.核心
B.部件
C.引擎
D.集合
10.大数据技术不包括( )。
A.数据计算
B.数据存储
C.数据冗余
D.数据采集
11.大数据的特点不包括()。
A.数量大
B.类型少
C.速度快
D.价值高
第二章Hadoop简介
1.下列对云栈架构层数不正确的一项为________。
A.三层云栈架构
B.四层云栈架构
C.五层云栈架构
D.六层云栈架构
2.下列______不是云计算三层架构的概括。
A.IaaS
B.PaaS
C.SaaP
D.SaaS
3.IaaS基础设施及服务可以称为______。
A.弹性计算
B.效用计算
C.有效计算
D.随需应用
4.四层云栈模式,是将三层模式中的_________进行分解,分为两层,一层为硬件层,一层为虚拟资源层。
A.硬件部分
B.虚拟化部分
C.基础设施
D.平台
5.五层云栈模式,第五层为______。
A.固件/硬件层
B.云基本资源层
C.云应用程序层
D.云软件环境层
6.大数据是_____的应用。
A.人工智能
B.云计算
C.物联网
D.互联网
7.hadoop______中第一阶段的输出可以作为下一阶段的输入。
A.应用场景
B.分布式计算
C.分阶段计算
D.高效处理
8. .hadoop______中将海量数据分割于多个节点,由每个节点并行计算,将得到的结果归并到输出。
A.应用场景
B.分布式计算
C.分阶段计算
D.高效处理
9.下列选项中不是hadoop特点的是_____。
A.可靠性
B.扩容能力
C.高效率
D.成本高
10.hadoop能可靠地存储和处理_____字节数据。
A.TB
B.PB
C.YB
D.ZB
11.hadoop集群可以用___种模式进行。
A.四
B.三
C.五
D.二
12.hadoop集群不可以在_____________进行。
A.联机模式
B.单机模式
C.虚拟分布模式
D.完全分布模式
13.________模式:hadoop安装时的默认模式,不对配置文件进行修改。
A.联机
B.单机
C.虚拟分布
D.完全分布
14.________模式:在一台机器上用软件模拟多节点集群。
A.联机
B.单机
C.虚拟分布
D.完全分布
15.________模式:Hadoop安装运行在多台主机上,构成一个真实的hadoop集群,在所有的节点上都安装JDK和hadoop,相互通过高速局域网连接。
A.联机
B.单机
C.虚拟分布
D.完全分布
16.完全分布式,各节点之间设置________,将各个从节点生成的公钥添加到主节点的信任列表。
A.SSH
B.JDK
C.hadoop
D.HDFS
17.完全分布式,不需要修改的配置文件为_______。
A.core-site.xml
B.hdfs-site.xml
C.hadoop-env.sh
D.mapred-site.xml
18.HDFS架构中有两个_________。
A.DataNodes
B. JobTracke
Node
D.SecondayNameNode
19.下列不是hadoop核心组件的是________。
A.JobTracker
B.TaskTracker
C.HDFS
D.Hbase
20._______存储Hadoop集群中所有存储节点上的文件,为海量提供存储。
A.JobTracker
B.TaskTracker
C.HDFS
D.HBase