大数据题库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据题库
共50题,每题2分,总分100分。
考试时间25分钟。
第一部分:简单题
1. spark是用以下哪种编程语言实现的 [单选题] *
A、c
B、c++
C、java
D、Scala(正确答案)
2. FusionInsight Manger 对服务的管理操作,下面说法错误的是? [单选题] *
A、可以对服务进行启停重启操作
B、可以添加和卸载服务
C、可设置不常用的服务
隐藏和显示(正确答案)
D、观察期不能做扩容
3. FusionInsight hd集群升级,以下描述正确的有 *
A、升级过程中不可以手工操作主备 OMS倒换(正确答案)
B、集群内所有主机的root账户密码要保持一致(正确答案)
C、保持网络畅通。
避免因网络问题导致升级异常(正确答案)
D、观察期不能做扩容(正确答案)
4. FusionInsight HD的Loader 在创建作业时。
连接器(connector)有什么用? [单选题] *
A、、确定有哪些转换步骤
B、提供有话参数。
提高
数据导入导出性能
C、配置作业如何与外部
数据源进行连接(正确答
案)
D、配置作业如何与内部
数据源进行连接
5. 下列哪个HDFS命令可用于检测数据块的完整性? [单选题] *
A、hdfs fack/(正确答案)
B、hdfs fack/-delete
C、hdfs dfsadmin-report
D、hdfs balancer-
threshold1
6. YARN中设置队伍QueueA的最大使用资源量。
需要配置哪个参数 [单选题] *
A、
yarn.scheduler.capacity.root .QueueA-user-limit-factor B、
yarn.scheduler.capacity.root
.QueueA.minimum-user-
limit-percent
C、
yarn.scheduler.capacity.root
.QueueA.state
D、
yarn.scheduler.capacity.root
.QueueA.maximum-
capacity(正确答案)
7. Flume的数据流可以根据headers的信息发送到不同的channel中 [单选题] *
A、正确(正确答案)
B、错误
8. FusionInsight HD与外部管理平台对接时,支持哪些接口? *
A、SNMP(正确答案)
B、vpn
C、BGP
D、Syslog(正确答案)
9. Hbase的数据文件HFile中一个Keyvalue格式包括哪些信息? *
A、key(正确答案)
B、value(正确答案)
C、Timestamp(正确答案)
D、Key Type(正确答案)
10. FusionInsight HD集群规划设计时,集群有150个节点,并且采用双平面组网部署,对于该集群网络宽带要求的描述,下列描述正确的有? *
A、业务平面所有节点都使用10GE网络(正确答案)
B、管理平面控制节点都使用10GE网络
C、管理平面数据节点都使用1GE网络(正确答案)
D、业务平面控制节点都使用1GE网络
E、管理平面管理节点都使用10GE网络(正确答案)
11. FusionInsiht系统中Hive支持的储存格式包括? *
A、HFile
B、TextFile(正确答案)
C、sequenceFile(正确答案)
D、RCFile(正确答案)
12. Spark任务的每个Stage可划分为job,划分的标记是shu [单选题] *
A、对
B、错(正确答案)
13. FusionInsight Manger对服务的配置功能说法不正确的是? [单选题] *
A、服务级别的配置可对所有实例生效
B、实例级别的配置只针
对本实例生效
C、实例级别的配置对其
他实例也生效(正确答案)
D、配置保存后需要重启
服务才能生效
14. FusionInsight hd部署solr时如果选择索引存放在本地磁盘建议给每个solrsever 实例的数据目录单独挂载磁盘,并且磁盘配置为RAID0或RAID5 [单选题] *
A、对(正确答案)
B、错
15. 关于 FusionInsight HD安装流程正确的是? [单选题] *
A、安装manager-执行preinstall-LLD工具进行配置-安装集群-安装manger-
B、LLD工具进行配置-执
行preinstall-安装manger-
安装集群-安装后检查-安
装后配置(正确答案)
C、安装manager-LLD工
具进行配置-执行
preinstall-安装集群-安装后
检查-安装后配置
D、LLD工具进行配置-执行preinstall-安装集群-安装manger-安装后检查-安
装后配置
16. 关于kerberos的部署,描述正确的是? [单选题] *
A、kerberos仅有一个角色
B、kerberos服务在同一个
节点上有两个实例(正确答
案)
C、kerberos服务采用主备
模式部署
D、kerberos服务必须和
LDAP服务部署在同一个
节点上
17. 某银行规划的 FusionInsight HD集群中有90个节点。
如果控制节点就规划了三个那集群中的数据节点规划几个最为合理? [单选题] *
A、87(正确答案)
B、85
C、990
D、86
18. 安装 FusionInsight HD软件包钱必须在本节点/etc/hosts文件中配置集群中所有节点的主机名称与业务IP的映射关系 [单选题] *
A、对(正确答案)
B、错
19. 客户IT系统中 FusionInsight HD集群中有150个节点,每个节点12块磁盘(不做Raid 不包括OS盘),每块磁盘大小1T,只安装HDFS,按照默认配置最大可储存多少数据? [单选题] *
A、1764tb
B、1800tb
C、600tb
D、588tb(正确答案)
20. FusionInsight HD节点不支持哪种主机操作系统? [单选题] *
A、Suse11.1
B、RedHat6.5
C、CentOS6.4
D、Ubuntu11.04(正确答
案)
21. FusionInsight HD中如果需要查看当前登录Hbase的用户和权限组,可以在Hbase shell中执行什么命令? [单选题] *
A、use-permissio
B、whoami(正确答案)
C、who
D、get_user
22. FusionInsight HD产品在部署kerberos和LDAP服务时以下描述正确的是? *
A、部署kerberos服务之前,必须先部署LDAP服务(正确答案)
B、LDAP服务必须和kerberos服务部署在同一节点
C、kerberos服务和LDAP服务部署到同一个节点上利于数据的访问,有助于性能的提升(正确答案)
D、LDAP服务可以多个集群共享
23. 23. Fusionsight HD manager界面Hive日志收集,哪个选项不正确? [单选题] *
A、可指定实例进行日志收集,比如制定单独收集METASTORE的日志
B、可指定时间段进行日志收集,比如只收集2016-1-1 到2016-1-10的日志
C、可指定节点IP进行日志收集,例如仅下载某个IP的日志
D、可指定特定用户进行日志收集,例如仅下载userA用户产生的日志(正确答案)
24. 24.华为Fusionsight HD集群中,spark服务可以从以下哪些服务读取数据? *
A、YARN
B、HDFS(正确答案)
C、Hive(正确答案)
D、Hbase(正确答案)
25. 25.如果YARN集群中只有Dafault、QueuA和QueueB子队列,那么允许将他们的容量分别设置为60%、25%和22% [单选题] *
A、正确
B、错误(正确答案)
26. 26、Fusionsight HD系统中,关于solr索引的存储部署,以下说法正确的有? *
A、利用HDFS数据存储可靠性和易于扩容的特点选择索引存储与HDFS(正确答案)
B、不论solr索引存储在HDFS上还是存储在本地磁盘,在同一节点上都必须要部署5个solr实例根据ip和不同的端口号来区分不同的solr实例
C、当对实时索引录入速度要求较高时,可选择索引存放在本地磁盘(正确答案)
D、当索引数据存放在HDFS上,solrserver实例与Datanode实例部署在同一节点(正确答案)
27. 27. FusionInsight HD 三层组网适合多少节点的集群规模? [单选题] *
A、30 节点以下
B、100 节点以下
C、100-200 节点
D、200 节点以上(正确答案)
28. 28、FusionInsight HD系统中,kerberos仅用于组件间服务安全认证 [单选题] *
A、正确
B、错误(正确答案)
29. 29、FusionInsight HD支持大规模集群得到安装部署、监控、告警、用户管理、权限管理、审计、服务管理、健康检查、问题定位、升级和补丁 [单选题] *
A、正确(正确答案)
B、错误
30. 30.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是? [单选题] *
A.客户端的文件数据经过NameNode传递给DataNode
B.客户端将文件划分为多个Block,根据DataNode的地址信息,按顺序写入每一个DataNode中(正确答案)
C.客户端个根据DataNode的地址信息,按顺序将整个文件写入每一个,然后由DataNode将文件划分为多个Block
D.客户端只上传数据到一个DataNode,然后由NataNode,然后由NameNode负责Block复制。
31. 31.Fusionlnsight HD系统中Hbase的最小处理单元是Region,User Region和RegionServer之间的路由信息是保存在哪? [单选题] *
A.ZooKeeper
B.HDFS
C.Master
D.meta表(正确答案)
32. 32 Hbase集群定时执行Compaction的目的是什么? *
A.减少同一个Region,同一个ColumnFamily下的文件数目(正确答案)
B.提升数据读取性能(正确答案)
C.减少同一个ColumnFamily的文件数据
D.减少同一个Region的文件数目
33. 33Fusionlnsight Manager会定时备份哪些数据? *
A.NameNode(正确答案)
B.LDAP(正确答案)
C.OMs(正确答案)
D.DBService(正确答案)
34. 34. 通过 FusionInsight Manager 不能完成以下哪个操作? [单选题] *
A、安装部署
B、性能监控
C、权限管理
D、虚拟机分配(正确答案)
35. 35.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,并不会保存消息。
[单选题] *
A.正确
B.错误(正确答案)
36. 36.以下哪些是Spark服务的常驻进程? *
A.JobHistory(正确答案)
B.JDBCServer(正确答案)
C.SparkResource
D.NodeManager
37. 37.Fusionlnsight HD的 Steraming是基于开源Apache Storm 开发的,Storm是一个分布式的离线计算框架。
[单选题] *
A.正确
B.错误(正确答案)
38. 38.Fusionlnsight HD 系统中一个集群可以管理多个服务,每个服务可以管理多个角色,每个角色只能管理一个实例。
[单选题] *
A.正确
B.错误(正确答案)
39. 39. 关于 Hbase 的 Region 分裂流程 split 的描述不正确的是? [单选题] *
A、Split 过程中并没有真正的将文件分开,仅仅是创建了引用文件
B、Split 为了减少 region 中数据大小,从而将一个 region 分裂成两个 region
C、Split 过程中该表会暂停服务(正确答案)
D、Split 过程中被分裂的 region 会暂停服务
40. 40.Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管理? *
A.大量小文件存储
B.高容错、高吞吐量(正确答案)
C.低延迟读取
D.流式数据访问(正确答案)
41. 41.如果 FusionInsight HD 集群节点数不足以使数据节点单独部署的
情况下,可以采用管理节点&控制节点&数据节点合一部署方案,但性能会受到
限制。
[单选题] *
A.正确(正确答案)
B.错误
42. 42.Hadoop的NameNode用于存储文件系统的元数据。
[单选题] *
A.正确(正确答案)
B.错误
43. 43. 关于FusionInsight Manager关键特性,说法正确的是? [单选题] *
A.能够针对整个集群,某个服务器进行健康检查,不能够针对节点进行健康检查
B.Manager引入角色的概念,采用RBAC的方式对系统进行权限管理(正确答案)
C.整个系统使用Kerberos管理用户,使用Ldap进行认证,通过CAS实现单点登录
D.对于健康检查结果,不能够导出检查报告,只能够在线查看
44. 44.查看kafka某topic的partition详细信息时,使用如下哪个命令? [单选题] *
A. bin/kafka-topics.sh –create
B. bin/kafka-topics.sh –list
C. bin/kafka-topics.sh -describe(正确答案)
D. bin/kafka-topics.sh -delete
45. 45. FusionInsight Hadoop 集群中,在某个节点上通过 df-hT 查询,看到的分区包含以下几个:
/var/log
/srv/BigData
/srv/BigData/hadoop/data5
/srv/BigData/solr/solrserver3
/srv/BigData/dbdata_om
这些分区所对应磁盘最佳 Raid 级别的规划组合是? [单选题] *
A、Raid0、Raid1、Raid0、Non-Raid、Raid-1
B、Raid1、Raid1、Non-Raid、Non-Raid、Raid1(正确答案)
C、Raid0、Raid0、Raid0、Raid0
D、Non-Raid、Non-Raid、Non-Raid、Non-Raid、Raid1
46. 46. FusionInsigh HD 系统中 HDFS 默认 Block Size 是多少? [单选题] *
A、32M
B、64M
C、128M(正确答案)
D、256M
47. 47. FusionInsigh HD部署时,同一集群内的Flume server节点建议至少部署几个? [单选题] *
A、1
B、2(正确答案)
C、3
D、4
48. 48. FusionInsight HD 系统设计日志不可以记录下面那些操作? [单选题] *
A、手动清除告警
B、启停服务实例
C、删除服务实例
D、查询历史监控(正确答案)
49. 49.基于 Hadoop 开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有?(多选) *
A、MR
B、Spark
C、HDFS(正确答案)
D、Hbase(正确答案)
50. 50.Hadoop的HBase不适合哪些数据类型的应用场景? [单选题] *
A.大文件应用场景(正确答案)
B. 海量数据应用场景
C. 高吞吐率应用场景
D. 半结构化数据应用场景
51. 51.FusionInsight 集群组网设计中,二层组网指集群内二层交换,集
群节点在一个子网里,适用节点数小于 200 的集群场景 [单选题] *
A.正确(正确答案)
B.错误
52. 52.FusionInsight HD 中的 Loader 作业提交到 Yarn 后,作业不能手工停止 [单选题] *
A.正确
B.错误(正确答案)
53. 53. 安装 FusionInsight HD 的 Streaming 组件时,Nimbus 角色要求安装几个节点? [单选题] *
A、1
B、2(正确答案)
C、3
D、4
54. 54. 关于FusionInsight HD 中Loader作业描述正确的是? [单选题] *
A.Loader将作业提交到Yam执行后,如果Loader服务出现异常,则此作业执行失败
B.Loader将作业提交到Yame执行后,如果某个Mapper执行失败,能够自动进行重试(正确答案)
C.Loader作业执行失败,将会产生垃圾数据,需要用户手动清除
D.Loader将作业提交到Yam执行后,在该作业执行完成前,不能再提交其他作业
55. 55. 关于大数据的主要特征理解和描述正确的有? *
A、来源多,格式多(正确答案)
B、增长速度快,处理速度快(正确答案)
C、存储量大,计算量大(正确答案)
D、数据的价值密度较低(正确答案)
56. 56. Hadoop 平台中,要查看 YARN 服务中一个 application 的信息,通常需要使用什么命令? [单选题] *
A、container
B、applicationattempt
C、jar
D、application(正确答案)
57. 57.在FusionInsight集群规划部署时,建议管理节点最好部署()个,控制节点最少部署(),数据节点最少部署()个。
[单选题] *
A. 1,2,2
B. 1,3,2
C. 2,3,1
D. 2,3,3(正确答案)
58. 58. FusionInsight Manager 界面上,当收到 Kafka 磁盘容量不足告警,且该告警的原因已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决此问题。
[单选题] *
A.正确(正确答案)
B.错误
59. 59.FusionInsight HD安装过程中,执行preinstall不能完成哪项功能? [单选题] *
A.修改OS配置,确保OS满足FusionInsight HD的安装要求
B.安装Manager(正确答案)
C.格式化分区
D.安装OS缺失的RPM包
60. 60.SolrCloud模式是集群模式,在此模式下Solr服务强依赖于以下哪个服务?[单选题] *
A.HBase
B.HDFS
C.ZooKeeper(正确答案)
D.Yarn
61. 61.Spark on YARN 模式下的driver只能运行在客户端。
[单选题] *
A.正确
B.错误(正确答案)
62. 62. Hadoop 的 MapReduce 组件擅长处理哪些场景的计算任务? [单选题] *
A、迭代计算
B、离线计算(正确答案)
C、实时交互计算
D、流式计算
63. 63.某高校的FusionInsight HD集群中有230个节点,在进行集群规划时,下列哪些进程应该部署在数据节点上? *
A.Data Node(正确答案)
Node
C.NodeManager(正确答案)
D.RegionServer(正确答案)
E.DBServer
F.SolrServer(正确答案)
64. 64. FusionInsight HD集群中的节点只安装了一块网卡,也可以采用双平面隔离组网方案。
[单选题] *
A.正确
B.错误(正确答案)
65. 65. Hadoop 系统中,如果文件系统的备份因子是 3,那么每次 mapreduce 任务运行的 task 所需要的文件都要从 3 个有副本的机器上传输需要处理的文件。
[单选题] *
A.正确
B.错误(正确答案)
66. 66.YARN上有两个同级队列Q1与Q2,容量都是50,Q1上已经有10个任务共占用了40的容量,Q2上有2个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1。
[单选题] *
A.正确
B.错误(正确答案)
67. 67.以下哪些数据不属于半结构化数据? [单选题] *
A.HTML
B.XML
C.二维表(正确答案)
D.JSON
68. 68.关于FusionInsight HD Streaming 客户端的Supervisor描述正确的是? [单选题] *
A、Supervisor负责资源分配和资源调度
B、Supervisor负责接管 Nimbus 分配的任务,启动和停止属于自己管理的worker 进程(正确答案)
C、Supervisor 是运行具体处理逻辑的进程
D、Supervisor是一个Topology中接收数据然后执行处理的组件
69. 69. HDFS 的 Client 写入文件时,数据的第一副本写入位置是由 NameNode 确定,
其他副本的写入位置是由 DataNode 确定 [单选题] *
A.正确
B.错误(正确答案)
70. 70. 关于FusionInsight Manager,说法错误的是? [单选题] *
A、NTP sever/client负责集群内各节点的时钟同步
B、通过FusionInsight Manager,可以对HDFS进行启停控制、配置参数
C、FusionInsight Manager所有维护操作只能够通过WebUI来完成,没有提供Shell 维护命令(正确答案)
D、通过FusionInsight Manager,可以向导式安装集群,缩短集群部署时间
71. 71.RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。
[单选题] *
A.正确(正确答案)
B.错误
72. 72.HDFS支持大文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。
[单选题] *
A.正确
B.错误(正确答案)
73. 73. 下列哪些 OS 版本被推荐可以用来搭建 FusionInsight V1R2C60 集群? *
A、SUSE 11 SP1/SP2/SP3 for AMD64 & Intel64(正确答案)
B、CentOS-6.6(正确答案)
C、RedHat-6.4-x86_64(正确答案)
D、RedHat-6.5-x86_64(正确答案)
E、RedHat-6.7-x86_64(正确答案)
F、Ubuntu6.3
74. 74. FusionInsight HD 系统中如果修改了服务的配置项,不进行服务重启,该服务的配置状态是什么状态? [单选题] *
A、SYNCHRONIZED
B、EXPIRED(正确答案)
C、CONFIGURING
D、UNKNOWN
75. 75. FusionInsight HD 用户管理系统仅支持管理人机帐号 [单选题] *
A.正确
B.错误(正确答案)
76. 76.Flume的properties.properties配置文件中可以配置多个channle来传输数据。
[单选题] *
A.正确(正确答案)
B.错误
77. 77. FusionInsight HD部署过程中,执行precheck检查每一个节点时必须调用checkNodes.Configd配置文件。
[单选题] *
A.正确(正确答案)
B.错误
78. 78. FusionInsight HD 系统中,如果发现 Solr 服务不可用,可以从哪些方面分析定位问题? *
A.查看其依赖的 ZooKeeper 服务是否正常(正确答案)
B.查看 HDFS 服务是否正确(正确答案)
C.登录 SolrServerAdmin 所在节点,确认该节点与另外一个 SolrServerAdmin 实例节点网络是否连通(正确答案)
D.登录 FusionInsight Manager 界面,下载 Solr 服务不可用期间的相关日志,进行进一步定位(正确答案)
79. 79. Spark 是基于内存的计算,所有 Spark 程序运行过程中的数据只能存储在内存中。
[单选题] *
A.正确
B.错误(正确答案)
80. 80. Spark应用在运行时, Stage划分的依据是哪个? [单选题] *
A、task
B、taskSet
C、action
D、shuffle(正确答案)
81. 81. FusionInsight HD 安装前准备,包括哪些步骤? *
A、完成硬件安装(正确答案)
B、完成节点主机操作系统安装(正确答案)
C、准备工具和软件。
例如 PuTTY,LLD,FusionInsight HD 软件包等(正确答案)
D、准备规划数据。
例如网络参数和角色部署位置(正确答案)
82. 82. FusionInsight HD系统中HBase支持动态扩展列。
[单选题] *
A.正确(正确答案)
B.错误
83. 83. FusionInsight HD 的 Streaming 对于 zookeeper 弱依赖,即使zookeeper 故障streaming 也可以正常提供服务。
[单选题] *
A.正确
B.错误(正确答案)
84. 84. 采用 Flume 传输数据过程中,为了防止因 Flume 进程重启而丢失数据,推荐使用以下哪种 channel 类型? [单选题] *
A、Memory Channel
B、File Channel(正确答案)
C、JDBC Channel
D、HDFS Channel
85. 85.Loader的作业执行失败,则此作业运行过程中导入的数据不会被删除,必须手动删除。
[单选题] *
A.正确
B.错误(正确答案)
86. 86.Loader提供了哪些方式或接口实现作业管理? *
A.Web UI(正确答案)
B.Linux 命令行(正确答案)
C.Rest 接口(正确答案)
D.java API(正确答案)
87. 87. 以下选项中,对华为 FusionInsight HD 系统中备用 NameNode 的作用描述准确的有?(多选) *
A、主 NameNode 的热备(正确答案)
B、备 NameNode 对内存没有要求
C、帮助主 NameNode 合并编辑日志,减少主 NameNode 启动时间(正确答案)
D、备 NameNode 应与主 NameNode 部署到一个节点
88. 88. FusionInsight HD集群中,集群规模有300个节点,如果采用推荐部署方案,控制节点上一定不会存在哪些分区? *
A./
B.//srv/BigData/dbdata_om(正确答案)
C./srv/BigData
D.//srv/ BigData/ jurnalnode
E. //srv/BigData/hadoop/data5(正确答案)
89. 89. FusionInsight HD 的 Hbase 中一张表包含以下几个
Region[10,20),[20,30),[30,+∞),分别编号为①,②,③,那么,11,20,222 分别属于哪个 Region? [单选题] *
A、①①③
B、①②③
C、①②②(正确答案)
D、①①②
90. 90、关于Hive建表基本操作描述正确的是? [单选题] *
A.创建外部表时需要指定external关键字(正确答案)
B.一旦表创建好,不可再修改表名
C.一旦表创建好,不可再修改列名
D.一旦表创建好,不可再增加新列
91. 91、FusionInsight HG 系统中,在创建Kafka的 Topic 时必须设置 Partition 个数和副本个数,设置多副本可以增强Kafka服务的容灾能力。
[单选题] *
A.正确(正确答案)
B.错误
92. 92、FusionInsight HD 部署时,如果 Solr 索引默认存放在HDFS上时,以下理解正确的有? [单选题] *
A、不需要考虑各solrserver实例上创建了多少shard
B、为保证数据可靠性,创建索引时必须创建多Replica
C、通过HDFS读取索引时占用磁盘IO,因此不建议Solr实例与DataNode部署在同一节点上
D、当Solr服务参数INDEX_STORED_ON_HDFS值为HDFS时,创建Collection 的索引就默认存储在HDFS上。
(正确答案)
93. 93.FusionInsight Hadoop 集群中,集群规模有 70 个节点,如果采用推荐部署方案,在管理节点可能存在哪些分区?(多选题) *
A、/srv/BigData/zookeeper(正确答案)
B、/srv/BigData/dbdata_om(正确答案)
C、/srv/BigData/(正确答案)
D、/srv/BigData/journalnode(正确答案)
E、/srv/BigData/hadoop/data5
94. 94.大数据商业咨询服务方案在规划环节主要考虑以下哪些设计?(多选题) *
A、大数据商业模式设计(正确答案)
B、商业场景全景规划(正确答案)
C、典型场景需求设计(正确答案)
D、场景分解和业务设计(正确答案)
95. 95. Loader仅支持关系型数据库与Hadoop HBase之间的数据的导入和导出。
[单选题] *
A.正确
B.错误(正确答案)
96. 96. FusionInsight HD中使用HBase进行数据读写服务时需要连接 HMaster。
[单选题] *
A.正确
B.错误(正确答案)
97. 97. 关于 Kerberos 的 TGT 以下说法错误的是? [单选题] *
A、TGT 全称为票据授权票据,主要由 KDC 服务器生成
B、TGT 一次生成之后,可以无限期使用(正确答案)
C、TGT 在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式
D、TGT 中主要的信息有当前该票据的有效时长和授予该 TGT 的服务端 IP 以及
98. 98. HBase如果发生一个Region的Split,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段? [单选题] *
A Split过程中
B Flush过程中
C Compaction过程中(正确答案)
D HFile分开过程中
99. 99. FusionInsightHD V100R002C60的版本集群中,以下哪些组件需要规划元数据分区? *
A、HDFS(正确答案)
B、Zookeeper(正确答案)
C、Streaming(正确答案)
D、Redis
E、HBase
F、Kafka
100. 100.Hadoop 通过 ResourceManager 对集群资源进行管理,它的主要功能有? *
A、集群资源调度(正确答案)
B、应用程序管理(正确答案)
C、集群资源管理(正确答案)
D、日志管理
101. 101. 以下关于 Hadoop的 HDFS描述正确的有? *
A、HDFS由NameNode,DataNode,Client组成(正确答案)
B、HDFS备NameNode上的元数据是主NameNode同步过去的
C、HDFS采用就近的机架节点进行数据的第一副本存储(正确答案)
D、HDFS适合一次写入,多次读取的读写任务(正确答案)
102. 102. FusionInsight Manager 可以对哪些项目进行健康检查? *
A、主机(正确答案)
B、服务(正确答案)
C、角色
D、实例
103. 103. Hadoop 系统中 YARN 支持哪些资源类型的管理? *
A、内存(正确答案)
B、Cpu(正确答案)
C、网络
D、磁盘空间
104. 104.哪个不是Flume的 channel 类型? [单选题] *
A、Memory Channel
B、File Channel
C、JDBC Channel
D、HDFS Channel(正确答案)
105. 105. FusionInsightHD中Loader实例必须与哪个实例部署在一起? [单选题] *
A.DataNode
B.RegionServer
C.ResourceManager
D.NodeManager(正确答案)
106. 106. Hadoop 平台中HBase的Region是由哪个服务进程来管理? [单选题] *
A、HMaster
B、DataNode
C、RegionSever(正确答案)
D、Zookeeper
107. 107. FusionInsight系统中,HDFS的Block默认保存几份? [单选题] *
A、3份(正确答案)
B、2份
C、1份
E、不确定
108. 108.Hadoop中,如果将
yarn.scheduler.capacity.root. QueueA.minimum-user-limit-percent设置为50,下面说法错误的是? [单选题] *
A.一个用户提交任务,可以使用QueueA的100%的资源
B. QueueA中的每个用户最多只能获得50%的资源(正确答案)
C.如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源
D. QueueA中必须保障每个用户至少得到50%的资源
109. 109.Solr创建Collection时,推荐选用路由算法为compositld Router,那么该Collection可以扩展shard。
[单选题] *
A.正确
B.错误(正确答案)
110. 110.在solrcloud模式下,以下关于solr相关概念描述正确的有? *
A.collection是在solrcloud集群中逻辑意义上完整的索引,可以被划分为一个或多个shard,这些sahrd使用相同的config set。
(正确答案)
B.config set时solr core提供服务必须的一组配置文件,包括solrconfig.xml和schema.xml(正确答案)
C.shard是collection的逻辑分片,每个shard都包含了一个或者多个replicas,通过选举确定哪个replica是leader,只有Leader replica 才能进行处理索引和查询请求
D.reptica只有处于active状态是才会接受索引和查询请求(正确答案)
111. 111. 那个选项不属于transformation操作? [单选题] *
A.jion
B.sort
C.reduceByKey
D.reduce(正确答案)
112. 112. 关于Hive与Hadoop其他组件的关系,描述错误的是? [单选题] * A.HIVE 最终将数据存储在HDFS中
B. Hive SQL其本质是执行的MapReduce任务
C. Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖(正确答案)
113. 113. 关于 FusionInsight Manager 功能说法错问题有哪些?(多选题) *
A、通过 FusionInsight Manager 的 Audit 设计界面可以查询每个重要操作
B、通过 FusionInsight Manager 不能下载单个组件的客户端(正确答案)
C、集群部署完成后,通过 FusionInsight Manager 不能进行集群扩容,只能通过卸载集群重新搭建来扩容集群(正确答案)
D、通过 FusionInsight Manager 的 admin 告警界面可以查询每个告警的具体信息
114. 114. FusionInsightHD系统中,集群节点规划时需要考虑哪些磁盘规划? *
A.主机OS磁盘规划(正确答案)
B.控制节点元数据盘规划(正确答案)
C.管理节点元数据盘规划(正确答案)
D.数据节点数据磁盘规划(正确答案)
115. 115. FusionInsight Manager用户权限管理不支持哪个配置? [单选题] *
A.给用户配置角色
B.给角色配置权限
C.给用户组配置角色
D.给用户组配置权限(正确答案)
116. 116.华为FusionInsight HD系统中,对存储副本为3个的数据块,当有一个节点上该数据块丢失时,需要手动复制一个副本到该节点上。
[单选题] *
A.正确
B.错误(正确答案)
117. 117.Spark应用运行时,如果某个tast运行失败则导致整个app运行失败。
[单选题] *
A.正确
B.错误(正确答案)
118. 118. FusionInsight HD的Manager界面对Loader的操作不包括下列哪个? [单选题] *
A.启动Loader实例
B.查看Loader服务状态
C.配置Loader参数
D.查看Loader运行日志(正确答案)
119. 119.Flume传输数据过程中,Sink取走数据并写入目的地后,会将event从channel中删除。
[单选题] *
A.正确(正确答案)
B.错误
120. 120.在FusionInsight集群规划时,以下哪些集群命名是系统允许的? *
A. FusionInsight-123
B. FusionInsight_123(正确答案)
C. FusionInsight 123(正确答案)
D.123FusionInsight(正确答案)
121. 121. FusionInsight HD支持哪些日志下载方式? *
A.下载已安装的所有组件的日志(正确答案)
B.下载单个组建某个模块的日志(正确答案)
C.下载指定主机的日志(正确答案)
D.下载指定时间段的日志(正确答案)
122. 122. FusionInsight HD集群规划中,管理节点&控制节点&数据节点合一部署方案合适什么样的场景? [单选题] *
A.30节点以下(正确答案)
B.100节点以下
C.100~200节点
D.200节点以上
123. 123. FusionInsight HD系统中,以下选项哪一个不是HBase写数据设计的角色或服务? [单选题] *
A.Zookeeper
B.HDFS
C.HMaster(正确答案)
D.RegionServer
124. 124.HDFS机制中NameNode负责管理元数据,Client端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息以此获取所读文件在DataNode的位置。
[单选题] *
A.正确
B.错误(正确答案)
125. 125.以下哪些是Spark可以提供的功能? *
A.分布式内存计算引擎(正确答案)
B.分布式文件系统
C.集群资源的统一管理
D.流处理功能(正确答案)
126. 126. FusionInsight HD LLD配置规划工具可以生成哪些配置文件? *
A.监控告警阀值配置文件
B.集群的安装模板文件(正确答案)
C.HDFS和YARN的配置文件
D.执行Precheck所需要的配置文件CheckNodes.Config(正确答案)
127. 127. FusionInsight HD扩容时,添加到集群中的新节点,主机OS的root用户密码与集群原所有节点root用户密码可以不用保持一致。
[单选题] *
A.正确
B.错误(正确答案)
128. 128.从生命周期维度看,数据主要经历那几个阶段? *
A.数据采集(正确答案)
B.数据存储(正确答案)
C.数据管理(正确答案)。