2017年广东省公需课大数据考试
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据体系结构
单选
·下面不是HDFS优点的是B.适合单线程处理
·下面不是HDFS缺点的是D.流式文件访问
·大数据处理框架Spark最大的集群来自B.腾讯
·大数据处理框架Spark诞生于A.伯克利大学AMPLab
·提供资源的网络被称为B.云
·以下不属于服务器及桌面虚拟化技术的是D. 虚拟SAN技术
多选
·前端数据中心虚拟化技术包括A.组件虚拟化B.交换系统虚拟化C.网络虚拟化D.网络服务器虚拟化 ABCD
·能解决大数据存储效率的两方面有A.容量B.吞吐量 AB ·Hadoop的缺点有A.延迟大B.相应缓慢C.运维复杂 ABC
·分布式数据库的特点是A.是一个有序、稀疏、多维度的映射表B.有良好的伸缩性和高可用性 C.用来将数据库存储或部署到各个计算节点上 ABC
·云计算的优势包括 A.数据在云端:不怕丢失,不必备份,可以任意点的恢复B.软件在云端:不必下载自动升级C.无所不在的计算:在任何时间,任意地点,任何设备登录后就可以进行计算服务 D.无线强大的计算:具有无线空间的,无线速度 ABCD ·SaaS模式的优点有A.不用承担软件项目定制、开发、实施费用B.不用支付软件许可费用 C.不需要支付采购服务器等硬件设备费用
D.不需要支付购买操作系统、数据库等平台软件费用ABCD
·大数据处理框架-Spark的优点是()A. Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合
B. Spark不适用那种异步细粒度更新状态的应用 D. Spark的适用面比较广泛且比较通用 ABD
判断
·编程模型不适合用来处理大量数据的分布式运算,用于解决问题的程序开发模型,也是开发人员拆解问题的方法(错误)
·HDFS是一个不可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用(错误)
·目前大数据在互联网公司主要把Spark应用在广告、报表、推荐系统等业务上(正确)
·Hadoop主要的使用场景在于实时系统(错误)
·Hadoop是一个处理、存储和分析海量的分布式、非结构化数据的开源框架(正确)
·政务云是为政府机构应用现代信息通信技术(正确)
·Spark与Hadoop无缝结合(正确)
·流计算关注的是数据多次处理一次写入(正确)
·云计算将所有的计算资源集中起来,并由软件实现自动管理,无需人为参与(正确)
大数据概述和基本概念
单选
·以下观点错误的是 D.内部大数据与外部大数据的相对独立能保证企业的数据安全
·大数据技术的战略意义是 C.对这些含有意义的数据进行专业化处理
·以下数据单位最大的是C. TB
·以下不属于推动大数据分析平台发展技术的是B.数据管理技术·主要承担搭建大数据平台上层建筑任务的是B.数据开发技术
·下列单位不是数据单位的是 B.NB
··信息技术是指有关信息的收集、识别、提取、变换、存贮、传递、处理、检索、检测、分析和利用等的技术。凡涉及到这些过程和技术的工作部门,都可称作()部门C.信息
·下列不属于商业大数据类型的是()D. 电子商务数据
多选
·大数据技术的出现实现了巨大的社会价值,主要表现在 A.能够推动实现巨大经济效益C.能够推动增强社会管理水平D.如果没有高性能的分析工具,大数据的价值就得不到释放 ACD
·“大数据”的特点是A.数据体量大B.数据类别大C.数据处理速度
快D.数据真实性高 ABCD
·数据是一种未经加工的原始资料,下列属于数据的是A.数字B.符号C.文字D.图像 ABCD
·云计算包括有三个部分,分别是A.基础设施服务B.平台服务C.软件服务 ABC
·大数据处理流程可以概括为A.采集B.导入和预处理C.统计和分析D.数据挖掘 ABCD
·互连网上出现的海量信息可以划分为三种,分别为()A. 结构化信息B. 非结构化信息C. 半结构化信息 ABC
·企业大数据分析包括()A. 内容B. 关系C. 时空 ABC
·美国哈佛大学的研究小组给出了著名的资源三角形,分别是()A. 信息C. 物质D. 能量 ACD
判断
·大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合力时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯(正确)
·结构化数据是指不方便用数据库二维逻辑来表现的数据(错误)·全球数据的90%产生于过去2年内(正确)
·信息资源的创造和管理,从以往以经营和运作为核心的中心化模式,转化为以分散创造、自由传播、灵活汇聚为特征的众创模式(正确)·对企业而言,大数据实质上是一种管理手段(错误)
·除了传统的报表、图形之外,我们还可以结合现代化的可视化工具及人机交互手段(正确)
·信息是数据的表达,数据是信息的内涵(错误)
·可视化是给机器看的,数据挖掘就是给人看的(错误)
大数据应用案例
单选
·以下算法中,不属于分类预测的典型算法的是C. K-means算法·英国发布《把握数据带来的机遇:英国数据能力战略》的时间是B. 2013年
·常应用于市场细分方面的数据挖掘是B.聚类分析
·在激烈竞争的市场中,()是一个可能根据服务质量、优惠条件等因素而不断流动的团体 D. 客户
·美国治理警察超速行驶是通过()发现问题的 B. 通过对不同高速口收费站的原始数据记录的比对挖掘分析
·拥有全球第一大互联网用户群体的国家是()A. 中国
多选
·以B.物联网C.云计算D.大数据为代表的信息时代,将逐步改变人类的传统工作生活方式 BCD
·翼云平台主要研究内容包括 A. Hadoop架构及源码分析 B .HDFS 文件存储和传输的机制 C .NameNode的伸缩性问题D.负载均衡ABCD