大数据试卷-答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

上海市工业和信息化人才继续教育培训课程
《大数据和数据挖掘》在线考卷
一、是非题(共20题,每题2分,共40分)
1)大数据的概念与“海量数据”相同,都是强调数据的量。

(错)
2)大数据的数据价值密度比较高。

(错)
3)不管是大数据还是传统数据,都是以结构化数据作为基本的关注点。

(错)
4)大数据的数据类型包括结构化数据、半结构化数据、非结构化数据等多
种类型。

(对)
5)大数据三个颠覆性的观念转变:一是全部数据,而不是随机采样;二是
大体方向,而不是精确制导;三是相关关系,而不是因果关系。

(对)
6)科学研究的范式一:实验范式;范式二:理论范式;范式三:计算范式;
范式四:大数据范式。

(对)
7)小数据定义是提供群体决策的依据。

(错)
8)小数据是提供个人决策的依据。

(对)
9)大数据至今已有确切、统一的定义。

(错)
10)胡焕庸线是中国历史与地理发展的一个标志线。

(对)
11)大数据尚不能完全取代传统结构化数据。

(对)
12)大数据至今尚无确切、统一的定义。

(对)
13)云计算仅是一种计算模式。

(错)
14)人工智能是一种计算形式。

(对)
15)数据采集最基本的内容是系统日志。

(对)
16)NoSQL是指No SQL。

(错)
17)MapReduce的工作原理是先分后合的数据处理方式。

(对)
18)HBase是一个分布式的、面向列的开源数据库。

(对)
19)图G=(V)是仅有节点组成的集合。

(对)
20)关联规则挖掘也称购物篮分析。

(对)
二、单选题(共15题,每题2分,共30分)
21)云计算包含两方面的内容:( D )。

A数据和计算B服务和计算 C 存储和计算D服务和平台
22)人工智能需要(A)来建立其智能。

A数据,B计算,C 存储,D服务
23)数据(data)就是数值,也就是通过(B)或计算得出的结果。

A编制、观察,B观察、实验,C实验、抽样
24)分布式文件系统(DFS)可以有效解决数据的(C)难题。

A数据和计算, B服务和计算, C存储和管理
25)MapReduce是一套软件框架,包括(A)阶段。

A Map/映射和Reduce/化简两个,
B Map/映射,
C Reduce/化简
26)Hadoop框架最核心的设计是(B)。

A HDFS,
B HDFS和MapReduce,
C MapReduce
27)HDFS是Hadoop(C)缩写。

A分布式关系数据库,B关系数据库系统,C分布式文件系统
28)Kafka是一种高吞吐量的(B)发布订阅消息系统
A信息,B 分布式,C集中式
29)Hive是基于Hadoop的一个(A)工具。

A数据仓库,B分析,C平台
30)HBase是一个分布式的、(C)开源数据库。

A高容错,B面向行的,C面向列的
31)Tachyon是一个(A)的分布式文件系统。

A高容错,B面向行,C面向列
32)Spark速度比Hadoop MapReduce快(A)倍。

A10,B100,C200,
33)Apache Spark是专为(C)数据处理而设计的快速通用的计算引擎。

A 小规模,B中规模,C大规模
34)数据挖掘是从大量数据中(A)知识。

A提取或“挖掘”, B 总结,C归纳与学习
35)关联规则挖掘的主要内容是研究(C)的相关性。

A特征,B对象间,C属性间
三、多选题(共10题,每题3分,共30分)
36)大数据发展的四大要素:(ABCE)。

A不同参与主体产生的海量数据信息,B支撑大数据存储和运算的IT基础设施,C实时处理数据的能力,D满足日常业务分析的需要,E挖掘大数据潜在价值
37)数据预处理主要包括(ABDE)等四种方法。

A数据清洗,B数据集成,C数据挖掘,D数据转换,E数据消减
38)大数据产业链的六个主要环节层:IT基础设施层、(AC)、数据分析层、
数据平台层、数据应用层。

A数据源层,B数据管理层,C数据存储层,D数据业务层
39)大数据处理关键技术一般包括:(BCD)、大数据展现和应用。

A大数据清洗,B大数据采集与预处理,
C大数据存储与管理,D大数据分析及挖掘
40)四大种类NoSQL(BCDE)。

A SQL数据库,B键值数据库,C列存储数据库,D文档型数据库,E图数据库
41)Spark 四个主要特点:(ABCD)
A运行速度快,B易用性好,C通用性强,D随处运行,E防病毒。

42)云计算主要包括3种类型(ABD)。

A IaaS,
B PaaS,
C FaaS,
D SaaS
43)UMP系统是(ACD)云数据库方案。

A高性能,BOracle,C低成本,D标准的MySQL
44)流计算的处理流程一般包含三个阶段(BCD)。

A通讯服务,B数据实时采集,C数据实时计算,D实时查询服务
45)数据可视化是研究(BCD)等问题的综合技术。

A大数据存储与管理B,数据表示C,数据处理,D决策分析。

相关文档
最新文档