2020年大数据及其应用试题及答案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2020年大数据及其应用试题及答案

练习一:大数据方法与工具

1、(单选,10分)

不属于Hadoop生态系统的是()

A、HDFS

B、GFS

C、HBase

D、Hive

答案:B

2、(单选,10分)

MapReduce计算模型的描述,错误的是()

A、MapReduce采用的是一种分而治之的思想

B、MapReduceMapReduce要求待处理数据集可以分解为能并行处理的小数据集

C、MapReduce适合于实时在线任务的应用场景

D、MapReduce可以处理离线任务

答案:C

3、(单选,10分)

Spark描述正确的是()

A、Spark Streaming是将Stream数据分成小的时间片段(几秒)

B、Spark是专为大规模数据处理而设计的快速通用的计算引擎

C、内存计算下Spark比Hadoop快100倍

D、Spark不适合处理离线数据。

答案:D

4、(单选,10分)

下列关于人工智能技术描述错误的是()

A、人工智能技术是大数据分析的重要方法

B、计算智能属于人工智能技术

C、深度学习通常需要昂贵的GPU设备,不太适合于大数据分析

D、传统的机器学习对硬件环境要求不高,适合大数据分析。

答案:C

5、(单选,10分)

聚类分析的描述错误的是()

A、基于“物以类聚,人以群分”思想

B、采用样本间距离度量相似性,将数据分类划分到已有类别

C、k-means算法适合于非此即彼的聚类分析方法

D、对于有层级关系的样本,可以采用自底向上的凝聚式层次聚类分析方法答案:B

6、(单选,10分)

关于深度学习算法的描述,错误的是()

A、深度学习通过组合低层特征形成更加抽象的高层特征或类别。

B、深度学习算法适合于语音识别、文字识别、智能客服等应用场景

C、深度学习应用于人脸识别时,首先根据每个像素的亮度来识别边缘,然后根据边缘再识别出轮廓,最后根据轮廓识别出特定图像。

D、KNN、SVM等算法属于深度学习算法。

答案:D

7、(单选,10分)

计算智能描述错误的是()

A、计算智能是在生物遗传、变异、生长以及外部环境的自然选择中产生的

B、计算智能包括遗传算法、粒子群算法、蚁群算法等

C、粒子群算法是模拟鸟随机搜索食物的算法

D、计算智能是局部最优算法

答案:D

8、(单选,10分)

深度学习开源软件框架描述,错误的是()

A、TensorFlow支持多种操作系统和终端设备

B、Caffe支持命令行、 Python和MATLAB接口

C、PyTorch内嵌自动求导系统,使其成为最流行的动态图像处理框架

D、2018年PyTorch项目并入Caffe2项目。

答案:D

9、(单选,10分)

HDFS是基于google的GFS白皮书设计开源分布式文件系统

A、正确

B、错误

答案:A

10、(单选,10分)

啤酒和尿布的关系是沃尔玛分析消费者购物行为时,利用分类分析方法发现的规律

A、正确

B、错误

答案:B

练习二:大数据基本概念

1、(单选,10分)

下列对大数据4V特征的说法中,错误的是()

A、数据规模大

B、数据价值密度高

C、数据类型多样

D、数据处理速度快

答案:B

2、(单选,10分)

按照KB、MB、GB、TB、PB的有小到大顺序,下列换算错误的是()

A、1KB=1024Byte

B、1MB=1024KB

C、1TB=1024MB

D、1PB=1024TB

答案:C

3、(单选,10分)

下列关于大数据中计算机存储容量单位的说法中,错误的是()

A、基本存储容量单位是字节(Byte),

B、汉字字符存储空间要大于英文字符存储空间

C、一个英文字符需要2个字节的存储空间

D、一个汉字字符需要2个字节的存储空间

答案:C

4、(单选,10分)

数据清洗的方法不包括()

A、缺失数据处理

B、噪声数据清除

C、数据的一致性检查

D、数据的可视化

答案:D

5、(单选,10分)

非关系型数据库不包括()

A、Hbase

B、Mapreduce

C、Neo4j

D、MongoDB

答案:B

6、(单选,10分)

数据库不包括()

A、Hbase

B、MongoDB

C、Neo4j

D、Mapreduce

答案:D

7、(单选,10分)

下列关于分布式数据库的说法中,错误的是()

A、分布式数据库系统通常使用较小的计算机系统

B、分布式数据库是物理上分散的数据库

C、分布式数据库是逻辑上统一的数据库

D、每台计算机中都一定有DBMS的一份完整拷贝副本答案:D

8、(单选,10分)

大数据4V特征不包括()

A、规模性(Volume)

B、真实性(Veracity)

C、多样性(Varity)

D、高速性(Velocity)

答案:B

9、(单选,10分)

大数据的4V特征仅仅是指数据的体量大。

A、正确

B、错误

答案:B

10、(单选,10分)

分布式数据库是指物理上分散在不同地点,但是逻辑上是统一的数据库。

A、正确

B、错误

答案:A

相关文档
最新文档