2020年大数据及其应用试题及答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020年大数据及其应用试题及答案
练习一:大数据方法与工具
1、(单选,10分)
不属于Hadoop生态系统的是()
A、HDFS
B、GFS
C、HBase
D、Hive
答案:B
2、(单选,10分)
MapReduce计算模型的描述,错误的是()
A、MapReduce采用的是一种分而治之的思想
B、MapReduceMapReduce要求待处理数据集可以分解为能并行处理的小数据集
C、MapReduce适合于实时在线任务的应用场景
D、MapReduce可以处理离线任务
答案:C
3、(单选,10分)
Spark描述正确的是()
A、Spark Streaming是将Stream数据分成小的时间片段(几秒)
B、Spark是专为大规模数据处理而设计的快速通用的计算引擎
C、内存计算下Spark比Hadoop快100倍
D、Spark不适合处理离线数据。
答案:D
4、(单选,10分)
下列关于人工智能技术描述错误的是()
A、人工智能技术是大数据分析的重要方法
B、计算智能属于人工智能技术
C、深度学习通常需要昂贵的GPU设备,不太适合于大数据分析
D、传统的机器学习对硬件环境要求不高,适合大数据分析。
答案:C
5、(单选,10分)
聚类分析的描述错误的是()
A、基于“物以类聚,人以群分”思想
B、采用样本间距离度量相似性,将数据分类划分到已有类别
C、k-means算法适合于非此即彼的聚类分析方法
D、对于有层级关系的样本,可以采用自底向上的凝聚式层次聚类分析方法答案:B
6、(单选,10分)
关于深度学习算法的描述,错误的是()
A、深度学习通过组合低层特征形成更加抽象的高层特征或类别。
B、深度学习算法适合于语音识别、文字识别、智能客服等应用场景
C、深度学习应用于人脸识别时,首先根据每个像素的亮度来识别边缘,然后根据边缘再识别出轮廓,最后根据轮廓识别出特定图像。
D、KNN、SVM等算法属于深度学习算法。
答案:D
7、(单选,10分)
计算智能描述错误的是()
A、计算智能是在生物遗传、变异、生长以及外部环境的自然选择中产生的
B、计算智能包括遗传算法、粒子群算法、蚁群算法等
C、粒子群算法是模拟鸟随机搜索食物的算法
D、计算智能是局部最优算法
答案:D
8、(单选,10分)
深度学习开源软件框架描述,错误的是()
A、TensorFlow支持多种操作系统和终端设备
B、Caffe支持命令行、 Python和MATLAB接口
C、PyTorch内嵌自动求导系统,使其成为最流行的动态图像处理框架
D、2018年PyTorch项目并入Caffe2项目。
答案:D
9、(单选,10分)
HDFS是基于google的GFS白皮书设计开源分布式文件系统
A、正确
B、错误
答案:A
10、(单选,10分)
啤酒和尿布的关系是沃尔玛分析消费者购物行为时,利用分类分析方法发现的规律
A、正确
B、错误
答案:B
练习二:大数据基本概念
1、(单选,10分)
下列对大数据4V特征的说法中,错误的是()
A、数据规模大
B、数据价值密度高
C、数据类型多样
D、数据处理速度快
答案:B
2、(单选,10分)
按照KB、MB、GB、TB、PB的有小到大顺序,下列换算错误的是()
A、1KB=1024Byte
B、1MB=1024KB
C、1TB=1024MB
D、1PB=1024TB
答案:C
3、(单选,10分)
下列关于大数据中计算机存储容量单位的说法中,错误的是()
A、基本存储容量单位是字节(Byte),
B、汉字字符存储空间要大于英文字符存储空间
C、一个英文字符需要2个字节的存储空间
D、一个汉字字符需要2个字节的存储空间
答案:C
4、(单选,10分)
数据清洗的方法不包括()
A、缺失数据处理
B、噪声数据清除
C、数据的一致性检查
D、数据的可视化
答案:D
5、(单选,10分)
非关系型数据库不包括()
A、Hbase
B、Mapreduce
C、Neo4j
D、MongoDB
答案:B
6、(单选,10分)
数据库不包括()
A、Hbase
B、MongoDB
C、Neo4j
D、Mapreduce
答案:D
7、(单选,10分)
下列关于分布式数据库的说法中,错误的是()
A、分布式数据库系统通常使用较小的计算机系统
B、分布式数据库是物理上分散的数据库
C、分布式数据库是逻辑上统一的数据库
D、每台计算机中都一定有DBMS的一份完整拷贝副本答案:D
8、(单选,10分)
大数据4V特征不包括()
A、规模性(Volume)
B、真实性(Veracity)
C、多样性(Varity)
D、高速性(Velocity)
答案:B
9、(单选,10分)
大数据的4V特征仅仅是指数据的体量大。
A、正确
B、错误
答案:B
10、(单选,10分)
分布式数据库是指物理上分散在不同地点,但是逻辑上是统一的数据库。
A、正确
B、错误
答案:A