大数据技术导论_北京理工大学中国大学mooc课后章节答案期末考试题库2023年

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据技术导论_北京理工大学中国大学mooc课后章节答案期末考试题库2023年
1.大数据是一个什么领域的问题?
答案:
多学科综合领域
2.以下哪种技术对大数据技术的发展起了最重要基础支撑作用?
答案:
云计算技术
3.科学研究的第三范式是计算思维-()
答案:
仿真模拟
4.与大数据直接相关的职业不包括
答案:
首席执行官
5.下面科学研究的四个范式顺序正确的是()
答案:
经验范式-理论范式-模拟范式-数据密集型范式6.常见的分布式网络爬虫架构不包含()
答案:
Master-worker
7.以下哪项不是传统关系型数据库的弱点?
答案:
无法满足数据一致性和完整性的需求
8.HBase是一种()数据库
答案:
列式数据库
9.访问HBase表中的行,不可以用以下哪种方式
答案:
通过某列的值区间
10.HDFS中文件块默认保存几份()
答案:
3 份
11.下面与HDFS类似的框架是()
答案:
GFS
12.下列关于NoSQL数据库和关系型数据库的比较,不正确的是
答案:
NoSQL数据库很容易实现数据完整性,关系型数据库很难实现数据完整性13.下列数据库属于文档数据库的是
答案:
MongoDB
14.NoSQL数据库的CAP不包含()
答案:
持久性
15.NoSQL数据库的BASE不包含()
答案:
持续性
16.关于NoSQL数据库和关系数据库,下列说法不正确的是:
答案:
NoSQL数据库和关系数据库各有优缺点,但随着NoSQL的发展,终将取代关系数据库
17.下列关于数据可视化的介绍,不正确的是()
答案:
雷达图不适用于多维数据
18.下列不可以用于多维数据可视化的方法有()
答案:
GMap
19.数据度量的常用方法不包括:
答案:
聚类系数
20.Spark的组件中,用于做查询分析的是()
答案:
Spark SQL
21.关于MapReduce,下列说法错误的是
答案:
Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写22.传统并行计算框架(比如MPI)和MapReduce并行计算框架相比较的特点
不包含
答案:
前者相比后者学习起来更容易
23.关于RDD论述正确的是()
答案:
RDD提供一种高度受限的共享内存模型,是一个弹性分布式数据集
24.Apache软件基金会最重要的三大分布式计算系统开源项目不包括()
答案:
MapReduce
25.以下哪项对数据隐私问题的影响相对最小
答案:
政府和企业成立安全联盟
26.科学研究的第一到第四范式数据思维依次分别采用:仿真模拟、模型推演、
关联分析、科学归纳
答案:
错误
27.大数据处理中的批处理框架包含Flink、hadoop、jvm、Spark
答案:
错误
28.系统的控制方式一般分为模型驱动和数据驱动
答案:
正确
29.4V特征包含:数据规模大、数据密度低、数据处理速度快、价值密度低
答案:
错误
30.模拟范式是以数据考察为基础,联合理论、实验和模拟一体的数据密集计算
的范式
答案:
错误
31.全表对比是一种需要计算MD5校验码的非增量抽取方法
答案:
错误
32.大数据中的非结构化数据包括视频、图像、语音、文本
答案:
正确
33.电子表格Excel、网页HTML均属于结构化数据
答案:
错误
34.HBase依靠Hadoop存储底层数据
答案:
错误
35.在分布式文件系统中,采用采用多副本冗余存储可以节约存储空间、保证数
据可靠性、更容易检查数据错误并加快数据传输速度
答案:
错误
36.分布式文件系统改变了数据存储和管理方式,相对于本地文件系统具有易扩
展、低成本、强可靠、高可用的优势
答案:
正确
37.Hadoop的框架最核心的设计是HDFS和MapReduce
答案:
正确
38.HDFS 专为解决大数据存储问题而产生的,其具备了强大的跨平台兼容性,
支持批和流数据读写,实现了低延时数据访问,并兼容廉价的硬件设备
答案:
错误
39.目前,NoSQL的含义是“Not only SQL”,而不是“No SQL”。

答案:
正确
40.数据可视化可以理解信息、探索数据、协助思考,并作为大量工作记忆的外
界辅助
答案:
正确
41.PCA是一种无监督的降维方法
答案:
正确
42.Textflow用河流的运动表达了文本主题的诞生、发展、合并、分裂、消亡
的过程导致主题演变的原因往往是主题关键词的变化
答案:
正确
43.聚类是在没有先验知识的情况下进行的
答案:
正确
44.在Spark运行时,Task Scheduler为程序构建基本运行环境 Spark context
对象(应用管家),向资源管理器进行资源申请,任务分配与监控
答案:
错误
45.MapReduce体系结构包含Task、TaskTracker、JobTracker、Client
答案:
正确
46.MapReduce设计的一个理念是“数据向计算靠拢”,并采用“分而治之”的策略
答案:
错误
47.理论上如果数据传输渠道确保不被窃取、数据存储服务器不被破解、数据库
确保不被他人脱库,则不存在数据隐私问题。

答案:
错误
48.数据匿名化技术将数据库的部分敏感数据隐匿,使得攻击者无法直接获取到
敏感数据
答案:
错误
49.属性多样技术的原理是给予敏感属性不少于l个多样性的值,使得攻击者难
以猜测到真实的属性
答案:
正确
50.属性多样技术难以解决同质性攻击,但是可以克服相似性攻击
答案: 错误。

相关文档
最新文档