《大数据导论》期末试卷二(含答案)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《大数据导论》考试试卷二
《大数据导论》试卷二答案及评分标准
一、单项选择题(每题2分,共20分)
1、D
2、C
3、C
4、D
5、D
6、D
7、C
8、D
9、B 10、B
二、判断题(每题1分,共8分)
1、×
2、√
3、√
4、√
5、×
6、√
7、√
8、×
三、名词解释(每题3分,共12分)
1、物联网——是指通过各种信息传感器,射频识别技术,全球定位系统,红外感应器,激光扫描器等各种装置与技术,实时采集任何需要监控、连接、互动的物体或过程。
物联网作为信息时代信息领域的一个关键词,其本质是传感器技术进步的产物。
2、网络爬虫——是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,是搜索引擎的重要组成。
3、可视分析学——是通过交互式可视化界面促进分析推理的一门科学,尤其关注的是意会和推理。
4、云存储——是一种网上在线存储的模式,即把数据存放在由第三方托管的多台虚拟服务器中。
托管公司营运大型的数据中心,需要数据存储托管的人向数据中心购买或租赁存储空间来满足数据存储的需求;数据中心营运商根据客户的需求,在后端准备存储虚拟化的资源,并将其以存储资源池的方式提供给客户。
四、简答题(第1、2题各7分,第3、4题各8分,共30分)
1、参考答案:
(1)硬件性价比的提高。
体现在计算机性价比的提高和磁盘价格的下降。
(2分)
(2)软件技术的进步,主要是大规模数据分布式处理技术Hadoop的诞生。
(2分)
(3)云计算的普及,使得大数据的处理环境在很多情况下不一定要自行搭建了。
(3分)
2、参考答案:
第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再是只依赖于随机采样。
(2分)第二个转变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。
当我们测量事物的能力受限时,关注最重要的事情和获取最精确的结果是可取的。
(3分)第三个转变即我们不再热衷于寻找因果关系。
(2
分)
3、参考答案:
大数据作为一场科学技术又一次的飞跃,是在继互联网、云计算后的技术变革,其发展和应用,必将对社会的组织结构、国家的治理模式、企业的决策架构、商业的业务策略以及个人的生活方式等产生深远的影响。
(3分)可以预测,大数据对大数据应用行业的发展具有长远性的重要作用。
(2分)从全球范围内目前大数据的发展的市场规模及其市场细分领域的行业现状来看,大数据逐步从概念研究进入了实际应用的转型时期,各国政府无一不加大该领域的扶持力度,争取占据战略领导高地。
(3分)
4、参考答案:
云计算和大数据在很大程度上是相辅相成的,最大的不同在于:云计算是你在做的事情,而大数据是你所拥有的东西。
(2分)以云计算为基础的信息存储、分享和挖掘手段为知识生产提供了工具,而通过对大数据分析、预测会使得决策更加精准,两者相得益彰。
(2分)从另一个角度讲,云计算是一种IT理念、技术架构和标准,而云计算也不可避免地会产生大量的数据。
(2分)所以说,大数据技术与云计算的发展密切相关,大型的云计算应用不可或缺的就是数据中心的建设,大数据技术是云计算技术的延伸。
(2分)
五、论述题(每题15分,共30分)
1、答题要点:
(1)IaaS(Infrastructure as a Service):基础设施即服务。
消费者通过因特网可以从完善的计算机基础设施获得服务。
IaaS通过网络向用户提供计算机(物理机和虚拟机)、存储空间、网络连接、负载均衡和防火墙等基本计算资源;用户在此基础上部署和运行各种软件,包括操作系统和应用程序。
(5分)
(2)PaaS(Platform as a Service):平台即服务。
PaaS实际上是指将软件研发的平台作为一种服务,以SaaS的模式提交给用户。
平台通常包括操作系统、编程语言的运行环境、数据库和 Web服务器,用户在此平台上部署和运行自己的应用。
(5分)
(3)SaaS(Software as a Service):软件即服务。
它是一种通过因特网提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动,例如邮件服务、数据处理服务、财务管理服务等。
(5分)
2、答题要点:
(1)在传统观念下,人们总是致力于找到一切事情发生背后的原因。
然而在很多时候,寻找数据间的关联并利用这种关联就足够了。
相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示其内部的运作机制。
(3分)
(2)通过找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。
相关关系虽然无法预知,但能预测可能发生的事情。
这已经极其珍贵了。
(3分)
(3)大数据时代,专家们正在研发能发现并对比分析非线性关系的技术工具。
一系列飞速发展的新技术和新软件也从多方面提高了相关关系分析工具发现非因果关系的能力。
这些新的分析工具和思路为我们展现了一系列新的视野被有用的预测,我们看到了很多以前不曾注意到的联系,还掌握了以前无法理解的复杂技术和社会动态。
(4分)
(4)传统情况下,人类是通过因果关系了解世界的。
但经常凭借直觉而来的因果关系并没有帮助我们加深对这个世界的理解。
很多时候,这种认知捷径只是给了我们一种自己已经理解的错觉。
在小数据时代,很难证明由直觉而来的因果联系是错误的。
将来,大数据之间的相关关系,将经常会用来证明直觉的因果联系是错误的。
分析相关关系,我们既有数学方法,也有统计学方法,同时,数字工具也能帮我们准确地找出相关关系。
相关关系分析本身意义重大,同时它也为研究因果关系奠定了基础。
通过找出可能相关的事物,我们可以在此基础上进行进一步的因果关系分析.如果存在因果关系的话,我们再进一步找出原因。
因此,相关关系帮助我们更好地了解了这个世界。
(5分)。