南京邮电大学云计算与大数据课后作业节选(附题干)

合集下载

云计算习题参考答案

第6章云计算习题参考答案6-1简述云和云计算的基本概念。

答：云也叫做资源池，是一些可以自我维护和管理的虚拟计算资源，通常是一些大型服务器集群，包括计算服务器、存储服务器和宽带资源等。

云计算是一种基于互联网的、大众参与的计算模式，其计算资源（计算能力、存储能力、交互能力）是动态、可伸缩、且被虚拟化的，以服务的方式提供。

6-2简述私有云、公用云和混合云的基本概念。

答：私有云也叫做专用云，是由单个客户所拥有的按需提供基础设施，该客户控制哪些应用程序在哪里运行，拥有服务器、网络和磁盘，并且可以决定允许哪些用户使用基础设施。

公用云是由第三方运行的云，第三方可以把来自许多不同客户的作业在云内的服务器、存储系统和其他基础设施上混合在一起。

最终用户不知道运行其作业的同一台服务器、网络或磁盘上还有哪些用户。

混合云把公用云模式与私有云模式结合在一起。

客户通过一种可控的方式对云部分拥有，部分与他人共享。

6-3简述云计算的四个本质特征。

答：云计算的本质包括：(1)虚拟化，即把软件、硬件等IT资源进行虚拟化，抽象成标准化的虚拟资源，放在云计算平台中统一管理，保证资源的无缝扩展；(2)多粒度和多尺度，即灵活的面对需求，提供不同的服务；(3)不确定性，因为云计算是一个人参与的计算，是群体智能的体现，表现出自然界不确定性特征；(4)软计算，即如何让网络明白一些定量、定性的转换，如一些大约的量词等。

6-4简述云计算与并行计算的关系。

答：并行计算式云计算的萌芽阶段。

在并行计算中，为了获得高速的计算能力，人们不惜采用昂贵的服务器和购买更多的服务器。

因此，强大的并行计算能力需要巨额的投资。

并且，传统的并行计算机的使用是一个相当专业的工作，需要使用者具有较高的专业素质。

而云计算将服务器等设施集中起来，最大程度地做到资源共享，能够动态地为用户提供计算能力和存储能力，随时满足用户的需求。

6-5简述分布式计算的基本原理，并指出云计算与分布式计算的关系。

云计算与大数据技术-课后习题答案docx (6)[1页]

6.11 习题答案
1．启动Hadoop集群可以使用一条命令，也可以使用两条命令，它们分别是什么？
答：使用一条命令：start-all.sh；使用两条命令：start-dfs.sh和start-yarn.sh。

2．Hadoop启动成功之后，使用jps命令，分别回答在master和slave端，至少需要看到那几个服务进程已经启动才表示Hadoop启动正确？
答：master机器上：NameNode、SecondaryNameNode、ResourceManager服务进程；slave机器上：NodeManager、DataNode服务进程。

3．试述ZooKeeper正确启动之后，可以看见的它的守护进程是什么？
答：QuorumPeerMain进程。

4．HBase启动成功之后，分别在master和slave端可见的它的守护进程是什么？
答：在hbase的主节点master机器可见HMaster、HRegionServer进程，在从节点slave上可见HRegionServer进程。

5．试叙述如果需要Hbase正常工作的话，Hbase、ZooKeeper、Hadoop三者的启动先后顺序。

答：先启动Hadoop，再启动ZooKeeper，最后启动ZooKeeper。

在前一个正确的基础上，后一个才可以正确运行。

6．试述在安装Hive之前，必须在Linux服务上事先安装什么数据库软件？
答：安装mysql数据库软件。

7．试述在安装Kafka之前，需要在Linux环境下，必须事先安装好什么软件或服务？
答：Kafka工作的时候需要jdk和zookeeper服务，所以必须事先安装。

大学《云计算与大数据》试题及答案

云计算大数据试题一、单选题1、我公司大数据对外服务品牌是下面哪一项？（A）A.智慧洞察B.精确营销C.智慧数据D.和数据答案：A2、目前中国移动已经开展的大数据对外服务不包括下面的哪一项？（D）A.旅游景区客源分析B.交通OD系统C.商铺选址D.互联网广告营销答案：D3、大数据金融征信是对外服务一个重要的领域，下面说法错误的是（C）A.要严格保护用户信息安全B.数据结果脱敏加工C.可以输出用户的位置信息D.必须获得用户授权答案：C4、大数据技术的战略意义不在于掌握庞大的数据信息，而在于对这些含有意义的数据进行（B）。

A. 数据信息B. 专业化处理C.速度处理D. 内容处理答案：B5、与运营商数据相比，互联网数据有以下几点局限性，除了（ D ）。

A. 数据局部性B. 数据封闭性C. 数据割裂性D.数据全面性答案：D6、推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、（D ），推测客户将来可能的购买行为。

A.客户的朋友B.客户的个人信息C.客户的兴趣爱好D. 客户过去的购买行为和购买记录答案：D7、社交网络产生了海量用户以及实时和完整的数据，同时社交网络也记录了用户群体的（ C ），通过深入挖掘这些数据来了解用户，然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。

A.地址B.行为C.情绪D.来源答案：C8、在云生态环境中，用户需求相当于（ D ），云数据中心相当于（ C ），云服务相当于（ B ）。

A. 降水B. 水滴C. 水库D. 阳光答案：D\C\B9、云计算按照提供的服务类型进行分类，包括Iaas、Paas、（A）。

A.SaasB.DockerC.XenD.KVM答案：A10、IDC机房等级（五星级机房），等保(三级)答案：B11、（A）是指以服务的形式提供虚拟硬件资源，如虚拟主机/存储/网络等资源。

A.IaasB.SaasC.PaasD.Docker答案：A12、存储虚拟化通过对存储系统或存储服务的内部功能进行抽象、隐藏或隔离，从而实现（B）和存储的独立管理。

《分布式计算、云计算与大大数据》习题参考解答

《分布式计算、云计算与大数据》习题解答参考第1章分布式计算概述一、选择题1，CD 2，ABC 3，ABCD 4，ACD二、简答题1，参考1.1.1和1.1.2节2，参考1.1.2节3，分布式计算的核心技术是进程间通信，参考1.3.2节4，单播和组播5，超时和多线程三、实验题1.进程A在进程B发送receive前发起send操作进程A进程B发出非阻塞send操作，进程A继续运行发出阻塞receive操作，进程B被阻塞进程B在进程A发起send前发出receive操作发出非阻塞send 操作，进程A 继续运行发出阻塞receive 操作，进程B被阻塞收到进程A 发送的数据，进程B 被唤醒2. 进程A 在进程B 发送receive 前发起send 操作进程A 进程B发出阻塞send 操作，进程A 被阻塞发出阻塞receive 操作，进程B 被阻塞进程B 在进程A 发起send 前发出receive 操作发出阻塞send操作，进程A被阻塞发出阻塞receive操作，进程B被阻塞收到进程A发送的数据，进程B被唤醒收到进程B返回的数据，进程A被唤醒3.1).在提供阻塞send操作和阻塞receive操作的通信系统中receiveoperationsendoperationt=1在提供非阻塞send操作和阻塞receive操作的通信系统中t=1receiveoperationsendoperation2)．P1，P2，P3进程间通信的顺序状态图m1m1m2m2第2章分布式计算型概述1.消息传递，客户-服务器，P2P，分布式对象，网络服务，移动代理等2.分布式应用最广泛最流行的型是客户-服务器型，参考2.2节3.分布式应用最基本的型是消息传递模型，参考2.1节4.参考2.3节，P2P应用有很多，例如Napster，迅雷，PPS网络电视等5.参考2.4节6.参考2.7节7.略8.消息传递模式是最基本的分布式计算型，适用于大多数应用；客户-服务器型是最流行的分布式计算型，应用最为广泛；P2P型又称为对等结构型，使得网络以最有效率的方式运行，适用于各参与者地位平等的网络；分布式对象型，是抽象化的远程调用，适用于复杂的分布式计算应用等。

云计算与大数据技术应用习题

1. 简述什么是云计算？答：云计算是一种动态扩展的计算模式，通过网络将虚拟化的资源作为服务提供；云计算是一种无处不在的、便捷的通过互联网访问一个可定制的IT资源（IT资源包括网络、服务器、存储、应用软件和服务）共享池，并是一种按使用量付费的模式，它能够通过最少量的管理或与服务供应商的互动实现计算资源的迅速供给和释放；云计算是基于互联网服务的增加、使用和交付模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。

2. 云计算有什么特点？答：①具有大规模并行计算能力；②资源虚拟化（Virtualization）和弹性调度；③数据量巨大并且增速迅猛；④高可靠性；⑤按需分配，按量计费。

3. 请分别回答什么是IaaS、PaaS、SaaS？答：IaaS：基础设施即服务，Infrastructure as a Service；PaaS：平台即服务，Platform as a Service；SaaS：软件即服务，Software as a Service。

4. 云计算的基础设施有哪些，各自完成什么功能？答：①分布式文件系统，完成数据的存储；②MapReduce编程模式，提供分布式并行编程环境进行数据处理；③大规模分布式数据库BigTable，提供分布式大规模数据库管理系统。

1. 解释说明什么是非结构化和半结构化数据？答：非结构化数据是数据结构不规则或不完整，没有预定义的数据模型，不方便用数据库二维逻辑表来表现的数据，包括所有格式的办公文档、文本、图片、图像和音频/视频信息等。

半结构化数据是介于完全结构化数据（如关系型数据库、面向对象数据库中的数据）和完全无结构的数据之间的数据，XML、HTML文档属于半结构化数据，它一般是自描述的，数据的结构和内容混在一起，没有明显的区分。

2. 大数据价值链的三大构成是什么？答：数据本身、技能与思维。

3. 大数据的4V特征是什么？答：①多样性（Variety）；②规模性大（V olume）；③快速性（Velocity）；④价值密度低（Value）。

云计算技术_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

云计算技术_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.下列关于云计算的说法错误的是（）。

参考答案:主要基于非虚拟化资源池2.副本删除发生的原因主要包括（）。

参考答案:副本的生命周期结束3.下列典型虚拟化软件不包括（）。

参考答案:Eureka4.下列不属于半虚拟化技术的是（）。

参考答案:AMD-V5.相较于Swarm，Kubernetes的优势包括（）。

参考答案:以上都是6.用户合法获取云服务的第一道关卡是（）。

参考答案:身份认证7.与虚拟机相比，以下关于目前容器的叙述错误的是（）。

参考答案:容器的安全性比虚拟机强8.目前决定副本数量的主要方法不包括（）。

参考答案:随机复制9.在GFS中，客户端可以并行访问多个（），提高了系统的整体性能。

参考答案:数据块服务器10.同一台物理主机上一个虚拟机的崩溃或故障不会影响其他虚拟机，这主要得益于虚拟化技术的（）特征。

参考答案:隔离11.虚拟化技术的研究目的包括（）。

参考答案:以上都是12.Docker可以回滚到当前镜像的前一个版本，可以避免因为完成部分组件的升级而导致对整个环境的破坏，这是Docker的（）功能。

参考答案:版本控制13.分布式文件系统的性能要求主要包括（）。

参考答案:以上都是14.区块链的核心是（），是区块链网络中各个节点达成一致的方法。

参考答案:共识层15.云计算有许多关键技术，其中包含（）。

参考答案:以上都是16.证明云计算系统中的活动符合内部或外部要求的合规性机制是（）。

参考答案:云计算审计17.云计算的体系架构不包括（）。

参考答案:网络调度层18.云计算的产生与发展综合了许多技术，包括（）。

参考答案:以上都是19.存储虚拟化的实现方式包括（）。

参考答案:以上都是20.以下不属于云计算部署模型的是（）。

参考答案:企业云21.云计算的管理中间件层中包含对（）的管理功能。

参考答案:以上都是22.基于区块链的数据完整性验证通过（）计算哈希值并判断其与根哈希值是否一致。

《分布式计算、云计算与大数据》习题参考解答

《分布式计算、云计算与大数据》习题解答参考第1章分布式计算概述一、选择题1，CD 2，ABC 3，ABCD 4，ACD二、简答题1，参考1.1.1和1.1.2节2，参考1.1.2节3，分布式计算的核心技术是进程间通信，参考1.3.2节4，单播和组播5，超时和多线程三、实验题1.进程A在进程B发送receive前发起send操作进程A进程B发出非阻塞send操作，进程A继续运行发出阻塞receive操作，进程B被阻塞进程B在进程A发起send前发出receive操作发出非阻塞send 操作，进程A 继续运行发出阻塞receive 操作，进程B被阻塞收到进程A 发送的数据，进程B 被唤醒2. 进程A 在进程B 发送receive 前发起send 操作进程A 进程B发出阻塞send 操作，进程A 被阻塞发出阻塞receive 操作，进程B 被阻塞进程B 在进程A 发起send 前发出receive 操作发出阻塞send操作，进程A被阻塞发出阻塞receive操作，进程B被阻塞收到进程A发送的数据，进程B被唤醒收到进程B返回的数据，进程A被唤醒3.1).在提供阻塞send操作和阻塞receive操作的通信系统中receiveoperationsendoperationt=1在提供非阻塞send操作和阻塞receive操作的通信系统中t=1receiveoperationsendoperation2)．P1，P2，P3进程间通信的顺序状态图m1m1m2m2第2章分布式计算范型概述1.消息传递，客户-服务器，P2P，分布式对象，网络服务，移动代理等2.分布式应用最广泛最流行的范型是客户-服务器范型，参考2.2节3.分布式应用最基本的范型是消息传递模型，参考2.1节4.参考2.3节，P2P应用有很多，例如Napster，迅雷，PPS网络电视等5.参考2.4节6.参考2.7节7.略8.消息传递模式是最基本的分布式计算范型，适用于大多数应用；客户-服务器范型是最流行的分布式计算范型，应用最为广泛；P2P范型又称为对等结构范型，使得网络以最有效率的方式运行，适用于各参与者地位平等的网络；分布式对象范型，是抽象化的远程调用，适用于复杂的分布式计算应用等。

大数据与云计算综合练习含答案

大数据与云计算综合练习含答案1.下列关于大数据(Big data)特点的叙述,错误的是( ).[单选题] *A:数据体量巨大B:数据类型繁多C:商业价值高D:处理速度慢(正确答案)2.当前大数据技术的基础是由( )首先提出的.[单选题] *A:微软B:百度C:谷歌(正确答案)D:阿里巴巴3.大数据的起源是( ).[单选题] *A:金融B:电信C:互联网(正确答案)D:公共管理4.大数据的最显著特征是( ).[单选题] *A:数据规模大(正确答案)B:数据类型多样C:数据处理速度快D:数据价值密度高5.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点.这体现了大数据分析理念中的( ).[单选题] *A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析(正确答案)C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据6.当前社会中,最为突出的大数据环境是( ).[单选题] *A:自然资源B:综合国力C:物联网D:互联网(正确答案)7.大数据时代,数据使用的关键是( ).[单选题] *A:数据收集B:数据存储C:数据分析D:数据再利用(正确答案)8.下列论据中,能够支撑"大数据无所不能"的观点的是( ).[单选题] *A:互联网金融打破了传统的观念和行为(正确答案)B:大数据存在泡沫C:大数据具有非常高的成本D:个人隐私泄露与信息安全担忧9.支撑大数据业务的基础是( ).[单选题] *A:数据科学B:数据应用(正确答案)C:数据硬件D:数据人才10.大数据的核心就是( ).[单选题] *A:告知与许可B:预测(正确答案)C:匿名化D:规模化11.大数据不是要教机器像人一样思考.相反,它是( ).[单选题] *A:把数学算法运用到海量的数据上来预测事情发生的可能性(正确答案)B:被视为人工智能的一部分C:被视为一种机器学习D:预测与惩罚12.大数据是指不用随机分析法这样的捷径,而采用( )的方法 .[单选题] *A:所有数据(正确答案)B:绝大部分数据C:适量数据D:少量数据13.相比依赖于小数据和精确性的时代,大数据因为更强调数据的( ),帮助我们进一步接近事实的真相.[单选题] *A:安全性B:完整性C:混杂性D:完整性和混杂性(正确答案)14.大数据的发展,使信息技术变革的重点从关注技术转向关注( ).[单选题] *A:信息(正确答案)B:数字C:文字D:方位15.大数据时代,我们是要让数据自己"发声",没必要知道为什么,只需要知道( ).[单选题] *A:原因B:是什么(正确答案)C:关联物D:预测的关键16.下列关于大数据的分析理念的说法中,错误的是( ).[单选题] *A:在数据基础上倾向于全体数据而不是抽样数据B:在分析方法上更注重相关分析而不是因果分析C:在分析效果上更追究效率而不是绝对精确D:在数据规模上强调相对数据而不是绝对数据(正确答案)17.下列说法正确的是( ).[单选题] *A:有价值的数据是附属于企业经营核心业务的一部分数据B:数据挖掘它的主要价值后就没有必要再进行分析了C:所有数据都是有价值的(正确答案)D:在大数据时代,收集、存储和分析数据非常简单18.关于数据创新,下列说法正确的是( ).[单选题] *A:多个数据集的总和价值等于单个数据集价值相加B:由于数据的再利用,数据应该永久保存下去C:相同数据多次用于相同或类似用途,其有效性会降低D:数据只有开放价值才能得到真正释放(正确答案)19.关于数据估值,下列说法错误的是( ).[单选题] *A:随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴B:无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的(正确答案) C:数据的价值可以通过授权的第三方使用来实现D:目前可以通过数据估值模型来准确的评估数据的价值评估20.在大数据时代,下列说法正确的是( ).[单选题] *A:收集数据很简单B:数据是最核心的部分(正确答案)C:对数据的分析技术和技能是最重要的D:数据非常重要,一定要很好的保护起来,防止泄露21.在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于( )为其行为承担责任.[单选题] *A:数据使用者(正确答案)B:数据提供者C:个人许可D:数据分析者22.对大数据使用进行正规评测及正确引导,可以为数据使用者带来什么切实的好处( ).[单选题] *A:他们无须再取得个人的明确同意,就可以对个人数据进行二次利用(正确答案) B:数据使用者不需要为敷衍了事的评测和不达标准的保护措施承担法律责任C:数据使用者的责任不需要强制力规范就能确保履行到位D:所有项目,管理者必须设立规章,规定数据使用者应如何评估风险、如何规避或减轻潜在伤害23.下列论据中,体现"冷眼"看大数据的观点的是( ).[单选题] *A:互联网金融打破了传统的观念和行为B:大数据医疗正在走进平民百姓C:数据资产型企业前景光明D:个人隐私泄露与信息安全担忧(正确答案)24.大数据环境下的隐私担忧,主要表现为( ).[单选题] *A:个人信息的被识别与暴露(正确答案)B:用户画像的生成C:恶意广告的推送D:病毒入侵25.对线下零售而言,做好大数据分析应用的前提是( ).[单选题] *A:增加统计种类B:扩大营业面积C:增加数据来源(正确答案)D:开展优惠促销26.一切皆可连,任何数据之间逻辑上都有可能存在联系,这体现了大数据思维维度中的( ).[单选题] *A:定量思维B:相关思维(正确答案)C:因果思维D:实验思维27.一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证,这体现了大数据思维维度中的( ).[单选题] *A:定量思维B:相关思维C:因果思维D:实验思维(正确答案)28.下列企业中,最有可能成为典型的数据资产动营商的是( ).[单选题] *A:物联网企业B:互联网企业C:云计算企业D:电信运营商(正确答案)29.大数据处理中的数据分析根据不同层次大致可分为3类:计算架构、( )以及数据分析和处理.[单选题] *A:支撑技术B:数据解释C:查询与索引(正确答案)D:数据的收集管理30.大数据的4V特点,不包括( ).[单选题] *A:大量(Volume)B:高速(Velocity)C:多样(Variety)D:可视化(Visualization)(正确答案)31.大数据的处理不包含下列( ).[单选题] *A:采集B:导入/预处理C:统计/分析D:查询(正确答案)32.大数据分析相比于传统的( )仓库应用,具有数据量大、查询分析复杂等特点.[单选题] *A:小型B:大型C:数据(正确答案)D:计算33.网上购物过程中,经常会看到"看了此商品的会员通常还看了…"、"买了此商品的会员通常还买了…".这些信息既方便了顾客购物选择,又为商家赢得了更多的利润.这里采用的技术是( ).[单选题] *A:联机分析处理B:智能代理C:智能机器人D:数据挖掘(正确答案)34.基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源.这种新的计算机应用领域称为( ).[单选题] *A:嵌入式技术B:云计算(正确答案)C:虚拟现实技术D:物联网技术35.云计算是对( )技术的发展与运用.[单选题] *A:并行计算B:网格计算C:分布式计算D:三个选项都是(正确答案)36.云计算通过共享( )的方法将巨大的系统池连接在一起.[单选题] *A:CPUB:软件C:基础资源(正确答案)D:处理能力37.云计算中,提供资源的网络被称为( ).[单选题] *A:母体B:导线C:数据池D:云(正确答案)38.通过分布处理和并行处理的方式,将计算资源放置在网络中,供多个终端设备共同来分享使用的技术是( ).[单选题] *A:多媒体技术B:云安全技术C:物联网技术D:云计算技术(正确答案)39.下列关于云计算技术的叙述,错误的是( ).[单选题] *A:可以轻松实现不同设备间的数据和应用共享B:云计算是一种分布式计算C:提供了较为可靠安全的数据存储中心D:对用户端的设备要求较高(正确答案)40.移动云计算是云计算技术在移动网络中的应用,下列不是移动云计算优势的是( ).[单选题] *A:便捷的数据存取B:降低管理成本C:限制资源的访问(正确答案)D:突破终端硬件限制41.云计算将存在于互联网上的( )集群上的硬件资源和软件资源池连接在一起,以服务的方式提供计算资源,形成了一种动态可伸缩、虚拟化的新型计算资源组织、分配和使用模式.[单选题] *A:存储器B:网络设备C:服务器(正确答案)D:无线设备42.云计算的特点有通用性、按需服务、成本低廉、超大规模及( ).[单选题] *A:基于互联网B:高可扩展性(正确答案)C:计算速度快D:存储速度快43.一般认为云计算不包括以下( )层次的服务.[单选题] *A:基础设施即服务(IaaS)B:平台即服务(PaaS)C:软件即服务(SaaS)D:硬件即服务(HaaS)(正确答案)44."云"使用了数据多副本容错、计算节点同构可互换等措施来保障服务的( ),使用云计算比使用本地计算机更加可靠.[单选题] *A:高可靠性(正确答案)B:通用性C:超大规模D:虚拟性45.云计算技术在( )中的应用,体现在搜索引擎、网络信箱、Google的Applications 等.[单选题] *A:虚拟现实B:嵌入式技术C:网络服务(正确答案)D:通信技术46.按照云计算服务类型进行划分,以下不是其分类的是( ).[单选题] *A:基础设施即服务(IaaS)B:平台即服务(PaaS)C:软件即服务(SaaS)D:网络服务(正确答案)47.云计算是一种基于互联网的计算方式,以下不属于云计算特征的是( ).[单选题] * A:多人共享资源池B:随需应变自助服务C:借助自然界的云为载体的计算(正确答案)D:基于虚拟化技术获得服务48.云计算通常通过( )来提供动态易扩展且经常是虚拟化的资源.[单选题] *A:局域网B:互联网(正确答案)C:服务器D:软件49.大数据与云计算的关系( ).[单选题] *A:密不可分(正确答案)B:毫无关系C:不一定D:以上都不对50.云计算服务除了提供计算服务外,还必然提供了( )服务.[单选题] *A:存储(正确答案)B:分布C:打包D:运算。

云计算与大数据技术课后习题

第一章云计算与大数据基础1.在信息产业的发展历程中。

硬件驱动力，网络驱动力，作为两个重要的内在动力在不同的时期起着重要的作用6．MapReduce思想来源LISP语言7。

按照资源封装层次，云计算分为 Iaas paas saas三种8。

教材P2 1。

1.210。

教材P8 1。

2。

211. 教材P10 1.2.3第二章云计算与大数据相关技术1。

一致性hash算法原理:哈希算法是一种从稀疏值到紧密值范围的映射方法，在存储和计算定位时可以被看做是一种路由算法。

通过这种路与哦算法文件块能被唯一的定位到一个节点的位置.传统的hash算法容错性和扩展性都不好，无法有效的适应面向数据系统节点的动态变化。

意思就是当集群需要增加节点，传统的hash算法不容易检测到新增加的节点,此为扩展性不好，而一致性hash算法增加一个节点只会影响增加的这个节点到前一个节点之间的数据.容错性就是如果不幸一个机器C宕机了，那么机器B和C之间的数据都会被D执行，那么受影响的数据只是机器B和C之间的数据。

当然,容错性和扩展性对于节点数较多的集群是比较有意义的，对于节点较少的集群似乎这两个特性并没有什么诱惑力。

一致性hash的实际目的就是解决节点频繁变化时的任务分配问题,一致性hash将整个hash值空间组织成一个虚拟圆环，我们这里假设某hash函数H值空间为0~（2^32—1），即32位无符号整形。

下面简述一下一致性hash的原理：这是一致性hash的整个值空间0～（2^32-1）下一步将各个服务器使用Hash进行一个哈希，具体可以选择服务器的ip或主机名作为关键字进行哈希,这样每台机器就能确定其在哈希环上的位置，假设使用四台机器进行hash：将数据key使用相同的函数Hash计算出哈希值，并确定此数据在环上的位置，从此位置沿环顺时针“行走”，第一台遇到的服务器就是其应该定位到的服务器。

例如我们有Object A、Object B、Object C、Object D四个数据对象,经过哈希计算后，在环空间上的位置如下：根据一致性哈希算法，数据A会被定为到Node A上，B被定为到Node B上，C被定为到Node C上，D被定为到Node D上下面我们看看当集群机器比较少的情况例如系统中只有两台服务器，其环分布如下，此时必然造成大量数据集中到Node A上，而只有极少量会定位到Node B上。

云计算与大数据技术考试选择题 55题

1. 云计算的核心特征不包括以下哪一项？A. 按需自助服务B. 广泛的网络访问C. 资源共享D. 固定带宽分配2. 以下哪个不是云计算的服务模型？A. IaaSB. PaaSC. SaaSD. MaaS3. 大数据的4V特征不包括以下哪一项？A. 大量（Volume）B. 高速（Velocity）C. 多样（Variety）D. 价值（Value）4. Hadoop生态系统中，用于数据仓库的是哪个组件？A. HBaseB. HiveC. PigD. Spark5. 以下哪个是NoSQL数据库的例子？A. MySQLB. PostgreSQLC. MongoDBD. Oracle6. 在云计算中，IaaS代表什么？A. Infrastructure as a ServiceB. Internet as a ServiceC. Information as a ServiceD. Integration as a Service7. 大数据处理框架Apache Spark的核心抽象是什么？A. DataFrameB. RDDC. DatasetD. GraphFrame8. 以下哪个技术不是用于大数据存储的？A. HDFSB. S3C. RAIDD. Cassandra9. 云计算中的“云”通常指的是什么？A. 互联网B. 数据中心C. 虚拟化技术D. 网络存储10. 以下哪个是云计算的部署模型？A. 公共云B. 私有云C. 混合云D. 以上都是11. Hadoop中的MapReduce主要用于什么？A. 数据存储B. 数据处理C. 数据查询D. 数据分析12. 以下哪个不是大数据分析的步骤？A. 数据收集B. 数据清洗C. 数据存储D. 数据加密13. 在云计算中，PaaS代表什么？A. Platform as a ServiceB. Programming as a ServiceC. Process as a ServiceD. Protocol as a Service14. 以下哪个是Apache Hadoop的核心组件？A. HBaseB. HiveC. HDFSD. Zookeeper15. 大数据技术中，用于实时数据处理的技术是？A. MapReduceB. Spark StreamingC. HiveD. Pig16. 云计算中的SaaS代表什么？A. Software as a ServiceB. System as a ServiceC. Service as a ServiceD. Server as a Service17. 以下哪个是大数据的可视化工具？A. TableauB. MySQLC. HadoopD. Spark18. 在Hadoop中，哪个组件负责管理集群中的资源？A. HDFSB. YARNC. MapReduceD. Hive19. 以下哪个是云计算的安全问题？A. 数据泄露B. 带宽不足C. 存储空间不足D. 计算能力不足20. 大数据技术中，用于数据挖掘的算法不包括以下哪个？A. 决策树B. 神经网络C. 线性回归D. 动态规划21. 在云计算中，哪个服务模型提供完整的应用程序？A. IaaSB. PaaSC. SaaSD. MaaS22. 以下哪个是大数据的存储技术？A. HDFSB. RAIDC. S3D. 以上都是23. 在Hadoop中，哪个组件用于实时查询和分析？A. HBaseB. HiveC. PigD. Spark24. 云计算中的虚拟化技术主要用于什么？A. 提高安全性B. 提高可靠性C. 提高资源利用率D. 提高数据传输速度25. 以下哪个是大数据的分析工具？A. RB. PythonC. SQLD. 以上都是26. 在云计算中，哪个部署模型是企业自己拥有和管理的？A. 公共云B. 私有云C. 混合云D. 社区云27. 以下哪个是大数据的处理框架？A. HadoopB. SparkC. FlinkD. 以上都是28. 在Hadoop中，哪个组件用于数据仓库？A. HBaseB. HiveC. PigD. Spark29. 云计算中的资源池化主要用于什么？A. 提高安全性B. 提高可靠性C. 提高资源利用率D. 提高数据传输速度30. 以下哪个是大数据的存储系统？A. HDFSB. S3C. CassandraD. 以上都是31. 在云计算中，哪个服务模型提供开发平台？A. IaaSB. PaaSC. SaaSD. MaaS32. 以下哪个是大数据的可视化工具？A. TableauB. MySQLC. HadoopD. Spark33. 在Hadoop中，哪个组件负责管理集群中的资源？A. HDFSB. YARNC. MapReduceD. Hive34. 以下哪个是云计算的安全问题？A. 数据泄露B. 带宽不足C. 存储空间不足D. 计算能力不足35. 大数据技术中，用于数据挖掘的算法不包括以下哪个？A. 决策树B. 神经网络C. 线性回归D. 动态规划36. 在云计算中，哪个服务模型提供完整的应用程序？A. IaaSB. PaaSC. SaaSD. MaaS37. 以下哪个是大数据的存储技术？A. HDFSB. RAIDC. S3D. 以上都是38. 在Hadoop中，哪个组件用于实时查询和分析？A. HBaseB. HiveC. PigD. Spark39. 云计算中的虚拟化技术主要用于什么？A. 提高安全性B. 提高可靠性C. 提高资源利用率D. 提高数据传输速度40. 以下哪个是大数据的分析工具？A. RB. PythonC. SQLD. 以上都是41. 在云计算中，哪个部署模型是企业自己拥有和管理的？A. 公共云B. 私有云C. 混合云D. 社区云42. 以下哪个是大数据的处理框架？A. HadoopB. SparkC. FlinkD. 以上都是43. 在Hadoop中，哪个组件用于数据仓库？A. HBaseB. HiveC. PigD. Spark44. 云计算中的资源池化主要用于什么？A. 提高安全性B. 提高可靠性C. 提高资源利用率D. 提高数据传输速度45. 以下哪个是大数据的存储系统？A. HDFSB. S3C. CassandraD. 以上都是46. 在云计算中，哪个服务模型提供开发平台？A. IaaSB. PaaSC. SaaSD. MaaS47. 以下哪个是大数据的可视化工具？A. TableauB. MySQLC. HadoopD. Spark48. 在Hadoop中，哪个组件负责管理集群中的资源？A. HDFSB. YARNC. MapReduceD. Hive49. 以下哪个是云计算的安全问题？A. 数据泄露B. 带宽不足C. 存储空间不足D. 计算能力不足50. 大数据技术中，用于数据挖掘的算法不包括以下哪个？A. 决策树B. 神经网络C. 线性回归D. 动态规划51. 在云计算中，哪个服务模型提供完整的应用程序？A. IaaSB. PaaSC. SaaSD. MaaS52. 以下哪个是大数据的存储技术？A. HDFSB. RAIDC. S3D. 以上都是53. 在Hadoop中，哪个组件用于实时查询和分析？A. HBaseB. HiveC. PigD. Spark54. 云计算中的虚拟化技术主要用于什么？A. 提高安全性B. 提高可靠性C. 提高资源利用率D. 提高数据传输速度55. 以下哪个是大数据的分析工具？A. RB. PythonC. SQLD. 以上都是答案部分1. D2. D3. D4. B5. C6. A7. B8. C9. A10. D11. B12. D13. A14. C15. B16. A17. A18. B19. A20. D21. C22. D23. A24. C25. D26. B27. D28. B29. C30. D31. B32. A33. B34. A35. D36. C37. D38. A39. C40. D41. B42. D43. B44. C45. D46. B47. A48. B49. A50. D51. C52. D53. A54. C55. D。

云计算与大数据技术-课后习题答案docx (7)[1页]

7.5 习题答案
1．使用Hadoop通过浏览器监控其服务运行情况使用什么ip地址和端口？
答：假设Hadoop集群的master机器配置使用了192.168.1.21，则访问http://192.168.1.21:50070或打开http://127.0.0.1:50070均可访问到Hadoop运行状况。

2．Nagios的工作原理是什么？
答：Nagios的功能是监控服务和主机，但是他自身并不包括这部分功能，所有的监控、检测功能都是通过各种插件来完成的。

启动Nagios后，它会周期性的自动调用插件去检测服务器状态。

3．Nagios安装的前提条件是什么？
答：Nagios的官方文档中只要求安装时系统必须是Linux或者其它Nagios支持的系统即可。

为了可以用直观的界面来查看监控信息，就需要安装apache（即http服务），所以安装apache应该算是一个前提条件。

4．ganglia的工作原理是什么？
答：ganglia是一款为高性能计算集群设计的可扩展性的分布式监控系统，它可以监视和显示集群中节点的各种状态信息。

Ganglia包括gmetad、gmond和gweb这三大组件。

它由运行在各个节点上的gmond守护进程来采集CPU、内存、磁盘利用率、I/O负载、网络流量情况等方面的数据，然后汇总到gmetad守护进程下，使用rrdtool存储数据。

最后将历史数据用gweb以图形、图表等方式通过PHP页面呈现。

数据库与数据挖掘_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

数据库与数据挖掘_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.在通常情况下，下面的关系中不可以作为关系数据库的关系的是（）参考答案:R4（学号，姓名，简历）2.以下是大数据存储面临的挑战（）参考答案:应用问题_管理问题_系统问题3.数据挖掘常用的算法有（）参考答案:特征分析_分类_聚类_决策树归纳4.分布式系统可以同时满足CAP原则参考答案:错误5.大数据的特征包括（）参考答案:容量大_速度快_多样性_价值高6.以下不是Spark 四大组件的有（）参考答案:Spark R_pyspark7.关于L1和L2正则化，下面说法对的是 ( )参考答案:L2正则化标识各个参数的平方的和的开方值_L1范数会值得权值稀疏8.小明参加某公司的大数据竞赛，他的成绩在大赛排行榜上原本居于前二十，后来他保持特征不变，对原来的模型做了1天的调参，将自己的模型在自己本地测试集上的准确率提升了5%，然后他信心满满地将新模型的预测结果更新到了大赛官网上，结果懊恼地发现自己的新模型在大赛官方的测试集上准确率反而下降了。

（）参考答案:可能发生过拟合了_应该利用交叉验证判断是否过拟合9.以下哪些算法是推荐系统常用算法（）参考答案:内容过滤_协同过滤10.以下哪些算法是文本处理中常用模型（）参考答案:tf-idf_word2vec_词向量11.下面算法中能够使用核函数的算法是（）参考答案:K-means_SVM12.下面关于贝叶斯分类器的描述哪些是对的？ ( )参考答案:对缺失数据不敏感_假设属性之间相互独立13.评价警察抓小偷，描述警察抓的人中有多少个是小偷的标准( )参考答案:Precesion14.数据预处理指在主要的处理后对数据进行处理（）参考答案:错误15.只要有数据，就必然存在安全与隐私的问题（）参考答案:正确16.Hadoop 核心模块包括HDFS, MapReduce, Spark （）参考答案:错误17.数据挖掘的步骤是数据采集，数据转换，建立模型，分析评估（）参考答案:正确18.假定用于分析的数据包含属性age。

南京邮电大学云计算与大数据课后作业节选(附题干)

1、在信息产业的发展历程中，计算和数据作为两个重要的内在动力在不同时期起着重要作用。

5、吉姆•格雷（Jim Gray提出了第四范式，被誉为“大数据之父”。

6 Map Reduce的思想来源是Lisp编程语言。

7、按照资源封装层次，云计算可分为基础设施既服务、平台既服务、软件既服务三种类型。

8、与传统的资源提供方式相比，与计算具有什么特点？云计算技术是资源与用户需求之间是一种弹性化的关系，资源的实用这之需对资源的使用按需付费，从而敏捷地响应客户不断变化的需求，从而降低了资源使用者的成本，提高了走远利用的效率。

10、简述主要的大数据的处理系统。

（1）数据查询分析计算系统：对大规模莫数据进行事时或准时查询（2）批处理系统：典型代表有MapReduce计算模式的Hadoop与Spark（3）流式计算系统：具有很强的实时系统，需要对应用源源不断产生的数据实时进行处理，使数据不积压、不丢失，常用于处理电信、电力等行业应用与互联网恒业的访问日志等。

（4）迭代计算系统：iMapReduce Twister、Spark、Hadoop 等。

（5）图计算系统：图数据需要专门的系统进行存储和计算。

常用的计算系统有：Giraph、Prege、Trinity、GraphX等（6）内存计算系统：Dremel、HANA、Spark等11、简述大数据处理的基本流程。

（1）数据抽取与集成：从数据中取出关系与实体，经过关联和聚合等操作，按照统一的格式进行存储。

（2）数据分析：是大数据处理流程的核心步骤，通过数据抽取和集成环节获得原始数据后用户可以根据自己的需求对这些数据进行分析处理。

（3）数据解释：可视化和人机交互是书记解释的主要技术。

第二章1、简述一致性哈希算法的基本原理。

一致性哈希算法的设计目标是解决节点频发变化时的任务分配问题。

一致性哈希算法将整个哈希空间组织成一个哈希环。

比如将ip 作为关键字哈希，确定每个结点在哈希环上的位置，将key用函数映射到哈希空间上的某个值，沿该值向后，将遇到的第一个节点作为处理节点。

《分布式计算、云计算与大数据》习题参考解答

《分布式计算、云计算与大数据》习题解答参考第1章分布式计算概述一、选择题1，CD 2，ABC 3，ABCD 4，ACD二、简答题1，参考1.1.1和1.1.2节2，参考1.1.2节3，分布式计算的核心技术是进程间通信，参考1.3.2节4，单播和组播5，超时和多线程三、实验题1.进程A在进程B发送receive前发起send操作进程A进程B发出非阻塞send操作，进程A继续运行发出阻塞receive操作，进程B被阻塞进程B在进程A发起send前发出receive操作精选文库进程A 进程B发出非阻塞send 操作，进程A 继续运行发出阻塞receive 操作，进程B被阻塞收到进程A 发送的数据，进程B 被唤醒2. 进程A 在进程B 发送receive 前发起send 操作进程A 进程B发出阻塞send 操作，进程A 被阻塞发出阻塞receive 操作，进程B 被阻塞进程B 在进程A 发起send 前发出receive 操作精选文库进程A进程B发出阻塞send操作，进程A被阻塞发出阻塞receive操作，进程B被阻塞收到进程A发送的数据，进程B被唤醒收到进程B返回的数据，进程A被唤醒3.1).在提供阻塞send操作和阻塞receive操作的通信系统中receiveoperationsendoperationt=1在提供非阻塞send操作和阻塞receive操作的通信系统中t=1receiveoperationsendoperation2)．P1，P2，P3进程间通信的顺序状态图m1m1m2m2第2章分布式计算范型概述1.消息传递，客户-服务器，P2P，分布式对象，网络服务，移动代理等2.分布式应用最广泛最流行的范型是客户-服务器范型，参考2.2节3.分布式应用最基本的范型是消息传递模型，参考2.1节4.参考2.3节，P2P应用有很多，例如Napster，迅雷，PPS网络电视等5.参考2.4节6.参考2.7节7.略8.消息传递模式是最基本的分布式计算范型，适用于大多数应用；客户-服务器范型是最流行的分布式计算范型，应用最为广泛；P2P范型又称为对等结构范型，使得网络以最有效率的方式运行，适用于各参与者地位平等的网络；分布式对象范型，是抽象化的远程调用，适用于复杂的分布式计算应用等。

数据结构_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

数据结构_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.向最大堆84,49,82,26,29,46依次插入元素94,99,89,80,94，最终得到的最大堆是____________（提示：堆的元素插入操作需调用AdjustUp方法，请将答案表示成元素序列，并用半角逗号相隔，答案中不要有空格）。

参考答案:99,94,84,89,94,46,82,26,49,29,802.设有5×8的数组A，其每个元素占2个字节，已知A[0][4]在内存中的地址是120，按列优先顺序存储，A[2][6]的地址是_________ 。

参考答案:1443.以下选项_____是下图的深度优先遍历序列。

【图片】参考答案:K,D,A,B,E,C,F,G,J,H,I4.对最大堆序列95,61,66,9,19,27执行1次删除操作（提示：对优先级队列执行删除操作默认删除堆顶元素）后得到最大堆序列_____________（提示：堆元素删除操作需调用AdjustDown方法，请将答案表示成元素序列，并用半角逗号相隔，答案中不要有空格）。

参考答案:66,61,27,9,195.求该方法的渐近时间复杂度为__________.(注意填写答案时不要有空格，用x^y的方式表达x的y次方)void aFunc(int n) { for (int i = 0; i < n; i++) { for (int j = i; j < n; j++) { printf("Hello World\n"); } }}O(n^2)6.已知图的边集合:【图片】若采用邻接表存储，则顶点4对应的边结点链表中共有_________个边结点。

参考答案:27.用克鲁斯卡尔算法构造下图的最小代价生成树，第一条被加入生成树上的边一定是(E,C)。

【图片】参考答案:正确8.假设一棵含有18个结点的完全二叉树中，按层次从上到下、每层结点从左到右的顺序，从0开始编号，则编号为14的结点的左孩子编号为_______（如果孩子不存在，则填写NULL）。

云计算与大数据_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

云计算与大数据_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.1、下列关于云计算的说法错误的是（）。

答案:主要基于非虚拟化资源池2.以下不属于目前典型云计算服务模型的是（）。

答案:系统即服务3.IaaS服务模型主要提供的资源不包含（）。

答案:应用程序4.以下说法错误的是（）。

答案:数据中心地点只能固定5.区块链的（）提供区块链网络中各个节点达成一致的方法。

答案:共识层6.同一台物理主机上一个虚拟机的崩溃或故障不会影响其他虚拟机，这主要得益于虚拟化技术的（）特征。

答案:隔离7.Linux KVM中内存虚拟化技术不包括（）。

答案:vMotion8.下列选项不属于典型虚拟化软件的是（）。

答案:Eureka9.与虚拟机相比，以下关于目前容器的叙述错误的是（）。

答案:容器的安全性比虚拟机强10.Docker可以回滚到当前镜像的前一个版本，可以避免因为完成部分组件的升级而导致对整个环境的破坏，这是Docker的（）功能。

答案:版本控制11.在GFS中，客户端可以并行访问多个（），提高了系统的整体性能。

答案:数据块服务器12.以下不属于集中式副本管理策略的优点的是（）。

答案:文件副本的数量快速增加13.以下关于分布式副本管理策略描述错误的是（）。

答案:随着文件副本的数量不断增加，其负载会急剧增加14.Paxos云存储系统中的主要角色不包括（）。

答案:执行者15.以下关于S3的数据存储结构描述错误的是（）。

答案:存储桶是S3中对数据进行排序的唯一方法16.Paxos算法用于解决分布式系统中的（）问题。

答案:数据一致性17.分布式监测架构的优点不包括（）。

答案:延时小18.以下关于分布式协同监测模型描述错误的是（）。

答案:数据节点彼此完全独立19.在分布式协同监测模型中，（）被用来接收被监测节点周期性报告自己心跳信息，表明自身活性。

答案:全局队列20.以下对Nagios描述错误的是（）。

答案:Nagios Core是Nagios的核心组件，包括核心监测引擎和Web界面，监测都是由该组件实现的21.用户合法获取云服务的第一道关卡是（）。

云计算与大数据技术题库1-7章节习题参考答案含原题

1.10 习题1．简述云计算的定义。

【参考答案】云计算的定义有多种说法，细查起来，出现几十种上百种说法也不稀奇，这里只介绍几种相对权威机构或组织给出的云计算定义的说法。

百度百科中描述：“云计算（Cloud Computing）是基于互联网的相关服务的增加、使用和交互模式，通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。

”从百度百科中析出美国国家标准与技术研究院（NIST）定义：“云计算是一种按使用量付费的模式，这种模式提供可用的、便捷的、按需的网络访问，进入可配置的计算资源共享池（资源包括网络，服务器，存储，应用软件，服务），这些资源能够被快速提供，只需投入很少的管理工作，或与服务供应商进行很少的交互。

”ISOIEC 17788在2014年的《INTERNATIONAL STANDARD》中表述云计算的术语解释为“云计算是一种支持网络访问的，将可伸缩、弹性、可共享的物理和虚拟资源池以按需自服务的方式供应和管理”。

在维基百科（）中，截止到2010年7月，“云计算”的词条被表述为是一种基于互联网的计算，在其中共享的资源、软件和信息以一种按需的方式提供给计算机和设备，就如同日常生活中的电网一样。

2．试述云计算的能力类型。

【参考答案】云能力类型是根据资源的使用情况，对为云服务客户提供的云服务的功能进行的分类。

有三类不同的云能力类型：应用能力类型、基础设施能力类型和平台能力类型。

⏹应用能力类型。

云服务客户能使用云服务提供者的应用的一类云能力类型。

⏹基础设施能力类型。

云服务客户能配置和使用计算、存储和网络资源的一类云能力类型。

⏹平台能力类型。

云服务客户能使用云服务提供者支持的编程语言和执行环境，部署、管理和运行客户创建或客户获取的应用的一类云能力类型。

3．试述云计算的服务类型。

【参考答案】云服务类别是拥有相同质量集的一组云服务。

一种云服务类别可对应一种或多种云能力类型。

参考自《云计算标准化白皮书》中描述，典型的云服务类别包括：⏹通讯即服务（CaaS）。

课后作业答案云计算与大数据

第一章1.硬件驱动力网络驱动力2.西摩·克雷(Seymour Cray)·麦卡锡·博纳斯·李·格雷平台即服务软件即服务8.(1) 超大规模“云”具有相当的规模，Google云计算已经拥有100多万台服务器， Amazon、IBM、微软、Yahoo等的“云”均拥有几十万台服务器。

企业私有云一般拥有数百上千台服务器。

“云”能赋予用户前所未有的计算能力。

(2) 虚拟化云计算支持用户在任意位置、使用各种终端获取应用服务。

所请求的资源来自“云”，而不是固定的有形的实体。

应用在“云”中某处运行，但实际上用户无需了解、也不用担忧应用运行的具体位置。

只需要一台笔记本或者一个，就可以通过网络服务来实现我们需要的一切，甚至包括超级计算这样的任务。

(3) 高可靠性“云”使用了数据多副本容错、计算节点同构可互换等措施来保障服务的高可靠性，使用云计算比使用本地电脑可靠。

(4) 通用性云计算不针对特定的应用，在“云”的支撑下可以构造出千变万化的应用，同一个“云”可以同时支撑不同的应用运行。

(5) 高可扩展性“云”的规模可以动态伸缩，满足应用和用户规模增长的需要。

(6) 按需服务“云”是一个庞大的资源池，你按需购买；云可以像自来水，电，煤气那样计费。

(7) 极其廉价由于“云”的特殊容错措施可以采用极其廉价的节点来构成云，“云”的自动化集中式管理使大量企业无需负担日益高昂的数据中心管理成本，“云”的通用性使资源的利用率较之传统系统大幅提升，因此用户可以充分享受“云”的低成本优势，经常只要花费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完成的任务。

云计算可以彻底改变人们未来的生活，但同时也要重视环境问题，这样才能真正为人类进步做奉献,而不是简单的技术提升。

(8) 潜在的危险性云计算服务除了提供计算服务外，还必然提供了存储服务。

但是云计算服务当前垄断在私人机构〔企业〕手中，而他们仅仅能够提供商业信用。

南京邮电大学云计算技术慕课答案

南京邮电大学云计算技术慕课答案1、问题:1.云计算是对（D）技术的发展与运用云计算是对（）技术的发展与运用。

选项：A:并行计算B:网格计算C:分布式计算D:三个选项都是答案:三个选项都是2、问题:从研究现状上看，下面不属于云计算特点的是（）。

选项：A:超大规模B:虚拟化C:私有化D:高可靠性答案:私有化3、问题:与网络计算相比，不属于云计算特征的是（）。

选项：A:资源高度共享B:适合紧耦合科学计算C:支持虚拟机D:适用于商业领域答案:适合紧耦合科学计算4、问题:亚马逊AWS提供的云计算服务类型是（）。

选项：A:IaaSB:PaaSC:SaaSD:三个选项都是答案:三个选项都是5、问题:将平台作为服务的云计算服务类型是选项：A:IaaSB:PaaSC:SaaSD:三个选项都不是答案:PaaS6、问题:微软于2008年10月推出云计算操作系统是（）。

选项：A:GoogleAppEngineB:蓝云C:AzureD:EC2答案:Azure7、问题:简单的理解为云计算等于资源的闲置而产生的。

选项：A:正确B:错误答案:正确8、问题:基于WEB服务同PaaS类似，服务提供者利用Web服务，通过Internet给软件开发者提供API应用接口，而不是整个应用程序。

选项：A:正确B:错误答案:正确第二单元云计算关键技术第二单元测验1、问题:以下服务器虚拟化技术中需要修改GuestOS内核的是选项：A:全虚拟化B:半虚拟化C:CPU虚拟化D:内存虚拟化答案:半虚拟化2、问题:虚拟机迁移过程中，迁移源主机在（）步骤中第一次迭代把所有内存内容都复制到目标主机中？选项：A:预迁移B:预复制C:停机复制D:启动答案:预复制3、问题:迁移存储设备的最大障碍在于需要占用大量时间和网络带宽，通常的解决办法是（），而非真正迁移。

选项：A:以共享的方式共享数据和文件系统B:增大网络带宽C:使用分布式存储架构D:使用外存储设备进行迁移答案:以共享的方式共享数据和文件系统4、问题:以下哪种存储技术使用标准TCP/IP网络协议加入网络？选项：A:文件服务器技术B:RAID磁盘阵列技术C:NAS(NetworkAttachedStorage)网络连接存储技术D:SAN(StorageAreaNetwork)存储区域网络技术答案:NAS(NetworkAttachedStorage)网络连接存储技术5、问题:关于虚拟化安全问题描述不正确的是选项：A:如果主机受到破坏，那么主机所管理的客户端服务器有可能被攻克。

云计算与大数据管理考试选择题 60题

1. 云计算的主要服务模型不包括以下哪一项？A. IaaSB. PaaSC. SaaSD. DaaS2. 以下哪个不是云计算的部署模型？A. 公有云B. 私有云C. 混合云D. 社区云3. 大数据的4V特征不包括以下哪一项？A. 大量B. 高速C. 多样D. 价值4. Hadoop生态系统中，用于数据存储的是哪个组件？A. HDFSB. MapReduceC. HiveD. Pig5. 以下哪个工具不是用于大数据分析的？A. RB. PythonC. ExcelD. Tableau6. 云计算中的“弹性计算”是指什么？A. 计算资源可以根据需求自动扩展或缩减B. 计算资源的价格弹性C. 计算资源的物理弹性D. 计算资源的网络弹性7. 以下哪个是NoSQL数据库的典型代表？A. MySQLB. OracleC. MongoDBD. PostgreSQL8. 大数据处理框架Spark的核心是什么？A. RDDB. DataFrameC. DatasetD. GraphX9. 云计算中的SLA（服务级别协议）主要涉及哪些方面？A. 服务可用性B. 性能C. 安全性D. 以上都是10. 以下哪个不是数据仓库的特点？A. 面向主题B. 集成C. 时变D. 事务性11. 在Hadoop中，哪个组件负责数据的处理？A. HDFSB. MapReduceC. YARND. Hive12. 以下哪个是大数据处理中的批处理技术？A. Spark StreamingB. KafkaC. MapReduceD. Storm13. 云计算中的虚拟化技术主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 提高存储容量D. 提高安全性14. 以下哪个是云计算中的网络服务？A. AWS EC2B. Azure Virtual NetworkC. Google Cloud StorageD. IBM Cloud Functions15. 大数据分析中的机器学习主要用于什么？A. 数据清洗B. 数据存储C. 数据挖掘D. 数据可视化16. 以下哪个是云计算中的存储服务？A. AWS S3B. Azure ComputeC. Google Cloud SQLD. IBM Cloud Kubernetes17. 大数据处理中的实时处理技术不包括以下哪一项？A. Spark StreamingB. FlinkC. StormD. MapReduce18. 云计算中的负载均衡主要用于什么？A. 提高单个服务器的性能B. 提高整个系统的性能C. 提高存储容量D. 提高安全性19. 以下哪个是云计算中的数据库服务？A. AWS RDSB. Azure Blob StorageC. Google Cloud Pub/SubD. IBM Cloud Object Storage20. 大数据处理中的数据湖（Data Lake）主要用于什么？A. 存储结构化数据B. 存储非结构化数据C. 存储半结构化数据D. 存储所有类型的数据21. 云计算中的容器技术主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 提高存储容量D. 提高应用的可移植性22. 以下哪个是云计算中的计算服务？A. AWS LambdaB. Azure StorageC. Google Cloud DatastoreD. IBM Cloudant23. 大数据处理中的数据挖掘主要用于什么？A. 数据清洗B. 数据存储C. 发现数据中的模式和关联D. 数据可视化24. 云计算中的安全服务不包括以下哪一项？A. 身份认证B. 访问控制C. 数据加密D. 数据压缩25. 以下哪个是云计算中的网络服务？A. AWS VPCB. Azure FunctionsC. Google Cloud DataprocD. IBM Cloud IAM26. 大数据处理中的数据清洗主要用于什么？A. 去除数据中的错误和不一致B. 增加数据存储容量C. 提高数据处理速度D. 提高数据可视化效果27. 云计算中的自动化部署主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 提高应用的部署效率D. 提高存储容量28. 以下哪个是云计算中的存储服务？A. AWS GlacierB. Azure ComputeC. Google Cloud SQLD. IBM Cloud Kubernetes29. 大数据处理中的数据集成主要用于什么？A. 将不同来源的数据整合在一起B. 提高数据存储容量C. 提高数据处理速度D. 提高数据可视化效果30. 云计算中的监控服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 监控系统性能D. 提高存储容量31. 以下哪个是云计算中的数据库服务？A. AWS DynamoDBB. Azure Blob StorageC. Google Cloud Pub/SubD. IBM Cloud Object Storage32. 大数据处理中的数据可视化主要用于什么？A. 数据清洗B. 数据存储C. 数据挖掘D. 将数据以图形方式展示33. 云计算中的备份服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 保护数据免受丢失D. 提高存储容量34. 以下哪个是云计算中的计算服务？A. AWS EC2B. Azure StorageC. Google Cloud DatastoreD. IBM Cloudant35. 大数据处理中的数据分析主要用于什么？A. 数据清洗B. 数据存储C. 发现数据中的模式和关联D. 数据可视化36. 云计算中的灾难恢复服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 保护数据免受灾难影响D. 提高存储容量37. 以下哪个是云计算中的网络服务？A. AWS Direct ConnectB. Azure FunctionsC. Google Cloud DataprocD. IBM Cloud IAM38. 大数据处理中的数据治理主要用于什么？A. 确保数据的质量和一致性B. 增加数据存储容量C. 提高数据处理速度D. 提高数据可视化效果39. 云计算中的弹性伸缩主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 根据需求自动调整资源D. 提高存储容量40. 以下哪个是云计算中的存储服务？A. AWS EBSB. Azure ComputeC. Google Cloud SQLD. IBM Cloud Kubernetes41. 大数据处理中的数据建模主要用于什么？A. 数据清洗B. 数据存储C. 设计数据结构D. 数据可视化42. 云计算中的安全审计服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 监控和记录安全事件D. 提高存储容量43. 以下哪个是云计算中的数据库服务？A. AWS RedshiftB. Azure Blob StorageC. Google Cloud Pub/SubD. IBM Cloud Object Storage44. 大数据处理中的数据仓库主要用于什么？A. 存储结构化数据B. 存储非结构化数据C. 存储半结构化数据D. 存储所有类型的数据45. 云计算中的容器编排服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 管理容器化应用D. 提高存储容量46. 以下哪个是云计算中的计算服务？A. AWS Elastic BeanstalkB. Azure StorageC. Google Cloud DatastoreD. IBM Cloudant47. 大数据处理中的数据湖（Data Lake）与数据仓库的主要区别是什么？A. 数据湖存储所有类型的数据，数据仓库主要存储结构化数据B. 数据湖主要用于实时处理，数据仓库用于批处理C. 数据湖是开源的，数据仓库是商业的D. 数据湖是分布式的，数据仓库是集中式的48. 云计算中的多租户架构主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 允许多个用户共享资源D. 提高存储容量49. 以下哪个是云计算中的网络服务？A. AWS CloudFrontB. Azure FunctionsC. Google Cloud DataprocD. IBM Cloud IAM50. 大数据处理中的数据标签化主要用于什么？A. 数据清洗B. 数据存储C. 为数据添加元数据D. 数据可视化51. 云计算中的自动化测试服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 提高软件测试效率D. 提高存储容量52. 以下哪个是云计算中的存储服务？A. AWS S3 Glacier Deep ArchiveB. Azure ComputeC. Google Cloud SQLD. IBM Cloud Kubernetes53. 大数据处理中的数据共享主要用于什么？A. 数据清洗B. 数据存储C. 允许不同用户访问数据D. 数据可视化54. 云计算中的安全合规服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 确保服务符合法规要求D. 提高存储容量55. 以下哪个是云计算中的数据库服务？A. AWS ElastiCacheB. Azure Blob StorageC. Google Cloud Pub/SubD. IBM Cloud Object Storage56. 大数据处理中的数据脱敏主要用于什么？A. 数据清洗B. 数据存储C. 保护敏感数据D. 数据可视化57. 云计算中的自动化运维服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 提高系统运维效率D. 提高存储容量58. 以下哪个是云计算中的计算服务？A. AWS FargateB. Azure StorageC. Google Cloud DatastoreD. IBM Cloudant59. 大数据处理中的数据归档主要用于什么？A. 数据清洗B. 数据存储C. 长期保存不经常访问的数据D. 数据可视化60. 云计算中的安全监控服务主要用于什么？A. 提高硬件利用率B. 提高网络速度C. 实时监控安全事件D. 提高存储容量答案：1. D2. D3. D4. A5. C6. A7. C8. A9. D11. B12. C13. A14. B15. C16. A17. D18. B19. A20. D21. D22. A23. C24. D25. A26. A27. C28. A29. A30. C31. A32. D33. C34. A35. C36. C37. A38. A39. C40. A41. C42. C43. A44. A45. C46. A47. A48. C49. A50. C51. C52. A53. C54. C55. A56. C57. C58. A60. C。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1、在信息产业的发展历程中，计算和数据作为两个重要的内在动力在不同时期起着重要作用。

5、吉姆·格雷（Jim Gray）提出了第四范式，被誉为“大数据之父”。

6、MapReduce的思想来源是Lisp编程语言。

7、按照资源封装层次，云计算可分为基础设施既服务、平台既服务、软件既服务三种类型。

8、与传统的资源提供方式相比，与计算具有什么特点？
云计算技术是资源与用户需求之间是一种弹性化的关系，资源的实用这之需对资源的使用按需付费，从而敏捷地响应客户不断变化的需求，从而降低了资源使用者的成本，提高了走远利用的效率。

10、简述主要的大数据的处理系统。

（1）数据查询分析计算系统：对大规模莫数据进行事时或准时查询
（2）批处理系统：典型代表有MapReduce计算模式的Hadoop与Spark
（3）流式计算系统：具有很强的实时系统，需要对应用源源不断产生的数据实时进行处理，使数据不积压、不丢失，常用于处理电信、电力等行业应用与互联网恒业的访问日志等。

（4）迭代计算系统：iMapReduce、Twister、Spark、Hadoop等。

（5）图计算系统：图数据需要专门的系统进行存储和计算。

常用的计算系统有：Giraph、Pregel、Trinity、GraphX等
（6）内存计算系统：Dremel、HANA、Spark等
11、简述大数据处理的基本流程。

（1）数据抽取与集成：从数据中取出关系与实体，经过关联和聚合等操作，按照统一的格式进行存储。

（2）数据分析：是大数据处理流程的核心步骤，通过数据抽取和集成环节获得原始数据后用户可以根据自己的需求对这些数据进行分析处理。

（3）数据解释：可视化和人机交互是书记解释的主要技术。

第二章
1、简述一致性哈希算法的基本原理。

一致性哈希算法的设计目标是解决节点频发变化时的任务分配问题。

一致性哈希算法将整个哈希空间组织成一个哈希环。

比如将ip作为关键字哈希，确定每个结点在哈希环上的位置，将key用函数映射到哈希空间上的某个值，沿该值向后，将遇到的第一个节点作为处理节点。

节点数不多时可以引入虚拟节点解决负载不均衡的问题。

Key值在哈希环中找到大于它的最小节点作为路由值。

2、科学研究的四个范式是经验、理论、实验、海量数据。

3、物联网的产业链可以分为标识、感知、处理和信息传递4个环节。

4、非关系型数据库可以分为Column-Oriented、Key-Value、Document-Value。

第三章
2、虚拟化技术从计算体系层次结构上可以分为以下5种类型：指令集架构级虚拟化、硬件抽象层虚拟化、操作系统层虚拟化、编程语言层上的虚拟化、库函数层的虚拟化。

4、系统虚拟化具有硬件无关性、隔离性、多实例、特权功能等优点。

5、系统虚拟化可分为一虚多、多虚一、多虚多。

6、服务器虚拟化按照其虚拟化部件可分为CPU虚拟化、内存虚拟化、I/O虚拟
7、什么是广义虚拟化技术？
逻辑简化技术，实现物理层想逻辑层的变化。

8、虚拟化技术有哪些优势与劣势？
优势：提高资源利用率；提供相互隔离的、高效的运行环境；简化资源和资源管理；实现软件和硬件的分离。

劣势：肯呢个回事物理计算机负载过重；升级和维护的安全问题；物理计算机的影响。

第四章
3、传统的集群系统可以分为高可用性集群系统、负载均衡集群系统、高性能集群系统、虚拟化集群系统4类。

4、简述Beowulf系统的主要特点。

用廉价系统实现高性能的能力。

（1）由一个管理节点和多个计算节点构成。

（2）同城由最城建的硬件系统构成。

（3）通常采用廉价且广范传播的软件。

5、Lustre存储系统的组成有元数据服务器、元数据存储节点、对象存储服务器、对象存储节点、客户端。

6、简述面向对象的分布式系统、混合型分布试系统、面向数据的分布式系统的实现机制，分析三种系统的区别。

三种系统的实现机制分别为：计算拆分、数据拆分、数据拆分
区别：混合式系统具有面向计算和面向数据的特征以集中式的存储和数据想计算迁移的方式实现计算和数据位置的一致性。

面向数据的分布式系统往往有对应的文件系统支持，从文件存储实现数据块的划分。

计算和数据协作机制为核心问题。

面向计算的分布试系统具有灵活和功能强大的计算能力能完成大多数问题的计算任务，面向数据的分布试系统能较好地解决海量数据的自动分布式分布式处理问题。

第五章
1、什么是MPI？
MPI是一种消息传递编程模型并成为这种编程模型的代表和事实上的标准。

3、简述MPICH并行环境建立的主要步骤。

（1）配置NFS实现所有节点指定文件夹的共享。

（2）配置好节点间的互信，实现集群内部各节点间的无密码访问。

（3）编译安装配置MPICH。

第六章
2、简述GFS的工作过程。

（1）客户端使用固定大小的块将应用程序指定的文件名和字节偏移转换成文件的一个块索引，向master发送包含文件名和块索引的请求。

（2）Master收到客户端发来的请求后向服务器发出指示，同时时刻监控众多chunkserver的状态。

（3）Master通过和chunkserver的交互向客户端发送chunk-handle和副本位置。

期中文件被分成若干个块。

（4）客户端向其中一个副本发出请求，请求指定了chunk-handle和块内的一个字节区间。

（5）客户端从chunkserver获得数据。

3、简述HDFS的分块策略。

通常HDFS在存储一个文件会将文件切为64M大小的块来进行存储，数据块会被分别存储在不同的Datanode节点上同时数据块被分块存储后在数据读写时能实现对数据的并发读写。

4、简述搭建Hadoop开发环境的流程。

首先安装jdk,下载解压Hadoop，配置Hadoop环境变量，然后修改Hadoop配置文件。

第七章
1、简述HPCC的主要特点。

面向数据的高性能计算平台，平台基于键值进行索引，用来解决海量数据的处理与分析。

4、HPCC从总体物理上可以看作在同一个集群上部署了Thor、Roxie两套集群计算系统。

5、HPCC的系统服务包含ECL服务器、Dail服务器、Sasha服务器、DFU服务器、ESP服务器。

6、简述HPCC平台数据检索任务的执行过程。

（1）加载原始数据（2）切分、分发待处理的数据（3）分发后原始数据的ETL 处理（4）向Roxie集群发布。

第八章
1、Storm三进程包括Nimbus、Supervisor、Zookeeper。

2、在Storm中每实现一个任务，用户需要构造包含Spout、Bolt组件的拓扑。

第九章
1、数据中心的发展经历了巨型机时代、微型计算机/PC时代、互联网时代、云计算、大数据时代四个阶段。

2、数据中心的选址主要考虑地质环境、气候条件、电力供给、网络带宽等因素。

3、数据中心的主要组成部分有基础设施、硬件设施、基础软件、管理支撑软件。

4、PUE的定义为数据中心整体能耗/IT设备能耗。

5、DCIE的定义为IT设备能耗/数据中心整体能耗。

第十章
1、GirdSim和CloudSim的区别有哪些？
GirdSim没有将云计算体系中的SaaS、PaaS、LaaS层抽象出来也没有虚拟化模型和资源管理模型，CloudSim继承了前者的模型弥补了网格计算模拟软件的不足。

2、简述CloudSim仿真的主要步骤。

初始化CloudSim库，创建数据中心，创建代理Broker，创建虚拟机，创建云任务，启动仿真，在仿真结束后统计结果。

南京 邮电 大学 云计算与大数据 课后作业节选(附题干)

云计算习题参考答案

云计算与大数据技术-课后习题答案docx (6)[1页]

大学《云计算与大数据》试题及答案

《分布式计算、云计算与大大数据》习题参考解答

云计算与大数据技术应用习题

云计算技术_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

《分布式计算、云计算与大数据》习题参考解答

大数据与云计算综合练习含答案

云计算与大数据技术课后习题

云计算与大数据技术考试 选择题 55题

云计算与大数据技术-课后习题答案docx (7)[1页]

数据库与数据挖掘_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

南京邮电大学云计算与大数据课后作业节选(附题干)

《分布式计算、云计算与大数据》习题参考解答

数据结构_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

云计算与大数据_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

云计算与大数据技术题库1-7章节习题参考答案含原题

课后作业答案云计算与大数据

南京邮电大学云计算技术慕课答案

云计算与大数据管理考试 选择题 60题

南京邮电大学云计算与大数据课后作业节选(附题干)

云计算与大数据技术考试选择题 55题

云计算与大数据管理考试选择题 60题