云计算基础考题--精选.docx
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、选择题 30‘
云计算
Software as a Service Platform-as-a-Service Platform-as-a-Service
云计算的特点 : ○1通用○2高扩展○3按需服务○4极其廉价云计算的三大核心技术
GFS中的每一个文件被划分成多个 Chunk,Chunk的默认大小是 64MB,每个Chunk 又划分为若干 Block (64KB),每个 Block 对应一个 32bit 的校验码,保证
数据正确(若某个 Block 错误,则转移至其他 Chunk 副本)
二、名词解释 15’
1.企业信息化:企业信息化是指企业利用现代信息技术,通过对信息资源
的深化开发和广泛利用,不断提高企业生产、经营、管理、决策的效率和水平,
进而提高企业经济效益和企业市场竞争力的过程。
2.云计算 : 是一种商业计算模型。它将计算任务分布在大量计算机构成的资
源池上,使各种应用系统能够按需获取计算力、存储空间和信息服务。
:Apache 开源组织的一个分布式计算框架,可以在大量廉价的硬件设备组成的
集群上运行应用程序,为应用程序提供了一组稳定可靠的接口,旨在构建一个具
有高可靠性和良好扩展性的分布式系统
4.企业信息系统
PS:管理信息系统是一个以人为主导,利用计算机硬件、软件、网络通讯设
备以及其它办公设备,进行信息收集、传输、加工、存储、更新和维护,以提高
企业竞争力、提高效益和效率为目的,支持企业高层决策、中层控制、基层运作
的集成化的人机系统。
4、决策支持信息系统
DSS 是一种以计算机为工具,应用决策科学及有关学科的理论与方法,以人
机交互方式辅助决策者解决半结构化和非结构化决策问题的信息系统。
5.客户关系管理 : 通过信息技术使企业在营销、销售和服务业务范围内实现以客户为中心的管理理念的软件系统,其中涉及销售、市场营销、客户服务以及支持应用等软件
三、简答题 30‘
的三大关键技术,了解GFS的构成以及作用,实现机制。
三大关键技术: mapreduce,hbase,hdfs.
○1 实现机制:
客户端首先访问Master 节点,获取交互的Chunk Server 信息,然后访问这些Chunk Server ,完成数据存取工作。这种设计方法实现了控制流和数据流的分离。Client与Master之间只有控制流,而无数据流,极大地降低了Master 的负载。
Client与Chunk Server之间直接传输数据流,同时由于文件被分成多个Chunk 进行分布式存储, Client可以同时访问多个Chunk Server ,从而使得整个系统的 I/O 高度并行,系统整体性能得到提高。
○2 架构:
GFS将容错的任务交给文件系统完成,利用软件的方法解决系统可靠性问题,使
存储的成本成倍下降。 GFS将服务器故障视为正常现象,并采用多种方法,从多
个角度,使用不同的容错措施,确保数据存储的安全、保证提供不间断的数据存储服务
○重构成作用
Client (客户端):应用程序的访问接口
Master (主服务器):管理节点,在逻辑上只有一个,保存系统的元数据,负责
整个文件系统的管理
Chunk Server (数据块服务器):负责具体的存储工作。数据以文件的形式存储
在Chunk Server 上。
Ps: 技术
1.大规模集
2. 群安装技术
3. 故障检测技术
4. 节点动态加入技术
5. 节能技术
特点:采用中心服务器模式/ 不缓存数据 / 在用户态下实现/ 只提供专用接口
基本功能,任务要求,实现过程。
任务基本要求:
待处理的数据集可以分解成许多小的数据集,而且每一个小数据集都可以完
全并行地进行处理
实现过程:
(1)输入文件分成 M块,每块大概 16M~64MB(可以通过参数决定),接着在集群的机器上执行分派处理程序
(2)M个 Map任务和 R 个 Reduce任务需要分派, Master 选择空闲 Worker 来分配这些 Map或 Reduce任务
(3)Worker 读取并处理相关输入块,Map 函数产生的中间结果
(4)中间结果定时写到本地硬盘,分区函数将其分成R 个区。中间结果在本
地硬盘的位置信息将被发送回Master ,然后 Master 负责把这些位置信息传送给Reduce Worker
( 5)当 Master 通知执行 Reduce的 Worker 关于中间
它调用远程过程,从Map Worker 的本地硬盘上读取缓冲的中间数据。当Reduce Worker 读到所有的中间数据,它就使用中间key 进行排序,这样可使相同key 的值都在一起
( 6) Reduce Worker 根据每一个唯一中间key 来遍历所有的排序后的中间数据,
并且把 key 和相关的中间结果值集合传递给用户定义的Reduce函数。Reduce函
数的结果写到一个最终的输出文件
(7)当所有的 Map任务和 Reduce 任务都完成的时候, Master 激活用户程序。
此时 MapReduce返回用户程序的调用点
3、专家系统,三库,四库系统,概念,组成,(描述),每部分的作
用。
专家系统就应该是:应用于某一专门领域,拥有该领域相当数量的专家级知识,
能模拟专家的思维,能达到专家级水平,能像专家一样解决困难和复杂的实际
问题的计算机 ( 软件 ) 系统。
四、设计题 15‘
Hbase 的数据行中有几种类型,(列簇,时间戳,列名)
行关键字是数据行在表中唯一标识,时间戳是每次数据操作对应关联的时间戳,列定义为:
Hbase概念视图设计与物理视图设计转化。
物理模型实际上就是把概念模型中的一个行进行分割,并按照列族存储
五、案例分析 10’