分布式系统的管理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分布式系统论文
报告(论文)题目:分布式系统的管理
作者所在学院:信息工程学院
作者姓名:
作者学号:
分布式系统的管理
摘要
分布式系统作为网络上的重要软件系统之一,众多学者对它的研究从未停止。由于人们对分布式系统的高可靠性的需求,使得对分布式系统的管理的研究变得相对比较重要。本文详细讲解有关分布式系统管理的相关概念,内容等,希望能为分布式网络系统的使用带来便利。
关键词:分布式,管理,系统
Abstract
A distributed system as one of the important software system on the network, many scholars never stop researching it. Due to people demand for the high reliability of distributed system, it makes the study of distributed system management is relatively important. The article describe in detail the related concepts of distributed system management, content and so on. We hope that we can bring convenience for the use of the distributed network system.
Key words: distributed, management ,system
1.引言
分布式系统具有高度的内聚性和透明性,它与传统的网络有很大的不同,网络和分布式系统的区别主要在高层软件,更多的是操作系统,而不是硬件。分布式系统的基本特征主要有以下两方面:一个分布式系统是由一组网络连接的具有独立功能的计算机,在一套特殊软件的管理下,整个系统在用户面前呈现为一个透明的整体;一个分布式系统是一组位于网络计算机上的并发构件,这些构件之间的通信以及任务协调都只能通过信件传递进行,其目的是实现资源共享。由基本的分布式系统定义,我们可以知道,对分布式系统的管理是保证计算机通信可靠性的前提。本文将就分布式的系统管理进行相关的介绍,旨在加深人们对分布式系统管理的理解。
2.分布式系统管理的概念
首先,我们要了解什么是系统管理?从时间和空间两方面进行分析得出,系统管理是系统管理者在管理环境中,通过管理平台运行管理应用,从而控制系统正常运行的一系列活动。那么,究竟什么是分布式系统的管理呢?通过反复的研究,我们得出以下比较全面的概念:系统管理员通过网络各节点上独立的操作系统和全在系统集成的操作环境中,运行管理应用,对系统资源(用户,任务,硬件,软件,网络)进行分布式控制,从而保证系统正常运行,并能充分发挥分布
式系统优势(透明性,并发性)的一系列活动。
3.分布式系统管理的分类、内容及策略
首先,将管理分为用户管理,任务管理,软件管理,硬件管理,网络管理。主要内容及策略如下:
(1)用户管理:在分布式系统中,用户的概念从机器用户扩展到网络用户,他们可以在分布式系统的任意地方。这对用户管理提出了新的问题。在用户管理中,将遵循“帮助用户即是使用户自己帮助自己”的原则。因为在分布式系统中,用户的技术水平不同,使用的平台也各异,所以很难有一个统一的规范。根据这一原则,一些分布式系统采用了电子公告栏和新闻组的方法。
(2)任务管理:分布式系统中的任一个任务可以由多个子任务组成。这多个子任务分别在不同的地方并发执行。很多子任务都是在客户/服务器模式下由远程服务器来完成的。在任务管理中,最重要的是要有一个良好的进程管理和监控机制。当任务失败时,能自动恢复失败进程。
(3)软件管理:异构环境的分布式系统中有多种系统软件。应用软件也分布、配置在不同的系统中,构成不同的软件组合。这带来比单一系统多得多的问题,分布式系统的软件管理又可分为应用软件管理和系统软件管理,其中后者又可称为工作站管理,它最简单的实现方法就是无性繁殖,应用软件比系统软件易于管理,常采用划分的方法进行分类和分解。
(4)硬件管理:它可能是分布式管理中最困难的管理。因为能自动处理的事务是有限的,如果硬件崩溃或者要增加新的硬件设备,必须有人修复或安装。
硬件管理的策略基本与软件相同,其中,明确服务器和用户的界限极为重要。
(5)网络管理:明确网络功能的正常,它也处理类似于软件,硬件,任务之类的问题,但管理的范围较为确定。
其次,在每一项管理中又有5项子任务,配置管理,失效管理,安全管理,性能管理和资源管理。其主要定义如下:
配置管理:它主要通过控制产品的升级提供稳定性,如逐步地,并发地修改等。作为一种管理机制,它通过开始,升级,授权,修改来控制,记录和报告产品及其修改的历史和状态。作为开发支持工具,它维护产品的实际成分,记录每个成分和整个产品的历史,提供修改产品的稳定的工作环境。
失效管理:处理各种错误,并提供防范措施防止问题的再次出现。
安全管理:是失效管理的一部分,集中在系统的进入和外界用户的作用上。
性能管理:包括协调、优化各分类的各种任务。
资源管理:目标是收集资源使用数据,以便对将来进行规划,并完成性能管理。
4.分布式管理面临的困难
作为完整的多系统管理,不但单一系统管理的所有问题都带到了分布式系统,还产生了许多新的问题,这些问题可能使分布式计算的优势得不到充分地发挥,甚至带来很大的麻烦。
以下是分布式系统管理所面临的困难:
(1)可伸缩性
分布式系统允许加入新的系统成分,这一特性称为可伸缩性。理想的情况是随着系统成分的增加,系统性能不断地提高,但现实中常有瓶颈和约束限制了可管理的机器数目在100个左右,如何解决这一问题,是分布式系统管理所关注的交点。
(2)异构性
分布式系统通常是一个异构的环境,它包含多种硬件平台和操作系统,即使在同一个硬件平台和操作系统上也会因为每个机器的配置不同而产生新的异构问题。如何将管理系统适用于所有的机器操作系统,或者说,如何将不同的硬件平台操作系统统一成集成的分布式计算环境是分布式系统管理的目标。
(3)安全性
安全是管理的重要问题,分布式系统提出了全新的安全概念。在分布式系统中,一个很小的局部安全漏洞也会导致整个系统的崩溃,这对安全管理提出了新的更高的要求。
(4)一致性
一致性是分布式系统的典型问题,包括同步,互斥,并发和可恢复性。由于分布式系统的状态是由各个节点的状态共同决定的。所以,一致性的问题显得特别突出。
5.分布式系统的管理模型
计算机系统被认为是计算资源和资源管理的集合,由于安全,可维护和抽象等原因,这些资源常被认为是封装在不同的管理对象中的一个计算机系统,因此,也被认为是管理和管理对象的集合。历史上有三种途径用来获取管理资源,分别是被保护的过程调用;Amoeba系统中的性能;客户/服务器模型。
在客户/服务器模型中,服务器是一组管理系统资源的进程,客户是一组使用系统资源的进程。它们可驻留在同一个处理机,也可以安装在不同的节点上。服务器定义了一组可被客户激活的服务接口,客户通过向服务器申请服务而使用系统资源。客户和服务器是相对的,一个服务器也可以是其他服务器的客户,最高层的不具有抽象性质的客户是应用。
服务器所管理的系统资源的类型是多种多样的,有硬件,软件,客户,任务