制造业信息管理系统..
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
制造企业信息管理系统数据库/应用服务器双机热备
解决方案
北京酷博睿特信息技术有限公司
2010-8
一.项目背景
在企业运营过程中,会产生和积累大量的数据。这些数据环环相扣,纵横交错。从管理流程上看,数据传递上至最高管理层,下至生产最基层;从产品实现过程看,则囊括从设计、采购、生产、库存到销售和售后服务的全生命周期。这些数据蕴含着对企业具有重大价值的知识和信息,获取和使用这些知识的途径便是充分有效地利用制造企业信息平台。制造企业信息平台将企业运作的各部分、各环节生成的信息紧密地“链接”
在一起,其有效的配置可以实现生产全过程和产品全生命周期的支持和监控,使物流、信息流、资金流通畅运行。
在企业整个生产过程中,生产业务的连续性是制造企业的生命线,如何保障企业信息管理系统的稳定,不间断运行,是现代化企业管理者最为关心的话题。
二.系统高可用需求
现代化企业信息管理系统,是现代管理知识和计算机技术相结合的产物。信息管理系统能为企业不仅带来经济效益,还为提升公司综合竞争力起到重要的作用。
对于当前企业的信息管理系统系统部署在Windows 2003/Linux平台上,数据库、应用服务器、Web服务器、文件服务器等均是企业信息管理系统中至关重要的组成部分。无论是硬件、平台软件还是应用软件,一旦发生故障,将会造成服务的中断,数据的丢失,给企业带来重大经济损失。正是基于安全性、连续性、可靠性及避免单点故障的考虑,用户需要对数据库、应用服务器、Web服务器等系统构筑成为双机热备系统,确保系统(包括整个硬件系统和软件系统)高可用性。
2.1 企业信息管理系统当前存在的问题
1)、服务器出现软、硬件故障,致使服务器宕机,对外服务停止。
2)、当系统出现故障而停止服务,管理人员无法及时得到通知。
3)、维护困难,修复时间较长,系统宕机期间给企业带来巨大经济损失。
4)、系统数据关系企业的命脉,数据库单点故障导致数据丢失是系统最大风险。
5)、原有意识认为,服务停止不是重大事故,系统依然单机运行。发生故障几率大。
6)、对高可用集群的技术及作用不了解,没有想到使用高可用软件。
2.2 数据库系统常见故障及高可用的基本要求
✧系统故障(System failure)
系统故障主要是由于服务器在运行过程中,突然发生操作系统错误、停电等原因
造成的非正常中断,用户对数据库进行处理的事务被突然中断,内存缓冲区中的
数据全部丢失,但硬盘、磁带等外设上的数据未受损失。
✧介质故障(Media failure)
介质故障是由于硬件的可靠性较差出现的存储介质发生物理损坏。数据库的数据
全部或部分丢失,破坏性较大。
✧事务故障(Event failure)
事务故障是某些对数据库进行操作的事务违反了系统设定的条件,如输入数据错
误、运算溢出等,使事务未能正常完成就终止。发生事务故障时,事务对数据库
的操作可能已经修改了部分数据,因此数据库管理系统必须提供某种恢复机制,
强行回滚该事务对数据库的所有修改,使系统回到该事务发生前的状态。
✧数据库僵死故障(Defunct failure)
由于数据库系统中某些进程运行过程占用大量系统资源,出现系统性能下降,并
出现进程阻塞现象。进程无法自动释放,而导致数据库进程无法响应应用程序的
调用。从服务进程列表可以看到服务的存在,但已经无法正常工作。由于这种隐
蔽的故障很难及时发现,会给用户造成巨大的经济损失。
2.3 应用服务器系统常见故障及高可用的基本要求
内存泄漏是比较常见的一种应用程序性能问题,一旦发生,则系统的可用内存和性能持续下降;最终将导致内存不足(OutOfMemory),系统彻底宕掉,不能响应任何请求,其危害相当严重。同时,Java堆(Heap)中大量的对象以及对象间之复杂关系,导致内存泄漏问题的探测和分析均比较困难,采用相应的辅助工具是很必要的。另外,当故障发生时,能及时通过多种报警方式,如邮件或短信报警等,及早发现故障。
2.4 Web服务器系统常见故障及高可用的基本要求
WEB服务器采用的是浏览器/服务器结构,其作用是整理和储存各种WWW资源,并响应客户端软件的请求,把客户所需的资源传送到 Windows、UNIX 或 Linux 等平台上。
Web服务器承担着处理HTTP请求(request)的任务,并传送(serves)页面,使客户端浏览器可以浏览信息。一旦Web服务器出现设置错误,断电,硬件损坏等故障,将直接影响用户的访问,造成信誉和经济的巨大损失。因此,对Web服务器提出高可用性要求,达到99.99%。当故障发生时,能够提供多种报警方式,如邮件或短信报警等。
2.5 文件服务器高可用的基本要求
文件服务器是最基本的服务器,是实现文件(数据)资源的共享使用。承担着企业内部各个部门的协同工作,作用非常重要。一旦故障发生,通过应用备份机制,将文件服务器服务尽快恢复,降低经济损失。另外,一旦故障发生,要求提供多种报警方式,如邮件或短信报警等。
简单地说就是必须保证企业信息管理系统7*24小时不间断运行。
三.解决方案
3.1方案描述
本方案中采用NEC EXPRESSCLUSTER构筑企业信息系统高可用集群方案,保护系统中的数据库服务器、应用服务器、WEB服务器、文件服务器等实现集群,达到高可用性目的。当任何一个应用发生故障时,将服务切换到待机的服务器上运行,保证网站系统平台应用7*24小时不间断地运行,同时保证数据安全可靠性。
NEC EXPRESSCLUSTER可以提供数据库服务器的高度可靠性和容错能力。可以采用共享磁盘型双机热备结构,将用户数据存储于磁盘陈列分区上。也可以采用镜像型双机热备结构。
采用NEC EXPRESSCLUSTER镜像方式构筑集群系统,保护应用系统中的应用服务器实现集群,达到高可用性。当主机应用发生故障时,将服务切换到待机的服务器上运行,保证网站系统平台应用7*24小时不间断地运行。
采用NEC EXPRESSCLUSTER镜像方式构筑集群系统,保护应用系统中的Web/文件服务器实现集群,达到高可用性。当主机应用发生故障时,将服务切换到待机的服务器上运行,保证网站系统平台应用7*24小时不间断地运行。
3.2基本架构
数据库服务器
二台数据库服务器通过网线连接到网络交换机上,同时两台机器通过直连线相互连接,作为心跳线,进行实时探测系统状态。
数据库服务器,其中准备一台待机服务器通过集群软件构件成一个双机集群,NEC EXPRESSCLUSTER实时监视服务存活状态,提高企业网站平台的系统高可用性。
集群软件对本地数据实时监视,实现数据的一致性、完整性、可用性,为数据提供