容错服务器简介(7月1日)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
容错服务器解决方案
目录
一、市场背景及现状 二、容错方案概述 三、集群与容错方案对比 四、案例及拓扑图
一、市场背景及现状(一)
国内医疗行业IT每年投入0.3%-0.5%,发达 国家3%-5%。 《“十二五”期间深化医药卫生体制改革规 划暨实施方案》 目前,上海大多数医疗采用双机热备与集群 服务器,可靠性方面存在安全隐患。需要更 高可用性,高连续性,高可靠性,高安全性 的“容错服务器解决方案”来保证医院门诊 ,临床等业务不间断,保障7*24*365连续运 营。
六、案例2—集群宕机
上海市黄浦区中心医院: 2008年9月,医院的服务器发生故障,但 两台服务器未成功切换,造成宕机。各个挂 号收费窗口排队等待,业务无法运作,软件 商与硬件商到达现场后,素手无策。事后, 信息科人员配合医院相关人员与医保对账, 历时2个多月,才完成医保结算。宕机事件 发生后,医院购买了5台容错服务器,连接 CIS、LIS、HIS等医院系统,关键应用都在 容错服务器上运行。
硬软件结构简单 纯硬件容错结构 对所有软件无特殊要求 时钟同步,无需切换
六、集群和容错方案对比—拓扑结 构
无单点故障的集群方案 无单点故障的容错方案
心跳线
系统结构复杂 环节过多,外部连接 故障发生点多
系统结构简单 如同单机,内部连接 故障发生点少, 拓扑结构更简单
集群和容错方案采购成本对比
软件 价格
约¥60000 约¥680000 约¥140000 ¥136000
¥60000 ¥680000
Windwos2008 企业版 套 2CPU SQL标准版 1套
1 ¥80000
8%
¥80000
硬件和操作系统安装已经 在设备报价中,仅数据库 软件安装
¥20000
总价
¥1496000
¥1170000
¥1280000
行业优惠折扣off10%
¥1346400
行业优惠折扣off10%
1053000
行业优惠折扣OFF 46%
¥ 690000
集群和容错方案的工作原理比较
HA
实践证明切换不是总能成功的!
数据丢失 业务延滞
等待检测
故障出现 永久故障 瞬Байду номын сангаас故障
CPU中正在处理的数据 内存中驻留的重要数据 I/O中正等待写入/出的数据
三、集群和容错方案
内容 可靠性指标 集群HA方案(High Availability) 方案可靠性99.9%-99.99%, 非 计划性停机时间为(53分钟-9 )小时/年,平均88秒/天 冗余服务器和磁盘柜,通过集 群软件设计,来实现切换功能 ,由软件来执行故障的恢复。 对软件的要求比较高,包括数 据库软件和应用软件,而其集 群造成软件结构复杂,增加故 障的发生率。 软件及人员成本高投入,总成 本投入较高。 本身包含设备多,管理复杂, 除了管理服务器以外,须管理 磁盘柜,使用寿命为4年。 被动式服务,一般采取人工电 话咨询、工程师现场故障判断 和备件更换,无法进行远程维 护和自动报警 容错CA方案(Continuous Availability) 方案可靠性99.999%以上,达到 99.9998%,非计划性停机<2分 钟/年,<0.3秒/天。 100%部件冗余,计算机指令时钟 同步,由硬件执行容错功能,真 正实现“零”切换预防故障发生 单软件映像,强化驱动和热插拔 支持,软件结构像单机这么简单 ,无需做特殊处理。 硬件成本投入略高,软件及人员 投入成本低,总成本投入较低。 设备单一,管理简单,如同管理 单机一样管理。使用寿命规定为 6年。 主动式服务,一旦机器出现故障 ,机器会自动监测和隔离故障, 并主动向容错公司的客服中心报 警,工程师也可以进行远程维护
内容 双机双柜 硬件 价格 HP DL580 G7 双 lInte Xeon 2.4 GHz/2MB 8GB内存,2个300GB硬盘 双网卡,冗余电源 HP MSA2000 600GB 15K硬盘6块 Windwos2008企业版:2 套 2CPU SQL企业版: 2套 集群软件: 1套 安装测试 价格 10% 集群HA方案 价格 ¥480000 双机单柜 HP DL580 G7双 lntel Xeon 2.4 GHz/1MB 8GB内存,2个300GB硬 盘 双网卡,冗余电源 HP MSA2000 600GB 15K硬盘3块 Windwos2003企业版:2 套 2CPU SQL企业版: 2套 价格 ¥330000 容错CA方案 ftServer Stratus ft4700 双Intel Xeon 1.8GHz/2MB CPU( 逻辑),4GB内存(逻辑 ),2个74GB硬盘,6个 300GB硬盘 双网卡 价格 ¥1180000
二、容错方案概述
容错在系统中的每个关键部件均为双份冗余 配置,因此,当某一部件出现故障,其冗余 部件仍在继续工作,从而保证系统性能不受 到影响,避免发生停机、宕机的情况。客户 可以信赖地认为“部件一直在工作”。 实现硬件容错技术、连续(24*7)可用的计 算机系统平台,应用解决方案,以及专家服 务。其先进的维护服务技术实施于每个系统 ,以嵌入式的、无可比拟的技术克服停机现 象。
选择新平台
进行切换
故障恢复
CA
容错服务器的主动式服务
1.当部件发生故障,系统将自动 隔离故障并使用冗余的部件继 续运行 双向客户服务 中心
备件送达 服务
主动通知
2.“主动通知”技术将自动向 Stratus公司的客户服务中 心报告故障 3.随后,新的“客户可自行更 换单元”即会被送出 4.ftServer®会将新换上的部件自 动进行同步并始终保持系统的 运行
六、案例1—集群宕机
上海交通大学附属仁济医院(东院): 在2009年,医院的集群服务器宕机,导致 HIS系统瘫痪,多笔收费记录丢失;HP、思 科、symantec厂商承诺设备重启后将正常运 行,但动态数据将丢失。每月医院与市医保 局核对数据进行结算(约有6千万元,精确 到角)。医院投入大量的人员对每笔数据核 实核对,历时3个月才完成结算。医院受到 上海卫生局、上海申康扣分与批评,影响了 医院对外服务的形象。
七、医院集群方案拓扑图
七、容错方案拓扑图
黄浦区中心医院
一、市场背景及现状(二)
上海曙光医院、上海儿童医院、上海黄 浦中心医院、上海口腔医院、上海交通大学 附属仁济医院等30家医院采用“容错服务器 解决方案”,应用于各业务系统平台。 HIS—Hospital CIS(Clinical Information System Information System ) 医院信息系统(门诊 临床信息系统 挂号) LIS(Laboratory RIS(Radiology Information System Information )放射科信息管理系 Management System) 检验科信息管理系统 统;
集群软件
中间件 操作系统
CPU Memory CPU Memory
操作系统
MPU, Memory
操作系统
MPU, Memory
磁盘阵列 数据 镜像 心跳线定期侦测
ENET
ENET
SMM SCSI
SMM SCSI
I/O
I/O
硬软件结构复杂 依赖集群软件 对所有软件和硬件要求苛刻 切换机制只能覆盖部分实际应用情况
硬件结构
软件结构
成本投入 设备管理
售后服务
计算机业界对可靠性的定义
方案可靠性
99.999%
容错服务器
99.99%
99.9%
大型主机 消除单 点故障 的集群 系统
99%
独立 服务 器 使用外部 磁阵的独 立服务器 简易的 集群系 统
集群和容错方案硬软件结构比较
HIS
HIS
中间件
集群软件
HIS
中间件
目录
一、市场背景及现状 二、容错方案概述 三、集群与容错方案对比 四、案例及拓扑图
一、市场背景及现状(一)
国内医疗行业IT每年投入0.3%-0.5%,发达 国家3%-5%。 《“十二五”期间深化医药卫生体制改革规 划暨实施方案》 目前,上海大多数医疗采用双机热备与集群 服务器,可靠性方面存在安全隐患。需要更 高可用性,高连续性,高可靠性,高安全性 的“容错服务器解决方案”来保证医院门诊 ,临床等业务不间断,保障7*24*365连续运 营。
六、案例2—集群宕机
上海市黄浦区中心医院: 2008年9月,医院的服务器发生故障,但 两台服务器未成功切换,造成宕机。各个挂 号收费窗口排队等待,业务无法运作,软件 商与硬件商到达现场后,素手无策。事后, 信息科人员配合医院相关人员与医保对账, 历时2个多月,才完成医保结算。宕机事件 发生后,医院购买了5台容错服务器,连接 CIS、LIS、HIS等医院系统,关键应用都在 容错服务器上运行。
硬软件结构简单 纯硬件容错结构 对所有软件无特殊要求 时钟同步,无需切换
六、集群和容错方案对比—拓扑结 构
无单点故障的集群方案 无单点故障的容错方案
心跳线
系统结构复杂 环节过多,外部连接 故障发生点多
系统结构简单 如同单机,内部连接 故障发生点少, 拓扑结构更简单
集群和容错方案采购成本对比
软件 价格
约¥60000 约¥680000 约¥140000 ¥136000
¥60000 ¥680000
Windwos2008 企业版 套 2CPU SQL标准版 1套
1 ¥80000
8%
¥80000
硬件和操作系统安装已经 在设备报价中,仅数据库 软件安装
¥20000
总价
¥1496000
¥1170000
¥1280000
行业优惠折扣off10%
¥1346400
行业优惠折扣off10%
1053000
行业优惠折扣OFF 46%
¥ 690000
集群和容错方案的工作原理比较
HA
实践证明切换不是总能成功的!
数据丢失 业务延滞
等待检测
故障出现 永久故障 瞬Байду номын сангаас故障
CPU中正在处理的数据 内存中驻留的重要数据 I/O中正等待写入/出的数据
三、集群和容错方案
内容 可靠性指标 集群HA方案(High Availability) 方案可靠性99.9%-99.99%, 非 计划性停机时间为(53分钟-9 )小时/年,平均88秒/天 冗余服务器和磁盘柜,通过集 群软件设计,来实现切换功能 ,由软件来执行故障的恢复。 对软件的要求比较高,包括数 据库软件和应用软件,而其集 群造成软件结构复杂,增加故 障的发生率。 软件及人员成本高投入,总成 本投入较高。 本身包含设备多,管理复杂, 除了管理服务器以外,须管理 磁盘柜,使用寿命为4年。 被动式服务,一般采取人工电 话咨询、工程师现场故障判断 和备件更换,无法进行远程维 护和自动报警 容错CA方案(Continuous Availability) 方案可靠性99.999%以上,达到 99.9998%,非计划性停机<2分 钟/年,<0.3秒/天。 100%部件冗余,计算机指令时钟 同步,由硬件执行容错功能,真 正实现“零”切换预防故障发生 单软件映像,强化驱动和热插拔 支持,软件结构像单机这么简单 ,无需做特殊处理。 硬件成本投入略高,软件及人员 投入成本低,总成本投入较低。 设备单一,管理简单,如同管理 单机一样管理。使用寿命规定为 6年。 主动式服务,一旦机器出现故障 ,机器会自动监测和隔离故障, 并主动向容错公司的客服中心报 警,工程师也可以进行远程维护
内容 双机双柜 硬件 价格 HP DL580 G7 双 lInte Xeon 2.4 GHz/2MB 8GB内存,2个300GB硬盘 双网卡,冗余电源 HP MSA2000 600GB 15K硬盘6块 Windwos2008企业版:2 套 2CPU SQL企业版: 2套 集群软件: 1套 安装测试 价格 10% 集群HA方案 价格 ¥480000 双机单柜 HP DL580 G7双 lntel Xeon 2.4 GHz/1MB 8GB内存,2个300GB硬 盘 双网卡,冗余电源 HP MSA2000 600GB 15K硬盘3块 Windwos2003企业版:2 套 2CPU SQL企业版: 2套 价格 ¥330000 容错CA方案 ftServer Stratus ft4700 双Intel Xeon 1.8GHz/2MB CPU( 逻辑),4GB内存(逻辑 ),2个74GB硬盘,6个 300GB硬盘 双网卡 价格 ¥1180000
二、容错方案概述
容错在系统中的每个关键部件均为双份冗余 配置,因此,当某一部件出现故障,其冗余 部件仍在继续工作,从而保证系统性能不受 到影响,避免发生停机、宕机的情况。客户 可以信赖地认为“部件一直在工作”。 实现硬件容错技术、连续(24*7)可用的计 算机系统平台,应用解决方案,以及专家服 务。其先进的维护服务技术实施于每个系统 ,以嵌入式的、无可比拟的技术克服停机现 象。
选择新平台
进行切换
故障恢复
CA
容错服务器的主动式服务
1.当部件发生故障,系统将自动 隔离故障并使用冗余的部件继 续运行 双向客户服务 中心
备件送达 服务
主动通知
2.“主动通知”技术将自动向 Stratus公司的客户服务中 心报告故障 3.随后,新的“客户可自行更 换单元”即会被送出 4.ftServer®会将新换上的部件自 动进行同步并始终保持系统的 运行
六、案例1—集群宕机
上海交通大学附属仁济医院(东院): 在2009年,医院的集群服务器宕机,导致 HIS系统瘫痪,多笔收费记录丢失;HP、思 科、symantec厂商承诺设备重启后将正常运 行,但动态数据将丢失。每月医院与市医保 局核对数据进行结算(约有6千万元,精确 到角)。医院投入大量的人员对每笔数据核 实核对,历时3个月才完成结算。医院受到 上海卫生局、上海申康扣分与批评,影响了 医院对外服务的形象。
七、医院集群方案拓扑图
七、容错方案拓扑图
黄浦区中心医院
一、市场背景及现状(二)
上海曙光医院、上海儿童医院、上海黄 浦中心医院、上海口腔医院、上海交通大学 附属仁济医院等30家医院采用“容错服务器 解决方案”,应用于各业务系统平台。 HIS—Hospital CIS(Clinical Information System Information System ) 医院信息系统(门诊 临床信息系统 挂号) LIS(Laboratory RIS(Radiology Information System Information )放射科信息管理系 Management System) 检验科信息管理系统 统;
集群软件
中间件 操作系统
CPU Memory CPU Memory
操作系统
MPU, Memory
操作系统
MPU, Memory
磁盘阵列 数据 镜像 心跳线定期侦测
ENET
ENET
SMM SCSI
SMM SCSI
I/O
I/O
硬软件结构复杂 依赖集群软件 对所有软件和硬件要求苛刻 切换机制只能覆盖部分实际应用情况
硬件结构
软件结构
成本投入 设备管理
售后服务
计算机业界对可靠性的定义
方案可靠性
99.999%
容错服务器
99.99%
99.9%
大型主机 消除单 点故障 的集群 系统
99%
独立 服务 器 使用外部 磁阵的独 立服务器 简易的 集群系 统
集群和容错方案硬软件结构比较
HIS
HIS
中间件
集群软件
HIS
中间件