容灾挑战及智慧容灾
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据完整性能力:RPO
支持实时复制,数据不丢失,RPO≈0 提供秒级任意时间轴回滚的数据保护和恢复功能 支持定时快照,数据小时级保护,RPO=小时/天 保障数据一致性和应用可恢复
应急恢复能力:RTO 手动应急
iSCSI Boot网络启动应急模式,RTO≤5分钟 FC Boot启动应急模式,RTO≤5分钟 sVMBoot虚拟化应急模式,RTO≤3分钟
IIS
WEB Server
Exchang e
数据库服 务器
生产中心
WAN
LAN
虚拟容灾服务器 智慧容灾系统
System Storage
N5500
容灾小型机
容灾中心
智慧容灾系统 LAN
IBM AIX
MS
IIS
WEB Server
Exchan ge
数据库 服务器
生产中心
全方位容灾保护
PC 等终端
系统领域
运维的美好愿景
可控运维
轻松运维
智慧容灾
智慧容灾
统一容灾 智能容灾 简单容灾
统一容灾
统一容灾技术融合 存储备份/在线复制/快照/镜相/网启/虚拟化 /CDP… 应对任何灾难(基于PC服务器的业务系统) 一体化统一平台 统一管理 专用统一安全系统
统一容灾
RPO/RTO的综合设计
数据完整性能力:RPO 业务持续能力:RT0 本异地多级容灾能力 全方位容灾能力
容灾挑战及智慧容 灾
1
容灾挑战
2
智慧容灾
容灾挑战
运维现状
要求高,压力大,不可控
IT技术越来越复杂 系统越来越宠大 安全风险越来越高 持续运行要求越来越高 维护力量有限,维护压力大 灾难的不确定性,后果不可控 比如:时间,灾难程度,现场人员,维护人员,业务水平 发挥程度,厂家支持等
每年的发生频率
智能容灾
自动复制或同步 自动快照或录像数据变化 自动监测系统故障 自动接替并恢复业务系统功能 自动调整应急副本配置实现随需而变
简单容灾
适合应急场景使用
软件、硬件按钮“一键应急”,简单至极 定制专属导航式指导网络启动应急操作 自动容灾——监测告警应急联动 多种角色权限控制,专属应急操作员精简界面 一体化WEB界面全浏览器操作 自动复制保护
自动应急
冷备实现分钟级快速恢复,RTO≤5分钟 热备HA架构保障应用不间断,RTO≈0
本异地多级容灾能力
智慧容灾系统 LAN
IBM AIX
MS
IIS
WEB Server
Exchan ge
数据库 服务器
生产中心
7
8
UID
6
6
5
5
4
4
3
3
2
2
OVER TEMP
POWER CAP
ONLINE SPARE
业务持续保障
系统可用性——HA高可用支持 灾难恢复能力——RTO≈0、RPO≈0 业务持续管理BCM
风险评估与分析 业务冲击分析 应急响应计划 业务持续保障计划BCP
总结
传统容灾: 1. 多容灾手段的集成 2. 人工操作 3. 网管员级专业操作
智慧容灾 1. 统一容灾 2. 智能容灾 3. 简单容灾
10万美元
每次发生的结果 (单次发生损失) (美元)
100万美元
1000万美元
高
1亿美元
容灾发展
容灾意即灾难恢复(Disaster Recovery) 早期:数据级容灾备份
备份软件 磁带、硬盘 注重RPO指标
容灾发展
现在:应用级容灾
操作系统、应用程序与数据的统一保护 应用系统整体恢复 重视RTO指标,和RPO指标协同发展
应用容灾
一:复制备份
定时(全量、增量) 实时(连续数据保护CDP) 操作系统、应用、数据等 国内外产品同质化情况明显
应用容灾
二:灾难恢复
数据还原(重装系统和应用)—小时、天级 裸机恢复(光盘、U盘启动) —小时级 虚拟机替代应急容灾—分钟级
当我们遇到信息系统故障时
容灾的挑战
信息系统故障时
立即恢复业务应用—应急快速恢复手段少 数据不要丢—基本能满足 操作要简单—过于专业复杂
WEB服务器等信息接入
应用服务器
数据库服务器 存储
20
功能领域(横向) • 终端访问层 • 系统接入层 • 系统应用层 • 数据库 • 存储盘阵
系统领域(纵向) • 硬件 • 操作系统 • 应用程序 • 数据库
多种架构统一容灾能力
智能容灾
智能业务监测
心跳监测 网络连通性监测 业务级仿真监测
智能分析与告警 智能存储空间管理
MIRROR
பைடு நூலகம்PS 2
PS1
5 13579
1234
2 PROC
2468 97531
1 PROC
8642 4321
1
1
共享存储
7
8
HP ProLiant DL370 G6
System Storage
N5500
System Storage
N5500
AIX oracle
智慧容灾系统 LAN
IBM AIX
MS
1,000 100 10 1 1/10
1/100 1/1,000 1/10,000 1/100,000
系统中断不可避免
病毒
数据损坏
蠕虫
磁盘故障
应用中断
组件故障 网络问题
与可用性相关的
电源故障
业务连续运营
恐怖行动/国内动荡
建筑火灾
自然灾害
常见
不常见
1美元 10美元 100美元
低
与恢复相关的
1千美元
1万美元