企业云容灾备份规划方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
南京2个资源池数据备份到中心;
南京作为北京异地灾备中心;
灾备中心和生产中心在资源的投入上
基本上是0.X:1,灾备中的资源要小于
生产中心。只有当生产中心不可用时,
灾备中心临时接管生产业务,当生产中
心恢复后,生产业务从灾备中心回切到
生产中心;
备中心仅作为备份和测试中心,不建
议两边同时跑业务互为备份;
企业云容灾备份规划方案
IT现状问题分析总结:IT架构优化已迫在眉睫
计算
网络
存储
安全
运维
业务
• 物理服务器:服务器 年限过长,一旦出现 硬件故障,会导致对 应业务中断
• 虚拟化:虚拟化,集 群超配严重,导致HA 无法正常工作,一旦 故障会导致大面积的 业务瘫痪
33
• 网络架构:网络中存 在大量的单点故障, 一旦链路或者设备故 障,会严重影响到的 业务
线路图
资 源 效
1. 各数据中心完全对等,支持所有业务应用的分布式部署(可同时读写);
2. 实现前提是形成数据存储在任意时刻、任意地点的单一视图,而目前 尚存在克服异地时延的技术障碍
数据中心B
率
同城数据中心
异地多功能中心 (灾备、研发和 部分生产应用)
数据中心A
数据中心C
分布式数据中心模式
同城数据中心
两地三中心 2.
3.
根据应用特征进行同城部署,以充分利用资源,通常要求业务数据读写分离,例如:数据中心A处理 某应用的正常业务,而数据中心B完成该应用以读为主的业务; 同城数据中心保留一定的资源冗余,以保证在灾难状况下一定的服务质量;
典型案例:四大行等国内大型金融机构陆续采用该模式
1. 在同城部署核心、重要业务等较多业务的主备架构(为主),在异地部署核心业务的主要架构及较多系统的数据备份;
• 开发平台:当前IT开 发平台不统一,各系 统独立部署,形成资 源孤岛,业务故障无 法快速排除
• 系统架构:多套系统 架构完全不同,没有 统一的可靠性/可用 性/安全性的软件架 构设计,导致系统的 可用性低,出现故障 难以快速恢复
171 334
43
当年 1-3年 4-6年 7年以上
2
应用系统现状
安全问题 ➢ 当前对安全防护及隔离考虑较少,而系统安全性格外重要, 必须严格遵守集团对信息安全等级保护的要求;业务安全隔 离也尤为重要
自动化及运维问题 ➢ 仍然存在很多手工配置的内容和纸件办公。随着后续IT 资源 规模不断扩大,服务模式转型会使得业务需求更具多样化, 系统升级扩容将更加频繁,容易产生人为操作错误的问题, 且不易维护
• 备份是容灾的基础,而由于逻辑故障恢复和归档等需求,容灾不能完全替代备份
• 不同的业务系统有不同的RPO和RTO需求,根据需求来规划合理的灾备方案
可恢复的最近时间点
灾难发生的时间点
系统恢复到可用的时间点
RPO
Time
RTO
5
应先建立同城灾备,再逐步推进到同城双活
建设目标 备份方案 灾备方案 双活方案
2. 仅在同城的两个中心都无法执行任务时,才启用异地容灾中心;以牺牲资源效率为代价满足灾备要求; 3. 国内大部分金融机构普遍采用该模式
技术难度与管理要求 6
三地四中心的职能规划
武汉数据中心 北京主中心
建设目标
南京数据中心 北京备中心
备份方案 灾备方案 双活方案
线路图
北京做为作为的同城灾备中心,武汉、
体系
建设目标 备份方案 灾备方案 双活方案
线路图
• 备份与容灾是保证业务连续性的两种技术手段,两者有着紧密的关联
• 备份的目的是保存历史数据,主要方式是将生产数据复制至其他离线介质中进行保存
• 容灾的目的是在异地建立与生产系统相同的环境并通过数据同步,将生产环境复制至 容灾环境,当生产环境发生灾难时,由容灾环境接管业务继续运行
3
云平台建设目标
建设目标 平台架构 技术选型 建设内容 高可靠设计
路线
以云服务平台作为企业云业务统一入口,提供IT资源服务化的整合引擎,实现资源服务化、运维部署自动化
新IT: ✓ IT资源服务化 ✓ 管理界面统一
传统IT: ✓ IT资源分散建设 ✓ 资源手工交付 ✓ 多个管理界面
4
通过备份加强数据的安全性,通过三地四中心建立容灾
主数据中心
多活中心模式 (理想状态)
同城数据 备份中心
主数据中心
主数据中心 异地灾备中心
1. 与“双活+灾备中心模式”不同之处在于:部分关键应用实现同城的读
双活+灾备中心模式 写同步,同时实现不同应用部署异地的两个中心; 2. 各技术层面均有较成熟的解决方案,但缺乏整体应用的成熟案例
异地灾备中心
1.
• 网络设计:网络设计 层次不清晰,二层广 播域过大,一旦出现 广播风暴,会导致整 网瘫痪
• 存储备份:没有规划 备份机制,存在数据 丢失的风险,包括财 务核算,检验等重要 数据
• 存储容量:由于大数 据等业务发展非常 快, 存储没有统一 复用,现有存储容量 和性能已经无法满足 要求
• 安全技术:安全防御 手段不足 (IDS/WAF没有充 分利用),容易被黑 客攻击,存在科研数 据泄露的风险
• SLA服务标准:当前 没有发布云计算服务 SLA目标和测评标 准,不能满足迁移到 云上的业务连续性要 求
• 安全制度:安全制度 无法满足等保三级要 求,会影响到后续业 务向云上迁移的安全 合规要求
• 运维工具:当前有网 络/资产/ITIL的运维 工具,但缺乏服务 器,存储和应用的运 维工具,没有主动告 警和故障快速恢复机 制
南京和武汉需要在本地备份数据,当本
地无法恢复业务时,才考虑在北京接管
业务;
7
备份规划
虚拟化集群1
建设目标 备份方案 灾备方案 双活方案
线路图
备份服务器 备份介质
虚拟化集群2
备份方案说明: 在每个数据中心内外网各部署一套备份软
件,备份介质可以利旧现有的磁带库; 虚机无代理备份:在虚拟化平台安装备份
信息化建设起步较早,但当前并行存在多套具有各自架构特点的平台,孤岛式建设导致资源不能重用,阻碍信息和业务的进一步 深度集成和共享。
测试系统 一卡通
来自百度文库员工报销
信息中心
档案管理 …
统一支撑管理平台
大数据平台
系统仿真平台 天气预报平台
容灾问题 ➢ 当前对容灾备份暂无考虑,数据可靠性和容灾能力较差
资源利用问题 ➢ 某些阶段性应用,在相当长时期内或者永久不再需要,但是 该资源不能被及时、方便的释放或回收,以供新系统使用, 造成空闲资源的浪费