常见容灾备份方案的分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于常见容灾备份方案的分析
互联网、信息化、大数据、云平台,我们所处的时代越来越离不开数据;误操作、硬件故障、地震、海啸,我们的数据多灾多难;定时备份、镜像复制、快照技术、日志复制,容灾备份技术日新月异;实时备份、逻辑完整、任意回退、业务连续,CDP持续数据保护方案全方位护航。
容灾备份方案之——HA解决方案
在2000年后出现了很多HA模式的高可以用解决方案。按群集组成的服务器来分,包括双机HA群集、多机HA群集。根据部署和工作模式来分,包括纯高可用模式和负载均衡模式。这种HA模式很好的解决应用的高可用问题,只要不是HA组成节点内的所有服务器都宕机,业务就可以通过HA软件的调节转移到剩余的可用节点上。这样的情况下只要组成HA的节点有一台还可以工作,业务就可以连续。
但是HA冗余的只是应用,数据还是共享的一份。在这份共享的数据出现问题的时候,即使是所有的节点都可以工作,业务也会被迫中断。
HA只解决了应用冗余
因为HA并没有对数据冗余,只有一份共享的数据。
所以HA是一个应用冗余方案,并不属于容灾备份方案。
不能解决系统软硬故障导致的数据丢失、误删除、逻辑错误等常见的但是是致命的隐患。虽然后来的一些HA解决方案,采用了多节点多存储的模式,比如双机双柜、三机三柜等,不同的存储之间采用了镜像模式进行数据冗余,但是它仍然会具有镜像模式的缺点,详见下一小节。
容灾备份方案之——镜像解决方案
很多用户认为CDP的含义就是字面的意思:“持续数据保护”,因为镜像的保护就是持续的,所以镜像就是CDP,事实并非如此。
镜像按请求镜像的主机是否需要镜像站点的确认信息,又可分为同步镜像和异步镜像。
同步镜像在数据写入的过程中需要先写入到镜像站点且得到确认后然后才写入到主机。我们把主机命名问A,把镜像站点命名为B。那么同步镜像在写入数据的过程中就是:“欲写A,先写B;写完B,再写A”。在不需要同步镜像的情况下,那就是“欲写A,只写A”。我们可以看出,在同步镜像的模式下,数据写入绕远了,这将会直接导致效率的降低,也决定了同步镜像只能在较近距离的环境中使用,因为越远数据的传播时间越长,效率就越低。优点是它保证了写到生产机的数据肯定写到了镜像服务器,从而使得生产机和镜像服务器的数据高度一致!
而异步镜像的写入模式是“欲写A,只写A;欲写B,只写B”,说白了就是两次写入各写各的。虽然它提高了写入的效率,但是在这种情况下写入A的数据并不一定写入了B,A和B 之间的数据存在数据不一致的可能,而在结构化数据备份过程中,这种不一致可能是致命的,将导致整个结构化数据库的无法使用。
假设在同步镜像中数据往返传播不需要时间,而异步镜像也不会出现数据不一致的问题,那么镜像就是一种不会影响效率、不会传丢数据的技术。这也是镜像技术的理想条件。那么我们来看在这种理想条件下,如果发生了逻辑错误(数据库写入错误、内部逻辑意外、人为恶意/误删除),那么两边的数据就会都存在这种逻辑错误,因为他们是一致的。
镜像复制技术,包括双机双柜或者多机多柜的单活或者多活的HA模式,做到了实时数据冗余,甚至也同时有了应用冗余。
但是却不能解决数据误删除、数据逻辑错误,异步镜像甚至不能解决数据的一致性问题,同步镜像也不能解决长距离的异地灾备问题。
或许有客户会想,如果真出现这种问题,我可以通过快照来修复。快照真的可以修复么?我们继续看下一小节。
容灾备份方案之——快照解决方案
快照,从字面上我们可以理解为快速的拍一张照片。假设在镜像的过程中,我们每间隔5分钟做一个快照(实际应用中,快照不能太频繁,因为会占用系统资源,影响应用的效率和流畅性)。这样一天下来大概有255个快照点。这个快照点是预先设置好的,到了那个时间就开始做快照。
假设在11点34分59秒的时候由于误操作删除了A表中的1万条数据,这1万条数据全部或者部分是在11点30分以后写入的。当发现这种删除后,我们可以根据预先做好的快照点进行恢复。根据前面的5分钟原则,距离事故点最近的一个快照是在11点30分。我们将数据恢复到11点30分后,11点30分到11点34分59秒的数据将永久丢失!
而且这是假设11点30分这个时间点的快照在恢复后数据库是能打开,可用的。事实上,因为镜像(尤其数据块级别的镜像)并没有对数据库的数据结构和逻辑性进行分析,所以并不是所有的快照点都是可用的。如果当前的快照点是数据库存储文件不完整的一个点那么恢复后数据库将无法打开和使用。
所以快照是一个定时的计划备份,有了数据冗余,恢复数据快,能够回退恢复。但是只能做指定时间点(Fixed Poit In Time)的数据恢复,只能几率性的修复部分数据错误,同时RPO ≠0,会有数据丢失。
容灾备份方案之——CDP持续数据保护方案及优势
CDP应用级容灾备份方案在能够实现HA的应用高可用基础之上,又实现了数据冗余。在能够实现镜像的实时备份基础之上,又具有超出快照有限回退点的任意回退点,同时保证了数据的完整可用性。
备特佳CDP容灾备份方案和其它方案对比如下:
方案
应用冗余
数据0丢失
数据冗余
数据100%可用
任意时间点回退
指定时间点回退
远距离异地容灾
定时备份
否
否
是
否
否
是
是
单柜HA方案
是
否
否
否
否
否
否
双柜HA方案是
是
是
否
否
否
否
镜像
否
是
是
否
否
否
否/异步的可以