数据快照技术原理和应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据快照的原理和应用
前言
一、应用存储产品时遇到的问题
随着电子商务的发展,数据在企业中的作用越来越重要,越来越多的企业开始关注存储产品以及备份方案。在应用这些存储产品时会遇到以下的问题:
1.备份速度的问题:
随着业务的不断发展,数据越来越多,更新越来越快,在休息时间来不及备份如
此多的内容,在工作时间备份又会影响系统性能。
2.操作简单化的问题:
数据备份应用于不同领域,进行数据备份的操作人员也处于不同的层次。操作的简单与否直接影响操作的效果和数据的安全。
3.保护数据一致性的问题:
有些关键性的任务是要 24 小时不停机运行的,在备份的时候,有一些文件可能
仍然处于打开的状态。
4.容错的问题:
数据备份损坏了,怎样在最短的时间恢复它。
二、解决方法
为提高数据存储的安全性和高效率,保护企业的数据,数据快照技术(Flash copy, Snapshot, Point-in-time-copy)是其中比较成熟的技术之一。数据快照技术是一种保留某一时刻数据映像的技术,其保留的影像被称为快照(即 Snapshot)。数据快照的真实含义是: 用最短的时间和最低的消耗实现文件系统的备份,创作出您数据的"影子"图象,你可以象操作原始数据一样对其进行读取或写入。因此,采用数据快照技术给数据拍照,你能在进行备份、下载数据仓库或者转移数据的同时,保证应用不受影响而继续运行。使用真实的数据结果,你甚至能更开发和测试应用程序。IBM 的FlashCopy、HDS的 Shadow Image 软件都是使用快照技术来实现快速复制或备份的。
1.数据快照功能可以在数秒钟内建立拷贝,供备份应用所用。
举个例子:一个企业的数据量很大,而且应用昼夜不停,作一次磁带备份需要24 个小时。现在要求备份 9 月 18 日 0 点 0 分时的数据。如果用传统的在线备份方法,备份下来的数据开始时是0 点 0 分时的,最后的数据是 24 点 0 分时的,数据的前后一致性受到了挑战。利用数据快照技术,配合普通的备份软件是这样实现的:通过图形的管理界面发出做快照的命令,快照功能会自动寻找没有数据改变的时刻进行拷贝,几秒钟之后拷贝生成。再使用备份软件对该拷贝进行备份。24 小时后这个备份过程结束。所有的数据都是一个瞬间的,数据的一致性得到了保证。
2.利用数据快照的映像可以在数秒钟内把数据恢复到做快照的时间点,还允许系统管理员选择性地迅速恢复受损或被删文件。
举个例子:张三不小心把一个重要的文件夹彻底删除了,现在想要恢复。利用先前通过快照做的拷贝,把相应的文件夹拷回来即可。
3.数据快照的功能还有很多用处,比如现在需要一份最新的生产数据来做新系统的测试或者提供决策支持和数据分析所用,而系统又不能停机,使用磁带备份恢复一份数据时间又很长。这样的情况可以利用数据快照的备份功能在任一时间点建立快照拷贝,利用拷贝的数据进行测试和分析,不会影响系统的正常使用。
4.企业里虽然有了磁带备份,但是万一磁介质坏了,某些数据还是读不出来,如果有了快照生成的数据拷贝,相当于为数据做了双保险。
数据快照的原理和应用
一、数据快照基本原理
基本原理
这是正常情况下的文件系统在存储上的示意图:(如下)
文件系统描述就是一系列的指针,记录着磁盘上的数据块的逻辑关系。
现在假设你在上午 10:00 生成一个数据快照,那么在 10:00 这个时刻,快照功能要
做 3 件事:
1.把文件系统描述复制一份。
2.在磁盘空闲空间创建一个缓冲区。
3.在文件系统写操作中增加一个判断(图中没体现),就是判断应用是否是第一次
修改数据
在 10:00 以后,当有应用要修改数据块时,快照功能就把原来的数据块保留入缓冲区,同时把数据快照的访问入口转而指向缓冲区。
这样就生成了一个数据快照,通过快照入口访问到的就是 10:00 的数据。而同时,
应用程序仍然可以在文件系统上读写。也就是说,在应用不停的情况下,得到了一个 10:
00 的静态数据
数据快照中常用术语
以下列出了讨论数据快照技术中用到的术语:
主卷----磁盘的一个逻辑分区,存储特殊程序和成套程序的原始信息。
影像卷(快照卷)----磁盘的一个逻辑分区,存储已改变的时点数据或原
始主卷的完全映像。
卷对----由主卷和与其对应的影像卷组成,每一卷对由一个位图支持。
三重镜像----在已有的被保护的数据实现镜像后连接第三镜像卷(RAID1),
这是用以实现数据快照的方法之一。
位图----文件或磁盘物理分区,用以保存主卷和影卷之间的数据的当前状
态。
同步化----在影像卷上创建与主卷完全相同的复件或映像的过程。
完全的再同步----完全的磁盘复制,这是同步化操作中耗时最长的过程。
大多数情况下,影像卷按照主卷同步化,但有时主卷也可以按照影像卷
同步化。
快速再同步化----仅复制与数据日志相关的磁盘块从而降低了同步化时
间。
二.数据快照技术
数据快照是对在特殊时点(point in time)“复制”的数据的映像。以下是创
建数据快照的三种主要技术:
中断镜像----时点到达之前对数据创建并存储完全物理复制
按需复制----时点到达之后对数据进行完全物理复制
虚拟映象----时点到达的时刻,对数据进行虚拟的,非物理的复制。
这每一种技术伴有响应更新的选择能使之充分利用时间实现后来的时点。一般
说来,主数据和时点映象会有软件跟踪以实现有选择的刷新而不会执行费时又费力
的完全磁盘一磁盘复制。
1)中断镜像
EMC TIME FINDER 和 HDS Shadow Image 就是采用中断镜像方法实现数据快照的
产品。这一方法要求附属的镜像卷和主数据卷相联系(主卷自身可能被RAIDI 实现镜像,因此“三重镜像”)。利用中断镜像,数据能够在时点来临之前不断地复制到“第三镜像”中。
以下是使用“中断镜像”技术的典型过程:
●创建数据的附属镜象
在要求时点复制之前,一个新的镜卷与主卷相联系。接着,主卷的内含在后台
被复制到新镜之中。然后,附加镜像将调整与主卷一致。附属镜卷也会得到与主卷
一致的更新数据,以保证同步继续,在三途径镜卷中,子系统的存储设备对每一次
写入将受到 3 次输入/输出操作。
●使附属镜卷与主卷脱离
如果要创建一个能为后续程序所进入的时点映象。人们必须不时的暂停更新镜