快照技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
MSPE培训教材—快照技术
什么是快照
Snapshot(http://www.snia.org/dictionary)
A fully usable copy of a defined collection of data that contains an image
of the data as it appeared at the point in time at which the copy was initiated. A snapshot may be either a duplicate or a replicate of the data it represents.
地址
6 z
数据
快照前写块1 p z
快照后写块6
读块6 读块1
源 盘
g p
1 p 2 4 c 3 d e f g h i 5 6 7 8
检索
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •源卷块6内容不变 •‘z’写入日志 4.从快照读时只访问源卷
15
RoW的实现
SAN访问
同时间点的快照恢复数据。
重新定义数据用途 快照提供一份接近实况数据的拷贝,可供测试、归档、查询使用,既 保护生产系统又赋予备份数据新的用途。
3
常见快照技术分类
全拷贝快照
分离镜像(Splitting a mirror)
差分快照
写即拷贝(CoW : Copy On Write)
写即重定向(RoW : Redirect On Write)
参考译文: 快照是特定数据集的一个完整可用拷贝,该数据集包含源数据在拷贝点 的静态映象;快照可以是数据再现的一个副本或者复制。
2
快照的价值
快速备份/恢复 快照可迅速生成,并可用作传统备份和归档的数据源,缩小甚至消除 了数据备份窗口; 快照存储在磁盘上,可以快速直接存取,大大提高数据恢复的速度。 保存多个恢复点目标 基于磁盘的快照使存储设备有灵活和频繁的恢复点,可以快速通过不
两次快照之间的多次写操作
第一次写动作,需要一次读,二次写操作 后续的写动作,只需直接写入到源卷,不再需要拷贝操作
12
RoW的实现
SAN访问
阵列
源卷
0 a
p
快照前写块1
源 盘
1 p b 2 4 5 6 7 8 c e f g h i 3 d
1.写操作(‘p’写入块1)
13
RoW的实现
SAN访问
读写路径影响
源卷的写操作基本无影响 源卷的读路径潜在受影响 快照(卷)的读写路径最优化
源卷的状态不是最新,快照卷故障将会导致源卷数据丢失
17
WA与WAFL
WAFL:Anywhere File Layout,任意位臵写入文件布局,是
Netapp的专利文件系统。其采用类似于Linux的树形架构,如下:
C’
快照创建的过程:
•建立一个新的文件 •为这个文件建立与原来文 件完全一样的数据块索引
•将源文件的索引指向新的数据块
19
WA的特点
磁盘块被虚拟化
1. 源盘使用真实块的映射重定向
2. 新写操作定向到空闲块,而不是直接覆盖块
3. 映射反应当前状态和潜在维护多个‚快照‛
性能通常不因源盘/快照改变
源卷
p
快照前写块1
0 a
1 p b 2 4 5 6 1.写操作(‘p’写入块1) 7 8 c e f g h i 3 d
源 盘
9
CoW的实现
SAN访问
阵列
源卷
0 a
快照索引和日志
地址
6 g
数据
快照前写块1 p z
ቤተ መጻሕፍቲ ባይዱ
快照后写块6
源 盘
1 p 2 4 c e f h i 3 d 5 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •不一次性写入 •先将块6内容移入日志 •‘z’写入源卷
阵列
源卷
0 a
快照索引和日志
地址
6 z
数据
快照前写块1 p z
快照后写块6
读块6 读块1
源 盘
g p
1 p 2 4 c e f z g h i 3 d 5 6 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •源卷块6内容不变 •‘z’写入日志 4.从快照读时只访问源卷
1.如果快照是可读/写,快照盘上的写操作直接 更新索引和日志
11
CoW的特点
源卷状态:源卷保持最新状态
写操作步骤:当一个新的写操作执行时:
1. 首先读出写操作将要覆盖地址的当前数据 2. 将读出数据保存至专用空间并建立索引 3. 新的写操作执行(写入目标地址)
读写路径影响
源卷的读路径基本无影响 源卷的写操作受拷贝影响 对快照(卷)的读写路径都有影响
7
常见快照技术分类
全拷贝快照
分离镜像(Splitting a mirror)
差分快照
写即拷贝(CoW : Copy On Write)
写即重定向(RoW : Redirect On Write) 随机写(WA : Write Anywhere)
8
CoW的实现
SAN访问 阵列
WA:Write Anywhere,是在WAFL基础之上的快照技术。
18
基于WAFL文件系统的WA实现举例
快照前 快照后 快照后数据更新
Active FS
Active FS
Snapshot
Active FS
Snapshot
A B C D
A B C D
A B C D
数据写操作:
•找到新的空闲数据块 •写入新数据到空闲数据块
写操作
读和备份
源
镜像
写操作
镜像卷
记录写操作
源
分离镜像
镜像
源
镜像
镜像再同步
6
全拷贝快照的特点
空间占用:每一次全拷贝快照需要与源盘相同大小的数据空间 创建过程:每一次全拷贝快照都需要完全数据同步 读写操作影响 源卷的读操作不受影响 源卷的写操作受数据同步的影响
创建完成后,快照(卷)的读写操作保持最优
6 g z
10
CoW的实现
SAN访问
阵列
源卷
0 a
快照索引和日志
地址
6 g
数据
快照前写块1 p z
快照后写块6
读块6 读块1
源 盘
g p
1 p 2 4 c e f z h i 3 d 5 6 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •不一次性写入 •先将块6内容移入日志 •‘z’写入源卷 4.从快照读时组合索引/日志和源卷
性能受数据碎片影响
1. 快照过程会产生大量的碎片,性能受影响,需要定时整理
快照区大小需要预分配,并受到空间限制
1. 快照区与源数据区需要在同一个文件系统中,因此大小需
要预分配,并受到卷大小的限制
20
THANKS 谢谢
阵列
源卷
0 a
快照索引和日志
地址
6 z
数据
快照前写块1 p z
快照后写块6
源 盘
1 p 2 4 c e f g h i 3 d 5 6 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •源卷块6内容不变 •‘z’写入日志
14
RoW的实现
SAN访问
阵列
源卷
0 a
快照索引和日志
1.如果快照取消,快照日志必需全部执行,以保 证源卷的状态更新到最新
16
RoW的特点
源卷状态:源卷状态冻结
读写操作步骤:
1. 到源盘的新的写操作被存入日志(并索引): 2. 读源卷时,先检索日志 3. 读快照时,源卷需要引用 4. 当快照取消时,写日志必须全部执行以与源卷保证数据状态同步更新
随机写(WA : Write Anywhere)
4
全拷贝快照
分离镜像(Splitting a mirror)
写操作 写操作
镜像子系统 (阵列,逻辑卷管理器,存储网络)
镜像子系统 (阵列,逻辑卷管理器,存储网络)
镜像关系终止
源
镜像
源
镜像
5
分离镜像的生命周期
写操作 原始数据 分离镜像 1.分离镜像 2.从分离镜像备份 3.再同步
什么是快照
Snapshot(http://www.snia.org/dictionary)
A fully usable copy of a defined collection of data that contains an image
of the data as it appeared at the point in time at which the copy was initiated. A snapshot may be either a duplicate or a replicate of the data it represents.
地址
6 z
数据
快照前写块1 p z
快照后写块6
读块6 读块1
源 盘
g p
1 p 2 4 c 3 d e f g h i 5 6 7 8
检索
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •源卷块6内容不变 •‘z’写入日志 4.从快照读时只访问源卷
15
RoW的实现
SAN访问
同时间点的快照恢复数据。
重新定义数据用途 快照提供一份接近实况数据的拷贝,可供测试、归档、查询使用,既 保护生产系统又赋予备份数据新的用途。
3
常见快照技术分类
全拷贝快照
分离镜像(Splitting a mirror)
差分快照
写即拷贝(CoW : Copy On Write)
写即重定向(RoW : Redirect On Write)
参考译文: 快照是特定数据集的一个完整可用拷贝,该数据集包含源数据在拷贝点 的静态映象;快照可以是数据再现的一个副本或者复制。
2
快照的价值
快速备份/恢复 快照可迅速生成,并可用作传统备份和归档的数据源,缩小甚至消除 了数据备份窗口; 快照存储在磁盘上,可以快速直接存取,大大提高数据恢复的速度。 保存多个恢复点目标 基于磁盘的快照使存储设备有灵活和频繁的恢复点,可以快速通过不
两次快照之间的多次写操作
第一次写动作,需要一次读,二次写操作 后续的写动作,只需直接写入到源卷,不再需要拷贝操作
12
RoW的实现
SAN访问
阵列
源卷
0 a
p
快照前写块1
源 盘
1 p b 2 4 5 6 7 8 c e f g h i 3 d
1.写操作(‘p’写入块1)
13
RoW的实现
SAN访问
读写路径影响
源卷的写操作基本无影响 源卷的读路径潜在受影响 快照(卷)的读写路径最优化
源卷的状态不是最新,快照卷故障将会导致源卷数据丢失
17
WA与WAFL
WAFL:Anywhere File Layout,任意位臵写入文件布局,是
Netapp的专利文件系统。其采用类似于Linux的树形架构,如下:
C’
快照创建的过程:
•建立一个新的文件 •为这个文件建立与原来文 件完全一样的数据块索引
•将源文件的索引指向新的数据块
19
WA的特点
磁盘块被虚拟化
1. 源盘使用真实块的映射重定向
2. 新写操作定向到空闲块,而不是直接覆盖块
3. 映射反应当前状态和潜在维护多个‚快照‛
性能通常不因源盘/快照改变
源卷
p
快照前写块1
0 a
1 p b 2 4 5 6 1.写操作(‘p’写入块1) 7 8 c e f g h i 3 d
源 盘
9
CoW的实现
SAN访问
阵列
源卷
0 a
快照索引和日志
地址
6 g
数据
快照前写块1 p z
ቤተ መጻሕፍቲ ባይዱ
快照后写块6
源 盘
1 p 2 4 c e f h i 3 d 5 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •不一次性写入 •先将块6内容移入日志 •‘z’写入源卷
阵列
源卷
0 a
快照索引和日志
地址
6 z
数据
快照前写块1 p z
快照后写块6
读块6 读块1
源 盘
g p
1 p 2 4 c e f z g h i 3 d 5 6 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •源卷块6内容不变 •‘z’写入日志 4.从快照读时只访问源卷
1.如果快照是可读/写,快照盘上的写操作直接 更新索引和日志
11
CoW的特点
源卷状态:源卷保持最新状态
写操作步骤:当一个新的写操作执行时:
1. 首先读出写操作将要覆盖地址的当前数据 2. 将读出数据保存至专用空间并建立索引 3. 新的写操作执行(写入目标地址)
读写路径影响
源卷的读路径基本无影响 源卷的写操作受拷贝影响 对快照(卷)的读写路径都有影响
7
常见快照技术分类
全拷贝快照
分离镜像(Splitting a mirror)
差分快照
写即拷贝(CoW : Copy On Write)
写即重定向(RoW : Redirect On Write) 随机写(WA : Write Anywhere)
8
CoW的实现
SAN访问 阵列
WA:Write Anywhere,是在WAFL基础之上的快照技术。
18
基于WAFL文件系统的WA实现举例
快照前 快照后 快照后数据更新
Active FS
Active FS
Snapshot
Active FS
Snapshot
A B C D
A B C D
A B C D
数据写操作:
•找到新的空闲数据块 •写入新数据到空闲数据块
写操作
读和备份
源
镜像
写操作
镜像卷
记录写操作
源
分离镜像
镜像
源
镜像
镜像再同步
6
全拷贝快照的特点
空间占用:每一次全拷贝快照需要与源盘相同大小的数据空间 创建过程:每一次全拷贝快照都需要完全数据同步 读写操作影响 源卷的读操作不受影响 源卷的写操作受数据同步的影响
创建完成后,快照(卷)的读写操作保持最优
6 g z
10
CoW的实现
SAN访问
阵列
源卷
0 a
快照索引和日志
地址
6 g
数据
快照前写块1 p z
快照后写块6
读块6 读块1
源 盘
g p
1 p 2 4 c e f z h i 3 d 5 6 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •不一次性写入 •先将块6内容移入日志 •‘z’写入源卷 4.从快照读时组合索引/日志和源卷
性能受数据碎片影响
1. 快照过程会产生大量的碎片,性能受影响,需要定时整理
快照区大小需要预分配,并受到空间限制
1. 快照区与源数据区需要在同一个文件系统中,因此大小需
要预分配,并受到卷大小的限制
20
THANKS 谢谢
阵列
源卷
0 a
快照索引和日志
地址
6 z
数据
快照前写块1 p z
快照后写块6
源 盘
1 p 2 4 c e f g h i 3 d 5 6 7 8
快照
1.写操作(‘p’写入块1) 2.产生快照 3.快照后写入‘z’到块6: •源卷块6内容不变 •‘z’写入日志
14
RoW的实现
SAN访问
阵列
源卷
0 a
快照索引和日志
1.如果快照取消,快照日志必需全部执行,以保 证源卷的状态更新到最新
16
RoW的特点
源卷状态:源卷状态冻结
读写操作步骤:
1. 到源盘的新的写操作被存入日志(并索引): 2. 读源卷时,先检索日志 3. 读快照时,源卷需要引用 4. 当快照取消时,写日志必须全部执行以与源卷保证数据状态同步更新
随机写(WA : Write Anywhere)
4
全拷贝快照
分离镜像(Splitting a mirror)
写操作 写操作
镜像子系统 (阵列,逻辑卷管理器,存储网络)
镜像子系统 (阵列,逻辑卷管理器,存储网络)
镜像关系终止
源
镜像
源
镜像
5
分离镜像的生命周期
写操作 原始数据 分离镜像 1.分离镜像 2.从分离镜像备份 3.再同步