数据备份和恢复基础知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据备份和恢复基础知识
1. 什么是数据备份与恢复? (2)
2. 需要备份的数据对象 (3)
3. 备份设备 (4)
4. 备份类型(或备份模式) (4)
5. 备份窗口 (5)
6. 备份介质 (5)
7. 备份策略 (5)
8. 备份系统的逻辑结构和部署 (6)
9. 备份代理(agent) (9)
10. 恢复操作系统 (10)
11. 总结 (10)
数据备份和恢复基础知识
1. 什么是数据备份与恢复?
数据备份与恢复系统是指在运行业务软件的计算机上安装专用的备份软件,该软件将按照计算机管理员设定的规则,周期性地为业务数据制作一个或多个拷贝,并将其存放到专门的备份设备上;当在线存储中的业务数据因为各种原因(如磁盘坏、病毒、误删除等)丢失后,管理员或用户可以通过备份软件提供的GUI, 从备份设备上将数据恢复到在线存储上。一般来说,在线存储是指计算机上存放数据的硬盘或磁盘阵列。存储设备通常是磁带机/磁带、或磁带库,今天也可能是磁盘、或磁盘阵列。Symantec Backup Exec就是典型的备份软件。
例如图书馆的借还书计算机上运行着图书馆软件,数据库采用Sql server, 图书馆所有的书籍信息和借还信息均存放在数据库中,而数据库的数据物理地存放在计算机的硬盘中。显然如果这些数据丢失,图书馆就停止运转了,需要对这台机器上的数据进行保护。在这台计算机上安装Backup Exec, 同时连接一台磁带机,Backup Exec按照计算机管理员的要求,每个星期六晚上将所有Sql Server数据库都制作一个拷贝,并存放到磁带机中的磁带中。一旦Sql server中某条记录丢失,Backup Exec很容易在磁带中找到它的拷贝,并将其恢复到指定的位置。这就是一套数据备份和恢复系统。
管理员
2. 需要备份的数据对象
通常计算机上有三种数据需要备份:文件数据、数据库数据、及裸设备数据
文件数据:文件通常指操作系统中的文件系统直接管理的数据,它是数据在硬盘上的一种存放格式。我们可以通过Windows explore 看到它的存在。在Windows中,一个文件同时只能被一个应用程序读写。这就意味着,当文件正被应用访问时,备份软件是不能够读取它并进行备份的。通常安装一个叫做open file option的软件来协调这种备份操作。
数据库数据:数据库软件(Sql server、oracle等)是指以一定的逻辑关系将数据组织起来,便于用户进行各种计算、更新、检索和查询。符合这种逻辑关系的数据叫数据库数据。它们通常以文件的方式存放在磁盘上、或者直接放到裸设备上,但是文件系统不直接管理它。它们有数据库软件自身进行维护和存取。由于数据库中的数据之间存在着复杂的逻辑关系,且被数据库动态修改,因此当数据库软件正在运行时,不能读取这些数据。即使读出来也不一定能用。所以备份时需要与数据库软件配合,或停掉数据库进程。
裸设备数据:不管文件系统文件还是数据库数据,都存放在磁盘上。Windows提供一种方式可以直接读取磁盘的数据块,而不管它们是什么逻辑关系。这种脱离上层应用的数据叫裸设备数据。
备份设备是指存放数据拷贝的设备,也叫离线设备,通常是磁带机或磁带库。近来随着磁盘价格的下降,很多客户也采用廉价磁盘做备份设备。还有最近出现的虚拟磁带库,它是用磁盘来仿真磁带存放备份数据。在海量存储环境,一般采用磁盘做中间缓冲,磁带做最终备份设备。
很多计算机本身带着一个磁带机,尤其是UNIX服务器。只有磁带机的情况下,需要人工将磁带送进去,或取出来,人工保存磁带。当数据量很大时,人工管理变得不可能。
磁带库是指含有一个或多个磁带机、一定数目的磁带槽和一个机械手的存储设备。机械手负责将磁带槽中的磁带送到磁带机中,或反之;磁带机将要备份的数据写到磁带上,或从磁带上读数据恢复到应用计算机上;磁带槽保存含有关键数据的拷贝。生产磁带库的厂家很多如:HP、IBM、EXBYTE、Quantum等。
虽然磁盘备份开始流行起来,但是大多数用户仍然选用磁带库。
4. 备份类型(或备份模式)
在图书馆的例子中我们说每周备份一次所有的数据,在实际当中是否可行?如果周五的时候发生了问题,数据被破坏,磁盘上的数据不能使用了,那么我们采用计算机上的Backup Exec将数据的拷贝从磁带上重新恢复到磁盘中。但是那是上周六的数据,周一至周五发生的变更全部丢失了。我们能否推荐每天都备份呢?如果数据量小,还可以。如果数据量大,就太花时间,也占有太多的磁带容量。
为了解决上述问题,提出了全备份与增量备份的概念。
全备份是指将所有的数据都备份一遍。
增量备份是指只备份相对于前一天改变过的数据。
还有一种增量备份叫累积增量备份,指备份那些相对于上一次全备份以来改变过的数据。在图书馆的例子中,我们可以每周六做全备份,周日至周五做增量备份或累积增量备份。这样一来,当周五出问题时,可以恢复上周六的全备份,及周一至周四的增量备份(或周四的累积增量备份),数据丢失从五天减到几小时。而磁带容量增加的并不多。
在建立一个备份系统时,有一个重要因素要考虑,那就是每次数据备份允许在多长时间内完成。数据备份的过程是将数据从在线磁盘上取出来,然后传送到离线设备上。在这个过程中,运行应用的计算机需要花CPU资源、内存资源、及I/O带宽来处理备份,肯定会影响应用程序的正常运行效率。一般只允许在业务不繁忙的时间段内来完成备份,以减轻影响。这个时间段就叫备份窗口。备份窗口是指允许完成备份的时间长度。
例如我们个人笔记本电脑上可能安装了备份软件,每次备份软件运行时,机器慢的我们几乎不能进行日常工作。我们的工作时间是早9:00至晚6:00, 但常常会加班至晚12:00. 因此为了不影响工作,我们要求管理员只能在0:00-9:00这9个小时内为我们做备份。这就是我们笔记本的备份窗口,长度为9小时。
显然备份窗口的长短直接影响投资成本。例如需要备份的数据600G,备份窗口为4小时,如果采用LTO磁带库,那么我们需要600*1024/(4*3600*30)=1.4个磁带机,即至少两个。(这里没有考虑磁盘I/O是否可以支持,实际当中需要考虑)
6. 备份介质
在备份与恢复系统中备份介质往往指磁带。介质服务器指的是连接磁带库、且运行备份软件的计算机,它通常负责将它自身或其它计算机上的数据拷贝传送给磁带机,由磁带机写到磁带中。
一般在备份系统中将磁带库中的介质分成介质池(media pool),以便将不同应用(或计算机)的数据存放到不同的磁带组中,便于分类。
备份介质既可以保存在与备份服务器连接的磁带库中,也可以取出来异地保存,取决于你的备份策略
7. 备份策略
在上面图书馆的例子中,我们提到备份软件按照计算机管理员设定的规则,将在线数据备份到备份设备上。这里提到的规则就是指备份策略。备份策略通常指将哪些计算机上的什