IBM磁带机备份故障
磁带机故障问题 与处理方法
技术文档模板版本说明目录版本说明 (2)1 背景描述 (4)2磁带机故障问题处理常见方法与操作步骤 (4)2.1二级标题 (4)2.2二级标题 (4)2.3二级标题 ........................................................................................................................ 错误!未定义书签。
1 背景描述黑龙江联通业务支撑部HP 小型机维保项目,因该项目之重要,而且业务都是计费等重要的核心业务,所以备份问题尤为重要了。
然而现场环境是很多磁带机备份根系统是报各式各样的错误,从而导致无法系统备份,这样就给系统的稳定带来隐患。
为此针对各种磁带机备份问题,进行实际解决与处理方法的总结,与大家一同分享。
2磁带机常见问题与解决方法2.1磁带机常见问题1、磁带机黄色告警灯亮2、磁带机自动吐带3、磁带机SCSI ID跳错4、磁带机驱动丢失或驱动不正确5、因出现僵死的备份进程,磁带机无法读带从而无法备份6、/var空间不足,引起磁带机无法备份7、 ignite –ux软件版本较旧,而导致备份的磁带信息不完整8、备份make命令因path环境变量丢失,而引起磁带机备份时报无此命令,无法备份2.2 磁带机常见问题检查步骤1、告警时或者无法备份时,首先检查线缆和终结器是否故障,磁带机是否告警灯亮2、磁带是否是DDS3或者磁带是否与磁带机兼容3、检查磁带机箱5300指示灯是否正常,请参考5300手册4、查看磁带机后面连接线缆的旁边的小按钮,上面显示的SCSI ID 是否是7。
如果是需要调整过来。
5登录系统,ioscan –fnCtape 是否是NO_HW状态;同时ioscan查看是否是HP型号的磁带机,如果不是,是外挂的,需查看是否是光纤连接的磁带机,如果是,那么光纤的磁带机是无法用make_tape_revovery备份的。
磁带库典型故障处理案例分析
磁带库典型故障处理案例分析在STK L180磁带库上爬过的坑故事发生在几年前,在更换机房的一组光纤交换机的实施过程中,原光纤交换机因使用超限,决定将其更换为博科DS5100。
交换机下联设备有存储、小型机、磁带库。
光纤交换机使用端口zone,并反复确认了zone配置信息。
切换当天,按照计划顺利实施。
验证小型机和存储链路均正常。
但业务验证时发现,NBU备份软件中,手动执行备份任务,有部分失败。
故障现象:查看NBU备份软件中日志,关于执行备份任务的报错,发现在STK L180磁带库上执行的备份任务均失败。
检查过程:首先,查看光纤链路标签,确认实施前后一致。
接着,确认DS5100光纤交换机与L180磁带库的端口和ZONE划分也配置正确。
然后,详细分析了交换机log信息,发现连接磁带机光纤卡的两个端口,只有FX流,没有RX数据流。
根据,以上故障现象及检查方式,基本上先排除光纤交换机和光纤链路的问题。
问题聚焦在STK L180磁带库上。
因平时很少出现问题,面对这台老古董,确实无从下手。
L180磁带库有3块光纤卡,其中一块为机械臂的光纤卡,另两块为磁带机的光纤卡。
重新手动发起备份任务,观察老古董的工作,发现其机械臂可将磁带抓入磁带机,但两个磁带机均无法进行正常读写。
备份任务无法正常执行。
初步怀疑是两台磁带机的光纤卡有问题,可是磁带机上的光纤卡上连指示灯都没有,继续崩溃中。
硬着头皮在L180磁带机的面板中翻看信息,状态显示都正常无报错信息。
继续仔细检查,发现两个磁带机的光纤卡速率speed仅为1 GBIT。
显示信息:speed : 1GBIT1GBIT?会不会是跟新更换光纤交换机的端口速率不匹配呢?可是怎么修改磁带库的光纤卡速率呢?在面板上把所有选项翻个遍,根本没有更改端口速率的选项。
心想,先不在这台老古董上浪费时间吧,去光纤交换机上改下吧。
紧接着登录到DS5100光纤交换机上,查看磁带机连接的端口模式为自适应,会不会是无法自适应1GBIT呢?决定将光纤交换机的该端口速率强制为1GBIT,修改后,重新执行备份任务,老古董的机械臂将磁带抓入磁带机中,然后就没有声音了。
备份磁带库故障排除手册
备份磁带库 故障排除手册Content Introduction (3)Platform Problems (3)Host Lock Out (3)Error Recovery (4)Error Recovery Procedures (5)Fault Symptom Codes (5)IntroductionThis manual describes the error messages and descriptions that may be displayed when there is a possible malfunction, including:Platform ProblemsHost Lock OutError RecoveryFault Symptom CodesPlatform ProblemsAn incorrect installation or configuration can cause platform problems. In this case, the library appears to be operating normally, but no data can be interchanged. You also might or might not get an error code on the touch screen Graphical User Interface (GUI). To identify an error caused by this type of problem, check your installation and configuration setup. See Chapter 2, “Installation and Setup,” for information on how to correctly install and configure the library.General drive errors usually result from a miscommunication between the library and the tape drive or a mechanical malfunction within the library. Both platform problems and general drive errors display an error message and a Fault Symptom Code (FSC) on the touchscreen GUI. Use an FSC to report errors to your service provider, or in some cases, to determine a recovery procedure.Host Lock OutAccess to the library’s media and magazines can be locked by the backup software running on the host (for example, Veritas’s Netbackup). The library provides no touch screen GUI override for this condition. Exiting the host software also locks media access.Tip: If you are unable to access the library’s magazine or media, check to see if the host backup software has blocked access to the NEO library.Error RecoveryFigure 9-1 outlines the recommended steps for error recovery. You should follow this chart in all cases.Error Recovery Procedures (ERPs) are listed in detail in Table 1-1.Fault symptom codes are listed in Table 1-2 along with their related ERPs.Troubleshooting and Error RecoveryFigure 1: Troubleshooting Flow ChartError Recovery ProceduresTable 1-1 lists ERPs for errors reported on the touch screen GUI of the library. This list includes only those procedures that can be safely performed by an end user.Table 1-1: Error Recovery ProceduresFault Symptom CodesFault symptom codes (FSCs) that appear on the touch screen GUI are described in the tables below. A descriptive message and instructions for clearing the fault accompany each FSC. If a fault persists, look up the FSC in Table 1-2 to determine the error recovery procedure or to report it to your service provider.Table 1-2: Fault Symptom Codes。
IBM磁带存储TS3XXX用法以及常见问题解决
140MB/s
Generation 1
Generation II
Generation III
Generation IV
generation V
100 GB 15 MB/S
8 FC-1, Ultra II
Full High MP 609M 4 M/S 6 M/S No 384
124 kbpi
200 GB 35 MB/S
•1-4 LTO Ultrium 5 HH Drive Features •HH SAS or Fibre •3-slot I/O
•48 DataCartridge Slots
•Standalone or Rack
•Multi-Path Architecture •LTO Gen 5 Media
•LTO Gen 5/4 Encryption
TS3100 (3573)
T S3200 (3573)
T S3310 (3576)
3 or 4 HH or FH
1 FH or 2 HH 24
3 or 4 HH or FH
2 FH or 4 HH 48
3 or 4 FH
18 403
TS3500 (3584)
3 or 4 FH 192
+20,000
IBM LTO Ultrium 5 HH Product Family
Generation 1 100 GB
Generation 2 200 GB
Generation 3 400 GB
Generation 4 800 GB
Next Generation 5
1.5 TB
15 MB/sec
20 - 40 MB/sec 40 - 80 MB/sec 80-120 MB/sec
磁带机常见故障分析
磁带机常见故障分析磁带机常见故障分析2010-08-01 22:29磁带机常见故障磁带故障最常见的原因答:正常的磨损可以导致磁带损坏,如磁带读写数据时与读/写磁头表面长时间地一遍一遍地摩擦。
备份管理员操作磁带时,磁带可能被丢来丢去,一层一层地码放在金属盒子里面,或者受到振动导致磁带盒里脆弱的部件损坏。
也有环境问题导致的磁带损坏。
高温或者低温,湿度,灰尘都可以导致磁带故障。
当然也有磁带机里磁带旋转时的转动传送的问题。
问:除了磁带故障外,关于磁带操作我们还需要注意哪些问题?答:使用备份监视软件监视磁带盒磁带机,这样你就可以知道磁带和磁带机的质量和性能是否已经开始变差。
这样你就可以进一步知道某一磁带上的数据是否需要迁移到新的磁带上去。
要记住两件最重要的事情:操作磁带要轻拿轻放;随时监视磁带。
这样你就可以明确地知道他们执行状态是否良好,是否出现了某些质量问题。
问:2-4GB的HP DDS数据磁带的使用寿命大约为多长?答:据惠普称,DDS系列数据磁带产品至少可承受2,000次读写或100次完全备份,也就是说,可以保证10年的存档寿命。
问:磁带应该有多长的使用寿命?答:如果你问的是磁带的记忆能力而不是存储介质的记忆能力,通常没法给出一个确切的答案(至少我个人意见如此)。
问题的答案依赖于你所处的环境。
首先,要看你究竟使用的是何种存储介质以及它们预定的总读写次数。
然后将这项数据和你一周内对它的读写次数进行比较。
记住,磁头每经过磁带一次,"读写次数"都要增加一次,包括倒带、快进等都要计算在内。
经常会有一些人会发现他们永远也不会使用到自己磁带的极限读写次数。
当然,如果你不均匀地使用你的磁带,而像擦皮鞋一样经常的读写某段磁带(很多人都是这样),那么事情就没法预料了。
这种做法会显著增加你的磁带中某一段的数据读写次数,从而大大降低磁带的寿命。
最简单的回答是:"把磁带一直用到它报废,然后将它扔到一边儿去!"如何防止磁带恢复失效曾经人们都开玩笑说:"备份永远不会出错,只有恢复才会失效。
IBM的存储备份解决方案
IBM的存储备份解决方案在企业对信息的依赖性越来越强的今天,信息已经成为企业的生命源泉,有效地防范系统的突发事件,在尽可能低的运作成本和拥有成本的前提下,提高信息可靠性和可用性已经成为每个企业信息化工作急需要解决的内容和关键性问题。
企业内需要有统一的存储管理策略,建立安全、可靠、高效的备份和恢复管理体制,将日常数据的集中安全管理与灾难恢复系统的建设结合起来。
要实现以上的目标,有必要在数据管理上做到自动化备份,实现无忧化集中管理,并能实现高效、简单的灾难恢复功能。
IBM公司存储系统部成立于1956年(世界上第一块硬盘就是IBM公司生产的),IBM 公司的SSA磁盘系统和Magstar磁带系统更是业界领先的产品在国内外已经有非常成熟的应用和丰富的经验。
一、备份管理的模式当前由于历史和地理上的原因,数据通常是分布在不同的服务器之上。
随着服务器功能的越来越强大、数据量的急剧增加,越来越多的用户希望对企业内的数据进行集中管理。
这样的优势在于:便于用户分析、应用用户宝贵的数据资源;便于用户管理,可以减少存储管理的成本;便于数据的整合,为今后的服务器整合打下基础。
根据本期题目的需求,IBM公司建议用户采用服务器/客户端模式,在北京总公司建立一个备份服务器,而其他的所有设备都可以作为它的客户端。
二、备份存储的配置方案在北京总公司,配置一台Windows NT服务器,其上运行IBM的存储管理软件ADSM(ADSTAR分布式存储管理),连接一台IBM Magstar3570多用途高速磁带库(容量为140GB,非压缩),对本地用户通过LAN的方式直接访问,对上海、广州的用户通过专线来进行备份。
IBM的ADSM软件客户端支持各种流行平台,可以支持广泛的网络协议。
配置方案简图如图1所示。
图1三、主要存储设备简介IBM Magstar3570多用途磁带库,采用IBM先进的Magstar磁带技术,性能卓著、可靠性高。
其主要技术优势有:采用金属介质带,可靠性高;采用每秒7MB的传输速度的磁带驱动器,速度快;使用条码阅读器,配合每盘磁带上的条形码、自动管理软件,可以实现磁带库的自动化管理;独特的双轴卷带技术,性能较单轴磁带快一倍;独特的磁带不出磁带仓的设计(磁头伸入磁带去读数据),磁带寿命大提高(防灰尘、防机械磨损);伺服轨道的设计,大大地提高了数据访问的准确性;卷控制区(VCR)的设计,大大地提高了数据访问的速度;采用磁带RAID技术,大大地提高了可靠性;采用线性扫描技术,较螺旋扫描有更高的可靠性;采用磁阻磁头的先进技术。
BM TSM 存储备份系统 介质故障原因分析及解决办法
IBM TSM 存储备份系统介质故障原因分析及解决办法存储备份系统报介质故障是TSM 运维过程中常见故障之一;这里不是指硬件设备故障(硬件故障必须报IBM 800 售后),这里的介质故障指的是TSM备份软件中定义的磁带库设备由于机房断电、SAN交换机ZONE信息更改等原因导致TSM配置信息与系统重新识别到的磁带库设备信息不一致,引起的故障。
一、案例:1、查看rman备份报错日志channel t2: starting piece 1 at 2015.08.24 01:00:19 RMAN-03009: failure of backup command on t1 channel at 0 8/24/2015 01:00:26ORA-19502: write error on file "oracle_full_DB_1537363504 _1279_1_759978018_20150824"", blockno 1 (blocksize=512)ORA-27030: skgfwrt: sbtwrite2 returned errorORA-19511: Error received from media manager layer, error text:ANS1312E (RC12) Server media mount not possible channel t1 disabled, job failed on it will be run on another ch annel released channel: t1 released channel: t2RMAN-00569: ========= ERROR MESSAGE STACK FOLLO WS ========RMAN-03009: failure of backup command on t2 channel at 0 8/24/2015 01:00:26ORA-19502: write error on file "oracle_full_SBDB_11373635 04_1280_1_759978018_20110824"", blockno 1 (blocksize=5 12)ORA-27030: skgfwrt: sbtwrite2 returned errorORA-19511: Error received from media manager layer, error text:ANS1312E (RC12) Server media mount not possible2、故障原因工程师描述:机房停电,重新启动磁带库和备份服务器后,备份不成功。
磁带较脆弱,备份时容易出现介质错误及损坏,复写能力差
可管理性
状态、容量等信 息需要从备份软 件间接获取,不 易管理
web界面管理
SEPATON的VTL可以通过web界面远程访问,更可以通过邮件,进 行告警通知;由于SEPATON VTL内部程序和服务器及存储组件实现 了API的开发,因此可以对所有硬件的工况进行监控,并实现故障自 动告警诊断定位,指导使用者更换故障部件(此项目为SEPATON独 有)。
容量的扩展
不易扩容,通常 需要再购买一套 磁带库
两种容量扩容方 SEPATON的VTL可以通过增加磁盘扩容,也可以通过添加重删 式,根据需求选择 license后,删除VTL中重复数据,达到扩容效果
性能扩展
备份性能 恢复性能 (RPO,RTO) 升级成本 灾备功能 投资保护性
需要购买磁带机 或者磁带库
项目
物理磁带库
虚拟磁带库
说明
质错误及损坏,复写能力差,需要 持续的补充,因此开销成本累计较大;磁带保存环境要求严格,否 则会造成磁带粘连,发霉,导致数据丢失;而磁盘复写能力高,具 有一定的厂商免费维修更换,并且可以通过续保方式延续这种保 证,介质开销成本累计销;并且磁盘利用的RAID技术,用于存放数 据更安全。
维护成本
较高
可开发性
没有
较低 很高
PTL由于机械手,磁带机等设备故障率较高,其维护成本会逐年提 高,每年的维护费几乎是其设备费用的30%。
因为SEPATON VTL基于主机和操作系统建立,其具有很高的应用功 能开发能力,可以基于这个系统环境,后续开发并使用很多功能强 大的软件,来实现超过备份基本功能的其他处理能力,而这个是PTL 不具备并且在未来也不可能具备的特性
性故障,以及因为老化导致的永久性故障。VTL不存在机械装置, 不存在卡带等故障,不会出现磁带I/O错误,不会具有疲劳性操作故 障,其老化情况要比机械磁带缓慢的多。
IBM 磁带存储TS3XXX用法以及常见问题解决
TS2900连接方式 连
TS2900磁带自动装入器,
只支持SAS驱动器 (LTO3,LTO4)
1. 以太网线 2. SAS连接线 3. 电源线
TS3100/TS3200磁带驱动器类型与连接 磁
SCSI接 口 驱 动 器 , 无 接 “ WRAP”标 识 终 结 器 标
FC接 口 驱 动 器 , 每 驱 接 动 器 只 有 一 个 可 用 FC 端口
IBM存储售后主要问题,Session 3: 存 : IBM 磁带存储 TS2900/TS3100/TS3200/TS3310用法 用 及常见问题解决
Innovation that matters
Tian XiaoLu Techline Storage Team
Topic
IBM LTO 磁带库产品简介 磁带库初始化安装 IBM LTO磁带库管理/使用以及配置 磁 使 如何定义清洁槽和使用清洁功能 各操作系统下驱动程序的下载以及安装 诊断工具简介 :TapeUtil/NTUtil/ITDT LTO磁带库 常见问题以及解决 方法 磁
1. 在 液 晶 面 板 主 菜 单 项 中 选 择 : Unlock I/ O Station 2. 在 I/O Station里 放 入 数 据 带 . 里
放 TS3200/TS3100 如 何通 过I/O Slot放 磁带
1.通 过 液 晶 面 板 菜 单 项 设 置 : Control通 >Open I/O Station 2. 在 I/O Station里 放 入 数 据 带 . 里
放 TS3310 如何通过I/O Slot放 磁带
1. 查 看 逻 辑 带 库 可 用 的 storage slots , 通 过 web菜 单 选 项 Monitor System-> 菜 Library Map. 2. 在 I/O Station里 放 入 数 据 带 . 里 3. 从 液 晶 面 板 菜 单 项 : Operations >Insert Media 或 从 Web 管 理 界 面 : Manage Cartridges->I/O Station
磁带机故障问题 与处理方法
技术文档模板版本说明目录版本说明 (2)1 背景描述 (4)2磁带机故障问题处理常见方法与操作步骤 (4)2.1二级标题 (4)2.2二级标题 (4)2.3二级标题 ........................................................................................................................ 错误!未定义书签。
1 背景描述黑龙江联通业务支撑部HP 小型机维保项目,因该项目之重要,而且业务都是计费等重要的核心业务,所以备份问题尤为重要了。
然而现场环境是很多磁带机备份根系统是报各式各样的错误,从而导致无法系统备份,这样就给系统的稳定带来隐患。
为此针对各种磁带机备份问题,进行实际解决与处理方法的总结,与大家一同分享。
2磁带机常见问题与解决方法2.1磁带机常见问题1、磁带机黄色告警灯亮2、磁带机自动吐带3、磁带机SCSI ID跳错4、磁带机驱动丢失或驱动不正确5、因出现僵死的备份进程,磁带机无法读带从而无法备份6、/var空间不足,引起磁带机无法备份7、 ignite –ux软件版本较旧,而导致备份的磁带信息不完整8、备份make命令因path环境变量丢失,而引起磁带机备份时报无此命令,无法备份2.2 磁带机常见问题检查步骤1、告警时或者无法备份时,首先检查线缆和终结器是否故障,磁带机是否告警灯亮2、磁带是否是DDS3或者磁带是否与磁带机兼容3、检查磁带机箱5300指示灯是否正常,请参考5300手册4、查看磁带机后面连接线缆的旁边的小按钮,上面显示的SCSI ID 是否是7。
如果是需要调整过来。
5登录系统,ioscan –fnCtape 是否是NO_HW状态;同时ioscan查看是否是HP型号的磁带机,如果不是,是外挂的,需查看是否是光纤连接的磁带机,如果是,那么光纤的磁带机是无法用make_tape_revovery备份的。
IBM- TSM 存储备份解决方案
分散备份管理
管理员逐一登录到各个需要保护的系统。 管理员逐一登录到各个需要保护的系统。 对各个需要保护的系统分别设定备份规则。 对各个需要保护的系统分别设定备份规则。 难以通过集中管理实现基于策略的自动化备份。 难以通过集中管理实现基于策略的自动化备份。 备份数据难以方便的集中到集中的存储设备上。 备份数据难以方便的集中到集中的存储设备上。 恢复复杂度高。 恢复复杂度高。
Windows Linux HP Unix Sun Solaris
14
2006 Storage Solutions Strategy and Overview
© 2006 IBM Corporation
Tivoli Storage Solutions
备份的基本方式( 应用在线备份的传输 ——备份的基本方式(LAN) 备份的基本方式 )
13
2006 Storage Solutions Strategy and Overview
© 2006 IBM Corporation
Tivoli Storage Solutions
集中存储备份解决方案 - IBM Tivoli Storage Manager (TSM)
裸机恢复
AIX 重建操作系统 恢复目标数据 基于SMIT工具 工具 基于
应用在线备份
数据库接口/ 数据库接口 应用接口
TSM Data Protector TSM API 在线应用 API
TSM API调用
TSM 服务器
TSM Data Protector Lotus Domino - NT, AIX, HP-UX, Sun Solaris, OS/390, OS/400, Linux. Oracle - NT, AIX, HP-UX, Sun Solaris, Linux. Informix - AIX, HP-UX, Sun Solaris, Linux SAP R/3 - NT, AIX, HP-UX, Sun Solaris, Tru64 UNIX, Linux MS SQL Server - NT MS Exchange - NT Webshpere Application Server - NT, AIX, HP-UX, Sun Solaris, Linux ……
IBM 3583磁带库故障诊断及维修分析
磁带库设备经过长时间的运行,易产生各种各样的故障,导致设备停止运行影响,严重的甚至会出现设备事故。
其故障大致可分为两大类:①硬件故障。
如机械手、电源、主控板、液晶屏、驱动器等。
这类故障往往是非法断电、非法操作等原因所致。
②软件故障。
这类故障是检修的难点,其主要问题在存储系统的软件报错从而使机器无法正常工作等。
1检修前的调查研究调查研究是设备检修的前奏,是故障分析的第一手资料,调查研究正确、全面,对检修工作往往起到事半功倍的效果。
调查研究的主要方法是问、闻、看、听①问,询问设备使用者故障发生前的情形、异常现象、以往故障情况、故障前有否操作失当等。
②闻,是否有绝缘漆、塑料、橡胶等过热、烧焦的刺鼻气味。
③看,察看带库的报错日志。
④听,将带库重启后听是否有异常声音。
通过调查研究,一般说来,直观性一类故障可找出。
2全面检测确定故障范围与故障点复杂带库设备的故障,应根据错误日志和故障现象,分析确定故障的可能范围,查找故障点。
带库设备的主体是由机械手、主控板、电源等构成,电源故障一般简单、直观、易于查找。
一般都是加电后电源无法应等。
其他的故障较难判断 下面已IBM 3583带库维修为例进行分析。
这属于中型磁带库,一般都应用在数据较大的场合,目前应用比较广泛2010年3月份中国移动哈尔滨数据中心机房3583带库故障,机械臂移动磁带时卡带,之后机械臂无法移动。
这种带库机械手故障率较高,但机械手维修较为繁杂,工程师通过对现场机械臂的观察,发现机械臂主控板故障,公司将备件发到客户现场工程师进行更换,更换完机械臂等带库自检完成后,带库运行正常。
北京鑫博腾飞。
数据备份失败的原因及解决办法
数据备份失败的原因及解决办法磁盘数据备份是任何数据保护策略的最重要的工作,但是,根据一些估计,一半以上的备份要么全部失败,要么就部分失败。
当你在查找备份失败的原因时,相同的问题总是不断地重复出现。
下面是一个关于引起备份失败的常见问题的清单,清单中所列问题的顺序是按照其出现频率由多到少排列的。
1 .磁碟错误:磁碟失效几乎在所有关于备份和恢复失败清单中都排在第一位。
基于此,重新审视备份所用的磁碟并聪明地对其加以运用就显得尤为重要了。
关于磁盘备份,这意味着确保你在处理和存储、有规则地替换磁盘以及根据制造商的计划清除驱动程序时能够根据软件供应商的向导来进行。
这也意味着废弃任何可疑的磁盘。
不要认为基于光盘的备份能够让你免受磁碟失效之苦。
尽管用光盘备份发生磁碟失效的情况比用磁带磁盘备份要低很多,但这种失效仍然有可能发生。
比如,在备份时常常使用SATA光盘阵列,因为这种这些阵列成本更低,而且在这种情况下,较低性能的系统也能支持备份。
然而,把“较低性能”与“较低可靠性”等同起来却是一大错误。
通过使用没有多余能量供应和热备品光盘等特征的备份阵列来节约花费会使数据面临风险。
2.人为操作出错:尽管这类错误排在第二位,但人为操作出错可能导致备份失败的最可能的原因。
比如,如果磁盘在使用中没有得到正确地储存,那么这究竟算是人为因素还是磁碟因素导致的失败呢? 通常,在任何备份失败中,认为因素都是一个很显著的因素。
在备份中针对人为出错的最佳保护措施就是对进行备份操作的员工进行培训,以使他们按照最好的操作规程来进行。
确保进行备份和存储的员工能够准确地理解他们需要做什么一一以及不需要做什么。
这也是尽可能地使人们摆脱循环的一个好办法。
在理想的情况下,备份不需要采取任何人为行为。
尤其要注意那些备份不是某个人的主要职责的情形——例如,在分公司被要求每晚进行磁盘备份的某个职员。
3.软件错误:有些时候,新的软件或者某个软件的新版本也可能会导致备份失败。
3592磁带机的故障分析
3592磁带机的故障分析摘要:IBM公司推出的3592磁带机成为各大油田勘探使用的主要记录单元,本文主要介绍3592磁带机野外使用时所出现的问题以及解决办法,通过介绍,帮助大家更好的了解和解决实际问题。
关键词:3592;磁带机;记录单元0、引言从近几年地震采集技术的发展趋势来看,三维地震勘探逐渐向小道距、高道数方向发展,目前最大采集道数已经超过3000道,勘探方向由过去的浅、薄油层转向深层的天然气方向,这样记录时间长度达到七秒,每炮的数据量达到80多兆,而每盘3490磁带只能记录8-10炮左右,磁带机的记录速度(每炮记录时间达到1分钟以上)已经严重影响生产速度的进行。
考虑到提高野外生产,大庆物探公司引进了IBM公司生产的3592磁带机。
1、3592磁带机使用常见故障及分析解决方法作为刚刚推向市场的最新一代记录系统,3592磁带机表现出了强大功能,但部分功能不是很理想,甚至存在漏洞等不完善的地方,我们在生产实践中发现并解决了一系列的问题,这些问题的解决大大提高了仪器的稳定性,使系统3592磁带机的生产效率得到了提高,在具体的使用过程中,发现了这么几个问题: 故障现象1在磁带机显示框右下脚出现“F”或“ ”的情况,这种显示状态对内部数据记带是没有任何影响,和正常的内部数据记带一样,但是这种故障会直接影响到3592磁带机的维护。
解决办法在磁带机的显示框下面有一个样子的标符,按一下,然后在显示栏中按照以下路径选择——CEOFFLIN EMOD E——DUMP——CLEARFLAS HD UMP选择完后要对磁带机进行复位,这样就可以消除这样的状态。
以保证对磁带机更好的维护。
故障现象2在磁带机显示框中提示A TTNDRV这样的状态,这是一个人为性的操作错误信息,主要是在操作中没有正确装入或者卸载磁带时导致的。
解决办法:出现这种故障一定要对磁带机系统进行修复,首先确定磁带机内没有数据带,然后按一下附图中的复位按钮进行复位,复位结束后关机重新启动,磁带机内部将对自身进行自动检测,检测过程大约需要15分钟左右,检测完成后,A TTN DRV状态就会自动消失,磁带机恢复正常工作。
NBU常见故障处理
NBU常见错误及故障解决 典型故障一常见错误及故障解决常见错误解决Veritas Netbackup提供了强大的故障响应功能,能够有效及时的处理各种备份故障。
主要有备份状态码(status)、错误信息、报告信息及调试日志。
下面我们主要针对备份状态码讲解下各种常见的错误及故障处理办法。
Backup 状态码:0消息:请求的操作成功完成解释:对于请求的操作,没有检测到任何问题。
Backup 状态码:1消息:请求的操作部分成功解释:在执行请求的操作的过程中,检测到一个可能需要更正操作的问题。
推荐的操作:确保该备份文件当前未被使用或修改。
检查文件或目录路径的长度是否超过了1023 个字符。
无法打开文件。
检查文件的权限或目录中是否有隐藏文件Backup 状态码:2消息:请求的文件都未备份解释:备份或归档操作无法备份文件列表中的任何文件。
推荐的操作:验证这些文件是否存在以及您是否有读取这些文件的权限。
查看客户机的文件列表,确定其中是否有一个或多个文件名中存在结尾空格。
删除所有无意中添加的尾随字符。
在Windows 客户机上,验证用来启动NetBackup 客户机服务的帐户是否有读取这些文件的权限。
Backup 状态码:6消息:备份操作未能备份请求的文件解释:所出现的错误导致用户备份失败。
推荐的操作:验证您是否具有读取这些文件的权限。
检查文件读取权限或Windows上的用户权限。
对于数据库扩展客户机(如NetBackup for Oracle),这可能意味着控制备份的脚本出现问题。
详细信息请查看脚本的Out文件和错误信息。
Backup 状态码:41消息:网络连接超时解释:服务器太长时间没有收到来自该客户机的任何信息。
推荐的操作:NetBackup 服务器上使用“主机属性”,更改客户机连接超时(Client connect timeout)或客户机读取超时(Client read timeout)。
默认为300秒。
文件不是有效的磁带格式备份集
文件不是有效的磁带格式备份集在进行数据备份时,经常会使用磁带作为存储介质。
但有时在还原备份时,可能会遇到“文件不是有效的磁带格式备份集”这样的错误提示,导致备份不能正常还原。
那么这个错误的产生原因和解决方法是什么呢?造成此错误的主要原因是备份文件可能已经被破坏或损坏,或者备份介质(磁带)本身有问题。
在这种情况下,我们需要采取相应的措施来修复数据,并进行数据恢复。
以下是一些可行的解决方案:1. 进行磁带检查在磁带备份时,使用的磁带有可能已经受损或老化。
因此,我们需要首先检查磁带的健康状态。
可以使用测试软件,如LTO tape tool,进行磁带检测。
这种软件可以检查磁带中的坏块,并指示文件是否已被破坏。
2. 恢复备份文件如果备份文件已经被破坏,我们需要采取措施恢复它们。
可以使用一些数据恢复软件,如Recuva、EaseUS data recovery等。
这些软件可以扫描受损的硬盘或移动介质上的备份文件并恢复损坏或丢失的文件。
在使用这些软件时,确保制作备份,以避免进一步破坏或丢失数据。
3. 正确的备份操作避免备份文件损坏的最佳方式是使用正确的备份操作。
在备份文件之前,我们需要确保备份文件的校验和。
在进行备份后,在必要时,需要还原备份以验证其完整性。
同时,建议定期将数据备份到多个介质上,以防止单点故障导致数据丢失。
总之,在进行数据备份和恢复时,我们需要时刻保持警惕,并采取必要的预防措施。
如果遇到任何不可预测的问题,不要轻易放弃,而是需要找到正确的解决方案来解决问题。
这样,我们就可以确保我们数据的安全和完整性,避免焦虑和损失。
把IBM带库中的磁带取出测试后,重新放入需要TSM重新定义卷、存储池
把IBM带库中的磁带取出测试后,重新放入需要TSM重新定义卷、存储池环境:Windows 2003 的Tivoli Storage Manager5.4.0.0AIX5.3上的Oracle10.2.0.1.0IBM的SCSI 3310LIB 2T的带库描述:1、把带库中的磁带拿出来做测试,2、测试完毕就手工的把磁带放入带库中3、然后发现TSM不能正常备份了原因:磁带中的数据已经读写过,不是原来的数据,因此需要重新在TSM server中重新设置带库。
确定在TSM Server中能够识别带库的Library、Driver、磁带(卷)不能备份主要原因是在TSM Server中不能识别带库中的磁带解决方法:1、在TSM Server的命令行:查看带库磁带:show slots 3100lib没有相关的磁带信息还可以用q libv 查看磁带的相关信息,如果信息错误确定磁带是否正确放入到带库中。
2、下面具体操作:3.1 把磁带正确放入到带库中,确保磁带机器的屏幕没有相关的错误信息。
3.2 TSM 命令行命令:LABEL libv 3100lib search=b labels=b checkin=scr verwrite=yes日志:日期/时间: 06/03/2009 10:55:02消息: ANR8373I 001:用所有 LTO 卷填充库 3100LIB 的信息量大的入/出端口,该操作在 60 内处理;当就绪时发出当就绪时,发出'REPLY' 与请求标识。
(会话: 18, 进程: 3)命令:QUERY PROCESS命令:REPLY 1日志:日期/时间: 06/03/2009 11:10:35消息: ANR8816E LABEL LIBVOLUME:无法标记库 3100LIB 中的卷746ABAL3,因为它当前在存储池或卷历史文件中定义。
(会话: 18, 进程: 3)日期/时间: 06/03/2009 11:10:35消息: ANR9756I 没有找到卷。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IBM磁带机备份故障
前不久公司的LOTUS服务器突然备份不成功(连接磁带机为IBM ULT3580-TD1,备份软件为Symantec Backup Exec 10d),忙查看作业日志,在完成状态项中报错代码为:0xe00084ed-硬件出错;存储设备"IBM1"报告一个请求从介质中读取数据的错误.错误报告为:由于I/O设备错误,无法运行此请求.
看到这些就进行了简单的分析:磁带才用一年左右应该没问题,磁盘SCSI驱动没人动过也该没问题,那就只有是磁带机的问题了,因为这玩艺儿用了两年多并且天天都备份较长时间,于是动手更换另一台备份机过来(注:对于2003server可以关掉磁带机电源,直接拔出数据线并可以直接插入新的备份机但切勿将备份机电源打开插入,需数据线和电源线接好后再开开关,而2000server按同样方法拔出会蓝屏,接入后开磁带机开关也蓝屏,所以最好关机情况下插拔),测试备份成功于是那个高兴啊;可没过几天又一次备份失败,有点郁闷了,又一次的反复查看日志文件,最后发现屏幕右下角的一个SQL服务图标不见了(此图标不知道有什么用,虽然没用SQL),又重装BACKUP软件才算得以解决.对于文件服务器的备份最近也出了问题,情况和另一台差不多,屏幕右下角也没有备份的SQL服务图标,重装备份软件后出现了,备份一个文件试了试也正常,但一全选D盘中的文件就失败,报警提示快照其间出现故障,经过自习查看才发现把BACKUP软件本身的隐藏文件也打上勾了,怪不得说是其它程序占用了快照缓存文件,连装了open file也没用(至此两台处理完成(望能给遇到此问题的朋友提供一点帮助(。