X86服务器存储-Inspur 2008 Raid卡报错firmware error导致死机重启问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Inspur 2008 Raid卡报错firmware error导致死机重启问题
故障现象
系统运行中死机或重启,Raid卡日志中报错Fatal firmware error,类似如下:
EVT#04215-08/13/14 1:45:02: 15=Fatal firmware error: Line 1480 in ../../raid/1078dma.c
EVT#04216-08/13/14 1:45:02: 15=Fatal firmware error: Line 1480 in ../../raid/1078dma.c
且报错时间和系统宕机时间相符
故障原因
研发分析与PCIE节能有关,导致2008imr Raid卡读取内存时发生错误。
在故障发生时刻,PCIE产生pciErrorInit,如下:
pciErrorInt: iopIntStatus 2480【这是故障发生时刻的第一条打印】
pciErrorInt: pciIntStatus = 00000000, blackEagleIntStatus 00002000
In MonTask; Seconds from powerup = 0x000033da
_MonTask: Online Controller Disabled00
[0]: fp=c04467e0, lr=c085ea30- _MonTask+1a0
[1]: fp=c0446920, lr=c0906b30- pciErrorInt+7c
[2]: fp=c0446938, lr=c048ba18- dispatchIsrs+8c
[3]: fp=c0446968, lr=c048bae0- external_IRQ+34
[4]: fp=c0446980, lr=c048b074- wrapper__External_IRQ+74
[5]: fp=c04469d0, lr=c04b7a24- TtyIdle+cc
[6]: fp=c04471c8, lr=c04a8364- set_state+90
[7]: fp=c0447208, lr=c04a8a7c- raid_task_idle_loop+20
[8]: fp=c0447218, lr=c087bea4- raid_task+de4
[9]: fp=c0447fd0, lr=c0908c7c- _main+18d8
[10]: fp=c0447ff8, lr=c0801c0c- __start+bb4
MonTask: line 621 in file ../../raid/1078main.c
UIC_ER=9f200:c00031b, UIC_MSR=4000:8000002, MSR=21000, sp=c04467e0
解决办法
1、对于Windows 2008R2系统,修改电源选项--> 高级电源设置– >PCIE Express链接状态电源管理--> 改为关闭!
或者升级OS到Windows 2008 R2 SP1
2、对于Linux系统,编辑/etc/grub.conf文件,在kernel一行最后添加pcie_aspm=off ,重启生效。
如果无效,请将BISO中内存频率由1600降为1333。