HP服务器故障排除实战
服务器故障处理手册范本
服务器故障处理手册范本第一章:引言服务器是现代信息技术发展中不可或缺的一部分。
然而,随着服务器使用量的增加,服务器故障的频率也随之增加。
为了保障服务器的稳定运行和数据的安全,有必要建立一份服务器故障处理手册,以指导运维人员在遇到故障时能够快速定位和解决问题。
本手册旨在为管理员提供一份范本,帮助其根据实际情况定制适合自身服务器环境的故障处理手册。
第二章:故障识别与分类2.1 故障识别服务器故障的识别是故障解决的第一步,常见的故障识别包括网络连接、硬件故障、系统崩溃等。
管理员需要通过日志、系统监控工具等手段来定位故障原因。
2.2 故障分类根据故障的性质和影响程度,可以将故障分为紧急故障、一般故障和次要故障。
不同类型的故障需要采取不同的处理策略和时间安排,管理员应根据实际情况进行分类。
第三章:紧急故障处理3.1 紧急故障定义紧急故障指的是服务器遭遇停机、系统崩溃等导致业务无法正常进行的故障,处理紧急故障时需要迅速且高效地恢复服务器功能。
3.2 紧急故障处理流程1. 迅速通知相关人员:管理员应立即通知上级、相关技术人员和业务人员,确保所有人员都能及时响应。
2. 开启备用服务器:若有备用服务器,应及时切换至备用服务器,确保业务的持续运行。
3. 分析故障原因:管理员通过查看日志、排除硬件故障等方式,尽快确定故障原因。
4. 发布紧急修复方案:管理员需根据故障原因和解决方法,编写紧急修复方案,并尽快发布给相关人员。
5. 实施修复方案:相关人员按照修复方案进行操作,确保服务器功能的快速恢复。
6. 监测与验证:恢复服务器功能后,管理员需要对服务器进行监测和验证,确保故障已经解决。
7. 故障报告和总结:管理员需撰写故障报告和总结,包括故障原因、处理过程、修复方法等信息,以供后续参考和优化。
第四章:一般故障处理4.1 一般故障定义一般故障指的是服务器遇到影响业务但非立即崩溃的故障,处理一般故障时需要在较短的时间内解决问题,并确保业务正常进行。
惠普服务器常见问题及故障排除.课件
指示灯
描述
状态
1
驱动器活动 On =驱动器活动状态
状态
Off =无驱动器活动状态
2
在线工作状 闪烁 =在线工作状态
态
Off =无在线工作状态
3
故障状态
闪烁 =故障状态 Off =无故障状态
常见问题及故障排除– 13
联系我们!-技术支持热线
如果发现服务器出现异常现象(比如日志报错、红灯闪烁、有报警声等),可以先按照随 服务器附带的《用户指南》种的“故障排除”部分进行简单的排错。如果不能解决问题,
安装防火墙或者病毒监测程序 定期查毒,实时监控,并注意更新最新的病毒特征码
常见问题及故障排除– 5
数据安全维护
定期做数据备份,推荐使用磁带机或其他专业备 份工具和备份软件。 在进行任何硬盘操作前,备份数据。包括:更换 硬盘、重新配置阵列、阵列扩容等等。
常见问题及故障排除– 6
服务器简单排错-保证各设备连接正常
常见问题及故障排除– 4
定期检查Windows 2000的日志
查看Windows 2000/Windows2003的日志包括: 系统日志、安全日志和应用程序日志。分别记录操作系统、安 全相关和应用程序的事件(包括正常的事件和警告或出错信息 )。通过“开始菜单-〉程序-〉管理工具-〉事件察看器”可以 察看这三种日志。
服务器环境海拔要求 操作海拔:-30m ~ 3,045m 非操作海拔:-30 ~ 12,180m
服务器机房电源要求 输入范围:50/60 Hz时为100至240 VAC 电源功率:最大780W持续功率 零地电压: ≤ 1V
保持机房环境符合服务器工作要求,定期检查并进行除尘工作。
常见问题及故障排除– 2
HP服务器与存储系统安装、管理与故障排查指南说明书
This document is for the person who installs, administers, andtroubleshoots servers and storage systems. HP assumes that you are qualified in servicing computer equipment and trained in recognizing hazards in products with hazardous energy levels.© Copyright 2005 Hewlett-Packard Development Company, L.P .Hewlett-Packard Company makes no warranty of any kind with regard tothis material, including, but not limited to, the implied warranties of merchantability and fitness for a particular purpose. Hewlett-Packard shall not be liable for errors contained herein or for incidental or consequential damages in connection with the furnishing, performance, or use of this material.This document contains proprietary information, which is protected by copyright. No part of this document may be photocopied, reproduced, or translated into another language without the prior written consent of Hewlett-Packard. The information contained in this document is subject to change without notice.Hewlett-Packard Company shall not be liable for technical or editorial errors or omissions contained herein. The information is provided “as is” without warranty of any kind and is subject to change without notice. The warranties for Hewlett-Packard Company products are set forth in the express limited warranty statements accompa-nying such products. Nothing herein should be construed as constituting an additional warranty.Printed in the U.S.A.hp ProLiantDL585 Storage ServerHP ProLiant DL585 Storage Server Installation Instructions First Edition (March 2005)Part Number: 389150-001WARNING: This product contains energy levels that areconsidered hazardous. To reduce the risk of personal injury from electric shock and hazardous energy, individuals who are knowledgeable of the procedures, precautions, and hazards associated with equipment containing hazardous energy circuits must perform the installation and servicing of this product.•Obtain adequate assistance to lift and stabilize the chassis during installation or removal.•Be aware that the product becomes unstable when it is not fastened to the rails.•Before removing the server from the rack, remove all hot-plug power supplies, power modules, and drives to reduce the overall weight of the product.•Extend leveling jacks fully to the floor and make sure that the full weight of the rack rests on the leveling jacks.•Install stabilizing feet on single-rack installations.•Couple multiple-racks.•Only extend one rack component at a time. The rack will become unstable if more than one device is extended.A rack resource kit ships with all HP branded or Compaq branded 9000,10000, and H9 series racks. For more information on the content of each resource, refer to the rack resource kit documentation.If you intend to deploy and configure multiple servers in a single rack,refer to the white paper on high-density deployment at the HP website./products/servers/platformsThe HP ProLiant DL585 Storage Server is preloaded with the Windows ®Storage Server 2003 operating system. Prior to power up, deployment instructions found in the “User Guide” should be followed to enable the successful configuration of the storage server in addition to the guidelines found below.Required Items:User GuideAdministration GuideTo begin the first-time startup procedure:Be sure that the server is safely installed in an adequateenvironment.Be sure that the power cables and peripheral devices are plugged inand AC power is supplied to the server.Refer to the User Guide prior to powering up the server.389150-001Remove shipping bracket from the PCI Basket, loosen thethumbscrew (1) and remove and discard the shipping bracket (2).NOTE: The shipping bracket is used only to secure the PCIlatches during shipment.Install optionsIf you are installing additional options, such as expansion boards,processors, hard drives, or memory, refer to the instructionsincluded with the option.NOTE: For quick start memory guidelines, refer to the hood labels on theserver.1.Install the rails on both sides of the chassis.2.Pull the rail compression lever toward you.3.Install the rear of the rail into the designated holes in the rear ofthe rack.4.Install the front of the rail into the designated holes in the frontof the rack.5.Install the rails on the chassis into the rails in the rack.6.Slide the server onto the rack rails until the lockingpin engages.7.Tighten the thumbscrews to secure the server to the rack.The ProLiant DL585 server can operate either on a 120-V or a 240-V AC input. Two AC inlets are on the rear of the server, one for each power supply installed.WARNING: To reduce the risk of electric shock or damage to the equipment:•Do not disable the power cord-groundingplug. The grounding plug is an important safety feature.•Plug the power cord into a grounded (earthed)electrical outlet that is easily accessible at all times.•Disconnect power from the server by unpluggingthe power cord from either the electrical outlet or the server.To connect the power cord:1.Locate the correct voltage line cord that came with the server. Remove any labels that cover the cord connector.IMPORTANT: To connect the power cord, plug it into the appropriate power supply AC inlet. The power connector is connector number one for the primary (populated) power supply and is connector number two for the redundant hot-plug power supply.2.Plug the other end of the power cord into a grounded electrical outlet or UPS, depending on power cord type.3.Connect the peripheral device cables to the server, and then route the power cord and device cables through the cable management arm.Attaching cable management arm to a square-hole rack1.Slide the bracket onto the rack (1).2.Insert the bracket hooks into the square holes on the rack, and then push down to secure (2).3.Tighten the thumbscrew to stabilize the cable management armon the rack (3).Attaching the cable management arm to a round-hole rack1.Remove the square-hole bracket from the cable management arm by pulling out the spring-activated fasteners (1), and thenpulling out the bracket (2).2.Attach the round-hole bracket by pulling the spring-activated fasteners on the cable management arm out (1), and then inserting the bracket between them (2).3.Slide the bracket onto the rack (1).4.Attach the cable management arm to the round-hole rack, andthen secure the thumbscrews (2).To register your product visit the HP Registration web site at:Attaching the cable management arm to the server1.Loosen the thumbscrews on the front of the server to enable theserver to slide forward.3.Secure the cables to the inside of the cable management arm using the V elcro straps.2.Align the keyholes on the cable management arm with the postson the server (1), and then secure with the thumbscrew (2).Securing the cables to the cable management arm1.Align the pivot points of the cable management arm by slidingthe server as needed.2.Pivot the arm away from the server.4.Close the cable management arm and finish securing the cables.The hardware installation is now complete. Please refer to the “HP ProLiant Storage Server User Guide.”Installation Instructions Rack template tool used during rack installation contains:Administration guide User GuideHP Warranty fulfillment documentprovides instructions to obtain a printed warrantyHP Important Safety Information bookletSafety information for HP storage, power,networking and rack productsDocumentation CDrequirements and configuration options User Guiderack installation poster Administration Guideprovides administrative and procedural instructions to manage the storage server。
HP DL388Gen8服务器raid硬盘故障标示识别与恢复
惠普HP DL388 Gen8服务器raid硬盘故障标示识别与恢复作者:CGQ912016-5-12最近,单位里一台惠普服务器出现异常,速度特慢,有些服务不响应,用户报告应用系统无法访问服务器,随后检查该服务器,发现指示灯异常。
该机器型号、配置:HP DL388e gen8 双CPU、16GB内存,3块15000转/min 300GB 做Raid5,操作系统为Win2008 server R2 Enterprise检查发现第三块盘,亮起黄色指示灯,上面两块盘,亮起白色指示灯,见图一,另外服务器前板指示灯也变黄色,闪烁见图二。
虽然重启服务器后,第三块盘先黄灯后又变绿灯,但上两块盘一直亮白灯。
图一查询相关技术资料,两块盘亮白灯,表示该盘不能被拔除,否则逻辑分区将损坏,意思两块其中再有任何一块盘出问题,这系统就彻底完蛋了!服务器电源按钮旁边的指示灯黄闪,表示系统硬件出现故障,系统降级使用,等待恢复,大概就是这么个意思。
用惠普服务器自带的软件工具,可以检测硬件故障所在。
见图三,打开“HP Insight Diagnostics Online Edition for windows”图三出现如图四的登录界面,有时IE8安全级别问题,可能不能直接打开网页,点“继续浏览此网站(不推荐)”打开。
输入该服务器的管理员账号密码,进入后,出现系统扫描界面,见图五。
图五扫描完成后,出现服务器硬件信息。
点击“诊断”选项卡,勾选“逻辑驱动器1,插槽0中的存储控制器”,其它不用选。
再点击窗口右下角“诊断”按钮,系统开始诊断。
几秒后,出现诊断后的“状态”页面,显示硬件状态,这里报了Raid故障,故障代码F297,报了第三块盘的故障代码F149。
到此,可以判断第三块盘出现了故障,需要更换。
我这个盘显示运行了40多个月了,肯定出保了,需要单位自购。
这款硬盘目前也不是主流配件了,主要是库存货,注意货号要与原盘一致。
自购HP硬盘很顺利,两天后,拿到了货。
[讲解]HP服务器的一些启动报错的原因和解决办法(中英双语)
304-Keyboard or System Unit Erroraudible beeps: nonepossible cause: keyboard, keyboard cable, mouse controller, or system board failure.action:1. be sure the keyboard and mouse are connected.only authorized technicians trained by hp should attempt to remove the system board. if you believe the system board requires replacement, contact hp technical support before proceeding.2. run insight diagnostics ("hp insight diagnostics" on page 101) and replace failed components as indicated.400 serieslist of messages:40x-parallel port x address assignment conflict404-parallel port address conflict detected40x-parallel port x address assignment conflictaudible beeps: 2 shortpossible cause: both external and internal ports are assigned to parallel port x.action: run the server setup utility and correct the configuration.404-parallel port address conflict detected......a hardware conflict in your system is keeping some system components from working correctly. if you have recently added new hardware remove it to see if it is the cause of the conflict. alternatively, use computer setup or your operating system to insure that no conflicts exist.audible beeps: 2 shortpossible cause: a hardware conflict in the system is preventing the parallel port from working correctly.action:1. if you have recently added new hardware, remove it to see if the hardware is the cause of the conflict.2.run the server setup utility to reassign resources for the parallel port and manually resolve the resource conflict.3. run insight diagnostics ("hp insight diagnostics" on page 101) and replace failed componentsas indicated.600 serieslist of messages:601-diskette controller error602-diskette boot record error605-diskette drive type error611-primary floppy port address assignment conflict612-secondary floppy port address assignment conflict601-diskette controller erroraudible beeps: nonepossible cause: diskette controller circuitry failure occurred.action:1. be sure the diskette drive cables are connected.2. replace the diskette drive, the cable, or both.3. run insight diagnostics ("hp insight diagnostics" on page 101) and replace failed components as indicated.602-diskette boot record erroraudible beeps: nonepossible cause: the boot sector on the boot disk is corrupt.action:1. remove the diskette from the diskette drive.2. replace the diskette in the drive.3. reformat the diskette.605-diskette drive type error.audible beeps: 2 shortpossible cause: mismatch in drive type occurred.action: run the server setup utility to set the diskette drive type correctly.611-primary floppy port address assignment conflictaudible beeps: 2 shortpossible cause: a hardware conflict in the system is preventing the diskette drive fromoperating properly.action:1. run the server setup utility to configure the diskette drive port address and manually resolve the conflict.2. run insight diagnostics ("hp insight diagnostics" on page 101) and replace failed components as indicated.612-secondary floppy port address assignment conflictaudible beeps: 2 shortpossible cause: a hardware conflict in the system is preventing the diskette drive from operating properly.action:1. run the server setup utility to configure the diskette drive port address and manually resolve the conflict.2. run insight diagnostics ("hp insight diagnostics" on page 101) and replace failed components as indicated.1100 serieslist of messages:1151-com port 1 address assignment conflict1151-com port 1 address assignment conflictaudible beeps: 2 shortpossible cause: both external and internal serial ports are assigned to com x.action: run the server setup utility and correct the configuration.1600 serieslist of messages:1609 - the server may have a failed system battery. some1610-temperature violation detected. - waiting 5 minutes for system to cool1611-cpu zone fan assembly failure detected. either1611-cpu zone fan assembly failure detected. single fan1611-fan failure detected1611-fan x failure detected (fan zone cpu)1611-fan x failure detected (fan zone i/o)1611-fan x not present (fan zonecpu)1611-fan x not present (fan zone i/o)1611- power supply zone fan assembly failure detected. either1611-power supply zone fan assembly failure detected. single fan1611-primary fan failure (fan zone system)1611-redundant fan failure (fan zone system)1612-primary power supply failure1615-power supply configuration error1615-power supply configuration error1615-power supply failure, power supply unplugged, or power supply fan failure in bay x 1616-power supply configuration failure1609 - the server may have a failed system battery. some......configuration settings may have been lost and restored to defaults. refer to server documentation for more information. if you have just replaced the system battery, disregard this message.audible beeps: nonepossible cause: real-time clock system battery has lost power. the system will lose its configuration every time ac power is removed (when the system is unplugged from ac power source) and this message displays again if a battery failure has occurred. however, the system will function and retain configuration settings if the system is connected to the ac power source.action: replace battery (or add external battery).1610-temperature violation detected. - waiting 5 minutes for system to coolaudible beeps: nonepossible cause: the ambient system temperature exceeded acceptable levels.action: lower the room temperature.1611-cpu zone fan assembly failure detected. either......the assembly is not installed or multiple fans have failed in the cpu zone.audible beeps: nonepossible cause: required fans are missing or not spinning.action:1. check the fans to be sure they are installed and working.2. be sure the assembly is properly connected and each fan is properly seated.3. if the problem persists, replace the failed fans.4. if a known working replacement fan is not spinning, replace the assembly.1611-cpu zone fan assembly failure detected. single fan......failure. assembly will provide adequate cooling.audible beeps: nonepossible cause: required fan not spinning.action: replace the failed fan to provide redundancy, if applicable.1611-fan failure detectedaudible beeps: 2 shortpossible cause: required fan not installed or spinning.action:1. check the fans to be sure they are working.2. be sure each fan cable is properly connected and each fan is properly seated.3. if the problem persists, replace the failed fans.1611-fan x failure detected (fan zone cpu)audible beeps: 2 shortpossible cause: required fan not installed or spinning.action:1. check the fans to be sure they are working.2. be sure each fan cable is properly connected, if applicable, and each fan is properly seated.3. if the problem persists, replace the failed fans.1611-fan x failure detected (fan zone i/o)audible beeps: 2 shortpossible cause: required fan not installed or spinning.action:1. check the fans to be sure they are working.2. be sure each fan cable is properly connected, if applicable, and each fan is properly seated.3. if the problem persists, replace the failed fans.1611-fan x not present (fan zonecpu)audible beeps: 2 shortpossible cause: required fan not installed or spinning.action:1. check the fans to be sure they are working.2. be sure each fan cable is properly connected, if applicable, and each fan is properly seated.3. if the problem persists, replace the failed fans.1611-fan x not present (fan zone i/o)audible beeps: 2 shortpossible cause: required fan not installed or spinning.action:1. check the fans to be sure they are working.2. be sure each fan cable is properly connected, if applicable, and each fan is properly seated.3. if the problem persists, replace the failed fans.1611- power supply zone fan assembly failure detected. either......the assembly is not installed or multiple fans have failed.audible beeps: nonepossible cause: required fans are missing or not spinning.action:1. check the fans to be sure they are installed and working.2. be sure the assembly is properly connected and each fan is properly seated.3. if the problem persists, replace the failed fans.4. if a known working replacement fan is not spinning, replace the assembly.1611-power supply zone fan assembly failure detected. single fan......failure. assembly will provide adequate cooling.audible beeps: nonepossible cause: required fan not spinning.action: replace the failed fan to provide redundancy, if applicable.1611-primary fan failure (fan zone system)audible beeps: nonepossible cause: a required fan is not spinning.action: replace the failed fan.1611-redundant fan failure (fan zone system)audible beeps: nonepossible cause: a redundant fan is not spinning.action: replace the failed fan.1612-primary power supply failureaudible beeps: 2 shortpossible cause: primary power supply has failed.action: replace power supply.1615-power supply configuration erroraudible beeps: nonepossible cause: the server configuration requires an additional power supply. a moving bar is displayed, indicating that the system is waiting for another power supply to be installed.action: install the additional power supply.1615-power supply configuration error- a working power supply must be installed in bay 1 for proper cooling.- system halted!audible beeps: nonepossible cause: the server configuration requires an additional power supply. a moving bar is displayed, indicating that the system is waiting for another power supply to be installed.action: install the additional power supply.1615-power supply failure, power supply unplugged, or power supply fan failure in bay x audible beeps: nonepossible cause: the power supply has failed, or it is installed but not connected to the system board or ac power source.action: reseat the power supply firmly and check the power cable or replace power supply.1616-power supply configuration failure-a working power supply must be installed in bay 1 for proper cooling.-system halted!audible beeps: nonepossible cause: power supply is improperly configured. action: run the server setup utility and correct the configuration.。
HP DL380 Gen9阵列Smart Storage Administrator错误信息(一)
本篇文章提供HPE ProLiant 服务器Smart Array关联的错误消息列表。
本文适合安装和管理服务器或服务器刀片以及对其进行故障排除的人员使用。
其中列出了ProLiant 服务器和服务器刀片上的错误消息,并提供了一些信息以帮助解释错误消息和解决问题。
可以使用这些消息排除Hewlett Packard Enterprise 设备的故障并优化这些设备的运行方式。
Array status: The array has failed症状:Array status: The array has failed.原因:阵列中的物理或逻辑驱动器发生故障。
操作:检查阵列中发生故障的物理或逻辑驱动器并纠正任何问题。
1.Array status: The array currently has a drive erase operation queued, running, stoppedor completed on a logical or physical drive症状:Array status: The array currently has a drive erase operation queued, running, stopped or completed on a logical or physical drive.原因:驱动器擦除操作已在队列中、正在运行、已停止或已完成。
操作:不需要采取任何措施。
2.Array Status: The array has a spare drive assigned which is smaller than the smallestdata drive in the array症状:Array Status: The array has a spare drive assigned which is smaller than the smallest data drive in the array. Some operations in the array will not be available.原因:备用驱动器不够大。
服务器硬件故障排除和维修的实际案例
服务器硬件故障排除和维修的实际案例在现代信息技术高速发展的时代,服务器扮演着非常重要的角色。
然而,由于各种原因,服务器硬件故障时有发生。
本文将探讨一些实际案例,介绍了如何排除和维修服务器硬件故障。
案例一:电源故障在公司A的数据中心,突然出现了一台服务器宕机的情况。
通过排查,我们发现服务器无法正常启动。
经过检查,发现电源插头没有插好,导致电源无法供应给服务器。
重新插好电源之后,服务器恢复正常运转。
案例二:硬盘故障公司B的一台服务器报告了硬盘错误的警告信息。
我们迅速采取了措施,通过服务器管理工具检查硬盘状态。
经过分析,发现一个硬盘出现了故障。
我们立即更换了故障硬盘,并进行了数据恢复。
最后,服务器重新正常运行。
案例三:内存故障某天,在公司C的服务器上,我们发现应用程序运行缓慢,出现了频繁的卡顿现象。
我们首先使用服务器监控工具检查服务器的内存使用情况。
通过检查,我们发现一块内存模块出现了问题。
我们立即更换了故障内存,服务器的性能问题也得到了解决。
案例四:风扇故障在公司D的服务器房,我们听到了异常的噪音,通过观察发现服务器后方的风扇停止工作。
我们立即关闭了服务器,并更换了风扇。
经过启动服务器,噪音问题得到了解决。
案例五:主板故障公司E的一台服务器在正常运行中突然关机,并伴随着烧焦的味道。
我们意识到这是一种非常严重的情况。
经过分析,确认主板发生了故障。
我们联系服务器厂商,并更换了主板。
经过一系列测试,服务器重新运行正常。
案例六:网络接口故障在公司F的一台服务器上,我们发现无法远程登陆服务器。
我们首先确认了网络连接是否正常,发现服务器的网卡出现了故障。
我们更换了网卡,服务器恢复了远程访问的能力。
综上所述,服务器硬件故障是一个常见的问题,但通过合适的排除和维修方法,这些问题可以迅速解决。
无论是电源故障、硬盘故障、内存故障,还是风扇故障、主板故障或者网络接口故障,关键在于迅速找到故障点并进行适当的修复或更换。
因此,在维护服务器和保养硬件方面,及时的检查、预防和处理故障是至关重要的。
HP ProLiant Gen9 故障排除指南
HP ProLiant Gen9 故障排除指南第一卷:故障排除指南摘要本文介绍了很多级别的 HP ProLiant Gen9 服务器故障排除的常见步骤和解决方法。
本文适合安装和管理服务器或服务器刀片以及对其进行故障排除的人员使用。
HP 假定您有资格维修计算机设备,并经过培训,可识别高压带电产品中的危险情况。
© Copyright 2014, 2015 Hewlett-Packard Development Company, L.P.本文档中包含的信息如有更改,恕不另行通知。
随 HP 产品和服务附带的明确保修声明中阐明了此类产品和服务的全部保修服务。
本文档中的任何内容均不应理解为构成任何额外保证。
HP 对本文档中出现的技术错误、编辑错误或遗漏之处概不负责。
AMD 是 Advanced Micro Devices, Inc. 的商标。
Microsoft® 和 Windows® 是 Microsoft 集团公司的商标。
Oracle 是 Oracle 和/或其分支机构的注册商标。
Linux® 是 Linus Torvalds 在美国和其它国家/地区的注册商标。
Red Hat® 是 Red Hat, Inc. 在美国和其它国家/地区的注册商标。
SD 和 microSD 是 SD-3C 在美国和/或其它国家/地区的商标或注册商标。
VMware 是 VMware, Inc. 在美国和/或其它司法辖区的注册商标或商标。
部件号:795674-AA32015 年 6 月版本:3目录1 使用本指南 (1)如何使用本指南 (1)新增内容(第三版) (2)795674-XX2(2014 年 12 月) (2)2 故障排除的准备工作 (4)预诊断步骤 (4)重要安全信息 (4)设备上的符号 (4)警告和注意 (5)静电释放 (6)防止静电释放 (6)防止静电释放的接地方法 (6)症状信息 (7)服务器诊断的准备工作 (8)执行故障排除流程中的处理器步骤 (9)将服务器降级到最低硬件配置 (9)3 常见问题的解决方法 (10)连接松动 (10)服务通知 (10)固件更新 (10)在启用了 HP Trusted Platform Module 和 BitLocker 的情况下更新服务器 (11)DIMM 操作准则 (11)DIMM 安装和配置准则 (11)组件 LED 指示灯定义 (11)SAS、SATA 和 SSD 驱动器准则 (12)热插拔驱动器 LED 定义 (12)系统电源 LED 指示灯定义 (13)运行状况 LED 条形指示灯定义(仅限刀片) (13)前面板 LED 指示灯和按钮 (13)前面板 LED 指示灯电源故障代码 (14)4 远程故障排除 (16)远程故障排除工具 (16)远程访问 Virtual Connect Manager (17)ZHCN iii使用 HP iLO 对服务器和服务器刀片进行远程故障排除 (17)使用 Onboard Administrator 对服务器刀片进行远程故障排除 (18)使用 OA CLI (18)5 诊断流程图 (20)故障排除流程图 (20)使用诊断流程图 (20)在开始之前收集重要信息 (21)故障排除流程图引用网站 (21)初始诊断流程图 (21)远程诊断流程图 (22)开机故障流程图 (23)服务器开机故障流程图(ML、DL 和 SL 系列) (23)服务器开机故障流程图(XL 系列) (24)服务器刀片开机故障流程图(BL 系列) (25)POST 故障流程图 (27)Intelligent Provisioning 故障流程图 (29)控制器问题 (29)缓存模块问题 (31)HP Smart Storage 电池问题 (32)物理驱动器问题 (33)逻辑驱动器问题 (34)操作系统引导故障流程图 (35)故障指示流程图 (36)服务器故障指示流程图(非刀片服务器) (37)服务器故障指示流程图(BL 系列) (38)电源配置文件问题 (38)网卡问题 (39)常规诊断流程图 (41)6 硬件问题 (43)用于所有 ProLiant 服务器的步骤 (43)电源问题 (43)电源问题 (43)电源问题 (43)无法打开服务器电源 (44)HP ProLiant 引导前运行状况摘要 (44)UPS 问题 (45)UPS 无法正常供电 (45)显示电池电量不足警告 (46)UPS 上的一个或多个 LED 指示灯呈红色 (46)iv ZHCN常规硬件问题 (46)新硬件的问题 (46)未知问题 (47)第三方设备的问题 (47)测试设备 (47)系统内部问题 (48)CD-ROM 和 DVD 驱动器问题 (48)系统无法从该驱动器引导 (48)从驱动器读取的数据不一致,或驱动器无法读取数据 (48)未检测到驱动器 (49)驱动器问题(硬盘驱动器和固态驱动器) (49)驱动器发生故障 (49)无法识别驱动器 (49)无法访问数据 (50)服务器响应时间比平时慢 (50)HP SmartDrive 图标或 LED 指示灯指示驱动器错误,或者在 POST、HP SSA 或 HP SSADUCLI 中显示错误消息 (51)存储问题 (51)在安装操作系统时,操作系统安装无法识别 HP Dynamic Smart Array B140iRAID 控制器驱动器 (51)具有 10 SFF 驱动器背板或 12 LFF 驱动器背板的服务器上的数据故障或磁盘错误 (51)具有 25 SFF 驱动器背板的服务器上的数据故障或磁盘错误 (51)SD 和 microSD 卡问题 (51)系统无法从该驱动器引导 (51)U 盘问题 (51)系统无法从该驱动器引导 (51)风扇问题 (52)出现一般的风扇问题 (52)出现热插拔风扇问题 (52)HP BladeSystem c 系列机箱中的所有风扇高速运行 (53)HP Trusted Platform Module 问题 (53)HP Trusted Platform Module 出现故障,或者未检测到 (53)内存问题 (53)出现一般的内存问题 (53)服务器内存不足 (54)出现内存计数错误 (54)服务器无法识别现有的内存 (54)服务器无法识别新的内存 (55)处理器问题 (55)磁带机问题 (56)ZHCN v磁带卡住问题 (56)读取/写入问题 (56)备份问题 (56)介质问题 (57)图形和视频适配器问题 (57)出现了常规图形和视频适配器问题 (57)外部设备问题 (58)视频问题 (58)启动服务器之后,屏幕持续 60 多秒钟没有显示 (58)如果使用节能功能,显示器无法正常工作 (58)显示颜色不对 (58)显示慢慢移动的水平线 (59)鼠标和键盘问题 (59)电缆问题 (59)在使用较旧的小型 SAS 电缆时,发生驱动器错误、重试、超时和无根据的驱动器故障 (59)无法识别 USB 设备,显示错误消息,或者设备在连接到 SUV 电缆时无法打开电源 (59)网络控制器或 FlexibleLOM 问题 (59)安装了网络控制器或 FlexibleLOM,但运行不正常 (59)网络控制器或 FlexibleLOM 已停止工作 (60)添加了扩展卡后,网络控制器或 FlexibleLOM 停止工作 (60)网络互联刀片出现问题 (61)控制器问题 (61)在禁用 RAID 模式时,找不到 HP Dynamic Smart Array B140i 驱动器 (61)在 RAID 模式中访问的驱动器上的数据不与从非 RAID 模式中访问的数据兼容 (61)在将驱动器移至新的服务器或 JBOD 后,Smart Array 控制器不显示逻辑驱动器 (61)驱动器漫游 (61)扩展卡问题 (61)系统在更换扩展卡期间要求使用恢复方法 (61)7 软件问题 (63)操作系统问题和解决方法 (63)操作系统问题 (63)操作系统锁定 (63)错误日志中显示错误 (63)安装 Service Pack 之后出现问题 (63)操作系统更新 (63)恢复为备份版本 (64)vi ZHCN何时重新配置或重新加载软件 (64)Linux 资源 (64)应用程序软件问题 (64)软件锁定 (64)更改软件设置后出错 (65)更改系统软件后出错 (65)安装了应用程序后出错 (65)ROM 问题 (65)远程 ROM 刷新问题 (65)命令行语法错误 (65)目标计算机上拒绝访问 (65)无效或不正确的命令行参数 (65)网络连接在进行远程通信时失败 (65)ROM 刷新期间发生故障 (65)不支持目标系统 (66)系统在固件更新期间要求使用恢复方法 (66)更新固件 (66)引导问题 (66)服务器无法引导 (66)UEFI 服务器的 PXE 引导准则 (68)8 软件工具和解决方案 (69)服务器模式 (69)产品规格说明简介 (69)HP iLO (69)Active Health System (70)用于 HP iLO 的 HP REST API 支持 (71)Integrated Management Log (71)HP Insight Remote Support (71)HP Insight Remote Support 集中连接 (72)HP Insight Online 直接连接 (72)HP Insight Online (72)Intelligent Provisioning (72)HP Insight Diagnostics (73)HP Insight Diagnostics 检测功能 (73)Erase Utility (73)适用于 Windows 和 Linux 的 Scripting Toolkit (73)HP Service Pack for ProLiant (74)HP Smart Update Manager (74)HP UEFI System Utilities (74)使用 HP UEFI System Utilities (74)ZHCN vii安全引导配置 (76)嵌入式 UEFI Shell (76)嵌入式诊断选件 (76)用于 UEFI 的 HP REST API 支持 (76)重新输入服务器序列号和产品 ID (76)实用程序和功能 (77)HP Smart Storage Administrator (77)Automatic Server Recovery(自动服务器恢复) (77)USB 支持 (78)外置 USB 功能 (78)支持冗余 ROM (78)安全性和安全优势 (78)使系统保持最新状态 (79)访问 HP 支持材料 (79)更新固件或系统 ROM (79)FWUPDATE 实用程序 (79)嵌入式 UEFI Shell 中的 FWUpdate 命令 (79)System Utilities 中的固件更新应用程序 (80)联机刷新组件 (80)驱动程序 (80)软件和固件 (81)支持的操作系统版本 (81)版本控制 (81)HP 对于 ProLiant 服务器支持的操作系统和虚拟化软件 (81)HP 技术服务组合 (81)更改控制和主动通知 (82)9 HP 故障排除资源 (83)在线资源 (83)HP 支持中心网站 (83)HP 企业信息库 (83)HP 指导的故障排除网站 (83)以前的 HP ProLiant 服务器型号的故障排除资源 (83)服务器刀片机箱故障排除资源 (84)错误消息资源 (84)服务器文档 (84)HP 产品规格说明简介 (84)白皮书 (84)服务通知、咨询和通告 (85)viii ZHCN产品信息资源 (85)其它产品信息 (85)注册服务器 (85)服务器功能概述和安装说明 (85)主要功能和选件部件号 (85)服务器和选件的规格、符号、安装警告和通告 (85)备件号 (86)拆卸步骤、部件号和规格 (86)拆卸或卸除和更换过程视频 (86)技术主题 (86)产品安装资源 (86)外部布线信息 (86)电源容量 (86)开关设置、LED 指示灯功能、驱动器、内存、扩展卡和处理器安装说明以及板卡布局 (86)产品配置资源 (87)设备驱动程序信息 (87)DDR4 内存配置 (87)支持的操作系统版本 (87)操作系统安装和配置信息(对于出厂时安装的操作系统) (87)服务器配置信息 (87)服务器设置软件的安装和配置信息 (87)服务器的软件安装和配置 (87)HP iLO 信息 (87)服务器管理 (87)服务器管理系统的安装和配置信息 (87)容错、安全保护、保养和维护、配置和设置 (88)10 支持和其它资源 (89)与 HP 技术支持部门或授权经销商联系 (89)客户自行维修 (89)所需的服务器信息 (89)所需的操作系统信息 (90)Microsoft 操作系统 (90)Linux 操作系统 (91)Oracle Solaris 操作系统 (92)报告和日志 (92)Active Health System 日志概述 (92)Active Health System 下载 CLI 实用程序 (93)HP iLO Web 界面 (93)ZHCN ixHP Intelligent Provisioning (93)下载 Active Health System 日志 (94)使用 HP iLO (94)使用 Intelligent Provisioning (95)使用用于 Windows 操作系统的 Active Health System 下载 CLI (96)使用用于 Linux 分发的 Active Health System 下载 CLI (96)使用 curl 命令行工具 (97)HP SSA 诊断任务 (97)HP Smart Storage Administrator Diagnostic Utility CLI 报告 (98)HPS 报告 (99)cfg2html 报告 (99)11 缩略语和缩写 (100)12 文档反馈 (103)索引 (104)x ZHCN1使用本指南如何使用本指南《HP ProLiant Gen9 故障排除指南,第一卷:故障排除》重点介绍了 HP ProLiant Gen9 ML、DL、BL、XL 和 SL 服务器的故障排除步骤。
服务器故障排查与修复技巧
服务器故障排查与修复技巧随着信息技术的不断发展,服务器已经成为现代企业和个人网络生活中不可或缺的一部分。
然而,服务器故障时有发生,一旦服务器出现故障,可能会给工作和生活带来严重影响。
因此,掌握服务器故障排查与修复技巧显得尤为重要。
本文将介绍一些常见的服务器故障排查与修复技巧,帮助您更好地解决服务器故障问题。
一、硬件故障排查与修复1. 电源问题:首先检查服务器的电源线是否插紧,电源插座是否正常供电。
如果电源线和插座都没有问题,可以尝试更换电源线或者插到其他插座中。
如果服务器仍然无法开机,可能是电源模块故障,需要更换电源模块。
2. 内存故障:内存故障是服务器常见的硬件故障之一。
当服务器出现频繁死机或者蓝屏时,可以尝试重新插拔内存条,清洁内存槽,确保内存条插紧。
如果问题依然存在,可能是内存条本身故障,需要更换新的内存条。
3. 硬盘故障:硬盘是服务器存储数据的关键组件,一旦硬盘故障可能导致数据丢失。
当服务器出现读写速度慢或者无法识别硬盘时,可以尝试重新连接数据线,检查硬盘是否正常运转。
如果硬盘发出异常声音或者无法正常工作,可能是硬盘故障,需要更换新的硬盘。
4. CPU故障:CPU是服务器的核心部件,一旦CPU故障可能导致服务器无法正常启动。
当服务器出现频繁死机或者无法开机时,可以检查CPU散热器是否正常工作,清洁散热风扇,确保CPU温度正常。
如果问题依然存在,可能是CPU故障,需要更换新的CPU。
二、软件故障排查与修复1. 操作系统故障:操作系统是服务器的核心软件,一旦操作系统出现故障可能导致服务器无法正常工作。
当服务器出现蓝屏或者无法启动时,可以尝试进入安全模式,进行系统恢复或者重装系统。
如果问题依然存在,可能是系统文件损坏,需要修复系统文件或者重装系统。
2. 网络故障:网络是服务器与外部通信的重要通道,一旦网络故障可能导致服务器无法连接外部网络。
当服务器无法访问外部网络或者网络速度慢时,可以检查网线连接是否正常,重启路由器或者交换机。
服务器故障排除及解决方法
服务器故障排除及解决方法随着信息技术的不断发展,服务器在企业和个人生活中扮演着越来越重要的角色。
然而,服务器故障时有发生,一旦出现故障,可能会给工作和生活带来不便甚至损失。
因此,了解服务器故障的排除方法以及解决方案显得尤为重要。
本文将介绍一些常见的服务器故障排除及解决方法,帮助您更好地处理服务器故障。
一、服务器故障排除方法1. 检查电源和连接:首先,确保服务器的电源线连接正常,电源插座正常供电。
检查电源开关是否打开,以及电源指示灯是否亮起。
同时,检查网线连接是否松动或损坏,确保网络连接正常。
2. 检查硬件设备:服务器故障可能是由硬件设备故障引起的。
检查服务器内部的硬件设备,如内存条、硬盘、CPU等是否正常工作。
可以尝试重新插拔硬件设备,清洁内部灰尘,确保硬件设备连接良好。
3. 检查系统日志:系统日志是记录服务器运行状态和故障信息的重要依据。
通过查看系统日志,可以了解服务器故障的具体原因,有针对性地进行排除。
可以通过命令行或管理工具查看系统日志。
4. 检查系统更新:及时更新服务器系统和软件是预防故障的重要措施。
确保服务器系统和软件处于最新版本,修复可能存在的漏洞和bug,提高服务器的稳定性和安全性。
5. 进行故障诊断:当服务器出现故障时,可以通过故障诊断工具进行诊断。
故障诊断工具可以帮助定位故障原因,提供解决方案。
常用的故障诊断工具有Ping、Tracert、Telnet等。
二、服务器故障解决方法1. 重启服务器:在服务器出现故障时,可以尝试通过重启服务器来解决问题。
重启服务器可以清除缓存、释放内存,恢复服务器正常运行状态。
2. 恢复备份数据:在服务器故障导致数据丢失时,可以通过恢复备份数据来解决问题。
定期备份重要数据是防范数据丢失的有效手段,确保数据安全。
3. 更新驱动程序:服务器硬件设备的驱动程序可能存在兼容性问题,导致服务器故障。
及时更新硬件设备的驱动程序,修复可能存在的问题,提高服务器性能。
服务器硬件故障排除的实际案例分析与解决方法
服务器硬件故障排除的实际案例分析与解决方法在现代科技高速发展的今天,服务器扮演了企业和组织信息管理、存储和处理的关键角色。
然而,由于各种原因,服务器硬件故障时有发生。
本文将以实际案例为基础,探讨服务器硬件故障排除的案例分析和解决方法,旨在帮助读者更好地应对类似问题。
案例一:电源故障在一个小型公司的办公室中,服务器突然无故关机,并无法再次启动。
技术人员立即检查并发现了电源故障导致的问题。
解决方法:1. 首先,切勿慌张,需要检查电源线是否插紧,是否有明显的损坏。
2. 确认电源线正常后,检查服务器电源插头和插槽,确保连接良好。
3. 如果以上步骤都无法解决问题,建议更换电源线或联系供应商进行更深入的维修。
案例二:硬盘故障在一个大型数据中心中,管理员收到警报通知一台服务器的硬盘出现问题。
为了避免数据丢失和业务中断,管理员需要快速解决这个问题。
解决方法:1. 首先,在硬盘问题发生后尽可能立即备份重要数据,以防进一步的损失。
2. 使用服务器管理软件或操作系统自带的硬盘诊断工具,对硬盘进行检测和修复。
3. 如果硬盘问题无法解决,建议及时联系供应商或专业维修人员,进行更换或修复。
案例三:内存故障一家互联网公司的服务器在高峰时段频繁出现宕机现象,经过初步分析,发现是内存故障导致的。
解决方法:1. 首先,将服务器断电,并关闭电源开关,确保安全操作。
2. 仔细检查内存是否插紧,是否有松动、污渍或生锈等问题。
3. 使用内存测试工具对内存进行检测,寻找潜在问题。
4. 如果无法解决内存问题,建议更换或升级内存条。
案例四:散热问题一个企业的服务器在连续运行几小时后突然出现频繁崩溃的情况,经过检查发现是散热问题导致。
解决方法:1. 确保服务器周围通风良好,避免堵塞或灰尘积累。
2. 清洁散热器和风扇,去除尘埃和杂物。
3. 如果以上措施无法解决问题,建议更换散热系统或增加额外的散热器。
通过以上实际案例分析,我们可以看到服务器硬件故障的解决方法多种多样,但总体来说,我们需要保持冷静、细致并采取正确的步骤。
HP ProLiant Gen9 故障排除指南
HP ProLiant Gen9 故障排除指南第一卷:故障排除指南摘要本文介绍了很多级别的 HP ProLiant Gen9 服务器故障排除的常见步骤和解决方法。
本文适合安装和管理服务器或服务器刀片以及对其进行故障排除的人员使用。
HP 假定您有资格维修计算机设备,并经过培训,可识别高压带电产品中的危险情况。
© Copyright 2014, 2015 Hewlett-Packard Development Company, L.P.本文档中包含的信息如有更改,恕不另行通知。
随 HP 产品和服务附带的明确保修声明中阐明了此类产品和服务的全部保修服务。
本文档中的任何内容均不应理解为构成任何额外保证。
HP 对本文档中出现的技术错误、编辑错误或遗漏之处概不负责。
AMD 是 Advanced Micro Devices, Inc. 的商标。
Microsoft® 和 Windows® 是 Microsoft 集团公司的商标。
Oracle 是 Oracle 和/或其分支机构的注册商标。
Linux® 是 Linus Torvalds 在美国和其它国家/地区的注册商标。
Red Hat® 是 Red Hat, Inc. 在美国和其它国家/地区的注册商标。
SD 和 microSD 是 SD-3C 在美国和/或其它国家/地区的商标或注册商标。
VMware 是 VMware, Inc. 在美国和/或其它司法辖区的注册商标或商标。
部件号:795674-AA32015 年 6 月版本:3目录1 使用本指南 (1)如何使用本指南 (1)新增内容(第三版) (2)795674-XX2(2014 年 12 月) (2)2 故障排除的准备工作 (4)预诊断步骤 (4)重要安全信息 (4)设备上的符号 (4)警告和注意 (5)静电释放 (6)防止静电释放 (6)防止静电释放的接地方法 (6)症状信息 (7)服务器诊断的准备工作 (8)执行故障排除流程中的处理器步骤 (9)将服务器降级到最低硬件配置 (9)3 常见问题的解决方法 (10)连接松动 (10)服务通知 (10)固件更新 (10)在启用了 HP Trusted Platform Module 和 BitLocker 的情况下更新服务器 (11)DIMM 操作准则 (11)DIMM 安装和配置准则 (11)组件 LED 指示灯定义 (11)SAS、SATA 和 SSD 驱动器准则 (12)热插拔驱动器 LED 定义 (12)系统电源 LED 指示灯定义 (13)运行状况 LED 条形指示灯定义(仅限刀片) (13)前面板 LED 指示灯和按钮 (13)前面板 LED 指示灯电源故障代码 (14)4 远程故障排除 (16)远程故障排除工具 (16)远程访问 Virtual Connect Manager (17)ZHCN iii使用 HP iLO 对服务器和服务器刀片进行远程故障排除 (17)使用 Onboard Administrator 对服务器刀片进行远程故障排除 (18)使用 OA CLI (18)5 诊断流程图 (20)故障排除流程图 (20)使用诊断流程图 (20)在开始之前收集重要信息 (21)故障排除流程图引用网站 (21)初始诊断流程图 (21)远程诊断流程图 (22)开机故障流程图 (23)服务器开机故障流程图(ML、DL 和 SL 系列) (23)服务器开机故障流程图(XL 系列) (24)服务器刀片开机故障流程图(BL 系列) (25)POST 故障流程图 (27)Intelligent Provisioning 故障流程图 (29)控制器问题 (29)缓存模块问题 (31)HP Smart Storage 电池问题 (32)物理驱动器问题 (33)逻辑驱动器问题 (34)操作系统引导故障流程图 (35)故障指示流程图 (36)服务器故障指示流程图(非刀片服务器) (37)服务器故障指示流程图(BL 系列) (38)电源配置文件问题 (38)网卡问题 (39)常规诊断流程图 (41)6 硬件问题 (43)用于所有 ProLiant 服务器的步骤 (43)电源问题 (43)电源问题 (43)电源问题 (43)无法打开服务器电源 (44)HP ProLiant 引导前运行状况摘要 (44)UPS 问题 (45)UPS 无法正常供电 (45)显示电池电量不足警告 (46)UPS 上的一个或多个 LED 指示灯呈红色 (46)iv ZHCN常规硬件问题 (46)新硬件的问题 (46)未知问题 (47)第三方设备的问题 (47)测试设备 (47)系统内部问题 (48)CD-ROM 和 DVD 驱动器问题 (48)系统无法从该驱动器引导 (48)从驱动器读取的数据不一致,或驱动器无法读取数据 (48)未检测到驱动器 (49)驱动器问题(硬盘驱动器和固态驱动器) (49)驱动器发生故障 (49)无法识别驱动器 (49)无法访问数据 (50)服务器响应时间比平时慢 (50)HP SmartDrive 图标或 LED 指示灯指示驱动器错误,或者在 POST、HP SSA 或 HP SSADUCLI 中显示错误消息 (51)存储问题 (51)在安装操作系统时,操作系统安装无法识别 HP Dynamic Smart Array B140iRAID 控制器驱动器 (51)具有 10 SFF 驱动器背板或 12 LFF 驱动器背板的服务器上的数据故障或磁盘错误 (51)具有 25 SFF 驱动器背板的服务器上的数据故障或磁盘错误 (51)SD 和 microSD 卡问题 (51)系统无法从该驱动器引导 (51)U 盘问题 (51)系统无法从该驱动器引导 (51)风扇问题 (52)出现一般的风扇问题 (52)出现热插拔风扇问题 (52)HP BladeSystem c 系列机箱中的所有风扇高速运行 (53)HP Trusted Platform Module 问题 (53)HP Trusted Platform Module 出现故障,或者未检测到 (53)内存问题 (53)出现一般的内存问题 (53)服务器内存不足 (54)出现内存计数错误 (54)服务器无法识别现有的内存 (54)服务器无法识别新的内存 (55)处理器问题 (55)磁带机问题 (56)ZHCN v磁带卡住问题 (56)读取/写入问题 (56)备份问题 (56)介质问题 (57)图形和视频适配器问题 (57)出现了常规图形和视频适配器问题 (57)外部设备问题 (58)视频问题 (58)启动服务器之后,屏幕持续 60 多秒钟没有显示 (58)如果使用节能功能,显示器无法正常工作 (58)显示颜色不对 (58)显示慢慢移动的水平线 (59)鼠标和键盘问题 (59)电缆问题 (59)在使用较旧的小型 SAS 电缆时,发生驱动器错误、重试、超时和无根据的驱动器故障 (59)无法识别 USB 设备,显示错误消息,或者设备在连接到 SUV 电缆时无法打开电源 (59)网络控制器或 FlexibleLOM 问题 (59)安装了网络控制器或 FlexibleLOM,但运行不正常 (59)网络控制器或 FlexibleLOM 已停止工作 (60)添加了扩展卡后,网络控制器或 FlexibleLOM 停止工作 (60)网络互联刀片出现问题 (61)控制器问题 (61)在禁用 RAID 模式时,找不到 HP Dynamic Smart Array B140i 驱动器 (61)在 RAID 模式中访问的驱动器上的数据不与从非 RAID 模式中访问的数据兼容 (61)在将驱动器移至新的服务器或 JBOD 后,Smart Array 控制器不显示逻辑驱动器 (61)驱动器漫游 (61)扩展卡问题 (61)系统在更换扩展卡期间要求使用恢复方法 (61)7 软件问题 (63)操作系统问题和解决方法 (63)操作系统问题 (63)操作系统锁定 (63)错误日志中显示错误 (63)安装 Service Pack 之后出现问题 (63)操作系统更新 (63)恢复为备份版本 (64)vi ZHCN何时重新配置或重新加载软件 (64)Linux 资源 (64)应用程序软件问题 (64)软件锁定 (64)更改软件设置后出错 (65)更改系统软件后出错 (65)安装了应用程序后出错 (65)ROM 问题 (65)远程 ROM 刷新问题 (65)命令行语法错误 (65)目标计算机上拒绝访问 (65)无效或不正确的命令行参数 (65)网络连接在进行远程通信时失败 (65)ROM 刷新期间发生故障 (65)不支持目标系统 (66)系统在固件更新期间要求使用恢复方法 (66)更新固件 (66)引导问题 (66)服务器无法引导 (66)UEFI 服务器的 PXE 引导准则 (68)8 软件工具和解决方案 (69)服务器模式 (69)产品规格说明简介 (69)HP iLO (69)Active Health System (70)用于 HP iLO 的 HP REST API 支持 (71)Integrated Management Log (71)HP Insight Remote Support (71)HP Insight Remote Support 集中连接 (72)HP Insight Online 直接连接 (72)HP Insight Online (72)Intelligent Provisioning (72)HP Insight Diagnostics (73)HP Insight Diagnostics 检测功能 (73)Erase Utility (73)适用于 Windows 和 Linux 的 Scripting Toolkit (73)HP Service Pack for ProLiant (74)HP Smart Update Manager (74)HP UEFI System Utilities (74)使用 HP UEFI System Utilities (74)ZHCN vii安全引导配置 (76)嵌入式 UEFI Shell (76)嵌入式诊断选件 (76)用于 UEFI 的 HP REST API 支持 (76)重新输入服务器序列号和产品 ID (76)实用程序和功能 (77)HP Smart Storage Administrator (77)Automatic Server Recovery(自动服务器恢复) (77)USB 支持 (78)外置 USB 功能 (78)支持冗余 ROM (78)安全性和安全优势 (78)使系统保持最新状态 (79)访问 HP 支持材料 (79)更新固件或系统 ROM (79)FWUPDATE 实用程序 (79)嵌入式 UEFI Shell 中的 FWUpdate 命令 (79)System Utilities 中的固件更新应用程序 (80)联机刷新组件 (80)驱动程序 (80)软件和固件 (81)支持的操作系统版本 (81)版本控制 (81)HP 对于 ProLiant 服务器支持的操作系统和虚拟化软件 (81)HP 技术服务组合 (81)更改控制和主动通知 (82)9 HP 故障排除资源 (83)在线资源 (83)HP 支持中心网站 (83)HP 企业信息库 (83)HP 指导的故障排除网站 (83)以前的 HP ProLiant 服务器型号的故障排除资源 (83)服务器刀片机箱故障排除资源 (84)错误消息资源 (84)服务器文档 (84)HP 产品规格说明简介 (84)白皮书 (84)服务通知、咨询和通告 (85)viii ZHCN产品信息资源 (85)其它产品信息 (85)注册服务器 (85)服务器功能概述和安装说明 (85)主要功能和选件部件号 (85)服务器和选件的规格、符号、安装警告和通告 (85)备件号 (86)拆卸步骤、部件号和规格 (86)拆卸或卸除和更换过程视频 (86)技术主题 (86)产品安装资源 (86)外部布线信息 (86)电源容量 (86)开关设置、LED 指示灯功能、驱动器、内存、扩展卡和处理器安装说明以及板卡布局 (86)产品配置资源 (87)设备驱动程序信息 (87)DDR4 内存配置 (87)支持的操作系统版本 (87)操作系统安装和配置信息(对于出厂时安装的操作系统) (87)服务器配置信息 (87)服务器设置软件的安装和配置信息 (87)服务器的软件安装和配置 (87)HP iLO 信息 (87)服务器管理 (87)服务器管理系统的安装和配置信息 (87)容错、安全保护、保养和维护、配置和设置 (88)10 支持和其它资源 (89)与 HP 技术支持部门或授权经销商联系 (89)客户自行维修 (89)所需的服务器信息 (89)所需的操作系统信息 (90)Microsoft 操作系统 (90)Linux 操作系统 (91)Oracle Solaris 操作系统 (92)报告和日志 (92)Active Health System 日志概述 (92)Active Health System 下载 CLI 实用程序 (93)HP iLO Web 界面 (93)ZHCN ixHP Intelligent Provisioning (93)下载 Active Health System 日志 (94)使用 HP iLO (94)使用 Intelligent Provisioning (95)使用用于 Windows 操作系统的 Active Health System 下载 CLI (96)使用用于 Linux 分发的 Active Health System 下载 CLI (96)使用 curl 命令行工具 (97)HP SSA 诊断任务 (97)HP Smart Storage Administrator Diagnostic Utility CLI 报告 (98)HPS 报告 (99)cfg2html 报告 (99)11 缩略语和缩写 (100)12 文档反馈 (103)索引 (104)x ZHCN1使用本指南如何使用本指南《HP ProLiant Gen9 故障排除指南,第一卷:故障排除》重点介绍了 HP ProLiant Gen9 ML、DL、BL、XL 和 SL 服务器的故障排除步骤。
hp端点安全控制器故障排除及解决方法
hp端点安全控制器故障排除及解决方法1. 前言哎呀,大家好呀!今天咱们聊聊HP端点安全控制器的问题。
说到这个,真是让人又爱又恨。
有时候,它就像个忠诚的狗狗,默默守护着我们的数据安全;可有时候,它也会发脾气,让我们捉摸不透。
你知道的,有时候它就像那天突然冒出的乌云,让你本来美好的工作日一下子蒙上一层阴影。
别担心,今天我就来给大家分享一些故障排除的小妙招,助你轻松应对这个“小脾气”。
2. 常见故障现象2.1 启动慢首先,如果你发现HP端点安全控制器启动得像老牛拉车,那绝对是个问题!你一开始心急如焚,点开电脑,心里还想着今天的工作多么重要,结果它却给你来了个“慢半拍”,这可真让人心烦。
启动慢的原因可能是因为软件更新没做或者是后台进程占用了太多资源。
简直让人想摔电脑,哈哈!这时候,别急,先给它一点时间,看看是不是在后台默默更新呢。
2.2 连接不稳定接着,如果你发现它的连接像个“小孩子”,时不时就掉线,那可就麻烦了。
今天好好的,明天却突然消失,让人想“你到底在干嘛”。
这可能是网络问题,或者是设置没调整好。
建议你先检查一下网络,看看路由器是不是在打盹,重启一下,有时奇迹就发生了!3. 故障排除步骤3.1 检查连接好,既然说到故障排除,那我们就开始吧!首先,最基本的就是检查连接。
确保所有的线缆都插得稳稳的,像咱们的生活一样,稳才是王道。
然后,确认一下网络设置,确保它没有被“调皮捣蛋”。
这时候可以尝试重启控制器,有时候这个简单的操作就能解决大部分问题,就像给你自己来一杯热水,立马感觉舒坦不少。
3.2 更新软件接下来,软件更新也是关键。
有时候控制器需要的就是一点新鲜的东西。
如果你的软件过期了,问题可就来了!定期检查更新,不仅能提高安全性,还能防止它像个小孩子一样不听话。
别忘了,更新的时候别心急,耐心等待,它正在为你“装扮”。
4. 其他建议4.1 备份数据另外,平时一定要养成备份数据的习惯。
万一它真给你整了个“罢工”,至少你还有后路。
服务器硬件故障排除技巧与解决方案
服务器硬件故障排除技巧与解决方案服务器硬件故障是在计算机网络系统中常见的问题之一,它会给企业和个人的信息存储和访问带来诸多困扰。
本文将介绍一些常见的服务器硬件故障,并提供相应的排除技巧和解决方案,以帮助读者更好地处理这些问题。
一、电源故障电源是服务器运行的关键组件之一,当电源发生故障时,服务器将无法启动或突然断电。
为了排除电源故障,我们可以采取以下几个步骤:1. 检查电源线是否连接牢固:确保电源线连接至服务器和电源插座的接口都牢固,没有松动或松脱。
2. 更换电源线和插座:有时,电源线及插座的老化和损坏会导致电源故障,可以尝试更换新的电源线和插座。
3. 检查电源开关和按钮:确认电源开关在打开状态,同时检查服务器前面板上的电源按钮是否正常。
4. 使用备用电源:在排除以上问题后,如果服务器仍无法启动,可以尝试使用备用电源。
二、硬盘故障硬盘是服务器中存储数据的重要组件,一旦硬盘发生故障,可能导致数据丢失或无法读取。
以下是解决硬盘故障的一些技巧:1. 检查连接状态:确保硬盘连接线和电源线连接是否牢固,没有松动或脱落。
2. 使用硬盘工具:有时候,硬盘故障可能是由于分区表错误、文件系统损坏等问题引起的,使用硬盘工具可以修复这些错误。
3. 备份数据:在尝试修复硬盘问题之前,务必先备份服务器中重要的数据,以防止数据丢失。
4. 更换故障硬盘:如果以上方法无法解决问题,很可能是硬盘本身出现了故障,此时需要更换故障硬盘。
三、内存故障内存是服务器中用于存储和读取数据的临时存储器件,当内存出现故障时,服务器可能无法正常运行。
以下是一些处理内存故障的技巧和解决方案:1. 清洁内存插槽:有时候,内存插槽上的灰尘和污垢会导致内存故障,可以使用压缩气罐或小刷子清洁内存插槽。
2. 更换内存条:如果清洁插槽无效,可以尝试更换故障的内存条,确保新的内存条与服务器兼容。
3. 内存排查工具:使用内存排查工具可以帮助识别和修复内存中的错误和问题。
服务器常见问题汇总(常见故障及相应的解决方法)
服务器常见问题汇总(常见故障及相应的解决方法)服务器支撑着整个企业的信息数据,对公司的信息储存、业务开展、正常运作等等环节都具有着至关重要的意义。
然而,服务器在日常运行过程中,由于其复杂的硬件结构、繁琐的运行原理,经常会出现一些大大小小的问题困扰着各位。
下面精心整理一些服务器的常见问题汇总,帮助各位排忧解难。
1.系统蓝屏、频繁死机、重启、反映速度迟钝服务器的与我们平常电脑不论是硬件结构还是运行系统,都是极其类似的。
因此,就如同我们的电脑一样,一样可能会感染病毒,同样会因为系统漏洞、软件冲突、硬件故障导致死机、蓝屏、重启等故障,同样会因为垃圾缓存信息过多而导致反应迟钝。
2.远程桌面连接超出最大连接数由于服务器默认为允许连接数为2个,如果登陆后忘记注销,而是直接关闭远程桌面的话,服务器识别此次登陆还是留在服务器端的。
出现这种情况,最常见的就是重启服务器,但是,如果是高峰期,重启服务器带来的损失是显而易见的。
那么此时,就可以利用mstsc/console指令进行强行登陆了。
打开“运行”框,键入“mstsc/v:xxx.xxx.xxx.xxx(服务器IP)/console”,即可强行登陆到远程桌面了。
3.无法删除的文件该怎么清理遇到这种情况,可能是该文件还在运行中,可以重启删之,或者运行CMD,输入arrtib-a-s-h-r想要删除的文件夹名,最后输入del 想要删除的文件夹名即可删除,运行该命令后无法恢复,请慎用。
4.系统端口隐患对于服务器来说,首要保障稳定性和安全性。
因此,我们仅需保证服务器最基本的功能即可,就像声卡都是默认禁止的。
我们并不需要太多的功能,也不需要太多的端口支持。
像一些不必要,而且风险较高的端口大可封掉。
而一些必要的,又有风险的端口,比如:3389、80等端口,我们可以通过修改注册表的方法将其设置不特殊的秘密端口,这样服务器端口的安全隐患就不复存在了。
服务器常见故障及相应的解决方法服务器一般是很少出现问题的,一旦出现问题,怎样去积极的抢救呢?我们不能坐以待毙,原因一旦服务器故障,那么该服务器上的所有网站将都会无法打开。
[VIP专享]HP Jetdirect 打印服务器
HP Jetdirect 打印服务器-HP Jetdirect 基本故障排除清除过程排除网络故障的策略依清除过程而定。
清除过程应当将问题范围缩小到下述三种基本组成部分之一。
如果网络拓扑结构复杂,可以先从确认打印机到网络的连接方面入手,然后是计算机到网络的连接;最后处理复杂的网络连接。
排除HP Jetdirect 打印服务器的故障包括三组常见组成部分:1.试图打印到HP Jetdirect 打印服务器或试图配置HP Jetdirect 打印服务器的计算机。
2.将计算机连接到HP Jetdirect 打印服务器的网络硬件。
其中包括电缆、集线器、交换机、网桥、路由器或服务器。
3.打印机和HP Jetdirect 打印服务器。
简介打印配置页可用的最佳故障排除工具之一就是HP Jetdirect 配置页,有时候也称为自测页。
配置页可以使用打印机的控制面板或者外置或LIO 打印服务器的Test 按钮打印出来。
从控制面板打印配置页打印机种类繁多,打印机控制面板的类型至少有两种-“Classic”和“Flex”。
Classic 控制面板通常具有Menu 和Item 按钮;Flex 控制面板具有复选标记按钮及箭头按钮和/或数字键盘。
更为复杂的是各类惠普打印机处于同一环境下,此时可以使用以下基本导航概念:HP Jetdirect Configuration 是计算机的I/O 端口,因此通常可以在Information菜单中找到,配置菜单一般在I/O 或EIO 菜单中。
有些打印机可以打印Menu Map,以显示可用的内容。
在Classic 菜单中:Figure 1: Classic 控制面板(按钮布局根据打印机型号不同而各有不同)1.使用前面板上的MENU 键,转到Information 、Test 或PCL Test 菜单。
2.按下ITEM 键,转到Print Configuration 、Print EIO Configuration 、PCLConfiguration Page 或Self Test 。
服务器常见故障及解决办法
服务器常见故障排除服务器常见故障一、造成服务器无法启动的主要原因:1)市电或电源线故障(断电或接触不良)2)电源或电源模组故障3)内存故障(一般伴有报警声)4)CPU故障(一般也会有报警声)5)主板故障6)其它插卡造成中断冲突服务器常见故障二、服务器无法启动?1)检查电源线和各种I/O接线是否连接正常。
2)检查连接电源线后主板是否加电。
3)将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。
4)检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。
5)如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板)服务器常见故障三、系统频繁重启?造成系统频繁重启的原因:1)电源故障(替换法判断解决)2)内存故障(可从BIOS错误报告中查出)3)网络端口数据流量过大(工作压力过大)4)软件故障(更新或重装操作系统解决)服务器常见故障四、服务器死机故障判断处理:服务器死机故障比较难以判断,一般分为软件和硬件两个方面:1)软件故障首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。
电脑病毒的原因。
系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。
软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决2)硬件故障硬件冲突电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。
硬盘故障(通过扫描硬盘表面来检查是否有坏道)内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断)主板故障(使用替换法来判断)CPU故障(使用替换法)板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。
HPE ProLiant Gen10 服务器的故障排除指南
© Copyright 2017-2019 Hewlett Packard Enterprise Development LP通知本文档中包含的信息如有更改,恕不另行通知。
随 Hewlett Packard Enterprise 产品和服务提供的明确保修声明中阐明了此类产品和服务的全部保修服务。
此处的任何内容都不应视作额外的担保信息。
对于本文档中包含的技术或编辑方面的错误或疏漏,Hewlett Packard Enterprise 不承担任何责任。
保密的计算机软件。
必须具有 Hewlett Packard Enterprise 颁发的有效许可证,方可拥有、使用或复制本软件。
按照 FAR 12.211 和 12.212 的规定,可以根据供应商的标准商业许可证授权美国政府使用商用计算机软件、计算机软件文档以及商业编号的技术数据。
单击指向第三方网站的链接将会离开 Hewlett Packard Enterprise 网站。
Hewlett Packard Enterprise 无法控制 Hewlett Packard Enterprise 网站之外的信息,也不对这些信息承担任何责任。
商标声明Microsoft®、Windows®和 Windows Server®是 Microsoft Corporation 在美国和(或)其他国家(或地区)的注册商标或商标。
Linux®是 Linus Torvalds 在美国和其他国家(地区)的注册商标。
Red Hat®是 Red Hat, Inc. 在美国及其他国家(地区)的注册商标。
SD 和 microSD 是 SD-3C 在美国和/或其他国家(地区)的商标或注册商标。
VMware®是 VMware, Inc. 在美国和/或其他司法辖区的注册商标或商标。
目录使用本指南 (10)入门 (10)支持的服务器 (10)其它故障排除资源 (11)故障排除的准备工作 (12)服务器故障排除的前提条件 (12)重要安全信息 (12)设备上的符号 (13)警告和小心 (13)静电释放 (14)防止静电释放 (14)防止静电释放的接地方法 (15)收集症状信息 (15)诊断服务器前的准备工作 (15)处理器故障排除准则 (16)将服务器降级到最低硬件配置 (17)常见问题的解决方法 (18)解决连接松动问题 (18)搜索服务通知 (18)固件更新 (18)在启用了 HPE 可信平台模块和 BitLocker 的情况下更新服务器 (19)DIMM 处理准则 (19)DIMM 和 NVDIMM 安装信息 (19)在 HPE ProLiant Gen10 服务器上支持的 Intel Xeon 可扩展处理器 (20)DIMM-处理器兼容性 (20)NVDIMM-处理器兼容性 (20)组件 LED 指示灯定义 (20)存储 (20)SAS、SATA 和 SSD 驱动器准则 (20)热插拔驱动器 LED 定义 (21)半高 LFF 驱动器 LED 指示灯定义 (22)NVMe SSD LED 指示灯定义 (22)SFF 闪存适配器组件和 LED 指示灯定义 (24)系统电源 LED 指示灯定义 (24)运行状态条形 LED 指示灯定义(仅限 c 系列服务器刀片) (25)前面板 LED 指示灯和按钮 (25)前面板 LED 指示灯注释 (26)使用服务器运行状况摘要 (26)前面板 LED 指示灯电源故障代码 (28)控制器和能源包电缆 (29)远程故障排除 (30)远程故障排除工具 (30)远程访问 Virtual Connect Manager (31)3使用 iLO 远程排除服务器和服务器刀片的故障 (31)使用 Onboard Administrator 对服务器刀片进行远程故障排除 (32)使用 OA CLI (32)诊断流程图 (34)诊断步骤 (34)在开始之前收集重要信息 (34)故障排除流程图 (34)使用诊断流程图 (34)初始诊断 (34)远程诊断流程图 (35)开机故障流程图 (36)ML 和 DL 系列服务器的服务器开机故障流程图 (36)XL 系列服务器的服务器开机故障流程图 (38)BL 系列服务器刀片的服务器刀片开机故障流程图 (40)POST 故障流程图 (43)POST 问题 - 服务器在 POST 期间挂起或重新引导流程图 (44)POST 问题 - 无法引导,没有视频流程图 (46)POST 问题 - 可以引导,没有视频流程图 (47)操作系统引导故障流程图 (48)Intelligent Provisioning 故障流程图 (49)控制器故障流程图 (51)HPE Smart Array 控制器的能源包问题 (53)物理驱动器故障流程图 (56)逻辑驱动器故障流程图 (58)故障指示流程图 (59)非刀片服务器的服务器故障指示流程图 (60)BL c 系列服务器刀片的服务器刀片故障指示流程图 (62)网卡故障流程图 (64)常规诊断流程图 (67)硬件问题 (70)用于所有 ProLiant 服务器的步骤 (70)电源问题 (70)服务器无法开机 (70)供电来源问题 (70)电源问题 (71)没有足够的电源配置 (72)UPS 问题 (73)UPS 无法正常供电 (73)显示电池电量不足警告 (74)UPS 上的一个或多个 LED 指示灯呈红色 (74)常规硬件问题 (74)新硬件问题 (74)未知问题 (76)第三方设备问题 (76)测试设备 (77)驱动器问题(硬盘驱动器和固态驱动器) (78)驱动器发生故障 (78)无法识别驱动器 (78)无法访问数据 (79)服务器响应时间比平时长 (80)HPE SmartDrive 图标或 LED 指示灯指示驱动器错误,或者在 POST、HPE SSA 或HPE SSADUCLI 中显示错误消息 (81)4SSD Smart Wear 错误 (81)诊断阵列问题 (81)HPE Smart Array SR 和 MR Gen10 控制器的诊断工具 (81)存储控制器问题 (82)常规控制器问题 (82)控制器不再是冗余的 (83)在 RAID 模式下访问的驱动器上的数据与在非 RAID 模式下访问的数据不兼容 (84)在将驱动器移到新的服务器或 JBOD 后,Smart Array 控制器不显示这些驱动器 (84)驱动器漫游 (84)具有 10 SFF 驱动器背板或 12 LFF 驱动器背板的服务器上的数据故障或磁盘错误 (84)禁用 RAID 模式后找不到 HPE Smart Array S100i SR Gen10 驱动器 (85)无法识别 HPE Smart Array S100i SR Gen10 驱动器 (85)风扇和散热问题 (86)常规风扇问题 (86)风扇的运行速度比预期速度高 (87)风扇噪音太大(高速) (87)风扇噪音太大(低速) (88)热插拔风扇问题 (88)HPE BladeSystem c 系列机箱风扇高速运行 (89)内存问题 (89)常规内存问题 (89)隔离并最小化内存配置 (90)服务器内存不足 (90)DIMM 配置错误 (90)服务器无法识别现有的内存 (91)服务器无法识别新的内存 (92)无法修复的内存错误 (93)超过可纠正的内存错误阈值 (94)NVDIMM 问题 (94)NVDIMM 安装错误 (94)已禁用 NVDIMM (95)在操作系统中不显示持久性内存驱动器 (96)持久性内存驱动器是只读的 (96)持久性内存驱动器不再具有持久性 (97)HPE 可扩展持久性内存问题 (98)在操作系统中不显示持久性内存驱动器 (98)持久性内存驱动器是只读的 (100)持久性内存驱动器不再具有持久性 (101)HPE 可扩展持久性内存备份和恢复失败 (102)无法配置可扩展持久性内存 (103)处理器问题 (104)排除处理器故障 (104)无法纠正的计算机检查异常 (105)可信平台模块问题 (105)TPM 发生故障或检测不到它 (105)系统电池电量不足或耗尽 (106)主板和电源背板问题 (106)microSD 卡问题 (107)系统无法从 microSD 卡引导 (107)U 盘问题 (107)系统无法从 U 盘引导 (107)图形和视频适配器问题 (108)排除常规图形和视频适配器故障 (108)视频问题 (108)打开服务器电源后屏幕黑屏超过 60 秒 (108)如果使用节能功能,显示器无法正常工作 (109)显示颜色不对 (110)5显示慢慢移动的水平线 (110)鼠标和键盘问题 (110)扩展卡问题 (111)系统在更换扩展卡期间要求使用恢复方法 (111)网络控制器或 FlexibleLOM 问题 (111)安装了网络控制器或 FlexibleLOM,但无法正常工作 (111)网络控制器或 FlexibleLOM 已停止工作 (112)在添加扩展卡后,网络控制器或 FlexibleLOM 停止工作 (112)网络互连模块刀片问题 (113)具有 AMD 处理器的 HPE ProLiant Gen10 服务器的网络性能或虚拟机性能问题 (113)能源包问题 (114)Gen10 服务器中的能源包支持 (114)能源包在长期搁置后可能会耗尽电量 (114)能源包配置错误 (115)能源包故障 (115)电缆问题 (116)在使用较旧的小型 SAS 电缆时,发生驱动器错误、重试、超时和无根据的驱动器故障 (116)无法识别 USB 设备,显示错误消息,或者设备在连接到 SUV 电缆时无法开机 (116)软件问题 (117)操作系统问题和解决方法 (117)操作系统问题 (117)操作系统锁定 (117)错误日志中显示错误 (117)在安装 Service Pack 后出现问题 (117)更新操作系统 (118)更新操作系统的前提条件 (118)更新操作系统 (118)重新配置或重新加载软件 (118)重新配置或重新加载软件的前提条件 (118)还原备份版本 (119)Linux 资源 (119)应用程序软件问题 (119)软件锁定 (119)更改软件设置后出错 (119)更改系统软件后出错 (120)安装了应用程序后出错 (120)ROM 问题 (120)远程 ROM 刷新问题 (120)命令行语法错误 (120)目标计算机上拒绝访问 (121)无效或不正确的命令行参数 (121)网络连接在进行远程通信时失败 (121)ROM 刷新期间发生故障 (121)不支持目标系统 (122)系统在固件更新期间要求使用恢复方法 (122)引导问题 (123)服务器无法引导 (123)UEFI 服务器的 PXE 引导准则 (125)软件和配置实用程序 (126)服务器模式 (126)产品规格说明简介 (126)6Active Health System Viewer (126)Active Health System (127)Active Health System 数据收集 (127)Active Health System 日志 (127)HPE iLO 5 iLO (127)iLO 联合 (128)iLO服务端口 (128)iLO RESTful API (129)RESTful Interface Tool (129)iLO Amplifier Pack (129)Integrated Management Log (129)Intelligent Provisioning (129)Intelligent Provisioning 操作 (130)管理安全性 (131)适用于 Windows 和 Linux 的 Scripting Toolkit (131)UEFI System Utilities (131)选择引导模式 (131)安全引导 (132)启动嵌入式 UEFI Shell (133)HPE Smart Storage Administrator (133)HPE MR Storage Administrator (134)StorCLI (134)USB 支持 (134)外置 USB 功能 (134)支持冗余 ROM (134)安全性和安全优势 (135)使系统保持最新状态 (135)更新固件或系统 ROM (135)Service Pack for ProLiant (135)更新 System Utilities 中的固件 (136)从 UEFI 嵌入式 Shell 中更新固件 (137)联机刷新组件 (137)驱动程序 (137)软件和固件 (137)支持的操作系统版本 (138)HPE Pointnext 产品 (138)主动通知 (138)报告和日志 (139)报告和日志概述 (139)Active Health System 日志 (139)Active Health System 日志下载方法 (139)下载某个日期范围的 Active Health System 日志 (139)下载整个 Active Health System 日志 (140)使用 cURL 下载 Active Health System 日志 (141)清除 Active Health System 日志 (143)通过 IP 下载 AHS 日志 (143)下载 Active Health System 日志 (iLOREST) (144)使用 AHSV 排除故障或打开支持案例 (145)Intelligent Provisioning 诊断工具 (145)Integrated Management Log (145)查看 IML (145)使用 HPE SSA 执行诊断任务 (146)HPE Smart Storage Administrator Diagnostics Utility CLI (146)安装实用程序 (146)7在 CLI 模式下启动该实用程序 (146)诊断报告过程 (147)查看诊断报告 (147)识别和查看诊断报告文件 (147)SmartSSD Wear Gauge 报告过程 (148)查看 SmartSSD Wear Gauge 报告 (148)识别和查看 SmartSSD Wear Gauge 报告文件 (148)HPS 报告 (148)Linux 报告 (148)故障排除资源 (149)在线资源 (149)Hewlett Packard Enterprise 支持中心网站 (149)Hewlett Packard Enterprise 信息库 (149)以前的 HPE ProLiant 服务器型号的故障排除资源 (149)服务器刀片机箱故障排除资源 (149)故障排除资源 (149)服务器文档 (150)服务器用户指南 (150)服务器维护和维修指南 (150)设置和安装指南 (151)HPE iLO 软件文档 (151)UEFI System Utilities 文档 (151)Intelligent Provisioning 软件文档 (151)产品规格说明简介 (151)白皮书 (151)服务通知、咨询和通告 (151)订阅服务 (152)HPE Pointnext 产品 (152)产品信息资源 (152)其他产品信息 (152)HPE SmartMemory 速度信息 (152)注册服务器 (152)服务器功能概述和安装说明 (152)主要功能和选件部件号 (152)服务器和选件的规格、符号、安装警告和通告 (153)HPE Smart Array 控制器文档 (153)备件号 (153)拆卸步骤、部件号和规格 (153)拆卸和更换步骤视频 (153)技术主题 (153)产品安装资源 (153)外部布线信息 (153)电源容量 (154)开关设置、LED 指示灯功能、驱动器、内存、扩展卡和处理器安装说明以及板卡布局.154产品配置资源 (154)Data Center Infrastructure Advisor (154)设备驱动程序信息 (154)DDR4 内存配置 (154)操作系统安装和配置信息(对于出厂时安装的操作系统) (154)服务器配置信息 (154)服务器设置软件的安装和配置信息 (154)服务器的软件安装和配置 (154)HPE iLO 信息 (155)服务器管理 (155)8服务器管理系统的安装和配置信息 (155)容错、安全保护、保养和维护、配置和设置 (155)网站 (156)支持信息和其他资源 (157)获取 Hewlett Packard Enterprise 支持 (157)获取更新 (157)客户自行维修 (158)远程支持 (158)保修信息 (158)法规信息 (158)文档反馈 (159)症状信息检查清单 (160)9使用本指南入门注意:对于常见的故障排除步骤,“服务器”一词用于表示服务器和服务器刀片。
服务器硬件故障排除技巧
服务器硬件故障排除技巧在日常工作中,服务器硬件故障是一种比较常见的问题,一旦出现硬件故障,可能会导致服务器无法正常运行,进而影响到整个系统的稳定性和可用性。
因此,及时有效地排除服务器硬件故障至关重要。
下面将介绍一些常见的服务器硬件故障排除技巧,希望对大家有所帮助。
一、检查电源供应1. 确认电源线连接:首先要检查服务器的电源线是否连接牢固,有时候电源线可能会松动或者脱落,导致服务器无法正常供电。
2. 检查电源插座:确认电源插座是否正常供电,有时候插座故障也会导致服务器无法正常开机。
3. 使用电源检测仪:如果以上两点都没有问题,可以使用电源检测仪来检测电源是否正常输出,以确定是否是电源故障导致的问题。
二、检查硬件连接1. 检查数据线连接:确保硬盘、内存条、网卡等硬件设备的数据线连接牢固,有时候数据线松动也会导致硬件无法正常工作。
2. 检查硬件插槽:如果硬件设备是插在插槽上的,可以尝试重新插拔硬件设备,确保插槽没有松动或者脏污导致接触不良。
三、检查硬件状态1. 查看指示灯:服务器硬件设备通常会有指示灯,通过指示灯的状态可以初步判断硬件设备是否正常工作,比如硬盘指示灯闪烁表示硬盘在工作。
2. 使用硬件检测工具:可以使用硬件检测工具对服务器硬件进行全面检测,查看硬件设备的工作状态和健康状况,及时发现问题并进行处理。
四、排除故障1. 逐一排除:如果确定是某个硬件设备出现故障,可以逐一排除其他硬件设备,确定问题所在,然后进行修复或更换。
2. 备份数据:在进行硬件维修或更换之前,一定要及时备份重要数据,以免数据丢失造成不可挽回的损失。
五、定期维护1. 清洁服务器:定期清洁服务器内部和外部,防止灰尘积累导致散热不良,影响硬件设备的正常工作。
2. 更新驱动程序:定期更新服务器硬件设备的驱动程序和固件,保持硬件设备的最新状态,提高系统的稳定性和性能。
通过以上一些常见的服务器硬件故障排除技巧,可以帮助大家更好地应对服务器硬件故障问题,保障服务器系统的稳定运行。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络技术飞速发展,计算机网络被广泛应用于学校、科研部门、政府机关及商业等各个领域。
网络管理的好坏将直接影响网络的有效使用,其中对于服务器的安全维护十分重要。
服务器的管理维护包括软件和硬件两个方面,哪一方面出问题都会让服务器运行出现故障甚至瘫痪。
下面就给大家说一说本人在实际中遇到的一次HP服务器故障排除。
HP服务器故障排除一、出现故障
笔者单位使用的是HP NetServer LH3000服务器组成的局域网,自从建网以来服务器硬件一直良好。
但有一次启动服务器后发现有问题,刚开始自检运行都正常,等到进入Windows2000主画面时,发现服务器主机内的噪音变大,开始认为是系统软件加载错误导致的,多次重新启动服务器,有时重启后正常维持时间稍长,有时稍短。
等到系统启动完毕后,注册进入系统,打开管理工具,查看系统日志,没有发现故障提示。
HP服务器故障排除二、故障的排除
于是我们怀疑是感染了病毒,把服务器设置成从软盘驱动器启动,用KV3000杀毒王引导盘启动服务器,之后扫描硬盘,查完后未发现病毒,排除了病毒感染的可能性。
又怀疑与BIOS有关?检查BIOS设置,查出版本号,到惠普网站查询,找到了对应的新BIOS版本,于是决定升级BIOS试一试。
先到惠普网站下载了最新的BIOS升级程序,拷贝到软盘,为了保险,先将服务器现在的BIOS备份后再升级。
从软盘引导系统,运行升级程序,大约25分钟之后,升级终于顺利完成。
再启动进入BIOS设置,改为硬盘启动。
重启服务器,进入系统后,过了一会儿,故障依旧。
至此,我们才转向服务器的硬件检查,打开了机箱,检查电源风扇,运转正常,粗略检查其它风扇也未见异常。
最后请HP专业维护人员来,并将系统I/O 控制板和电源控制板予以更换,更换重启服务器后,问题仍未解决。
于是开始全面检查服务器,在服务器面板主菜单中查看,意外发现“Event Log”中的“System Event”下有一提示,显示“Fan Slow”。
于是我们重新打开机箱,认真检查每组风扇,由于服务器内部有多组风扇,各自负责不同控制板的散热。
分别检查,终于在机器隔板下的隐蔽处找到两组风扇,其中有一组风扇停转。
原因找到后,换上新风扇再启动服务器,声音小了。
运行一切正常。
至此服务器故障得以排除。
HP服务器故障排除三、故障排除分析
从以上故障排除过程得知,HP NetServer LH3000服务器的面板日志记录中记载着系统每次启动和关闭时的硬件检测信息,如果系统出现故障,我们可以直接查看系统事件,以便快速诊断故障部位,这将起到事半功倍的作用。
现将HPNetServer LH3000服务器面板的主要内容简单介绍一下:
Event Log
Fw lnfo:主要是一些设备信息,如BIOS版本号等。
System lnfo:主要是硬件信息,如CPU主频、型号、CPU号(多处理器)、L2Cache、内存容量及所在插槽等。
Component lnfo:主要是产品标号、序列号等。
Service:记录一些服务信息。
Adjust Contrast:调整面板显示的对比度。
按面板右侧的上下箭头,选择进入子菜单;当光标处于“Event Log”时回车进入,选择“System Event”再进入,即显示系统引导、死机、管理、硬件故障信息等内容。
通过查看记录即可知道异常情况的原因及时间等信息,为解决问题提供依据。
HP服务器故障排除四、经验总结
HP服务器出现噪音变大的故障,初期可能只是风扇转速减慢,系统还能继续工作,但由于系统负荷逐渐加大,环境温度升高,使服务器内部温度升高,加大了风扇的负荷,最终导致一组风扇损坏,将排风散热的工作由另一组风扇负担,系统初始启动时,系统产生热量较小,一组风扇还可以承担。
当系统运行一段时间后,机箱内温度开始升高,当系统检测到温度已超过其阈值时,于是发出指令提高风扇转速,加速散热,从而导致服务器主机内的声音突然加大。
如果各组风扇都运行正常,则可以保证服务器主机内的温度在正常范围内,从而保证系统正常运行。
在检查服务器的硬件问题时,最好先查看服务器面板主菜单“Event Log”的内容。
由于服务器事件存储容量有限,应定期备份记录,否则溢出后新事件将无法记录,会导致系统实时信息丢失,不利于排查故障。
建议用Navigator CD制作DiagTools启动软盘,需两张软盘。
定期用软盘启动服务器,启动后回车,即选择Diagtools和Event Log Display Utility Ver 3.12,进入Event Log Display Utility Ver 3.12,即可导出Event Log记录;否则按“ESC”,只有Diagtools不能导出事件日志。
还可以通过Diagtools工具检查系统,保证系统的安全.。