无盘服务器常见问题解决方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
无盘实用技术(二):无盘服务器常见问题解决方法2010-09-27 16:34
一.前言
当无盘服务器出现故障的时候,相比PC机器故障而言,其造成的损失可就大多了,作为服务器维修人员需要了解一些服务器故障恢复的基本知识,知道在维修时可以做些什么来最快速的解决问题也可以减少故障停机时间。要确认其问题是软件还硬件照成的,在对故障进行分析和判断,其之间的关系也是密切相关的,硬件故障可以导致软件无法正常运作,软件缺陷和设置也会导致硬件得不到正常的发挥!所以,当无盘服务器出现故障和不能正常运作的时候,我们要对无盘服务器故障进行准确的分析,快速判断,合理的解决才是首要的,让客户减少损失,就是提升公司价值和利润,这篇文章为大家提供无盘服务器常见问题解决思路与办法!
二.无盘服务器问题排除的基本原则性问题
信息收集
1.目前,市场上的无盘服务器分为2大类,第一类为品牌服务器,像国外:IBM,DELL,惠普。国内:奥雷,曙光,浪潮等等,无论是从无盘服务器配件选配,还有稳定性设计与测试,都是一套整体的规范模式,这类无盘服务器优点在于其稳定性和兼容性优越,缺点是成本过高,在出现故障以后,可以参考其官方网站公布的手册和常见问题解决文档,便可以快速确认问题,还有一种是机箱前面板版故障灯显示分析,可以参考其说明书判断,总体来说,这一类服务器故障率极低,一旦出现硬件故障,入手难度性强,因为其整体配件搭配设计,会导致硬件对换和排除法难于实现,其兼容性有过多的要求,所有,在这类服务器出现故障的情况下,最好能先前能咨询供应商与厂商技术支持!在满足客户需求以及适应无盘服务器市场情况下,广州锐骏()推出奥雷系列无盘服务器, 考虑到网吧无盘服务器的特点,全部采用2U机架式设计,SAS/SATA 热插拔硬盘接口,极大的方便了无盘服务器的装配与维修,强劲的散热系统更适合网吧行业复杂的机房环境,内部配件的选配,均采用一线大厂的高性能、高可靠性产品,全部出厂机器均经过高温、高湿、全细节48小时烤机,奥雷无盘服务器无须任何装配的设计更降低了由于二次装配带来的故障与隐患,有效的控制了无盘服务器给网吧照成的损失,详情见详情见
/products.jsp?category_id=204。
2.第二类DIY服务器,这一类型的服务器,细看兼容和整体稳定性方面,存在过多的缺点和隐蔽性故障,随着无盘服务器配件不断的发展与进步,国内一些专业从事无盘服务器行业研究的公司,也展开了多年的较量与竞争,在稳定性和兼容性有着巨大的改变,无论从性能,价格,和更适用无盘网络可以看出,同国外品牌服务器在无盘应用中更胜一筹!
3.当无盘服务器出现故障,首先就需要对服务器配件型号和参数进行仔细的了解!
1).无盘服务主板型号
2).内存和CPU类型
3).硬盘数量与型号
4).主板集成RAID 或者独立RAID 卡芯片型号
5v电源功率
6).主板BIOS版本
7).操作系统版本
接着,对各类配件的参数以及的兼容性确认没有问题,像某些品牌内存和CPU与主板参数都能搭配,但是主板会对品牌的选择有要求,一般,出现兼容性的问题,可以参考主板官方网站提供的CPU与内存兼容列表,即QVL。
4.故障信息
1).在POST时,屏幕显示的异常信息
2).服务器本身指示灯的状态
3).报警声和BEEP CODES
4).BIOS及系统Events Log 文件
5. 确定故障类型和故障现象
1).开机无显示
2).通电后自检阶段故障
3).安装阶段故障和现象
4).操作系统加载失败
5).系统运行阶段故障
尽量恢复系统缺省配置
1.尽量最少硬件基本系统
2.裸机测试
3.清除BIOS设置
4.升级主板最新BIOS
5.更新驱动程序最新版本
从基本到复杂
1.系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。
2.硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止
3.软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止
交换对比
1.在最大可能相同的条件下,交换操作简单效果明显的配件
2.交换正常服务器与故障服务器之间的配件
3.交换整机,既交换正常服务器与故障服务器地里位置和环境
4.更换操作系统类型,快速判断系统与驱动之间兼容性问题
三.如何判断无盘服务器导致客户机卡机问题
一般来说无盘网吧在实际运行后一段时间,再出现,客户机运行时的卡,慢等故障绝大部分由以下几种情况导致的;
1).是客户机在日常维护中,因为不当操作导致一个或多个镜像包中病毒
2).是网吧的网络在使用过程中,因为软件或硬件原因产生类如网络风暴等极大干扰网络的因素,导致网吧局域网络的效率下降;
3).是INTENET接入方面的速度受到影响;使得由于外网速度变慢,导致客户以为是内网速度变慢;
4).便是无盘服务器方面出现故障,或性能衰减;导致客户机反映出卡和慢的现象
常见问题判断步骤;
询问
当技术人员在接听客户电话报修时,首先要询问清楚问题的准确描述;通过询问以下问题来基本定位问题;
客户电话报修网吧很卡的时候;我们一般建议您先提问客户如下一些问题;
A 请问您是网吧技术人员么?如果可以请直接和技术人员沟通;错误的现象描述很可能将问题的解决带向相反方向;
B 您的网吧全部机器都卡么?请您多询问一下不同配置的,不同交换机下的不同客户,他们的机器使用起来都卡么?这些信息对于我们准确判断故障非常有帮助;
C 您网吧现在的在运行硬盘游戏的人,感觉到机器慢么?
D,在这些问题出现之前,有人对服务器或者网络有什么操作么?或者有什么可能相关的事情发生么?比如雷电;
E,服务器现在的硬盘灯是闪烁状态还是长亮不灭?
以上类似问题很多,各位请根据自己客户的实际情况提出一些行之有效的问题,尽可能准确地定位问题所在;
初步检测
经过第一阶段的询问,大概的问题应该已经略有了解了。我们可以进一步远程访问服务器和客户机;通过如下的一些初步检测;能帮助确认问题;
A 使用HDSPEED,及HDTACH测试客户机虚拟盘,如果HDSPEED持续速度测试不长期低于20M/S,HDTACH 反复测试虚拟盘寻道时间高于20/MS以上,那么可以确认客户机的虚拟盘的速度是不能满足客户游戏需要的;
B 用快速有效的查杀手段,对无盘客户端进行病毒检查,长时间的查杀毒操作是会让问题客户机器变得更卡;所以要谨慎使用,尽量避免影响网吧营业;
C 选择一些客户机仅(只、唯一)挂载,完全可信的系统镜像(比如刚施工完成后保留的系统镜像备份);进行A测试;排查是否由于不当操作导致(包括病毒)的客户机系统方面问题;
D 检查服务器日志,看看日志文件中有没有报什么错误,有没有什么规律可循;
E 对服务器的读盘做读取能力测试,比如HDSPEED,HDTUNE,等等软件,请注意,因此时的服务器是在有负载状况下,因为数量众多的客户机每一瞬时对服务器造成的压力都无法估计,因此本测试只能看服务器的读盘在此状态下剩余的磁盘能力,如果一直在低位运行,那很可能是服务器读盘有问题了;正常情况下,应该如下图;
F 对服务器操作系统做是否中毒等方面的检查判断;