服务器硬件的知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ServeRAID manager程序: 安装在系统中,在线查看RAID和硬盘状态 DSA程序: 收集系统信息、底层硬件日志,借以判断硬件及系统状态;
二、 IBM PC Server产品介绍及故障诊断
LED指示灯法: 前面板: 3.5英寸硬盘: 2.5英寸硬盘:
二、 IBM PC Server产品介绍及故障诊断
前面板指示灯分析: 不管是安装了3.5英寸的还是2.5英寸的硬盘,设备前面板的指示灯基本都一样,主要需要关注两个: 操作员信息面板和硬盘驱动器状态指示灯; 操作员信息面板:
需要注意: 硬盘驱动器活动指示灯:当该指示灯闪烁时,表明硬盘驱动器正在使用中。 信息指示灯:当该指示灯点亮时,表明发生了一般性事件。光通路诊断面板上的某个指示 灯也会点亮,以帮助找出错误。 系统错误指示灯:当该指示灯点亮时,表明发生了系统错误。光通路诊断面板上的某个指示灯 也会点 亮,以帮助找出错误。 释放滑锁:将该滑锁滑向左侧可操作光通路诊断面板,该面板位于操作员信息面板的后 面。
一、PC Server基础知识介绍
内存技术: ECC校验:只能修正1比特的错误; 为了改善ECC性能: IBM:chipkill技术; HP:advanced ECC技术; 内存镜像技术: 单纯提高ECC校验位数是不能解决所有的内存问题的; 内存镜像技术就应运而生;--类似于磁盘镜像技术; 内存镜像技术可以支持内存热交换和热添加,可以在线解决内存问题和进行内存扩容; HP和IBM各有自己的内存镜像技术; 在线内存备份技术: 可以使用备份的内存为使用内存做在线备份;类似于硬盘技术中的热备盘; 内存RAID技术: 类似于硬盘RAID技术,HP DL760灯型号设备上有使用;
二、 IBM PC Server产品介绍及故障诊断
IBM System X3650主要性能特征: CPU:Intel® Xeon™ FC-LGA 771 双核,4M二级缓存,2个插槽; 内存:12个DIMM插槽,单条大小可以为512M、1G、2G、4G,必须成对; 内存必须为全缓冲DIMM(FBD)PC2-5300 DIMM,而且必须支持chipkill技术; 光驱:IDE接口,可以是24倍速的CD,也可以是8倍速的DVD; 硬盘:只支持SAS硬盘;可以为3.5英寸,也可以是2.5英寸; 3.5英寸最多可以插6个, 2.5英寸最多可以插8个; PCI:集成在主板上有两个PCI E插槽,使用可选件可以支持PCI X的卡; 风扇:标准5个,最多可以10个(支持冗余散热); 电源:835W,最少一个,最多两个(支持冗余);
一、PC Server基础知识介绍
总线技术: 目前的服务器,多采用I2C总线技术; I2C总线技术的作用是集中管理服务器的部件,并监控它们的状态,以便于管理; CPU技术: RISC :精简指令集;多用于小型机; CISC :复杂指令集;多用于PC机及PC Server; SMP技术 :对称多处理器技术;保证了服务器的运算性能和冗余性能; 这个技术的存在让我们不会因为坏了多个CPU中的一个而导致设备宕机; DP技术:双处理器技术;SMP技术的低端版; NUMA技术: IBM特有技术,扩展性能; 多台设备联机聚成一台性能更高的设备;
主要故障诊断方法: LED指示灯法: 前面板LED指示灯、光路诊断板指示灯、后面板LED指示灯、主板LED指示灯; POST 蜂鸣声代码、错误消息和错误日志: POST为开机自检;power on self-test; 开机自检(POST)生成蜂鸣声代码和消息,以表明测试成功完成或检测到问题。
诊断程序、消息和错误代码: IBM PC Server在只读存储器上集成了一个诊断程序; 需要重启,按下F2键,运行诊断程序;
目录
一、 PC Server 基础知识介绍 二、 IBM PC Server产品介绍及故障诊断 三、 HP PC Server产品介绍及故障诊断 四、 DELL PC Server产品介绍及故障诊断 五、 存储方式的分类 六、 交换机的介绍 七、AIX操作系统的安装
1
一、PC Server基础知识介绍
一、PC Server基础知识介绍
硬件冗余技术: 双份硬件;备用件处于待命状态; 实时监控部件使用情况,一旦故障,备用件立即顶替,保证设备不宕机; 比如:电源的冗余技术,保障供电; 风扇的冗余技术,保障散热;
热插拔和热添加技术: 硬件冗余技术往往都伴随着热插拔和热添加技术; 热插拔技术是指某些部件可以在系统运行的情况下进行插拔,不影响使用; 热添加技术是指某些部件的空槽位可以在系统运行的情况下插入相应的部件,类似于USB设备的即插 即用; 热插拔和热添加技术由特殊的电路来实现,主要是热插拔控制器和针对槽位的电流控制器;
二、 IBM PC Server产品介绍及故障诊断
产品介绍: Netfinity系列---低端、早期产品 集成度低; 配置低; 技术简单; X系列---曾经的主流产品 集成度提高; 性能提升; 采用主流技术; System X系列---最新的产品 由X系列发展而来; 各项性能均为顶端; 目前各外地机场的IBM设备清单中,只有IBM System X 3650这一款机型; 属于最新的产品系列,而且3650本身也是IBM很经典的一款机型;
二、 IBM PC Server产品介绍及故障诊断
光路诊断板分析: 使用释放滑锁将光路诊断板拉出的时候,可以看到如下图所示: OVER SPEC: 电源功率超过最大额定值 PS X: 托架X 中的电源发生故障; CPU: 微处理器发生故障; VRM: 微处理器稳压器模块(VRM)上发生错误。 CNFG: 发生硬件配置错误 MEM: 当该指示灯点亮时,表明发生了内存错误。 NMI: 发生机器检查错误 SP: 服务处理器发生故障 DASD: 发生硬盘驱动器错误 RAID: 发生RAID 控制器错误 FAN: 风扇发生故障 TEMP: 系统温度已超出阈值级别 BRD: 系统板上发生错误 PCI: PCI 总线或系统板上发生错误
一、PC Server基础知识介绍
双网卡绑定技术 网卡故障及链路故障容易造成业务中断; 使用软件,将两块网卡虚拟成一个网卡,对外进行通信;如果其中一块网卡或其链路出现故障,不影 响设备与外界的通信; 主要的厂商有brodcom和intel; 诊断技术: 指示灯技术:通过指示灯或者液晶面板等手段对设备部件的状态进行监控; Biblioteka BaiduBM:光路诊断板; HP:指示灯技术;新设备也开始使用光路诊断技术; DELL:液晶面板告警技术; 软件诊断:各厂商都使用各自的软件对设备节进行在线诊断; IBM:director;DSA HP:Homepage;SMH;SIM; DELL:openmanager Administrator; Dset;
PC Server的来源:PC Server 从PC机发展而来,在继承了X86架构的同时,加入了服务器的技术; PC Server的服务器特性: 1. Availablity:可用性 --即稳定性,指服务器能够持续稳定运行较长时间; 实时的生产设备要求极高的稳定性,服务器必须能够长时间稳定和不间断的运行; 这种要求除了对服务器的硬件质量有很高的要求外,也催生了一些服务器的技术: CPU的SMP技术 、内存的冗余、热插拔及镜像技术; 硬盘的RAID技术;电源的热插拔技术、风扇的热插拔技术等等; 2. Scalability:可扩展性---可以进行扩容; 高要求、高质量、复杂的技术支持,导致了服务器的成本较高,从而要求设备具备可扩展性;
4.
Manageability:易管理性---硬件故障的在线修复和故障的预警机制; 要让服务器易于管理,那么其故障的告警机制、诊断机制、在线修复机制必须要强; 所以产生了冗余技术、备份技术、在线诊断技术、故障预警技术、内存纠错技术、热插拔技术
和远程诊断技术等;
一、PC Server基础知识介绍
智能监控管理技术: 我们必须对服务器的整体运行情况进行监控,所以监控管理技术会应运而生; 首先,理解service processor—服务处理器; 服务器基本都有service processor;只是各自运用的技术有些差别; 设备上的关键部件总是有很多参数来表征他们的状态的,这些参数以电信号的方式通过I2C总线传给 service processor,service processor处理之后传送给专门的监控软件,软件就在其界面上表现 出来,呈现给管理员查看! 设备上的每个重要部件都有传感器,传感器将收集到的部件状态通过I2C总线发送给service processor,这样子,监控软件,service processor,I2C总线和各部件的传感器连接起来形成了 一个网络,这个网络区别于设备硬件系统和操作系统,就是所谓的监控管理网络; 主要有以下几种技术: EMP---应急管理端口;需要拨号;很少使用; ISC&ISM---Intel 服务控制或管理;Intel架构;局域网通信;客户端监控; IPMI---智能平台管理接口;应用最多;内置BMC芯片,HP和DELL应用较多; SNMP---简单网络管理协议;可以使用工作站终端管理网络设备;
RAID:主板上集成了RAID控制器,但是只有在安装了ServeRAID 8k 或8k-l SAS 控制器时才处于活动状态; ServeRAID 8k-l只支持RAID 0、1 和10; ServeRAID 8k ,256 MB 带有备用电池,支持RAID 0、1、1E、5、6 和10;
二、 IBM PC Server产品介绍及故障诊断
(3):倒数第二个数字是代表形状,,0代表塔式,其它数字(5,3,2等)代表机架式。 如:IBM System x3850 X5则为机架式服务器,IBM System x3500 M3则为塔 式服务器
(4):最后一个数字是代表CPU,0代表是用英特尔的CPU,5代表是用ADC的CPU。还有 后面的M3和X5就是内存上的区别,后者采用了MAX5技术,使内存扩展能力更强
业务的关键性、实时性,架构的复杂,让迁移也成为难点;
设备的可扩展性,避免了性能瓶颈导致的业务迁移; 服务器要有多个CPU、内存、电源、风扇、PCI插槽;高端服务器和存储的联机技术;
一、PC Server基础知识介绍
3.
Usability:易使用性---相关的软件系统的设计; 为实际生产需求产生的服务器,具备了相关的硬件技术; 同时也要求相应的操作系统来使用和管理硬件; 比如Windows的Server版本;AIX;HP-UX;Solaris;Linux的企业版等; 专业的系统是经过封装的,在易于使用的同时又加强了专业性,所以我们需要进行学习;
二、 IBM PC Server产品介绍及故障诊断
IBM产品命名规则: 现在IBM服务器都是X3开始的,比如x3500 M3,x3850 X5
(1):x3说明是在x3架构下的服务器
(2):倒数第三个数字是代表功能,数字越大,代表功能越强大。也就是说IBM System x3850 X5要比IBM System x3500 M3性能更强
一、PC Server基础知识介绍
硬盘RAID技术: 硬盘的容量、IO速度、容错能力都成为服务器的性能瓶颈; 使用RAID技术,可以解决单硬盘容量小、IO速度慢、出错容易导致数据丢失等问题; 要是有RAID技术,必须有RAID控制器和多块硬盘; 主要有以下几种RAID级别: RAID 0:串接只是单纯扩大容量;并接在扩大容量的同时,提高磁盘的性能和吞吐量。 没有冗余或错误修复能力,成本最小; RAID 1:RAID 1又被称为磁盘镜像,每一个磁盘都具有一个对应的镜像盘。 对任何一个磁盘的数据写入都会被复制镜像盘中; 系统可以从一组镜像盘中的任何一个磁盘读取数据。 能够在不影响性能的情况下最大限度的保证系统的可靠性和可修复性。成本最高; RAID 5:有3块以上硬盘组成,使用了校验的概念提供容错能力。 总容量为=(N-1)*单盘容量; 有较高的可靠性和可修复性;成本为一块盘的容量;
相关文档
最新文档