H6123-服务器日常巡检指导手册
日常维护工作手册
日常维护工作手册一.HIS系统各主机的登陆及日常巡检1.日常巡检巡检过程包括5个部分:检查errpt报错日志、检查换页空间使用率、检查文件系统使用率、检查ha状态、、检查各主机CPU/内存使用率。
登陆主机一errpt 软硬件报错 1 # hostname ---确认登陆主机2 #errpt –dH | more ---查询硬件错误(一般同时前面板黄灯)3 #errpt –aj xxxxxxx 查看详细的错误代码二检查换页空间使用率1 #Lsps –a --查看换页空间使用,内存足够时,使用率不高于5% 如果遇到换页空间增涨,可通过topas,vmstat等命令检查各进程状态,立刻通知应用工程师。
三检查文件系统使用率 1 #df –g 查看文件系统使用率如果有超过80%的文件系统,需要进入该目录,du –sm 查询那个目录或者文件较大。
四检查ha状态登陆主机# cd /usr/sbin/es/cluster#./clostat –a查看双机状态为stale 表示稳定如果出现网络故障网卡处显示为down五检查各主机CPU/内存使用率使用Topas vmstat 检查主机负载1. 关于topas命令的输出:右边从上至下依次是当前CPU、网络、磁盘使用情况和当前占用CPU资源较高的CPU使用情况一栏中有四项依次是kernel。
(此代表当前系统内核使用的CPU资源) User (此项是当前系统中其他用户使用的CPU资源)Wait (CPU等待时间)以及Idle (CPU空闲时间)。
Idle值很低的话,则代表当前CPU 十分繁忙。
在topas输出右侧的memory、paging space中可以查看当前系统内存与换页空间使用率。
2. 关于vmstat的输出:Proc部分:r-->在运行队列中等待的进程数。
(如此值达到2~5倍CPU数,说明系统中等待执行的线程数较多,可能存在性能问题)b-->在等待io的进程数memory部分:avm-->等于当前使用的物理内存和使用的交换区的总和减去作为文件系统缓存的物理内存(单位为4KB)free-->空闲的内存(4k表示)pages部分:re--》回收的页面pi--》进入页面数po--》出页面数fr--》代表此段时间内,有多少不用的物理内存被释放sr--》通过时钟算法扫描的页面fault 显示每秒的中断数:in--》设备中断sy--》系统中断cs--》cpu交换cpu 表示cpu的使用状态:us--》系统中用户操作所占用的CPU时间百分比sy--》系统中系统调用所占用CPU时间百分比id--》cpu空闲的时间百分比wa--》系统等待磁盘IO所占时间百分比(此时CPU闲置)LABEL 事件的预定义名称IDENTIFIER 事件的数字标识符Date/Time 事件的日期和时间Sequence Number 事件的唯一编号Machine ID 系统处理器部件的标识号Node ID 系统的缩写名(助记名)Class 错误的一般原因。
服务器日常巡检工作
服务器日常巡检工作服务器日常巡检工作一、环境准备⒈登录到服务器管理控制台⒉确认服务器运行状态正常⒊检查服务器硬件设备是否正常运行⒋检查电源和电源线是否连接正常⒌确认网络连接正常二、系统检查⒈确认操作系统版本和补丁是否最新⒉检查系统日志和事件日志,查找异常情况⒊检查磁盘空间使用情况,清理不必要的文件和日志⒋检查系统服务是否正常运行⒌确认系统防火墙和安全策略设置是否正确⒍检查系统安全更新和补丁,确保系统安全性三、网络设置检查⒈确认网络连接正常,检查网卡是否正常工作⒉检查网络配置文件是否正确⒊检查域名解析是否正常⒋检查网络访问控制清单(ACL)是否正确配置四、应用程序检查⒈确认应用程序版本是否最新⒉检查应用程序配置文件是否正确⒊检查应用程序日志,查找异常情况⒋检查数据库连接是否正常⒌检查定时任务是否正常执行⒍确认备份和恢复方案是否正确配置五、安全性检查⒈检查用户权限和访问控制列表(ACL)设置⒉检查系统密码策略和用户管理规范⒊检查防火墙和入侵检测系统设置⒋检查系统漏洞扫描和安全审计日志附件:⒈服务器运行状态报告⒉系统日志和事件日志⒊应用程序配置文件⒋数据库备份和恢复方案法律名词及注释:⒈网络访问控制清单(ACL):网络设备上用于控制和限制网络访问的设置,包括允许或禁止某些IP地质或端口进行通信的规则。
⒉密码策略:设定密码的复杂度要求、密码过期时间、最小密码长度等规则的安全措施。
⒊入侵检测系统:一种用于检测和防范网络入侵行为的安全设备或软件,可以实时监控网络流量、检测攻击行为并采取相应措施。
服务器设备日常巡检指导书
服务器设备日常巡检指导书目录1、声明 (3)2、巡检工具清单 (3)3、机房环境及线缆布局巡检项目 (3)3.1、巡检注意事项 (3)3.2、服务器所在机房环境巡检 (4)3.3、服务器相关的线缆布局情况巡检 (4)4、Tecal 服务器巡检 (5)4.1、服务器指示灯巡检 (5)4.2、服务器iMana健康信息巡检 (5)4.3、MM管理模块健康信息巡检 (6)附录:服务器巡检清单 (6)1、声明本指导书用于华为Tecal服务器设备的日常维护巡检,操作前应征得客户同意。
巡检的操作应仅仅针对服务器外观以及系统的管理单元,如服务器的iMana单元或者MM 管理模块等,不应对业务面有任何操作,以免意外中断客户重要业务。
现场工程师在操作前应仔细阅读相关服务器设备的用户指南(用户指南可在配套光盘中获取到,或者通过登录/enterprise进行下载),有任何不清楚的地方务必确认清楚,整个操作过程请做好静电防护和机器保护工作。
2、巡检工具清单3、机房环境及线缆布局巡检项目3.1、巡检注意事项在巡检之前,为了避免潜在的危险,请先熟悉下表中所列的安全信息符号,下列符号可能放置在服务器的一些部件上面。
3.2、服务器所在机房环境巡检检查机房环境主要包括机房内部的空调、供电设备和策略等。
3.3、服务器相关的线缆布局情况巡检对线缆的巡检,建议肉眼查看即可,即使需要重新拔插,也得征得客户的同意。
日常操作线缆时,为防止损坏,需注意以下事项:●检查电源线。
–确保三线制电源接地线的接头表面良好。
–确保电源线的类型正确。
–确保电源线表面绝缘部分没有任何破损。
●保证线缆远离热源;线缆避免紧绷,保持松弛。
●插拔线缆时,不要用力过大。
●尽可能通过连接端口插拔线缆。
●任何情况下,禁止扭曲或者拉扯线缆。
●合理布线,保证需要拆卸或者更换的部件不会接触线缆,确保所有电源线正确连接。
4、Tecal 服务器巡检4.1、服务器指示灯巡检Tecal 服务器前后面板分别提供UID按钮/指示灯、HEALTHY健康指示灯、网口指示灯、电源开关按钮指示灯等。
服务器日常巡检检查
服务器日常巡检检查(1)巡检细则我公司在对北京市公安局服务器设备巡检过程中发现故障、隐患或其它可能影响其正常运行的问题,将第一时间上报用户,并在用户的要求下对故障、隐患或问题进行处理。
一、周期:日检、周检、月检记录工作状态。
维护合同有特殊要求的按照合同执行。
二、人员:驻场维护检查人员。
三、工具:万能表、钳子、线缆剪、工程宝、套装螺丝刀、电工常用维修工具、笔记本等。
四、作业范围:定期对服务器设备的可用性及功能完整度进行巡检。
如果维护保养合同有特殊规定的按照合同执行。
(2)巡检内容服务器硬件检查检查项检查操作标准机柜防尘网观察机柜及服务器的防尘网上的灰尘是否有灰尘堵塞导致气流不畅。
系统风扇运转检查感觉进风和出风是否正常主机和磁盘柜的所有风扇运转正常。
系统运装噪音检查服务器运转声音噪音是否过大,有无异响系统电源指示灯检查观察液品面板、电源指示灯、硬盘报警灯等显示指示灯显示情况正常服务器硬盘工作状态硬盘指示灯指示是否正常绿色闪烁检查网线是否连接正常检查网线与交换机之间的连线是否正常,以及双机心跳网线连接是否正常交换机连接主机的所有端口指示灯为长亮服务器网卡工作状态服务器插上网线后,若有数据传输,则网卡指示灯呈现规律性闪烁;若闪烁不正常或指示灯指示颜色不正常,则说明系统数据传输将不正常网卡指示灯正常闪烁服务器电源连接检查电源连接线是否有松动、接触不良等情况服务器外壳整体检查服务器整体是否有移动或损害痕迹服务器系统检查服务器性能检查服务器安全检查(3)巡检记录表服务器检查列表(AIX)。
服务器日常巡检检查
服务器日常巡检检查服务器是现代企业运维的重要组成部分,对服务器进行日常巡检检查是确保服务器正常运行和安全的关键步骤。
本文将介绍服务器日常巡检检查的重要性、具体的巡检项目以及注意事项。
一、重要性服务器作为企业的核心设备,承载着公司的业务数据和应用程序。
定期进行日常巡检检查可保障服务器的正常运行和稳定性,避免由于硬件故障、软件错误或配置问题导致的服务中断和数据丢失。
此外,通过巡检还能及时发现潜在的安全风险,提高服务器的安全性。
二、巡检项目1. 硬件检查- 确保服务器设备正常运行,包括电源和风扇运转正常。
- 检查硬盘、内存、主板等硬件设备是否损坏或存在异常。
- 清理服务器内部和外部的灰尘,保持良好的散热条件。
2. 系统检查- 确认服务器操作系统是否正常运行,检查日志文件是否有异常记录。
- 检查系统补丁和更新是否及时安装,确保系统的安全性和稳定性。
- 检查防火墙和安全策略的配置是否正确,并进行必要的修复和优化。
3. 网络连接检查- 确认服务器网络连接是否正常,包括接入交换机的链路是否畅通。
- 检查服务器网卡配置是否正确,IP地址、子网掩码等设置是否符合要求。
- 扫描服务器的开放端口,查看是否存在未经授权的服务或漏洞。
4. 服务运行检查- 检查关键应用程序和服务的运行状态,确认是否有异常或错误信息。
- 检查服务的配置和参数是否正确,确认其能够满足业务需求。
- 验证备份和恢复过程,确保系统和数据可以正常备份并恢复。
5. 安全检查- 检查服务器的登录设置和权限控制,确保只有授权用户能够登录服务器。
- 检查服务器的登录失败次数是否过多,是否存在暴力破解的风险。
- 核查安全日志,发现可疑行为和攻击迹象,及时采取相应措施。
三、注意事项1. 巡检过程中一定要小心谨慎,避免操作不当导致服务器故障或数据丢失。
2. 在进行更改配置或修复问题之前,务必备份重要数据和相关配置文件。
3. 留下巡检日志,记录巡检的时间、巡检的内容以及发现的问题和解决方案。
h3c日常维护手册(巡检篇)
1 查看系统异常时的处理方式通过执行display system-failure 命令,可查看系统异常时的处理方式。
<Sysname> display system-failureSystem failure handling method: reboot2 查看设备温度命令dis environment3.查看各插板的工作状态命令dis device实例如下图:4.查看风扇运行状态dis fan5.查看日志信息dis trapbuffer(查看系统告警)dis logbuffer (查看系统日志)详细解释入下图:5.显示当前生效的配(部分未生效的配信息不显示)dis cur命令:display current-configuration 描述:display current-configuration命令用来显示以太网交换机当前生效的配置参数。
对于某些正在生效的配置参数,如果与缺省工作参数相同,则不显示。
当用户完成一组配置之后,如果需要验证配置是否正确,则可以执行display current-configuration命令查看当前生效的参数。
对于某些参数,虽然用户已经配置,但如果这些参数对应的功能没有生效,系统不予显示(如单板不在位);如果save 配置后,将保存当前能显示到的配置。
6.display saved-configuration命令:display saved-configuration描述:display saved-configuration命令用来显示以太网交换机的Flash中配置文件。
如果以太网交换机上电之后不能正常工作,可以执行display saved-configuration命令查看以太网交换机的启动配置。
服务器设备日常巡检指导书
服务器设备日常巡检指导书目录1、声明 (3)2、巡检工具清单 (3)3、机房环境及线缆布局巡检项目 (3)3.1、巡检注意事项 (3)3.2、服务器所在机房环境巡检 (4)3.3、服务器相关的线缆布局情况巡检 (4)4、Tecal 服务器巡检 (5)4.1、服务器指示灯巡检 (5)4.2、服务器iMana健康信息巡检 (5)4.3、MM管理模块健康信息巡检 (6)附录:服务器巡检清单 (6)1、声明本指导书用于华为Tecal服务器设备的日常维护巡检,操作前应征得客户同意。
巡检的操作应仅仅针对服务器外观以及系统的管理单元,如服务器的iMana单元或者MM 管理模块等,不应对业务面有任何操作,以免意外中断客户重要业务。
现场工程师在操作前应仔细阅读相关服务器设备的用户指南(用户指南可在配套光盘中获取到,或者通过登录/enterprise进行下载),有任何不清楚的地方务必确认清楚,整个操作过程请做好静电防护和机器保护工作。
2、巡检工具清单3、机房环境及线缆布局巡检项目3.1、巡检注意事项在巡检之前,为了避免潜在的危险,请先熟悉下表中所列的安全信息符号,下列符号可能放置在服务器的一些部件上面。
3.2、服务器所在机房环境巡检检查机房环境主要包括机房内部的空调、供电设备和策略等。
3.3、服务器相关的线缆布局情况巡检对线缆的巡检,建议肉眼查看即可,即使需要重新拔插,也得征得客户的同意。
日常操作线缆时,为防止损坏,需注意以下事项:●检查电源线。
–确保三线制电源接地线的接头表面良好。
–确保电源线的类型正确。
–确保电源线表面绝缘部分没有任何破损。
●保证线缆远离热源;线缆避免紧绷,保持松弛。
●插拔线缆时,不要用力过大。
●尽可能通过连接端口插拔线缆。
●任何情况下,禁止扭曲或者拉扯线缆。
●合理布线,保证需要拆卸或者更换的部件不会接触线缆,确保所有电源线正确连接。
4、Tecal 服务器巡检4.1、服务器指示灯巡检Tecal 服务器前后面板分别提供UID按钮/指示灯、HEALTHY健康指示灯、网口指示灯、电源开关按钮指示灯等。
主机巡检指南-整理版
主机巡检机房温度机房内一般都有温度湿度计,通过温度计查看机房温度是否正常,一般保持在21到24摄氏度即可。
IBM小型机巡检命令1、查看前面板告警灯是否正常1)通过直接到机房查看机器前面板是否有黄色告警灯;2)通过命令查看:#/usr/lpp/diagnostics/bin/usysfault如果返回fault,说明有告警灯,如果返回为normal,说明无告警灯。
有告警灯说明机器在运行过程中可能出现过不正常的现象,不能说明机器有故障,是否有故障,要具体查看错误日志。
如果有告警灯,需要清除告警灯,清除方法:#/usr/lpp/diagnostics/bin/usysfault -s normal2、查看是否有错误日志#errpt该命令显示有错误的类型,如果错误为P H,就需要关注,有可能有硬件错误,还需要关注发生错误的时间,如果是很久以前的错误,有可能是以前的故障,维修完后没有清除错误日志。
每个错误前有一个错误ID,查看具体的某个错误详细信息,输入命令:#errpt -aj 错误ID如果要查看所有错误的详细信息,输入命令:#errpt -a这个命令的输出可能较多,是所有错误日志的详细信息输出。
建议在后面加上参数,使用分屏查看,命令如下:#errpt -a | more (空格键翻页) 或者#errpt -a | pg (回车键翻页)#errclear 0 清除错误日志3、查看是否有mail故障系统运行中,如果出现不正常情况,会给root用户发送mail,通过命令:#mail可以查看是否有root用户的mail,一般root用户的mail保存在/var/spool/mail/root文件中,可以通过more或者vi查看。
命令如下:#more /var/spool/mail/root 或#vi /var/spool/mail/root (退出vi,先按esc,再输入:q! 回车)4、查看文件系统是否满文件系统达到100%,不及时处理,可能引起系统宕机,查看方法:#df -k如果占用率达90%以上,需马上处理或清理垃圾文件,如果清理后还很大,需扩容文件系统来保证系统正常运行。
服务器日常巡检工作
?通□不通
2.管理级用户控制:远程登录用户必须设置密码。
检查是否需要密码才能进入管理级别用户。
?完善□不完善
3. Telnet登录控制:口令的设置要不同,使用密文格式。Super口令和Telnet
?完善□不完善
4.接口配置:shutdown状态。不使用端口置为
Display current-configuration
system
Display device
?完善□不完善
9. CPU占有率:占有率应正常,与当前开展的业务类型和转发流量相符。CPU
Display system cpu
?完善□不完善
系统当前正在发生的告警信息:10.有告警及时处理。
Display alarm
?完善□不完善
内存使用情况:11.内存占有率。
?完善□不完善
系统当前正在发生的告警信息:10.有告警及时处理。
Display alarm
?完善□不完善
内存使用情况:11.内存占有率。
Display memory
?完善□不完善
异常问题记录(上面检查发现的问题或在各检查项外发现的问题请在此具体描述)
三、安全设备系统
1、检查防病毒的工作状态。
观察系统运行状态
?完善□不完善
5. FE/GE口配置:端口模式(包括速率、双工模式)配置对接双方必须一致;端口实际工作模式必须与对端一致。
Displaycurrent-configuration
Display interface
?完善□不完善
6. telnet和串口登录:telnet和串口两种方式能正常登录。
?完善□不完善
正常
2、检查防病毒系统的病毒引擎和病毒库是否为最新(升级更新)
服务器日常巡检工作(二)2024
服务器日常巡检工作(二)引言概述:服务器日常巡检工作是确保服务器系统正常运行的关键任务之一。
本文将介绍服务器日常巡检工作的第二部分内容,包括日志检查、磁盘空间管理、CPU和内存监控、网络连接状态检查以及安全漏洞扫描等。
通过逐项检查和监测,管理员可以及时发现和解决潜在问题,确保服务器的稳定性和安全性。
正文:一、日志检查1. 检查系统日志:查看系统日志,查找异常、错误、警告信息,如磁盘故障、内存溢出、服务崩溃等,并采取相应措施解决问题。
2. 监控应用程序日志:检查应用程序的日志,关注异常报错信息,及时处理错误,保证应用程序稳定运行。
3. 定期备份日志:将重要的系统日志和应用程序日志定期备份,以备追溯分析和问题排查。
二、磁盘空间管理1. 监控磁盘使用情况:查看服务器各个磁盘分区的使用情况,及时发现磁盘容量不足的问题。
2. 清理无用文件:删除不再使用的临时文件、日志文件等占用大量空间的文件,释放磁盘空间。
3. 扩容磁盘分区:当磁盘空间不足时,扩容磁盘分区,增加可用空间。
4. 配置磁盘定期清理任务:设置定期清理磁盘的任务,删除过期的备份文件和临时文件,以维持磁盘空间的合理利用。
三、CPU和内存监控1. 监控CPU利用率:通过性能监控工具实时监测服务器的CPU 利用率,及时发现CPU过载的情况。
2. 监控内存使用情况:监控服务器的内存使用情况,确保内存充足,避免因内存不足导致的系统崩溃和性能下降。
3. 调整应用程序的资源占用:根据监控结果,优化应用程序的资源占用,提高服务器的性能和效率。
四、网络连接状态检查1. 监控网络连接数:检查服务器的网络连接数,确保连接数在正常范围内,避免连接过多导致网络瓶颈。
2. 检查网络延迟:通过网络监控工具测试服务器的网络延迟情况,确保网络响应稳定。
3. 检测网络安全性:扫描服务器的开放端口,确保没有未授权的访问,防止黑客入侵。
五、安全漏洞扫描1. 使用漏洞扫描工具:使用专业的漏洞扫描工具对服务器进行扫描,发现潜在的安全漏洞。
服务器日常巡检工作
Display current-configuration
完善□不完善
5. FE/GE口配置:
端口模式(包括速率、双工模式)配置对接双方必须一致;端口实际工作模式必须与对端一致。
Display
current-configuration
Display interface
完善□不完善
9. CPU占有率:
CPU占有率应正常,与当前开展的业务类型和转发流量相符。
Display system cpu
完善□不完善
10.系统当前正在发生的告警信息:
有告警及时处理。
Display alarm
完善□不完善
11.内存使用情况:
内存占有率。
Display memory
完善□不完善
异常问题记录(上面检查发现的问题或在各检查项外发现的问题请在此具体描述)
2、检查系统内存利用率
检测三次,每次5分钟,记录大约平均的利用率
正常
3、检查系统盘和数据盘的空间占用
硬盘共分几个分区,哪几个分区
正常
每个分区空间大小,分别使用多少
正常
4、操作系统启动和运行状况检查
加电启动
正常
5、数据库启动和运行情况
应用启动测试
正常
6、应用程序启动和运行情况
应用使用测试
正常
异常问题记录(上面检查发现的问题或在各检查项外发现的问题请在此具体描述)
服务器日常巡检工作精选文档
巡检报告
服务器IP
5
巡检内容
检查方法
结 果
一、服务器系统
设备用途:
Svn版本控制系统服务器
1、检查系统CPU利用率
服务器日常巡检工作
服务器日常巡检工作首先,巡检前需要登录到服务器管理系统或者远程桌面,确保能够正常登录服务器。
同时,要检查日志文件,包括系统日志、应用日志和错误日志,以了解服务器的运行情况和可能存在的问题。
其次,巡检操作员需要检查服务器的硬件状态,包括服务器的电源、硬盘、内存、网络接口和风扇等。
如果有硬件故障或者异常情况,需要及时报修或更换硬件设备。
接下来,巡检操作员需要检查服务器的操作系统和应用程序的版本信息,以确保系统和应用程序的安全性和稳定性。
如果存在版本过旧或者漏洞风险的情况,需要及时更新和升级。
然后,巡检操作员需要检查服务器的磁盘空间使用情况,包括系统盘和数据盘。
如果磁盘空间不足,会导致服务器性能下降或者系统崩溃。
因此,需要及时清理无用的文件和扩展磁盘容量。
此外,巡检操作员还需要检查服务器的服务和进程运行情况,包括数据库服务、Web服务、邮件服务和网络服务等。
如果存在服务不正常或者进程异常的情况,需要及时修复和重启。
另外,巡检操作员需要检查服务器的安全设置,包括防火墙、口令策略和访问控制等。
如果存在安全漏洞或者配置错误的情况,会导致服务器遭受攻击或者数据泄露。
因此,需要及时修补漏洞和加强安全设置。
最后,巡检操作员需要监控和分析服务器的性能指标,包括CPU利用率、内存使用率、网络流量和磁盘IO等。
如果存在性能瓶颈或者异常情况,需要及时进行优化和调整,以提高服务器的性能和响应速度。
总之,服务器日常巡检工作是保障服务器正常运行和提高系统性能的重要工作。
巡检操作员需要按照一定的步骤和规范进行检查和维护,以确保服务器的稳定性和安全性。
一个良好的巡检工作流程和规范可以提高巡检效率和准确性,减少服务器故障和安全风险。
日常巡检指导手册(new)
日常巡检指导手册服务器第一步、记录服务器应用序列号(Device ID)第二步、记录服务器的设备序列号(Serial Number)第三步、记录服务器安装位置(Location)第四步、环境检测Environment✧温度:10℃-35℃湿度:35%-80%✧工作电压:200V~240V第五步、检查各状态灯情况:包括:电源状态灯Power LED、网络状态灯(NIC LED)、系统状态灯(SYS LED)、服务器硬盘的状态第六步、正常登陆域(Login Domain)使用域帐号正常登陆Games2008或BOCOG第七步、检查机器操作系统的系统日志打开操作系统的事件查看器(Event Viewer)中的系统日志(System):确认日志中无硬件报错即可。
附一:联想万全R520 G4Y(T1/T2)的各状态灯检查办法:1、检查主机后端电源模块状态灯(Power LED)电源状态灯(在机器后面板右端)1)、电源模块状态灯:为电源当前的状态显示,接通电源并在关机状态时为绿色闪烁,接通电源并在开机状态时为绿色常亮。
注:当服务器有一路电源供电正常,另一路有问题(未接通电源或电源模块有问题)时,有问题的电源模块的电源状态灯为橙色常亮,与此同时机器的前面板状态指示灯也会橙色常亮,此时说明电源状态报警。
电源指示灯(在机器前面板右侧)2)、前面板电源指示灯:绿色常亮表示机器处于开机状态;绿色闪烁表示机器处于休眠状态;熄灭表示机器处于关机状态。
2、检查网络状态灯(NIC LED)主板自带网卡状态灯(在机器前面板右侧)1)、前面板带有板载网卡状态灯:能够显示出主板自带网卡的连接状态。
绿色闪烁表示有数据传输;绿色常亮表示此网卡已连通。
网卡接口的状态灯(在机器后面板)2)、网卡接口的状态灯:能够表现出网卡当前的工作状态。
在每个网口上会有一个状态灯(左边)和一个通讯指示灯(右边)。
状态灯:熄灭表示此时网络未连通或网口在系统中被屏蔽;状态灯绿色常亮表示网络已连通;状态灯绿色闪烁表示有数据传输。
服务器日常巡检规范
服务器日常巡检一、数据库服务器1.检查磁盘可用空间检查数据库文件以及数据库备份文件所占用的磁盘空间,如果磁盘空间不足(可用空间大于50G),则需要清理数据库文件或数据库备份数据,方式服务器磁盘空间不足导致数据库写入失败。
2.检查数据库日志文件检查数据库的日志文件放置数据库日志文件异常增长3.检查数据库维护计划查看数据库维护计划的日志,确保自动备份作业以及截断事务日志和收缩数据库成功,保障数据的安全性。
4.检查数据库计划任务检查数据库功能性计划任务的日志,确保计划任务成功执行计划任务包括:HIS库:delete_temp_charge_data清除门诊临时数据的存储过程,建立计划任务每天空闲时调用该存储过程一次mthmydoctor,mthyb01_det门诊医生数据统计(门诊医生均次费等)每天晚上执行一次getmthcarddiag门诊医生工作站获取病人最近的诊断数据,每天晚上执行一次setamt自费住院病人欠费统计,每天晚上执行一次CPHS库:Dealfirspressureverify待核实的高血压首诊记录三个月后自动变为未核实,每天凌晨执行一次Job_JZCount统计糖尿病高血压病人库中就诊次数,每天凌晨执行一次ReIndex重新建立索引,每个星期天凌晨执行一次refreshView重新刷新视图,每个星期天凌晨执行一次二、WEB应用服务器1.检查IIS运行日志查看在CPHSOUT文件夹中存放的数据库执行日志,观察是否有SQLSERVER报错信息,目的是为了找出其中跟数据库结构相关的错误,及时更正。
查看程序目录中CPHS文件夹下的LOG文件夹中存放的日志,查看是否有程序的报错信息,并及时反馈给开发人员。
查看WINDOWS事件查看器,查看IIS是否有报错信息。
2.查看WINDOWS计划任务是否定期重启IIS,释放服务器资源。
服务器日常巡检规范
服务器日常巡检规范服务器日常巡检规范1.概述服务器日常巡检是确保服务器正常运行并提供稳定服务的重要活动。
本文档旨在规范服务器日常巡检的过程和要求,以确保服务器安全、可靠、高效运行。
2.巡检对象2.1 硬件设备- 服务器主机:检查服务器主机的硬件状态,例如电源、风扇、硬盘、内存等,确保正常运行。
- 网络设备:包括交换机、路由器等网络设备,检查其运行状态、接口状态等。
- 存储设备:例如磁盘阵列、存储服务器等,检查存储容量、磁盘状态等。
2.2 操作系统- 检查操作系统的运行状态,例如 CPU 使用率、内存使用率、磁盘使用率等。
- 检查操作系统的安全性,确保安全更新和补丁的安装。
- 检查关键日志信息,如登录日志、系统错误日志等。
- 检查进程和服务的运行情况。
2.3 应用程序和服务- 检查应用程序和服务的运行状态,确保其正常运行。
- 检查应用程序的日志信息,排查错误和异常情况。
3.巡检内容3.1 硬件设备巡检- 检查服务器主机的硬件情况,包括电源状态、风扇状态、硬盘状态、内存状态等。
- 检查网络设备的运行状态,包括交换机、路由器等设备的连通性、接口状态等。
- 检查存储设备的容量、磁盘状态等。
3.2 操作系统巡检- 检查操作系统的运行状态,包括 CPU 使用率、内存使用率、磁盘使用率等。
- 检查操作系统的安全性,包括安全更新和补丁的安装情况。
- 检查关键日志信息,如登录日志、系统错误日志等,排查异常情况。
- 检查进程和服务的运行情况,确保关键服务的正常运行。
3.3 应用程序和服务巡检- 检查应用程序和服务的运行状态,确保其正常运行。
- 检查应用程序的日志信息,排查错误和异常情况。
4.巡检频率根据实际情况和重要性,制定巡检频率,建议每日、每周、每月或每季度进行巡检。
5.巡检记录和报告每次巡检都必须记录并巡检报告,包括巡检的时间、巡检的结果、发现的问题和解决方案等。
6.附件7.法律名词及注释7.1 法律名词:根据需要填写相应的法律名词,如《计算机信息系统安全保护条例》、《网络安全法》等。
基站日常巡检维护手册
基站日常巡检维护手册为了确保通信基站的正常运行和服务质量,必须定期进行日常巡检维护。
下面是基站日常巡检维护手册,介绍了必须检查的各个方面。
巡检前准备在开始巡检前,需要进行以下准备:•确认巡检的基站名称和位置•确认巡检的时间和周期•根据基站类型,准备相应的巡检工具和设备•验证安全措施的措施,遵守公司的安全规定巡检内容本章将详细介绍日常巡检过程中应该检查的各个方面。
基站外部基站的外部主要包括天线、塔杆和周边环境等方面。
我们要检查以下内容:•天线是否均匀分布;•天线和塔杆是否有松动;•塔身是否变形、有裂缝、生锈等;•大风、雷雨、地震、火灾等天气或灾害对基站的影响;•环境是否安全、清洁、干燥。
基站内部基站的内部主要包括设备、电源、电缆等方面。
具体检查内容如下:•设备运行状态是否正常;•电源是否正常;•管道、线路、接口、绝缘等是否正常;•空调、温度、湿度、环境检测等是否正常。
数据采集巡检完成后,需要收集数据并创建日志,以便追踪问题并制定解决方案。
以下是需要收集的数据:•设备名称、型号、生产日期等;•天线高度、角度、方向等;•电压、电流、功率、温度、湿度等;•每日巡检报告和签到表。
巡检记录为了方便数据管理和分析,需要开发一个日常巡检记录表格,以下是其中的记录项:•巡检日期和时间;•基站名称和地址;•巡检人员和联系方式;•发现的问题和要采取的措施;•设备的状态和参数;•维护的结果和建议。
巡检报告巡检结束后,需要撰写巡检报告并提交给相关人员。
以下是需要包含在巡检报告中的内容:•基站的总体情况和维护结果;•当前设备状态和参数;•发现的问题和解决方案;•节约的维护成本和建议。
总结基站日常巡检维护是确保通信基站正常运行和服务质量的关键。
只有定期采取措施,才能避免花费巨额的维护成本或更严重的影响。
下面是一些注意事项:•根据基站巡检协议和周期进行巡检;•使用安全工具和设备;•同时记录基站的总体情况和维护结果;•需要故障分析的情况下,及时采取措施。
服务器日常巡检服务(一)2024
服务器日常巡检服务(一)引言概述服务器日常巡检服务是指定期对服务器的各项参数进行检查和评估,以确保服务器的正常运行和最佳性能。
本文将重点介绍服务器日常巡检服务的相关内容,包括硬件检查、软件检查、系统安全、性能监控和错误日志分析等五个大点。
正文内容1. 硬件检查- 检查服务器的硬件设备是否正常,如主板、内存、CPU、硬盘等。
- 检查硬件设备的温度和风扇运行情况,确保其在正常范围内。
- 检查硬件设备的连接是否松动,如电源线、数据线等。
2. 软件检查- 检查服务器的操作系统版本和补丁情况,及时进行升级和修复。
- 检查服务器上的应用程序是否正常运行,如数据库、Web服务等。
- 检查服务器上的防火墙和安全软件是否正常工作,确保系统安全。
3. 系统安全- 检查服务器的安全设置,包括用户权限、口令策略等,确保系统安全。
- 检查服务器上的网络连接情况,发现并阻止恶意攻击和入侵行为。
- 检查服务器的防病毒软件是否更新,及时清除病毒和恶意软件。
4. 性能监控- 监控服务器的CPU和内存使用情况,及时调整资源分配,提高系统性能。
- 监控服务器的磁盘空间和IO负载,及时清理无用文件和优化磁盘性能。
- 监控服务器的网络带宽使用情况,优化网络配置和带宽分配。
5. 错误日志分析- 分析服务器的错误日志,发现系统异常和错误,及时进行排查和修复。
- 分析应用程序的错误日志,找出潜在问题和漏洞,提高应用程序的稳定性。
- 分析数据库的错误日志,识别数据库性能问题和优化方案,提高数据库的效率。
总结服务器日常巡检服务是确保服务器正常运行和最佳性能的必要步骤。
通过对服务器的硬件和软件进行检查,系统安全、性能监控和错误日志分析等工作,可以有效预防和排除潜在问题,提高服务器的稳定性和性能。
建议定期进行巡检服务,并及时处理检测结果中存在的问题,保证服务器的正常运行。
服务器设备巡查内容(服务器设备维保资料)
服务器设备巡查定期巡检的目的在于及时发现和预防可能出现的硬件和系统问题,从而在最大程度上为系统的连续稳定运行提供保证,巡检工作主要包括:● 1. 主机系统的运行状态,对系统CPU、内存、I/O状态、进程等检查;● 2. 外部设备运行状态,对磁盘阵列、磁带机、外置光驱、维护终端等的状态、设置进行检查;对风扇、后备电池、磁盘、磁带、键盘等敏感部件进行重点检查,如有故障征兆则进行先期更换;● 3. 连接件检查,对连接插头、电缆、电源插座等进行检查;● 4. 环境检查,包括电源电压、接地和室内温度、湿度、空气洁净度等;● 5. 清洁保养,清除机箱、滤清器内的灰尘与异物;● 6. 系统优化,协助客户对OS进行系统性能调整和系统优化,提高系统效率;进行相关的安全●7. 性进程检查;●8. 技术交流,双方技术人员分析和解决日常运行中出现的未解决问题;●9. 工作报告,在对系统进行全面的检查后,给出详细的报告,根据检查结果给出相应建议和改进方案。
1.1.1 巡查周期我公司技术服务有限公司为贵单位提供乙方应提供7×24全天技术支持服务,并根据甲方的需要提供现场支持服务。
具体服务时间由甲方需求决定,服务响应时间按本招标文件第四点要求施行。
● 1. 确保本次保修范围内所有硬件设备的正常运行。
● 2. 确保本次保修范围内服务器设备操作系统的正常运行。
● 3. 及时提供操作系统升级和故障硬件更换。
● 4. 提供特殊时段(如:结账日、春节、劳动节、国庆节、年终、系统停机维护、数据集中及用户认为必须的重要时段)的服务,以及产品安装、系统变更和迁移等的现场支持服务。
● 5. 乙方应提供7×24全天技术支持服务,并根据甲方的需要提供现场支持服务。
具体服务时间由甲方需求决定,服务响应时间按本招标文件第四点要求施行。
● 6. 每月一次例行巡检即预防性维护并提供例行巡检报告;●7. 每月一次的系统运行性能诊断并提供性能分析报告;●8. 每次硬件故障处理后提供硬件处理和备件更换报告;●9. 每季度一次健康性检查,全面检查硬件系统的工作状态、对硬件系统的运行环境进行评估、现场解答有关硬件技术方面的问题、磁盘系统CACHE使用率、硬件可用率、故障分布和维修类型状况,并交付硬件系统健康检查报告书,针对设备的运行状况,提出设备的配置和参数设定等方面优化建议;10.乙方在服务年度期满前十五天应通知甲方,并完成年度现场维护,提供年度服务总结报告,方便贵单位控制和管理。
服务器安全巡检内容及方法(新编版)
( 安全管理 )单位:_________________________姓名:_________________________日期:_________________________精品文档 / Word文档 / 文字可改服务器安全巡检内容及方法(新编版)Safety management is an important part of production management. Safety and production are inthe implementation process服务器安全巡检内容及方法(新编版)一、安全巡检的重要性所谓安全巡检,是通过人工的定期检查工作,来提高对服务器安全的管理。
定期的巡检工作不但可以及时发现一些安全漏洞和异常,还可以及时发现一些日常管理的问题,为服务器的安全和管理措施的整改做好基础。
巡检可以做为一项例行的工作来做,具有非常重要的作用。
二、安全巡检的关注点安全巡检的主要关注点是系统的异常,因此在一台服务器上线前做好一份系统状态的镜像就必须了。
抓住异常情况并进行处理和跟踪,可以有效的降低管理的成本和管理风险。
三、安全巡检的内容安全巡检应尽可能覆盖不能现场观察到的一切内容,如系统服务、系统账户和权限、策略、防火墙、防病毒系统、操作系统补丁、用户密码安全、应用安全、磁盘权限等。
四、怎么做安全巡检做安全巡检,需要有计划的去进行,数据至关重要。
经验可以有效提高你的管理效率,但经验也容易造成惯性思维,导致故障延误。
故,应根据现象的表现和出现的具体情况给予谨慎的判断,同时做好记录和分析笔记。
巡检过程可以参照如下的步骤进行:1、远程服务器至桌面;2、查看系统进程,比对异常情况,发现可疑进程登记并结束进程;3、查看系统用户账户、密码,发现可疑用户立即登记并禁用,修改其密码,查看其登陆痕迹,用户组中清理其权限;4、查看系统服务,比对有无异常,发现可疑服务登记其位置,停止运行状态,后续处理;5、检查防火墙是否开启,例外列表异常;6、检查防病毒系统更新情况,运行是否正常,有无篡改痕迹;7、检查系统日志,关注安全日志,可以备份后下载至本地进行分析;8、检查数据库,比对数据库列表;9、检查备份任务执行情况,及时纠正错误的任务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
服务器日常巡检指导手册
本资料由豆丁若莲文档库搜集
更多文档请点击/ljk99
* 服务器日常巡检指导手册
服务器日常巡检指导手册
第一步、记录服务器应用序列号(Device ID
第二步、记录服务器的设备序列号(Serial Number
第三步、记录服务器安装位置(Location
第四步、环境检测Environment
温度:10℃-35℃湿度:35%-80%
工作电压:200V~240V
第五步、检查各状态灯情况:
包括:电源状态灯Power LED、网络状态灯(NIC LED)、系统状态灯(SYS LED)、服务器硬盘的状态
第六步、正常登陆域(Login Domain
使用域帐号正常登陆Games2008或BOCOG
第七步、检查机器操作系统的系统日志
打开操作系统的事件查看器(Event Viewer)中的系统日志(System):确认日志
中无硬件报错即可。
附一:联想万全R520 G4YT1/T2)的各状态灯检查办法:
1、检查主机后端电源模块状态灯(Power LED
电源状态灯(在机器后面板右端)
1)、电源模块状态灯:为电源当前的状态显示,接通电源并在关机状态时为绿
色闪烁,接通电源并在开机状态时为绿色常亮。
注:当服务器有一路电源供电正常,另一路有问题(未接通电源或电源模块有问题)时,有问题的电源模块的电源状态灯为橙色常亮,与此同时机器的前面板状态指示灯也会橙色常亮,此时说明电源状态报警。
电源指示灯(在机器前面板右侧)
2)、前面板电源指示灯:绿色常亮表示机器处于开机状态;绿色闪烁表示机器处于休眠状态;熄灭表示机器处于关机状态。
2、检查网络状态灯(NIC LED
主板自带网卡状态灯(在机器前面板右侧)
1)、前面板带有板载网卡状态灯:能够显示出主板自带网卡的连接状态。
绿色闪烁表示有数据传输;绿色常亮表示此网卡已连通。
网卡接口的状态灯(在机器后面板)
2)、网卡接口的状态灯:能够表现出网卡当前的工作状态。
在每个网口上会有一个状态灯(左边)和一个通讯指示灯(右边)。
状态灯:熄灭表示此时网络未连通或网口在系统中被屏蔽;状态灯绿色常亮表示网络已连通;状态灯绿色闪烁表示有数据传输。
通讯指示灯:熄灭(同时左边的灯为绿色常亮或闪烁)表示网络为10M;绿色常亮表示为100M;橙色常亮表示为1000M。
以上均为正常状态。
3、检查系统状态灯(SYS LED
系统状态指示灯(在机器前面板右侧)
1)、前面板系统状态指示灯:绿色常亮表示机器系统正常;绿色闪烁表示机器处于degraded状态(例如CPU disable),为非正常状态;橙色常亮、闪烁表示机器可能存在风扇、电压、温度的故障,为非正常状态;POST时状态指示灯熄灭表示机器有故障:POST报错,为非正常状态。
状态指示灯(在机器后面板右侧)
2)、后面板状态指示灯:与前面的状态指示灯功能相对应,正常状态为绿色常亮。
如有其它的状态(比如:绿色闪烁、橙色常亮、橙色闪烁)表明机器为非正常状态。
4、检查服务器硬盘的状态
硬盘工作状态灯(在机器前面板右侧)
1)、硬盘工作状态灯:绿色闪烁表示硬盘在读写数据;熄灭表示硬盘空闲。
硬盘支架自带状态灯(在机器前面板)
2)、硬盘支架自带状态灯:显示硬盘工作时的状态,绿色状态灯闪烁表示硬盘
在读取数据。
如果有硬盘损坏或掉线,那么此块硬盘的状态灯可能为橙色常亮(有时橙色闪烁)也可能状态灯不亮,这种现象出现时表示硬盘有问题,阵列已
降级,为非正常状态。
注:TYPE1为两块硬盘做的RAID1;TYPE2为六块硬盘,前两块硬盘做的RAID1
后四块做的RAID10。
在读取数据时也都是两两对应的成组的读取,那么一组中
两块硬盘的状态灯同时绿色闪烁为正常。
5、服务器其他状态指示灯说明:
如上图:光驱状态灯
注:1)、光驱状态灯:光驱在工作时光驱状态灯会闪烁,通常情况下此灯不亮。
某些赛场的服务器光驱已经被禁用,表现为在windows的设备管理器中光驱被
禁用,有感叹号的图标。
此为正常现象。
2)、LAB和PDC中某些机器随着应用的不同可能还会配有光纤卡,光纤卡的状
态与网卡状态类似,光纤卡的连通状态灯为绿色,通讯灯为橙色,有数据通讯
时通讯灯会闪烁。
3)、强调:除了机器的各个状态指示灯外,机器开机或运行中还会有报警音提示,当机器的任何状态灯出现异常或有报警音提示时请及时向KS反应。
附二:联想万全T350 G5YIST3)的各状态灯检查办法:
1、检查电源状态灯(Power LED
电源状态灯(后面板上方)
1)、电源状态灯:为电源当前的状态显示,接通电源并在关机状态时为绿色闪烁,接通电源并在开机状态时为绿色常亮。
注:当服务器有一路电源供电正常,另一路有问题(未接通电源或电源模块有问题)时,有问题的电源模块的电源状态灯为橙色常亮,与此同时机器的状态指示灯也会橙色常亮,此时说明电源状态报警。
电源指示灯(前面板)
2)、电源指示灯:绿色常亮表示机器处于开机状态;绿色闪烁表示机器处于待
机或休眠状态;熄灭表示机器处于关机或休眠状态。
2、检查网络状态灯(NIC LED
网络状态灯(LAN1&LAN2)(机器前面板)
1)、网络状态灯(LAN1&LAN2
网络状态灯(LAN1&LAN2):绿色常亮表示网络已连通;绿色闪烁表示有数据传输;熄灭表示网络无连接。
网卡接口状态指示灯(机器后面板)
2)、网卡接口的状态灯:能够表现出网卡当前的工作状态。
在每个网口上会有一个状态灯(左边)和一个通讯指示灯(右边)。
状态灯:熄灭表示此时网络未连通或网口在系统中被屏蔽;状态灯绿色常亮表示网络已连通;状态灯绿色闪烁表示有数据传输。
通讯指示灯:熄灭(同时左边的灯为绿色常亮或闪烁)表示网络为10M;绿色常亮表示为100M;橙色常亮表示为1000M。
以上均为正常状态。
3、检查系统状态报警灯(SYS LED
系统报警灯(前面板上)
1)、系统状态报警指示灯:绿色常亮表示机器系统正常;绿色闪烁表示机器处于degraded状态(例如CPU disable),为非正常状态;橙色常亮、闪烁表示机器可能存在风扇、电压、温度的故障,为非正常状态;状态指示灯熄灭表示机器有故障:POST报错,为非正常状态。
4、检查服务器硬盘的状态
硬盘工作状态灯(在机器前面板)
1)、硬盘工作状态灯:绿色闪烁表示硬盘在读取数据;熄灭表示硬盘未读取数据;橙色常亮表示硬盘报错,为非正常状态。
2)、硬盘模组自带状态灯:显示硬盘工作时的状态,绿色状态灯闪烁表示硬盘在读取数据。
如果有硬盘损坏或掉线,那么此块硬盘的状态灯可能为橙色常亮(有时橙色闪烁)也可能状态灯不亮,这种现象出现时表示硬盘有问题,阵列已降级,为非正常状态。
注:TYPE3为六块硬盘,前两块硬盘组成RAID1后四块硬盘组成RAID10。
在读取数据时也都是两两对应的成组的读取,那么一组中两块硬盘的状态灯同时绿色闪烁为正常。
特别声明:
1:资料来源于互联网,版权归属原作者
2:资料内容属于网络意见,与本账号立场无关
3:如有侵权,请告知,立即删除。
本资料由豆丁若莲文档库搜集
更多文档请点击/ljk99。