维护经验:网管安全告警处理案例

合集下载

告警系统故障处理情况汇报

告警系统故障处理情况汇报

报警系统故障处理情况汇报【故障现象】使用机房内的可视监控服务器PING终端可视对讲设备时,初次PING终端设备时的第一个PING包会丢。

(监控服务器IP=192.168.0.154,终端可视对讲设备IP=192.168.10.41)使用可视监控服务器PING小高层终端设备(监控服务器—交换机—OLT—ONU—交换机—终端设备)与使用可视监控服务器PING别墅区终端设备(监控服务器—交换机—OLT—ONU—终端设备)均出现“初次PING终端设备时的第一个PING包会丢”现象。

在初次PING过之后短时间内再次PING终端设备时,则PING包正常,不会出现丢包现象。

【原因分析】在第一次PING可视对讲终端设备时,第一个包通过ARP广播寻找设备的MAC地址,由ONU获取到LAN口下挂设备的MAC后,并不会再向上发REPLY。

由于以前可视对讲厂商并未说明PING包的第一个包丢失会影响其报警系统的使用:该报警系统与服务器之间在正常情况下是不会建立联系的,只有在突发情况下终端设备才会向服务器发送报警信息;此时如果因学习MAC造成第一个包丢失时,服务器将不会接受后续的报警包。

因此,我司的EPON设备仍按照出厂的默认配置,ONU的LAN口设置了MAC地址学习功能。

【处理办法】根据可视对讲设备维护人员提出的需求,现场将学习LAN口下挂设备的MAC地址功能关闭,确保所有PING包过程不会丢包。

在网管上的配置操作如下:在ONU列表中,选取所要修改的ONU,右键—配置—端口MAC地址个数限制。

按照下图方式将“MAC地址限制个数”修改为“0”即可。

修改前修改后(红色所框为需要修改地方)修改后,前往小高层验证报警功能是否正常:所去用户家以前一直无法使用报警功能,修改上述配置参数后,报警功能可以正常使用。

附:监控系统组网结构:小高层处组网结构别墅处组网结构。

应用华为Optix iManager T2000传输网管系统分析告警实例

应用华为Optix iManager T2000传输网管系统分析告警实例
收稿 日期 : 0 一l _ 7 20 1 0 l
箜 塑
型至垦! 塑Q! 堕旦
竺 里 Q 堡堕旦 笪墨堑坌堑堂篁壅
此 功能 提 供 了对 2Mbts级 别 的设 备 端 口连 i /
具体 配 置 , 以及对 网元 设备 各 种属 性 的管理 。华 为
Opi i n grT 0 0 传 输 网 管 系 统 提供 了 网 络 t Ma a e 2 0 x
《 ) 有灵 活 的网络 寻址结 构 ; 2具
系 统 管 理 指 华 为 O t Ma ae 2 0 传 pi i n g rT 0 0 x 输 网管 系统对 自身 属性 祀资 源 的管理 , 主要 包括 数 据库 备 份 和恢 复 管 理 、各 类 日志 转储 和清 除 管 理
等。 () 2 网络拓 扑 管理
同步 数 字 系 列 (D 网络 中 的 网 管 系 统 , 确 保 S H) 在 S H 网络 正常 运行 的过 程 中扮演 着 十分 重 要 的角 D
色 。S H 网络 网管 系统 一般 具有 如下 特点 : D
理 、 置管 理 、 障管理 、 能管理 和安全 管 理六 个 配 故 性
( ) 有 全面 的网络 配置 、 能 监视 等功 能 。 3具 性
因此 ,D 网络 中的 网管 系 统对 于 S H 网络 S H D
作 毒 疑 食 .
网络 拓扑 管理 主要 是 提供 网络 映射 和控 制 , 协
调 网管 系统管 辖 区域所 有 的拓 扑对 象 , 以及 通 过 网
馘 氏16) 孥 (7 9 ̄
管 系统 的管 理 功 能 可分 为 系 统 管 理 、网络 拓 扑 管
管 系统 为传 输设 备 所 产生 的不 同误 码 告 警级 别 进 行 分 析及有 关控 制误码 劣 化 的方 法 。

网管查看及告警问题处理

网管查看及告警问题处理
后未到24小时,没有人工手动确认,在当前告警库中无法查 到相应告警 检查d:\otnm\ui\ini\otnm.ini文件关于告警转储条件设置正确,自动 确认条件是AUTO_CHECK_ALARM_TIME= 1 day(一天自动确认), AUTO_CHECK_ALARM_NUMBER= 3000(已结束未确认告警超过3000条系统自动 确认)将结束未确认告警条目门限修改为10000条后,未再出现自动确认现象。 告警确认不仅只有一个时间参数,还有个条目数参数,目前默认设置 为3000( otnm.ini中的AUTO_CHECK_ALARM_NUMBER=3000),即在一天内如 果告警条目数超过3000条就会自动确认。 注意:修改参数后需重新启动dtserver设置才能生效。 网块中ma与mb的编号设置不正确导致manager2自动停止的 查看d:\otnm\ui\ini\otnm.ini文件中的manager2子项中的ip参数值与数据 库ip地址一致,没有发现异常,后经查看配置文件发现网块参数设置中Ma、 Mb出现如下错误:网块中有两个网元,其中网元编号分别为3和10,而在网 块设置中将ma和mb分别设置为1和2,即ma和mb的编号不是该网块中网元的编 号。修改正确后, manager2可以正常启动且不再停止。 网管无法处理网元编号不在本网块内的网元作为Ma/Mb,在网元 删除或网块调整时,请大家注意调整Ma/Mb的编号。
3
网管问题介绍
网管硬件问题: 网管软件的载体为服务器、硬盘等。对于此类硬件问题,第一要点 就是配置文件的备份及保护,这是恢复网管运行的首要条件。如果 日常维护的备份工作做的好,比如经常定期将配置文件做拷贝备份 的话就无此担忧了。
网管软件问题分类: 功能性问题:网管提供的基本功能,如告警、性能查询等 业务问题:和电路业务相关的问题 对于网管软件类问题,应重点关注操作方法,即问题是否能够通过 一定的操作步骤复现。

网元断链告警处理案例

网元断链告警处理案例

网元断链告警处理案例第一篇:网元断链告警处理案例⌝网元断链告警处理案例1.故障现象描述"在双模站点开通过程中,部分站点在初期会有断链情况。

告警显示“网元断链告警(198099803)”这样的话,后台就无法监控到断链站点的状态。

2.故障分析排查思路1、2、3、只有个别基站在所属网管服务器上面断链,可以排查网管服务器故障;大批基站集中断链,可以排除基站本身硬件、供电故障;如果个别站点在正常运行,排除基站无硬件、供电故障后,出现断链,一般为传输问题,需要联系移动传输室来联合排查定位;3.传输网络结构介绍" LTE基站OMC维护网络从IP传输网络架构来看,可分为3段,依次是:基站------基站网关------网管服务器网关------网管服务器。

整个传输网络结构如下图所示:4.网元断链故障处理流程从网管服务器ping基站IP是否ping通?是否从网管服务器ping 基站网关IP地址说明整个传输链路正常,排除了传输故障,需要检查网管配置数据、基站配置数据是否正常。

是否ping通?是说明基站网关到网管服务器之间的传输正常;基站与基站网关之间故障否从网管服务器与网管网关互ping检查基站硬件、数据配置是否正常否是否ping通?联系传输,保证基站VLAN、IP与传输配置一致是检查网管、网管对应网关及中间传输是否正常基站网关与网管网关之间故障,属传输内部故障,由传输处理基站与基站网关之间互ping,互相检查5.故障排查总结通过上述的排查总结如下:1、首先确认BBU设备是否运行正常,站点传输设备是否正常,基站供电系统是否正常。

2、然后检查下站点的配置数据,确保站点配置无误,可能由于传输割接导致站点断链。

网管配置参数如下图所示:网元中配置的OMC操作维护地址:基站传输网络→IP传输→IP层配置中的OMC操作维护地址:基站传输网络→IP传输→OMC链路服务器地址:3、关于ping命令,有两种使用情况:a)从后台ping前台基站的话:直接在网管服务器上:ping ip地址。

olp告警处理

olp告警处理

OLP网管故障分析及处理●告警分析及处理•事件分析及处理•通讯故障告警(一)➢首先确认该设备的IP、子网掩码和网关是否设置正确,是否属于合理的网段内并无IP冲突;➢点击开始\运行,输入ping IP地址,看是否连接正常;若PING的通设备IP,则:➢检查设备主控盘的端口号是否设置为9000;➢若组网方式为DCN,与局方确定DCN交换机是否将9000端口号屏蔽了;➢若同时有几台单机版网管在监控设备可能会造成数据冲击,流量过大造成通讯故障,关闭其余的网管再观察;➢依次重启主控(开关电源)、相关的网络硬件;通讯故障告警(二)若PING不通设备IP,则➢在Windows命令行环境下,PING该设备的网关地址看是否连接正常,若PING不通网关地址,让局方检查站点与网管中心的网络情况;➢若PING的通网关地址,则在本地机房用笔记本通过一根好网线直接连接OLP主控,看是否能够PING通并能通过网管观察,若不通则重启主控盘或将主控盘更改为另一个IP,还是不通则可能是主控盘的硬件故障;➢若含有HUB插盘,通过HUB来PING设备,此时主控盘和HUB插盘的网口灯应均为橙色,若不通则更换HUB端口或重启HUB,还是不通则可能是HUB盘的硬件故障;通讯故障告警(三)➢把主控盘的网线拔下接至笔记本,并将笔记本IP设成与主控盘一样,再从网管中心PING此IP;➢检查主控盘与DCN交换机(协转或光纤收发器)之间所有的网线是否正常并确定网线类型(两个HUB插盘之间用交叉网线,与DCN交换机连接通常用直通网线,其余情况均可用直通网线),重点检查连接主控盘那端网线水晶头是否做好,试着插拔一下网线或重新做一根或用力按住网线与主控盘连接处再PING,确定XPort与水晶头是否匹配;通讯故障告警(四)➢在交换机上找一个空余的网口与电脑相连,看是否能否PING 通,若不通则让局方检查交换机的工作情况,有条件的话可以重启交换机;➢在运行时常出现通信告警,而重启主控盘能恢复正常,更换主控盘再进行观察,若还会出现此现象可以让局方检查一下DCN 情况,是因为DCN网络中传送的数据包有可能对主控盘有冲击,从而造成其经常死机;通讯故障告警(五)若组网方式是2M,则➢确定协转右边的三个白色按钮没有被按下,且背面的拨码开关调至75Ω;➢确定网线已连接正确,若直接与主控盘连接,则用直通网线接至协转交叉网口,若与HUB插盘连接,则用直通网线接至协转平行网口;➢若LOS告警,检查2M线是否完好或是否连接正确,重启协转后仍有告警则让局方检查2M线路;➢若AIS告警,重启协转后仍有告警则让局方检查传输数据是否做的正确;➢若不能恢复正常则可能是协转的硬件问题;通讯故障告警(六)若组网方式是冗余光纤,则➢确定本地和对端的光纤收发器后面的三个拨码开关应均为出厂设置(自动协商开启、100M、全双工);➢确定网线已连接正确,无论与主控盘还是HUB插盘连接,均使用直通网线;➢若IN口指示灯不亮,检查跳线是否完好或是否连接正确;➢重启后仍不能恢复正常则可能是光纤收发器的硬件问题。

中兴皖通网管常见告警分析

中兴皖通网管常见告警分析

中兴皖通网管常见告警分析ZXWT-A80常见告警分析在设备安装维护工作中会遇到很多告警,对告警的有效分析是解决问题的关键。

要找到问题的根源,首先要从告警产生的原因着手,查清问题后运用有效的处理方法排除故障。

以下针对ZXWT-A80传输设备的一些常见告警,给出产生原因及处理方法,在以后工作中可以作为同事们的参考。

1、R-LOS告警告警名称:R-LOS Loss of signal 接收线路侧信号丢失告警级别:紧急告警原因:1)断纤;2)线路衰耗过大或光功率过载;3)对端站发送部分故障线路发送失效;4)对端站交叉板故障或不在位处理方法:1)一般是光纤断、光纤衰耗太大、接收光功率过载、单板故障等原因;2)检查光缆是否完好,光接头是否接触良好,清洁光缆连接器;3)如果接收光功率过载,加入衰耗器;4)如果是单板故障,更换单板。

2、R-LOF告警告警名称:R-LOF loss of frame接收线路侧帧丢失告警级别:紧急告警原因:1)接收信号衰减过大;2)对端站发送信号无帧结构;3)本板接收方向故障处理方法:1)一般是光纤衰耗太大,检查光纤是否完好;2)检查光纤接头接触是否良好,清洁光纤接头;3)检查对端站发送信号的帧结构;4)如果是单板故障,则更换单板。

3、R-OOF告警告警名称:R-OOF Out of frame接收线路侧帧失步告警级别:紧急告警原因:1)接收信号衰减过大;2)传输过程误码过大;3)对端站发送部分故障;4)本站接收方向故障处理方法:1)一般是光纤衰耗太大、接收光功率过载、单板故障等原因;2)检查光缆是否完好,光接头是否接触良好,清洁光缆连接器;3)检查对端站发送部分4)如果是单板故障,更换单板4、MS-AIS告警告警名称:MS-AIS Multiplex section alarm indication复用段告警指示告警级别:主要告警原因:1)对端站发送MS-AIS信号;2)对端站时钟板故障;3)本板接收部分故障处理方法:1)检查对端站线路板是否有问题,可通过复位或更换单板来检查告警是否消失;2)检查本站线路板,同样可通过复位或更换单板的方法来检查告警是否消失。

日常维护告警处理-优质课件

日常维护告警处理-优质课件
电源故障引起可能是pdu板须更换scc板常见告警主控单元主控单元etn灯常灭时表示该主控单元scc板管理的网元设备与网管操作系统终端的通信中断或不正常
SDH板常见告警及维护
SDH板TF告警:激光器发送失效 SDH板红灯3次/秒
1、R-LOS 接收侧光信号丢失,危急告警: 判断故障源:①光纤故障(断);②上游站SDH板发送故障; ③下游站SDH板接收模块,光口污染(损),用酒精擦,光接 口未接好等,造成信号丢失。 检测方法:自环法、光功率测试法。 2、R-LOF 接收帧丢失,危急告警 判断故障原因:①光纤故障(误码过大);②上游SDH板发送 故障;③下游站SDH板接收故障 检测方法:自环法、光功率测试法。
SDH板常见告警及维护
HP-SLM:
C2字节失配,由所配置业务通道装载级别不一致,通 过查寻ห้องสมุดไป่ตู้以更改。
HP-LOM:
H4字节,按4个基帧字节排列。 原因:①业务配置不当
②单板版本不匹配
GTC板的告警维护PS
复用段保护环下,业务级别,是在 VC4下,特点:
SCC板启动协议 SL1或SL4板处理相应K1、K2字节 GTC板执行保护动作一般是光路上的 保护,靠相应字节K1、K2的检测
SDH板常见告警及维护
MS-AIS、AU-AIS
AIS告警信号都是全“1”码 RLOS,RLOF,ROOF,告警都是最高级别的,说明业务已 中断,发现它们都会向下插入告警。 全“1”码,由高端危急告警下插。 AU-AIS还与业务配置错误有关。(红灯:2次/秒)
HP-TIM
由J1字节失配造成,通过网管登录看J1是否一致
ETN灯闪烁时,表示该主控单元SCC板管理的网元 设备与网管操作系统终端之间正在传送数据。

电力监控系统网络安全典型告警案例汇编

电力监控系统网络安全典型告警案例汇编

电力监控系统网络安全典型告警案例汇编国家电力调度控制中心2018年3月前言近年来国际上相继爆发了乌克兰大面积停电、勒索病毒肆虐等网络安全事件,电力监控系统作为关键信息基础设施,已成为国家间“网络战”首选攻击目标,安全形势严峻。

为全面加强网络空间的安全监管,各级调度机构依托内网安全监视平台(网络安全管理平台)开展网络安全运行监视工作,但目前平台中存在的大量无效告警,严重影响了网络安全运行监视的效率,亟需开展告警治理工作。

为有效指导各单位开展告警治理,国调中心组织浙江、江苏、宁夏公司以及北京科东、南瑞信通等单位梳理分析100余篇告警分析报告,编制形成《电力监控系统网络安全典型告警案例汇编》。

本汇编分为清朗、有序、安全三篇,共计28个典型告警案例,旨在指导各级调控机构、变电站和电厂等单位的网络安全运行管理人员和运维检修人员全面清理网络空间中垃圾软件、程序不良行为和无效网络连接,合理配置网络结构参数、安全防护策略,规范现场作业的操作行为,及时发现并处置网络安全风险及事件,全面营造清朗有序安全的电力监控系统网络空间。

目录第一篇清朗篇 (1)案例一、远动机未关闭SNTP服务导致异常访问 (2)案例二、远动机未关闭mDNS服务导致异常访问 (3)案例三、远动机未关闭DNS服务导致异常访问 (4)案例四、远动机未关闭NetBIOS服务导致异常访问 (5)案例五、计划工作站未关闭DHCP服务导致异常访问 (7)案例六、光功率预测服务器未关闭SSDP服务导致异常访问 (8)案例七、输入法软件自动更新导致异常访问 (9)案例八、故录装置防病毒软件自动更新导致异常访问 (11)案例九、电量终端Ping本地路由器网关导致异常访问 (12)案例十、电量主站前置机远程管理功能未关闭导致异常访问 (13)第二篇有序篇 (15)案例十一、EMS系统业务通道参数配置错误导致异常访问 (16)案例十二、纵向装置策略配置错误导致EMS正常业务访问被拦截 (17)案例十三、纵向装置策略漏配导致日志报文被拦截 (18)案例十四、保信子站存在默认路由导致局域网报文窜入数据网 (19)案例十五、保信子站网络结构不规范导致局域网报文窜入数据网 (20)案例十六、保信子站网络结构不规范导致数据网双接入网窜网互联 (22)案例十七、远动机硬件设计缺陷导致报文串网传输 (24)案例十八、故障录播装置硬件设计缺陷导致报文串网传输 (25)案例十九、PMU装置设计缺陷导致报文串网传输 (27)案例二十、纵向装置内外网口网线反接导致正常业务访问被拦截 (29)案例二十一、纵向装置报“证书不存在”告警 (30)案例二十二、纵向装置报“隧道没有配置”告警 (31)案例二十三、纵向装置报“验证签名错误”告警 (32)案例二十四、纵向装置报“私钥解密错误”告警 (33)第三篇安全篇 (34)案例二十五、远动机感染病毒导致异常访问 (35)案例二十六、外部设备违规接入导致异常访问 (36)案例二十七、外部设备接入导致违规外联 (37)案例二十八、内部交换机违规接入互联网 (38)第一篇清朗篇清朗,是指网络空间中的应用服务是必需的,网络连接是清晰必要的。

olp告警处理

olp告警处理

OLP网管故障分析及处理●告警分析及处理•事件分析及处理•通讯故障告警(一)首先确认该设备的IP、子网掩码和网关是否设置正确,是否属于合理的网段内并无IP冲突;点击开始\运行,输入ping IP地址,看是否连接正常;若PING的通设备IP,则:检查设备主控盘的端口号是否设置为9000;若组网方式为DCN,与局方确定DCN交换机是否将9000端口号屏蔽了;若同时有几台单机版网管在监控设备可能会造成数据冲击,流量过大造成通讯故障,关闭其余的网管再观察;依次重启主控(开关电源)、相关的网络硬件;通讯故障告警(二)若PING不通设备IP,则在Windows命令行环境下,PING该设备的网关地址看是否连接正常,若PING不通网关地址,让局方检查站点与网管中心的网络情况;若PING的通网关地址,则在本地机房用笔记本通过一根好网线直接连接OLP主控,看是否能够PING通并能通过网管观察,若不通则重启主控盘或将主控盘更改为另一个IP,还是不通则可能是主控盘的硬件故障;若含有HUB插盘,通过HUB来PING设备,此时主控盘和HUB插盘的网口灯应均为橙色,若不通则更换HUB端口或重启HUB,还是不通则可能是HUB盘的硬件故障;通讯故障告警(三)把主控盘的网线拔下接至笔记本,并将笔记本IP设成与主控盘一样,再从网管中心PING此IP;检查主控盘与DCN交换机(协转或光纤收发器)之间所有的网线是否正常并确定网线类型(两个HUB插盘之间用交叉网线,与DCN交换机连接通常用直通网线,其余情况均可用直通网线),重点检查连接主控盘那端网线水晶头是否做好,试着插拔一下网线或重新做一根或用力按住网线与主控盘连接处再PING,确定XPort与水晶头是否匹配;通讯故障告警(四)在交换机上找一个空余的网口与电脑相连,看是否能否PING 通,若不通则让局方检查交换机的工作情况,有条件的话可以重启交换机;在运行时常出现通信告警,而重启主控盘能恢复正常,更换主控盘再进行观察,若还会出现此现象可以让局方检查一下DCN 情况,是因为DCN网络中传送的数据包有可能对主控盘有冲击,从而造成其经常死机;通讯故障告警(五)若组网方式是2M,则确定协转右边的三个白色按钮没有被按下,且背面的拨码开关调至75Ω;确定网线已连接正确,若直接与主控盘连接,则用直通网线接至协转交叉网口,若与HUB插盘连接,则用直通网线接至协转平行网口;若LOS告警,检查2M线是否完好或是否连接正确,重启协转后仍有告警则让局方检查2M线路;若AIS告警,重启协转后仍有告警则让局方检查传输数据是否做的正确;若不能恢复正常则可能是协转的硬件问题;通讯故障告警(六)若组网方式是冗余光纤,则确定本地和对端的光纤收发器后面的三个拨码开关应均为出厂设置(自动协商开启、100M、全双工);确定网线已连接正确,无论与主控盘还是HUB插盘连接,均使用直通网线;若IN口指示灯不亮,检查跳线是否完好或是否连接正确;重启后仍不能恢复正常则可能是光纤收发器的硬件问题。

传输网告警故障典型案例

传输网告警故障典型案例

本地传输网故障告警典型案例光缆线路中断导致业务全阻系统概述某局本地传输网采用ZXSM-150/600/2500设备组网,整个网络由5端ZXSM-150/600/2500网元组成,构成一个通道保护环带链的结构,环一上的传输速率是2.5Gbit/s,F到C的链上的传输速率是622Mbit/s,B和D的链上的传输速率是155Mbit/s。

网络结构如图6-1所示。

中心局设在E网元,网管终端放在中心局。

图6-1 案例1网络结构图链上光纤连接关系如下:F网元的27#OL4接A网元7#OL4,A网元的10#OL4接B网元7#OL4,B网元的10#OL4接C网元7#OL4,B网元的13#OL1接D网元7#OL1。

所有其他网元均只和E网元有业务配置,A到E的业务使用链上的1#AU,B到E的业务使用链上的2#AU,C到E的业务使用链上的3#AU,D到E的业务使用链上的4#AU。

网元A 设置为内时钟,其余网元通过S1使用双向提取线路时钟。

故障现象描述A,B,C,D到E的业务全部中断,通过网管采集告警发现,F网元的27#OL4上有“622M 接收信号丢失”,A网元的7#OL4上有“622M接收信号丢失”,7#和10#OL4上有1~4#AU 的“AU通道告警指示信号”、“不可用时间开始”等告警。

B,C,D网元的光板上有相关AU的“AU通道告警指示信号”、“不可用时间开始”等告警。

A网元和F网元间有B1/B2/B3 UAS性能指示。

故障分析由于有再生段和复用段等高级别的告警和B1/B2性能,首先必须排除光路上的故障和外部光缆线路的因素。

通过上面的告警指示可以知道,A和F都没有收到光信号。

故障在A和F 之间,由于A和F光板同时产生故障的可能性比较小,因此外部光缆线路等因素导致上述故障的可能性比较大。

故障定位和排除步骤采用光功率指标测试法:到网元F所在机房,用光功率计从27#光板输入口、ODF的收光法兰连接、ODF上光缆成端的法兰连接,逐级测量光接口的功率。

II型机网管告警的解释、原因分析和处理方法

II型机网管告警的解释、原因分析和处理方法

网管告警的解释、原因分析和处理方法
说明:
1.对告警分类的解释
●通信类告警:直接影响业务层的告警,指示通信信号在一定的层面上发生了中断或
者信号劣化。

●同步类告警:时钟相关故障产生的告警。

●设备类告警:由设备内部故障直接产生的告警,包括电源故障、单板故障、单板脱
位、网管配置和设备上安装的硬件不一致故障而产生的告警。

2.告警单板是指网管告警监视窗口中的“检测点单板”,该单板指示告警,但告警来源不一
定就是告警单板。

3.告警级别和告警处理:
当由故障发生时,设备和网管上常常伴随大量的告警和不同类型的告警。

由于高级别的告警常常会导致低级别的告警,因此故障发生时,必须先将所有告警进行分类;首先对高级别的告警进行处理,然后观察低级别的告警是否消失;如果没有消失,再对低级别的告警进行处理;如果消失,说明低级别的告警是由高级别的告警引起的。

通信中断类告警级别比通信误码类告警级别高,再生段的告警级别比复用段的告警级别高,复用段的告警级别比高阶通道的告警级别高,高阶通道的告警级别比低阶通道的告警级别高。

以下是不同类告警的告警级别的列表。

CV性能超值
帧丢失、不可用时间开始
B1 UAS性能超值
帧失步
再生段信号劣化
复用段告警指示信号、不可用时间开始
复用段远端缺陷指示
复用段信号劣化
复用端保护倒换事件
AU4通道告警指示信号、不可用时间开始
AU4指针丢失
远端缺陷指示
复帧丢失
VC4高阶通道信号劣化
B3 SES性能超值
B3 FESES性能超值
AU4 PJE+性能超值、AU4 PJE-性能超值。

传输网告警整治建议-华为V2

传输网告警整治建议-华为V2
高频闪报告警专项清理:对于闪报告警进行专项整治,预计可以减小告警30%告警量 PTN告警关联规则定义:PTN线路可能导致倒换TUNNEL_APS_DEGRADED和
PW_APS_DEGRADED同时上报,设置TUNNEL_APS_DEGRADED不上报可以减少约6% 的告警上报。 *以上饶移动PTN告警为例
告警清理建议:SNCP业务配置设置成恢复 式可以减少大量PS告警;
清理后对系统影响:主用通道误码可能导 致频繁上报PS告警;恢复断缆时若存在光 缆错连可能在业务恢复至主用后业务中断。 4: DOWN_E1_AIS:下行方向2Mbit/s信号 告警指示; 告警对业务影响:产生该告警时,单板通 道的E1信号不可用。 告警清理建议:明确电路无业务承载后删 除电路;或者更换电路路由或时隙; 清理后对系统影响:无
告警清理工作汇报
XX移动网络维护中心 2015年X月
告警专项整治背景
告警问题概述
传输网告警较多,工单多,影响日常维护和故障处理效
九江移动U2000告警统计(OTN+SDH) 上饶移动U2000告警统计(OTN+PTN)
告警类别 紧急 重要 次要 提示 合计
告警数量 6 1892 546 15 2459
NE_NOT_LOGIN
MPLS_TUNNEL_BDI IN_PWR_LOW NE_COMMU_BREAK
920
869 752 731
86.77
87.56 88.25 88.91
全部告警数量:
109447
100%
传输网告警专项整治具体措施---大基数告警(PTN)
1: ETH_LOS: 表示ETH信号丢失。 告警对业务影响:此时业务已经中断或者 无业务。 告警清理建议:明确接口无业务反转告警; 清理后对系统影响:无 告警清理建议:屏蔽此类告警; 清理后对系统影响:非线路或者上层链路 原因导致该告警上报时,可能影响故障及 时识别和定位。 4: TUNNEL_APS_DEGRADED :表示Tunnel保护组降级; 告警对业务影响:如果该告警产生,则保 护组可用性降低; 告警清理建议:屏蔽此类告警; 清理后对系统影响:无线路或者上层链路 原因导致该告警上报时,可能影响故障及 时识别和定位。

网管电调告警处理案例

网管电调告警处理案例

通过电调告警判断小区接反案例【摘要】在日常优化过程中,经常会碰到由于小区接反导致各种干扰切换等问题,需要到现场测试才能发现问题,由于电信大部分站点为BBU池,在处理传输故障过程中由于不小心导致小区接反,而通过电调告警基本能判断出小区如何接反,并在BBU池作出相应调整。

【关键字】小区接反电调外部扩展设备告警【故障现象】在中兴ommb网管上发现有很多外部扩展设备告警,如下图所示:我们知道此类告警由于电调本身故障或电调序列号与网管配置序列号不匹配导致【原因分析】网管告警类型现网网管关于电调告警大致分为:1. 通讯链路断2. 校准失败3. 电机没有响应调整命令4. 电机不能调整5. AISG接口/NSBT端口过流关断6. 网管配置与现场电调序列号不一致下面主要说明电调告警处理方法并着重说明第6条与现场小区是否接反的关系【解决方案】关于告警处理方法及流程1.校准失败,电机类原因导致的告警,可通过复位电调处理。

具体方法为:打开动态管理,选中待处理网元。

在下方动态命令中找到“复位AISG设备”。

如下图:2.AISG接口/NSBT端口过流关断类告警。

此类告警一般与馈线接口故障有关,先进行电调更换。

如告警未消,则检查RRU馈线接口是否进水。

若RRU馈线接口进水,则考虑更换RRU。

3.通讯链路断。

此种告警产生是由于电调或电调线出现故障,此类告警部分可在告警监视中查看,部分站点因开站过程中无法配置数据而无法查看告警。

关于查看未显示告警的电调故障,步骤如下:1).点击视图—AISG设备管理,弹出对话框。

2).选中待处理网元,点击扫描按钮。

,选择协议“V.20”.点击确定,显示消息发送成功,即开始扫描。

如下图:4.扫描完成后,显示结果在“详细信息”中,显示为“0或1”的,即为有故障。

显示为“2“,即为电调无故障。

对于有故障的扇区,需要先更换电调线,然后依照上文步骤再次进行扫描,若扫描有故障,则考虑更换电调设备。

5.对于已处理过扫描结果为“2”的扇区,在下方状态栏中显示未创建,需手动创建。

通信安规案例分析

通信安规案例分析

1/6、案例1 网管值班人员违规操作电力通信网管2017年4月18日,按照☓☓公司信通调度下发的工作联系单,为配合110kV 景天变电站π接入110kV龙葵变电站、110kV龙阳变电站,需对相关业务通道组织方式进行变更。

☓☓公司通信运检班工作负责人李☓☓办理相关工作许可手续后,登录网管系统后直接进行业务配置操作,出现业务数据下发异常,遂重启网管系统,重启后发现110kV龙葵变电站、110kV龙阳变电站业务数据丢失,于是寻求厂家运维人员进行故障排查。

厂家运维人员吴☓☓使用预留的测试账号通过远程方式登录网管进行故障处置。

工作结束后,为避免数据丢失,李☓☓用自有移动硬盘对网管数据进行了备份。

试分析该案例中违反《电力安全工作规程(电力通信部分)》的行为。

正确答案(1)工作负责人李☓☓登录网管系统后直接进行业务配置操作。

违反《电力安全工作规程(电力通信部分)》8.2“电力通信网管检修工作开始前,应对可能受到影响的配置数据、应用数据等进行备份”的规定。

(2)吴☓☓使用预留的测试账号通过远程方式登录网管进行故障处置。

违反《电力安全工作规程(电力通信部分)》8.1“电力通信网管的账号、权限应按需分配,不得使用开发或测试环境设置的账号”和8.6“电力通信网管维护工作不得通过互联网等公共网络实施。

禁止从任何公共网络直接接入电力通信网管系统”的规定。

(3)工作人员李☓☓用自有移动硬盘对网管数据进行备份。

违反《电力安全工作规程(电力通信部分)》8.8“电力通信网管的数据备份应使用专用的外接存储设备”的规定。

2/6、案例2 220kV重楼变电站ECI设备光路误码紧急消缺2018年2月20日9时10分,☓☓公司工作人员张☓☓发现核心机房ECI光传输系统X1槽位1口(对220kV重楼变电站X2槽位1口)上报误码越限告警。

10时15分,☓☓信息通信公司运检中心工作负责人王☓☓和工作班成员李☓☓到达220kV重楼变电站现场填写电力通信工作票,经工作票签发人电话同意,但未在工作票备注栏中记录。

网管中心突发事件处理措施

网管中心突发事件处理措施

网管中心突发事件处理措施第一篇:网管中心突发事件处理措施第一节应急保障目前网管中心主要负责公司门禁,电话交换系统,应用服务器系统、电话交换系统、网络系统、外网门户、以及公司内外网信息安全等。

保障各系统的稳定安全,是网管中心首要工作任务。

这需要网管中心时刻警惕突发事件的发生,在日常工作中做好网络及服务器的维护工作,做到防患于未然,也希望公司各位员工积极配合,遵守网络管理要求,防止可能发生的问题。

(一)人员保障(二)物资保障根据网管中心并报公司审批的预案,做到各种硬件有备份,各种软件有备份、各项数据定期备份归档。

根据实际情况建立物质储备,购买各服务器的备件,网络备件,以确保紧急事件发生后的及时解决。

第二节处置措施(一)灾害发生前,网管中心配合相关安全体系预先对灾害预警预报系统进行建设,编制突发情况防范规划,加强各办公室的巡查力度,发现隐患及时处理,并做好巡查记录。

各服务器定时做数据备份,定时备份日志文件,并分析是否有潜在威胁。

每天检查各服务器杀毒软件运行、更新情况,并经常关注最新病毒动向,积极预防。

(二)突发事件发生后,立即启动应急预案,采取应急处置程序,初步判断事件的严重性,该保留证据的就保留,并在5分钟内通知上级领导,有关人员及时到位,相关技术人员要时刻处在应急处置状态。

首先确定此事件是否人为,是否偶然或必然。

在确保在场人员人身安全前提下,首先保障数据安全,其次是设备安全。

具体方法包括:安全关机、数据设备强行关机、数据备份物理转移等。

第三节处置程序(一)发现情况网管中心要做到每天巡查公司网络设备、公司内部服务器日志、托管服务器访问日志,保障最先发现问题,做好防范措施。

(二)启动预案一旦突发事件发生,立即启动应急预案,按照处置措施进入具体方案。

(三)情况报告紧急情况发生时,一方面判定危害程度,同时向公司其他应急小组成员汇报,并及时向公司领导报告处置进展情况,直至威胁解除。

情况报告内容有:紧急情况发生的时间、地点、威胁程度、灾害造成的后果、预计处理时间、处置结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网元安全告警处理案例
近日,我传输中心技术人员在更换华为公司Optix155H型设备主控板时,遇到网元频繁上报SCB-ALM告警的问题。

我们通过查找资料、咨询华为客服热线等方式,及时将该问题解决。

现将本次处理过程总结如下。

一、现象描述
我公司传输本地网一网元F2口传输环境监控信息,该F2通道出现故障,需要更换主控板进行处理。

我们将设备的主控板由SS42SCB更换为SS43SCB单板,更换完成后,发现该网元频繁上报SCB-ALM告警,闪报状态,但不影响业务。

该网元单板配置如下:3-SP1D,9-X42,11-OI2D, 15-STG ,17-SCC,18-OHP2。

二、原因分析
SCB-ALM告警是网元安全告警,是由于网管登陆网元引起的。

该网元不断闪报安全告警,表明一直有一网管试图登陆该网元,但不能成功登陆。

这种情况,应该是网元用户设置问题或是网管侧数据设置引起的。

三、处理过程
1、通过NES网管查询网元用户,发现该网元用户只有一个:们首先排除传输侧问题:重新检查各处2M线的制作情况,没有发现问题。

在远端进行PDH 设备支路环回,近端PDH侧挂PCM2M误码表进行测试,测试结果显示没有任何误码。

传输侧问题基本可以排除。

排除路由器问题:公安边防接入系统原使用另一家电信运营商的传输路由,割接前一直没有丢包现象。

通过测试路由器设备,没有发现问题。

故障定位在V.35介质转换器上。

本次使用的V.35转换器是北京瑞斯康达公司的RC903-V35FE1型转换器。

我们以前没有接触到该型号设备,通过查看设备说明书和咨询厂家,我们初步判断问题出在该转换器的设置开关上。

调整V.35设备的时钟方式,将近端和远端V.35转换器设备由出厂默认的主时钟方式(内时钟)改为从时钟方式(跟踪E1时钟),观察丢包现象,丢包现象依然存在。

调整TX、RX的CLK相位关系,将近端和远端V.35转换器设备由正向改为反向,丢包现象消失。

我们又尝试了其它几种TX、RX的CLK相位设置方式,我们发现近端和远端V.35转换器的TX、RX-CLK相位关系不是绝对的,有一端设为正
向,另一端设为反向,也没有丢包现象;而对哈尔滨总队的两端转换器,都是出厂的默认设置-正向,也没有丢包现象。

所以,TX、RX的CLK相位关系,在调测时应该视设备情况而定,灵活运用。

双鸭山联通史克虎
2004年9月23日。

相关文档
最新文档