网优常见指令及告警分析(精选)
SDH常见告警分析与信号流
SDH常见告警分析与信号流
一、SDH常见告警分析
1、告警概述
SDH(Synchronous Optical Network)是一个如今非常流行的高速数字
传输技术,它将各种网络服务联接到一个基于光纤的正交网中。
通过在此
网络上提供端到端的数据传输,SDH能够实现更高的带宽,更低的成本以
及更高的可靠性。
SDH技术具有较高的灵活性和可靠性,但它也存在一定的风险,典型
表现为传输质量下降、网络中断,网络性能下降等。
要确保网络可靠,运营商必须采取一些措施来监控网络,检测可能会
引起故障的事件,并及时采取有效的故障处理措施。
其中SDH告警检测是一种常见的故障监控技术,它可以发现和跟踪SDH网络中出现的异常情况,从而及时发现故障源,有效的处理网络故障。
2、常见SDH告警
SDH网络中的常见告警主要包括以下几类:
(1)信号失步:又叫网元失步,是指在SDH网络中,网元的时钟和信
号的传输时间不一致,导致网络的传输出现失步现象。
(2)传输质量异常告警:SDH的传输质量是指把原始信号转换为该网
络的Status Bits格式并在网络内传输时,信号的损耗、延时、差错率、
帧丢失率等参数;当这些参数超过允许的阈值时,就会产生传输质量异常
告警。
网优班华为2G及3G网管告警处理说明
网优班华为2G及3G网管告警处理说明无线华为2G系统:目前,网优班华为2G系统包括M2000网管服务器一台(设备在省公司核心机房),华为BSC计5套,其中新区机房四楼有3套,分别为:YAC-HBSC-6000-01:,YAC-HBSC-6000-04:,第三机房楼有1套,YAC-HBSC-6900-05:,下挂基站约300个左右的基站。
华为2G基站退服的故障及告警全部统一在M2000网管客户端上进行查看,主要操作步骤如下:1、双击桌面上的“M2000客户端”图标,打开客户端。
2、在出现的登陆对话框中,输入用户名:yclidw,密码:YCHhuawei@1,检查服务器地址是否为:,确认无误后,按登陆进入系统。
3、进入M2000服务器后可以看到主界面,左上角为“盐城移动分公司2G华为网络管理系统“,分别有”主拓扑“等按钮,在主界面的右上角,分别显示紧急告警(红色)、重要告警(棕色)、次要告警(黄色)、及提示告警(灰色)等四类告警类型。
值班主要看紧急告警,包括了基站退服、BSC级的单板或其它紧急故障等。
4、双击红色告警,即可显示紧急告警的列表,如图显示,其中“OML故障告警“即为基站退服的告警,绿色标记的基站已恢复的告警。
白色标记的为基站仍在退服当中的,必须即时通知各县市代维进行处理。
频次表示的是该基站当天重复退服的次数。
对于绿色标记已恢复的基站,可按右键,点”确认“键,即可清除该告警。
该告警即不会在列表中显示出来了。
5、对于所有告警,可按右键,将告警列表另存为EXCLS表格,便于后期统计及处理。
无线华为3G(TD)系统:网优班华为3G系统与2G系统较相似,界面及操作方法基站一致,其中包括M2000网管服务器一台(设备在省公司核心机房),华为RNC计10套,其中RNC01-04在盐湾三楼机房,其它RNC05-10在黄山路第三机房楼内。
华为3G的所有告警在3G网管系统OMC920客户端上进行查询及处理。
告警分析及处理
告警分析及处理一、动环1、网管1)帐号登陆提示连接失败或鉴权失败:可分为两个原因,一是网络中断,无连接到服务器,二是服务器程序未运行,需要联系网管人员进行程序启动。
提示用户被锁定:因用户多次密码输入错误,导致用户被锁定,需要联系系统管理员进行帐号解锁设臵。
2)网络连接网络连接故障:本地连接断开,检查电脑网口网线是否连接正常,检查交换机端网口网线连接是否正常,其次检查电脑网卡是否存在故障。
3)基站中断基站中断分三个方面:一是模拟站或者干节点站的站点全部中断,导致原因应该是模拟站的前臵台或者干节点的前臵台程序未运行或者连接中断;二是模拟站的多个站点同时中断,这种现象一般是中断站点传输在同一传输设备ETN上,如果该ETN与交换机之间传输出现问题,就会出现这种故障,检查ETN与交换机之间网管连接情况;三是个别站点出现监控中断,导致原因可分两方面:一是该基站传输出现故障,二是底端EISU设备出现故障或者基站为EISU提供48V电源出现故障。
2、基站1)动力设备A、开关电源监控中断:分为四方面,一是从施工一直未正常监控的,为电源监控模块故障,需要更换电源监控模块;二是检查是否因为更换电源模块后所致,是否更换了电源监控模块型号,或者更换监控模块后,电源监控模块后的RS232通信口的连接线是否连接正常。
三是开关电源监控模块故障,需要更换电源监控模块;四是电源其它告警(欠压、防雷故障之类的),检查现场电源监控模块内告警内容,如果也存在相应告警,则是电源实际告警,如果不一致请联系厂家进行数据处理。
B、空调空调控制:因基站都做有相应的空调节能系统,网管进行控制后不能产生效果。
空调电流及空调状态:如果空调电流出现值无效之类的告警,一般为基站空调电流监测设备出现接线错误,检查该基站是否更换空调,而导致电流监测设备被拆除,如果设备正常,请检查设备接线情况。
C、蓄电池监控原理:对两组蓄电池的总电压进行测量,测点一般设在开头电源柜内的电极排上,如果出现电压数值不付或者故障,检查现场电极排上测点之间电压是否正常,接线是否正常;电流监测在蓄电池电源线上有个直流电流互感器进行监测,如果出现电流数据为-45,一般为直流电流互感器接线故障,检查接线是否有松动。
常见(重要)告警说明
常见(重要)告警说明一.常见(重要)告警列表:目录索引:1.1 PROCESSOR[33] ACCESS-FAIL[3] (3)1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]: (4)1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]: (5)1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]: (5)1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]: (6)2.1 PROCESSOR[33] RESTART[0]: (7)2.2 PROCESSOR[33] RESET[1]: (7)2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]: (8)2.4 PROCESSOR[33] TAKEOVER[7]: (8)2.5 PROCESSOR[33] RELC-OV[4]: (9)2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]: (10)3.1 N7[35] LNK-REP[0]: (11)3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]: (11)3.3 TSC-TRUNK [66] AIS-2-MB[66]: (11)3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]: (11)3.5 TSC-TRUNK [66] BER-10E-3[99]: (12)3.6 TSC-TRUNK [66] BER-10E-4[100]: (12)3.7 TSC-TRUNK [66] BER-10E-6[102]: (12)3.8 TSC-TRUNK [66] FAR-END-ALARM[176]: (12)4.1 BSS BVCSig is broken on: (13)4.2 BSS GSL is broken on(GSL out): (14)5.1 CELL[43] LOSS-OF-BCCH[0]: (16)5.2 CELL[43] LOSS-OF-ALL-CHAN[3]: (17)6.1 CELL[43] LOSS-OF-TCH[2]: (18)7.1 RTCH_fail_rate (18)8.1 BTS-EXTERNAL[9] bts-external-2[2] (19)8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo (19)8.3 ENVIR[5] MAINS-AL[20] (19)9.1 BTS-EXTERNAL[9] bts-external-3[3] (19)9.2 BTS-EXTERNAL[9] bts-external-3[3]mbo (19)10.1 At least one temperature sensor has detected a T > 65C: (20)10.2 CNVR: disjunction due to output voltage problem on converter: (20)10.3 2.1V: no more redondancy of GPU boards: (21)二.常见(重要)告警祥解: BSC设备方面的常见告警:1.1 PROCESSOR[33] ACCESS-FAIL[3]1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]:1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]:1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]:1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]:BSC负荷方面的常见告警:2.1 PROCESSOR[33] RESTART[0]:2.2 PROCESSOR[33] RESET[1]:2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]:2.4 PROCESSOR[33] TAKEOVER[7]:2.5 PROCESSOR[33] RELC-OV[4]:2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]:BSC传输方面的常见告警:3.1 N7[35] LNK-REP[0]:3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]:3.3 TSC-TRUNK [66] AIS-2-MB[66]:3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]:3.5 TSC-TRUNK [66] BER-10E-3[99]:3.6 TSC-TRUNK [66] BER-10E-4[100]:3.7 TSC-TRUNK [66] BER-10E-6[102]:3.8 TSC-TRUNK [66] FAR-END-ALARM[176]:GRPS方面的常见告警:4.1 BSS BVCSig is broken on:4.2 BSS GSL is broken on(GSL out):4.3 LapDLink disabled:小区退服的关键告警:5.1 CELL[43] LOSS-OF-BCCH[0]:5.2 CELL[43] LOSS-OF-ALL-CHAN[3]:基站载频退服关键告警:6.1 CELL[43] LOSS-OF-TCH[2]:小区分配失败7.1 RTCH_fail_rate基站交流断电外部告警:8.1 BTS-EXTERNAL[9] bts-external-2[2] 8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo 8.3 ENVIR[5] MAINS-AL[20]基站直流低电压外部告警:9.1 BTS-EXTERNAL[9] bts-external-3[3] 9.2 BTS-EXTERNAL[9] bts-external-3[3]mboMFS重要外部告警10.1 At least one temperature sensor has detected a T > 65C:10.2 CNVR: disjunction due to output voltage problem on converter:10.3 2.1V: no more redondancy of GPU boards:。
常见(重要)告警说明
常见(重要)告警说明一.常见(重要)告警列表:目录索引:1.1 PROCESSOR[33] ACCESS-FAIL[3] (3)1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]: (4)1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]: (5)1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]: (5)1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]: (6)2.1 PROCESSOR[33] RESTART[0]: (7)2.2 PROCESSOR[33] RESET[1]: (7)2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]: (8)2.4 PROCESSOR[33] TAKEOVER[7]: (8)2.5 PROCESSOR[33] RELC-OV[4]: (9)2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]: (10)3.1 N7[35] LNK-REP[0]: (11)3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]: (11)3.3 TSC-TRUNK [66] AIS-2-MB[66]: (11)3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]: (11)3.5 TSC-TRUNK [66] BER-10E-3[99]: (12)3.6 TSC-TRUNK [66] BER-10E-4[100]: (12)3.7 TSC-TRUNK [66] BER-10E-6[102]: (12)3.8 TSC-TRUNK [66] FAR-END-ALARM[176]: (12)4.1 BSS BVCSig is broken on: (13)4.2 BSS GSL is broken on(GSL out): (14)5.1 CELL[43] LOSS-OF-BCCH[0]: (16)5.2 CELL[43] LOSS-OF-ALL-CHAN[3]: (17)6.1 CELL[43] LOSS-OF-TCH[2]: (18)7.1 RTCH_fail_rate (18)8.1 BTS-EXTERNAL[9] bts-external-2[2] (19)8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo (19)8.3 ENVIR[5] MAINS-AL[20] (19)9.1 BTS-EXTERNAL[9] bts-external-3[3] (19)9.2 BTS-EXTERNAL[9] bts-external-3[3]mbo (19)10.1 At least one temperature sensor has detected a T > 65C: (20)10.2 CNVR: disjunction due to output voltage problem on converter: (20)10.3 2.1V: no more redondancy of GPU boards: (21)二.常见(重要)告警祥解:BSC设备方面的常见告警:1.1 PROCESSOR[33] ACCESS-FAIL[3]1.2 BSC-ADAPT[73]EQUIPMENT-FAULT[128]:1.3 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-A[3]:1.4 BSC-CLOCK[52] LOSS-OF-SYSTEM-CLK-B[4]:1.5 BSC-CLOCK[52] BSC-RUN-ON-LOCAL-CLK[6]:BSC负荷方面的常见告警:2.1 PROCESSOR[33] RESTART[0]:2.2 PROCESSOR[33] RESET[1]:2.3 PROCESSOR[33] SDCCH-OVRL-BSC[9]:2.4 PROCESSOR[33] TAKEOVER[7]:2.5 PROCESSOR[33] RELC-OV[4]:2.6 GOLBAL-BSC[47] SCCP-NOT-A V AIL[1]:BSC传输方面的常见告警:3.1 N7[35] LNK-REP[0]:3.2 TSC-TRUNK [66] TWO-MB-MISSING[50]:3.3 TSC-TRUNK [66] AIS-2-MB[66]:3.4 TSC-TRUNK [66] FRAME-ALIGNMENT[81]:3.5 TSC-TRUNK [66] BER-10E-3[99]:3.6 TSC-TRUNK [66] BER-10E-4[100]:3.7 TSC-TRUNK [66] BER-10E-6[102]:3.8 TSC-TRUNK [66] FAR-END-ALARM[176]:GRPS方面的常见告警:4.1 BSS BVCSig is broken on:4.2 BSS GSL is broken on(GSL out):4.3 LapDLink disabled:小区退服的关键告警:5.1 CELL[43] LOSS-OF-BCCH[0]:5.2 CELL[43] LOSS-OF-ALL-CHAN[3]:基站载频退服关键告警:6.1 CELL[43] LOSS-OF-TCH[2]:小区分配失败7.1 RTCH_fail_rate基站交流断电外部告警:8.1 BTS-EXTERNAL[9] bts-external-2[2] 8.2 BTS-EXTERNAL[9] bts-external-2[2]mbo 8.3 ENVIR[5] MAINS-AL[20]基站直流低电压外部告警:9.1 BTS-EXTERNAL[9] bts-external-3[3] 9.2 BTS-EXTERNAL[9] bts-external-3[3]mboMFS重要外部告警10.1 At least one temperature sensor has detected a T > 65C:10.2 CNVR: disjunction due to output voltage problem on converter:10.3 2.1V: no more redondancy of GPU boards:。
网优投诉常见问题
语音质量差 特定区域出现
覆盖不足
设备故障
回音
原因
电学回音。用户拨打固定电话出现的回音,回音的现象是“可以听到自己的声音,还可 以听到对方的声音” 声学回音。用户手机拨打手机出现的回音现象,回音的现象是“可以听到自己的声音, 还可以听到对方的声音” 网络设备故障。听到自己的声音而无法听见对方的声音,即“声音环回”
手机显示无信号
处理方法
· 手机终端故障,需要到维修店维修 · 基站故障,需及时通知机房维护人员并协助对该基站进行故障排查 · 频繁切换重选,需让网优人员进行优化调整,可以进行天线调整,切换、接入、重选等参 数调整。 · 弱覆盖,需要采集相关资料备案(地理位置、人流量等信息),为后期优化调整或工程规 划建设提供参考依据
工单填写
投诉工单的回复是网优客户投诉处理工作的
记录和证据,在一定程度上体现了投诉处理 的工作质量,重视和做好回单工作。 根据省公司要求,网络质量工单结单要满足 结单要素,要素内容要齐全、结果明确。杜 绝“转XX厂家处理”等现象,尽量减少“正 在处理中”、“已派包区人”等回复。
a结单填写要素
⑴可以解决的投诉问题。 问题产生原因、地点、是否解决、是否有基站,解 决方式、时间,回复时间及客户满意度。 ⑵无法解决的投诉问题。 问题产生原因、地点,待解决方式、待解决时间, 回复时间及客户满意度。 如需现场测试,要说明“需现场测试,待添加笔 记”。测试完成后将处理结果补充到笔记中,并通 知客服呼叫中心添加笔记。
4.主叫呼出(被叫呼入)困难,表现为主叫听到下列 通知音
忙音
空号
被叫可能在通话中
被叫可能设置了呼叫转移,号码可能注销
4G常见告警解析及常用操作
4G常见告警解析及常用操作第一篇:4G常见告警解析及常用操作4G重要告警解析一、影响小区发射的告警1.ReachabilityProblem(基站退服或脱管)λAlarm Code:ReachabilityProblem λ告警影响:eNode B 设备监控失去λ告警原因分析:导致该告警的原因主要体现在三个方面:电源、传输、主控卡(C板)故障: 1)电源:交流停电等,此时应该有相关环境告警上传; 2)传输:传输断3)主控卡故障:主控卡出现掉死、无法正常启动、不断重启等故障;λ告警解决方法:电源或传输问题,请相关人员解决;如果是主控卡故障,需要维护人员上站解决;更换主控卡后,需要先问网管人员要一个Yang WO文件重新下软件并导入WO文件激活。
2.CB INIT FAILURE(C板初始化失败)λAlarm Code:IK4004001 λ告警影响:整站退服,设备可监控;λ告警原因分析:C板故障或者高温导致λ告警解决方法:需上站下电重启设备,或热插拔C板,若故障依旧需要更换C板,更换流程请参考ReachabilityProblem(基站退服或脱管)3.NO CONTACT TO BOARD(B板退服)λAlarm Code:IK4009041 λ告警影响:整站退服,小区不发射;λ告警原因分析:若基站无C板或者GPS告警的话,则是B板故障λ告警解决方法:网管重启基站不管用的话,需要上站更换,更换B板会自动下软件,基站侧不需要做任何操作,大概需要10分钟左右4.LTECellAdminDown(小区退服)λAlarm Code:LTECellAdminDown λ告警影响:相应小区退服;λ告警原因分析:一般都是由于基站硬件告警或者小区被lock所致λ告警解决方法:首先排除小区或基站是否被locked,其次查看是否有导致小区退服的硬件告警5.NO CONTACT TO BOARD(RRH脱离)λAlarm Code:IK4009138 λ告警影响:某个RRH对应的小区不发射λ告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查6.CB LOS LOF CPRIPORT *(某个小区RRH脱离)λ Alarm Code:IK4004030 λ告警影响:对应小区不发射λ告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查7.CB ALL CPRIPORTS FAILED(所有小区不RRH脱离)λAlarm Code:IK4004061 λ告警影响:所有小区不发射λ告警原因分析:造成此告警的原因可能是电源,光纤及RRH故障λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查8.CB TRANS RX LOS CPRIPORT *(某个RRH脱离)λ Alarm Code:IK4004042 λ告警影响:造成此告警的原因可能是电源,光纤及RRH 故障λ告警原因分析:RRH掉电、不加电,RRH掉死,光纤故障,CCM板卡故障等原因都会出现RRH脱离告警;λ告警解决方法:需下站查看电源及RRH和C板连接的光纤衰耗,如果两种情况都正常的话,就要考虑RRH本身的问题了,最好的方法是塔上和别的正常小区做对调来排查;9.CB GPS ANTλ Alarm Code:IK4004082 λ告警影响:GPS时钟不同步,长期告警会造成整站退服λ告警原因分析:GPS天线安装问题或者接头等问题λ告警解决方法:检查GPS天线及各个接头,告警同时会伴随产生以下告警IK4004012,IK4004014,IK4004157(GPS锁卫星失败)10.ANTENNA_PORT TX VSWR THRESH2(2级驻波)λ Alarm Code:IK4011011 λ告警影响:小区不发射λ告警原因分析:天馈接口问题λ告警解决方法:下站基站馈线头是否松动或者进水等等11.ANTENNA_PORT GAIN CONTROL TX(天线口传输主分支增益已经超出范围)λ Alarm Code:IK4011005 λ告警影响:小区不发射λ告警原因分析: RRH硬件故障λ告警解决方法:step1:SAM侧重启该RRH。
网优常见问题处理
应急通信保障方案要点:①、首先确定应急保障区域的大概人数(市场部提供)。
②、按照人数预测产生话务量为每观众话务量(爱尔兰)0.03erl*人数。
③、统计目前应急保障区域覆盖小区(现场测试)。
④、根据现场测试统计覆盖小区的信道配置及最大能承载的话务(参照之前话务最忙时的话务情况)⑤、若现网配置不能满足应急保障区域产生的话务量则尽可能的扩容载频。
⑥、扩容后还是不能满足活动区域产生的话务量则建议增派应急通信车。
⑦、根据话务情况增派应急通信车信道配置,目前应急通信车最大配置为12+12+12,一般分两层UL/OL,OL配置4个GSM900载频、UL配置8个GSM1800载频。
⑧、时时监控话务,若有拥塞小区作话务分担。
道路质量①、勘查道路涉及的基站,路测数据采集、分析。
形成道路覆盖情况图。
②、对信号强度较高而有质差的路段,查看测试LOGFILE,C/I值较低的建议重新规划频点,对于占用某小区信号很强而持续的6、7级干扰,则有可能载频故障或天馈线问题。
③、弱信号质差,则查看周围是否有基站覆盖或是掉站引起,若有基站覆盖则可以调整天线下倾角、增加基站发射功率等增强信号,若现网无法调整解决的则可以建议增加基站覆盖(主要是农村)。
④、弱信号覆盖较多的质差区域则可以通过小区参数、天线调整,确定主覆盖小区,优化道路信号覆盖,理顺切换关系,提高道路通话质量。
差小区处理差小区比例指忙时话音信道掉话率高于3%的小区总数占所有小区总数的比例。
其中小区总数指每信道话务量>0.1爱尔兰的小区处理方法如下:1、首先检查硬件,TCH信道完好率是否100%,若不是100%,则建议基站代维检查硬件。
2、若无硬件故障,则根据STS统计,查看掉话类型,质差掉话多可能是频点干扰或外部干扰,可以通过FAS修改频点或通过RLCRP查看上行干扰情况;弱信号掉话则查看小区附近基站分布情况,检查是否有漏定义切换关系的现象;突然掉话则检查是否有传输误码、天馈线告警、TRA设备故障;3、另外可以通过TS统计查看掉话是否集中某一块载频,排除载频软件故障。
常用网络命令以及常见网络问题分析
• ip层(三层) • netstat -s查看报文统计
• udp层(四层) • netstat -s 查看报文统计
• tcp层(四层) • netstat -s eth0查看报文统计
• 常见问题六:
192.168.1.2 192.168.2.3
route
• 增加一条主机的屏蔽路由
– route add -host xx.xx.xx.xx reject
• 删除一条主机的屏蔽路由
– route del -host xx.xx.xx.xx reject
route
• 增加一条网段的屏蔽路由
– route add -net xx.xx.xx.xx netmask yy.yy.yy.yy reject
ethtool ethx 查看网卡的状态值 ethtool -i ethx 查看网卡驱动版本 ethtool -S ethx 查看网卡的收发统计值 ethtool -s ethx speed 10 duplex full autoneg off 强制模式 ethtool -A ethx 开启网卡的流控
常用网络命令及常见网络问题分析
作者:吴鹏飞
本单元学习目标
学习目标:
1.掌握常用的网络命令 2.掌握常见的网络问题的分析方法
适用对象:
对网络调试感兴趣的开发与测试人员
常用的网络命令
如何使得一台公司设备能够访问外网?
ifconfig
• ifconfig
– ifconfig [ethx]
ifconfig
iptables
• MASQUERADE
– iptables -t nat -A POSTROUTING -o wlan0 -j MASQUERADE
常见告警及详细告警码详解
爱立信LTE无线专业常见告警目录Heartbeat Failure (2)ServiceUnavailable (2)ServiceDegraded (2)Gigabit Ethernet Link Fault (3)Remote IP Address Unreachable (3)Loss of Tracking (4)Network Synch Time from GPS Missing (6)System Clock Quality Degradation (6)PowerFailure (6)LinkFailure (7)LinkStability (7)VswrOverThreshold (8)CalibrationFailure (8)Plug-In Unit HW Failure (9)Plug-In Unit General Problem (9)GeneralHwError (10)HwFault (10)GeneralSwError (10)License Key File Fault (11)LicenseKeyMissing (11)Heartbeat Failure(基站退服或断站) 告警解释:此告警表示基站心跳告警,即基站脱管。
可能原因:(1)DU掉电(2)传输故障(3)DU故障(4)OSS原因(网管)处理步骤:(1)检查电源状态。
(2)检查DU电源接头是否松动,如有松动重做接头。
(3)检查基站传输连接,如有虚接或者尾纤破损则进行重接或者更换。
(4)通知传输检查传输状态。
(5)DU下电重启.(6)更换DU。
(7)配置原因,检查数据原因,回落到割接之前的地址,更换IP ServiceUnavailable告警解释:此告警表示小区服务质量不可用,即小区退服。
该告警为伴生告警,其提示作用。
能够触发该告警的常见子告警为:●PowerFailure(电源故障)●LinkFailure(光路告警)●HwFault(RRU硬件故障)●TemperatureExceptionalTakenOutOfService(RRU高温告警)可能原因:由于该告警为伴生告警,可能原因请参见其伴生的子告警。
常见告警、性能及处理
常见告警、性能及处理在我们日常使用各种设备和系统的过程中,经常会遇到各种各样的告警信息和性能问题。
这些问题如果不及时处理,可能会影响到我们的工作效率、甚至导致严重的后果。
下面,让我们来了解一些常见的告警、性能问题以及相应的处理方法。
首先,来说说网络方面的常见告警和性能问题。
网络连接中断是一个让人十分头疼的问题。
当我们突然无法访问网页、无法收发邮件或者与他人的在线交流中断时,很可能就是网络连接出现了故障。
这时候,我们首先要检查自己的网络设备,比如路由器、交换机等,看看指示灯是否正常。
如果指示灯显示异常,可能是设备出现了硬件故障,需要进行维修或更换。
另外,网络延迟过高也是常见的问题。
当我们在玩网络游戏或者进行视频通话时,如果出现卡顿、画面不流畅的情况,很可能就是网络延迟导致的。
造成网络延迟的原因可能是网络拥堵、服务器负载过高或者本地网络设置问题。
解决这个问题,可以尝试关闭其他占用网络带宽的程序,或者更换网络连接方式,比如从无线网络切换到有线网络。
还有一种常见的网络告警是 IP 冲突。
当多个设备被分配了相同的IP 地址时,就会出现这种情况。
这会导致网络连接不稳定,甚至无法正常上网。
解决方法是手动为每个设备设置不同的静态 IP 地址,或者通过路由器的 DHCP 功能自动分配 IP 地址。
接下来,我们谈谈计算机系统方面的常见告警和性能问题。
系统死机是很多人都遇到过的情况。
电脑突然停止响应,鼠标和键盘都无法操作,这可能是由于系统资源耗尽、软件冲突或者硬件故障引起的。
如果是系统资源耗尽,可以尝试关闭一些占用大量内存和 CPU 资源的程序。
如果是软件冲突,可以卸载最近安装的可疑软件。
如果是硬件故障,可能需要检查硬件设备是否正常工作,或者寻求专业的维修服务。
系统运行缓慢也是一个常见的问题。
当我们打开一个程序需要很长时间,或者在操作过程中经常出现卡顿,这可能是由于系统垃圾文件过多、硬盘空间不足、病毒感染等原因造成的。
各类故障原因分析
各类故障原因分析各类故障告警归类:1)设备、板卡故障:2M头子故障、控制面板、GPS暂时不能锁星,20DB耦合器坏、4G,熔丝烧了2)停电引起:设备供电恢复、空开跳闸、该点业主电力检修引起,现来电后恢复。
学校放假,POP已改停用3)环境原因:微波故障,天气恶劣引起4)不明原因、误告警:闪断告警、瞬断告警、嘉兴信产产生的告警(假告警)、接口无业务、用户频繁注册引起、轮巡后恢复、直放站版本过低。
5)隐性故障重启后恢复:网优重启设备引起、平台刷新后恢复、重新插拔监控卡、拉起后恢复、传输重新倒换电路后恢复正常。
6)工程原因、割接设备:下挂RRU退服引起,现已恢复。
施工队施工引起、电力改造断电、设备拆除、扇区不在使用、电力施工引起停电、离线测试、与联通共站,准备搬迁,POP停用, 设备测试7)室内分布故障:低噪过高引起设备离线8)升级、割接其他工程原因:设备例测引起、TM设备下电退网引起、省公司已删除HSTP到杭州TSH1的信令路由,因此有告警、已不用9)本地光缆的设备、板卡故障:更换整流模块,更换尾纤。
10)接头接触不良:头子松动、2M虚焊、7/8馈线头子故障引起11)2M出租,传输线路故障:2M线断了、传输故障12)13)光缆故障:光缆改道14)光功率异常:光路衰耗告警已恢复正常、经过光路部门处理后到设备尾纤处衰耗为-11db,设备已恢复正常。
15)站点还未开通、工程调测中:站未投点、此站为闭站状态、扇区人工闭塞状态,网优在调整。
16)固网软交换:系统负荷高、系统性能告警故障:话务量承载过高,性能QoS轻微告警,信令负荷性能门限阀值告警,不影响业务,无需处理。
18 系统数据出错:同步当前告警恢复、数据表CRC校验错误,重新校验后正常。
19) 天线问题:GPS蘑菇头松动20)市政、业主:21)(交换)非本端故障:用户关设备引起、参数配置错误引起,对端设备故障。
一、SCTP偶联重传超过阈值——承载网导致的瞬间重传比例增大。
告警分析报告
告警分析报告1. 引言告警分析是指对系统中产生的告警信息进行收集、分类、分析和处理的过程。
通过对告警数据的分析,可以及时发现和解决系统中存在的问题,保障系统的可用性和稳定性。
本报告旨在对系统中的告警进行分析,找出其中的规律和问题,并提出相应的解决方案,以提升系统的可靠性和性能。
2. 数据概览本次告警分析使用的数据集包含了一段时间内系统产生的告警信息。
数据集中主要包含以下几个字段:•告警级别(Level):表示告警的紧急程度,包括严重(Critical)、重要(Major)、次要(Minor)和提示(Warning)。
•告警类型(Type):表示告警的类别,包括网络告警(Network)、服务器告警(Server)、数据库告警(Database)等。
•告警时间(Time):表示告警发生的时间戳。
•告警描述(Description):对告警的详细描述和问题定位。
3. 告警分类首先对数据集中的告警信息进行分类,以了解各类告警的分布情况。
根据告警类型对数据集进行统计,得到以下结果:告警类型告警数量网络告警500服务器告警700数据库告警200其他告警100从上表可以看出,服务器告警是最多的,占据了告警数据集的一半以上。
网络告警次之,数据库告警较少。
4. 告警趋势分析为了了解系统告警的趋势,我们对告警时间进行统计分析,以找出可能存在的周期性问题。
将每天的告警数量进行统计,得到以下图表:![告警趋势图](path/to/image.png)从上图可以看出,系统的告警数量呈现出明显的周期性变化,存在一定的规律性。
在某些时段,例如凌晨和中午,告警数量明显增加,而在其他时段则相对较少。
这可能与系统的负载和用户行为有关,需要进一步分析和调查。
5. 告警级别分布告警级别是评估告警紧急程度的重要指标。
我们对数据集中各级别告警的数量进行统计分析,得到以下结果:告警级别告警数量严重100重要300次要500提示600从上表可以看出,大部分告警属于次要和提示级别,而严重级别的告警相对较少。
常见告警、性能及处理
常见告警、性能及处理一:告警处理1.LOS:信号丢失告警。
表示本端接收不到光信号。
主要引起的原因是①光纤断;②对端发送光信号没有;③本端光收模块坏。
处理方法:①先将本端用一根光纤自环,若告警消失,表示本端是好的,问题在对端。
若对端自环也好,则可以肯定两端间光纤的断了;若对端自环不好,也是LOS告警,用光功率计测量其光发功率,若功率过小(-50dB或更低)则可断定光发坏了;若功率正常,则是由于没有时钟引起的,换掉时钟板,告警消失。
②若本端自环还是LOS告警,则是由于光收模块坏了,更换后告警消失。
2.LOF/OOF:帧丢失、帧失步告警。
原因和处理同1。
帧失步:连续5帧以上,找不到正确的A1、A2,则进入帧失步状态。
帧丢失:如果OOF状态持续一段时间,则进入帧丢失状态。
3.MS-AIS:该告警是伴随着远端LOS/LOF出现而出现的,或者从网管上插入该告警。
处理方法:①若本端自环也有该告警,则更换光板。
②本端自环是好的,对端又没有LOS告警,则可能是网管上插入了AIS告警,从网管上将插入AIS操作取消,若此处理不消除告警,则更换远端光板。
③若远端有LOS告警,则按1将LOS告警消除。
4.MS-FERF/RDI:复用段远端接收故障。
产生原因是由于远端有LOS、LOF、MS-AIS告警引起的。
处理方法:按1、2、3方法消除远端告警则可。
实际工程中,我们经常遇到这样的情况:5.B1、B2、B3信号劣化告警。
原因:光板接收光功率过强或过弱,或系统本身所有。
处理方法:将本端自环,适当调节光纤插入深度,若告警消失,则是由于光功率过强或过弱引起,过强加衰减,过弱将光纤洗干净,法兰盘连接处拧紧或换光发功率强的光模块;若不是光功率引起的,则是光板或时钟板所致,更换光板或时钟板则可(误码性能的参数意义见后面详细介绍)。
6.LOM:复帧丢失。
原因:通常由对端交叉板引起。
处理方法:①更换对端交叉板则可。
②检查背板是否断针。
③交叉板是否插好。
中级培训第一模块之五常见指令及告警分析ppt课件
常用指令及告警分析
❖输出BSC级当前告警:ZAHO:;BSC当前告警 ❖输出BSC级历史告警:ZAHP:;
中国移动通信集团网优专家小组
常见告警分析
借助S11.5 NED进行告警分析和问题定位
MML Alarm
info
BSC10_FY BCF-007 BTS-019 ENVIR 2003-02-08 16:16:54.63
See the document Alarm Structure, Alarm Reference Manual Instructions Check the operation of the AFE unit, antenna, and cabling between the AFE unit and antenna. Replace the faulty unit. The alarm level is adjustable in the HW database. Cancelling Do not cancel the alarm. The system cancels the alarm automatically when the fault has been corrected.
123456
1) rack (cabinet) number 4) type of unit
2) shelf number
5) unit number
3) slot
6) subunit number
Refer to S11.5 NED Chapter 2.5 Alarm Reference Manual for details !!
中国移动通信集团网优专家小组
网管统计报告及内容简介
基站常见告警说明及处理
12
7745告警
13
处理7745(CHANNEL FAILURE RATE ABOVE DEFINED THRESHOLD)告警的办法及建议-3
18
处理7746 (CH CONGESTION IN BTS ABOVE DEFINED THRESHOLD)告警的办法及建议-1
告警的含义:
基站中由于拥塞被拒绝信道占用的请求与所有信道请求之间的比例超出定义 的告警门限。该告警用来监控基站的话务量。
拥塞对象:
01=SDCCH 02=TCH 03=扩展小区SDCCH 04=扩展小区TCH
如果发现小区拥塞,首先要查看硬件告警,检查小区每线话务量,确定 是否基站故障导致拥塞。
对于拥塞小区解决办法只有两大类:
① 降低小区吸收的话务量。 ② 增加小区承载能力。
21
处理7746 (CH CONGESTION IN BTS ABOVE DEFINED THRESHOLD)告警的办法及建议-3
基站常见告警说明及处理
1
告警影响
在GSM网络系统中,数量最多的网元是基站,出现故障最多的也是基 站。而基站工作性能的好坏直接影响整个网络的整体质量。基站的各 种软硬件故障直接影响多项网络指标,如掉话率、接通率、载频完好 率,切换成功率及TBF掉线率等。基站在网络中起着重要的作用。网 络优化是在整个网络相对稳定的情况下进行的,因此关注基站工作状 态也是网优的日常工作之一。
9
处理7607 (TRX OPERATION DEGRADED) 告警的主要方法-2
网络设备中常见术语含义及故障分析
电子知识网络设备(24) ----CRCError:----含义:指示在数据传输中有坏帧出现。
坏帧将被丢弃,并通过高层协议而重传。
----原因:通常因电缆或网络硬件错误、环境噪音造成。
如网卡硬件错误,劣质电缆。
----解决方法:更换网络硬件或避开周围的环境干扰源。
----ShortFrame:----含义:说明设备端口有小于最小的帧长(64byte)的帧被接收并且该帧有错误。
----原因:由于受到噪音干扰、电缆错误及落硬件错误。
如果经常发生,须应予以解决。
----解决方法:更换网络硬件或避开周围的环境干扰源。
----Fragment:----含义:具有坏帧或CRC错误的小于64byte的数据包。
----原因:网络负担过重,起多是因网络冲突造成。
----解决方法:网络负担过重而造成网络冲突,应该采用交换设备或分割网段。
----Alignment:----含义:被接收的帧有重组错误。
帧重组错误是大于64byte的有CRC错误的帧且在长度上不是整数位(帧的位数不能被8整除)。
----原因:多是因电缆或收发器错误或是由于连接的速率不匹配。
----解决方法:有帧重组错误,其将被丢弃而重传,这样将严重影响网络性能,所以应该予以重视。
更换收发器或收发器电缆,调节网线两端设备的速率。
----RuntFrame:----含义:小于最小帧长度(64byte)并且具有正常FCS的帧。
----原因:多是由于网络冲突造成。
当网络冲突消失后其也消失。
----解决方法:如果有该类型的数据帧不断出现,应该采取措施减轻网络负担。
----LongFrame:----含义:指大于1518byte而小于6000byte的帧。
连续多的长帧影响网络性能,并且可能导致网络传输中断。
----原因:工作站传输长帧是由于硬件或软件错误造成。
与之相近还有“VeryLongs(也叫giants)”,其表示有大于6000字节的帧出现。
造成的原因与之类似。