排除华为OLT PON口下的业务上行网速慢的故障案例
华为GPON设备ONU常见告警及处理
华为GPON设备ONU常见告警及处理随着GPON方式接入的逐步应用,GPON设备的维护工作也开始进入维护日程,了解GPON设备的故障处理方法,掌握维护技巧,势在必行,结合平顶山管内移动GPON设备的维护及铁通GPON设备的维护工作,对发生的故障进行整理分类,并得出一点维护心得:1、设备掉电告警名称:ONT掉电(DGi) 告警描述:OLT接收到ONT的掉电消息时发生此告警,OLT在测距阶段接收到ONT的PLOAM消息时告警恢复,发生此告警时ONT下线。
告警原因:ONT电源出现异常修复建议:检查ONT电源,保证ONT电源正常工作2、光信号丢失告警名称:ONT信号丢失(LOSi)告警描述:OLT连续几帧无法收到ONT有效的光信号,ONT下线,业务中断告警原因:(1)光通路质量差(2)光衰减不正常(3)ONT发生异常修复建议:(1)依次检查分支光纤连接和主干光纤连接,清洁光纤接头,必要时更换光纤(2)保证光路的光衰减正常(3)可能是ONT异常,复位该ONT3、主干光路告警告警名称:OLT GPON光信号丢失(LOS) 告警描述:OLT连续多帧收不到任何光信号,PON口下所有ONT下线告警原因:(1)光通路故障(2)PON口激光器没有被打开修复建议:(1)依次检查主干光纤连接和分支光纤连接,清洁光纤接头,必要时更换光纤(2)检查PON端口激光器是否打开,如果没有打开,打开激光器(3) OLT光模块松动或未插到位,重新插拔,并确认链接良好。
4、出现流氓ONT告警名称:端口下存在非法入侵的流氓ONT告警描述:端口下存在非法入侵的流氓ONT,可能阻断其他ONT的业务告警原因:端口下存在非法入侵的流氓ONT 修复建议:人工排查非法入侵的流氓ONT,然后替换它在OLT上查看告警的命令式display alarm history all。
如果对英文命令不好理解的话可以转换成中文switch language-mode目前维护中遇到的告警大都是常见告警,要么设备掉电,要么光路不好,很常见,只要电源和光路及时恢复,设备告警就会清除,业务就能恢复;不常见的是PON口下出现流氓ONU,这个不好处理,得逐一排查,在分光器侧逐个拔插跳纤,然后在OLT上观察告警的消除情况,拔掉一根跳纤,观察一下告警是否消除,直到告警消除,判断最后拔的那个跳纤连接的ONU就很有可能是故障设备,关闭电源重启看是否能恢复,最好是设备更换来解决。
华为OLT故障处理经典案例分析
华为OLT故障处理经典案例分析作者:严娟来源:《硅谷》2012年第24期摘要:在OLT日常维护工作中,用户系统的故障所占比重最高,引起用户系统的故障原因有很多,现象也不尽相同。
本文通过案例详细介绍了OLT的故障原因和处理流程。
关键词:华为OLT、故障处理、忙音2012年9月,武广OLT下挂的ONU广州北站发生了一次故障,此故障的处理过程几乎囊括了OLT故障处理的所有手段,是OLT故障处理的一个典型案例。
现象描述:广州北站ONU第一条电路PCM告警,本室做2M环回,OLT侧正常。
打直2M后,告警消失。
第二天,又发生相同告警,检查发现2M头虚焊,重做2M头告警消失。
PCM告警消失后,工区反映所有电话呼入呼出都忙音。
对于OLT单个用户故障,一般从三个方面入手:1、外线故障。
在机房MDF架甩开外线,插上话机听是否正常,如正常便是外线原因。
2、硬件故障。
ASL板故障、PV4板故障、PWX板故障、时钟问题以及用户话机故障。
因为是单个用户出现问题,所以一般不可能是整块板及时钟问题,大都是ASL板上相应的端口问题或话机问题。
3、数据设置错误。
用户数据由交换机侧设置,检查用户数据即可。
大面积用户故障,主要有三种:1、网管维护系统中,半框或整框单板呈现为红色故障态。
故障原因包括:数据设置错误,传输问题,PV4板硬件故障。
2、半框或整框用户板故障,但PV4板正常。
故障原因包括: 2M收发接反,或把到其它框的2M接到了故障框。
3、忙音现象。
故障原因有四种:(1)用户过多,话路不够分配。
一个ONU两条2M,可以满足60个用户同时提机通话,按照收敛比1:4,可以安装240个用户。
超过240个用户,可能会有忙音现象出现。
这个问题通过扩容便可以解决。
(2)2M链路硬件故障。
由于2M链路连接不好,引起2M链路物理层的故障。
观察网管是否有线路告警,通过逐段环回等操作定位。
(3)2M链路正常,但是呼叫时隙分配到该链路时不能通话。
可能是由于2M链路连接交叉错位引起(俗称鸳鸯线),通过维护台发起链路身份标识,便可验证是否鸳鸯线。
光模块故障导致LTE上行速率不达标案例.
查证处理査证投诉区域LTE基站无告警情况正确预处网管话统数据分析方法客户心理客户提出语音、数据业务无法正常使用,认为是移动LTE网络问题导致。
分析投诉处理用户信号正常,上传速率低。
难点1.问题现象RSR P/SINF良好的情况下,上行速率不达标。
2.问题描述在某地业务优化测试过程中发现,在其覆盖区域内RSRP/SINF良好的情况下,上行速率不达标,且存在处理技巧分析较高的误码率;具体如下图一所示。
K IKMC SMWyn^却Wn VTM3C_AHnIP^A4#IH.i=FK5W»TMttrfiViktf107 Cfl&ABaPwwa <MSn 冋A55JPUCCHTi PwiRI5CMTI Pw=^CHPWI心T1如申,HTI I jlint # eanaUter E A WO*3WMhJ11715510 in as IS]帝cE祐-F亦i:頁■赢万1 Cvntd 叱Th 板y 5W53 PtfVTirB<1k*s / ・时01! \31- 1S 16 1?2T aF Efl 21 Et1 勢fc llw 72 ■« 1 片如10图一、T QB JLLCuriCrFirViIJL印叭w VIIJLPW T血TOJ»Ji飓她______________ 轧fiLLBlZREI W !盪码宰iV币融ii讦慎.”杏$狞MasrpDLgxiSm〉znn.聞W T代ZHIn.Fw 叶* 妣«? 1QCLCUD=rt|11!2 IJ IS ItMl22Z?QRK4EZPW|■ «■ •zc二MIt2止匚_■7 I -uj.™t 竺421:;3.问题分析UE占用某室分小区,在前台可以看到当前无线信号覆盖情况良好看到PRB调度情况为满调度,但是RSRP=-69dBm SINR=39dB 同时可以UL MSC只占用到20,且误码率高达11%;按往测试经验,只占用到24的比例在10%以上,且低误码率时,上行速率就能达到码率,导致UL MSC占用不满,从而导致上行速率不达标。
中国移动PON网络维护优化案例
中国移动PON网络优化案例烽火通信科技股份有限公司二○一○年十二月目录前言 (4)第一章PON网络组网模型 (5)1.PON网络上联IP城域网组网模型 (5)1.1光缆单路由直连IP城域网节点 (5)1.2光缆双路由连IP城域网节点 (6)1.3光缆双路由连IP城域网双节点(双上联) (7)1.4通过PTN网络SNCP保护方式上联IP城域网 (8)1.5通过城域波分网络波道保护方式上联IP城域网 (8)2.PON网络组网模型 (9)1.6无保护方式 (9)1.7TYPE B方式组网 (10)1.8TYPE C方式组网 (11)第二章网络优化的目标和范围 (13)2.1网络优化的目标: (13)2.2优化的范围: (13)第三章网络优化的原则及典型案例 (15)3.1 PON网络优化原则与建议 (15)3.1.1组网优化原则 (15)3.1.2驻地网优化原则 (15)3.1.3光缆网优化原则 (15)3.1.4设备配置优化原则 (16)3.1.5 VLAN、IP地址优化原则: (16)3.1.6GEMPORT流限速与QOS规划建议 (17)3.1.7 PON网络用户接入要求 (17)3.1.8网管系统的优化建议 (18)3.2PON网络优化应用案例 (18)第四章软件管理办法 (19)第五章PON网络备件配置原则 (21)第六章维护人员技术要求 (23)第七章应急方案的制定与演练 (25)前言中国移动进入全业务运营时代,大量的中小企业和家庭客户对宽带上网提出更高的需求。
中国移动为顺应这些需求,推出了以为PON网络接入为主的宽带接入业务,目前业务在快速发展之中。
各地的网络发展迅速,组网方式千差万别,如何让这些网络尽量的提供安全、稳定的服务?如何让我们的PON网络具有相对的灵活性、一定的前瞻性和一定的创新能力?如何提高维护的高效率?带着这些问题,我们提出了对网络及维护进行优化,指导各地根据本地的实际情况来优化宽带接入网,力争做出精品网络,在市场竞争中取得更加优异的成绩,在客户中建立良好的口碑。
FTTx产品故障案例集和FAQ(V1[1].3)-C
1.典型故障案例 (1)1.1.TC-C6002 光纤接头不匹配导致ONT无法注册 (2)1.2.TC-C6007 电压不稳定导致ONU反复上下线 (3)1.3.TC-C6008 接收光功率过大导致OLT产生信元告警 (4)1.4.TC-C6021 OLT设臵了告警屏蔽导致复位ONT没有告警记录 (6)1.5.TC-C6120 光信号太强导致同一个PON端囗下大量用户拔号错误678的问题 (8)2.上网业务典型故障案例 (9)2.1.TC-C6031 OLT与对端设备的链路聚合配臵不一致导致用户有时打不开网页 (9)2.2.TC-C6118 上层交换机QoS策略设臵不当导致ONT下接网吧用户时延大 (11)3.语音业务典型故障案例(VoIP) (12)3.1.TC-C6005 线缆破损导致语音用户摘机无拨号音 (13)3.2.TC-C6033 配线架接触不良导致语音用户摘机无馈电及拨号音 (14)3.3.TC-C6013 承载网配臵了ACL导致语音业务出现单通 (16)3.4.TC-C6003 外线受到外部干扰导致摘机听到广播的声音 (17)3.5.TC-C6063 链路聚合配臵问题导致OLT下接MxU语音业务异常错误!未定义书签。
4.其他典型故障案例 (18)4.1.TC-C6016 OLT与交换机LACP配臵问题导致对接不成功 (18)4.2.TC-C6024 TOPA单板的跳线设臵问题导致无法支持长距的E1线缆 (20)4.3.TC-C6131 上行接口环路导致OLT下专线业务中断 (22)5.FAQ (24)5.1.OLT设备有那些版本查询命令 (25)5.2.设备root用户密码丢失如何处理 (27)5.3.如何查询和修改ARP老化时间 (28)5.4.ETHB做MA5680T/MA5683T上行板使用时需要注意什么 (29)5.5.如何设臵主控板SCUN面板上的接口为上行口 (29)5.6.TOPA单板可以支持那些扣板 (29)5.7.DBA限速的时延与用户报文大小有什么关系 (30)5.8.MA5680T/MA5683T的PON口多长时间接收不到光信号后就会上报LOS告警315.9.FAQ-怎么简要并且精辟的概括DBA原理 (31)5.10.FAQ-为什么离OLT最远和最近的ONT之间的距离差值限制在20KM范围内325.11.FAQ-为什么配臵GPON业务时无法为新增的ONT的TCONT绑定DBA模板325.12.FAQ-在OLT上是否可以通过ont modify 命令修改ONT的密码 (33)5.13.FAQ-目前华为GPON相关产品OLT和ONT的PON口收光灵敏度以及发光功率的范围分别是多少 (33)5.14.FAQ-光接入中的功率损耗点损耗多少光功率 (33)1.典型故障案例从故障现象、可能原因、处理步骤、建议总结等几个方面,介绍FTTx组网场景下典型故障的实际排障过程。
上行接口环路导致OLT下专线业务中断案例
上行接口环路导致OLT下专线业务中断一、问题描述MA5680T下静态专线业务全部中断。
二、原因分析:1、ONU故障无法学到MAC地址。
2、OLT PON单板故障。
3、用户端问题。
4、设备存在环路。
三、故障处理过程1、更换下挂ONU,ONU注册正常,业务依然故障。
排除ONU问题。
2、将ONU更换到其他槽位,故障依旧。
排除OLT PON单板问题。
3、更换用户端电脑,故障依旧。
排除用户端问题。
4、在OLT上检查用户MAC地址是否在其他端口学习到,操作步骤如下。
(1)使用display mac-address port 0/3/1命令查看用户MAC 地址(故障用户所在端口为0/3/1,ONT ID为8)。
(2)使用display location 001d-609d-e770命令查看用户MAC 地址所在端口(故障用户MAC地址为001d-609d-e770)。
发现上行口0/19/0也学习到了用户MAC,且上行口的VLAN ID为1。
定位到问题原因为上层设备在VLAN 1中存在环路。
5、消除环路的方法是将OLT的上行口从VLAN 1中删除,阻止VLAN 1透传,并且将上行口的native-vlan改成其他VLAN ID。
由于VLAN 1作为默认Native VLAN无法在上行口直接删除,需按照以下步骤操作。
(1)使用vlan 101 standard命令新增一个VLAN作为上行口的Native VLAN。
(2)使用port vlan 101 0/19 0命令将VLAN 101增加到0/19/0,使带VLAN 101的报文能通过0/19/0上行。
(3)使用interface giu 0/19命令进入GIU模式,使用native-vlan 1 vlan 101命令在0/19/0的native-vlan中增加VLAN 101。
(4)使用quit命令退回全局配置模式,使用port vlan 1 0/19 0命令从0/19/0的native-vlan中删除VLAN 1。
OLT故障排查报告
GPON故障排查报告故障原因:机房内GPON OLT(7342 FTTU Meta)第一块业务板以前出现频繁吊死,业务板卡型号为OGPT-A,此业务板下现在已经下挂了十几台ONT,之前出现用户本地连接X掉,原因是ONU吊死后重启的原因。
当时检查是电源电压使得背板出现故障,后来更换了机框和业务板,业务恢复。
通过将背板送到上海维修部返修,发现机框背板有三个针孔出现轻微的弯曲,经过测试发现背板出现接触不良。
进而导致业务板频繁出现吊死。
更换过后一个月左右,也就是6月21日,用户板再次死掉,工程师上站观察PON板吊死,通过更换板件暂时恢复业务。
为了查明设备故障原因,我们专门安排人员上站做详细的检查:下面是上站检查的相关信息:OLT机框的检查:对可能松动的板件进行逐一的检查和确认,没发现松动的板件。
机房设备安装情况:由于直流电源柜没有接线端子了,当时安装时县局要求和另一台设备并用一个电源端子,同时跟另外一台设备共用一个熔丝开关,我们对电源做了长达6小时的测量,电压都在-53.6V左右变化,室内温度是24℃,属正常范围,同时对接地也做了详细的检查。
下面是图片:OLT电源和另外一台设备并用电压电流监控记录:OLT机柜接地,符合接地的标准。
通过连接到软件查看设备运行状态:/* rtrv-eqpt::all */"P-OLT:LEUS,LEUS::,""RACK-1:ALTR-A,ALTR-A::,""SHELF-1-1:OFXS-B,OFXS-B:SHELFCLASS=MAINETHERNET:IS-NR,""NTA:OANT-A,OANT-A::IS-NR,""NTB:OANT-A,EMPTY::OOS-AU,UEQ""LT-1-1-1:OGPT-A,OGPT-A:SWOVERRULE=NOOVERRULE,LSMPWR=UP:IS-NR,""LT-1-1-2:OGPT-A,OGPT-A:SWOVERRULE=NOOVERRULE,LSMPWR=UP:IS-NR,"查看软件版本:< RTRV-MEM::OSWP-1;IP 0<AF-NH-OLT-7342 11-06-23 21:29:17M 0 COMPLD/* RTRV-MEM::OSWP-1 */"OSWP-1:ML3NAJ46.830,OLTCORE,M18PAA46.005,A V AILABLE,GLT4-A""OSWP-1:ML3NAJ46.830,OLTCORE,M18PAA46.005,A V AILABLE,OGPT-A""OSWP-1:ML3NAJ46.830,OLTCORE,M3C5AA46.830,A V AILABLE,GLT4-A""OSWP-1:ML3NAJ46.830,OLTCORE,M3C5AA46.830,A V AILABLE,OGPT-A""OSWP-1:ML3NAJ46.830,OLTCORE,M3Q9AA45.001,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,M3RGAA46.001,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NA34AA45.002,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NDG2AA45.600,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NDG4AA45.600,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJC7AJ46.830,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJC8AA46.502,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJC9AJ46.003,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJDCAJ46.830,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJDDAJ46.830,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJDEAJ46.830,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJDGAJ46.015,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJYQAA46.002,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJYQAB46.002,A V AILABLE,OANT-A""OSWP-1:ML3NAJ46.830,OLTCORE,NJYQAC46.002,A V AILABLE,OANT-A" ;查看系统告警信息:AF-NH-OLT-7342 11-06-23 22:06:45M 0 COMPLD/* RTRV-ALM-ALL */"NTB,EQPT:MJ,BDMISSING,SA,,,,:\"Board planned / once detected / now missing\"""SHELF-1-1,EQPT:MN,FA,NSA,,,,:\"Fuse alarm - power fuse blown\"""NTA,EQPT:MN,LANXLINKFAIL,SA,,,,:\"LANX peer-to-peer link failure on this unit and/or on peer unit\"""PON-1-1-1-2,PON:MN,NEWONT,NSA,,,,:\"SERNUM =ALCLF8A3E9FC, SLID =DEFAULT,\""通过当时登陆OLT检查的结果:软件,数据,告警在观察的期间均无发现异常的情况,设备运行正常。
关于PON网络故障典型案例
关于PON网络故障典型案例目录1、华为PON网络典型故障案例 (2)1.1、B类ONU上行VLAN透传问题 (2)1.2、ONU参数设置问题 (5)1.3、B类ONU更换PON口 (8)2、阿尔卡特PON网络典型故障案例 (13)2.1、OLT上联口故障 (13)2.2、ONU端口异常 (20)1、华为PON网络典型故障案例1.1、B类ONU上行VLAN透传问题故障描述:接到电话保障一个B类ONU无法上网,网管检查该ONU 状态正常,(该ONU有两个上联口,尾纤接1口时ONU无法登陆,接2口时ONU正常登陆)业务配置正常,ONU上能识别到网口下带电脑的MAC地址,但在OLT上查询不到该MAC地址。
故障诊断:定位及处理过程:1、检查该B类ONU状态正常,无任何异常告警。
2、与现场核对CVLAN,SVLAN与网管上配置一致,检查OLT上service port、线路模板配置正常,检查ONU上service port,以太网端口设置均正常。
3、联系现场,把手提电脑接到对应的网口上,长PING网关。
在网管上,进入ONU的命令行,观察该手提的MAC地址能透传上ONU。
4、进入OLT的命令行,查询不到该MAC地址。
5、双击ONU进入网元管理器,检查VLAN是从0/0/1口透传到OLT 的,而状态正常且在用的是0/0/2口,于是把0/0/2口增加到VLAN 的端口列表中。
6、进入OLT的命令行能够查询到该MAC地址,现场反馈业务正常。
分析情况:1、display mac_address port 0/1/1 查看ONU能否获取手提上的MAC地址。
截图012、display vlan xxx 查看vlan是通过哪个上联口向上透传截图02通过截图看出vlan是从1口向上透传的,而现场在用的是2口。
3、display board x/x 查看板卡上端口的状态。
截图03故障分析为1口是DOWN的,2口为UP的。
VLAN无法从1口透传上去。
华为基站故障处理实例
5.2.3华为基站故障处理实例1. 天馈连接鸳鸯线导致扩容载频后话务量减小现象描述:反映某 312 基站第二小区话务量减小,该站话务量减小是从扩容后,原来是一个载频,采用一个 CDU ,扩容后加了一块载频,同时将 CDU 更换为 EDU ,至此话务量急剧下降,连续 3 天话务量不足原来的 1/4 ,用户怀疑是覆盖范围减小。
告警信息:在告警台中观察不到任何关于该基站的告警,单板指示灯和运行状态均正常。
原因分析:由于用户增加了一块载频,该基站下的四块载频变为五块,但是 PSU 单板只用两块,所以初步分析可能由以下原因造成话务量减小:1 ) PSU 单板不够用,由于每两块 TRX 需要一个 PSU ,所以有可能是这个原因所致;2 )新更换的 EDU 有问题;3 )扩容时连接跳线时接头没有连接牢靠,造成驻波比过大;4 )小区的天馈连接错误。
处理过程:现场检查数据,没有任何问题,观察话统,发现的确从扩容后话务量就一直维持在 1ERL 左右,没有异常告警。
到达现场后加入一块 PSU 板,通过话统对该小区进行测量报告数量的测量,发现很少,话务量没有提高,将 1 、 2 小区的 EDU 更换,现象依旧,仔细检查 TRX 和EDU 之间的连线,也没有错误,又检查天馈连线,发现第二小区的 EDU 的第二个发射端口 TX/RX_ANTB 错误的连接到第一小区天线的发端口,这样以来,第二小区的 BCCH 和 TCH 是通过不同的天线发出去的,造成可能指配信道所在的载频信号很弱,进而发生切换或掉话,切分集接收也不正确,所以造成该小区吸收不了话务量。
将小区天线重新连接,二小区的话务量立刻提升了。
建议与总结:扩容,更换硬件时一定要信心连接线缆,避免连成鸳鸯线,交叉线,如果连接错误通常不会产生告警,故障比较隐蔽,同时会造成一些切换,掉话,话务量上不去的现象。
2. 数据配置不当导致 BTS3006A 在市电掉后出现非主 BCCH 载频退服现象描述:某基站业务信道可用率突然下降,严重影响了考核指标。
知识库-PON上行设备现网排障
案例名称:PON上行设备现网排障录入人员:郑洁录入单位:NOC传输与接入网录入时间:2012.9.5接入方式:FTTH 业务:注册、上网、IPTV用户类型:公客故障现象:PON上行设备注册不成功、不能上网、IPTV卡屏、魔屏无法收看直播IPTV等故障处理过程:1、首先将PON上行网关和外置AP的软件版本升级至网运部发布的最新版本,并确认无线路连接错误。
贝尔网关的最新版本为1.5S(固件版本为E230)烽火网关的最新版本为rp0100,后续会更新版本rp0101(10月初发布)中兴网关的最新版本为V3.30.10T4贝曼AP的最新版本为1.1o2、注册认证失败失败原因一:认证方式错误其他现象:OLT认证失败正确处理:若为SN认证,则应使用SFU+LAN上行设备进行安装;若为LOID认证方式,则应使用PON上行+外置AP设备进行安装;失败原因二:光线路存在问题其他现象:LOS灯红灯闪烁正确处理:请使用用光功率计检查线路;失败原因三:数据配置错误其他现象:网络E常亮,TR069属性WAN连接未获得地址;正确处理:咨询NOC帮助解决失败原因四:ITMS侧工单逻辑ID错误其他现象:网络E常亮,TR069属性WAN连接获得地址;正确处理:咨询信网部帮助解决贝尔网关注册页面:显示注册超时贝尔网关注册页面:显示宽带帐号不存在烽火网关注册页面:卡在20%中兴网关注册页面:“正在注册,请等待”中兴网关注册页面:“注册成功,正在下发业务,请等待”华为网关注册页面:卡在30%的注册界面3、上网出现问题失败原因一:预付费用户未完工其他现象:网络12小时断线一次正确处理:工单完工;失败原因二:数据配置错误其他现象:PPPoE拨号不成功;正确处理:把PON设备改为桥接模式,PC使用测试帐号进行拨号,若为密码错误,则进行手动修改,若为BRAS端口绑定错误,则咨询NOC帮助解决失败原因三:外置AP在网关DHCP服务启动前为下行设备分配了IP地址其他现象:有线可上网,无线无法上网,无线设备获得的地址的网关为192.168.1.254 正确处理:升级外置AP,上网设备重新获取一次地址;失败原因四:公网接入数受限其他现象:部分终端可上网,部分终端不可上网临时解决方案:通过ITMS平台对网关中的参数进行修改,将限制数值改大。
华为ONU故障案例分析
华为ONU5620设备故障案例分析故障现象:用户电话3982918不通,无法上网,网管管理不到ONU设备。
处理过程:1、在OLT上查看ONU设备信息PDS-PingDong-MA5680T(config)#inter epon 0/2 进入PON板查看ONU的状态MA5680T(config-if-epon-0/1)#display ont info 4 0 非断电下线查看ONU收光功率MA5680T(config-if-epon-0/2)#display ont optical-info 4 0 (4是端口号 0是ONU id 号)收不到光2、现场查看设备电源正常光信号指示灯LINK灯灭,用PON光功率计收不到光,确定光缆断。
3、光缆修复后,设备可以管理到,但电话和宽带仍然不同登录到ONU重启设备Reboot system 重启设备后故障依旧在OLT上查看ONU设备信息PDS-PingDong-MA5680T(config)#inter epon 0/2查看ONU收光功率MA5680T(config-if-epon-0/2)#display ont optical-info 4 0 (4是端口号 0是ONU id 号)收光正常查看ONU的状态MA5680T(config-if-epon-0/1)#display ont info 4 0 在线,各项正常查看OLT上ONU配置信息Disp service-port 0/2/4Disp service-port 0/2/4 ont 0 (0/2/4是框号/槽号/端口号 0是ONU id)正常查看PON口用户MAC情况MA5680T (config)#display mac-address port 0/2/4 (0/2/4是框号/槽号/端口号)用户VLAN 256-1299同时绑定在上联PON口,无法区分同时与软交换机房联系,查看用户3982918数据。
华为交换机故障排查案例
华为交换机故障排查案例华为交换机是一种常见的网络设备,用于在计算机网络中传输数据。
然而,由于各种原因,交换机可能会出现故障,导致网络中断或性能下降。
下面列举了一些华为交换机故障排查案例,希望能对读者有所帮助。
1. 网络中断:当网络中断时,首先要检查交换机的电源是否正常,以及是否有任何硬件故障。
如果电源和硬件都正常,则可能是由于配置错误或软件问题导致的。
此时,可以通过查看交换机日志来查找问题,并尝试重新配置交换机。
2. 性能下降:如果网络性能下降,可能是由于交换机的负载过高或网络拓扑不合理导致的。
可以通过查看交换机的流量统计信息来确定是否存在负载过高的情况,并尝试优化网络拓扑以提高性能。
3. VLAN故障:VLAN是一种逻辑分区技术,用于将交换机划分为多个虚拟局域网。
如果VLAN无法正常工作,可能是由于交换机端口配置错误或VLAN故障引起的。
可以通过检查端口配置和VLAN设置来解决问题。
4. STP故障:STP(Spanning Tree Protocol)是一种用于防止网络环路的协议。
如果STP无法正常工作,可能会导致网络中断或性能下降。
可以通过查看交换机的STP配置和状态来确定是否存在STP故障,并尝试重新配置或调整STP参数。
5. 电力故障:如果交换机无法正常供电,可能会导致整个网络中断。
可以通过检查交换机电源和电缆连接来确定是否存在电力故障,并尝试修复或更换故障设备。
6. 网络攻击:如果交换机遭受网络攻击,可能会导致网络中断或性能下降。
可以通过检查交换机的安全配置和日志来确定是否受到攻击,并尝试加强安全措施以防止类似攻击再次发生。
7. 端口故障:如果交换机端口无法正常工作,可能会导致网络中断或性能下降。
可以通过检查端口状态和配置来确定是否存在端口故障,并尝试重新配置或更换故障端口。
8. 路由故障:如果交换机无法正确路由数据包,可能会导致网络中断或性能下降。
可以通过检查交换机的路由表和路由配置来确定是否存在路由故障,并尝试重新配置或调整路由参数。
光模块故障导致上行速率不达标案例
光模块故障导致上⾏速率不达标案例光模块故障导致上⾏速率不达标——某室分问题现象:测试⼿机:HW E5776终端类型:Cat4问题现象:RSRP/SINR良好的情况下,上⾏速率不达标。
问题分析:问题描述:在某地业务优化测试过程中发现,在其覆盖区域内RSRP/SINR良好的情况下,上⾏速率不达标,且存在较⾼的误码率;具体如下图⼀所⽰。
图⼀、问题分析:UE占⽤某室分⼩区,在前台可以看到当前⽆线信号覆盖情况良好RSRP=-69dBm,SINR=39dB,同时可以看到PRB调度情况为满调度,但是UL MSC只占⽤到20,且误码率⾼达11%;按往测试经验,UL MSC只占⽤到24的⽐例在10%以上,且低误码率时,上⾏速率就能达到8M以上。
因此初步怀疑由于⾼误码率,导致UL MSC占⽤不满,从⽽导致上⾏速率不达标。
造成上传不达标原因⼤致可分为以下⽅⾯:1、配置参数不合理。
2、服务器故障。
3、上⾏存在⼲扰。
4、RRU存在故障。
5、线路存在故障。
问题处理处理步骤:1、后台检查相关参数设置未发现异常,排除参数故障。
2、服务器到其它正常站点测试,上传正常;排除服务器故障。
如下图⼆、图三所⽰:图⼆、同⼀个服务器某室分上传测试图三、同⼀个服务器另外某室分上传测试3、后台查上⾏⼲扰⽆问题,断开室分系统WLAN、更换合路器天线底下测试;⼩天线直接接合路器测试及RRU直接接⼩天线多⽅⾯测试,上传还是不达标,初步排除系统上⾏⼲扰故障。
如下图四、图五、图六所⽰:图四、断开室分系统WLAN、更换合路器天线底下测试图五、⼩天线直接接合路器测试图六、RRU直接接⼩天线测试4、更换新的RRU后、RRU直接接⼩天线测试上传,上传仍然不达标,初步排除RRU故障。
如下图七所⽰图七、更换新的RRU后、RRU直接接⼩天线测试经上述排查,初步定位问题出在BBU与RRU之间接线或BBU存在故障。
因此对BBU与RRU之间的光模块及尾纤进⼀步排查,排查发现,RRU与BBU之间连接的光模块型号及⽣产⼚家不⼀致。
华为OLT3个故障案例分析
与华为OLT有关的三个故障案例分析案例一、门楼张5616增加宽带板故障现象:门楼张需扩一块32线宽带用户板,管理不通,业务正常。
处理过程:1、管理不通排查登录到门楼张需扩板子的设备不通,登录到另一台设备正常。
登录到OLT上:Int epon 0/1Disp ont info 2 1 查看,ONU正常在线Disp ont snmp-profile 2 0Disp ont snmp-profile 2 1 比较两个ONU管理模版,一致Disp ont ipconfig 2 1 查看管理地址地址 121.7.134.37,掩码 255.255.255.0,网管121.7.134.36正常情况下网关应该为123.7.139.254,查资料确认为123.7.139.254Ont ipconfig 2 1 ip-address 121.7.134.37 mask 255.255.255.0 gateway 121.7.134.254 mange-vlan 199 priority 0 下发管理地址查看该ONU所在PON口以前的定义PDS-PingDong-MA5680T(config)#display service-port port 0/1/2---------------------------------------------------------------------------- INDEX VLAN VLAN PORT F/ S/ P VPI VCI FLOW FLOW RX TX STATE ID ATTR TYPE TYPE PARA----------------------------------------------------------------------------3 2372 QinQ epon 0/1 /2 0 - vlan 199 - - up4 2372 QinQ epon 0/1 /2 - - vlan 256-512 - - up5 1307 common epon 0/1 /2 0 - vlan 1307 - - up166 1307 common epon 0/1 /2 1 - vlan 1307 - - up167 2372 QinQ epon 0/1 /2 1 - vlan 199 - - up---------------------------------------------------------------------------- 再次登录ONU,正常。
华为ONU下用户-上网速度慢的处理
华为ONU下用户-上网速度慢的处理用户可以正常访问网络,但是网络速度很慢,达不到用户的开通速率。
原因分析该故障的可能原因如下:∙用户PC问题∙ONU到用户之间的线路激活速率达不到要求∙业务端口进行了限速∙上行端口带宽不足1.用户PC问题1.如果同一个ONU下的其它用户可以正常上网,只有个别用户存在问题,则可能是用户PC存在问题。
2.更换用户PC进行测试,如果能够正常上网,则可定位为用户PC问题。
检查用户PC是否感染病毒,网络设置是否正确等问题。
2.ONU到用户之间的ADSL线路激活速率达不到要求1.在ONU上的ADSL模式下,使用display line operation portid命令查询用户端口的实际激活速率“Actual line rate downstream/ upstream”是否达到要求。
例如:用户的开通带宽为3Mbit/s,确认实际下行激活速率是否达到了3Mbit/s。
如果没有达到要求的带宽,查看查询结果中的最大可达带宽“Maximumattainable rate downstream/ upstream”。
说明:线路质量在最佳状态时,最大可达速率应该接近理论值(ADSL 下行12Mbit/s,上行1.2 Mbit/s)。
可达速率越小,说明线路质量越差。
o如果最大可达带宽远远小于理论值,说明线路质量太差,检查ONU 到用户Modem之间的物理线路质量,是否存在打线不牢,线路老化等问题。
o如果最大可达带宽正常,可能是信道模板配置导致激活速率低。
使用display adsl channel-profile profile-index命令检查该端口绑定信道模板的参数配置。
重点检查:▪最大激活速率“Maximum transmit rate”,实际激活速率会在设置的最大和最小速率之间,要保证此参数设置大于用户的要求带宽。
▪交织深度“Maximum interleaving delay”,交织深度越大,线路的延迟越大,可能会影响FTP等协议报文的交互。
粗流受同PON口traffic-limit限速导致用户上网慢
MA5680t一个pon口下带的宽带用户上网慢,MXU随机脱管,ping MXU会出现断断续续的现象。
可能原因:1、该pon口下光路出现异常。
2、该pon下onu dba带宽分配过小或者是业务流限速太小。
3、pon口下有报文攻击。
分析过程:1、在olt上用命令display statistics ont-line-quality x x查看线路质量统计,统计结果误码较少,并且换过olt的pon口光模块,问题依旧。
2、检查olt上数据配置,该pon口下业务流全部都是粗流方式,不过都没有限速,onu dba带宽都是保证30M,最大50M,没有问题。
3、进入单板透明通道,通过查看Ptype统计发现有单板的确存在丢包。
=============== DISCARD========================================================Dnstream:Drop frame for Dn groupcar[143]: 000016654、经过研发分析,这个丢弃表明OLT开启了Traffic-limit Ont特性, 查看olt上的Traffic-limit 配置,的确存在如下配置:display traffic-limit ont 0/1/3--------------------------------------------F/S/P ONT ID DownTrafficProfile--------------------------------------------0/1/3 0 -0/1/3 1 -0/1/3 2 -0/1/3 3 -0/1/3 4 -0/1/3 5 -0/1/3 61 21--------------------------------------------而且21号流量模板限速为8MCHZ-GC_x6L-OLT-MA5680T-2(config)#display traffic table ip index 21------------------------------------------------TD Index : 21TD Name : FTTHG8MGXDPriority : 0Copy Priority : user-cosMapping Index : 0CTAG Mapping Priority: user-cosCTAG Mapping Index : 0CTAG Default Priority: 0Priority Policy : tag-priCIR : 8192 kbpsCBS : 264144 bytesPIR : 10240 kbpsPBS : 526288 bytesReferenced Status : used5、尝试关闭这个traffic-limit ont 0/1/3 Ont 61后,业务恢复正常,ping也没有问题.undo traffic-limit ont 0/1/3 616、再次开启traffic-limit ont 0/1/3 Ont 61,问题复现traffic-limit ont 0/1/3 61 down-stream traffic-table index 21可以看出:管理MXU的流38受Ont61的traffic-limit影响7、查看单板配置和分析:粗流应该不属于特定Ont,不受traffic-limit ont的限速,但SPC310的EPON单板软件在处理traffic-limit ont时,错误的把粗流的OntID算成61和62,导致粗流使用了OntID61和62的traffic-limit的限速定位结论:R8C05 SPC310版本,H802EPBD/C单板上的粗流受同PON下Ont61(奇数PON口,偶数PON口为62)配置的traffic-limit ont的限制,和Ont61(奇数PON口,偶数PON口为62)的业务流一起按照traffic-limit ont配置的traiffic table限速。
OLT排障思路三板斧
烽火OLT排障思路--三板斧OLT作为局端设备,主要用于对终端业务的控制和承载,同时,在整个接入网络中,OLT也作为承上启下的“业务桥梁”,承担着故障处理“分水岭”的重要责任。
一旦OLT设备发生异常故障,就会给终端业务造成十分严重和广泛的影响。
那么作为接入技术人员,在日常维护工作中,如何根据故障类型和范围,来判断是否为OLT故障引起的原因呢?我们从故障类型着手,来分析和总结一下,如何快速判断和定位由OLT设备导致的故障。
第一关于ONU或HGU无法授权或者授权正常后出现掉注册问题的分析:首先要检查是否为某个PON口下的单台终端无法注册,还是多板卡多PON口下都出现类似情况,如果是极个别情况,一般就跟OLT没有关系,需要具体查找ONU原因;要是发现大面积都是无法正常授权或注册的,则需要查找OLT原因。
具体的检查思路为:1)检查PON口的认证模式是否跟局方要求的相符;2)确认下挂终端设备是否为互通型,需要检查OLT上的互通开关是否打开;3)ONU固件版本太低,或者OLT线卡版本和ONU版本相差太大;4)如果下面终端设备出现流氓ONU,也会导致某PON口下大面积掉注册情况。
5)如果发现部分槽位或全部槽位的办法不能正常工作,需要检查OLT的供电电压和电流是否正常。
第二发生语音业务故障时如何分析和定位是否由OLT设备异常引起:首先也是先确定故障范围,是某一个用户故障,还是整台OLT下都出现了类似问题。
通常情况,只有出现大面积的语音业务故障时,才需要把排障重点放到OLT设备上,具体的分析思路为:1)检查OLT主控盘上的语音业务配置信息是否存在,并检查到MGC的注册是否正常;2)检查OLT上联口能否学到上层交换设备送下来的语音VLAN和相应MAC地址信息;3)联系软交换平台确认MGC业务和路由是否正常。
4)如果发现是PON内通话有问题,PON外是正常,此时需要检查OLT上的ARP语音代理功能是否正常。
第三发生宽带业务故障时如何分析和定位是否由OLT设备异常引起:宽带业务异常常见的主要现象为:不能拨号上网,网速很慢,经常掉线等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键字:
pon口下业务上行网速慢
摘要:
本案例对日常工作中常遇到的网络不稳定的故障采用排除法及告警分析法进行故障定位,对网络不稳定网速慢及PON口下存在非法入侵的发光设备这类故障的处理思路进行整理,对排障过程及方法进行了总结。
案例正文:
故障现象:
1,100M专线用户反映网络不稳定,下载文件正常但上行网速慢,发生故障时带附件的电子邮件无法正常发送,玩QQ及微信发送图片失败。
2,在用户现场通过第三方测速网站测速,显示下载可以达到83.07Mbps,而上行只有1.03Mbps甚至更低;
3,重启ONU终端后,ONU上线慢,且网速无改善;
4,更换ONU终端后,ONU设备MAC地址无法被自动发现,无法正常注册。
(一)上行网速慢故障处理思路:
1,排除用户局域网设备导致故障的可能;
2,检查用户线路的光衰耗值是否在正常范围内;
3,由于用户反映下行正常但上行业务异常,因此需检查该用户接入OLT设备的配置的线路模板中DBA参数是否适当;
4,检查OLT设备上联中继带宽及流量是否正常;
5,PON网络中的其他故障(含设备板卡及光模块及PON口下的长(乱)发光的异常入侵等因素)
6,根据上述检查情况,指导相关(线路维护)人员到现场协助排除故障。
根据上述思路采取的故障排除方法:
1,在ONU的以太口直接连接单台电脑测试,故障现象仍然存在。
2,在华为OLT设备上通过命令#display ont optical-info 7 1 查看该ONU的收发光均在正常工作范围内(ONU收OLT方向为-19.17dBm;ONU发光为2.05 dBm)
3,在OLT设备上通过命令#display dba-profile all检查该用户使用的线路模板中调用的DBA 14模板参数无误:上行保证带宽为102400kbps
4,在OLT设备上通过命令#display port state all 和display port traffic 0检查OLT设备上联中继带宽和流量正常(当前双上联的10GE端口带宽占用率约为11%)
5,在OLT设备上通过命令#anti-rogueont autodetect on(OFF检查完毕要及时关闭)和在PON板下用命令#anti-rogueont manual-check 7手动排查排查PON口下的异常入侵等因素,通过命令#display port state 7检查PON口工作状态:发现该PON口下出现非法入侵的流氓ONT “存在”
在OLT设备上通过命令#display alarm history alarmparameter 0/5/7查看该PON口近期产生的全部告警信息并顺利找到入侵告警如下:
根据上述5个排查步骤,至此对该故障原因确认为:该OLT的0/5/7 PON口下存在非法入侵的发光设备。
6,根据上述检查情况,通知线路维护人员到现场准备配合处理。
(二)针对PON口下存在非法入侵的发光设备这类故障的处理思路,见附图:
根据上述思路采取的故障排除方法:
1,在华为OLT上用命令#display ont info 0 5 7 al l查看改PON口下所有ONU注册情况:(专线用户的ONU均正常在线);
在OLT上用命令#display alarm history alarmparameter 0/5/7查看该PON口近期产生的全部告警信息,无ONU频繁上下线告警。
根据上述两个特征,符合“长发光ONT”类型中的第3种情况“流氓ONU比其他ONU距离更远或发光比其他ONU更弱”。
2,在OLT上用命令#anti-rogueont manual-check 7手动排查具体的流氓ONT。
OLT系统排查的流程是将PON口所有配置的ONT都排查一遍,直到找到流氓ONT。
对排查出的流氓ONT下发关闭ONT发光的操作,等待更换ONT后才能恢复业务。
但如果是PON口下面存在不受控的异常发光的设备(比如不支持开关ONT光模块协议的终端或其他发光设备),此时华为OLT只是检测到有流氓ONT,并产生相应告警记录,但最终还是需要线路维护人员配合处理才能最终解决。
由于本案例就属于这种OLT仅能检测出有发光的ONT但又无法关闭远端发光设备这种情况,因此只能通知线路维护人员及时赶到分光器安装现场,在分光器的上联口接光功率计测试收用户方向的光信号,发现可以收到-25dBm的非法入侵光信号。
为找到该异常光信号,采取在分光器内逐根拔纤的方法,最终确认非法入侵的光信号来自于在分光器的第6端子。
根据光缆相关信息逐步排查,最终找到该发光设备为属于待开通状态的某专网用的光收发器。
断掉该光路与分光器的错误连接,恢复分光器上联至PON口的主干光纤,该PON口下ONU上线正常,在OLT设备上可以看到“PON口下
非法入侵流氓ONT已被清除”的相关信息。
后续观察故障未重现,回访用户故障现象消除,业务使用正常。
背景:
随着PON网络的大量建设及应用,网络故障现象和产生的因素也随之增多,而对于网络不稳定这类的故障在排除过程中较为复杂,因此有一个清晰明了的故障排除思路显得尤为重要。
本案例结合一起100M专线用户反映网络不稳定,上行网速慢的故障案例进行深入分析,并详细介绍排除过程,希望可以给维护人员提供参考。
问题、事件描述:
网络不稳定,下载文件正常但上行网速慢。
故障现象:
1,100M专线用户反映网络不稳定,下载文件正常但上行网速慢,发生故障时带附件的电子邮件无法正常发送,玩QQ及微信发送图片失败;
2,在第三方测速网站测速,显示下载可以达到83.07Mbps,而上行只有1.03Mbps甚至更低;
3,重启ONU终端后,ONU上线慢,且网速无改善;
4,更换ONU终端后,ONU设备MAC地址无法被自动发现,无法正常注册。
分析与对策
上行网速慢故障处理思路:
1,排除用户局域网设备导致故障的可能;
2,检查用户线路的光衰耗值是否在正常范围内;
3,由于用户反映下行正常但上行业务异常,因此需检查该用户在MA5680T设备配置的线路模板中DBA参数是否适当;
4,检查OLT设备上联中继带宽及流量是否正常;
5,PON网络中的其他故障(含设备板卡及光模块及PON口下的长(乱)发光的异常入侵等因素)
6,根据上述检查情况,指导相关(线路维护)人员到现场协助排除故障。
处理结果:
依照上述的排查步骤,对网络不稳定网速慢故障原因进行准确定位为:PON口下存在非法入侵的发光设备。
由于本案例属于这种OLT仅能检测出有发光的设备,但又无法关闭远端发光设备这种情况,因此只能通知线路维护人员及时赶到分光器所在现场配合处理。
为找到该异常光信号的来源,采取了在分光器内逐根拔纤的方法,最终确认非法入侵的光信号来自于在分光器的第6端子。
根据光缆相关信息最终找到了该发光设备,拆除后故障恢复。
经验教训及推广
针对PON网络下业务网速慢、不稳定等这类故障,由于涉及的因素较多,若故障定位不准确非常容易产生重复故障,影响用户感知,因此建议维护人员排查过程中:
1,可以抓住故障现象的典型特征,采用分段排除故障区域,仔细分析故障产生的因素;
2,通过细致查看设备相关状态及告警信息,准确定位故障产生的原因;
3,积极协调其他维护部门配合采取简单有效的方法达到处理故障彻底,缩短故障时限的目的。