关于PON网络故障典型案例
单个ONT故障导致PON口业务中断

故障现象:中心局MA5680T设备O/5/0PON口下用户陆续出现错误678提示,且0/5/0下挂所有设备均出现ping丢包情况。
故障查询:登陆中心局MA5680T,进入EPON 0/5下,查看PON口3下挂的ONT一共是16个,显示状态为-----------------------------------------------------------------------------F/S/P ONT-ID MAC Control Run Config Match LoopbackFlag State State State State-----------------------------------------------------------------------------0/ 5/0 0 xxxx-xxxx-0000 active up normal match disable0/ 5/0 1 xxxx-xxxx-0001 active up normal match disable0/ 5/0 2 xxxx-xxxx-0002 active up normal match disable0/ 5/0 3 xxxx-xxxx-0003 active up normal match disable0/ 5/0 4 xxxx-xxxx-0004 active up normal match disable0/ 5/0 5 xxxx-xxxx-0005 active up normal match disable0/ 5/0 6 xxxx-xxxx-0006 active up normal match disable0/ 5/0 7 xxxx-xxxx-0007 active up normal match disable0/ 5/0 8 xxxx-xxxx-0008 active up normal match disable0/ 5/0 9 xxxx-xxxx-0009 active up normal match disable0/ 5/0 10 xxxx-xxxx-0010 active down initial initial disable0/ 5/0 11 xxxx-xxxx-0011 active up normal match disable0/ 5/0 12 xxxx-xxxx-0012 active up normal match disable0/ 5/0 13 xxxx-xxxx-0013 active up normal match disable0/ 5/0 14 xxxx-xxxx-0014 active up normal match disable0/ 5/0 15 xxxx-xxxx-0015 active up normal match disable----------------------------------------------------------------------------其中只有0/5/0:10一个ONT处于掉线状态,其他ONT显示在线。
OLT侧PON口插槽故障导致双向业务无法使用

OLT侧PON口插槽故障导致双向业务无法使
用
一、故障描述:
城关用户双向业务无法使用,营维员上门排查入户光功率后,用户无法使用。
二、处理过程:
到用户家后,发现光猫PON灯闪烁,测量光功率-24.1dBm。
将光纤重新插拔后,光猫PON灯依然闪烁,怀疑光猫损坏,更换光猫后还是PON灯闪烁。
此时怀疑可能是链路出问题导致,此时刚好又有其他用户报障且是同一分纤箱出来的。
于是营维员来到分纤箱检查总信号,发现总信号是正常的。
此时又有几户上报异常故障。
怀疑上层设备问题,来到机房排查该光猫是从那台OLT的哪个端口连接。
测试该PON口发现光功率是正常的,将测试光猫连接上后出现相同故障情况。
检查PON口配置正常,设备也未异常告警。
联系厂家,未能发现问题,尝试将此PON口的光模块更换未果,但在将该光模块插入其他正常PON口上时又可以正常使用。
此时定位故障为PON 板上的单个PON口插槽故障,将用户切换到此PON板上其他PON口上用户恢复正常使用。
三、总结:
— 1 —
此故障属于OLT侧较少见的PON板单PON口插槽故障,常见的问题多为配置错误丢失、PON板或光模块故障。
一般对于光猫无法注册上线,我们按照从下到上的顺序依次检查用户侧、分纤箱侧和OLT侧,同时结合用户的报障聚集性来判断故障点位所在的层级,在排查中要兼顾硬件和软件的检查,一般光网络故障点位都在“衔接处”发生。
— 2 —。
PON 故障分析(共35张PPT)

OLT-A
1:4
OLT-B 1:4
OLT-C 1:4
1:8分光器 1:8分光器 1:8分光器 1:8分光器
交接箱A
1:8分光器 1:8分光器
交接箱B
1:8分光器
1:8分光器
1:8分光器
交接箱C
1:8分光器 1:8分光器 1:8分光器
• 分光器及跳纤上需进 行明确标识。标识包 括分光器编号、分光 器纤号及对端设备安 装地点。
• ONU的安装必须在获 得端口申请回复的基 础上进行。
• 设备开通过程中需关 注ONU的实际开通情 况,避免因MAC地 址错误造成设备无法 开通及光点对应关系 错误的情况。
• 施工过程中要仔细对 • 设备开通完成后应及
长度相比较光缆增加 超过500米,这种情况 下B点还是选用直接放 置ONU的方式。
3
ONU
5
0
B点
800M
ONU
2
0
0
A点
• 在考虑上述条件基础 上尽量保持ONU覆盖 区域的完整性。
20户
35户
60户
96户
15户
50户
乡镇网回传通道图纸要求
• 杆路图/管线图 • 光/电线路安装图 • 电气设计图/光链路设计图。 • 当图纸被分为多个区域时,需提供一份
1:n 无源光 分路器
ONU
ONU
润欣OLT设备
NMS:带外网管口
CON:串口
GE:上连口,千百兆自适应电口、千兆光口(光模块单模、多模) PON:下行光接口(SC/PC接口)
OLT指示灯状态说明:sys灯:加电后一直绿色常亮;
ZXA10 C300 下某pon口下E8C掉线后重拨678需拨很久才能拨成功故障处理案例

ZXA10 C300 下某pon口下E8C掉线后重拨678需拨很久才能拨成功故障处理案例(海量广播报文)问题描述(故障现象)反馈C220 、C300下不少E8C重拨678,需要拨号很久才能拨上,拨号成功后业务稳定正常。
问题原因分析由于数据配置、流氓ONU检测、告警、网络环路都检查正常。
为进一步排查问题,现场抓包确认是同个pon口有恶意用户发送大量广播报文导致正常广播报文转发不正常。
后把该用户关闭后其他onu重拨测试正常。
问题原因分析1.1拨号678说明广播报文PADI报文在某一段网络被丢弃1、上层BAS设备以及交换机抓包确认没有收到PADI报文。
后现场逐步抓包确认。
11)ONU上联口镜像抓包确认PADI报文正常广播,上层没有回复PADO2)OLT内敛口长时间抓包(用户侧拨号密码设置错误,保证每隔30s不断重拨)从上面的报文分析可以看出,第一个报文时间是:11点28分38秒:现场抓包到11点40分,由于现场拨号次数肯定超过20次(每30s一次),按照PPPOED拨号流程,用户侧至少发送了20*4=80个PADI报文。
而OLT内敛口只收到了2个PADI报文。
同时OLT对接收成功的PADI报文正常转发,可以排除OLT上联口以及上层网络问题。
问题就明确在OLT内敛口到ONU 上联口的问题。
1.2广播报文丢弃原因由于偶尔能正常转发报文,说明物理链路没有问题,于是怀疑OLT内敛口丢弃了广播报文。
进一步查看OLT内敛口广播报文转发情况,连续show pon口:HD-SLY-OLT-1.M.C300-1#show interface epon-olt_1/16/6 epon-olt_1/16/6 is activate,line protocol is up. Description is none.The port is activate.The port link up/down notification is trap disable.The port has 64 onus, the number of registered onus is 26 OLT statistic:Input rate : 5864656 bps 1137 ppsOutput rate: 8780832 bps 1321 ppsInput bandwidth thoughput :0.6%Output bandwidth thoughput:0.9%Interface peak rate:Input peak rate : 31351936 bps 33790 ppsOutput peak rate: 42625352 bps 4141 ppsTotal statistic:Input:PassPackets :6548642258 PassBytes :595061888345 UnicastsPkts :324163583 MulticastsPkts:227328 BroadcastsPkts:6224251347CRCAlignErrors:0 OversizePkts :35026UndersizePkts :0 CollisionPkts :0Fragments :0 Jabbers :064B :0 65-127B :6417943371128-255B :18016171 256-511B :4171368512-1023B :5355333 1024-1518B:103120989Output:PassPackets :383116714 PassBytes :336708054003 UnicastsPkts :383116714 MulticastsPkts:0 BroadcastsPkts:0HD-SLY-OLT-1.M.C300-1#show interface epon-olt_1/16/6 epon-olt_1/16/6 is activate,line protocol is up. Description is none.The port is activate.The port link up/down notification is trap disable.The port has 64 onus, the number of registered onus is 26 OLT statistic:Input rate : 6557144 bps 1192 ppsOutput rate: 9255800 bps 1401 ppsInput bandwidth thoughput :0.7%Output bandwidth thoughput:0.9%Interface peak rate:Input peak rate : 31351936 bps 33790 ppsOutput peak rate: 42625352 bps 4141 ppsTotal statistic:Input:PassPackets :6548647749 PassBytes :595065480967UnicastsPkts :324169071 MulticastsPkts:227331BroadcastsPkts:6224821351CRCAlignErrors:0 OversizePkts :35026UndersizePkts :0 CollisionPkts :0Fragments :0 Jabbers :064B :0 65-127B :6417945794128-255B :18016394 256-511B :4171406512-1023B :5355371 1024-1518B:103123758Output:PassPackets :383123093 PassBytes :336713210128UnicastsPkts :383123093 MulticastsPkts:0BroadcastsPkts:0HD-SLY-OLT-1.M.C300-1#从上面INPUT的广播报文(红色加粗部分)可以看出,在极短的时间内PON口收到了60万(两次相减)个左右的广播报文,完全超出了正常网络的报文。
GEPON故障:PPPOE拨号后用户显示676电话占线故

建议与总结
PPPOE拨号出现“676”为常见故障,应从上层BRAS的配置,VLAN的配置方面考虑,建议使用替换法来排查问题。
附件
4)当ONU侧的测试人员测试出故障现象后,有OLT侧测试人员用同一帐号进行PPPOE拨号测试;
5)通过前面的测试过程来判断故障的发生段(如果OLT侧的测试人员也能够测试到故障现象,则说明该故障不是GEPON设备引起的。反之则是GEPON设备引起的故障);
6)如果故障发生在GEPON的传输段,对OLT及ONU设备进行软件的更新,并且进行数据配置的检查,然后再测试。如果问题依旧,则对GEPON传输链路进行UNI接口到SNI接口的互PING测试,看是否有丢包。如果无丢包情况出现,则在ONU侧将HUB换成交换机,并做镜像端口,用sniffer进行抓包,以抓包结果来判断故障的发生段,然后根据具体情况酌情处理;
7)由于小区内采用了HUB,而且所有用户在GEPON系统之都处于同一VALN,所以怀疑病毒攻击引起广播风暴,引起网络繁忙或数据包传送错误所致;
处理过程
制定了故障诊断方案,方案如下:
1)人员安排:需要参加测试人员4人(包括我在内);
2)人员分配:在OLT侧留1人进行测试配合,在ONU侧留3人同时拨号测试;
告警信息
用户通过PPPOE拨号不能获得认证,PC提示“676”故障
版本信息
原因分析
案例1:onu无法上报

ONU无法上报故障现象:汕头移动金砂中路MA5680T,PON口0/1/3下有12台ONU无法正常上报。
施工人员在10月23号安装完成,后台在OLT上能看到新发现的12台ONU。
10月24号上午要调试的时候,没有发现未注册的ONU,无法调试。
在该PON下有一台两周前开通的ONU(ONUID9);该ONU工作正常。
原因分析:可能原因判断:1、光路问题,到该小区的光路全部中断。
2、电源问题,该小区停电。
3、存在流氓ONU,ONU发光不正常影响其他ONU上报4、PON口问题解决措施:1、施工人员去现场查看,ONU电源正常;ONU光路指示灯link灯长亮,即代表有收到光;AUTH灯快闪,即ONU在请求注册;RUN灯慢闪。
可以看出设备正常运行。
2、怀疑光功率达到临界值,用光功率测光路,光功率都为-18到-19db之间,排除光路问题。
3、怀疑PON问题,但该PON口已经有一台ONU正常运行,故排除PON口问题。
4、怀疑存在流氓ONU。
在OLT侧,拔出0/1/3 PON口的尾纤,波长调到1310nm,测从ONU端上来的光功率,没测到光。
排除流氓ONU存在。
5、至此排查失去头绪,怀疑问题依然出在OLT上。
在OLT上用相关命令查看命令:STYD_JSZL_MA5680T(config)#interface gpon 0/1STYD_JSZL_MA5680T(config-if-gpon-0/1)# display portont-register-info 3 30display port ont-register-info 3 30---------------------------------------------------------------- SN 日期时间注册结果---------------------------------------------------------------- 4857544301599203 2010-10-25 16:50:52 失败 485754431A519503 2010-10-25 16:50:52 失败 4857544300E9AA03 2010-10-25 16:50:56 失败 4857544301599203 2010-10-25 16:50:56 失败 485754431A519503 2010-10-25 16:50:56 失败 4857544301091903 2010-10-25 16:51:06 失败 4857544301016403 2010-10-25 16:51:06 失败 4857544301017003 2010-10-25 16:51:12 失败 4857544300E8D903 2010-10-25 16:51:12 失败 4857544301017103 2010-10-25 16:51:12 失败 4857544301016403 2010-10-25 16:51:13 失败 4857544300E7B303 2010-10-25 16:51:13 失败 485754431A50D003 2010-10-25 16:51:13 失败 485754431AA61003 2010-10-25 16:51:13 失败 4857544301019E03 2010-10-25 16:51:13 失败 485754431A519503 2010-10-25 16:51:18 失败 485754431AA61003 2010-10-25 16:51:22 失败 48575443A917B542 2010-10-25 16:51:22 失败 4857544301599203 2010-10-25 16:51:27 失败 4857544301091903 2010-10-25 16:51:27 失败 4857544300E9AA03 2010-10-25 16:51:32 失败4857544300E8D903 2010-10-25 16:51:32 失败4857544301019E03 2010-10-25 16:51:36 失败485754431A50D003 2010-10-25 16:51:37 失败4857544300E7B303 2010-10-25 16:51:37 失败4857544301017103 2010-10-25 16:51:41 失败48575443A917B542 2010-10-25 16:51:47 失败4857544301091903 2010-10-25 16:51:47 失败4857544301599203 2010-10-25 16:51:47 失败----------------------------------------------------------------在不同时间段查看STYD_JSZL_MA5680T(config-if-gpon-0/1)#display port ont-register-info 3{ register-index<U><0,226> }:30命令:display port ont-register-info 3 30---------------------------------------------------------------- SN 日期时间注册结果---------------------------------------------------------------- 4857544301599203 2010-10-25 16:52:52 失败485754431A519503 2010-10-25 16:52:52 失败4857544300E9AA03 2010-10-25 16:52:56 失败4857544301599203 2010-10-25 16:52:56 失败485754431A519503 2010-10-25 16:52:56 失败4857544301091903 2010-10-25 16:53:06 失败4857544301017003 2010-10-25 16:53:12 失败4857544300E8D903 2010-10-25 16:53:12 失败4857544301017103 2010-10-25 16:53:12 失败4857544301016403 2010-10-25 16:53:13 失败4857544300E7B303 2010-10-25 16:53:13 失败485754431A50D003 2010-10-25 16:53:13 失败485754431AA61003 2010-10-25 16:53:13 失败4857544301019E03 2010-10-25 16:53:13 失败485754431A519503 2010-10-25 16:53:18 失败485754431AA61003 2010-10-25 16:53:22 失败48575443A917B542 2010-10-25 16:53:22 失败4857544301599203 2010-10-25 16:53:27 失败4857544301091903 2010-10-25 16:53:27 失败4857544300E9AA03 2010-10-25 16:53:32 失败4857544301017003 2010-10-25 16:53:32 失败4857544300E8D903 2010-10-25 16:53:32 失败4857544301019E03 2010-10-25 16:53:36 失败485754431A50D003 2010-10-25 16:53:37 失败4857544300E7B303 2010-10-25 16:53:37 失败4857544301017103 2010-10-25 16:53:41 失败48575443A917B542 2010-10-25 16:53:47 失败4857544301091903 2010-10-25 16:53:47 失败4857544301599203 2010-10-25 16:53:47 失败---------------------------------------------------------------- 总数 : 30用该命令STYD_JSZL_MA5680T(config-if-gpon-0/1)#display portont-register-info 3 30 多刷几次,可以看到不同的时间段都有ONU在发起注册请求,但是在OLT上却始终无法发现STYD_JSZL_MA5680T(config-if-gpon-0/1)#display ont autofind 3 Failure: The automatically found ONTs do not exist5、该PON板下没用户,通过复位PON板看能否发现。
流氓ONT引起PON口用户闪断故障案例分析

流氓ONT引起PON口用户闪断故障案例分析福建阿尔卡特,李琦摘要:针对流氓ONT引起整个PON口ONT用户频繁闪断故障,结合跟踪消息分析故障原因,并给出了常用的排查思路。
关键词:误码率、流氓ONT1 故障现象福建漳州移动农科所OLT下带的茶斜村PON用户(对应OLT PON端口1/1/2/2,该PON带大约25个ONT用户)不定时出现闪断,故障表现为ONT用户不停上线下线,闪断频率时快时慢,没有规律,且误码率增长非常迅速,具体log信息如下:15/02/09 01:29:11 major alarm occurred for ont 1/1/2/2/36 (service affecting) : ONT is inactive 15/02/09 01:29:11 major alarm occurred for ont 1/1/2/2/27 (service affecting) : ONT is inactive 15/02/09 01:29:14 major alarm occurred for ont 1/1/2/2/25 (service affecting) : ONT is inactive 15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/23 (service affecting) : ONT is inactive 15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/18 (service affecting) : ONT is inactive 15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/16 (service affecting) : ONT is inactive 15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/15 (service affecting) : ONT is inactive 15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/13 (service affecting) : ONT is inactive 15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/5 (service affecting) : ONT is inactive15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/3 (service affecting) : ONT is inactive15/02/09 01:29:16 major alarm occurred for ont 1/1/2/2/2 (service affecting) : ONT is inactive15/02/09 01:29:16 major alarm cleared for ont 1/1/2/1/21 (service affecting) : 1490 Optical signal level too low15/02/09 01:29:16 major alarm cleared for ont 1/1/2/2/25 (service affecting) : Signal Degraded from ONT15/02/09 01:29:16 major alarm cleared for ont 1/1/2/2/18 (service affecting) : Signal Degraded from ONTZZLY-NKeSuo-7360-33.227>#show pon ber-stats 1/1/2/2======================================================================= ber-stats table======================================================================= pon-idx |ont-num|bit-err-down|bit-err-up|ranged-ind---------+-------+------------+----------+---------------------------------------------------------------------------- 1/1/2/2 1 204 2077 ranged1/1/2/2 2 417 1552461 ranged1/1/2/2 3 229 183526 ranged1/1/2/2 4 212 8361 ranged1/1/2/2 5 405 3645598 ranged1/1/2/2 6 1099 18100 not-ranged1/1/2/2 7 185 5089591 ranged1/1/2/2 8 278 5352530 not-ranged1/1/2/2 9 57 2787475 ranged1/1/2/2 10 189 3068826 ranged1/1/2/2 11 217 3962846 not-ranged1/1/2/2 12 229 2728350 not-ranged1/1/2/2 13 360 4562798 ranged1/1/2/2 14 243 4956220 not-ranged1/1/2/2 15 269 1176529 ranged1/1/2/2 16 228 5148 not-ranged1/1/2/2 17 262 5392128 ranged1/1/2/2 18 41 5137896 ranged1/1/2/2 19 238 2276648 not-ranged1/1/2/2 20 259 5904572 not-ranged1/1/2/2 21 210 5086538 ranged1/1/2/2 22 243 4734875 not-ranged1/1/2/2 23 182 3672936 ranged2 故障分析PON技术是一种点对多点的光纤传输和接入技术,下行OLT将全部信号广播出去,通过ODN分配到各ONU。
中国移动PON网络维护优化案例

中国移动PON网络优化案例烽火通信科技股份有限公司二○一○年十二月目录前言 (4)第一章PON网络组网模型 (5)1.PON网络上联IP城域网组网模型 (5)1.1光缆单路由直连IP城域网节点 (5)1.2光缆双路由连IP城域网节点 (6)1.3光缆双路由连IP城域网双节点(双上联) (7)1.4通过PTN网络SNCP保护方式上联IP城域网 (8)1.5通过城域波分网络波道保护方式上联IP城域网 (8)2.PON网络组网模型 (9)1.6无保护方式 (9)1.7TYPE B方式组网 (10)1.8TYPE C方式组网 (11)第二章网络优化的目标和范围 (13)2.1网络优化的目标: (13)2.2优化的范围: (13)第三章网络优化的原则及典型案例 (15)3.1 PON网络优化原则与建议 (15)3.1.1组网优化原则 (15)3.1.2驻地网优化原则 (15)3.1.3光缆网优化原则 (15)3.1.4设备配置优化原则 (16)3.1.5 VLAN、IP地址优化原则: (16)3.1.6GEMPORT流限速与QOS规划建议 (17)3.1.7 PON网络用户接入要求 (17)3.1.8网管系统的优化建议 (18)3.2PON网络优化应用案例 (18)第四章软件管理办法 (19)第五章PON网络备件配置原则 (21)第六章维护人员技术要求 (23)第七章应急方案的制定与演练 (25)前言中国移动进入全业务运营时代,大量的中小企业和家庭客户对宽带上网提出更高的需求。
中国移动为顺应这些需求,推出了以为PON网络接入为主的宽带接入业务,目前业务在快速发展之中。
各地的网络发展迅速,组网方式千差万别,如何让这些网络尽量的提供安全、稳定的服务?如何让我们的PON网络具有相对的灵活性、一定的前瞻性和一定的创新能力?如何提高维护的高效率?带着这些问题,我们提出了对网络及维护进行优化,指导各地根据本地的实际情况来优化宽带接入网,力争做出精品网络,在市场竞争中取得更加优异的成绩,在客户中建立良好的口碑。
PON网络组网和工程故障排查

3200.alarm=0.
BIP8:DS==0(上行BIP8告警).
DS_MAX=5.DS_MIN=_MAX=_MIN=5.DS_E=_E=1.
19
OMCI互通问题
• OMCI&PLOAM
➢ GPON互通中网关与OLT之间主 要通过PLOAM消息和OMCI消息 进行交互。
➢ 在完成LOID认证以后,OLT首先通过MIB 同步流程同步与ONU之间的配置,其后会 下发VEIP配置给网关。
OMCI互通问题排查
➢ 通过ps检查fhomci进程是否存在,不存在则尽快下载OMCI日志,保留现场。
➢ 指示灯分析。可通过指示灯快速确定当前ONU状态。
指示灯名称
颜色 标识文字
显示功能
VLAN1 VLAN2 VLAN3
4
接BAS,桥由模式,用于满足PC上网 接ITMS,路由模式,实现TR069远程管理 接软交换,路由模式,实现VoIP业务应用
VLAN1
B
VLAN 2
R
VLAN 3
R
TR069
上网
VoIP
中国移动PON网络应用故障案例库

中国移动PON网络应用故障案例库中国移动通信集团北京有限公司2011年2月目录1.项目概述 (3)1.1.背景和意义 (3)1.2.研究内容 (3)1.3.编制依据 (3)2.PON网络故障点分析 (3)2.1.PON网络结构 (3)2.2.PON网络常见故障分析 (4)2.2.1.光网络层常见故障 (4)2.2.2.业务应用层常见故障 (5)2.2.3.其他常见故障 (5)3.PON网络应用问题案例分析 (5)3.1.光网络层故障案例 (5)3.1.1.传输距离超过20km (5)3.1.2.PON链路光功率衰耗过小 (6)3.1.3.PON链路光功率衰耗过大 (7)3.1.4.光纤接头不匹配导致ONT无法注册 (7)3.1.5.光纤链路性能恶化引发误码丢包 (8)3.1.6.异常发光ONU导致同PON口下所有ONU业务异常 (8)3.1.7.SDH光端机误接入PON网络导致多个ONU业务异常 (8)3.1.8.上联光口单纤中断导致业务中断 (9)3.1.9.设备与交换机两端光模块配置错误导致链路异 (9)3.1.10.上行设备光模块问题导致组播节目不流畅 (10)3.2.业务应用层故障案例 (11)3.2.1.ONU掉电重启后业务配置下发丢失 (11)3.2.2.业务配置模板与ONU设备类型不兼容 (11)3.2.3.流量模板中设置的业务流下行速率值较小导致机顶盒下载节目列表慢 (11)3.2.4.PC MAC地址重复导致PPP拨号失败 (11)3.2.5.电话打不通但能上网 (11)3.2.6.OLT与BRAS之间双路由引起的宽带拨号业务676故障 (11)3.2.7.SN相同导致ONT无法注册 (11)3.2.8.OLT与ONU之间双路由保护出现ONU离线问题 (11)3.2.9.OLT上联接口VLAN配置与BRAS VLAN配置不匹配导致业务中断 (11)3.2.10.网关地址冲突造成上网业务全部中断 (11)3.2.11.设备网线类型设置为AUTO导致与传输对接不成功 (11)3.2.12.组播流TTL值设置不当导致用户无法收看节目常 (11)3.2.13.用户点播节目一段时间后画面停止 (11)3.2.14.未配置Hostip导致用户不能点播节目 (11)3.2.15.未配置Fast leave导致用户下载速率慢 (11)3.2.16.QoS配置不合理导致V oIP业务质量较差 (11)3.2.17.错误配置导致DHCP拨号不成功 (11)3.2.18.ACL配置不合理导致专线用户不能上网 (11)3.2.19.设备没有转发未知多播报文导致下挂路由器建立OSPF路由失败 (11)3.2.20.上级设备开启广播抑制功能导致级联的设备下用户拨号困难 (11)3.2.21.BRAS侧数据配置问题导致OLT接入的拨号用户无法正常上网 (11)3.2.22.拨号用户提示721错误 (11)3.2.23.E1映射到T-CONT中带宽配置不当引起丢包 (11)3.2.24.远程升级ONU软件版本失败 (11)3.2.25.OLT工作在IGMP Proxy模式下IGMP协议版本互通故障 (11)3.2.26.V oIP语音质量问题 (11)3.2.27.V oIP话机摘机忙音故障 (11)3.2.28.ONU上配置了管理地址导致从OLT下发IP失败 (11)3.2.29.ARP映射不匹配导致无法从维护网口登录ONU设备 (12)3.2.30.ONU由于H.248接口没有正常注册无法进行数据保存 (12)3.2.31.MA5616开启环路检测导致用户端口自动关闭 (12)3.2.32.OLT与对端设备的链路聚合配置不一致导致用户有时打不开网页 (12)3.2.33.ONU上配置的广播域太多导致PC经常无法获取DHCP分配的地址 (12)3.2.34.ONU设备用户VLAN和组播VLAN不同导致组播不通 (12)3.2.35.OLT的PON口有组播带宽限制导致新加入的节目无法播放 (12)3.2.36.承载组播方式工作的私有协议的二层透传业务专线的配置问题 (12)3.2.37.承载RIP协议的二层透传业务专线的配置问题 (12)3.2.38.MA5616下挂公话只能接不能打的问题 (12)3.2.39.MA5620E软交换功能故障 (12)3.2.40.MAC地址老化时间过短导致OLT下挂UA5000的VOD组播用户花屏 (12)3.2.41.不同组播IP映射到相同的组播MAC导致某组播频道节目卡 (12)3.2.42.OLT与交换机LACP配置问题导致对接不成功 (12)3.2.43.POTS配置冗余导致语音业务闪断 (12)3.2.44.IMS未配置号码属性支持T38导致ONT上传真业务故障 (12)3.2.45.ONU拨号后要等4-5s才出现回铃音的情况故障 (12)3.2.46.ONU 体彩、福彩掉线故障 (12)3.2.47.ONU设备开通呼叫转接引起的故障 (12)3.2.48.BRAS负载过大导致IPTV节目故障 (17)3.2.49.ONU发传真故障 (17)3.2.50.ONU宽带拨号678故障的分析 (17)3.2.51.ONU下挂无线AP电脑无法获取IP 问题的故障分析 (17)3.2.52.丢失关键包导致语音断话故障 (17)3.2.53.MGC链接断开告警频现的故障 (17)3.2.54.无回铃音故障处理 (17)3.2.55.拨号数图格式问题导致二次拨号故障 (17)3.2.56.语音业务通信中断后,不能自动注册 (17)3.2.57.ONU下联设备ARP攻击导致同一PON口下所有用户pppoe拨号678故障 (17)3.2.58.IPTV业务HTTP页面失败故障 (17)3.2.59.三方通话问题处理 (17)3.3.其他故障案例 (17)3.3.1.单路电源功率不足导致设备频繁重启 (17)3.3.2.电压不稳定导致ONU反复上下线 (18)3.3.3.板卡温度异常引起ONU不能同步 (18)3.3.4.OLT机框内单板之间软件版本不匹配导致的故障 (19)3.3.5.备用主控板无法正常启动 (19)3.3.6.电磁干扰引起上联口时通时断问题 (20)4.PON网络运维建议 (21)4.1.光网络层故障排查方法 (21)4.1.1.在线测试和诊断 (21)4.1.2.离线测试和诊断 (22)4.1.3.PON光链路自动测试和诊断系统 (22)4.2.业务应用层故障排查建议 (23)1. 项目概述1.1 背景和意义随着网络演进和业务发展的需要,中国移动正进入全业务宽带网络的发展阶段,PON 设备以其高带宽、长距离传输、全业务接入能力成为实现FTTx 的主流技术,因此是今后中国移动全业务宽带网络发展战略中不可缺少的技术实现手段。
PON网络的业务配置及故障维护课件

Data
Smart VLAN = 600(HIS-PPPoE).
Smart VLAN =411 ( VoIP_SIP)
Smart VLAN = 412 (VoIP_POTs)
Smart VLAN = 711 (IPTV)
Smart VLAN = 811 (Management)
Smart VLAN = 10,20 (VPN)
ONT port Vlan Port ID of ONT
VLAN
Service
FE 0
2
FE 1
3
FE 2
5
FE 3
10
IPHOST
4
ONT port Port ID of ONT Native VLAN FE 0
FE 1 FE 2 FE 3
Native VLAN 2 3 PON网络5的业务配置及故障维护 10
Meth0:10.11.104.2/24
0/19/0 ~ 0/19/1(Link aggregation.)
0/20/0~0/20/1(Link aggregation)
Internet
Index: 10, CAR: 2048 Kbit/s, Priority: 0 pvc-
service
setting (Upstream & Downstream)
检查上层设备状态
•
在EPON业务发生故障时,通过检查上层设备状态排除故障。
•
如果所接终端都正常,则问题可能出在上层设备,请检查上层设备
的运行状态、数据配置。特别要关注上层设备和对接接口的状态和属性的
兼容性。
PON网络的业务配置及故障维护
常见故障分类及原因
PON网络应用案例分析库

PON网络应用案例分析库PON网络应用案例库中国移动通信集团目录1.项目概述 (1)1.1.背景和意义 (1)1.2.研究内容 (1)1.3.编制依据 (1)2.PON网络故障点分析 (1)2.1.PON网络结构 (1)2.2.PON网络常见故障分析 (2)2.2.1.光网络层常见故障 (2)2.2.2.业务应用层常见故障 (2)2.2.3.其他常见故障 (3)3.PON网络应用问题案例分析 (3)3.1.光网络层故障案例 (3)3.1.1.传输距离超过20km (3)3.1.2.PON链路光功率衰耗过小 (4)3.1.3.PON链路光功率衰耗过大 (4)3.1.4.光纤接头不匹配导致ONT无法注册 (5)3.1.5.光纤链路性能恶化引发误码丢包 (5)3.1.6.异常发光ONU导致同PON口下所有ONU业务异常 (5) 3.1.7.SDH光端机误接入PON网络导致多个ONU业务异常 (6) 3.1.8.上联光口单纤中断导致业务中断 (6)3.1.9.设备与交换机两端光模块配置错误导致链路异 (7)3.1.10.上行设备光模块问题导致组播节目不流畅 (7)3.2.业务应用层故障案例 (8)3.2.1.ONU掉电重启后业务配置下发丢失 (8)3.2.2.业务配置模板与ONU设备类型不兼容 (8)3.2.3.流量模板中设置的业务流下行速率值较小导致机顶盒下载节目列表慢 (9)3.2.4.PC MAC地址重复导致PPP拨号失败 (9)3.2.5.电话打不通但能上网 (10)3.2.6.OLT与BRAS之间双路由引起的宽带拨号业务676故障 (10)3.2.7.SN相同导致ONT无法注册 (11)3.2.8.OLT与ONU之间双路由保护出现ONU离线问题 (11)3.2.9.OLT上联接口VLAN配置与BRAS VLAN配置不匹配导致业务中断 (12)3.2.10.网关地址冲突造成上网业务全部中断 (12)3.2.11.设备网线类型设置为AUTO导致与传输对接不成功 (13)3.2.12.组播流TTL值设置不当导致用户无法收看节目常 (13)3.2.13.用户点播节目一段时间后画面停止 (14)3.2.14.未配置Hostip导致用户不能点播节目 (14)3.2.15.未配置Fast leave导致用户下载速率慢 (15)3.2.16.QoS配置不合理导致V oIP业务质量较差 (15)3.2.17.错误配置导致DHCP拨号不成功 (16)3.2.18.ACL配置不合理导致专线用户不能上网 (16)3.2.19.设备没有转发未知多播报文导致下挂路由器建立OSPF路由失败 (17)3.2.20.上级设备开启广播抑制功能导致级联的设备下用户拨号困难 (17)3.2.21.BRAS侧数据配置问题导致OLT接入的拨号用户无法正常上网 (18)3.2.22.拨号用户提示721错误 (18)3.2.23.E1映射到T-CONT中带宽配置不当引起丢包 (19)3.2.24.远程升级ONU软件版本失败 (19)3.2.25.OLT工作在IGMP Proxy模式下IGMP协议版本互通故障(20)3.2.26.V oIP语音质量问题 (21)3.2.27.V oIP话机摘机忙音故障 (21)3.2.28.ONU上配置了管理地址导致从OLT下发IP失败 (21)3.2.29.ARP映射不匹配导致无法从维护网口登录ONU设备 (22)3.2.30.ONU由于H.248接口没有正常注册无法进行数据保存 (22)3.2.31.MA5616开启环路检测导致用户端口自动关闭 (23)3.2.32.OLT与对端设备的链路聚合配置不一致导致用户有时打不开网页 (23)3.2.33.ONU上配置的广播域太多导致PC经常无法获取DHCP分配的地址 (24)3.2.34.ONU设备用户VLAN和组播VLAN不同导致组播不通 (25)3.2.35.OLT的PON口有组播带宽限制导致新加入的节目无法播放(26)3.2.36.承载组播方式工作的私有协议的二层透传业务专线的配置问题 (26)3.2.37.承载RIP协议的二层透传业务专线的配置问题 (27)3.2.38.MA5616下挂公话只能接不能打的问题 (28)3.2.39.MA5620E软交换功能故障 (29)3.2.40.MAC地址老化时间过短导致OLT下挂UA5000的VOD组播用户花屏 (29)3.2.41.不同组播IP映射到相同的组播MAC导致某组播频道节目卡 (30)3.2.42.OLT与交换机LACP配置问题导致对接不成功 (31)3.2.43.POTS配置冗余导致语音业务闪断 (31)3.2.44.IMS未配置号码属性支持T38导致ONT上传真业务故障(32)3.2.45.ONU拨号后要等4-5s才出现回铃音的情况故障 (32)3.2.46.ONU 体彩、福彩掉线故障 (33)3.2.47.ONU设备开通呼叫转接引起的故障 (34)3.2.48.BRAS负载过大导致IPTV节目故障 (39)3.2.49.ONU发传真故障 (40)3.2.50.ONU宽带拨号678故障的分析 (41)3.2.51.ONU下挂无线AP电脑无法获取IP 问题的故障分析 (42)3.2.52.丢失关键包导致语音断话故障 (43)3.2.53.MGC链接断开告警频现的故障 (45)3.2.54.无回铃音故障处理 (46)3.2.55.拨号数图格式问题导致二次拨号故障 (47)3.2.56.语音业务通信中断后,不能自动注册 (49)3.2.57.ONU下联设备ARP攻击导致同一PON口下所有用户pppoe拨号678故障 (50)3.2.58.IPTV业务HTTP页面失败故障 (53)3.2.59.三方通话问题处理 (55)3.3.其他故障案例 (57)3.3.1.单路电源功率不足导致设备频繁重启 (57)3.3.2.电压不稳定导致ONU反复上下线 (58)3.3.3.板卡温度异常引起ONU不能同步 (58)3.3.4.OLT机框内单板之间软件版本不匹配导致的故障 (59)3.3.5.备用主控板无法正常启动 (59)3.3.6.电磁干扰引起上联口时通时断问题 (60)4.PON网络运维建议 (61)4.1.光网络层故障排查方法 (61)4.1.1.在线测试和诊断 (61)4.1.2.离线测试和诊断 (61)4.1.3.PON光链路自动测试和诊断系统 (62)4.2.业务应用层故障排查建议 (62)1. 项目概述1.1. 背景和意义随着网络演进和业务发展的需要,移动正进入全业务宽带网络的发展阶段,PON 设备以其高带宽、长距离传输、全业务接入能力成为实现FTTx 的主流技术,因此是今后移动全业务宽带网络发展战略中不可缺少的技术实现手段。
知识库-PON上行设备现网排障

案例名称:PON上行设备现网排障录入人员:郑洁录入单位:NOC传输与接入网录入时间:2012.9.5接入方式:FTTH 业务:注册、上网、IPTV用户类型:公客故障现象:PON上行设备注册不成功、不能上网、IPTV卡屏、魔屏无法收看直播IPTV等故障处理过程:1、首先将PON上行网关和外置AP的软件版本升级至网运部发布的最新版本,并确认无线路连接错误。
贝尔网关的最新版本为1.5S(固件版本为E230)烽火网关的最新版本为rp0100,后续会更新版本rp0101(10月初发布)中兴网关的最新版本为V3.30.10T4贝曼AP的最新版本为1.1o2、注册认证失败失败原因一:认证方式错误其他现象:OLT认证失败正确处理:若为SN认证,则应使用SFU+LAN上行设备进行安装;若为LOID认证方式,则应使用PON上行+外置AP设备进行安装;失败原因二:光线路存在问题其他现象:LOS灯红灯闪烁正确处理:请使用用光功率计检查线路;失败原因三:数据配置错误其他现象:网络E常亮,TR069属性WAN连接未获得地址;正确处理:咨询NOC帮助解决失败原因四:ITMS侧工单逻辑ID错误其他现象:网络E常亮,TR069属性WAN连接获得地址;正确处理:咨询信网部帮助解决贝尔网关注册页面:显示注册超时贝尔网关注册页面:显示宽带帐号不存在烽火网关注册页面:卡在20%中兴网关注册页面:“正在注册,请等待”中兴网关注册页面:“注册成功,正在下发业务,请等待”华为网关注册页面:卡在30%的注册界面3、上网出现问题失败原因一:预付费用户未完工其他现象:网络12小时断线一次正确处理:工单完工;失败原因二:数据配置错误其他现象:PPPoE拨号不成功;正确处理:把PON设备改为桥接模式,PC使用测试帐号进行拨号,若为密码错误,则进行手动修改,若为BRAS端口绑定错误,则咨询NOC帮助解决失败原因三:外置AP在网关DHCP服务启动前为下行设备分配了IP地址其他现象:有线可上网,无线无法上网,无线设备获得的地址的网关为192.168.1.254 正确处理:升级外置AP,上网设备重新获取一次地址;失败原因四:公网接入数受限其他现象:部分终端可上网,部分终端不可上网临时解决方案:通过ITMS平台对网关中的参数进行修改,将限制数值改大。
案例2:电源和光路引起的ONU离线告警

电源和光路引起的ONU离线告警故障现象:汕头移动澄海综合楼OLT下,0/1/0 PON下有两台ONU,从10月18号到19号,不断有设备离线告警和恢复告警;到10月20号有2台ONU离线,1台ONU 告警反复出现,分别为宜嘉名都ONU13、ONU20、ONU29。
网管告警:网管与设备通信失败。
原因分析:1、由于N2000网管显示的告警不具体,通过登入到OLT上用命令行查看具体告警原因。
查询命令:STYD_CHZHL_MA5680T#display board 0/1 ---------------------------------------------------------------------F/S/P ONT-ID SN Control Run Config Match DBA flag state state state type ---------------------------------------------------------------------0/ 1/0 1 48575443A9080742 active up normal match SR 0/ 1/0 2 48575443A8EFC342 active up normal match SR 0/ 1/0 3 48575443A9071942 active up normal match SR 0/ 1/0 4 48575443A919FB42 active up normal match SR 0/ 1/0 5 48575443A91A4E42 active up normal match SR 0/ 1/0 6 48575443A9039742 active up normal match SR 0/ 1/0 7 48575443A9073A42 active up normal match SR 0/ 1/0 10 48575443A8F0E742 active up normal match SR 0/ 1/0 11 48575443A8ECAC42 active up normal match SR0/ 1/0 12 48575443A8ED2042 active up normal match SR 0/ 1/0 13 48575443A917B042 active down initial initial SR 0/ 1/0 14 4857544336955203 active up normal match SR 0/ 1/0 15 48575443A9164642 active up normal match SR 0/ 1/0 16 48575443A90D1642 active up normal match SR 0/ 1/0 17 48575443A8ED1B42 active up normal match SR0/ 1/0 18 48575443A909AE42 active up normal match SR 0/ 1/0 19 48575443A90B0C42 active up normal match SR 0/ 1/0 20 48575443A905C842 active down initial initial SR 0/ 1/0 21 48575443A9178642 active up normal match SR 0/ 1/0 22 48575443A90ADB42 active up normal match SR 0/ 1/0 23 48575443A8EE7F42 active up normal match SR 0/ 1/0 24 48575443A8F0D242 active up normal match SR 0/ 1/0 25 48575443A9098D42 active up normal match SR 0/ 1/0 26 48575443A90D4B42 active up normal match SR 0/ 1/0 27 48575443A919DD42 active up normal match SR 0/ 1/0 28 48575443A8ED3342 active up normal match SR 0/ 1/0 29 48575443A9162E42 active up normal match SR 0/ 1/0 30 48575443A9036042 active up normal match SR 0/ 1/0 31 48575443A9045342 active up normal match SR 0/ 1/0 32 48575443A9003D42 active up normal match SR 0/ 1/0 33 48575443A9091142 active up normal match SR 0/ 1/0 34 48575443A8ECA742 active up normal match SR 0/ 1/0 35 485754433692B503 active up normal match SR 0/ 1/0 36 485754433692CC03 active up normal match SR 0/ 1/0 37 48575443A8CF0042 active up normal match SR 0/ 1/0 38 48575443A90D7942 active up normal match SR 0/ 1/0 39 48575443A8EFF642 active up normal match SR------------------------------------------------------------------------------ 从该查询中,可以看到ONU ID13,ONU ID 20 已经离线进入PON板,查询ONU注册信息:STYD_CHZHL_MA5680T(config)#interface gpon 0/1STYD_CHZHL_MA5680T(config-if-gpon-0/1)#display ont register-info 0 13 --------------------------------------------------------------------- 索引编号 : 3认证方式 : SN认证ONT序列号 : 48575443A9080742密码 :ONT类型 : SmartAX MA5620上线时间 : 2010-10-19 05:01:58下线时间 : 2010-10-19 11:58:31下线原因 : ONT的LOSI告警--------------------------------------------------------------------- 索引编号 : 2认证方式 : SN认证ONT序列号 : 48575443A9080742密码 :ONT类型 : SmartAX MA5620上线时间 : 2010-10-18 09:37:06下线时间 : 2010-10-19 05:01:55下线原因 : ONT的LOSI告警--------------------------------------------------------------------- 索引编号 : 1认证方式 : SN认证ONT序列号 : 48575443A9080742密码 :ONT类型 : SmartAX MA5620上线时间 : 2010-10-10 12:19:04下线时间 : 2010-10-18 09:36:47下线原因 : ONT的LOSI告警--------------------------------------------------------------------- 有效认证信息条数 : 3STYD_CHZHL_MA5680T(config-if-gpon-0/1)#display ont register-info 0 20 --------------------------------------------------------------------- 索引编号 : 3认证方式 : SN认证ONT序列号 : 48575443A8EFC342密码 :ONT类型 : SmartAX MA5620上线时间 : 2010-10-19 05:01:58下线时间 : 2010-10-19 11:58:31下线原因 : ONT掉电--------------------------------------------------------------------- 索引编号 : 2认证方式 : SN认证ONT序列号 : 48575443A8EFC342密码 :ONT类型 : SmartAX MA5620上线时间 : 2010-10-10 12:26:48下线时间 : 2010-10-18 09:36:47下线原因 : ONT掉电--------------------------------------------------------------------- 索引编号 : 1认证方式 : SN认证ONT序列号 : 48575443A8EFC342密码 :ONT类型 : SmartAX MA5620上线时间 : 2010-10-10 12:21:13下线时间 : 2010-10-10 12:23:57下线原因 : ONT的LOSI告警--------------------------------------------------------------------- 有效认证信息条数 : 4从查询中可以判断:ONU 13 离线原因为:ONT光信号丢失告警;根据维护经验告警产生可能原因:1、到ONU侧光路故障,2、设备故障。
华为ONU故障案例分析

华为ONU5620设备故障案例分析故障现象:用户电话3982918不通,无法上网,网管管理不到ONU设备。
处理过程:1、在OLT上查看ONU设备信息PDS-PingDong-MA5680T(config)#inter epon 0/2 进入PON板查看ONU的状态MA5680T(config-if-epon-0/1)#display ont info 4 0 非断电下线查看ONU收光功率MA5680T(config-if-epon-0/2)#display ont optical-info 4 0 (4是端口号 0是ONU id 号)收不到光2、现场查看设备电源正常光信号指示灯LINK灯灭,用PON光功率计收不到光,确定光缆断。
3、光缆修复后,设备可以管理到,但电话和宽带仍然不同登录到ONU重启设备Reboot system 重启设备后故障依旧在OLT上查看ONU设备信息PDS-PingDong-MA5680T(config)#inter epon 0/2查看ONU收光功率MA5680T(config-if-epon-0/2)#display ont optical-info 4 0 (4是端口号 0是ONU id 号)收光正常查看ONU的状态MA5680T(config-if-epon-0/1)#display ont info 4 0 在线,各项正常查看OLT上ONU配置信息Disp service-port 0/2/4Disp service-port 0/2/4 ont 0 (0/2/4是框号/槽号/端口号 0是ONU id)正常查看PON口用户MAC情况MA5680T (config)#display mac-address port 0/2/4 (0/2/4是框号/槽号/端口号)用户VLAN 256-1299同时绑定在上联PON口,无法区分同时与软交换机房联系,查看用户3982918数据。
中兴EPON MAC漂移造成其它用户不能正常上网

中兴EPON设备MAC漂移案例
故障现象:
据维护人员反应新城一小区多个用户报修宽带不能上网,拔号错误676、678,本地连接正常。
用户反应正在上网时,突然掉线,然后就连不上了,而且出现故障的时间都在同一个时间。
该小区是采用光纤+LAN的接入方式,全部使用用中兴的PON设备。
处理过程:
1、首先查看中兴网管,网管上没有与该现象有关的告警。
2、由于本地连接通,可以断定有电。
随机抽取几台设备可以PING通,设备能够管理到。
怀疑是上层数据故障。
3、登录OLT,没有查到关于这个小区的告警。
PON口正常,所有设备在线。
4、检测该PON口下的设备光路都在正常范围。
5、打开设备的环路检测功能,没有检测到环路。
6、由于整个OLT 使用同一个外层V ALN ,其它小区宽带正常,所以排除上层VLAN问题。
7、打开MAC 漂移检测功能,security mac-spoofing-trap enable
security mac-anti-spoofing uplink-protect enable
security mac-anti-spoofing enable 然后使用show security mac-spoofing-log 查看到另一PON口的MAC:cccc.810d.ff55 存在异常,找到异常的ONU。
关闭异常ONU后,该小区的宽带恢复。
分析:
通过这个故障我们认识到中兴网管还存在一些不足。
另外也提醒我们,不同的PON口之间也会出现影响,PON口之间的隔离功能还需要加强。
关于PON网络故障典型案例

关于PON网络故障典型案例目录1、华为PON网络典型故障案例 (2)1.1、B类ONU上行VLAN透传问题 (2)1.2、ONU参数设置问题 (5)1.3、B类ONU更换PON口 (8)2、阿尔卡特PON网络典型故障案例 (13)2.1、OLT上联口故障 (13)2.2、ONU端口异常 (20)1、华为PON网络典型故障案例1.1、B类ONU上行VLAN透传问题故障描述:接到电话保障一个B类ONU无法上网,网管检查该ONU 状态正常,(该ONU有两个上联口,尾纤接1口时ONU无法登陆,接2口时ONU正常登陆)业务配置正常,ONU上能识别到网口下带电脑的MAC地址,但在OLT上查询不到该MAC地址。
故障诊断:定位及处理过程:1、检查该B类ONU状态正常,无任何异常告警。
2、与现场核对CVLAN,SVLAN与网管上配置一致,检查OLT上service port、线路模板配置正常,检查ONU上service port,以太网端口设置均正常。
3、联系现场,把手提电脑接到对应的网口上,长PING网关。
在网管上,进入ONU的命令行,观察该手提的MAC地址能透传上ONU。
4、进入OLT的命令行,查询不到该MAC地址。
5、双击ONU进入网元管理器,检查VLAN是从0/0/1口透传到OLT 的,而状态正常且在用的是0/0/2口,于是把0/0/2口增加到VLAN 的端口列表中。
6、进入OLT的命令行能够查询到该MAC地址,现场反馈业务正常。
分析情况:1、display mac_address port 0/1/1 查看ONU能否获取手提上的MAC地址。
截图012、display vlan xxx 查看vlan是通过哪个上联口向上透传截图02通过截图看出vlan是从1口向上透传的,而现场在用的是2口。
3、display board x/x 查看板卡上端口的状态。
截图03故障分析为1口是DOWN的,2口为UP的。
VLAN无法从1口透传上去。
PON网管原因导致新装户无法上网

PON网管原因导致新装户无法上网
一、故障描述
用户新装100M FTTH宽带,安装后宽带和互动业务无法使用。
二、环境布局
1、ONU型号:创维HGU(GPON/EPON双制式)
2、无线路由器:华为WS5200
3、网络环境:EPON制式
4、ONU收光功率:-18.2dBm
三、故障处置
1、创维HGU的PON灯常亮,说明光猫认证成功。
2、使用用户名FJGDAdmin权限登录创维HGU的后台WEB网管,对HGU进行恢复出厂设置,依旧无法上网和使用互动业务。
3、烽火统一网络管理系统查询到,光猫状态正常。
图1 光猫状态正常
4、OLT QinQ域配置正常。
图2 QinQ域
5、登录集团PON网管,查询到该台HGU的工单下发正常。
图3 HGU工单
6、在“远程操作”里,却未查询到该台HGU的信息。
图4 PON网管终端平台未查询到HGU
7、怀疑是HGU故障,更换一台新的HGU,也存在同样的故障。
8、将该故障类型反馈至集团PON网管支撑人员,经排查原因为PON 网管后台HGU认证失败。
图5 PON网管终端平台查询到HGU
9、经PON网管厂家后台修复后,在“远程操作”里,可查询到该台HGU的信息。
10、现场再次对HGU进行出厂设置后,HGU可正常上网和使用互动业务。
四、故障总结
因集团PON网管的后台原因,导致该类HGU设备无法正常上网时,应先确认本地网络环境是否正常,待本地网络环境正常后,可向集团网管维护人员寻求技术支撑。
PON网络MAC地址欺骗引起PPPOE拨号认证失败的案例

PON网络MAC地址欺骗引起PPPOE拨号认证失败的案例故障现象:2012年7月11日,GPON网络出现大量用户PPPOE拨号认证失败投诉,拨号错误代码676,但同台OLT下部分用户能够正常拨号。
原因分析:PPPOE拨号认证失败原因很多,主要有设备软硬件问题、物理链路问题、PPPOE协议报文丢失等几大类。
此次故障中上报拨号676错误,首先排除物理链路问题(物理链路中断会上报678错误代码),从设备软硬件和协议报文丢失方面分析。
1、从设备软硬件方面分析检查OLT各单板(主控板、上下行板)的告警性能误码状态,发现无任何异常告警和异常性能。
上行G28单板和下行PON板的流量状态也未超负荷,其中上行G28板流量很少,排除设备单板软硬件及网络拥塞问题。
2、查看MAC地址表与现场供电交换机抓包对比分析在网管上用show svc all 命令查看,发现有一个DHCP获得的地址和BARS 相同(00:30:88:01:d6:5b为BRAS的MAC地址),详见下图红色字体标识。
图1 查看故障OLT下的业务流数据上图中红色字体显示,有一个设备DHCP获得的地址和BRAS的相同,该条流标识为“3F8BAB”,该设备还发出了一个ARP广播报文请求IP地址为10.240.136.1的设备,并且该设备DHCP获得1402,58的vlan数值。
通过show crs gem命令找到流标识为“3F8BAB”对应的GEM号,然后在OLT 的交叉连接中找到同GEM号的ONU为ONT-14-3-4,该台ONU下挂了的供电交换机管理vlan正是58,而1402的vlan是在OLT的PON口所标记的svlan,找到该台供电交换机后,在其管理口做镜像抓包结果如下:图2 现场供电交换机管理口镜像抓包截图从上图第一行可以看出,该供电交换机mac地址为00:22:93:55:c0:bf,且发出了请求IP为10.240.136.1设备MAC地址的广播包,与图1数据吻合。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关于PON网络故障典型案例目录1、华为PON网络典型故障案例 (2)1.1、B类ONU上行VLAN透传问题 (2)1.2、ONU参数设置问题 (5)1.3、B类ONU更换PON口 (8)2、阿尔卡特PON网络典型故障案例 (13)2.1、OLT上联口故障 (13)2.2、ONU端口异常 (20)1、华为PON网络典型故障案例1.1、B类ONU上行VLAN透传问题故障描述:接到电话保障一个B类ONU无法上网,网管检查该ONU 状态正常,(该ONU有两个上联口,尾纤接1口时ONU无法登陆,接2口时ONU正常登陆)业务配置正常,ONU上能识别到网口下带电脑的MAC地址,但在OLT上查询不到该MAC地址。
故障诊断:定位及处理过程:1、检查该B类ONU状态正常,无任何异常告警。
2、与现场核对CVLAN,SVLAN与网管上配置一致,检查OLT上service port、线路模板配置正常,检查ONU上service port,以太网端口设置均正常。
3、联系现场,把手提电脑接到对应的网口上,长PING网关。
在网管上,进入ONU的命令行,观察该手提的MAC地址能透传上ONU。
4、进入OLT的命令行,查询不到该MAC地址。
5、双击ONU进入网元管理器,检查VLAN是从0/0/1口透传到OLT 的,而状态正常且在用的是0/0/2口,于是把0/0/2口增加到VLAN 的端口列表中。
6、进入OLT的命令行能够查询到该MAC地址,现场反馈业务正常。
分析情况:1、display mac_address port 0/1/1 查看ONU能否获取手提上的MAC地址。
截图012、display vlan xxx 查看vlan是通过哪个上联口向上透传截图02通过截图看出vlan是从1口向上透传的,而现场在用的是2口。
3、display board x/x 查看板卡上端口的状态。
截图03故障分析为1口是DOWN的,2口为UP的。
VLAN无法从1口透传上去。
结论:通过ONU的MAC地址的透传情况定位为VLAN从ONU 透传到OLT上的设置错误而导致用户无法上网。
通过把在用端口增加到VLAN的端口列表后,业务恢复正常。
解决措施:把在用端口增加到VLAN的端口列表步骤:在网管系统中,进入ONU网元管理器,点击VLAN查询,在端口列表选项中右键增加,勾选在用端口。
截图04同类故障处理指引梳理:1、第一步:了解现场情况,ONU端口在用情况。
2、第二步:通过MAC地址透传的情况,初步定位故障发生的位置。
3、第三步:检查上联口状态及VLAN透传口,判断MAC地址是否有向上透传。
1.2、ONU参数设置问题故障描述:10月19日康裕北苑多家家客异常案例。
现场ONU能正常注册,但ONU里面拨号失败,一直显示正在连接,业务中断。
故障诊断:现场反馈ONU拨号异常,ONU内部拨号显示正在连接。
怀疑问题:OLT 上数据配置出现问题、ONT上数据配置出现问题、光路故障、OLT上层数据配置问题、ONT设备故障,OLT端口故障,用户上联设备不是上报故障ONT等问题。
根据网服报障清单检查网元配置,发现网服清单与现实报障点不一致。
与现场确认报障网元,检查ONU侧与OLT侧收光正常,可排除光缆故障。
检查网管上相关网元无任何异常告警,业务配置、以太网端口设置均正常,报障端口有其他正常在用ONU存在,可排除OLT上配置错误和OLT端口故障,根据MAC地址检查,发现OLT上不能学习到ONT上报的MAC地址,怀疑ONU故障或ONT上数据配置问题。
检查现场ONT配置时,发现WAN口配置情况是:获取IP地址的方式—PPPOE;状态—正在连接;没获取IP;VLAN—41,发现现场配置与OLT数据配置不一致,导致PPPOE连接不上,OLT配置端口VLAN为2159。
判断为ONT配置数据错误。
要求网服现场人员更换正确CVLAN后,拨号正常,业务恢复。
分析情况:经过以上步骤的测试和分析,可以判断现场WAN口配置与实际数据不一致导致这次故障,现场配置VLAN均为41,PPPOE模式。
网管数据配置VLAN 为工单的真实CVLAN.结论:故障站点OLT配置数据为旧模板配置数据,不适合配套现场指引里面的配置数据,需要改动ONU上WAN口配置VLAN为真实的CVLAN。
解决措施:1、出现故障时快速恢复方案检查ONT现场配置数据与网管配置数据是否一致。
在确认OLT数据配置无误后,要求现场把不一致的VLAN更改为正确的CVLAN。
2、隐患预防措施:要求现场开通人员严格按照开通流程配置ONT上数据,切勿擅自修改或创建不符合开通规范的数据。
同类故障处理指引梳理:第一步:telnet到OLT上,检查OLT是否学习到ONU上报的MAC地址第二步:确定OLT上学习不到ONU上报的MAC地址后,检查OLT上配置,主要检查线路模板、业务模板和service-port配置是否正确。
第三步:确认现场配置信息是否与网管一致(获取IP地址的方式、VLAN):注:现场WAN口信息里面的VLAN配置,必须与网管上配置的CVLAN一致,否则会导致业务不通故障。
1.3、B类ONU更换PON口故障描述:现场报障反馈广播电视大学业务全阻;经排查发现该站点之前停用过一段时间,现在需要复通,但是原分光器端口已被其他站点占用,且该分光器下已无可用端口,需要更换PON口,之前的分光器接到西德胜OLT 的5槽3口,现需要把数据换到18槽3口。
故障诊断:定位及处理过程1、经过拔插ONU检查,确认ONU已更换到18槽3口,在OLT的18槽3端口下,点击自动发现ONU,核对SN码,确认ONU已正确连接。
2、进入GPON调度系统http://10.244.78.86:8088/在GPON工单进度查询中以广播电视大学作为工单标题搜索条件进行搜索;进入工单后找出在用端口的CVLAN,SVLAN 等信息;并记录原5板3口下的线路模板名称,IP地址,IP地址掩码,默认网关,管理VLAN等信息后删除原ONU。
解决措施:在18板3口下面配置ONU数据。
1、点击自动发现ONU,确认该ONU后,在弹出的对话框中输入ONU名称并选择线路模板。
按前一步记录下来的线路模板名称搜索相应的模板,并选中2、点击网管管理通道参数,输入相应的IP地址、掩码、网关,管理VLAN等信息;3、按照施工单信息,在OLT上新建service port,如下图。
选中ONU,进入Service Port信息界面,在空白处右键选择增加;选择正确的接口,并输入相应的SVLAN,CVLAN 以及流量模板等信息如上诉方法把施工单上面的8条业务的service port建齐(注意端口一定要选好)。
4、同步ONU数据,由于只更换了OLT的PON口,ONU数据没变,同步后ONU 数据恢复。
与现场核实业务恢复,故障消除。
(如数据丢失,需在ONU上面重新配置VLAN,端口Service Port 等信息)5、报资源组更改资料。
同类故障处理指引梳理:1、第一步:了解现场情况,具体全阻原因2、第二步:根据现场反馈情况,与现场确定拔插确定情况是否与现场描述一致3、第三步:找出相应施工单,根据工单信息结合现场提供信息重新配置OLT端口2、阿尔卡特PON网络典型故障案例2.1、OLT上联口故障故障描述:海珠区四二一医院和琶洲安置区50多家互联网家客用户保障,现场PPPOE 拨号业务和CMCC无线业务均不通。
PPPOE拨号时,电脑提示678错误,连接CMCC无线网络时,获取不了IP地址。
故障诊断:1、检查ONU有无收发光功率异常等告警,检查ONU的状态及软件版本是否正确。
2、检查ONU的相应业务配置是否正确,检查出现故障的ONU端口状态是否正常,能否学习到正确的MAC地址。
3、检查从ONU端口学习到的MAC地址是否能够透传到OLT的PONVLAN及SHUB VLAN处,同时检查所配置的SVLAN及SHUB VLAN是否正确,有无放通到对应的LT板卡及上联板卡。
同时城域网SW亦学习到该MAC地址。
4、检查OLT有无告警,特别是上联板卡,确保上联端口的状态正常,收发光功率正常。
5、该故障中,发现台涌工业区OLT的上联板NTA板的2口处于DOWN状态,没有接收到对应城域网端口发出的光,经监控派单处理,问题定位为光路纤芯问题导致链路断开,经过现场更换纤芯后,NTA板2口能接收到城域网端口发出的光,此时,客户端反馈PPPOE拨号及CMCC无线业务均恢复正常。
分析情况:该故障中,发现台涌工业区OLT的NTA上联板卡的2口处于DOWN状态,但对应的城域网端口却是UP状态。
城域网端口可以收到OLT发出的PPPOE discovery包及DHCP discovery包,也有向OLT回复对应的offer包,但是没有收到OLT发给城域网端口的回复包。
因此初步判断为,OLT与城域网SW对接的收发两根光纤,是捆绑的。
OLT发往SW的包是同时发送的,SW发回OLT的包有部分发到光路断开的一边上,导致有丢包现象,故不能成功建立连接。
处理好光路异常后,故障消除,业务恢复。
结论:应时刻监控OLT上联端口的状态及告警,包括ETHERNET LINKDOWN 告警、LACP LINKDOWN告警及收发光功率异常告警。
一旦发现此类告警,应及时处理,否则有可能影响到较大片区的业务故障。
解决措施:1、出现故障时快速恢复方案(1)检查ONU配置及端口状态是否正常,可尝试更换ONU测试。
(2)检查OLT上联端口状态及告警,若有端口处于DOWN状态,且该OLT 符合双上联条件,可先尝试关闭此端口,然后测试业务是否正常。
(3)派单处理OLT的上联故障光路,重新打开OLT上联端口,使对应OLT 端口能收到城域网端口发出的光。
2、隐患预防措施:监控OLT的上联端口状态,发现端口状态异常及告警,及时处理。
需检查的内容包括如下:上联端口的状态,包括是否处于UP状态等上联端口有无告警,包括ETHERNET LINKDOWN告警、LACP LINKDOWN告警及收发光功率异常告警。
同类故障处理指引梳理:第一步:检查ONU配置及状态,ONU连接端口状态,及能否正常学习到接入设备的MAC地址。
检查ONU配置及状态检查ONU收光功率检查ONU端口状态检查ONU端口能否正常学习到MAC地址第二步:检查ONU端口学习到的MAC地址能否正常透传到PONVLAN及SHUB VLAN处,对应的SVLAN及SHUB VLAN配置是否正确,询问城域网SW是否能学习到MAC地址。
检查MAC地址是否能透传到PONVLAN检查MAC地址是否能透传到SHUB VLAN第三步:检查OLT上联板卡及LT板卡有无告警。
最后,在一切均正常的情况下,需到现场抓包进行问题定位。