GPON设备故障处理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用测距命令在C300上测试无法注册成功站点,发现距离已经超过了PON口默认最大20公里距离。 测试F660距离命令如下。 ZXAN#show gpon onu distance gpon-onu_1/4/1:1 Eqd (bit) Distance(m) ....................................... ................ 0 21336
GPON设备故障处理
故障排除的一般步骤
故障现象观察
故障相关信息收集
循环2
经验判断和理论分析
各种可能原因列表 对每一原因实施排错方案 循环1
故障排除? N
Y
故障排除
恢复实施方案前的网络状态
即初始故障 状态
故障处理基本原则
● 观察
● 维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重程度、 危害程度。
e n v i ro n m e nt Te m p e r a t u re : 4 7 ( C e l s i u r s c a l e )
Upper Fanboard Status
: online
● All fan status:
● Up p er Fa n Tr a y
-------------------------------------------
● 故障现象
● 用户使用C300下挂E8-C终端测试IPTV业务,点播测试正常,但是组播测试黑屏,用户将E8-C终端挂在其它C220 OLT下,点播直播 均正常。
● 分析过程
● 首先检查用户搭建的测试环境配置包括C300和E8-C的配置,检查数据未发现异常,在OLT上做预加入配置,测试点播业务确实正常, 基本可以排除上联端口故障,查看IPTV业务上联端口,发现端口组播流量业务流量并不增加,怀疑是上层组播流未引入 OLT导致组播 业务黑屏,现场抓取C300上联口IGMP数据报文如下:
案例6
● 故障现象
● C300开局后,在U31上创建网元,却无法实现管理,snmp无法ping通。
● 分析过程
● 首先检查网管和C300的连接,互相可以ping通,说明连接没有问题,检查汇聚交换机上的mac地址学习,也没有IP或mac地址冲突的 情况。
● 在网管上对网元执行snmp ping,从C300的上联口抓包,C300能够收到包,但是不回应,说明161端口没有中间设备屏蔽,问题出 在C300上。
● 询问
● 询问相关操作人员,是否有直接原因导致此故障。查询清楚设备的历史操作、历史告警等。
● 思考
● 根据现场查看的故障现象和询问的结果,结合自己的知识进行分析,进行故障定位,判断故障点和故障 原因。
● 动手
● 根据前三个步骤,采取相应的操作,例如修改配置数据、更换单板等。
故障定位
● 故障原因
● 工程问题 ● 外部原因 ● 硬件问题 ● 人为故障 ● 版本问题 ● 设备对接问题 ● ……
能超过单板正常工作温度,导致业务故障。 ● 一般C300默认的风扇转速设置是这样的:单板温度在48度以下(不含48度),风扇转速是全速的25%;单板温度到48度以上58度以下时,风
扇转速为全速的50%;单板温度大于等于58度时,风扇转速会提高到全速的75%。 ● PON板温度高于48度以后,PON板的正常工作就有可能受到影响了,一般PON板能够正常工作的极限温度在55度以下,但是如果温度高于48度,
fan
Speed
-------------------------------------------
1
3
2
3
3
3
-------------------------------------------
案例4
● 故障现象
● 某C300下有一个PON口下多个用户报障,用户上网频繁离线。
● 分析过程
● ONU频繁离线,需要进一步详细了解用户具体故障现象,进行初步判断故障点。 ● 可以尝试进行更换PON口光模块、PON单板排除C300侧硬件问题。 ● 需要使用仪表测量光路是否稳定。 ● 判断是否有个别ONU长发光导致,可以抓取OAM扩展消息,查看首发数据是否有异常报文。
只有离线的告警,没有掉线的告警,可以断定没有长发光现象。 ● 协调局方使用专用的光路测试仪表再次进行测试,最后使用otdr打光分析,发现在olt到onu光路之间,有一个节点光衰耗非常大。由
此可以断定故障点就在此。 再次和局方沟通,调整光路。 ● 局方进行光路调整后,让用户观察几天,用户反馈,没有再出现掉线故障。
● 再次检查SNMP配置: ● snmp-server community public view defaultview rw
snmp-server view allview internet included snmp-server view DefaultView system included ● 最终发现【snmp-server community public view defaultview rw】命令中的defaultview在起作用,当修改为allview时,管理正 常。 ● 添加【snmp-server host 10.3.0.1 trap version 2c public enable NOTIFICATIONS server -index 1 udp-port 162 】trap server命令后,告警正常。
风扇转速提高的50%时,PON工作产生的热量不能及时排出,PON板温度就会继续上升,进而PON板正常工作受到影响。
● 处理结果
● 可行的作法是,把PON板温度控制在48度以下,在PON板温度达到48度时,必须用极大的风扇转速来迅速降低PON板的工作温度,防止PON板 温度继续上升,影响正常工作。
案例3
● 在检查U31网元上的community与C300上配置是否一致时,发现C300的SNMP配置里没有缺省配置community,随即进行配置 【snmp-server community public view default view rw】community与网管一致,配置完成后,网元可以snmp ping通,但是 发现打开机架图或执行其他操作时,显示【获取数据超时】。
● 在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需 要收集的信息包括:
● 1.版本信息,包括系统软件的版本,ONU版本,相关单板版本。 ● 2.提供现场设备的组网图,且特别说明上联口的情况,光口还是电口,半双工还是全双工,自适应还
是强制方式;VLAN划分情况,tagged还是untagged。 ● 3.描述设备基本配置情况,包括ONU数目,单板类型和数量, VLAN划分,端口tag方式。 ● 4.详细描述故障现象。 ● 5.提供相关的告警。
Fa n C o n t r o l Ty p e
: temperature-control
Te m p e r a t u re T h re s h o l d
: 23 38 48 58 (Celsiur scale)
FanSpeedLevelPercent
: 25% 50% 70% 80%
H i g h Te m p e r a t u re T h re sh ol d : 7 0 ( C e l s i u r s c a l e )
案例5
● 处理结果
● 上述信令表示192.168.1.13是Alcatel发出的查询报文,C300组播业务代理地址192.168.2.14发出的加入请求,Alcatel设备在接收 到请求后并未将组播流引入C300上联口,因此查询上联口组播数据包无增长,测试组播业务黑屏,抓包说明反馈局方后,局方再次检 查修改上层组播业务配置,组播业务测试正常,故障解决。
● 现场采用的做法是:在单板温度达到38度后,就把风扇转速提高到50%,温度达到48度时,风扇转速提高到70%, 观察几天,单板温度基本稳定在了40度左右,工作一直正常。
● ZXAN(config)#fan speed-percent-set 25 50 70 80
● ZXAN(config)#show fan
案例7
● 故障现象
● F620上两个POTS口分配了两个号码,并且分别接话机。拨打任何一个号码,两步话机都会振铃。
● 分析过程
● 由该现象判断是语音版配置文件board.conf的参数设置有问题。
● 处理结果
● Telnet 到设备192.168.1.1 上,用户名密码是root / root 。 ● 在 #的提示符下输入vsftpd &, 启动FTP服务进程。 ● 登录FTP ftp://192.168.1.1,用户名密码为 root / root 。 ● 找到地址为etc/config/board.conf 的文件, 复制到本地电脑。 ● 打开board.conf文件 , 修改 id=30026 的参数值为0,配置如下:
● 处理结果
● 用户反馈,出现故障时,电话也无法正常拨打,于是可以判断,故障点在光路或者 OLT侧。 ● 更换PON口的光模块和更换PON口,故障依旧,由此判断故障点在光路或者分光器侧。 ● 到用户家里进行处理,抓取日志,判断是否有长发光ONU信息,查看alarm日志,抓取OAM扩展信息产看是否收发数据正常。查看后,
故障处理方法
● 常用故障定位方法
● 观察分析法 ● 测试法 ● 替换法 ● 配置数据分析法 ● 更改配置法 ● 仪表测试法 ● 经验处理法
作为故障处理人员,须掌握 GPON原理,熟悉设备硬件和组 网结构,掌握基本维护操作。
故障处理注意事项
● 处理过程中如遇到难以定位解决的问题,需尽快联系厂家进行处理。
案例2
● 故障现象
● F660在C300设备上注册不稳定,经常出现F660运行一段时间后无法正常工作。重启设备故障依旧,只 能通过更换F660设备来解决。
● 分析过程
● 通过现场查看跳纤情况,发现现场是C300的GPON口直接通过光纤连接到F660设备,而没有通过分光 器,导致光太强,超过了PON口和F660的最高接收光功率。
处理结果
通过修改测距范围为25公里后,故障得以解决。
修改测距模式的命令如下: ZXAN(config)#interface gpon-olt_1/4/1 ZXAN(config-if)#shutdown ZXAN(config-if)#range-mode 50 250 ZXAN(config-if)#no shutdown ZXAN(config)#show gpon olt range-mode gpon-olt_1/4/1 OltInterface Base-distance(100m) Maximum-distance(100m) -------------------------------------------------------------------- gpon-olt_1/4/1 50 250
案例1
故障现象
F660可以上报SN号,但是完成注册后查看ONU状态一直是“syncmib”。
分析过程
检查分光器是放在C300机房然后通过两个机房的跳纤连接到F660设备,F660放在C300机房的分光器侧注册是能成功的, 把F660放在第一个机房是也可以注册成功,但到了第二个机房和用户那边就无法注册。
● 处理结果
● 通过在C300设备的GPON板的PON口和F660设备之间增加分光器解决。
案例3
● 故障现象
● C300 2号槽位的GPON板,每隔几天就会出现整块PON板上业务中断的故障,更换单板,故障依旧,和相邻槽位的单板对换,2好槽位还是出现 这个问题。
● 分析过程
● 该槽位单板已经是最新版本。 ● 出现故障时,MAC地址学习正常,PON-ONU口有流量,怀疑是硬件导致的丢包问题。 ● 主控板进行了主备倒换,更换了后背板,2号槽位的PON板也和相邻槽位单板进行了对换,但2号槽位还是出现这种故障,说明和硬件没有关系。 ● 根据现场人员反馈,PON板故障时,温度特别高,而且别绪得温度降下去,插回槽位,业务才能恢复,这可能是PON板温度过高导致的问题。 ● 用show temperature查看单板的实时温度,发现这块PON板在白天业务闲时,都能达到45度左右,可想而知,业务繁忙时,温度会更高,有可
GPON设备故障处理
故障排除的一般步骤
故障现象观察
故障相关信息收集
循环2
经验判断和理论分析
各种可能原因列表 对每一原因实施排错方案 循环1
故障排除? N
Y
故障排除
恢复实施方案前的网络状态
即初始故障 状态
故障处理基本原则
● 观察
● 维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重程度、 危害程度。
e n v i ro n m e nt Te m p e r a t u re : 4 7 ( C e l s i u r s c a l e )
Upper Fanboard Status
: online
● All fan status:
● Up p er Fa n Tr a y
-------------------------------------------
● 故障现象
● 用户使用C300下挂E8-C终端测试IPTV业务,点播测试正常,但是组播测试黑屏,用户将E8-C终端挂在其它C220 OLT下,点播直播 均正常。
● 分析过程
● 首先检查用户搭建的测试环境配置包括C300和E8-C的配置,检查数据未发现异常,在OLT上做预加入配置,测试点播业务确实正常, 基本可以排除上联端口故障,查看IPTV业务上联端口,发现端口组播流量业务流量并不增加,怀疑是上层组播流未引入 OLT导致组播 业务黑屏,现场抓取C300上联口IGMP数据报文如下:
案例6
● 故障现象
● C300开局后,在U31上创建网元,却无法实现管理,snmp无法ping通。
● 分析过程
● 首先检查网管和C300的连接,互相可以ping通,说明连接没有问题,检查汇聚交换机上的mac地址学习,也没有IP或mac地址冲突的 情况。
● 在网管上对网元执行snmp ping,从C300的上联口抓包,C300能够收到包,但是不回应,说明161端口没有中间设备屏蔽,问题出 在C300上。
● 询问
● 询问相关操作人员,是否有直接原因导致此故障。查询清楚设备的历史操作、历史告警等。
● 思考
● 根据现场查看的故障现象和询问的结果,结合自己的知识进行分析,进行故障定位,判断故障点和故障 原因。
● 动手
● 根据前三个步骤,采取相应的操作,例如修改配置数据、更换单板等。
故障定位
● 故障原因
● 工程问题 ● 外部原因 ● 硬件问题 ● 人为故障 ● 版本问题 ● 设备对接问题 ● ……
能超过单板正常工作温度,导致业务故障。 ● 一般C300默认的风扇转速设置是这样的:单板温度在48度以下(不含48度),风扇转速是全速的25%;单板温度到48度以上58度以下时,风
扇转速为全速的50%;单板温度大于等于58度时,风扇转速会提高到全速的75%。 ● PON板温度高于48度以后,PON板的正常工作就有可能受到影响了,一般PON板能够正常工作的极限温度在55度以下,但是如果温度高于48度,
fan
Speed
-------------------------------------------
1
3
2
3
3
3
-------------------------------------------
案例4
● 故障现象
● 某C300下有一个PON口下多个用户报障,用户上网频繁离线。
● 分析过程
● ONU频繁离线,需要进一步详细了解用户具体故障现象,进行初步判断故障点。 ● 可以尝试进行更换PON口光模块、PON单板排除C300侧硬件问题。 ● 需要使用仪表测量光路是否稳定。 ● 判断是否有个别ONU长发光导致,可以抓取OAM扩展消息,查看首发数据是否有异常报文。
只有离线的告警,没有掉线的告警,可以断定没有长发光现象。 ● 协调局方使用专用的光路测试仪表再次进行测试,最后使用otdr打光分析,发现在olt到onu光路之间,有一个节点光衰耗非常大。由
此可以断定故障点就在此。 再次和局方沟通,调整光路。 ● 局方进行光路调整后,让用户观察几天,用户反馈,没有再出现掉线故障。
● 再次检查SNMP配置: ● snmp-server community public view defaultview rw
snmp-server view allview internet included snmp-server view DefaultView system included ● 最终发现【snmp-server community public view defaultview rw】命令中的defaultview在起作用,当修改为allview时,管理正 常。 ● 添加【snmp-server host 10.3.0.1 trap version 2c public enable NOTIFICATIONS server -index 1 udp-port 162 】trap server命令后,告警正常。
风扇转速提高的50%时,PON工作产生的热量不能及时排出,PON板温度就会继续上升,进而PON板正常工作受到影响。
● 处理结果
● 可行的作法是,把PON板温度控制在48度以下,在PON板温度达到48度时,必须用极大的风扇转速来迅速降低PON板的工作温度,防止PON板 温度继续上升,影响正常工作。
案例3
● 在检查U31网元上的community与C300上配置是否一致时,发现C300的SNMP配置里没有缺省配置community,随即进行配置 【snmp-server community public view default view rw】community与网管一致,配置完成后,网元可以snmp ping通,但是 发现打开机架图或执行其他操作时,显示【获取数据超时】。
● 在紧急故障处理时,要及时、准确记录必要的信息和处理步骤,以供后续分析故障原因所用;需 要收集的信息包括:
● 1.版本信息,包括系统软件的版本,ONU版本,相关单板版本。 ● 2.提供现场设备的组网图,且特别说明上联口的情况,光口还是电口,半双工还是全双工,自适应还
是强制方式;VLAN划分情况,tagged还是untagged。 ● 3.描述设备基本配置情况,包括ONU数目,单板类型和数量, VLAN划分,端口tag方式。 ● 4.详细描述故障现象。 ● 5.提供相关的告警。
Fa n C o n t r o l Ty p e
: temperature-control
Te m p e r a t u re T h re s h o l d
: 23 38 48 58 (Celsiur scale)
FanSpeedLevelPercent
: 25% 50% 70% 80%
H i g h Te m p e r a t u re T h re sh ol d : 7 0 ( C e l s i u r s c a l e )
案例5
● 处理结果
● 上述信令表示192.168.1.13是Alcatel发出的查询报文,C300组播业务代理地址192.168.2.14发出的加入请求,Alcatel设备在接收 到请求后并未将组播流引入C300上联口,因此查询上联口组播数据包无增长,测试组播业务黑屏,抓包说明反馈局方后,局方再次检 查修改上层组播业务配置,组播业务测试正常,故障解决。
● 现场采用的做法是:在单板温度达到38度后,就把风扇转速提高到50%,温度达到48度时,风扇转速提高到70%, 观察几天,单板温度基本稳定在了40度左右,工作一直正常。
● ZXAN(config)#fan speed-percent-set 25 50 70 80
● ZXAN(config)#show fan
案例7
● 故障现象
● F620上两个POTS口分配了两个号码,并且分别接话机。拨打任何一个号码,两步话机都会振铃。
● 分析过程
● 由该现象判断是语音版配置文件board.conf的参数设置有问题。
● 处理结果
● Telnet 到设备192.168.1.1 上,用户名密码是root / root 。 ● 在 #的提示符下输入vsftpd &, 启动FTP服务进程。 ● 登录FTP ftp://192.168.1.1,用户名密码为 root / root 。 ● 找到地址为etc/config/board.conf 的文件, 复制到本地电脑。 ● 打开board.conf文件 , 修改 id=30026 的参数值为0,配置如下:
● 处理结果
● 用户反馈,出现故障时,电话也无法正常拨打,于是可以判断,故障点在光路或者 OLT侧。 ● 更换PON口的光模块和更换PON口,故障依旧,由此判断故障点在光路或者分光器侧。 ● 到用户家里进行处理,抓取日志,判断是否有长发光ONU信息,查看alarm日志,抓取OAM扩展信息产看是否收发数据正常。查看后,
故障处理方法
● 常用故障定位方法
● 观察分析法 ● 测试法 ● 替换法 ● 配置数据分析法 ● 更改配置法 ● 仪表测试法 ● 经验处理法
作为故障处理人员,须掌握 GPON原理,熟悉设备硬件和组 网结构,掌握基本维护操作。
故障处理注意事项
● 处理过程中如遇到难以定位解决的问题,需尽快联系厂家进行处理。
案例2
● 故障现象
● F660在C300设备上注册不稳定,经常出现F660运行一段时间后无法正常工作。重启设备故障依旧,只 能通过更换F660设备来解决。
● 分析过程
● 通过现场查看跳纤情况,发现现场是C300的GPON口直接通过光纤连接到F660设备,而没有通过分光 器,导致光太强,超过了PON口和F660的最高接收光功率。
处理结果
通过修改测距范围为25公里后,故障得以解决。
修改测距模式的命令如下: ZXAN(config)#interface gpon-olt_1/4/1 ZXAN(config-if)#shutdown ZXAN(config-if)#range-mode 50 250 ZXAN(config-if)#no shutdown ZXAN(config)#show gpon olt range-mode gpon-olt_1/4/1 OltInterface Base-distance(100m) Maximum-distance(100m) -------------------------------------------------------------------- gpon-olt_1/4/1 50 250
案例1
故障现象
F660可以上报SN号,但是完成注册后查看ONU状态一直是“syncmib”。
分析过程
检查分光器是放在C300机房然后通过两个机房的跳纤连接到F660设备,F660放在C300机房的分光器侧注册是能成功的, 把F660放在第一个机房是也可以注册成功,但到了第二个机房和用户那边就无法注册。
● 处理结果
● 通过在C300设备的GPON板的PON口和F660设备之间增加分光器解决。
案例3
● 故障现象
● C300 2号槽位的GPON板,每隔几天就会出现整块PON板上业务中断的故障,更换单板,故障依旧,和相邻槽位的单板对换,2好槽位还是出现 这个问题。
● 分析过程
● 该槽位单板已经是最新版本。 ● 出现故障时,MAC地址学习正常,PON-ONU口有流量,怀疑是硬件导致的丢包问题。 ● 主控板进行了主备倒换,更换了后背板,2号槽位的PON板也和相邻槽位单板进行了对换,但2号槽位还是出现这种故障,说明和硬件没有关系。 ● 根据现场人员反馈,PON板故障时,温度特别高,而且别绪得温度降下去,插回槽位,业务才能恢复,这可能是PON板温度过高导致的问题。 ● 用show temperature查看单板的实时温度,发现这块PON板在白天业务闲时,都能达到45度左右,可想而知,业务繁忙时,温度会更高,有可