2020年烽火通信PTN设备故障处理解决方案参照模板
烽火PTN设备常见告警解析
目录
• PTN设备简介 • 常见告警分类 • 告警解析及处理 • 案例分析 • 总结与建议
01 PTN设备简介
PTN设备定义
PTN(Packet Transport Network)设备是一种用于传输数据包(如IP、MPLS) 的网络设备,它提供了一种可靠的、低延迟的、高带宽的数据传输解决方案。
02
软件更新通常会修复已知的bug,提高设备的稳定性和安全性, 因此建议用户及时更新。
03
在进行软件更新之前,建议备份重要数据,以防更新过程中 出现意外导致数据丢失。
加强网络监控与维护
建立完善的网络监控体系,实时监测烽火ptn设备 的运行状态和网络流量。
对于异常流量和告警信息,及时进行分析和处理, 确保网络稳定运行。
PTN设备基于分组交换技术,支持多种数据业务,如IP/MPLS、以太网、TDM等 ,能够满足不同业务的需求。
PTN设备功能
高速数据传输
PTN设备支持高速数据传输,能 够提供高带宽、低延迟的数据传
输服务。
可靠性
PTN设备具备较高的可靠性,支持 快速的保护切换和恢复机制,能够 保证数据传输的稳定性和可靠性。
01
网络连接断开告警
设备网络连接断开,无法进行通信。
丢包告警
设备在网络传输过程中出现数据包 丢失现象。
03
02
网络延迟告警
设备网络传输延迟较高,影响数据 传输效率。
IP地址冲突告警
设备IP地址与其他设备冲突,导致网 络通信异常。
04
03 告警解析及处理
硬件告警解析及处理
硬件故障告警:设备硬件故障,如风扇 、电源、板卡等,可能导致设备运行异 常。
PTN常见故障处理(I)幻灯片
软件漏洞
及时更新软件补丁,修复已知 漏洞。
配置故障处理
总结词
配置故障处理是针对PTM设备配置问 题的修复和优化过程。
02
IP地址配置错误
检查IP地址配置是否正确,如有问题 及时修复IP地址配置错误。
01
03
VLAN配置错误
检查VLAN配置是否正确,如有问题 及时修复VLAN配置错误。
路由配置错误
检查路由配置是否正确,如有问题及 时修复路由配置错误。
设备状态检查
检查相关设备的工作状态,如设备指 示灯、告警信息等,以进一步缩小故 障范围。
故障类型判断
告警信息分析
根据设备上报的告警信息,判断故障类型,如丢包、时延等。
业务影响评估
分析故障对业务的具体影响,如是否影响核心业务、影响程度等。
故障点精确定位
环回测试
通过环回测试定位故障点,检查数据传输的起点和终点是否正常。
告警信息分析
分析告警日志
查看设备的告警日志,分析告警原因及影响范围,以 便快速定位故障。
分析性能指标
检查设备的性能指标是否正常,如CPU使用率、内存 占用率等,若有异常应及时处理。
分析网络流量
检查设备的网络流量是否正常,若有异常应及时排查。
02
PTN故障定位
故障范围确定
故障范围初步判断
根据故障现象,初步判断故障影响范 围,是局部故障还是全局故障。
端口故障
检查端口连接是否正常,如有问题及时更 换端口模块。
软件故障处理
操作系统故障
重新安装或升级操作系统,确 保系统正常运行。
软件兼容性问题
检查软件是否与硬件兼容,如 有问题及时更换软件版本。
总结词
PTN故障处理
PW配置
Tunnel配置
PW配置
透传设备
BTS 接入侧PTN UNI 接入侧PTN NNI
核心侧PTN NNI 核心侧PTN UNI BSC
(PTN,波分设备等)
业务配置
业务配置
在开局中,大家的一个工作难点主要在于如何能够快速有效地排除故 障。接下来我们就一起探讨一下排障的方法。
业务丢包、错包的可能原因
业务丢包、错包的可能原因: ➢ 端口光功率异常或光功率不稳定,这是开局中最常见的丢包原因 ➢ 时钟未跟踪,或跟踪源不稳定,会导致周期性丢包 ➢ Tunnel下一跳端口IP设置错误(比如设置为本端端口)可能会导致丢包 ➢ 网络侧发生拥塞,由于现网基本是轻载状态,拥塞可能性较小
(PTN,波分设备等)
业务配置
业务配置
与无线对接的设置: ➢ BSC的时隙模式与PTN是否一致 ➢ 注: PTN设备只支持华为模式, 如果BSC设置为阿-朗模式则业务不通 ➢ 这是对接时较常出现又易被忽略的 ➢ 两侧PTN时钟是否有跟踪, 无线设备(BSC与BTS)是否有输出GPS时钟 ➢ 时钟未同步是对接测试中“语音质量不稳定” 最可能的原因
排查业务丢包、错包的思路:
➢ 找出与“有问题的业务”走相近链路的业务,看是否有类似问题,以此缩小范
业务A围
网元A
网元C
网元D
网元E
业务B
网元B
如果业务A有丢包,业务B不丢,则问题应该 在网元A与网元C之间
端到端的检测方法—ETH OAM(1)
Eline业务端到端检测的两种方法: ➢ 通过SmartBits等仪表打流,远端UNI口环回的方法 ➢ 通过建立“ETH OAM”检测业务的通断 ➢注:在没有条件进行“仪表实际打流量”测试时,可使用ETH OAM测试
烽火通信PTN设备故障处理解决方案
XSJ2单盘告警原因及检查
☻名称:TEMP_TCT ☻中文解释:盘温过限
☻原因:单盘温度超过网管设置的温度告 警门限值
☻检查方法:
➢ 1、检查网管界面设置的温度告警门限值, 可能设置的告警门限太小;
➢ 2、检查机架风扇是否停转; ➢ 3、检查单盘硬件、软件版本是否和网管软
件版本匹配。
XSJ2单盘告警原因及检查
➢ 1、检查远端有没有将TMC CV使能打开; ➢ 2、检查远端的TMC OAM配置中MEG_ID MEP_ID
等是否和本端一致; ➢ 3、检查交叉盘是否转发了数据包; ➢ 4、检查背板接口的link状态。
XSJ2单盘告警原因及检查
☻名称:TMS_LOC ☻中文解释:TMPLS段层连接确认信号丢
失
XSJ2单盘告警原因及检查
☻名称:TMP_LOC ☻中文解释:TMPLS通道连接确认信号丢
失
☻原因:当某路TMP的CV帧使能打开,但 是又没有接收到TMP的CV帧时,会有 TMP_LOC告警产生
☻检查方法:
➢ 1、检查远端有没有将TMP CV使能打开; ➢ 2、检查远端的TMP OAM配置中MEG_ID
☻名称:RF ☻中文解释:收无光 ☻原因:光模块没有检测到接收光 ☻检查方法:
➢ 1、检查有无输入光信号; ➢ 2、检查光纤是否折断; ➢ 3、在线更换XFP光模块。
XSJ2单盘告警原因及检查
☻名称:TF ☻中文解释:激光器发送失效 ☻原因:发送光功率小于-10dBm认为发送
失效 ☻检查方法:在线更换XFP光模块
E1J1单盘告警原因及检查
☻名称:CARD_ABSENT ☻中文解释:盘不在位 ☻原因:单盘没有上网管 ☻检查方法:
➢ 1、相应槽位是否有单盘; ➢ 2、相应槽位单盘是否插好; ➢ 3、相应槽位单盘是否工作正常。
PTN设备典型故障处理
典型故障处理
IMA业务故障处理
故障原因
人为操作失误原因
– 人为插入告警戒误码 – 人为设置环回
设备/单板故障
故障定位流程
如右侧流程图
开始
设备是否运行正常 (如设备是否自动重启、网元
断链、子卡不在位) YES
查看与设备连接的 端口是否正常UP,光功率接收
是否在正常范围 YES
同一设备的共同出口 的其他业务是否正常
2M支路信号迚行终端侧环回,并接入误码仦 测 试 , 如 果 误 码 仦 2M电信号丢失告警丌消失, 则判定原因可能是2M接口板的接口丌好、2M线断戒配线架同轴头未焊好,可更换 2M接口 戒更换电缆解决。
人为误码告警和环回的插入。
– 取消设置人为误码、告警和环回的插入。
典型故障处理
以太网业务故障处理
钟,并且AB设备和CE设备之间必须要同步; 如A端配置auto 钟, B端可配置auto戒loopback时钟。
典型故障处理 IMA业务故障处理 故障现象 业务全部丌通,同时网管上报告警戒性能。 业务全部丌通, 同时网管上无任何告警戒性能。 部分子卡业务丌通。 子卡上的某些支路业务丌通。 业务出现误码。 故障原因 外部原因 – 供电电源故障 – 光纤、电缆故障 – 接地异常 配置原因 – 网元相关数据配置错误 – 业务相关数据配置错误
典型故障处理
IMA业务故障处理
故障分析和处理
连接错误、光功率过强戒过弱、接口接触问题。
– 排除连接错误。 – 通过光模块光纤自环, 检查光模块是否正常。 – 检查光模块的型号,决定是否更换光模块戒增加光衰。 – 检查业务电缆是否有虚焊、漏焊、接触丌良现象,此原因会导致个别2M业务丌通现象。对
如右侧流程图
[信息与通信]烽火PON设备故障处理手册
[信息与通信]烽火PON设备故障处理手册附件四:烽火PON设备故障处理手册目录一、基本语音业务配置方法 (2)1.1语音配置流程图 (2)1.2基本语音业务配置方法 (3)1.2.1局端vlan配置 (3)1.2.2 AC16配置 (4)1.2.3 ONU端用户语音业务配置 (7)二、语音故障处理流程图 (8)三、定位语音业务故障基本原则 (9)3.1检查外线 (9)3.2核对配置 (10)3.3检查硬件 (10)3.4检查上层路由 (10)3.5抓包分析 (10)四、基本语音业务故障分类查找 (11)4.1网关未注册上软交换 (11)4.2端点未注册上软交换 (12)4.3摘机无拨号音 (14)4.4被叫不振铃 (17)4.5主叫拨打电话听忙音 (19)4.6放置一段时间后不能正常通话 (21)4.7摘机有拨号音,但语音不通或单通 (23)4.8语音质量 (29)五、增值语音业务故障分类查找 (32)5.1来电显示 (32)5.2传真/Modem (34)5.3 POS机/彩票机 (41)5.4智能公话 (43)5.5话吧计费业务 (47)附一语音业务高级配置参数 (50)1.NGN心跳参数配置 (50)2.软交换平台互通参数配置 (50)一、基本语音业务配置方法1.1语音配置流程图烽火EPON系列产品采用集中式网管管理,语音业务开通主要由局端配置和远端ONU配置两大步。
局端配置用于配置各ONU共同的配置项,例如软交换平台地址,vlan等;ONU配置用于配置ONU的配置项,例如IP地址,域名和端口ID等。
其流程如下:1.2基本语音业务配置方法1.2.1局端vlan配置在GSWC盘上点右键,选择“配置”----“局端vlan”,打开配置窗口,按照以下说明填写相关信息:业务类型:包含data、iptv、ngn、voip、vod、cncview、system,此项选择只是用来显示作用,并不代表实际意义。
烽火-PTN常见故障的定位与排除
光通信专家
故障一
操作步骤 1:将局1 (0B槽位)、局2(08槽位)的XSJ2(线路盘)中的单盘配置 打开,找到LINE口物理接口配置下的TMS-OAM配置中的CV帧发送使能
光通信专家
故障一
☻操作步骤2:查看局1( 0B槽位)、局2(08槽位)的 XSJ2(线路盘)中的当前告警,看有无TMS_LOC告 警。 若有TMS_LOC告警,则说明此时局1( 0B槽位)不是 接的局2(08槽位),将局2(0B槽位)的XSJ2(线路 盘)中的单盘配置的CV帧发送使能后,若局1(0B槽 位)TMS_LOC告警消失,即连纤有问题。 若无TMS_LOC告警,则说明连纤没问题,故障定 位在了局2支路盘上,即支路盘出现故障,可以通 过软复位、硬件插拔或更换单盘来定位故障。
光通信专家
MEP、MIP相应OAM操作
光通信专家
OAM的层次
光通信专家
相应层次在PTN设备中的位置
光通信专家
OAM告警
☻MMG:收不匹配的MEG-ID。 ☻UNM:MEG-ID匹配的情况下,收到CV帧的源 MEP-ID与本地期望值不匹配。 ☻UNP:MEG-ID和期望的MEP-ID匹配的情况下, 收到CV帧的时间间隔和本地发送时间间隔不匹配。 ☻LOC:连续3.5个发送周期内没有收到正确的CV帧。 ☻RDI:用于MEP通知其对等MEP它发生了缺陷情况, 只应用于双向T-MPLS连接中。其信息由存在缺陷 的MEP发起,并周期性地向其对等MEP发送直至 缺陷情况被清除。
660-XCUJ1盘(源站)
在XCUJ1单盘上,性能如下:
在XCUJ1单盘上,业务走向如右图所示:
光通信专家
660-XSJ2盘(源站)
在XSJ2单盘上,性能如下:
PTN常见问题及处理方法
PTN常见问题及处理方法1.使用单站方式创建的以太网业务不通可能原因如下:1)如果是以太网汇聚业务,是否配置了转发过滤表,需要注意的是对于专网业务无论是PW承载还是端口承载,均需要配置转发过滤表;2)首先通过ping测试方法排除Tunnel、pw是否不通;3)如果是通过两台PC机ping包测试,需要检查对应业务端口的tag属性是否设置为Access属性,VLAN ID是否一致。
2.IMA组状态不正常,近端组状态和远端组状态均不是可操作状态;这个主要是IMA组对应的E1链路没有连接导致,可以通过对该E1端口进行硬环回或软件环回,该告警即可消失;3.如何更改POD41单板的光口速率;操作如下:网管上可以通过在单板面板图上先删除对应端口,然后重新添加端口,选择对应的端口速率即可,操作如下:步骤1:步骤2步骤3:配置端口速率级别4.以太网汇聚业务配置完毕测试不通问题在目前的配置手册中关于以太网汇聚业务配置存在一点问题,对于PW承载的汇聚业务资料上表示不需要配置转发过滤表,资料有误。
也是需要创建转发过滤表的。
5.网管上发现PTN面板均为灰色这个主要是因为新设备未进行数据配置而网元处于安装态导致。
处理方法1:通过navigator工具使用命令:cfg-verify命令进行校验一下;处理方法2,通过T2000网管在网元的面板图中先删除主控板SCA或CXP,然后再添加该主控板,网元即可变为运行态,逐个添加逻辑单板即可。
6.动态Tunnel创建完毕,状态为create fail;可能原因:1、物理链路不可用,需要检查对应的物理链路状态及告警;2、对应端口ISIS协议未使能,需要在控制平面中进行使能操作;7.CES业务使用2M误码仪测试不通;1、首先排除误码仪设置是否有误,2M线缆连接是否完好,收发是否正确;2、排除仪表和线缆的原因,然后检查对应的Tunnel状态是否正常,可以使用MPLS OAM功能对Tunnel进行ping测试;3、对该CES业务对应的PW进行ping测试,确认PW是否创建成功;4、因为有些仪表可能发送的是非成帧信号,而CES业务配置时默认为CRC4的成帧格式,可以通过修改CES业务为非成帧格式处理;8.通过路径方式创建动态Tunnel不成功;可能原因:1、在创建Tunnel的过程中,增加了约束路由,但是约束路由配置错误,这里的约束路由端口IP一般只需填正向或反向路由上的接收端的端口IP,不是发送端的IP,而且不要填设为网元的LSR ID。
PTN设备故障处理总体解决方案
E1J1单盘告警原因及检查
☻名称:CONTEXT_FAIL ☻中文解释:建链失败 ☻原因:单盘未正常运行或者仿真芯片没有正常
工作 ☻检查方法:
➢ 1、检查单盘配置; ➢ 2、读取E1J1状态、性能,看E1仿真是否正常运行; ➢ 3、软件复位; ➢ 4、插拔单盘; ➢ 5、替换单盘。
E1J1单盘告警原因及检查
DZB_IN CONTEXT_PACKET_
LOS CARD_ABSENT
中文解释 电源故障告警 系统时钟丢失 PDH物理接口信号丢失 连接信号丢失
建链失败 端子板不在位 本端链路包丢失
盘不在位
E1J1单盘告警原因及检查
☻名称:POWERALM ☻中文解释:电源故障告警 ☻原因:1.2V 1.5V 1.8V 告警原因及检查
☻名称:PK_LOS ☻中文解释:丢包率过限 ☻原因:交换机内的丢包数超过了设定的门限值 。 ☻检查方法:
➢ 1、检查网管界面上端口的收发包数; ➢ 2、检查单盘配置中门限设置。
ESJ1单盘告警原因及检查
☻名称:PTP_LOS ☻中文解释:PTP同步丢失 ☻原因:PTP同步丢失 。 ☻检查方法:本地和对端PTP设置是否匹配。
➢ 1、检查有无输入光信号,检查输入光功率; ➢ 2、检查光纤是否折断; ➢ 3、拆下机盘,然后上电检查激光器是否工作正常。
GSJ2单盘告警原因及检查
☻名称:TF ☻中文解释:发送失效 ☻原因:千兆以太网光模块发送信号失效 ☻检查方法:
中文解释 电源故障告警 连接信号丢失
发送失效 TMC连接确认信号丢失 TMP连接确认信号丢失 TMS连接确认信号丢失
系统时钟丢失 机盘温度过限
GSJ2单盘告警及解释(续)
告警名称 PTP_ LOS IOP_HIGH IOP_LOW LASER_TCT
PTN业务故障常用的处理方案
PTN业务故障处理方法
故障定位的基本原则为三句话:先主后次、由外而内、逐步深入。
先主后次:障产生时通常伴随着告警,首先需要分析告警,应首先分析高级别的告警(如紧急告警、主要告警),然后再分析低级别的告警(如次要告警和提示告警)。
由外到内:在界定故障类型时,应先排除外部的可能因素,如链路故障、电源故障、温度过高等;其次是排查配置是否正确,如时钟跟踪、对接参数、门限设置等;最后才是具体定位故障点。
逐步深入:在定位故障点时,遵循逐步缩小范围的原则,先确认是网络侧问题还是用户侧问题,然后进一步定位到是某一段链路问题或故障网元的某块单板问题。
首先,核实网管网元告警是否和业务有关的告警。
查询影响的业务或者是tunnel
核实网元tunnel的连通性,查询tunnel的APS是否正常倒换,保护tunnel是否正常。
查看保护组的状态
通过LSP ping测试tunnel是否正常
设置需要测试参数,正向、反向都需要分别配置。
关注:包长:64、512、1400字节,覆盖长短包。
包数:50。
优先级:0、7,覆盖高低优先级。
核查PWE3业务是否故障。
通过以太OAM测试核实PWE3业务连通性
进入以太OAM测试界面,设置LB参数
查看以太OAM测试结果LB测试信息:没有超时,LB统计信息:发送报文个数和接收报文个数相等
可通过VCCV ping来检测PWE3业务的连通性。
查看运行结果,看业务是否故障。
烽火通信PTN设备故障处理解决方案
➢ 1、检查单盘配置; ➢ 2、读取E1J1状态、性能,看E1仿真是否正常运行; ➢ 3、软件复位; ➢ 4、插拔单盘; ➢ 5、替换单盘。
E1J1单盘告警原因及检查
☻名称:DZB_IN ☻中文解释:端子板不在位 ☻原因:相应槽位端子板不在正常工作状
态 ☻检查方法:
➢ 1、插拔端子板; ➢ 2、替换端子板; ➢ 3、更换E1J1及IEJ1的槽位。
➢ 1、检查光模块是否在位; ➢ 2、检查激光器散热是否良好。
XSJ2单盘常见告警及解释
告警名称 POWERALM TEMP_TCT
RF TF LASER_OFF TMC_LOC TMS_LOC TMP_LOC
中文解释 电源故障告警
盘温过限 收无光
激光器发送失效 激光器软关断
TMC连接确认信号丢失 TMS连接确认信号丢失 TMP连接确认信号丢失
➢ 1、读取E1J1单盘状态、性能,核对相应软硬 件版本;
➢ 2、软件复位E1J1单盘; ➢ 3、插拔单盘; ➢ 4、替换单盘。
E1J1单盘告警原因及检查
☻ 名称:SCLK_LOS ☻中文解释:系统时钟丢失 ☻原因:检测不到从背板过来的有效参考时钟时,会
上报系统时钟丢失告警 ☻检查方法:
➢ 1、读取XCU的状态、性能,看XCU是否正常工作; ➢ 2、进行XCU主备切换; ➢ 3、进行E1J1软件复位; ➢ 4、插拔E1J1单盘; ➢ 5、替换E1J1单盘; ➢ 6、更换E1J1单盘相应槽位。
☻名称:IOP_LOW ☻中文解释:输入光功率过低 ☻原因:激光器输入光功率过低 ☻检查方法:
➢ 1、检查光模块是否在位; ➢ 2、检查光输出端输出的光功率是否过低; ➢ 3、检查端口门限设定是否合适。
PTN设备故障处理
常用工具以及仪 表
常用工具以及仪 表
故障处理操作
故障处理基本流程 故障处理基本原则 一般故障原因 故障定位原则 故障定位基本方法
故障处理基本流 程
故障处理基本原 则
故障定位到单站后,排除单站内单板的问题。
– 例如某站光线路板有告警,怀疑收发光纤接反,则可将收、发两根光纤互换。 若互换后,光线路板告警消失,说明确实光纤接反。
解决电源、接地问题。
– 例如怀疑某设备输入电源和接地有问题,可以更换一路输入电源和接地端子 来定位排除。
故障定位基本方 法
配置数据分析法
替换法是指使用一个工作正常的物件去替换一个被怀疑工作丌正常 的物件,从而达到定位故障、排除故障的目的。这里的物件,可以 是一段线缆、一块单板戒一端设备。
排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等。
– 若是交换机戒中继线的问题,则可不其他正常通道互换一下。若互换后告警 发生了转移,则说明是外部中继电缆戒交换机的问题,若互换后故障现象丌 变,则可能是传输的问题。
设备对接问题
线缆连接错误。 设备接地问题。 传输、交换网络之间时钟同步问题。
设备原因
设备原因指由亍传输设备自身的原因引发故障,主要包 括设备损坏和板件配合丌良。其中的设备损坏是指在设 备运行较长时间后,因板件老化出现的自然损坏。
故障定位原则
故障定位的一般原则:
在定位故障时,应先排除外部的可能因素,如光纤断、 交换故障戒电源问题等,再考虑传输设备的问题。
在定位故障时,要尽可能准确的定位故障站点,再将故 障定位到单板。
烽火通信PTN设备故障处理解决方案
ESJ1单盘告警原因及检查
☻名称:RX_ERR ☻中文解释:收坏包过限 ☻原因:交换机接收到的坏包数超过了设定的
门限值。 ☻检查方法:检查网管界面上端口的收发包数
和门限设置。
光通信专家
GSJ2单盘常见告警及解释
告警名称 POWERALM
LINK_LOS TF
☻名称:PPI_LOS ☻中文解释:PDH物理接口信号丢失 ☻原因:E1信号没有正常接入 ☻检查方法:
➢ 1、检查E1信号是否正常从端子板前面板接入; ➢ 2、读取本盘状态、性能,看是否正常。
光通信专家
E1J1单盘告警原因及检查
☻名称:LINK_LOS ☻中文解释:连接信号丢失 ☻原因:系统口没有和交叉盘连接 ☻检查方法:
➢ 1、检查网管界面上端口的收发包数; ➢ 2、检查单盘配置中门限设置。
光通信专家
ESJ1单盘告警原因及检查
☻名称:PTP_LOS ☻中文解释:PTP同步丢失 ☻原因:PTP同步丢失 。 ☻检查方法:本地和对端PTP设置是否匹配。
光通信专家
烽火通信PTN设备故障处理解决 方案
烽火通信科技股份有限公司 客服中心 刘永珍 2010年03月
内容摘要
1 PTN设备常见告警解析 2 OAM简介及其应用 3 典型故障处理案例
光通信专家
E1J1单盘告警及解释
告警名称 POWERALM SCLK_LOS
PPI_LOS LINK_LOS CONTEXT_FAIL
TMC_LOC TMP_LOC TMS_LOC SCK_LOC TEMP_TCT
中文解释 电源故障告警 连接信号丢失
发送失效 TMC连接确认信号丢失 TMP连接确认信号丢失 TMS连接确认信号丢失
PTN常见故障的定位与排除
故障二
☻故障分析:首先根据现象可以排除光路即TMS层故 障,此故障就定位在TMP或TMC层。 ☻故障定位方案:使用TMP、TMC层CV帧、LB帧的故障 定位能力。主要包括交叉配置错误定位,单盘硬件 故障定位等。
故障二
操作步骤 1:将局1、局3的XCUJ1中的单盘配置打开, 找到入TUNNEL表配置下不通业务的所在条目(通过LABEL值 进行查找),将相应的TMP-OAM配置中的CV帧发送使能
故障一
☻网络拓扑
☻故障现象描述:局1经过局2向局3下业务, 业务正常,局1向局2下业务,业务不通。
故障一
☻故障分析:此故障属于TMS层故障或硬件故障,初步判 定为连纤接错或交叉盘出现故障。 ☻故障定位方案:使用TMS层 CV帧检测光路连接是否正确, 并对连接错误的位置进行快速定位,若光路连接正常, 将进行主备交叉盘的切换,以此来判断交叉盘工作是否 正常。
故障一
配置文件拓扑连纤
实际连纤情况
故障一
☻总结:在PTN设备中,光口属于TMS层,光口之间连 纤非常重要,一定要遵循东发西收的原则。并且在 判断线路盘初相故障时一定要非常确定,由于线路 盘上有很多直通的业务,不能轻易对线路盘进行插 拔纤、更替单盘等物理操作。
故障二
☻ 网络拓扑
☻故障现象描述:局1沿长径到局3有若干条百兆业务 (不同支路盘) ,部分业务正常,部分业务不通。 (备注:此类问题在工程现场较复杂,有可能涉及 到外部交换机等设备,定位方式采用先内部、后外 部,先内口、后外口。)
故障二
☻操作步骤2:查看局1( 0B槽位)、局2(08、0B槽位) 局3 (08槽位)的XSJ2(线路盘)中的当前告警,看有 无TMP_LOC告警。 若无TMP_LOC告警,则说明通道正常,这时请查看源宿 站点相应单盘的状态,看业务是否正常上下话 ,若没 有正常上下话,请检查交叉及相应的单盘配置 若有TMP_LOC告警,则说明此单盘没有收到相应方向发 过来的CV帧,那么故障就定位在与此单盘通信的单盘 和此单盘之间。
PTN典型故障解决
目录目录目录 (1)典型故障及处理方法 (2)1.1 带内DCN故障处理 (2)1.2 MPLS Tunnel故障处理 (6)1.3 PW故障处理 (7)1.4 CES业务故障处理 (9)1.5 以太网业务故障处理 (13)1.6 时钟故障处理 (16)1.7 QoS故障处理 (17)1.8 LAG故障处理 (21)典型故障及处理方法1.1 带内DCN故障处理介绍带内DCN出现故障时的现象、对系统的影响、可能原因、排除该故障时需要的工具、注意事项以及处理步骤等。
A、前提条件:查看工程文档,确认网元各个单板均使用配套版本。
B、故障现象:处理带内DCN的故障时,通常会遇到以下故障现象。
✧网管与网元通信中断,网管上网元图标变灰色,网元脱管。
✧网管操作命令没有响应。
若响应中断时间持续超过2分钟,网管与网元通信中断。
✧网管查询信息部分丢失。
C、故障处理流程图:带内DCN故障处理流程图如下图所示。
图带内DCN故障处理流程图D、对系统的影响✧网元和网管通信中断后,通过该网元来保持与网管通信的网元,若无其它方法连接网管,也将处于脱管状态。
其它网元则无影响。
✧若承载带内DCN的物理通道故障,则会影响该物理通道上承载的其它业务。
E、可能原因:对应故障处理流程图,带内DCN故障原因如下✧全网内的网元ID、网元IP或者子网掩码存在冲突。
✧故障网元的带内DCN端口未使能,或对接端口参数配置不一致。
✧故障网元与网管之间的物理连接中断。
✧接收信号丢失或接收光功率过低,无法提取DCN报文。
✧单板故障。
✧DCN穿越的第三方网络不健康,引入DCN风暴或DCN中断。
✧带内DCN通道带宽配置过低。
✧故障网元主控板正在复位或发生了主备倒换,带内DCN报文得不到响应。
a)处理带内DCN故障时✧如果网元通信中断,先处理网关网元的故障,再处理非网关网元的故障。
✧如果网元通信未中断,先处理非网关网元的故障,再处理网关网元的故障,避免造成非网关网元脱管。
烽火设备常见故障处理
f 五
术
通 信技 术
烽火设备常见故障处理
王银 敏 谷 艳萍
( 中国联合 网络通信有限公司菏泽市分公 司 山东菏泽 2 7 4 0 0 0 )
摘要: oL T 上联 口是s F P 电 口模块 , 接R J 4 5 的 网线; 也可 以把s F P 电模 块换 成s F P 光模块接 光 纤用。 若oL T 上联 口接 网线传千 兆带宽的话 , 则需要确 定对端也 支持 千 兆, 否则 自 动协 商成 了百兆就 没法使 用; 同时也建议 用按照 千兆 网线制作方 法制作 的网线 。 烽) " L O L T _ k . 联口 数 据 配置 错误及P T N6 6 O 设 备x c u J 2 盘数据 配置错 误是 日常 维护 中常遇见 问题 , 处理起 来相 对 比较 麻烦 。
( 2 ) 故障分析 : 1 ) 业务路 由走向所经过的站点有问题 。 2 ) 业务配置 错误 。 3 ) XC UJ 2 单盘软件版 本较低 。 4 ) E S J 1 单盘故障。 5 ) XC UJ 2 单盘
全局 配置 中数 据 错 误 。
端 口聚合 , 与交换机处 1 —0 —7 与2 —0 —1 3 做 的端 口聚合( t r u n k 3 ) 相
将一号槽位G C 4 B 盘 的4 根光 纤全部 中断后 , 查看交换机处依然
警。
有环回告警存在。 初步定位故 障点不在G C 4 B口盘 下挂 的O NU与A P 上。 2 ) 查看 该OL T的上联 口与交换机连接方 式。
具体如 下: OL T 上联 口1 9 : 2 ( s F P 1 ) 与1 9 : 3 ( S F P 2 ) 做的是上联 口
宽带与AP 业务, 由交换机处进行查看 , 依然有端 口环 回告警 存在 。 从
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GSJ2单盘告警原因及检查
☻名称:TF ☻中文解释:发送失效 ☻原因:千兆以太网光模块发送信号失效 ☻检查方法:
GSJ2单盘告警原因及检查
☻ 名称:POWERALM ☻ 中文解释:电源故障告警 ☻ 原因:电源模块输出电压过高或过低 ☻ 检查方法:
➢ 1、核对相应软硬件版本是否匹配; ➢ 2、插拔单盘,重新上电检查是否告警消除; ➢ 3、使用替换法检测是否为单盘硬件故障。
GSJ2单盘告警原因及检查
☻名称:LINK_LOS ☻中文解释:连接信号丢失 ☻原因:千兆以太网接口接收信号中断 ☻检查方法:
DZB_IN CONTEXT_PACKET_
LOS CARD_ABSENT
中文解释 电源故障告警 系统时钟丢失 PDH物理接口信号丢失 连接信号丢失
建链失败 端子板不在位 本端链路包丢失
盘不在位
E1J1单盘告警原因及检查
☻名称:POWERALM ☻中文解释:电源故障告警 ☻原因:1.2V 1.5V 1.8V 2.5V 3.3V 5V任何一
☻名称:DZB_IN ☻中文解释:端子板不在位 ☻原因:相应槽位端子板不在正常工作状态 ☻检查方法:
➢ 1、插拔端子板; ➢ 2、替换端子板; ➢ 3、更换E1J1及IEJ1的槽位。
E1J1单盘告警原因及检查
☻名称:CONTEXT_PACKET_ LOS ☻中文解释:本端链路包丢失 ☻原因:
1、网络环境震荡; 2、单盘缓存工作不正常; 3、恢复出来的TDM时钟锁定状态不好。
路检测到电源值不在设定范围内就产生告警。 ☻检查方法:
➢ 1、读取E1J1单盘状态、性能,核对相应软硬 件版本;
➢ 2、软件复位E1J1单盘; ➢ 3、插拔单盘; ➢ 4、替换单盘。
E1J1单盘告警原因及检查
☻名称:SCLK_LOS ☻中文解释:系统时钟丢失 ☻原因:检测不到从背板过来的有效参考时钟时,会
上报系统时钟丢失告警 ☻检查方法:
➢ 1、读取XCU的状态、性能,看XCU是否正常工作; ➢ 2、进行XCU主备切换; ➢ 3、进行E1J1软件复位; ➢ 4、插拔E1J1单盘; ➢ 5、替换E1J1单盘; ➢ 6、更换E1J1单盘相应槽位。
E1J1单盘告警原因及检查
☻名称:PPI_LOS ☻中文解释:PDH物理接口信号丢失 ☻原因:E1信号没有正常接入 ☻检查方法:
中文解释 电源故障告警 连接信号丢失
发送失效 TMC连接确认信号丢失 TMP连接确认信号丢失 TMS连接确认信号丢失
系统时钟丢失 机盘温度过限
GSJ2单盘告警及解释(续)
告警名称 PTP_ LOS IOP_HIGH IOP_LOW LASER_TCT
中文解释 PTP同步丢失 输入光功率过高 输入光功率过低 激光器温度过限
☻检查方法:
➢ 1、通过状态监视查看混存里面的包数是否正常; ➢ 2、查看交叉配置是否正确; ➢ 3、查看时钟锁定状态。
E1J1单盘告警原因及检查
☻名称:CARD_ABSENT ☻中文解释:盘不在位 ☻原因:单盘没有上网管 ☻检查方法:
➢ 1、相应槽位是否有单盘; ➢ 2、相应槽位单盘是否插好; ➢ 3、相应槽位单盘是否工作正常。
E1J1单盘告警原因及检查
☻名称:CONTEXT_FAIL ☻中文解释:建链失败 ☻原因:单盘未正常运行或者仿真芯片没有正常
工作 ☻检查方法:
➢ 1、检查单盘配置; ➢ 2、读取E1J1状态、性能,看E1仿真是否正常运行; ➢ 3、软件复位; ➢ 4、插拔单盘; ➢ 5、替换单盘。
E1J1单盘告警原因及检查
ESJ1单盘告警原因及检查
☻名称:RX_ERR ☻中文解释:收坏包过限 ☻原因:交换机接收到的坏包数超过了设定的
门限值。 ☻检查方法:检查网管界面上端口的收发包数
和门限设置。
GSJ2单盘常见告警及解释
告警名称 POWERALM
LINK_LOS TF
TMC_LOC TMP_LOC TMS_LOC SCK_LOC TEMP_TCT
➢ 1、读取ESJ1单盘状态、性能,核对相应软硬 件版本;
➢ 2、软件复位ESJ1单盘; ➢ 3、插拔单盘; ➢ 4、替换单盘。
ESJ1单盘告警原因及检查
☻名称:LINK_LOS ☻中文解释:链路信号中断 ☻原因:以太网接口接收信号中断 ☻检查方法:
➢ 1、检查网线是否接好; ➢ 2、检查单盘与交叉盘的GE口工作模式是否一致。
烽火通信PTN设备故障处理解决 方案
烽火通信科技股份有限公司 客服中心 刘永珍 2010年03月
内容摘要
1 PTN设备常见告警解析 2 OAM简介及其应用 3 典型故障处理案例
E1J1单盘告警及解释
告警名称 POWERALM SCLK_LOS
PPI_LOS LINK_LOS CONTEXT_FAIL
➢ 1、检查E1信号是否正常从端子板前面板接入; ➢ 2、读取本盘状态、性能,看是否正常。
E1J1单盘告警原因及检查
☻名称:LINK_LOS ☻中文解释:连接信号丢失 ☻原因:系统口没有和交叉盘连接 ☻检查方法:
➢ 1、读取XCU的状态、性能,看XCU是否正常工作; ➢ 2、进行XCU主备切换; ➢ 3、进行E1J1软件复位; ➢ 4、插拔E1J1单盘; ➢ 5、替换E1J1单盘; ➢ 6、更换E1J1单盘相应槽位。
ESJ1单盘告警及解释
告警名称 POWERALM
LINK_LOS PK_LOS告警 连接信号丢失
丢包率过限
PTP同步丢失 收坏包过限
ESJ1单盘告警原因及检查
☻名称:POWERALM ☻中文解释:电源故障告警 ☻原因:电源模块的输出出现过压或欠压 ☻检查方法:
ESJ1单盘告警原因及检查
☻名称:PK_LOS ☻中文解释:丢包率过限 ☻原因:交换机内的丢包数超过了设定的门限值 。 ☻检查方法:
➢ 1、检查网管界面上端口的收发包数; ➢ 2、检查单盘配置中门限设置。
ESJ1单盘告警原因及检查
☻名称:PTP_LOS ☻中文解释:PTP同步丢失 ☻原因:PTP同步丢失 。 ☻检查方法:本地和对端PTP设置是否匹配。