PTN L3网络典型故障分析(2014年)

合集下载

烽火PTN设备常见告警解析

烽火PTN设备常见告警解析
烽火ptn设备常见告警解析
目录
• PTN设备简介 • 常见告警分类 • 告警解析及处理 • 案例分析 • 总结与建议
01 PTN设备简介
PTN设备定义
PTN(Packet Transport Network)设备是一种用于传输数据包(如IP、MPLS) 的网络设备,它提供了一种可靠的、低延迟的、高带宽的数据传输解决方案。
02
软件更新通常会修复已知的bug,提高设备的稳定性和安全性, 因此建议用户及时更新。
03
在进行软件更新之前,建议备份重要数据,以防更新过程中 出现意外导致数据丢失。
加强网络监控与维护
建立完善的网络监控体系,实时监测烽火ptn设备 的运行状态和网络流量。
对于异常流量和告警信息,及时进行分析和处理, 确保网络稳定运行。
PTN设备基于分组交换技术,支持多种数据业务,如IP/MPLS、以太网、TDM等 ,能够满足不同业务的需求。
PTN设备功能
高速数据传输
PTN设备支持高速数据传输,能 够提供高带宽、低延迟的数据传
输服务。
可靠性
PTN设备具备较高的可靠性,支持 快速的保护切换和恢复机制,能够 保证数据传输的稳定性和可靠性。
01
网络连接断开告警
设备网络连接断开,无法进行通信。
丢包告警
设备在网络传输过程中出现数据包 丢失现象。
03
02
网络延迟告警
设备网络传输延迟较高,影响数据 传输效率。
IP地址冲突告警
设备IP地址与其他设备冲突,导致网 络通信异常。
04
03 告警解析及处理
硬件告警解析及处理
硬件故障告警:设备硬件故障,如风扇 、电源、板卡等,可能导致设备运行异 常。

基站PTN业务板卡故障造成网络故障问题分析

基站PTN业务板卡故障造成网络故障问题分析

兰山区2018年5月-基站PTN业务板卡故障造成网络故障问题分析用户侧客户端瑞斯康达收发器5-EF8T-1(许家寨4-EF8T-3)4-EF8T-2(国美印刷)汪沟镇人社所方城镇人社所临沂工业园人社所李官镇人社所南坊街道人社所兰山人社局社保大厅华为交换机VLAN689VLAN689VLAN689VLAN689VLAN689VLAN689VLAN689二、处理过程:1、客户申报数据业务无法使用,现场进行测试,业务不通,PING用户网关地址不通。

查询监控网管,确定此数据专线上联的基站侧收发器板卡无告警。

联系其它人社局站点业务均正常,确定故障范围为:人社局北园路服务大厅单个站点故障。

用户端使用光收发开通,光收发正常无告警,怀疑故障点位在基站端,去基站侧处理。

图1、在客户电脑PING测试截图2、在上联基站侧的华为交换机电口下进行测试,上行无法PING通人社局网关,下行PING用户电脑IP地址发现至用户端通道正常。

怀疑故障在传输数据链路上。

图2、在基站侧PING用户电脑正常3、联系传输老师并对客户业务进行更换端口试验,传输老师查看到该基站PTN业务板卡有故障,帧丢包严重,需要更换PTN业务板卡。

更换PTN业务板后测试业务正常。

图3、业务恢复后测试截图经更换PTN业务板卡后运行一段时间的测试,客户未再出现业务中断情况。

故障原因为:基站侧PTN业务板卡故障,影响个别业务使用。

该故障属于局域网类型的故障,故障点位比较少见。

(兰山区人社局的数据业务使用的VLAN均为689)三、经验与总结数据专线故障可以按照故障区域进行划分,方便快速确认故障区域,再逐步排查故障点位。

故障区域划分:1、接入端原因。

2、传输链路原因。

3、核心数据原因。

PTN类数据专线处理经验:1、首先根据告警和现场的情况确定故障可疑点以及可能的故障区域,缩小故障范围,便于快速查找到故障点。

2、逐一排除故障可疑点位,维修故障必要时可以更换设备或者传输端口,先抢修通后再查找原因。

PTN典型故障解决要点

PTN典型故障解决要点

目录目录目录 (1)典型故障及处理方法 (2)1.1 带内DCN故障处理 (2)1.2 MPLS Tunnel故障处理 (6)1.3 PW故障处理 (7)1.4 CES业务故障处理 (9)1.5 以太网业务故障处理 (13)1.6 时钟故障处理 (16)1.7 QoS故障处理 (17)1.8 LAG故障处理 (21)典型故障及处理方法1.1 带内DCN故障处理介绍带内DCN出现故障时的现象、对系统的影响、可能原因、排除该故障时需要的工具、注意事项以及处理步骤等。

A、前提条件:查看工程文档,确认网元各个单板均使用配套版本。

B、故障现象:处理带内DCN的故障时,通常会遇到以下故障现象。

✧网管与网元通信中断,网管上网元图标变灰色,网元脱管。

✧网管操作命令没有响应。

若响应中断时间持续超过2分钟,网管与网元通信中断。

✧网管查询信息部分丢失。

C、故障处理流程图:带内DCN故障处理流程图如下图所示。

图带内DCN故障处理流程图D、对系统的影响✧网元和网管通信中断后,通过该网元来保持与网管通信的网元,若无其它方法连接网管,也将处于脱管状态。

其它网元则无影响。

✧若承载带内DCN的物理通道故障,则会影响该物理通道上承载的其它业务。

E、可能原因:对应故障处理流程图,带内DCN故障原因如下✧全网内的网元ID、网元IP或者子网掩码存在冲突。

✧故障网元的带内DCN端口未使能,或对接端口参数配置不一致。

✧故障网元与网管之间的物理连接中断。

✧接收信号丢失或接收光功率过低,无法提取DCN报文。

✧单板故障。

✧DCN穿越的第三方网络不健康,引入DCN风暴或DCN中断。

✧带内DCN通道带宽配置过低。

✧故障网元主控板正在复位或发生了主备倒换,带内DCN报文得不到响应。

a)处理带内DCN故障时✧如果网元通信中断,先处理网关网元的故障,再处理非网关网元的故障。

✧如果网元通信未中断,先处理非网关网元的故障,再处理网关网元的故障,避免造成非网关网元脱管。

PTN设备典型故障处理

PTN设备典型故障处理

典型故障处理
IMA业务故障处理
故障原因
人为操作失误原因
– 人为插入告警戒误码 – 人为设置环回
设备/单板故障
故障定位流程
如右侧流程图
开始
设备是否运行正常 (如设备是否自动重启、网元
断链、子卡不在位) YES
查看与设备连接的 端口是否正常UP,光功率接收
是否在正常范围 YES
同一设备的共同出口 的其他业务是否正常
2M支路信号迚行终端侧环回,并接入误码仦 测 试 , 如 果 误 码 仦 2M电信号丢失告警丌消失, 则判定原因可能是2M接口板的接口丌好、2M线断戒配线架同轴头未焊好,可更换 2M接口 戒更换电缆解决。
人为误码告警和环回的插入。
– 取消设置人为误码、告警和环回的插入。
典型故障处理
以太网业务故障处理
钟,并且AB设备和CE设备之间必须要同步; 如A端配置auto 钟, B端可配置auto戒loopback时钟。
典型故障处理 IMA业务故障处理 故障现象 业务全部丌通,同时网管上报告警戒性能。 业务全部丌通, 同时网管上无任何告警戒性能。 部分子卡业务丌通。 子卡上的某些支路业务丌通。 业务出现误码。 故障原因 外部原因 – 供电电源故障 – 光纤、电缆故障 – 接地异常 配置原因 – 网元相关数据配置错误 – 业务相关数据配置错误
典型故障处理
IMA业务故障处理
故障分析和处理
连接错误、光功率过强戒过弱、接口接触问题。
– 排除连接错误。 – 通过光模块光纤自环, 检查光模块是否正常。 – 检查光模块的型号,决定是否更换光模块戒增加光衰。 – 检查业务电缆是否有虚焊、漏焊、接触丌良现象,此原因会导致个别2M业务丌通现象。对
如右侧流程图

PTN常见问题及处理方法

PTN常见问题及处理方法

PTN常见问题及处理方法1.使用单站方式创建的以太网业务不通可能原因如下:1)如果是以太网汇聚业务,是否配置了转发过滤表,需要注意的是对于专网业务无论是PW承载还是端口承载,均需要配置转发过滤表;2)首先通过ping测试方法排除Tunnel、pw是否不通;3)如果是通过两台PC机ping包测试,需要检查对应业务端口的tag属性是否设置为Access属性,VLAN ID是否一致。

2.IMA组状态不正常,近端组状态和远端组状态均不是可操作状态;这个主要是IMA组对应的E1链路没有连接导致,可以通过对该E1端口进行硬环回或软件环回,该告警即可消失;3.如何更改POD41单板的光口速率;操作如下:网管上可以通过在单板面板图上先删除对应端口,然后重新添加端口,选择对应的端口速率即可,操作如下:步骤1:步骤2步骤3:配置端口速率级别4.以太网汇聚业务配置完毕测试不通问题在目前的配置手册中关于以太网汇聚业务配置存在一点问题,对于PW承载的汇聚业务资料上表示不需要配置转发过滤表,资料有误。

也是需要创建转发过滤表的。

5.网管上发现PTN面板均为灰色这个主要是因为新设备未进行数据配置而网元处于安装态导致。

处理方法1:通过navigator工具使用命令:cfg-verify命令进行校验一下;处理方法2,通过T2000网管在网元的面板图中先删除主控板SCA或CXP,然后再添加该主控板,网元即可变为运行态,逐个添加逻辑单板即可。

6.动态Tunnel创建完毕,状态为create fail;可能原因:1、物理链路不可用,需要检查对应的物理链路状态及告警;2、对应端口ISIS协议未使能,需要在控制平面中进行使能操作;7.CES业务使用2M误码仪测试不通;1、首先排除误码仪设置是否有误,2M线缆连接是否完好,收发是否正确;2、排除仪表和线缆的原因,然后检查对应的Tunnel状态是否正常,可以使用MPLS OAM功能对Tunnel进行ping测试;3、对该CES业务对应的PW进行ping测试,确认PW是否创建成功;4、因为有些仪表可能发送的是非成帧信号,而CES业务配置时默认为CRC4的成帧格式,可以通过修改CES业务为非成帧格式处理;8.通过路径方式创建动态Tunnel不成功;可能原因:1、在创建Tunnel的过程中,增加了约束路由,但是约束路由配置错误,这里的约束路由端口IP一般只需填正向或反向路由上的接收端的端口IP,不是发送端的IP,而且不要填设为网元的LSR ID。

PTN常见故障及告警处理

PTN常见故障及告警处理

结束
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 16
ETH业务故障常见现象
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 17
ETH业务故障常见原因
原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。 原因2:接收信号丢失。 原因3:以太网网口连接错误,端口协商失败。 原因4:端口配臵了环回。
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 19
目录
1
常见故障定位流程 业务故障定位
2
3 4 5 6 7 8
Tunnel故障定位
链路故障定位 保护故障定位 时钟故障定位 带内DCN故障定位 硬件常见告警
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 15
ETH业务故障定位流程
开始 有HARD_BAD/ FPGA_ABN/COMMUN_FAIL/ BD_STATUS单板故障告警? 是 复位/更换单板 ETH 业务恢复? 是


有R_LOS(光纤接入)/ ETH_LOS( 网线接入) 告警?
HUAWEI TECHNOLOGIES CO., LTD. Huawei Confidential Page 11
CES业务常见告警(二)

CES_LOSPKT_EXC——CES业务丢包告警 原因1:时钟未同步。 原因2:CES业务两端网元参数配臵不一致。 原因3:Tunnel或PW带宽配臵过低,链路拥塞。 原因4:电缆、光纤或光模块故障导致链路信号变差或中断。

PTN设备故障案例

PTN设备故障案例
分别查询站点63-1和63-2之间的10GE端口光功率信息, 接受光功率为 -0.5dBm。
故障案

故障分析不定位
通过查看网管和设备的日志文件,排除是业务配置造成的问题。
现网中使用的光模块的传送距离为40KM。这种光模块的光功率接收 范围为:-14.4dBm到-1dBm,-1dBm是PIN管的过载点,一般要求接收 光功率在此值之下。如果接收光功率为-1dBm戒者是大亍该值时,将 会出现误码,甚至中断传输。0.5dBm是最大接收光功率,超过 0.5dBm就会损坏器件。
故障案

故障分析不定位
再次用bootrom update 命令对boot迚行升级,确认反馈了“OK”后,用show boot命 令查看,现象依旧。
怀疑是上传时,版本文件没有上传完整。打算将当前的mec.bin文件删除后,重新上 传。使用delete命令删除文件,命令执行后,却一直显示正在迚行状态,即界面上一 直显示打点的状态(正常情冴下,删除该文件只需1秒钟)。另开窗口登陆该6100设 备,查看img目录,显示文件大小为“0”,但文件名还在。如下图:
6300
6100
63-3
故障案 例
故障现象
某市移劢现网出现18个TD站点掉站现象,其中出现了掉站的站点为: 61-1-1 ~ 61-1-4,61-2-1 ~ 61-2-4,61-2-6 ~ 61-2-7, 61-3-2 ~ 61-3-4 , 61-4-2~ 61-4-3, 61-5-2 ~ 61-5-4。
故障案 例
故障分析不定位
按研发的说法,重新选取另外的4个站点做实验。发现只 要在下主控复位后,等下主控ALM灯熄灭,Run灯慢闪 之后再等待5分钟,然后再拔出上主控,重新插回上主控 就可以正常运行了,倒换也丌存在问题 。

PTN常见故障及告警处理

PTN常见故障及告警处理

HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 19
目录
1
常见故障定位流程 业务故障定位
2
3 4 5 6 7 8
Tunnel故障定位
链路故障定位 保护故障定位 时钟故障定位 带内DCN故障定位 硬件常见告警
9
10
故障定位典型案例
参考文档
Huawei Confidential Page 5
HUAWEI TECHNOLOGIES CO., LTD.
CESGIES CO., LTD.
Huawei Confidential
Page 6
CES业务常见故障现象
HUAWEI TECHNOLOGIES CO., LTD.
HUAWEI TECHNOLOGIES CO., LTD. Huawei Confidential Page 11
CES业务常见告警(二)

CES_LOSPKT_EXC——CES业务丢包告警 原因1:时钟未同步。 原因2:CES业务两端网元参数配臵不一致。 原因3:Tunnel或PW带宽配臵过低,链路拥塞。 原因4:电缆、光纤或光模块故障导致链路信号变差或中断。
臵较大的带宽,查看告警是否清除。 原因3:电缆、光纤或光模块故障导致链路信号变差。 检查并确认电缆或光纤与接口良好连接。清洁光纤或光模块后,查看告警是否清除。若告警未 清除,更换相应的电缆、光纤或光模块。
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential

PON网络常见故障处理

PON网络常见故障处理

语音电话 TEL1~TEL2 接口指示

状态 绿灯常亮
熄灭 常亮 闪烁 熄灭 常亮
快闪(2次/秒)
慢闪(1次/2秒)
指示灯状态
PON
LOS
熄灭
熄灭
快闪(2次/秒)
熄灭
常亮
熄灭
熄灭
慢闪(1次/2秒)
快闪(2次/秒)
快闪(2次/秒)
说明 电源接通 电源断开 以太网连接正常 以太网接口有数据传输 以太网连接未建立 已经与语音服务器建立连接 已经与语音服务器建立连接且处于摘 机或者振铃状态 正在向语音服务器注册
➢ 语音效果不好
● 请确认是否为ONU的IAD端口设置了独立于数据通道的业务通道,避免受到数据业务的冲击。 ● 另外,需要提高ONU的IAD端口的优先级。
Page 14
常见故障处理
● 常见故障处理方法
● ONU不能正常注册
➢ 步骤一:检查ONU光口是否正常
➢ 步骤二:检查光衰是否合适,使用光功率计检查ONT 光功率是否正常
➢ 步骤三:检查ONT 的配置是否正确
● GPON模式下,使用display ont info命令查看ONU信息:检查ONU的MAC是否和实际的 设备一致;检查ONU的控制标志是否为去激活,如果是去激活态,需要在GPON模式下使 用ont activate命令把控制开关设为激活。
● 初步定位故障位置
故障现象
个别端口用户无法上网
整板用户无法上网 整框用户无法上网
BRAS设备下所有用户无法上网
初步判断故障位置及原因 用户终端或者线路故障 GPON端口故障 数据配置问题 GPON单板故障 光路问题 主控板或者上行单板故障 网络攻击 上行设备问题

PTN常见网络故障现象

PTN常见网络故障现象

PTN常见网络故障现象
带内DCN
∙检查网管上有网元图标变灰色,网元脱管。

∙网管操作命令没有响应。

若响应中断时间持续超过2分钟,网管与网元通信中断。

∙网管查询信息部分丢失。

MPLS Tunnel
∙查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL或MP_DOWN 等告警,指示Tunnel使用的物理链路故障。

若存在,优先处理这些告警。

∙查看并处理系统中存在的下列告警。

PW
∙检查PW首末节点间物理链路是否正常,系统中是否存在HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS等告警。

具体操作请参见在U2000上
查询当前告警。

∙若存在,优先处理HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS告警。

∙查询并处理系统中存在的PW_DOWN、PW_DROPPKT_EXC或PW_EXC_TRAFFIC 告警。

∙查看并处理系统中存在的下列告警。

以太网业务
能影响设备接入的其它业务。

线性MSP。

PTN常见网络故障现象

PTN常见网络故障现象

PTN常见网络故障现象
带内DCN
∙检查网管上有网元图标变灰色,网元脱管。

∙网管操作命令没有响应。

若响应中断时间持续超过2分钟,网管与网元通信中断。

∙网管查询信息部分丢失。

MPLS Tunnel
∙查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL或MP_DOWN 等告警,指示Tunnel使用的物理链路故障。

若存在,优先处理这些告警。

∙查看并处理系统中存在的下列告警。

PW
∙检查PW首末节点间物理链路是否正常,系统中是否存在HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS等告警。

具体操作请参见在U2000上
查询当前告警。

∙若存在,优先处理HARD_BAD、LASER_MOD_ERR、R_LOS或ETH_LOS告警。

∙查询并处理系统中存在的PW_DOWN、PW_DROPPKT_EXC或PW_EXC_TRAFFIC 告警。

∙查看并处理系统中存在的下列告警。

以太网业务
能影响设备接入的其它业务。

线性MSP。

PTN故障处理案例分析

PTN故障处理案例分析


查询历史告警,CXP板曾在26小时前和2小时前两次上报TEMP_OVER
告警,指示单板温度过高。 当时PTN网络中的当前告警已多达四位数,维护人员均未能及时发现新

增告警。

告警信息

CXP板上报TEMP_OVER告警。
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.

Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.
Page20
案例五
Port1 Port2 STM-1 U2000 NE01 NE02

现象描述

网关网元NE01通过STM-1链路连接非网关网元NE02,DCN通信及业 务正常。 某日,客户反馈使用网管可以正常登录NE02网元,但查询相关配置信 息时,大部分操作结果显示失败或超时。
4. 业务丢包误码案例
5. 时钟故障案例
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.
Page3
目 录
1. DCN通信失败案例 2. 操作失败案例 3. 业务中断案例
4. 业务丢包误码案例
5. 时钟故障案例
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.

Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.

烽火通信PTN设备故障处理解决方案

烽火通信PTN设备故障处理解决方案

ESJ1单盘告警原因及检查
☻名称:RX_ERR ☻中文解释:收坏包过限 ☻原因:交换机接收到的坏包数超过了设定的
门限值。 ☻检查方法:检查网管界面上端口的收发包数
和门限设置。
光通信专家
GSJ2单盘常见告警及解释
告警名称 POWERALM
LINK_LOS TF
☻名称:PPI_LOS ☻中文解释:PDH物理接口信号丢失 ☻原因:E1信号没有正常接入 ☻检查方法:
➢ 1、检查E1信号是否正常从端子板前面板接入; ➢ 2、读取本盘状态、性能,看是否正常。
光通信专家
E1J1单盘告警原因及检查
☻名称:LINK_LOS ☻中文解释:连接信号丢失 ☻原因:系统口没有和交叉盘连接 ☻检查方法:
➢ 1、检查网管界面上端口的收发包数; ➢ 2、检查单盘配置中门限设置。
光通信专家
ESJ1单盘告警原因及检查
☻名称:PTP_LOS ☻中文解释:PTP同步丢失 ☻原因:PTP同步丢失 。 ☻检查方法:本地和对端PTP设置是否匹配。
光通信专家
烽火通信PTN设备故障处理解决 方案
烽火通信科技股份有限公司 客服中心 刘永珍 2010年03月
内容摘要
1 PTN设备常见告警解析 2 OAM简介及其应用 3 典型故障处理案例
光通信专家
E1J1单盘告警及解释
告警名称 POWERALM SCLK_LOS
PPI_LOS LINK_LOS CONTEXT_FAIL
TMC_LOC TMP_LOC TMS_LOC SCK_LOC TEMP_TCT
中文解释 电源故障告警 连接信号丢失
发送失效 TMC连接确认信号丢失 TMP连接确认信号丢失 TMS连接确认信号丢失

IPRAN故障案例分析

IPRAN故障案例分析

IPRAN故障案例分析IPRAN(Internet Protocol Radio Access Network)是一种将无线网络和IP网络相结合的技术,以提供高速、稳定和可靠的网络连接。

然而,在实际应用中,由于各种原因,可能会出现IPRAN故障。

本篇文章将通过分析一个IPRAN故障案例,探讨故障的原因和解决方法。

案例背景描述:大型电信运营商在一座城市部署了一个IPRAN网络,用于提供移动通信服务。

该网络由多个路由器和交换机组成,通过光纤互联。

近期,该网络出现了一系列故障,导致网络不稳定、传输速度变慢,客户抱怨也随之增加。

故障分析:1.网络拓扑问题:首先,要对网络拓扑进行排查,确保所有设备的连接和配置都正确。

检查光纤连接是否松动或损坏,交换机的端口配置是否正确,路由器之间的邻居关系是否建立。

任何一个拓扑结构失效都可能导致网络故障。

2.传输链路故障:其次,要仔细检查传输链路,包括光纤、光模块和接口等。

使用光纤测试仪,检查链路的物理和光学性能。

如果发现链路损坏或高光损耗,需要进行修复或更换。

3.网络设备问题:还需要检查路由器和交换机的配置文件和运行状态。

查看是否有日志记录错误信息,比如配置错误、冗余路由等。

如果路由表配置错误,可能导致数据包转发错误或循环转发。

此外,还应检查设备的资源利用率,如CPU利用率、内存利用率等。

如果一些设备超负荷运行,可能会导致网络拥塞和延迟。

4.安全问题:由于IPRAN网络通常连接到互联网,网络安全问题也可能导致故障。

检查设备的防火墙设置、访问控制列表和安全策略,确保网络不受到恶意攻击或未经授权的访问。

解决方案:1.拓扑排查和修复:对网络拓扑进行仔细检查,确保所有设备的连接正确并按照要求进行配置。

修复任何松动、损坏的光纤,重新配置交换机的端口。

2.传输链路维护:使用光纤测试仪检查传输链路的物理和光学性能。

如果有问题,及时进行修复和更换。

在链路故障发生时,可以通过使用备用链路或配置冗余链路来提供容错能力。

PTN常见故障及处理

PTN常见故障及处理

1、NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录对系统的影响无法从网元侧查询该告警的配置数据无法在网管上管理该网元可能原因原因1:网元与网管通讯中断解决网元与网管通讯中断方法,参见NE COMMU BREAK原因2:用户退出登陆或者登陆网元失败以其他正确的网元用户登陆网元查看告警是否结束,若未结束,请进行下一步如果故障依然存在,请联系华为工程师MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV 为TUNNEL连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

对系统的影响该告警产生时,会触发MPLS APS倒换,将业务倒换到保护TUNNELMPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。

可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:原因1:TUNNEL的INGRESS节点停止CV/FFD原因2:物理链路故障原因3:INGRESS节点的单板正在复位原因4:业务借口配置错误原因5;网络出现严重拥塞原因6:CPU占用饱和,无法处理ARP协议报文处理步骤:原因1:原因1:TUNNEL的INGRESS节点停止CV/FFD1、在网管上分别进入上报告警的TUNNEL的INGRESS节点和EGRESS节点的“网元管理器”,在功能树中选择“配置》MPLS 管理》单播TUNNEL管理”。

选择“OAM参数”选项卡。

2、查看两端的“检测方式”和“检测报文类型”参数是否一致如果两端的参数。

则。

不一致修改任一节点的参数配置使两端一致后,单击“应用”。

一致继续下一步3、查看INGRESS节点的“CV/FFD状态”参数如果是。

则。

停止右键单击该条TUNNEL,在弹出的菜单中单击‘启动CV/FFD”.查看告警是否清除启动排查下一原因原因2:物理链路故障1、在网管上查看EGRESS节点是否存在HARDBAD、ETH_LOS、或者ETH LINK DOWN告警,具体操作请参见在U2000上查询当前告警。

PTN技术原理与常见故障处理方法

PTN技术原理与常见故障处理方法

22
版权所有 翻印必究
MPLS技术原理
ATM的交换过程
标题样式
虚通路连接 (VCC) 虚通道连接(VPC)
UNI UNI
NNI
NNI
VC 交换
VP 交换
VC 交换
VPI = 1 VCI = 1
VPI = 2 VCI = 44
VPI = 26 VCI = 44
VPI = 20 VCI = 30
面向连接,有N2问题;
PE
PP
PP
PE
Ingress
Transit
Egress
P(Provider)端口: 该端口指接入服务提供商核心网络的端口;在我们设备上指接入的数据报文为MPLS封装报文的端口。 PE(Provider Edge)端口: 该端口为服务提供商的边缘端口,对接的是用户的设备;在这里指接入的是普通以太网帧,如果接 入的是MPLS封装格式的数据报文,但同时不希望对MPLS封装进行处理,端口也可以配置成这种属性。
20
版权所有 翻印必究
目录
CONTENT
PTN技术原理及特点
1. PTN产生背景及关键技术 2. MPLS基本原理 3. PWE3概念与应用
21
版权所有 翻印必究
MPLS技术原理
传统IP转发
分析IP头 映射到下一跳
分析IP头 映射到下一跳
分析IP头 映射到下一跳
每一跳分析IP头,效率低 QoS难于部署,而且效率低 所有路由器都要知道整个网络的所有路由
Mobile Challenge
移动宽带需要更大网络带宽 更大和更高效的带宽提供 高速上行接口 LTE-Ready
高质量业务保证 业务的QoS保障,网络的OAM 电信级的时钟/时间同步方案 E2E的网络管理、维护方案

PTN常见故障处理

PTN常见故障处理


Tunnel /PW故障
查询Tunnel/PW状态是否DOWN 查询系统是否存在MPLS_TUNNEL_LOCV 告警 查询系统是否存在PW_DOWN 告警

处理 Tunnel/PW故障


时钟不同步 时延过大
检查业务流经的所有网元时钟域是否相同 查询系统是否有SYNC_C_LOS 或LTI 告警
确,静态路由配置正确。 步骤3 :查看承载该以太网专线业务的PW的状态为“UP”。

步骤4 :查询以太网接口的基本属性,其“端口模式”为“二层”,
“封装类型”为“802.1Q”。更改“封装类型”为“NULL”,再 重新配置E-Line业务,发现业务可以正常工作
11
MPLS APS---应用场景


优化时钟配置 优化业务路由

查询系统是否有CES_LOSPKT_EXC、CES_MISORDERPKT_EXC 或 CES_STRAYPKT_EXC 告警 查询系统是否有CES_JTRUDR_EXC 或CES_JTROVR_EXC 告警


6
CES 业务故障典型告警处理
T_ALO S 信号丢 失
2.单向连通性检测(CC),源端MEP 将周期性的发送CC 帧,目的MEP 收到源端发送的CC 帧后,启动CC 检测功能。如果目的MEP 在一定时间之内没有收到源端的CC 报文,则自动上报ETH_CFM_LOC 告警。
3.链路追踪检测(LT),源端MEP 发送LTM 帧,同时启动定时器开始计时。链路上所有的MIP 都会转发LTM 帧, 所有收到LTM 帧的MEP 和MIP 都会回送LTR 帧响应,根据这些LTR 帧可以判断出源MEP 到目的MEP 所经过的所有 MIP。如果源端MEP 定时器超时,LT 失败

烽火通信PTN设备故障处理解决方案

烽火通信PTN设备故障处理解决方案
2、软件复位E1J1单盘; 3、插拔单盘; 4、替换单盘。
光通信专家
E1J1单盘告警原因及检查
☻名称:SCLK_LOS ☻中文解释:系统时钟丢失 ☻原因:检测不到从背板过来的有效参考时钟时,会 上报系统时钟丢失告警 ☻检查方法:
1、读取XCU的状态、性能,看XCU是否正常工作; 2、进行XCU主备切换; 3、进行E1J1软件复位; 4、插拔E1J1单盘; 5、替换E1J1单盘; 6、更换E1J1单盘相应槽位。
光通信专家
E1J1单盘告警原因及检查
☻名称:CONTEXT_FAIL ☻中文解释:建链失败 ☻原因:单盘未正常运行或者仿真芯片没有正常 工作 ☻检查方法:
1、检查单盘配置; 2、读取E1J1状态、性能,看E1仿真是否正常运行; 3、软件复位; 4、插拔单盘; 5、替换单盘。
E1J1单盘告警原因及检查
☻名称:LINK_LOS ☻中文解释:连接信号丢失 ☻原因:系统口没有和交叉盘连接 ☻检查方法:
1、读取XCU的状态、性能,看XCU是否正常工作; 2、进行XCU主备切换; 3、进行E1J1软件复位; 4、插拔E1J1单盘; 5、替换E1J1单盘; 6、更换E1J1单盘相应槽位。
1、对端相连通的TMC通道中OAM的CV使能 是否打开; 2、该TMC通道业务不通,检查线路配置。
光通信专家
GSJ2单盘告警原因及检查
☻名称:TMP_LOC ☻中文解释:TMP连接确认信号丢失 ☻原因:TMP层通道连接失效 ☻检查方法:
1、对端相连通的TMP通道中OAM的CV使能 是否打开; 2、该TMP通道业务不通,检查线路配置。
光通信专家
XSJ2单盘常见告警及解释(续)

PTN技术在移动通信网络中的应用及故障排除

PTN技术在移动通信网络中的应用及故障排除

摘要:本文介绍了PTN 技术在移动通信网络中的组网方式、技术特点。

通过对设备故障查找及排除的描述深入了解PTN 设备的运行,对从事通信传输工作的人员有一定的指导作用。

关键词:PTN 移动通信故障随着3G 和4G 接连进入到我们的生活中,高速数字化时代已经来临。

针对承载高速数据业务的需求,传统的SDH 设备虽然经过了上十年的发展增加了一些数据业务的接口,可以实现数据业务的透明传输以及一些简单的业务汇聚。

但是,业务的IP 化已经开始从移动通信网络的边缘向核心蔓延。

在这种趋势下,必然要求传输网络IP 化,即要求传输网络由电路交叉核心向分组交换核心的转换,利用分组交换核心实现分组业务的高效传输。

1PTN 的定义及组网方式1.1定义PTN (分组传送网,Packet Transport Net-work)是一种以面向连接的分组技术为内核,同时具备端到端的业务管理、层次化OAM 及电信级保护等传送特性,以承载电信级以太网业务为主,兼容TDM、ATM 等业务的综合传送技术。

1.2组网方式PTN 组网方式以环形网络为基本,先搭建核心层,再做汇聚层,最后是接入层。

对于移动业务的发展趋势带来的挑战,移动承载网络需要满足IP 化、移动宽带化、高质量业务保证、多业务接入的需求,并提供性价比最优的高效解决方案。

基于ALL IP 的PTN 分组传送平台,结合强大的网管系统,实现业务、网络、控制、管理的融合。

“端到端L2VPN”是IP 回传网最好的解决方案,是业界目前最认可的解决方案。

“L2VPN +L3VPN”是上一方案的补充,L3VPN 对于规模不大的汇聚层也是一个很好的选择,同时也可以满足已经在移动IPRAN 中部署了大量IP/MPLS 设备的运营商。

PTN 网络架构如图1所示。

10GE 核心层BRAS/SR /MSCGGE 接入层10GE 汇聚层IP HOTELFTTH 用户FTTB 用户商业楼宇企业Node BBTSE1E1/FEE1/FEFEFE GE/FEFE/E1FE网络游戏数据宽带数子电视视频监控视频电话数据宽带视频会议无线电视无线宽带无线语音无线业务专线业务家庭业务GE 接入层RNC/MGW/GGSN图1PTN 网络架构2PTN 技术的特点PTN 技术是在IP 业务和底层光传输媒质之间设置了一个层面,它针对分组业务流量的突发性和统计复用传送的要求而设计,以分组业务为核心并支持多业务提供,具有更低的总体使用成本,同时秉承光传输的传统优势,包括高可用性和可靠性、高效的带宽管理机制和流量工程、便捷的OAM 和网管、可扩展、较高的安全性等。

PTN故障案例

PTN故障案例

PTN故障案例1.1不能正常上网问题【故障现象】配置了从文慧(6100)-中心局-星河-中环-乐城KTV-政协-东都百货的EVPTREE业务,文慧是根节点,星河、中环、政协和东都百货是4个叶节点,其中从我们的星河的FE口下面接交换机和其他的宽带设备(WLAN业务)现场问题是:从宽带设备能够ping通我们的根节点,当用户上网时,正常的是打开ie后打开任一网页就能自动跳转到中国移动的主页面,但是当打开任一网页后却一直无法自动跳转【故障分析】业务其实是可通的,但是部分帧长的报文无法通过,可以参考1.2节设备的jumbo帧设置问题。

【故障处理】早期设备的mtu(最大传输单元)值较小的问题,目前设备除61设备需要启用jumbo帧功能,其他机型都不存在该问题6200设备无法进行调测【故障现象】在对大涌镇政府进行调测时,发现无法用笔记本登录到调测命令输入界面。

【故障分析】初步分析启动不正常,可能是主控有硬件或者芯片损坏。

【故障处理】对设备进行断电重启,问题未解决;而且光口板的有个光口T某指示灯常灭,R某指示灯常亮。

替换光模块,问题未解决;对主、备主控板进行交换拨插,仍然无法解决问题;设备换了主控以后,可以进行初始化操作。

【问题总结】无主控板问题导致设备无法进行调测,更换即可。

PTN承载大量TD基站出现瞬断/丢包等问题【故障现象】PTN承载TD基站运行,目前存在每天大量TD基站瞬断、丢包的问题。

【故障分析】PTN承载的TD业务出现大量的基站瞬断,引起该类问题的原因较多,如物理链路侧问题,设备自身问题等,需要对每一条出现问题的业务进行排查处理,确认问题原因。

【故障处理】发现PTN设备侧部分UNI端口有丢包,有可能和JUMBO启动功能有关,打开现场出现问题的JUMBO后情况好很多。

同时发现部分节点NNI侧也存在问题,收光较弱,处理线路侧问题。

同时TD设备也在进行查询问题原因,TD升级后情况解决了不少。

经过排查后基本解决了所有问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
8
典型原因归纳
请归纳常见PTN L3业务故障的原因,并描述这两起故障可能的原因:
光路两点中断。
节点失效,且保护失败 单点故障,且保护失败
硬件故障
单站配置数据/路由错误 端到端各节点路由配合错
以上的组合
9
目录
1
典型故障案例
1 L2转L3节点间同步协议通道故障案例 2 明细路由成环的案例 3 典型原因归纳
PTN1至PTN2、PTN1至PTN3开有伪线双归的以太网业务,业务通过L2转L3桥接 后,进入3层网络,最终落地点是MME/SGW PTN2和PTN3zhi之间设置DNI PW,同时还配置有ICB(同步协议通道)承载ARP 热备和MC-LAG协议报文。 在L2转L3桥节点,将L2VE(该E-Line业务VLL的V-UNI)和L3VE(静态L3VPN业务 的V-UNI)进行桥接,并分别将VE绑定到业务/隧道。
由于作者水平所限,课件可能存在一些不完善之处,还请各位同仁们指正。
2
目录
1
典型故障案例
1 L2转L3节点间同步协议通道故障案例 2 明细路由成环的案例 3 典型原因归纳
2
1 基本思路
如何处理PTN L3网络故障
2 网内关键检查点
3 重要手段 4 总结与提高
3
L2转L3节点间同步协议通道故障案例
LTE业务组网如图,其中接 入环网元(PTN1)为Optix PTN950设备,核心环的网 元(PTN2、PTN3、PTN4及 PTN5)均为OptiX PTN 3900 设备。PTN2和PTN3为L2/L3 网元(其中,正常情况下, PTN2为主用桥接点), PTN4和PTN5为L3网元。
3、从收发包分析:PTN1没有收到PTN2 的包。说明LTE业务下行在该区域发生由检查: 正常情况下,业务路径 应该是PTN1—PTN2—PTN4—MME/SGW , 各节点优先级,应该是沿此路径方向优先 级高,备用保护方向优先级低。当前PTN1 的优先级有变化,上行路径为:PTN1-PTN3--PTN5--PTN4--MME/SGW,即PTN3承 担了上行业务流量。这与PW发生倒换的事 件吻合。
2
1 基本思路
如何处理PTN L3网络故障
2 网内关键检查点
3 重要手段 4 总结与提高
10
基本思路
是否PTN之外的故障引起本网络故障,可查看相关网络告警等。
1
6 排查PTN数据设置层面故障
2 根据已有信息, 确定影响范围和
PTN L3网络
断!
割接前路由分析:红色明细路由掩码比绿色的网段路由长,由于路由优选第一原则为最长 掩码匹配。所以业务通过红色路由来进行业务转发。对于掩码相同的红色路由,再进行优 先级比较,因为上行EPC优先级较高,所有业务正常向省干转发。
7
明细路由成环的案例

由于路由调整后才出现故障,所以分析路由变化后, 发生匹配不当是故障原因。路由匹配顺序为:
➢1. 查找与目的IP和掩码完全匹配 的条目(长掩码优先) ➢2. 如果匹配的有多个路由,需比 较优先级,优选优先级高的; ➢3.查找与目的网络号匹配的条目 ➢4. . 如果匹配的有多个路由,需 比较优先级,优选优先级高的; ➢5. 查找默认路由
割接过程路由分析:据了解,割接时先清除了PTN-1、 PTN-2对外部UNI侧冗余路由(图中红点处),此时, 由于PTN-1、PTN-2之间,尚存在明细路由,此时两 台设备都优选了互指的网络侧保护路由(明细路 由),在两个节点间形成路由环路 ,使基站上行EPC 的业务无法正常转发。
2、下行路由检查:正常情况下,业务路径 应该是MME/SGW —PTN4—PTN2—PTN1, 各节点路由优先级无变化,但当前PTN1已 发生PW倒换,选收PTN3方向,即当前PTN2 应该以去PTN3方向为高优先级才对。
原因分析:当ICB通道故障,MC-LAG协议报文不通,PTN3备节点的MC-LAG协议,导致 备升主,且会通过PW备通道通告PTN1节点,触发PTN1节点PW APS倒换,上行流量路 径变为PTN1--PTN3--PTN5--PTN4--MME/SGW;下行流量从PTN4到PTN2后,由于MC-LAG 双主,PTN2节点不会把下行流量切到DNI PW,而是直接发往PTN1节点,但PTN1节点 已经PW APS倒换,只会从与PTN3对接端口接收流量,而与PTN2对接端口不接收流量, 故而下行流量中断,出现LTE站点全阻的情况。
3. 发现L2VPN业务状态正常,PW 能PING通,PW APS状态已经倒换。
5
L2转L3节点间同步协议通道故障案例 续2
告警及性能初步分析
1、从告警现象看:承载ICB的隧道告警, 应该和故障有关联;
2、从告警影响看:该隧道down掉,影 响的是ICB通道,即会影响承载ARP热备 和MC-LAG协议的报文传递。
1
前言
PTN网络,在其核心采用了MPLS-TP技术实现数据包的路由与交换。同时, 采用了传统传输SDH的保护倒换等理念。正因为兼有2层交换与3层交换特色, 在带来灵活性、高适应性的同时,不可避免增加了其故障处理的难度。
本课件,力图通过分析典型的PTN故障案例,协助维护人员对故障处理思路、 排查方式进行梳理,达到举一反三,提升经验的目的。
6
明细路由成环的案例
某承载LTE的PTN网络中,由于建网 初期,业务量少,EPC侧提供的地址为 包含少量IP地址的明细路由,后随着 EPC的扩容、需要扩容业务IP地址路由, 增加了相应的网段路由。已有的网段路 由包含了原有的明细路由,明细路由为 冗余路由,需要进行清除。该操作理论 上不影响业务。
割接时,发 现LTE基站 业务出现中
某日,出现 LTE基站业 务中断!
4
L2转L3节点间同步协议通道故障案例 续1
1. 告警现象:PTN2和PTN3之间,有 隧道Tunnel down告警,进一步复核, 发现该隧道是承载ICB通道的隧道。
2. PTN网络中,其余部分,如承载 DNI PW的通道等无物理中断告警。
4. 沿着正常情况下,业务路径检查, 发现PTN2节点连接PTN1节点的端 口统计有发送流量,但查看PTN1节 点连接PTN2节点的端口统计无接收。
相关文档
最新文档