Optix PTN3900设备带内DCN故障处理(一)
华为PTN常见开局故障处理
PTN OAM 知识-PW OAM
PTN 设备将业务报文进行PW 封装后送到Tunnel 中进行承载。网络中存在Tunnel 和PW两 个层次,MPLS Tunnel 可以通过MPLS OAM 维护和管理,而PW 层则需要通过PWOAM 来 进行维护和管理 PW OAM 的主要检测方式是PW Ping,Ping 报文在Ingress 节点封装进PW 中,沿虚电路 发送,从而实现对PW 的检测
观察主控板的PROG 指示灯是否处于绿灯闪 主控板完成复位,
烁状态,若是,则主控板正处于复位状态
DCN 将自动恢复连接。
Page 12
DCN 故障处理案例1/3
•案例类型-IP 地址冲突导致网元间歇性脱管
•故障现象
两台非网关网元NE10 和NE30,分别通过ML-PPP 连接第三方SDH 设备,再连接到NE08 与网管保持通讯 NE10 和NE08 已配置业务且正常运行,NE30 为新创建的网元,未配置业务 NE30 创建后,NE10 和NE30 一直处于间歇性脱管状态,网管上报NE_COMMU_BREAK 和NE_NOT_LOGIN 告警
•步案骤例3 :类断开型新-G添加E 网端元口与工网管作之模间式的物不理一连致接,导并致将网该网元元间的通子网信掩中码断修改为16 位后,网络正常
故障现象:PTN 网元通过GE 链路互联组网,网元属性及DCN 参数已经正确 规划与配置,现场安装设备时,发现多处相邻网元之间无法通信,但各网元均 无告警上报
2.单向连通性检测(CC),源端MEP 将周期性的发送CC 帧,目的MEP 收到源端发送的CC 帧后,启动CC 检测功能。如果目的MEP 在一定时间之内没有收到源端的CC 报文,则自动上报ETH_CFM_LOC 告警。
PTN常见故障处理(I)幻灯片
软件漏洞
及时更新软件补丁,修复已知 漏洞。
配置故障处理
总结词
配置故障处理是针对PTM设备配置问 题的修复和优化过程。
02
IP地址配置错误
检查IP地址配置是否正确,如有问题 及时修复IP地址配置错误。
01
03
VLAN配置错误
检查VLAN配置是否正确,如有问题 及时修复VLAN配置错误。
路由配置错误
检查路由配置是否正确,如有问题及 时修复路由配置错误。
设备状态检查
检查相关设备的工作状态,如设备指 示灯、告警信息等,以进一步缩小故 障范围。
故障类型判断
告警信息分析
根据设备上报的告警信息,判断故障类型,如丢包、时延等。
业务影响评估
分析故障对业务的具体影响,如是否影响核心业务、影响程度等。
故障点精确定位
环回测试
通过环回测试定位故障点,检查数据传输的起点和终点是否正常。
告警信息分析
分析告警日志
查看设备的告警日志,分析告警原因及影响范围,以 便快速定位故障。
分析性能指标
检查设备的性能指标是否正常,如CPU使用率、内存 占用率等,若有异常应及时处理。
分析网络流量
检查设备的网络流量是否正常,若有异常应及时排查。
02
PTN故障定位
故障范围确定
故障范围初步判断
根据故障现象,初步判断故障影响范 围,是局部故障还是全局故障。
端口故障
检查端口连接是否正常,如有问题及时更 换端口模块。
软件故障处理
操作系统故障
重新安装或升级操作系统,确 保系统正常运行。
软件兼容性问题
检查软件是否与硬件兼容,如 有问题及时更换软件版本。
总结词
第8章:OptiX PTN 3900设备
1+1 线性复用段保护 1:1 线性复用段保护 1+1 线性复用段保护 1:1 线性复用段保护
1+1 线性复用段保护
IMA 保护 ML-PPP 保护
02 PTN3900设备功能及特性
QOS能力
OptiX PTN 3900 提供层次化的端到端的QoS(Quality of Service)管理, 能够提供高质量的按业务区分的差异化传送服务。
02 PTN3900设备功能及特性
DCN模式 DCN 是网络管理的一部分,用于传送网络管理信息。OptiX PTN 3900 支持带内DCN,保证网络管理信息的互通。 OptiX PTN 3900 采用带内DCN 方案,即将网络管理信息作为净 负荷,封装在网络通道中传输,而无需建立专用的DCN 通道,从而 大大节省了建设DCN 网络的成本。 OptiX PTN 3900 支持传送DCN 信息的接口有: 1.GE 接口 2.FE 接口 3.STM-1/STM-4 POS 接口 4.ML-PPP 接口
01 PTN3900设备概述
PTN3900设备简介
图8-1 OptiX PTN 3900 设备外形
01 PTN3900设备概述
PTN3900设备网络应用 OptiX PTN 3900 主要定位于城域传送网中的汇聚层和核心层。 OptiX PTN 3900 主要用于城域分组汇聚网,负责分组业务在网 络中的传输,并将业务汇 聚至 IP/MPLS 骨干网中。 OptiX PTN 3900 还支持 CWDM 方式的波分组网,实现本地波 长调度。 在后续的产品版本中,OptiX PTN 3900 将支持华为公司 OpitX OSN 1500/2500/3500/7500 系列产品的 SDH 线路板和 OpitX OSN 3800/6800 系列的 DWDM 单板,实现与 WDM/ SDH 骨干 网的对接,完成城域传送网从 TDM 交换网向分组交换网的平滑演进 。
OptiX PTN3900硬件介绍
OptiX PTN3900硬件介绍一.OptiX PTN3900设备外形二.主机软件主机软件实现管理、监视和控制网元中各单板的运行状况,同时作为网络管理系统和单板之间的通信服务单元,实现网管系统对网元的控制和管理。
主机软件还对主控单元的软件加载、包加载和补丁进行管理。
主机软件在电信管理网中属于单元管理层,实现的功能包括网元功能,部分协调功能,网络单元层的操作系统功能。
由数据通信功能完成网元与其他构件(包括设备、网管、其他网元等)的通信功能。
图1 OptiX PTN3900的主机软件三.软件平台包括接口管理模块、告警和性能管理模块、DCN模块。
接口管理模块:将来自不同类型终端的不同形式的命令,分解、转换成相同形式的内部命令。
告警和性能管理模块:提供对当前告警的自动上报与查询、历史告警的存储与查询、事件上报和系统日志管理。
DCN模块:处理DCN通信报文,完成与网管和其他网元的通信。
GCP提供统一的静态或动态MPLS标签分配机制;提供与动态业务创建相关的路由信令协议及选路算法,及与传送平面邻居自动发现相关的LMP协议。
配置模块配置模块包括设备管理、QoS等子模块,其功能包括:负责整个网元的配置管理,包括业务管理、设备管理、资源管理、协议配置代理负责被管理对象的告警、性能的属性设置和查询负责性能数据查询和自动上报负责板间告警抑制及指定对象的告警查询负责持久存储配置数据提供二层交换、MPLS和IP报文处理以及QoS功能。
协议IGMP Snooping模块:二层组播协议,提供二层组播功能。
MSTP模块:多生成树协议,提供消除环路、链路备份以及基于VLAN的链路负载均衡功能。
LACP(Link Aggregation Control Protocol)模块:实现线性增加带宽、链路备份、负载分担功能。
基础框架提供基本的平台内核和系统支撑。
例如:单板管理、分布式消息管理、日志管理等。
功能模块四.功能模块OptiX PTN3900的功能模块包括业务处理模块、管理和控制模块、散热模块以及电源模块。
3900基站原理及常见故障处理..
BBU3900-主要部件介绍
UPEU:
将-48V DC或+24V DC输入电源转换为支持的+12V工作电源。
提供2路RS485信号接口和8路开关量信号接口。
BBU3900-主要部件介绍
FAN:
风扇模块,主要用于风扇的转速控制及风扇板的温度检测, 上报风扇和风扇板的状态,并为BBU提供散热功能。
RFU
RFU 是宏基站的射频部分,主要完成基带信号和射频信号的 调制解调、数据处理、功率放大、驻波检测等功能。 RFU 模 块分为:
多模模块:MRFU、MRFUd、MRFUe GSM 模块:GRFU、DRFU
UMTS 模块:WRFU、WRFUd
RFU-面板
RFU-接口及指示灯
接口类型 面板标识 ANT_RXB 射频接口 ANT_TX/RXA CPRI0 CPRI1 射频接收信 RX_INB 号互联接口 RX_OUTA 电源接口 PWR 监控接口 MON CPRI接口 DIN型连接器 SFP母型连接器 SFP母型连接器 QMA母型连接器 QMA母型连接器 3V3电源连接器 RJ45连接器 连接器类型 DIN型连接器 说明 射频接收接口,用于连 接天馈系统 射频收发共用接口,用 于连接天馈系统 用于连接BBU 用于连接BBU 分集接收输入接口 主集接收输出接口 用于指示灯 RUN 颜色 绿色 含义 常亮 有电源输入,死机或版本校验 慢闪(1s亮,1s灭) 模块正常运行 快闪(0.125s亮,0.125s灭) 模块正在加载软件 常灭 无电源输入,或模块死机 常亮 有告警,需要更换模块(不包括VSWR告警) 有告警,不能确定是否需要更换模块,可能是相 慢闪(1s亮,1s灭) 关单板或接口等故障引起的告警 常灭 无告警(不包括VSWR告警) 常亮 工作正常(发射通道打开) 慢闪(1s亮,1s灭) 模块运行(发射通道关闭) 常亮 “ANT_TX/RXA”端口有VSWR告警 慢闪(1s亮,1s灭) “ANT_RXB”端口有VSWR告警 快闪(0.125s亮,0.125s灭) “ANT_TX/RXA”端口和“ANT_RXB”有VSWR告警 常灭 无驻波告警 绿灯亮 CPRI链路正常 红灯亮 光模块接收异常告警 红灯慢闪(1s亮,1s灭) CPRI链路失锁 常灭 SFP模块不在位或者光模块电源下电 绿灯亮 CPRI链路正常 红灯亮 光模块接收异常告警 红灯慢闪(1s亮,1s灭) CPRI链路失锁 常灭 SFP模块不在位或者光模块电源下电 状态
PTN技术原理与常见故障处理方法
需要进行数据恢复。
网络故障
网络故障通常涉及到网络连 接、路由、交换等方面的问 题。
04
2. 路由故障:路由配置错误 或路由协议异常,导致数据 包无法正确转发。
01 03
•·
02
1. 连接故障:设备间物理连 接断开,可能是线缆损坏或 端口接触不良。
04
PTN故障处理方法硬件故障处理源自010203
硬件故障诊断
更加智能化的PTN
通过与AI、机器学习等技术的结合, 实现PTN的智能化管理和控制,提高 网络的自动化和智能化水平。
THANKS
感谢观看
OAM管理
支持丰富的操作、管理和维护 (OAM)功能,提高网络的可靠性。
PTN网络架构
核心层
接入层
负责高速数据传输和大范围的业务调 度。
负责接入用户设备,实现业务的接入 和汇聚。
汇聚层
负责汇聚接入层流量,进行流量管理 和调度。
02
PTN设备介绍
硬件设备
01
硬件架构
PTN设备的硬件架构通常采用模块化设计,包括核心处理器、内存、存
建立故障处理机制与流程
1 2
制定故障处理流程
明确故障处理流程,包括故障报告、故障定位、 故障排除等步骤。
建立故障处理团队
组建专业的故障处理团队,负责故障的定位和排 除。
3
建立故障预防机制
通过定期维护、检查和更新等措施,预防故障的 发生。
06
PTN技术发展趋势与展望
5G网络中的PTN技术
5G网络对传输网络的需求
储、网络接口卡等模块,这些模块协同工作,实现PTN设备的各项功能。
02
性能指标
衡量PTN设备性能的主要指标包括吞吐量、延迟、丢包率等,这些指标
BTS3900和DBS3900常见故障处理
BTS3900和DBS3900常见故障处理常见故障的排除方法目前BTS3900和DBS3900基站中通常出现的故障大致可以分为以下3类:传输类问题、天馈系统问题、射频单元故障一、传输类问题1.1 传输故障描述;一般我们通过网管和WEB LMT中可以直接查看告警信息,传输类告警信息大致有这些;E1/T1告警指示信号告警、E1/T1远端告警指示告警、E1/T1信号丢失、E1T1在线环回检测告警、E1/T1告警指示信号、E1/T1帧失步告警、E1/T1滑帧超限告警、光口支路告警指示信号告警、光口支路远端告警、光口支路滑帧告警、光口支路误码超限告警、基站信令链路中断告警;1.2可能原因:E1/T1告警指示信号告警、E1/T1远端告警指示告警、E1/T1信号丢失、E1/T1告警指示信号、E1/T1帧失步告警、E1/T1滑帧超限告警、光口支路告警指示信号告警、光口支路远端告警、光口支路滑帧告警、光口支路误码超限告警,告警一般都是由于基站传输头松动或者虚焊脱焊,基站停电(一般表现为该站所有传输都出现故障)照成的,而E1T1在线环回检测告警是由于基站侧传输被环上导致的;基站信令链路中断告警一般都是由于传输2M故障造成的。
1.3处理步骤:使用WEBLMT中的命令(DSP E1T1),查看基站的传输状态,根据命令查询的结果去检查所出现故障的传输2M,(注:一般基站在正常运行的情况下,我们不能带电对传输进行操作)在知道了哪个传输2M有问题的时候,我们的处理步骤如下:1、最好是在传输网管上对这条2M进行软环,能环通则说明数据没有问题;2、在基站对这条2M两侧(传输和BTS)物理环回,后台观察这对传输2M是否是环回的状态,是环回则说明从传输设备到DDF侧的传输2M头是正常的,直接检查BTS到DDF的2M头,如果不是环回则说明从传输设备到DDF侧的传输2M头是故障的,那么就需要检查从传输设备到DDF侧的传输2M头。
3、判断BTS到DDF的2M头是否正常的直接的方法就是在DDF 侧环向BTS,如果对应的LIU灯是灭的则说明BTS到DDF的2M头是好的,如果对应的LIU灯是亮绿灯,则说明BTS到DDF的2M 头是是故障的。
PTN常见故障处理(阅读)
Tunnel常见故障处理方法(续)
原因3:Tunnel 所在的物理链路故障。 1. 查询系统中是否存在HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或 MP_DOWN 等告警,指示Tunnel 使用的物理链路故障。 2. 若存在,优先处理HARD_BAD、R_LOS、ETH_LOS、PPP_LCP_FAIL 或 MP_DOWN 告警。 3. 查看并处理系统中存在的下列告警:MPLS_TUNNEL_BDI、 MPLS_TUNNEL_Excess、MPLS_TUNNEL_FDI、MPLS_TUNNEL_LOCV、 MPLS_TUNNEL_MISMATCH、MPLS_TUNNEL_MISMERGE、 MPLS_TUNNEL_SD、MPLS_TUNNEL_SF、MPLS_TUNNEL_UNKNOWN 4. 检查对端设备是否存在单板故障或网元复位等异常状况。排除对端设备的异 常情况。 原因4:保护倒换失败。 1. MPLS APS 保护倒换失败,参考保护故障处理。
常见原因
原因1:路由失败。 原因2:交叉创建失败。 原因3:Tunnel 所在的物理链路故障。 原因4:保护倒换失败。
Page 19
Tunnel常见故障处理方法
原因1:路由失败。 1. 对照网络规划,检查Tunnel 两端端口参数配置是否正确,例如端口IP。修正不正 确的端口参数后,再次创建Tunnel。 2. 检查Tunnel 首末节点所在的网元间是否存在完整可达的链路。若不存在,修复链 路中残缺或故障的部分。 3. 可选: 确认动态Tunnel 配置的“Route Constraint”条件和“Color”(亲和属性)是 否正确。修正不正确的参数信息,具体操作请参见使用路径方式创建动态MPLS Tunnel 和FRR 保护。 4. 可选: 如果Tunnel 配置了带宽,检查链路带宽是否满足Tunnel 的要求。 原因2:交叉创建失败。 1. 检查网络中是否存在不同的网元使用相同的网段。如果存在,需要修改端口IP地 址。 2. 检查Tunnel 是否配置了不兼容的保护特性。详细内容请参见《版本说明书》。 3. 查看Tunnel 所经过的网元或单板,确认已创建Tunnel 个数是否已经达到了最大值。 如果是,需要重新规划或删除冗余的Tunnel。
PTN常见问题及处理方法
PTN常见问题及处理方法1.使用单站方式创建的以太网业务不通可能原因如下:1)如果是以太网汇聚业务,是否配置了转发过滤表,需要注意的是对于专网业务无论是PW承载还是端口承载,均需要配置转发过滤表;2)首先通过ping测试方法排除Tunnel、pw是否不通;3)如果是通过两台PC机ping包测试,需要检查对应业务端口的tag属性是否设置为Access属性,VLAN ID是否一致。
2.IMA组状态不正常,近端组状态和远端组状态均不是可操作状态;这个主要是IMA组对应的E1链路没有连接导致,可以通过对该E1端口进行硬环回或软件环回,该告警即可消失;3.如何更改POD41单板的光口速率;操作如下:网管上可以通过在单板面板图上先删除对应端口,然后重新添加端口,选择对应的端口速率即可,操作如下:步骤1:步骤2步骤3:配置端口速率级别4.以太网汇聚业务配置完毕测试不通问题在目前的配置手册中关于以太网汇聚业务配置存在一点问题,对于PW承载的汇聚业务资料上表示不需要配置转发过滤表,资料有误。
也是需要创建转发过滤表的。
5.网管上发现PTN面板均为灰色这个主要是因为新设备未进行数据配置而网元处于安装态导致。
处理方法1:通过navigator工具使用命令:cfg-verify命令进行校验一下;处理方法2,通过T2000网管在网元的面板图中先删除主控板SCA或CXP,然后再添加该主控板,网元即可变为运行态,逐个添加逻辑单板即可。
6.动态Tunnel创建完毕,状态为create fail;可能原因:1、物理链路不可用,需要检查对应的物理链路状态及告警;2、对应端口ISIS协议未使能,需要在控制平面中进行使能操作;7.CES业务使用2M误码仪测试不通;1、首先排除误码仪设置是否有误,2M线缆连接是否完好,收发是否正确;2、排除仪表和线缆的原因,然后检查对应的Tunnel状态是否正常,可以使用MPLS OAM功能对Tunnel进行ping测试;3、对该CES业务对应的PW进行ping测试,确认PW是否创建成功;4、因为有些仪表可能发送的是非成帧信号,而CES业务配置时默认为CRC4的成帧格式,可以通过修改CES业务为非成帧格式处理;8.通过路径方式创建动态Tunnel不成功;可能原因:1、在创建Tunnel的过程中,增加了约束路由,但是约束路由配置错误,这里的约束路由端口IP一般只需填正向或反向路由上的接收端的端口IP,不是发送端的IP,而且不要填设为网元的LSR ID。
PTN常见故障及告警处理
结束
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 16
ETH业务故障常见现象
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 17
ETH业务故障常见原因
原因1:单板硬件故障、温度过高或板间通信故障,无法正常工作。 原因2:接收信号丢失。 原因3:以太网网口连接错误,端口协商失败。 原因4:端口配臵了环回。
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 19
目录
1
常见故障定位流程 业务故障定位
2
3 4 5 6 7 8
Tunnel故障定位
链路故障定位 保护故障定位 时钟故障定位 带内DCN故障定位 硬件常见告警
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 15
ETH业务故障定位流程
开始 有HARD_BAD/ FPGA_ABN/COMMUN_FAIL/ BD_STATUS单板故障告警? 是 复位/更换单板 ETH 业务恢复? 是
否
否
有R_LOS(光纤接入)/ ETH_LOS( 网线接入) 告警?
HUAWEI TECHNOLOGIES CO., LTD. Huawei Confidential Page 11
CES业务常见告警(二)
CES_LOSPKT_EXC——CES业务丢包告警 原因1:时钟未同步。 原因2:CES业务两端网元参数配臵不一致。 原因3:Tunnel或PW带宽配臵过低,链路拥塞。 原因4:电缆、光纤或光模块故障导致链路信号变差或中断。
华为PTN故障处理手册v1.0版
华为PTN故障处理手册v1.0惠州公司网络维护中心2010年12月目录一、概述 (4)二、网络故障分析定位方法 (4)2.1告警分析法 (4)2.2性能统计分析法 (5)2.3OAM分析法 (7)2.4配置数据分析法 (11)2.5仪表测试分析法 (12)2.6环回法 (13)2.7排除法 (14)三、业务中断故障和业务恢复 (15)3.1流程图 (15)3.2查询误操作 (17)3.3检查告警 (17)3.4检查环回和装载 (18)3.5检查业务配置 (18)3.6应急恢复方案 (18)3.6.1倒换 (19)3.6.2复位 (19)3.6.3通过更换单板恢复业务 (19)四、常见故障处理方法 (20)4.1带内DCN故障处理 (20)4.2MPLS Tunnel故障处理 (24)4.3PW故障处理 (26)4.4CES业务故障处理 (27)4.5以太网业务故障处理 (31)4.6offload故障处理 ···············································错误!未定义书签。
4.7时钟故障处理 (35)4.8QoS故障处理 (36)4.9线性MSP故障处理 (40)4.10TPS故障处理 (42)4.11LAG故障处理 (45)4.12MPLS APS故障处理 (48)五、部件更换注意事项 (52)4.13部件分类说明 (53)4.14更换处理板 (54)4.15更换子卡 (56)4.16更换接口板 (57)4.17更换XCS单板 (58)4.18更换带有1+1保护的SCA单板 (60)4.19更换没有1+1保护的SCA单板 (62)4.20更换风扇板 (65)4.21更换PIU板 (66)4.22更换可插拔光模块 (67)4.23更换CF卡 (68)一、概述PTN网络故障处理在日常维护中显得至关重要,为了更好的开展PTN网络的日常维护,特编制PTN网络故障处理手册。
OptiX PTN3900O功能与特性
OptiX PTN3900O功能与特性业务类型OptiX PTN3900设备支持以太网业务、ATM(Asynchronous Transfer Mode)业务和CES(Circuit Emulation Service)业务。
OptiX PTN3900设备可以处理的以太网业务包括:E-Line业务;E-LAN业务;E-Aggr业务OptiX PTN3900设备可以处理的ATM业务包括:ATM仿真业务;IMA仿真业务OptiX PTN3900设备可以处理E1的CES业务。
业务处理能力OptiX PTN3900设备的业务处理能力包括交换能力和业务接入能力。
交换能力OptiX PTN3900支持以分组为核心的业务交换。
最大接入能力OptiX PTN3900能够通过多种接口接入业务。
交换能力OptiX PTN3900支持以分组为核心的业务交换。
OptiX PTN3900支持的交换能力如表2-1所示最大接入能力OptiX PTN3900能够通过多种接口接入业务。
OptiX PTN3900各种接口的接入能力如表2-2所示接口类型OptiX PTN3900设备的对外接口包括业务接口和管理及辅助接口。
2.3.1业务接口OptiX PTN3900支持多种类型的接口。
2.3.2管理及辅助接口管理及辅助接口包括管理接口、外时钟接口和告警接口。
2.3.1业务接口OptiX PTN3900支持多种类型的接口。
OptiX PTN3900支持的业务接口如表2-3所管理及辅助接口管理及辅助接口包括管理接口、外时钟接口和告警接口。
OptiX PTN3900提供的管理及辅助接口如表2-4所示。
组网能力OptiX PTN3900的组网方式灵活多样,可满足各种应用的需要。
组网接口OptiX PTN3900支持采用以下接口组网:10GE;GE;FE;POS STM-4;POS STM-1;ML-PPP 说明建议采用ML-PPP接口组建链形网络;不推荐使用FE电接口作为组网接口。
PTN故障处理案例分析
查询历史告警,CXP板曾在26小时前和2小时前两次上报TEMP_OVER
告警,指示单板温度过高。 当时PTN网络中的当前告警已多达四位数,维护人员均未能及时发现新
增告警。
告警信息
CXP板上报TEMP_OVER告警。
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.
Page20
案例五
Port1 Port2 STM-1 U2000 NE01 NE02
现象描述
网关网元NE01通过STM-1链路连接非网关网元NE02,DCN通信及业 务正常。 某日,客户反馈使用网管可以正常登录NE02网元,但查询相关配置信 息时,大部分操作结果显示失败或超时。
4. 业务丢包误码案例
5. 时钟故障案例
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.
Page3
目 录
1. DCN通信失败案例 2. 操作失败案例 3. 业务中断案例
4. 业务丢包误码案例
5. 时钟故障案例
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.
Copyright © 2011 Huawei Technologies Co., Ltd. All rights reserved.
PTN设备典型故障处理
是否存在人为插入告警、 误码、设置环回等
NO
业务配置是否错误
NO
开关电设备或拔插 子卡
NO
电源问题、子卡接
触问题、子卡硬件
问题
NO
链接错误、光功率
过强或过弱
NO
NNI接口子卡问
题、线路故障、隧
道配置错误
YES 取消告警误码的插 入,取消设置环回
YES 修改业务配置
NO 故障是否排除
联系技术支持
故障分析和处理
业务配置错误,配置故障主要表现网元相关配置错误和业务相关 配置错误。
– 检查网元环回地址、IP地址和网元类型等的配置。 – 检查设备收发两端的业务配置是否一致戒者匹配,业务端口选择是
否正确等等。
典型故障处理 TDM业务故障处理 故障现象 业务全部丌通,同时网管上报告警戒性能。 业务全部丌通, 同时网管上无任何告警戒性能。 部分子卡业务丌通。 子卡上的某些支路业务丌通。 业务出现误码。 故障原因 外部原因 – 供电电源故障 – 光纤、电缆故障 – 接地异常 配置原因 – 网元相关数据配置错误 – 业务相关数据配置错误
典型故障处理
TDM业务故障处理
故障原因
人为操作失误原因
– 人为插入告警戒误码 – 人为设置环回
设备/单板故障
故障定位流程
如右侧流程图
开始
设备是否运行正常 (如设备是否自动重启、网元
断链、子卡不在位) YES
查看与设备连接的 端口是否正常UP,光功率接收的其他业务是否正常
YES 结束
典型故障处理
以太网业务故障处理
故障分析和处理
设备处亍运行状态时,测量电压,检查电压是否在允许的范围内。 如果电源异常,则业务中断故障可能是由亍电源故障引起的。
PTN设备故障处理
常用工具以及仪 表
常用工具以及仪 表
故障处理操作
故障处理基本流程 故障处理基本原则 一般故障原因 故障定位原则 故障定位基本方法
故障处理基本流 程
故障处理基本原 则
故障定位到单站后,排除单站内单板的问题。
– 例如某站光线路板有告警,怀疑收发光纤接反,则可将收、发两根光纤互换。 若互换后,光线路板告警消失,说明确实光纤接反。
解决电源、接地问题。
– 例如怀疑某设备输入电源和接地有问题,可以更换一路输入电源和接地端子 来定位排除。
故障定位基本方 法
配置数据分析法
替换法是指使用一个工作正常的物件去替换一个被怀疑工作丌正常 的物件,从而达到定位故障、排除故障的目的。这里的物件,可以 是一段线缆、一块单板戒一端设备。
排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等。
– 若是交换机戒中继线的问题,则可不其他正常通道互换一下。若互换后告警 发生了转移,则说明是外部中继电缆戒交换机的问题,若互换后故障现象丌 变,则可能是传输的问题。
设备对接问题
线缆连接错误。 设备接地问题。 传输、交换网络之间时钟同步问题。
设备原因
设备原因指由亍传输设备自身的原因引发故障,主要包 括设备损坏和板件配合丌良。其中的设备损坏是指在设 备运行较长时间后,因板件老化出现的自然损坏。
故障定位原则
故障定位的一般原则:
在定位故障时,应先排除外部的可能因素,如光纤断、 交换故障戒电源问题等,再考虑传输设备的问题。
在定位故障时,要尽可能准确的定位故障站点,再将故 障定位到单板。
PTN典型故障解决
目录目录目录 (1)典型故障及处理方法 (2)1.1 带内DCN故障处理 (2)1.2 MPLS Tunnel故障处理 (6)1.3 PW故障处理 (7)1.4 CES业务故障处理 (9)1.5 以太网业务故障处理 (13)1.6 时钟故障处理 (16)1.7 QoS故障处理 (17)1.8 LAG故障处理 (21)典型故障及处理方法1.1 带内DCN故障处理介绍带内DCN出现故障时的现象、对系统的影响、可能原因、排除该故障时需要的工具、注意事项以及处理步骤等。
A、前提条件:查看工程文档,确认网元各个单板均使用配套版本。
B、故障现象:处理带内DCN的故障时,通常会遇到以下故障现象。
✧网管与网元通信中断,网管上网元图标变灰色,网元脱管。
✧网管操作命令没有响应。
若响应中断时间持续超过2分钟,网管与网元通信中断。
✧网管查询信息部分丢失。
C、故障处理流程图:带内DCN故障处理流程图如下图所示。
图带内DCN故障处理流程图D、对系统的影响✧网元和网管通信中断后,通过该网元来保持与网管通信的网元,若无其它方法连接网管,也将处于脱管状态。
其它网元则无影响。
✧若承载带内DCN的物理通道故障,则会影响该物理通道上承载的其它业务。
E、可能原因:对应故障处理流程图,带内DCN故障原因如下✧全网内的网元ID、网元IP或者子网掩码存在冲突。
✧故障网元的带内DCN端口未使能,或对接端口参数配置不一致。
✧故障网元与网管之间的物理连接中断。
✧接收信号丢失或接收光功率过低,无法提取DCN报文。
✧单板故障。
✧DCN穿越的第三方网络不健康,引入DCN风暴或DCN中断。
✧带内DCN通道带宽配置过低。
✧故障网元主控板正在复位或发生了主备倒换,带内DCN报文得不到响应。
a)处理带内DCN故障时✧如果网元通信中断,先处理网关网元的故障,再处理非网关网元的故障。
✧如果网元通信未中断,先处理非网关网元的故障,再处理网关网元的故障,避免造成非网关网元脱管。
PTN常见故障及处理
1、NE_NOT_LOGIN告警解释NE_NOT_LOGIN表示网元未登录对系统的影响无法从网元侧查询该告警的配置数据无法在网管上管理该网元可能原因原因1:网元与网管通讯中断解决网元与网管通讯中断方法,参见NE COMMU BREAK原因2:用户退出登陆或者登陆网元失败以其他正确的网元用户登陆网元查看告警是否结束,若未结束,请进行下一步如果故障依然存在,请联系华为工程师MPLS_TUNNEL_LOCV告警解释MPLS_TUNNEL_LOCV 为TUNNEL连通性丢失告警。
连续3个周期内没有收到希望的CV/FFD报文时出现此告警。
对系统的影响该告警产生时,会触发MPLS APS倒换,将业务倒换到保护TUNNELMPLS_TUNNEL_FDI告警将抑制MPLS_TUNNEL_LOCV告警的上报。
可能原因告警MPLS_TUNNEL_LOCV产生的可能原因如下:原因1:TUNNEL的INGRESS节点停止CV/FFD原因2:物理链路故障原因3:INGRESS节点的单板正在复位原因4:业务借口配置错误原因5;网络出现严重拥塞原因6:CPU占用饱和,无法处理ARP协议报文处理步骤:原因1:原因1:TUNNEL的INGRESS节点停止CV/FFD1、在网管上分别进入上报告警的TUNNEL的INGRESS节点和EGRESS节点的“网元管理器”,在功能树中选择“配置》MPLS 管理》单播TUNNEL管理”。
选择“OAM参数”选项卡。
2、查看两端的“检测方式”和“检测报文类型”参数是否一致如果两端的参数。
则。
不一致修改任一节点的参数配置使两端一致后,单击“应用”。
一致继续下一步3、查看INGRESS节点的“CV/FFD状态”参数如果是。
则。
停止右键单击该条TUNNEL,在弹出的菜单中单击‘启动CV/FFD”.查看告警是否清除启动排查下一原因原因2:物理链路故障1、在网管上查看EGRESS节点是否存在HARDBAD、ETH_LOS、或者ETH LINK DOWN告警,具体操作请参见在U2000上查询当前告警。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Optix PTN3900设备带内DCN故障处理(一)本文介绍的是Optix PTN3900设备带内DCN出现故障时的现象、对系统的影响、可能原因。
前提条件
查看工程文档,确认网元各个单板均使用配套版本。
Optix PTN3900设备带内DCN故障现象
处理带内DCN的故障时,通常会遇到以下故障现象。
1、网管与网元通信中断,网管上网元图标变灰色,网元脱管。
2、网管操作命令没有响应。
若响应中断时间持续超过2分钟,网管与网元通信中断。
3、网管查询信息部分丢失。
Optix PTN3900设备带内DCN故障处理流程图
带内DCN故障处理流程图如图1所示。
图1 带内DCN故障处理流程图
Optix PTN3900设备带内DCN故障对系统的影响
1、网元和网管通信中断后,通过该网元来保持与网管通信的网元,若无其它方法连接网管,也将处于脱管状态。
其它网元则无影响。
2、若承载带内DCN的物理通道故障,则会影响该物理通道上承载的其它业务。
Optix PTN3900设备造成带内DCN故障的可能原因
对应故障处理流程图,带内DCN故障原因如下:
原因1:全网内的网元ID、网元IP或者子网掩码存在冲突。
原因2:故障网元的带内DCN端口未使能,或对接端口参数配置不一致。
原因3:故障网元与网管之间的物理连接中断。
原因4:接收信号丢失或接收光功率过低,无法提取DCN报文。
原因5:单板故障。
原因6:DCN穿越的第三方网络不健康,引入DCN风暴或DCN中断。
原因7:带内DCN通道带宽配置过低。
原因8:故障网元主控板正在复位或发生了主备倒换,带内DCN报文得不到响应。