华为OptiX光网络SDH网管系统日常维护

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

华为OptiX光网络SDH网管系统日常维护论文导读:陕西省广电网络SDH传输网系统覆盖全省11个地市分公司和108个县支公司。

这就要求我们好日常的网管系统的维护工作。

关键词:SDH传输网,SDH网管,维护
陕西省广电网络SDH传输网系统覆盖全省11个地市分公司和108个县支公司,传输设备均使用的为华为公司Optix系列设备和Optix iManager T2000 网管,网元设备包搖Optix2500+、Optix2500、Optix255/622H、Optix OSN 3500。

SDH网络系统承载着全省的数字电视、数据广播、模拟电视及IP数
据网等重要业务,这就要求我们好日常的网管系统的维护工作,及时发现
和解决问题。

一、网管系统的基本维护
1、网管系统注意事项
(1)禁止在网管运行过程中修改服务器的系统时间。

论文参考。

网管系统安装阶段设置好服务器的系统时间,如果必须修改服务器系统时间,一定要
先退出网管服务器,修改完成后再重新启动网管服务器。

⑵ 不要随便修改网管服务器计算机的名字和IP (Internet Protocol) 地址。

⑶ 为保障网管计算机工作电源稳定,建议使用UPS (Uninterrupted Power Supply)供电。

⑷ 在UNIX平台下,登录网管服务器操作系统时,请使用用户“t2000〃登录;在Windows平台下,必须使用安装网管时的用户和密码登录。

(5)网管使用过程中,要严格保证网元侧和网管侧的数据一致。

当网元上的数据配置完成、运行正常时,利用手工或自动同步功能,保持网元和网管
数据的一致性。

当网元数据出现错误时,首先确认网管上保存的网元数据是否正确,然后将网管侧的数据下载到网元,恢复网元数据。

⑹定期备份网管数据库,以便最大限度地减小系统出现异常时造成的损失。

(7)网管登录用户是管理员级别时,具有“关闭服务器〃的操作权限。

请小心此操作,不要错误的关闭了正在工作中的服务器。

⑻网管的License文件必须从合法的渠道获得,并妥善保存。

禁止对License文件作任何形式的更改,否则将导致License失效。

⑼ 在设置参数前,建议先从网元侧查询最新数据。

2、业务配置更改注意事项
(1)不要在业务高峰期进行业务调配。

因为一旦出错,影响会很大,应该选择在业务量较小的时候进行业务的调配,例如晚上12点以后。

⑵ 更改配置成功后请及时进行网元和网管数据备份。

二、网管系统的H常维护
定期查看网管告警和性能事件,若设备出现下列告警时需要及时处理。

1.线路或单板上RLOS/RLOF告警或再生段误码时,需及时排除线路或设备掉电问题。

可通过网管查询光板激光器性能事件或通过光功率计测试收、发光功率,判断光功率是否在光板的正常工作范围之内,排除对端网元掉电、光缆问题。

如果是设备问题,可通过自环的方法(注意衰减)定位故
障点,更换光板或时钟板。

2.当设备上出现下列告警时,需要及时处理并更换故障单板。

告警名称
检查电源盒或外部电源
板或主控板
线路上出现HP-TIM 或HP-SLM 高阶通道告警时, 进行
处理。

出现HP-TIM 、HP-SLM 告警,需检查上游站线路板相应高阶通道的J1. C2字节配置与本站是否相同,如配置不同,修改配置再重新下发配 置。

OptiX 系列设备在出现HP-TIM 告警时不影响业务。

告警说明 操作
POWER FAIL 电源
FAN FAIL 风扇故障导会致设备温度高,影响正常运行
检查风扇 关是否开启;
或更换风扇 BD STATUS 电路板不在位
更换单板或主控 MAIL ERR 邮箱通信
NO BD SOFT
电路板无软件 更换单板 HARD-BAD
单板硬件故障 更换单板 WR-FAIL
单板硬件故障 更换单板 NE-INSTALL
网元进入安装态 重新下发配置 SYN-BAD 时钟同步源劣化 更换木站或其它
站时钟板;或启动主备倒换;或更换外时钟源。

3.当 根据业务运行情况
4. 当支路出现T-ALOS 或TU-AIS 告警时
T-ALOS 告警一般为线缆、终端设备(如交换机等)或本端支路板故障 引起。

论文参考。

通过逐段环回或仪表测试的方法来定位问题。

线路故障、外部因素、倒换异常等问题都会造成支路板上报TU-AIS 告警。

在处理TU-AIS 前,先排除线路等高级别告警。

5. 当查询到误码性能事件时
根据查询到误码性能事件,通过对误码、性能事件的仔细分析,定位 出故障点并及时处理:
项目
告警
对端站检测到有误码 对端站检测到有误码
单板后可通过启动保护或更换单板来排除故障
通过环回法定位故障点后,可以通过启动网络级保护(如通道保护、 性能事件 木端站检测到有误码 木端站检测到有误码
再生段
RSBBE 复用段
B2-0VER 道 MSBBE
B1_OVER
MSFEBBE MS-REI 高阶通
HPBBE
HPFEBBE HPCROSSTR LPBBE LPFEBBE
LPCROSSTR LP-REI
6.当定位故障到单站或 HP-REI
低阶
SNCP保护或复用段保护等)或设备级保护(如交叉、时钟主备倒换或TPS 倒换)来试图恢复业务。

更换主控板后,需重下该网元的配置数据。

7.定期检查2.5G、622M、155M速率光板以及光放板的收发光功率,并做好光功率记录
单板/线路接收、发送光功率的变化直接反映了系统的功率变化,也决定了系统的稳定程度。

在SDH设备的日常维护中,应关注当前性能数据与历史性能数据进行比较是否发生了明显的变化。

尤其是关注接收光功率、发送光功率的变化,及时预警和维护。

对于网上运行设备时,可通过查看T2000网管性能事件的方式每H或定期检查:
1)O ptiX 2500+设备的S16> SL16> SL/SD4、SL/SD1 板的收发光功率。

2)OptiX OSN系列产品的2.5G速率的单板的收发光功率。

另在每次割接时,请及时检查割接前后的光功率是否发生较大变化, 并根据检查数据及时调整光路或衰耗器,避免出现光功率过高或过低的现象。

为保证光板正常稳定的工作,请注意光板实际接收光功率值建议比过载点小5dB,比灵敏度大3dB°
&定期查看各网络级和单板级保护状态,确保各保护倒换状态正常。

9.检查单板1+1保护倒换状态是否正常
在配置有交叉、时钟或主控板等单板的主备保护时,需定期查看单板保护状态,检查当前的工作的主板是否为当初设定的主板。

(一般情况下,槽位号小的为主板)。

对于已经自动发生了主备倒换的单板,需要检查当前
的备板工作是否正常,如不正常则需要进行更换。

10.检查TPS保护倒换状态是否正常
在配置有TPS保护的网元时,需定期查看TPS保护组的保护状态。

1)判断是否已经发生TPS倒换
查询TPS保护倒换组工作状态,检查TPS是否己经发生倒换。

在所有的工作板都正常运行时,TPS保护组的状态应该是“正常状态〃。

对于己经发生TPS倒换的需要检查原工作板是否工作正常,在确定单板故障时进行更换,提前排除故障。

2)检查网管配置是否正确:确认TPS保护倒换功能〃使能〃。

3)若工作板故障但未发生TPS保护倒换时,可以通过外部命令或拔出故障板的方式启动TPS倒换。

并对故障单板进行及时处理。

4)更换故障板
如果己经倒换到保护板业务仍然不正常,可考虑是否是参与倒换的其它单板故障,如保护板、接口板、交叉板及TPS倒换控制板等。

□・检查复用段环或线性复用段的保护子网状态是否正常
1)检查复用段状态
光路正常时,全环各节点复用段协议控制器应处于正常状态;当出现R-LOS、R-LOF、MS-AIS等告警时,有以上告警的光路的相邻网元对应局向的复用段协议控制器应处于倒换状态,环网中其他网元的复用段协议控制器处于穿通状态。

2)检查复用段参数设置是否正确
检查复用段参数设置是否正确,如保护倒换恢复时间是否统一设置为"600
秒〃及10分钟;确定复用段节点参数正确后,在复用段倒换状态异常时,可通过停启协议的方法试图恢复业务。

3)网元出现APS-FAIL告警时,表示复用段倒换失败。

对复用段保护环,业务异常时应先检查各个节点的复用段状态是否正常;并检查线路质量、确认引起复用段倒换的原因。

4)出现复用段保护倒换故障时逐段环回定位故障
如果复用段协议控制器的状态正常,但业务仍然不通,可以通过分析业务中断时的业务流向,将复用段环当作一条链来进行故障定位。

5)在特殊情况下可通过发外部倒换命令先恢复业务
某段光路故障导致业务中断但未触发倒换,可以通过拔纤或下发外部倒换命令,先恢复业务,再处理故障。

12.检查子网链接保护网络的SNC业务工作源、保护源是否正常子网连接保护采用2+1保护方式,业务在工作和保护子网连接上同时传送,当工作子网连接失效或性能劣化到某一规定的水平时,工作子网连接将由保护子网连接所代替。

1)查询SNC业务工作源、保护源的状态
查询SNC业务工作源、保护源的状态,正常情况下SNC业务工作源、保护源的状态均应为“正常〃,若为“异常〃则需要及时处理,排除故障。

查询SNCP保护倒换状态,正常情况下应该为“正常〃,业务工作在工作路径上。

对于已经发生倒换的业务,需确定业务是否正常,是否工作保护路径上。

并查找发生倒换的原因。

2)检查配置数据
①检查SNCP倒换条件设置是否正确。

论文参考。

②检查SNCP业务,在相关的环、链相交站点是否正确配置了SNCP 的保护属性;在网络的相关中间站点是否配置了穿通;检查业务级别是否正确。

③检查SNCP业务,在业务的源、宿站点是否按照各自的网络结构正确配置相关的保护属性。

3)检查相关路由上的电路板工作状态是否正常。

13.检查通道保护环状态是否正常
1、检查光纤连接
由于通道保护环的双发选收特性,在全网环路正常时,即使光纤连接错误,业务也可能不会中断;但是当环路异常时,可能导致业务中断。

2、检查数据配置
检查项目包括:
1)全网业务配置,注意中间站点的穿通时隙配置;
2)支路板通道属性需要设置为“保护〃、“装载〃;
3)业务是否配置到通道保护环对应的保护子网;
3、查询告警,正常情况下支路通道上应该无PS告警。

如果查询到支路通道有PS告警,则需要检查倒换原因,及早排除故障。

4、环回法定位故障在将故障定位到单站后,可以采用替换法,对怀疑有问题的电路板进行更换,将故障定位并排除。

相关文档
最新文档