电信现网常见基站故障处理案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.1.1 CMPT板损坏导致基站失锁
【现象描述】
基站在操作维护平台中查看未退服,但BBU内HECM、HCPM板件均无法正常使用,不断重启;告警维护平台中查看基站存在“失锁”告警。

【原因分析】
通过告警维护平台可得知告警涉及“GPS线路”方面,但对于具体障碍,需要对整段线路进行检查。

【处理过程】
通过障碍现象实际上可以得知该基站已经退服,无法实现其应有的功能。

由于已通过网管定位为GPS故障,因而直接检查GPS线路。

将CMPT板与GPS蘑菇头相连的小跳线处断开,使用万用表的直流电压档位测试CMPT板输出电压,为0V;再使用万用表欧姆档位测试GPS电阻,在合适范围内(注:蘑菇头电阻几百欧不等,按照品牌略有差异)。

由于一般情况下CMPT板应该输出约5V左右的直流电为GPS蘑菇头供电,那么可以判定,为CMPT板件引起的故障。

更换CMPT板,恢复小跳线,基站重启后恢复工作,HCPM、HECM板正常工作,基站修复。

【建议与总结】
1.当在基站不同步的一些情况下,网管不显示基站退服,但需要同步的板件无法正常工作;
2.应当了解GPS故障处理的一些常识性知识。

1.1.2 PPP链路中断
【现象描述】
接到网管通知,反映所属安宁分局的“费家营”基站UTRP板件存在PPP链路中断告警,影响该基站的正常业务功能。

【原因分析】
由于涉及的设备为基站电路域设备,因此优先考虑是电路部分的问题。

【处理过程】
在现场察看发现UTRP板件存在告警,ALM指示灯为红色闪烁状态,初步判断UTRP 板件正常。

排除传输扩展板件故障后,察看与其相联接的2M线路,将不涉及开销信道
2013-4-28 第1页, 共10页
的2M(不会造成断站)在成端处断开,METRO500光端机的2M接口向BSC环回,与UTRP 板相连的2M接口向基站环回。

询问网管,发现BSC侧链路正常,基站侧无法环回。

近一步察看与UTRP板相连的2M头子,可能存在虚焊,重做2M头子后PPP链路恢复正常,障碍恢复。

【建议与总结】
1.涉及电路域的故障优先考虑电路部分;
2.熟悉传输“环回”的故障处理方法
1.1.3 PPP数据漏配
【现象描述】
在操作维护系统对日常告警进行查看时,发现榆中分局“蒋家营”基站CMPT板上链路标示为1的PPP链路中断。

【原因分析】
传输链路出现告警的可能引起原因包括物理上的和逻辑(数据)上的。

【处理过程】
现场查看CMPT板件存在告警指示。

与基站CMPT板件相连的PPP链路,即通俗的2M链路,标示为1,表明为物理连接的第2条2M链路。

观察2M接头,发现头子焊点饱满,不存在虚焊问题。

在成端处把第2对2M向基站环回,CMPT板上告警消失,排除近端故障原因;在成端处向BSC把第2对2M环回,BSC侧人员发现链路不通。

将该情况向网络控制中心上报,最终查明故障原因为传输单条链路数据漏配导致。

重新添加数据后基站PPP链路告警消失,障碍修复。

【建议与总结】
1.单条传输链路告警一般是由物理原因引起的,处理时优先考虑虚焊、短路等问题;
2. 传输数据单条漏配是容易被忽视的障碍原因,需要引起重视。

1.1.4 PPP链路自环
【现象描述】
基站退服后,东岗分局人员表示该基站电源工作正常,外部传输光缆未中断,但基站却无法正常重新启动。

【原因分析】
2013-4-28 第2页, 共10页
基站退服,如果排除了电力和外部传输原因,那么优先考虑机房内传输和板件因素。

【处理过程】
赶往故障现场后查看基站电源工作正常;查看光端机,型号为瑞斯康达RC120,光口LOS灯灭,即外部传输光路正常,未中断。

仔细查看2M链路所使用的BNC接头,接头良好,无虚焊、短接。

但将近端未占用开销信道的BNC接头向基站环回时,BSC侧人员却表示不可见。

此时,可判断出BSC至BTS传输链路不通。

在光端机侧向BSC侧打环发现,无论物理上是否连接,BSC侧均可见。

至此,故障查明,障碍原因是传输侧软件自环引起。

通知相关维护人员,对自环链路进行释放后,基站在5分钟后重新启动进入正常工作,障碍修复。

【建议与总结】
1.传输自环是一种比较隐蔽的障碍现象,需要多部门配合才能处理;
2.对基站故障的判定要从大处着眼,从小处着手。

1.1.5 传输单纤中断导致基站退服
【现象描述】
基站退服,电源工作正常,基站光端机无告警。

【原因分析】
在排除电源故障的情况下,出于对设备本身的可靠性考虑,基站退服优先怀疑是传输的问题。

【处理过程】
查看CMPT板件,存在传输中断告警,查看光端机,无告警。

遵循“由近到远”的维护原则,从成端将2M断开,首先向基站侧环回,环回后观察CMPT板件指示灯,告警消失,表明基站2M线路正常;在成端将2M端子向BSC侧环回,询问BSC侧人员,发现链路不通。

此时可判定障碍为传输障碍,报相关传输维护单位,发现由BTS至BSC 的单条光纤中断,重新融接后基站恢复正常。

【建议与总结】
1.传输光端机设备仅将自身能否收到对端发光作为判定光路是否正常的依据。

由于
光端机一收一发两条链路,当发端链路中断时,本端不显示告警;
2. 谨记上述情况,理解光路中断,但光端机“无告警”的含义。

2013-4-28 第3页, 共10页
1.1.6 CMPT板件故障导致基站退服
【现象描述】
基站退服,传输、电源设备正常工作。

【原因分析】
当基站退服后,在排除所有外部故障可能性的前提下,锁定基站主设备本身
【处理过程】
现场查看设备机柜,发现BBU框架内的CMPT板件有告警存在,ALM灯常亮而不闪烁。

对CMPT板件作下电重启处理后,状态如前,可判断为CMPT板件已坏,需要更换。

使用备件替换损坏原件,基站恢复正常。

【建议与总结】
1.特别注意,由于CMPT板件内部含有存储基站信息的电路,因此更换该板件时不能仅仅更换板件就结束,还需要通知BSC侧人员对基站数据进行灌制;
2.如果更换的备件是从未被使用过的新板件,可直接通知BSC侧人员灌制数据。

若更换的备件是已经使用过的旧板件,需要BSC侧人员首先删除其内原有的数
据,才可重新灌注数据,否则无法正常加载数据,基站是无法启动的。

3.现网内使用的华为板件,除去CMPT板件外,其他板件故障,直接进行更换即可。

1.1.7 光纤中断导致BBU与RRU失去联接
【现象描述】
查看操作维护系统,发现所属皋兰分局的“109国道3”基站两个小区退服,但基站未退服。

【原因分析】
由于该基站为分布式基站系统,涉及障碍的板件可能是RRU设备。

【处理过程】
现场发现该基站的BBU设备在山坡机房内,而RRU设备挂在机房外10M抱杆上。

由于故障原因为小区退服,那么应当先查看RRU设备。

但由于RRU设备查看不易,因而首先查看与RRU相连的BBU设备。

发现与RRU相连的基带单元上的HCPM板件存在告警,告警显示为TX正常,RX收无光,可理解为BBU设备向RRU发送信号正常,但收不到RRU设备所发出的信号。

检查RRU设备供电,发现RRU设备供电正常,排除设备供电原因导致的故障。

爬上抱杆,发现RRU设备指示灯显示为收无光告警,也证明了2013-4-28 第4页, 共10页
排除电力故障的正确性。

对RRU与BBU相连接的两路光纤进行更换,与网管确认,退服小区已可用,障碍恢复。

【建议与总结】
1.维护人员应熟知基站连线结构;
2.维护时应遵循先易后难的原则。

1.1.8 GPS失锁
【现象描述】
基站传输与电力已确认正常,但基站有时退服,且无明显规律。

【原因分析】
在基站传输与电力确认正常的情况下,率先考虑基站同步问题。

【处理过程】
查看主设备BBU框架内的传输主控板,发现基站存在告警。

对传输与电力再次确认,包括光端机、2M、电源电压等,均无故障,故推测为GPS故障。

联系BSC侧维护人员,将基站的同步时钟源由GPS改为传输线路时钟。

观察发现,基站正常启动,且再无退服现象出现。

障碍查明,将基站原GPS蘑菇头进行更换,障碍恢复,未再次出现退服情况
【建议与总结】
1.GPS失锁是容易被忽视的障碍现象,但确实存在;
2.当基站使用传输时钟时,基站与其他基站间无法切换,使用传输时钟仅是一种手段。

1.1.9 DCDU端子故障
【现象描述】
RRU设备不断与BBU设备失去联接,间隔约5分钟。

【原因分析】
由于基站BBU工作正常,因此优先考虑RRU本身以及其连线的问题。

【处理过程】
至现场查看,该基站RRU采用直流供电(注:华为RRU设备根据不同的型号,可使用交/直流两种电源供电),且给RRU供电的设备为DCDU端子,当时DCDU端子空2013-4-28 第5页, 共10页
开已跳脱。

将DCDU跳脱空开进行复位,RRU恢复供电,询问网管,RRU与BBU建立连接,障碍似乎已恢复;观察10分钟,在RRU正常恢复后不久,DCDU端子上的空开再次跳脱。

使用万用表对整个基站的引入电源进行较长时间的观察测试,发现电压平稳,排除外部电源的问题。

将DCDU为RRU供电的端子改换为另外的一对接口,观察RRU 设备,至今再未出现空开跳脱情况,障碍恢复。

【建议与总结】
1.华为DCDU设备支持1路48V直流输入和10路直流输出,由于工艺、制造等方面的原因(不在本案例讨论范围之内),可能存在某对端子电压、电流不稳的情况;
2.基站维护要求我们能够就地取材、灵活应对各种障碍。

1.1.10 PSU损坏导致基站退服
【现象描述】
基站退服,传输正常。

【原因分析】
基站退服,大多数情况下都是由电力和传输故障引起。

【处理过程】
永登韩家井基站,地处偏远,因而野外露天安装,采用APM30机柜。

查看机柜内设备,发现PMU模块存在短路告警,表明PSU模块发生了故障。

首先,拔出1号槽位的PSU,告警仍然存在。

连接拔出2号槽位的PSU,告警消失,基站开始启动,5分钟后基站工作正常。

然后,将1号槽位内拔出的PSU模块恢复,基站仍然正常工作,证明1号槽位内的PSU模块也是正常的。

最后,将2号槽位已拔出的PSU模块带走进行返修后,重新装入了机柜内。

【建议与总结】
1.维护人员除了需要熟知常见板件和故障外,还应了解生僻设备和不常见故障的处理方法;
2.现网内目前在用的机柜包括APM30、APM30H、19英寸机柜等,其中APM30机柜中一般安装有1个PMU模块,3个PSU模块。

它们不是主/备关系,只要有一个PSU模块短路,机柜就会自动切断本身所有供电,造成所有设备电力中断。

1.1.11 光模块损坏
【现象描述】
2013-4-28 第6页, 共10页
基站工作正常,告警管理平台产生“小区退服”的告警,操作维护平台查看发现RRU与BBU失去联接。

【原因分析】
RRU与BBU失去联接,一般考虑RRU电力中断、RRU与BBU传输链路中断、设备本身故障这三种情况
【处理过程】
观察BBU机框内的HCPM板,发现与RRU相连光路的指示灯中,TX灯为绿色且常亮,表明HCPM板件发光正常;RX灯不亮,即板件收不到对端RRU设备发出的光。

在BBU端将RRU的发光纤使用光功率计测试,发现RRU设备发光正常;再到RRU侧使用光功率计测试HCPM板件发光纤也正常。

那么问题的焦点集中于HCPM板件处,故障可能是由HCPM板件本身或者是连接HCPM板件与RRU之间的光模块造成。

将光模块拔出后进行更换,HCPM板上的TX/RX灯均常亮,故障恢复,同时也排除了HCPM板件本身故障的可能性。

【建议与总结】
1.现网基带单元内的HCPM板与射频单元(包括CRFU与RRU两种)之间的互联都采用了光模块;
2.光模块损坏引起的故障隐蔽且少见,目前兰州市维护区域内仅有1例,但随着时间的推移,这种障碍值得我们关注。

1.1.12 UTRP板件故障
【现象描述】
网优人员通知,“大雁滩”基站所覆盖区域内无法使用数据业务。

【原因分析】
由于无法实现基站数据功能,所以故障定位在HECP板件与基站数据上。

【处理过程】
该基站为归属联通的共享共建基站,通知联通值班人员后进入基站。

我方基站为BTS3900设备,打开机柜发现为基站提供数据支持功能的HECM板件无告警指示,但传输扩展板UTRP却存在告警指示。

询问BSC侧值班人员,发现该基站传输数据配置为7条2M,其中CMPT板配置4条2M来实现基站语音业务,UTRP板件配置3条2M来实现数据业务,且3条数据链路均已中断。

由于涉及UTRP板件的全部2M链路均中断,那
2013-4-28 第7页, 共10页
么优先处理UTRP板件,暂不考虑2M线路和接头问题。

更换一块UTRP板件,联系网优相关人员进行测试,数据功能恢复,障碍排除。

【建议与总结】
1.故障处理的思路仅仅是解决问题的一种出发点,具体问题需要具体分析;
2.当基站实现某类功能的链路全部中断时,先不考虑单个2M虚焊等问题。

1.1.13 风扇异常导致基站闪断
【现象描述】
七里河分局所属的“天悦大酒店”频繁闪断。

【原因分析】
基站闪断,综合考虑传输、电力、设备的问题。

【处理过程】
在现场观察基站发现,该基站将BBU3900采用室内挂墙的方式进行了安装。

设备正好安装在天悦饭店厨房排烟口的上一层窗口处,窗户玻璃已破损,不时有大量油烟出现。

按照常规,首先使用万用表测试电压稳定,排除电力因素;其次,查看2M不存在虚焊等问题,排除传输链路因素;最后,观察BBU设备本身,发现风扇模块排风口已严重堵塞,无法正常转动。

原来,由于风扇异常,设备自身热量无法散发,造成断站。

当设备板件温度降低后,基站又重新启动,这样不停循环,造成基站频繁闪断。

将风扇模块排风口进行清洁后,又对设备安装的房间窗户进行了封闭,隔绝油烟进入设备,基站至今再未出现闪断现象。

【建议与总结】
1.基站的安装位置需要考虑环境等诸多因素;
2.维护工作不仅要求我们及时处理障碍,更要求我们做到巡检预修,避免故障的发生。

1.1.14 基站欠压
【现象描述】
接分局报告,雁滩“科技街”基站传输链路正常,物业未停电,但基站频繁、不正常启动,并伴有“吧哒”声。

【原因分析】
怀疑该基站光端机或者其他故障。

2013-4-28 第8页, 共10页
2013-4-28
第9页, 共10页
【处理过程】
该基站无专用机房,直接安装在一个废弃楼道顶端的墙面上,无稳压电源,直接连接大楼内市电。

现场听到规则的“吧哒”`声。

仔细观察发现,造成基站主设备BBU 不断启动的原因就是由于传输主设备光端机METRO500不断启动。

“吧哒”声音就是光端机不断重启时发出的。

为了验证光端机的好坏,拔出光口,发现光端机出现LOS 告警;恢复光口状态,告警消失。

以上证明光端机正常。

此时发现楼道内照明忽暗忽明,闪烁频率与光端机“吧哒”声频率相同。

使用万用表测试基站引入电源电压,原本应为220V 的市电为58V 。

通知物业相关人员对大楼电力进行检修,电力修复后,基站顺利启动,故障修复。

【建议与总结】
1.基站设备有规律的重启,且频率较快,优先考虑设备电压是否正常;
2.勤用维护仪表工具,它们既是维护的基础,也是维护结论的依据。

1.1.15 过压保护模块短路导致基站退服
【现象描述】
基站退服,传输线路正常。

【原因分析】
传输正常时,造成基站退服的原因一般为电源故障。

【处理过程】
首先要明晰基站内部电力线路的连接图
J
根据上图可知,过压保护模块的损坏,可直接导致机房内市电中断。

在维护条件允许的情况下,对过压保护模块进行更换即可修复障碍;在没有备件的情况下,本着快速恢复基站工作的原则,可将过压保护模块作断路处理,将外部市电直接与总空开相连来恢复供电。

【建议与总结】
1.要正确区分停电的原因,不要混淆外部电力中断与过压保护模块损坏导致的停电;
2.切记!当过压保护模块损坏时,一般来说,总空开同时会切离跳脱,此时万不可直接手动恢复空开(维护人员在看到空开跳脱时,一般都会下意识的将空开恢复),因为此时保护模块已短路,空开一旦恢复,将产生电火花,甚至是弧光,造成严重后果!
3.安装有过压保护模块的机房,外部输入电压一般都是380V的动力电。

2013-4-28 第10页, 共10页。

相关文档
最新文档