爱立信LTE无线故障现场处理手册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
爱立信LTE无线告警现场处理手册日常故障处理方法
(1)--- Loss of Tracking
➢告警解释:
此告警是由于系统或者无线时钟失步导致,可能造成基站退服。
➢可能原因:
(1)GPS硬件故障;
(2)基站进程吊死;
(3)DU硬件故障;
TD-LTE采用GPS进行同步。
其硬件以及连接方式如下:
➢处理步骤:
检查GPS信号接收器上的工作状态灯状态。
(1)灯不亮
1. 检查GPS信号接收器和连接DU的RJ45网线,如有问题则进行更换。
2. 检查DU上的GPS端口是否存在问题,如有问题则更换DU。
(2)绿灯常亮
1. 检查连接DU的RJ45网线,如有问题进行更换。
2. 通知后台重启基站
3. 更换DU。
(3)绿灯闪
1. 按照上面GPS硬件连接图按照从DU到GPS天线的顺序检查各个接口是
否有虚接、各线缆是否有破损、各个单元硬件是否存在问题,如有问题
则进行重接或者更换。
2. 通知后台重启基站
3. 更换DU。
(2)---Network Synch Time from GPS Missing
➢告警解释:
此告警是由于GPS信号丢失导致,可能导致基站退服。
➢可能原因:
(1)GPS硬件故障;
(2)基站进程吊死;
(3)DU硬件故障;
➢处理步骤:
请参考“Loss of Tracking”告警的处理步骤。
(3)---System Clock Quality Degradation
➢ 告警解释:
此告警表示系统或者无线时钟进入了“free-running ”模式,不能满足系统正常工作的需求。
该告警为伴生告警,其提示作用。
能够触发该告警的子告警为: ● Network Synch Time from GPS Missing
● Loss of Tracking
● TU Synch Reference Loss of Signal
➢ 可能原因:
由于该告警为伴生告警,可能原因请参见其伴生的子告警。
➢ 处理步骤:
由于该告警为伴生告警,处理步骤请参见其伴生的子告警。
(4)---Remote IP Address Unreachable
➢ 告警解释:
此告警表示远端IP 地址不可达,多为到核心网的IP 地址不可用。
➢ 可能原因:
DUL (TNA 为电口、TNB 为光口)
传输(PTN 或者PON )
核心网网管1条光纤或者网线2个IP 、2个VLAN
管理IP&VLAM 业务IP&VLAM
如上图所示,从基站上仅有1条光纤(TNA口)或者网线(TNB口)作为传输。
该告警为到核心网的IP地址不可达,所以不会是物理方面原因,多为配置问题。
(1)ENBID、业务IP地址、业务VID和其他基站冲突或者配置有误;
(2)传输侧故障;
(3)核心网侧故障;
➢处理步骤:
(1)检查基站侧ENBID、业务IP地址、业务VID是否冲突、配置正确。
如有问题则进行更改。
(2)通知传输侧核查传输。
(3)通知核心网侧检查核心网。
(5)---License Key
➢告警解释:
此告警表示许可秘钥文件错误,文件存放在ENB测,文件损坏可能影响业务性能及容量。
➢可能原因:
许可秘钥文件错误损坏或者丢失。
➢处理步骤:
重新加载许可秘钥文件。
(6)---Inter-PIU Link Fault
➢告警解释:
此告警表示Inter-PIU连接错误(仅针对多块DUL板件的配置)。
➢可能原因:
当多个DUL级联时,DUL之间会使用IDL级联线。
如上图所示。
(1)IDL连线故障;
(2)基站进程吊死;
(3)DUL故障;
➢处理步骤:
(1)检查IDL连线,如有问题则更换。
(2)重启基站。
(3)更换DUL。
(7)---TU Hardware Fault
➢告警解释:
此告警表示时钟模块硬件故障。
➢可能原因:
(1)基站进程吊死;
(2)DUL故障;
➢处理步骤:
(1)重启告警DUL。
(2)更换DUL。
(8)---Slave TU Out of Synchronization ➢告警解释:
此告警表示副时钟模块失步。
➢可能原因:
多出现在多个DUL级联的情况下:
(1)主DUL同步信号丢失;
(2)IDL连线故障;
(3)基站进程吊死;
(4)DUL故障;
➢处理步骤:
请参考“Inter-PIU Link Fault”告警处理步骤。
(9)---LinkFailure
➢告警解释:
此告警表示基站DU到RRU链路连接失败,可能导致小区业务中断。
➢可能原因:
根据不同的告警解释具体可分为以下几类:
(1)Loss Of Signal
意为RRU与DU主单元之间光路断开,光纤断开、传输质量不好或者RRU故障。
(2)No signal detected
意为到RRU到DU无光,光纤断开、传输质量不好或者RRU故障。
(3)Jitter Cleaner PLL not locked
意为RRU到DU无光,光纤断开、传输质量不好或者RRU故障。
(4)High bit error rate on CPRI link
意为DU到RRU链路高误码报警
➢处理步骤:
(1)检查DU和RRU之间的传输,如果不通或者质差则更换光纤或者传输。
(2)检查光模块,如有问题则更换。
(3)重启RRU。
(3)重启DU。
(4)更换RRU。
(10)---HwFault
➢告警解释:
此告警表示标示告警的单元硬件错误。
➢可能原因:
硬件错误;
➢处理步骤:
更换告警硬件。
(11)---VswrOverThreshold
➢告警解释:
此告警表示驻波比超限。
➢可能原因:
(1)天馈系统故障
(2)RRU故障
➢处理步骤:
(1)检查测量天馈系统驻波比,如有异常则进行更换。
(2)更换RRU。
(12)---GeneralHwError
➢告警解释:
此告警表示一般硬件故障。
➢可能原因:
(1)基站进程吊死;
(2)数据配置错误;
(3)SUP硬件故障;
➢处理步骤:
(1)检查基站数据配置是否正确,如有问题则进行修改。
(2)重启基站。
(3)更换MU机框。
(13)---Gigabit Ethernet Link Fault
➢告警解释:
此告警表示千兆以太网连接故障,可能导致基站退服。
➢可能原因:
(1)基站传输故障;
(2)DUL故障;
➢处理步骤:
(1)检查基站传输连接,如有虚接或者尾纤破损则进行重接或者更换。
(2)通知传输侧检查传输。
(3)更换DUL。
(14)---PowerFailure
➢告警解释:
此告警表示RRU电源故障,造成小区退服。
➢可能原因:
(1)RRU电源故障;
(2)RRU故障;
➢处理步骤:
(1)检查电源状态。
(2)检查RRU电源接头是否松动,如有松动重做接头。
(3)更换RRU。
(15)---ServiceDegraded
➢告警解释:
此告警表示小区服务质量下降。
该告警为伴生告警,其提示作用。
能够触发该告警的告警为:
●LinkFailure
●CalibrationFailure
●HwFault
●VswrOverThreshold
➢可能原因:
由于该告警为伴生告警,可能原因请参见其伴生的子告警。
➢处理步骤:
由于该告警为伴生告警,处理步骤请参见其伴生的子告警。
(16)---ServiceUnavailable
➢告警解释:
此告警表示小区服务质量不可用,即小区退服。
该告警为伴生告警,其提示作用。
能够触发该告警的告警为:
●HwFault
●PowerFailure
●TemperatureExceptionalTakenOutOfService
●LinkFailure
●ResourceConfigurationFailure
➢可能原因:
由于该告警为伴生告警,可能原因请参见其伴生的子告警。
➢处理步骤:
由于该告警为伴生告警,处理步骤请参见其伴生的子告警。
(17)---CalibrationFailure
➢告警解释:
此告警表示校准失败,仅发生在8通道基站上。
➢可能原因:
根据不同的告警解释可分为两类:
(1)signal too low
校准信号低且无驻波比告警,RRU端口与天线端口线序不匹配、跳线故障或RRU 故障
(2)signal disturbed
校准信号受到干扰,可能由于馈线故障或者外部干扰照成。
➢处理步骤:
(1)signal too low
1. 按照下列标准检查跳线和RRU之间线序,如有接错则按照规则更改。
RRU的A-H口对应天线的1-8口,RRU的ALD口对应天线的CAL口
2. 检查故障跳线,如有问题则更换。
3. 更换RRU。
(2)signal disturbed
1. 检查故障跳线,如有问题则更换。
2. 由于干扰导致,查找干扰源。
(18)---Heartbeat Failure
➢告警解释:
此告警表示基站心跳告警,即基站脱管。
➢可能原因:
(1)DU掉电
(2)传输故障
(3)DU故障
➢处理步骤:
(1)检查电源状态。
(2)检查DU电源接头是否松动,如有松动重做接头。
(3)检查基站传输连接,如有虚接或者尾纤破损则进行重接或者更换。
(4)通知传输检查传输状态。
(5)DU下电重启.
(6)更换DU。
(19)---Plug-In Unit HW Failure
➢告警解释:
DU硬件错误,可能导致基站退服。
➢可能原因:
DU硬件错误
➢处理步骤:
(1)对告警DU进行下电重启。
(2)更换DU。
(20)---Plug-In Unit General Problem
➢告警解释:
DU普通错误,可能导致基站退服。
➢可能原因:
(1)重复的软件错误;
(2)配置错误;
(3)启动检测出硬件错误;
(4)DU被拔出;
➢处理步骤:
(1)对告警DU进行下电重启。
(2)更换DU。
(21)---Disk Volume C Full
➢告警解释
Disk Volume C Full是一个主要告警,这个告警由MO ManagedElementData发出。
如果Main Processor(主处理器MP)的C卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume C Full告警。
系统一般每隔15分钟对C卷进行一次检测,如果可用空间小于等于MO ManagedElementData 的属性minimumHdVolumeCFreespace的值(单位为兆),告警就会出现。
只要可用空间比minimumHdVolumeCFreespace的值大1M,告警就能消除。
当该告警出现时,需要删除C卷的文件,令C卷有足够空间,使告警消除。
➢可能原因
(1)存放了太多UpgradePackage MO,或者存放的UP MO非常大。
(2)C卷上有大量其他文件
(3)C卷的最小可用空间设置得过大。
也就是说,虽然有足够的可用空间,但是属性minimumHdVolumeCFreespace的值太大,使得C卷中允许使用的空间过小。
➢处理步骤
(1)确定是否有应该删除的旧UpgradePackage MO。
如果有,请按照ALEX OPI中的Delete Upgrade Package删除。
(2)读取属性hdVolumeCFreespace。
其值必须比属性minimumHdVolumeCFreespace的值大至少1兆。
否则,需删除至少一个以上的UpgradePackage MO,直到C卷的可用空间足够大。
(3)完成以上操作后,等待15分钟,看看告警是否消除。
或者读取属性minimumHdVolumeCFreespace的值,然后将其设置为相同的值,告警可能会立即消除。
(4)如果告警没有消除,磁盘上可能有其他可删除的文件占用了空间,请联系爱立信技术支持。
(22)---Disk Volume D Full
➢告警解释:
Disk Volume D Full是一个主要告警,这个告警由MO GeneralProcessorUnit发出。
如果Main Processor(主处理器MP)的D卷上存储的数据过多,会导致该卷的可用空间耗尽或几乎耗尽,此时系统会发出Disk Volume D Full告警。
系统一般每隔15分钟对C卷进行一次检测,如果可用空间小于等于MO GeneralProcessorUnit的属性minimumHdVolumeDFreespace的值(单位为兆),告警就会出现。
只要可用空间比minimumHdVolumeDFreespace的值大1M,告警就能消除。
当这个告警出现时,需要删除D卷的文件,令D卷有足够空间,使告警消除。
如果出现了这个告警,也许D卷就没有足够空间去存储重要的新数据,新的升级包及创建新文件。
➢可能原因:
(1)太多UpgradePackage MO,或者MO非常大。
(2)ENB上有太多configuration version(CV),或者CV非常大。
(3)D卷上有大量其他文件(文件不属于任何UpgradePackage MO或configuration Version的一部分)。
(4)D卷的最小可用空间设置得过大。
也就是说,虽然有足够的可用空间,但是属性minimumHdVolumeDFreespace 的值太大,使得D卷中允许使用的空间过小。
➢处理步骤:
(1)确定是否有应该删除的旧Upgrade Package MO。
如果有,请删除。
(2)如果告警仅因Core MP而发出,则检查是否有应该删除的旧CV(检查属性faulttolerantCoreStates)。
如果有,请删除。
(3)读取属性hdVolumeDFreespace。
其值必须比属性minimumHdVolumeDFreespace的值大至少1兆。
(4)完成以上操作后,等待15分钟,看看告警是否消除。
或者读取属性minimumHdVolumeCFreespace的值,然后将其设置为相同的值,告警可能会立即消除。
(5)如果告警没有消除,请检查是否有其他可以删除的UpgradePackage MO或可以删除的CV。
如果有,请如上所述删除。
(6)如果告警仍然没有消除,磁盘上可能有其他可删除的文件占用了空间,请联系爱立信技术支持。
(23)---FanFailure
➢告警解释:
此告警是一个主要告警。
告警细节描述如下表:
➢处理步骤:
(1)在RBS EM中重启SCU(Support Control Unit)。
(2)检查告警是否已消除,如果已消除,故障处理完毕。
(3)如果告警未消除,检查风扇。
(4)如果告警未消除,在RBS EM中锁定SCU。
更换风扇。
(5)检查告警是否已消除,如果已消除,故障处理完毕。
(6)如果告警仍然没有消除,请联系爱立信技术支持。
(24)---loss of synch reference redundancy
➢告警解释:
此告警是次生告警,是由MO Synchronization发出。
可以参考主告警:
(1) TU Synch Reference Loss of Signal
(2) Network Synch Time from GPS Missing
(3) Loss of Tracking
(4) Synch Reference Path HW Fault
(5) Packet Server Availability Fault
(6) Synch Reference Not Reliable
(7) Sync Reference PDV Problem
(8) SDH相关告警: Loss of Signal, Loss of Frame, MS Alarm Indication Signal, MS Degraded Signal, MS Excessive Bit Error Rate, Plug-In Unit HW Failure, or ET Hardware Fault
(9) IP同步源: NTP Server Reachability Fault, or Gigabit Ethernet Link Fault
(10) 此告警的后果是,同步源的数量减少或者只剩一个同步源,如果最后一个同步源也丢失,系统时钟会进入”holdover mode”,然后是”free-running mode”,这样就不能满足无线模块所要求的时钟精度。
➢处理步骤:
执行以下步骤:
检查MO Synchronization的syncRefStatus值
(1)如果同步参考源的状态是FAILED,DEGRADED,REF_PATH_FAILED_A或者REF_PATH_FAILED_B,则检查是否同时有告警” Synch Reference Path HW Fault”,如果有,则参考告警” Synch Reference Path HW Fault”处理。
(2)检查GPS模块,确保GPS天线按要求安装,并尝试GPS模块重启,并更换。
(3)检查时钟源线缆,并尝试更换。
(4)如果同步参考源的状态是NOT_RELIABLE,根据MO IpSyncRef的NtpServerIpAddress,确定时钟服务器,并检查该服务器是否工作正常。
(5)如果同步参考源的状态是LOSS_OF_TRACKING,删除所有状态是
LOSS_OF_TRACKING的同步源,然后重新添加1条或者多条同步源,等待2分钟,看告警是否还会出。
(6)如果告警继续出现,根据ALEX OPI Lock Board来锁定故障板。
Lock type 是Hardlock;
(7)根据ALEX OPI Restart Board重新启动故障板。
RestartRank 是Cold with Test;
(8)根据ALEX OPI Unlock Board来解锁板。
(25)---Synch Reference Path HW Fault
➢告警解释:
此告警是一个主要告警,告警由Managed Object (MO) Synchronization发出。
当从主用的同步参考源到Timing Uint模块的同步路径被干扰或者中断时,将出现该告警。
告警细节描述如下表:
➢处理步骤:
(1)锁定DU ,重启DU,解锁DU
(2)在RBS EM 中,锁定DU
(3)重启DU, restartRank 选择RESTART_COLDWTEST (cold with test) , restartReason 选择UNPLANNED_O_AND_M_ISSUE, restartInfo 输入告警名称解锁DU,检查EM alarm list,查看告警是否清除
(4)如果告警未被清除,请执行以下操作。
RBS EM 中,锁定DU
按照OPI Replacing Digital Units更换DU
更换DU
解锁DU,检查RBS EM 告警列表,查看告警是否清除
(5)如果告警没有清除,则按照流程更换回原来的硬件,请联系爱立信技术支持。
(26)---NoContact
➢告警解释:
此告警是一个主要告警,细节描述如下表:
(1)AuxPlugInUnit故障对应操作:
A.确认riport的MO配置与现场物理连接匹配,并更正
B.如果告警未被清除,请执行以下操作
C.锁定对应AuxPlugInUnit,更换硬件,解锁
D.如果告警未被清除,则按照流程更换回原来的硬件,并联系爱立信
技术支持。
(2)AntennaNearUnit 的Equipment故障对应操作:
A.确认对应MO配置与现场物理连接匹配,并更正
B.如果告警未被清除,请执行以下操作
C.重启连接该设备的RU
D.如果告警未被清除,请联系爱立信技术支持。
(3)AntennaNearUnit 的Configuration Or Customizing Error对应操作:
A.确认并安装和激活license
B.如果告警未被清除,请联系爱立信技术支持。
(4)AntennaCtrlDevice的Equipment故障对应操作:
A.重启对应AIR 单元
B.如果告警未被清除,请执行以下操作
C.更换AIR,并再次重启
D.如果告警未被清除,则按照流程更换回原来的硬件,并请联系爱立
信技术支持。
(5)AntennaCtrlDevice的Configuration Or Customizing Error对应操作:
A.确认并安装和激活license
B.如果告警未被清除,请联系爱立信技术支持。
(27)---License Key
➢告警解释:
此告警是一个主要告警,告警由Managed Object (MO) Licensing发出。
告警细节描述如下表:
➢处理步骤:
确认新的LKF 已经从Ericsson Customer License Center 申请并获取到,并进行下一步;如果未获取到,请联系Ericsson Customer License Center进行申请
通过FTP或者SFTP使用Licensing MO的updateLicenseKey进行LKF 安装
如果告警未被清除,请联系爱立信技术支持。
(28)---告警NTP Server Reachability Fault
➢告警解释:
这是一个主要告警,是由MO IpSyncRef 触发的,当NTP(Network Time Protocol) 客户端检测到NTP服务器为not reachability 时,产生该告警. 同步参考信号的状态会变为NOT_REACHABLE。
➢可能原因:
(1)网络中负荷太高,导致丢包
(2)网络中节点硬件故障
(3)NTP 服务器配置不正确,或者NTP 服务器disable
(4)无效的NTP服务器IP地址
(5)DNS 服务器问题
(6)域名问题.
➢处理步骤:
(1)等待2分钟,如果告警消除,可能是由于网络临时拥塞导致的.
(2)检查MO IpSyncRef下的属性ntpServerAddress ,获得ntpserver的location.
(3)如果ntpserver 的location不是一个域名,使用MO ipaccesshostEt的ping功能,看是否能ping 通ntpserver的ip.如果不能ping通,需要联系NTP server维护人员,查看配置是否正确,如果能ping通,告警仍存在,请联系爱立信技术支持。
(4)如果ntpserver的location是域名,检查MO IP 下的属性dnsServer,获取dns的IP地址,查看是否能ping通,如果不能,需要联系DNS的维护中心,查看配置是否正确。
如果能ping通,再使用MO ipaccesshostEt的ping功能,看是否能ping 通ntpserver,如果不能ping通,需要联系NTP server维护人员,查看配置是否正确,如果能ping通,告警仍存在,请联系爱立信技术支持。
(29)---Plug-In Unit General Problem
➢告警解释:
此告警是一个主要告警,是由MO PIU(plug-in-unit)产生,造成的后果是该PIU携带的业务将会受到影响。
➢可能原因:
(1)重复出现的软件错误
(2)配置错误
(3)硬件错误
(4)PIU未接好
(5)由于没有足够的电源供应,PIU 由于系统的保护功能而被下电
➢可能原因:
(1)查看alarm log 及event log,查看与该告警相关的信息。
(2)查看该告警是否在近几天间断的出现,如果是,有可能是PIU的硬件问题。
(3)如果同时出现power feeding fault的告警,有可能是由于电源保护功能而PIU 被下电。
(4)确认最可能的原因,按以下处理过程进行处理。
➢处理步骤:
(1)如果是软件问题导致的,执行第6步,如果告警消除,退出本次处理过程,如果未消除,请联系爱立信技术支持,进一步行动不在本操作指南讨论的范围之内。
(2)如果是配置问题,修改错误的软件或者硬件配置,有些配置需要重启才能生效,执行第6步. 如果告警消除,退出本次处理过程,如果未消除,请联系爱立信技术支持。
(3)如果是硬件问题,先执行第6步,如果告警消失,退出本次处理过程,如果未消失,需要更换硬件,lock对应的PIU,执行更换PIU的流程,再unlock PIU。
更换硬件之后,如果告警未消失,请联系爱立信技术支持。
(4)如果是因为PIU未接好,需要现场接入该板件,确认硬件连接正确后,执行第6步,如果告警未消除,请联系爱立信技术支持。
(5)如果是电源保护功能的问题,请参照power feeding fault 告警处理。
(6)LOCK有问题的PIU,重启该PIU,RestartRank选择Cold with Test,RestartReason选择Restart ordered to resolve O&M issues,RestartInfo 写入告警名字.在PIU重启完之后,解开该PIU。
(30)---Power feeding fault
➢告警解释:
这是一个主要告警,是由MO PIU(plug-in-unit)产生的,该告警产生的条件是提供-48V直流电源与机框的连接丢失,或者电压的范围超过了允许的范围.
➢可能原因:
(1)外部电源系统故障
(2)DU 与供电系统之间的cable出问题
(3)DU硬件故障
➢处理步骤:
(1)检查外部电源供应系统,电压范围是否正确.
(2)验证电源线和DU板是否连接正确.
(3)确认DU正确安装好,并且DU上的连线都正常.
(4)以上如果都没问题,怀疑DU有问题,根据流程更换DU.
(5)如果问题还存在,请联系爱立信技术支持。
(31)--- Disconnected
➢告警解释:
此告警是由于EC和机框链接出现故障导致
➢可能原因:
(1)EC线故障
(2)机框故障
(3)DU硬件故障
➢处理步骤:
(1)更换EC线
(2)更换机框(如果是共机框站点,联系后台人员配置数据)
(3)更换DU
(32)--- Link Stability
➢告警解释:
此告警表示基站DU到RRU链路连接失败,可能导致小区业务中断。
➢可能原因:
根据不同的告警解释具体可分为以下几类:
(1)Loss Of Signal
意为RRU与DU主单元之间光路断开,光纤断开、传输质量不好或者RRU故障。
(2)No signal detected
意为到RRU到DU无光,光纤断开、传输质量不好或者RRU故障。
(3)Jitter Cleaner PLL not locked
意为RRU到DU无光,光纤断开、传输质量不好或者RRU故障。
(4)High bit error rate on CPRI link
意为DU到RRU链路高误码报警
➢处理步骤:
(1)检查DU和RRU之间的传输,如果不通或者质差则更换光纤或者传输。
(2)检查光模块,如有问题则更换。
(3)重启RRU。
(3)重启DU。
(4)更换RRU。
(33)--- RF Reflected Power High
➢告警解释:
此告警表示驻波比超限。
➢可能原因:
(1)天馈系统故障
(2)RRU故障
➢处理步骤:
(1)检查测量天馈系统驻波比,如有异常则进行更换。
(2)更换RRU。
(34)--- SFP Stability Problem
➢告警解释:
此告警表示光模块故障
➢可能原因:
(1)光模块故障
(2)RRU故障
(3)DU故障
➢处理步骤:
(1)清洁光模块
(2)更换光模块。
(3)更换RRU。
(4)更换DU。
(35)--- TemperatureSensorFailur
➢告警解释:
此告警表示温度传感器故障➢可能原因:
(1)EC线故障
(2)机框故障
(3)DU故障
➢处理步骤:
(1)更换EC线。
(2)更换机框。
(3)更换DU。