华为基站故障处理实例
华为基站故障处理汇总
一、BSC中的MO状态1。
TRXC和LU能够处于下列的各种状态之一:2。
TRXC:复位(Reset)、启动(Started ) 和TGC激活(TGC Active)。
3。
LU:复位(Reset)、不激活(Disabled)和激活(Enabled)。
4。
能够用指令:RXMSP:MO=-----;来打印MO的状态。
参数BTS指示状态。
如果TRXC激活而TGC没有激活时参数TGC来指示状态。
5。
MO的各种状态表:所有的MO都有下列的各种通用状态:1。
UNDEF:MO没有定义。
2。
DEF:MO被定义在预服务状态中。
3。
COM:MO被人工闭塞。
4。
PREOPER:MO正在进入操作状态。
5。
OPER:MO正处于操作状态中。
6。
NOOPER:MO暂时不处于操作状态。
7。
FAIL:MO永久不处于操作状态。
8。
打印例:〈RXMSP:MOTY=RXETRX;RADIO X-CEIVER ADMINISTRTIONMANAGED OBJECT STATUSMO STATE BLSTATE BLO BLA BTS CONF TGCRXETRX-0-0 OPER 0000 0000 STA ARXETRX-0-1 OPER 0000 0000 STA S9。
所有的MO也可能是下列各种闭塞状态中的一种:BLL:由于正处于程序的加载过程而出现的闭塞。
BLT:由于正处于测试过程而出现的闭塞。
MBL:人工闭塞。
BLO:自动闭塞。
BLA:由于激活的需要所产生的闭塞。
如果出现了自动闭塞状态(BLO),则可从BLO的解码表中查出自动闭塞的原因。
二、BLO bit的解码表为:表中的各项说明:-:空。
LMT:MO由于本地维护激活而闭塞。
OML:MO由于OML变化而闭塞。
TGC:MO由于TGC变化而闭塞。
TRXC:MO由于TRXC变化闭塞。
TG:MO由于TG变化而闭塞。
AS:MO可能由于有故障而闭塞。
AT:MO由于自检而暂时闭塞。
AP:MO由于自检而固定闭塞。
华为LTE基站硬件介绍及告警故障处理
eRAN: Evolved Radio Access Network 无线接入网 P-GW: Packet Data Network Gateway 分组数据网络网关 UE: User Equipment 用户设备 3
TD-LTE 硬件架构
射频天馈 基带控制单元 BBU3900 CPRI接口 射频拉远模块 RRU3211
标识 颜色 常亮 常灭 RUN 绿色 1s亮,1s灭 状态 含义 有电源输入,但单板硬件存在问题 无电源输入,或单板故障状态 单板运行正常
0.125s亮,0.125s 单板软件加载中或单板未开工,或正在自动升级版本 灭 常亮 告警状态,需要更换模块 告警状态,单板或接口故障,告警严重程度低于常亮状态,不一 ALM 1s亮,1s灭 红色 定需要更换模块 常灭 无告警 常亮 工作正常 ACT 绿色 常灭 高软开始正常运行前常灭 1s亮,1s灭 单板运行,但ANT口未发射功率 常亮 一个或多个校准通道出现故障 常灭 无驻波告警 VSWR 1s亮,1s灭 红色 小区建立后检测到一个或多个通道异常 0.125s亮,0.125s 启动过程中有一个或多个端口VSWR告警 灭 Ir链路正常工作状态 绿色常亮 红绿双 红色常亮 光模块接收异常告警 CPRI0/IR0 色 红色1s亮,1s灭 Ir链路失锁 SFP模块不在位或者光模块电源下电 常灭 Ir链路正常工作状态 绿色常亮 光模块接收异常告警 红绿双 红色常亮 CPRI1/IR1 红色1s亮,1s灭 Ir链路失锁 色 SFP模块不在位或者光模块电源下电 常灭
RRU
15
RRU 3151-fae 模块详细介绍
功能描述
——RRU3151-fae为三频段1通道RRU,它是天线和BBU之间的功能模块,通常用作室内覆盖,也可用 作室外覆盖。 ——它负责完成对来自天线的上行射频信号的放大、解调,通过Ir链路将IQ数据传送给BBU,并将来 自BBU的下行IQ数据进行调制、放大,通过天线发送出去。通过不同的软件配置,RRU可以同时支 持TD-SCDMA/TD-LTE两种制式双模工作,最大支持的载波带宽为: • • TDS单模:30载波(FA频段内18载波 和E频段内12载波) TDS-L双模:20M+9载波 RRU工作频段: ——F频段(1880MHz~1915MHz) ——A频段(2010MHz~2025MHz) ——E频段(2320MHz~2370MHz)
联通华为基站常见故障解剖
故障定位的常见方法
8.经验处理法
业务中断、ECC通信中断等,可能伴随相应的告警,也 可能没有任何告警,检查各单板的配置数据可能也是完全正 常的。经验证明,在这种情况下,通过复位单板,网元掉电 重启。重新下发配置或将业务倒换到备用通道等手段,可有 效地及时排除故障、恢复业务。建议尽量少使用该方法来处 理,因为该方法不利于故降原因的彻底查清。
•
•
•
•
23
天馈类-BTS3900射频单元驻波告警处理方法总结
• 处理方法总结 使用了排除法,置换法,步步为营法,专 业仪器测试法。运用各种知识最后解决问 题。
24
光纤类-传输光纤故障导致光模块故障 告警致小区退服
现象描述: 某局近期新开通基站DBS3900,开通后1扇区出光模块故障告警。 告警信息: 光模块故障告警。 原因分析: 1、光模块和光纤故障。 2、GRRU故障。 3、GTMU故障。 4、传输环节故障,BBU侧ODF至GRRU侧ODF传输光纤故障。 处理过程: 1、更换故障小区的CPRI口光模块和光纤,故障依旧。 2、BBU侧CPRI自环回,告警不消失。 3、更换1扇区的GRRU、以及更换GTMU,故障不消失。 4、更换1扇区CPRI端口由0号至2号,故障依旧,于是对调1、2扇区的CPRI端口,告警之路号由1号变为2号。
16
故障定位的常见方法
3. 拔插法 对最初发现某种电路板故障时,可以通过插拔一下电路 板和外部接口插头的方法,排除因接触不良或处理机异常的故障。 在插拔过程中,应严格遵循单板插拔的操作规范。插拔单板时, 若不按规范执行,还可能导致板件损坏等其它问题的发生。 4.替换法 当用拔插法不能解决故障时,可以考虑替换法。替换法 就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物
华为5G基站常见故障排查指导
5G项目常见故障排查指导目录1. GPS时钟问题 (2)1.1 GPS硬件结构 (2)1.2 常见时钟故障场景 (2)1.3 处理方案及建议 (2)2. 光路问题 (4)2.1 站点前传光路组网结构 (4)2.2 总体原则 (4)2.3 常见故障及排查思路 (5)3. 高温类告警 (9)1. BBU高温 (9)2. AAU高温: (10)4. 电源类问题 (10)1. 熟悉供电组网: (10)排查步骤: (11)电源类案例: (12)1. GPS时钟问题1.1 GPS硬件结构GPS时钟主要有GPS天线、馈线、避雷器、时钟线、放大器、分路器等组成。
1.2 常见时钟故障场景●GPS开路:主控板侧GPS信号线接头未插紧;制作接头松动;GPS馈线损坏;GPS连接功分器过多;GPS避雷器、功分器、主控板星卡故障●GPS短路:接头制作不规范导致短路;GPS天线接头进水;主控板星卡故障●GPS收星不足:接头、线缆施工工艺差导致GPS信号损耗过大;GPS天线周围有干扰、遮挡;GPS连接功分器过多1.3 处理方案及建议1. 联系后台确认属于哪一类问题,如果是GPS开路或短路,按照2来排查处理;如果是GPS星卡锁星不足,按照3来处理。
2. GPS开路/短路处理过程:天线开路/短路检测原理:硬件通过天线电流来判断天线开路或者短路,软件通过逻辑来读取当前的天线状态。
具体可以按照下面步骤来排查处理:步骤1:排查各节点连线情况;步骤2:排查放大器是否接反,并确保放大器是否处于从主控板到GPS天线之间连线的7:3位置处;步骤3:检查功分器是否损坏,接反;步骤4:检查避雷器连接,是否有进水,损坏等现象;步骤5:检查主控板连接短跳线是否有问题,有无进水等现象。
总结:星卡天线故障可以通过下面3种方法来定位处理方法一:测电压:GPS天线是由BBU上的GPS卡提供电源的。
按上面的排查节点,分段检查BBU侧GPS主控板到GPS天线接口各接线头出的电压是否正常,可分段定位问题。
华为BSCBTS典型故障处理
华为典型故障处理1 告警介绍:1.1告警分类:由于上报告警的网元不同,为告警规划的ID也不同,具体可分为:BSC控制器告警:20***~22***3900基站告警:25***、26***、28***自定义告警:65033~65040(门禁、烟感、水浸、交流断电、稳压器防盗等)从告警需要关注的程度不同可以分为故障、事件、工程告警:故障告警又分为:紧急告警、重要告警、次要告警、提示告警告警与事件的区别:事件是指被管对象发生的任何情况的通称。
例如对象的增加、删除、修改、状态改变等。
考虑到和原有系统的兼容,故障子系统中的事件专指:系统正常运行状态下产生且需要提示用户的通知。
工程告警:对设备在特定状态下上报的告警进行特殊处理,以达到降低告警数量、减轻维护人员工作量的目的。
设置方法:M2000菜单栏依次点击:“监控”、“告警设置”、“工程告警过滤”、“设置”从网管分类不同可以分为:电源系统、硬件系统、环境系统、通信系统、运行系统、业务质量、信令系统、中继系统2 告警查看方法2.1 查看当前未恢复告警未恢复告警就是设备当前存在的告警,需要重点关注和处理,监控未恢复告警是发现故障最直接最快速的手段。
2.1.1M2000操作方法(OMC级别)1、点击菜单栏监控/浏览告警列表2、在出现的过滤菜单栏中将状态为已清除的选项去掉,点击右下角的确认,就会弹出当前未恢复告警的列表。
2.1.2WEBLMT 操作方法(BSC 级别)在WEBLMT 界面依次点击“告警”、“浏览活动告警”、“故障”即可查询当前BSC 以及下挂基站的所有活动告警。
2.2 查询告警日志(历史告警)的方法查看告警日志是故障定位的常用方法,操作与查看未恢复告警类似,M2000对历史告警进行了优化,对同一网元同一告警多次上报进行了归一化处理,在告警信息中多了频次首次发生时间、最近发生时间等字段,如果需要逐条列出历史告警,请到WEBLMT 中进行查询。
2.2.1 M2000操作方法(3 a E H 浏览告警列表回 ilanager12000移动网元管理系^(10.228.192.10)-[主拓扑]监控①维护勉拓扑◎性能(E )安全㈢配置©软件®报表®窗口迴)帮助®系统㈤ 昭卩區册I 邂理A 蟲工作¥查询爭件日志㈢ 当前观團 性能监控日监控國值管理(H )…I 室内分布万冰蒔谷II.--2bJ■11JU :-1■:IaJ^::查询告警日志Q2.2.2WEBLMT操作方法在WEBLMT页面点击告警/查询告警日志,就可以进入到查询历史告警的界面:1、可以对查询的告警类型、告警时间、告警级别等进行设置;2、可以通过基站过滤进行单站点告警过滤;3、返回数目最大可以设置为4000,请修改为4000,防止出现因告警条数超过设置值导致部分告警无法显示的问题;3 性能结果统计统计的三要素:测量对象、指标名称、测量周期测量对象:指测量的网元实体,比如BSC、基站、小区、载频等;指标名称:测量统计的具体名称,比如:“DPUCPU占用率平均值”测量周期:BSC6900目前支持:5分钟、15分钟、60分钟、24小时测量3.1 性能结果统计开启方法BSC6900默认全指标登记,并上传至M2000数据库,但是M2000并不对没有开启的指标进行解析,如果要查询某些指标的结果,进行就必须先在策略设置中开启,具体操作如下:1、点击菜单栏性能/测量管理/测量设置國值管理⑤ 自定艮指标管理側 性能对象集管理回2、弹出的菜单中选择网元、功能级、功能子集、测量周期、测量对象后,单击右下角的“应用”,测量任务就开启了,M2000会对网元下一周期上传的统计结果进行解析,到时就可以查询到对应的统计结果。
华为LTE基站告警故障处理
LTE基站告警故障处理HUAWEI TECHNOLOGIES CO., LTD.Huawei ConfidentialTD-eNodeB整体结构HUAWEI TECHNOLOGIES CO., LTD.Huawei ConfidentialPage 3UMPT主控板UMPT单板主要功能:完成基站的配臵管理、设备管理、性能监视、信令处理等功能。
为BBU内其他单板提供信令处理和资源管理功能。
上维护BBU的功能。
DRRU3138-f提供USB接口、传输接口、维护接口,完成信号传输、软件自动升级、在LMT或OMC920LBBP基带板LBBP单板的主要功能包括:提供与射频模块的IR接口。
完成上下行数据的基带处理功能。
HUAWEI TECHNOLOGIES CO., LTD.Huawei ConfidentialPage 4eNodeB常见告警分析网元连接中断传输相关告警RRU故障告警天馈故障告警时钟源相关告警HUAWEI TECHNOLOGIES CO., LTD.Huawei ConfidentialPage 5网元连接中断告警分析告警名称:网元连接中断告警问题分析网元连接中断说明基站至网管的维护通道故障,引起这个问题的原因一般是由于基站传输异常或者停电。
解决方案检查传输数据是否有改动、检查传输设备是否正常或者上站尝试更换基站UMPT单板。
HUAWEI TECHNOLOGIES CO., LTD.Huawei ConfidentialPage 6传输相关告警分析传输相关告警包括:SCTP链路故障告警用户面承载链路故障告警X2接口故障告警S1接口故障告警HUAWEI TECHNOLOGIES CO., LTD.Huawei ConfidentialPage 7传输相关告警分析问题分析1、传输相关告警一般是由于传输路由问题、传输尾纤故障及硬件故障导致;2、X2接口为相邻站点之间的接口,如果个别站点故障会导致其相邻站点出现X2接口故障告警、SCTP链路故障告警和用户面承载链路故障告警;(检查相邻站点是否正常)3、S1接口为基站与EPC之间的接口,S1的SCTP链路故障说明基站至MME之间链路存在,S1的用户面承载链故障说明基站至SGW之间链路存在问题,如果E PC及传输故障会导致该告警大量产生,如果个别站点配臵数据错误或传输异常也会导致该告警产生。
华为BTS故障案例分析
BTS故障案例分析案例1:TRX单板反复加载1.现象描述某地基站进行预调,先后有3个基站出现上电后TRX单板反复加载现象,现象具体表现:∙基站上电后TMU板启动、运行正常,全部TRX单板由初始状态(4个灯全亮)进入数据加载阶段(RCP/RDP灯0.25秒闪)∙接着TRX单板进入启动阶段(RCP/RDP灯快闪,FAIL灯间断闪)∙然后又回到初始状态,如此循环。
∙操作维护终端可看到TRX单板软件加载进度指示条反复出现,TRX无法正常工作。
2.告警信息:∙TRX主时钟告警∙TRX单板通信告警∙TRX时钟严重告警∙TRX处理器运行告警3.处理方法:(1)检查基站背面数据总线连线:∙从TMU的背板CMB板与数据总线连接插座处查起,直到TRX的背板TRB板与数据总线连接插座处∙接下来检查TRB板上的trx-ID拨码开关设置正常并且没有虚焊∙无数据及控制方面的告警,数据加载正常,可排除数据总线硬件方面的原因。
(2)检查基站时钟系统:∙检查时钟源,基站近端维护查看TMU板状态,重点看时钟模式:♦正常情况下,鉴相器读数与晶振DA值都应为1500左右♦无特殊情况下:设定工作模式和当前工作模式都为外时钟♦有条件测量TMU板的T13M输出的频率是否在正常范围内?∙检查背面时钟总线连线:♦检查TMU的背板CMB板与时钟总线连接插座及与TDU的连接♦检查TDU板工作状态:若TDU板上的绿色和红色指示灯同时亮,至少说明TDU加电正常♦查看TDU的拨码开关♦检查TDU板至各载频之间的时钟总线♦检查机柜时钟总线两端的时钟总线匹配头。
4.三基站处理过程:∙基站1:♦查看TMU单板信息:♣鉴相器读数:0♣晶振DA值:2048♣时钟模式:内时钟。
♦重新设置时钟工作模式:♣时钟模式:外时钟♣晶振DA值:1500♣鉴相器读数始终为0♦复位TMU♣故障不变♦判断TMU板时钟锁相环出了问题♣更换TMU板,故障排除∙基站2:♦判断TMU板无问题♦机柜顶部的时钟分配板TDU板上的两个指示灯都不亮♣ TDU板电源线插头松动♣重新连接后,故障排除。
TD-LTE(4G)站点华为设备常见故障告警处理
TD-LTE(4G)站点华为设备常见故障告警处理FAQ-TD站点常见故障告警处理一、射频单元RRU类告警 (2)1.1、射频单元驻波告警 (2)1.2、射频单元通道异常告警 (2)1.3、射频单元校准通道异常告警 (3)1.4、射频单元通道幅相一致性告警 (3)1.5、射频单元发射通道增益异常告警 (4)1.6、射频单元下行输出功率异常告警 (4)1.7、射频单元硬件故障告警 (4)1.8、射频单元时钟异常告警 (4)1.9、射频单元光接口性能恶化告警 (5)1.10、 BBU连接的射频单元交流掉电告警 (5)1.11、射频单元配置但不可用告警 (5)二、基带单元BBU类告警 (6)2.1、BBU IR光模块收发异常告警 (6)2.2、BBU IR接口异常告警 (6)2.3、BBU IR光接口性能恶化告警 (7)2.4、光模块混插告警 (7)2.5、单板心跳检测失败告警 (8)2.6、单板硬件故障告警 (8)2.7、单板温度异常告警 (8)2.8、单板时钟输入异常告警 (9)2.9、BBU单板维护链路异常告警 (9)三、GPS类告警 (9)3.1、星卡天线故障告警 (9)3.2、时钟参考源异常告警 (10)3.3、系统时钟失锁告警 (11)3.4、星卡维护链路异常告警 (11)3.5、星卡时钟输出异常告警 (11)一、射频单元RRU类告警1.1、射频单元驻波告警告警影响:射频单元RRU发射通道的天馈接口驻波超过了设置的驻波告警门限,对于单通道RRU,该RRU的覆盖区域的业务会中断;对于多通道RRU,发射功率下降,小区覆盖减小。
可能原因与处理建议:1)DSP RRUPARA查询射频单元的驻波值与驻波告警门限2)用负载堵住告警端口,告警恢复,则排查RRU故障,否则更换RRU3)检查天馈接口的馈缆接头是否拧紧或进水4)尝试更换或倒换馈线,重启RRU,观察告警是否恢复5)检查对端天线、合路器是否正常,如故障则予以更换小结:上站处理前建议携带堵头或小天线、RRU馈线及接头等,定位问题时需要用到1.2、射频单元通道异常告警告警影响:下行通道或者上行通道故障,影响小区边缘处的用户接入成功率和边缘处HSDPA用户的速率可能原因与处理建议:1)跟网管确认是否存在“射频单元驻波告警”、“射频单元通道异常告警”,如有,则先处理该告警//////驻波导致通道异常2)执行MML命令RST RRU,远程复位射频单元3)近端检查故障通道与天线的连接4)将故障通道和无故障通道馈线调换,如果告警跟随馈线倒换,则判断是馈线问题,更换故障通道馈线5)如果通道馈线调换后告警没有变化,则判断是RRU问题,更换故障RRU小结:上站处理前建议携带堵头、RRU馈线及接头等,定位问题时需要用到,准备好相关备件,每次调换通道馈线来判断故障点时,最好重启一下射频单元RRU1.3、射频单元校准通道异常告警告警影响:多通道的RRU的校准通道出现故障,导致无法完成通道的校准功能,小区覆盖减小可能原因与处理建议:1)执行MML命令RST RRU,等待10分钟左右,判断告警是否恢复2)近端检查校准馈线与天线的连接3)将故障通道和无故障通道馈线调换,如果告警跟随馈线倒换,则判断是馈线问题,更换故障通道馈线4)如果通道馈线调换后告警没有变化,则判断是RRU问题,更换故障RRU小结:上站处理前建议携带堵头、RRU馈线及接头等,定位问题时需要用到,准备好相关备件,每次调换通道馈线来判断故障点时,最好重启一下射频单元RRU1.4、射频单元通道幅相一致性告警告警影响:宏站RRU对每个载波下所有通道进行幅度相位的校准时,出现了某个载波下的某个通道的幅度异常:影响小区边缘处的用户接入成功率;影响小区边缘处的HSDPA用户的速率可能原因与处理建议:1)跟网管确认是否同时存在“射频单元驻波告警”、“射频单元通道异常告警”,如有,则先处理该告警2)执行MML命令RST RRU,远程复位射频单元3)近端更换故障RRU4)如以上操作后,告警仍未恢复,请联系网优工程师远程检查同频干扰问题(更换载波对应的频点观察告警是否恢复)小结:上站处理前携带相应备件,如需复位或更换射频单元RRU,会中断业务,请在话务量较小时处理1.5、射频单元发射通道增益异常告警告警影响:射频通道的空口实际输出功率与期望功率不一致,可能会影响业务。
华为GPS故障处理案例
现象描述:
某局点有一定数量的基站出现USCU搜星为零的现象,该基站是利旧MOTO的RGPS线缆,线序复杂,需要上站实地解决。其中BSC版本为:V3R6C08SPC100,BTS版本:V4R6C05SPC100
告警信息:
1.CANBUS Detected Abnormal Board Volt.
B)拔插USCU单板
其他:如果上述方法都无法解决,并且打线没有短路,有可能USCU坏板或者UELP内部短路,可断开UELP上的DB头后重启USCU板,测试PWR和GND间电压。如果电压正常,需换UELP板。
特例:如果出现不接蘑菇头,USCU没有这条告警,但是一接上蘑菇头就存在这条告警时,可以推测为蘑菇头电源接反,可以交换USCU上的GND和PWR后再删加单板观察一下。目前仅出现一例。
4、当处理完gps故障,系统会在检测gps工作正常后,会完成时钟源的自动切换。此时,在配置了内部时钟源和单板时钟源时,如果单板时钟源优先级较高,系统会自动检测并自动切换到高优先级时钟源。
但是,系统的时钟源切换不是在更换gps后立刻完成的,需要有一个搜星的过程。因此,当我们对gps故障进行修复后,会存在一个搜星的过程,因此系统不会立刻切换到单板时钟。
第二种可能的原因是USCU上线缆到防雷板之间短路或者断路,或者防雷板到蘑菇头天线之间线缆短路或断路。
第三种可能的原因是USCU单板硬件故障。
第四种可能的原因是蘑菇头天线硬件故障。
处理过程:
1、RGPS总共有四对线缆需要检查:RX+/-,TX+/-,1S+/-,PWR与GND,检查这四对线缆,发现PWR与GND之间电压正常,说明电源接入没有问题,另外三对线缆的正确电压应该是2~3V,-2~-3V,-2V,但是用万用表测量的实际电压正负相反,说明线序错误,但是检查USCU上线缆颜色与安装说明书一致,并没有错,于是定位问题可能是:第一,USCU单板故障;第二,蘑菇头损坏。
华为基站常见故障分析与定位
目录Leabharlann 目录第 2 章 常见故障分析与定位...................................................................................................2-1 2.1 通话类故障分析与定位 ...................................................................................................... 2-1 2.1.1 移动台找网简介 ...................................................................................................... 2-1 2.1.2 打不通电话.............................................................................................................. 2-2 2.1.3 打通后无话音 .......................................................................................................... 2-5 2.1.4 单向通话 ................................................................................................................. 2-6 2.1.5 话音质量差.............................................................................................................. 2-6 2.1.6 断话 ........................................................................................................................ 2-7 2.1.7 串话 ........................................................................................................................ 2-8 2.1.8 移动台频繁掉网 ...................................................................................................... 2-8 2.1.9 立即指配拒绝 .......................................................................................................... 2-9 2.2 上网类故障分析与定位 ...................................................................................................... 2-9 2.2.1 移动台搜索不到网络 ............................................................................................... 2-9 2.2.2 移动台无法登录网络 ............................................................................................. 2-11 2.2.3 频繁位置更新 ........................................................................................................ 2-13 2.3 加载类故障分析与定位 .................................................................................................... 2-14 2.3.1 软件下载失败 ........................................................................................................ 2-14 2.3.2 基站初始化失败 .................................................................................................... 2-16 2.4 信令类故障分析与定位 .................................................................................................... 2-17 2.4.1 OML 链路不通 ....................................................................................................... 2-17 2.4.2 RSL 链路不通 ........................................................................................................ 2-18 2.5 天馈系统故障分析与定位 ................................................................................................ 2-19 2.6 光通道故障分析与定位 .................................................................................................... 2-21 2.7 单板故障分析与定位........................................................................................................ 2-21 2.7.1 CDU....................................................................................................................... 2-21 2.7.2 EDU....................................................................................................................... 2-24 2.7.3 PBU ....................................................................................................................... 2-27 2.7.4 PMU ...................................................................................................................... 2-29 2.7.5 PSU ....................................................................................................................... 2-32 2.7.6 TES ....................................................................................................................... 2-33 2.7.7 TEU ....................................................................................................................... 2-34 2.7.8 TMU....................................................................................................................... 2-35 2.7.9 SCU....................................................................................................................... 2-37 2.7.10 TRX ..................................................................................................................... 2-39
华为BSCBTS典型故障处理
华为典型故障处理1 告警介绍:1.1 告警分类:由于上报告警的网元不同,为告警规划的ID也不同,具体可分为:BSC控制器告警:20***~22***3900基站告警:25***、26***、28***自定义告警:65033~65040(门禁、烟感、水浸、交流断电、稳压器防盗等)从告警需要关注的程度不同可以分为故障、事件、工程告警:故障告警又分为:紧急告警、重要告警、次要告警、提示告警告警与事件的区别:事件是指被管对象发生的任何情况的通称。
例如对象的增加、删除、修改、状态改变等。
考虑到和原有系统的兼容,故障子系统中的事件专指:系统正常运行状态下产生且需要提示用户的通知。
工程告警:对设备在特定状态下上报的告警进行特殊处理,以达到降低告警数量、减轻维护人员工作量的目的。
设置方法:M2000菜单栏依次点击:“监控”、“告警设置”、“工程告警过滤”、“设置”从网管分类不同可以分为:电源系统、硬件系统、环境系统、通信系统、运行系统、业务质量、信令系统、中继系统2 告警查看方法2.1 查看当前未恢复告警未恢复告警就是设备当前存在的告警,需要重点关注和处理,监控未恢复告警是发现故障最直接最快速的手段。
2.1.1M2000操作方法(OMC级别)1、点击菜单栏监控/浏览告警列表2、在出现的过滤菜单栏中将状态为已清除的选项去掉,点击右下角的确认,就会弹出当前未恢复告警的列表。
2.1.2WEB LMT操作方法(BSC级别)在WEB LMT界面依次点击“告警”、“浏览活动告警”、“故障”即可查询当前BSC以及下挂基站的所有活动告警。
2.2 查询告警日志(历史告警)的方法查看告警日志是故障定位的常用方法,操作与查看未恢复告警类似,M2000对历史告警进行了优化,对同一网元同一告警多次上报进行了归一化处理,在告警信息中多了频次、首次发生时间、最近发生时间等字段,如果需要逐条列出历史告警,请到WEB LMT中进行查询。
2.2.1M2000操作方法2.2.2WEB LMT操作方法在WEB LMT页面点击告警/ 查询告警日志,就可以进入到查询历史告警的界面:1、可以对查询的告警类型、告警时间、告警级别等进行设置;2、可以通过基站过滤进行单站点告警过滤;3、返回数目最大可以设置为4000,请修改为4000,防止出现因告警条数超过设置值导致部分告警无法显示的问题;3 性能结果统计统计的三要素:测量对象、指标名称、测量周期测量对象:指测量的网元实体,比如BSC、基站、小区、载频等;指标名称:测量统计的具体名称,比如:“DPU CPU占用率平均值”;测量周期:BSC6900目前支持:5分钟、15分钟、60分钟、24小时测量;3.1 性能结果统计开启方法BSC6900默认全指标登记,并上传至M2000数据库,但是M2000并不对没有开启的指标进行解析,如果要查询某些指标的结果,进行就必须先在策略设置中开启,具体操作如下:1、点击菜单栏性能/ 测量管理/ 测量设置2、弹出的菜单中选择网元、功能级、功能子集、测量周期、测量对象后,单击右下角的“应用”,测量任务就开启了,M2000会对网元下一周期上传的统计结果进行解析,到时就可以查询到对应的统计结果。
华为基站故障处理实例
5.2.3华为基站故障处理实例1. 天馈连接鸳鸯线导致扩容载频后话务量减小现象描述:反映某 312 基站第二小区话务量减小,该站话务量减小是从扩容后,原来是一个载频,采用一个 CDU ,扩容后加了一块载频,同时将 CDU 更换为 EDU ,至此话务量急剧下降,连续 3 天话务量不足原来的 1/4 ,用户怀疑是覆盖范围减小。
告警信息:在告警台中观察不到任何关于该基站的告警,单板指示灯和运行状态均正常。
原因分析:由于用户增加了一块载频,该基站下的四块载频变为五块,但是 PSU 单板只用两块,所以初步分析可能由以下原因造成话务量减小:1 ) PSU 单板不够用,由于每两块 TRX 需要一个 PSU ,所以有可能是这个原因所致;2 )新更换的 EDU 有问题;3 )扩容时连接跳线时接头没有连接牢靠,造成驻波比过大;4 )小区的天馈连接错误。
处理过程:现场检查数据,没有任何问题,观察话统,发现的确从扩容后话务量就一直维持在 1ERL 左右,没有异常告警。
到达现场后加入一块 PSU 板,通过话统对该小区进行测量报告数量的测量,发现很少,话务量没有提高,将 1 、 2 小区的 EDU 更换,现象依旧,仔细检查 TRX 和EDU 之间的连线,也没有错误,又检查天馈连线,发现第二小区的 EDU 的第二个发射端口 TX/RX_ANTB 错误的连接到第一小区天线的发端口,这样以来,第二小区的 BCCH 和 TCH 是通过不同的天线发出去的,造成可能指配信道所在的载频信号很弱,进而发生切换或掉话,切分集接收也不正确,所以造成该小区吸收不了话务量。
将小区天线重新连接,二小区的话务量立刻提升了。
建议与总结:扩容,更换硬件时一定要信心连接线缆,避免连成鸳鸯线,交叉线,如果连接错误通常不会产生告警,故障比较隐蔽,同时会造成一些切换,掉话,话务量上不去的现象。
2. 数据配置不当导致 BTS3006A 在市电掉后出现非主 BCCH 载频退服现象描述:某基站业务信道可用率突然下降,严重影响了考核指标。
关于PON网络故障典型案例
关于PON网络故障典型案例目录1、华为PON网络典型故障案例 (2)1.1、B类ONU上行VLAN透传问题 (2)1.2、ONU参数设置问题 (5)1.3、B类ONU更换PON口 (8)2、阿尔卡特PON网络典型故障案例 (13)2.1、OLT上联口故障 (13)2.2、ONU端口异常 (20)1、华为PON网络典型故障案例1.1、B类ONU上行VLAN透传问题故障描述:接到电话保障一个B类ONU无法上网,网管检查该ONU 状态正常,(该ONU有两个上联口,尾纤接1口时ONU无法登陆,接2口时ONU正常登陆)业务配置正常,ONU上能识别到网口下带电脑的MAC地址,但在OLT上查询不到该MAC地址。
故障诊断:定位及处理过程:1、检查该B类ONU状态正常,无任何异常告警。
2、与现场核对CVLAN,SVLAN与网管上配置一致,检查OLT上service port、线路模板配置正常,检查ONU上service port,以太网端口设置均正常。
3、联系现场,把手提电脑接到对应的网口上,长PING网关。
在网管上,进入ONU的命令行,观察该手提的MAC地址能透传上ONU。
4、进入OLT的命令行,查询不到该MAC地址。
5、双击ONU进入网元管理器,检查VLAN是从0/0/1口透传到OLT 的,而状态正常且在用的是0/0/2口,于是把0/0/2口增加到VLAN 的端口列表中。
6、进入OLT的命令行能够查询到该MAC地址,现场反馈业务正常。
分析情况:1、display mac_address port 0/1/1 查看ONU能否获取手提上的MAC地址。
截图012、display vlan xxx 查看vlan是通过哪个上联口向上透传截图02通过截图看出vlan是从1口向上透传的,而现场在用的是2口。
3、display board x/x 查看板卡上端口的状态。
截图03故障分析为1口是DOWN的,2口为UP的。
VLAN无法从1口透传上去。
华为基站硬件与常见故障处理案例
R
四分集接收与两分集接收相比,可以获得约3~5dB的上行增益
风扇框
➢风扇框配置 1 个风扇盒,内有 4 个风扇和一块风
扇监控板。风扇监控板采集机柜底部的进风口温度
,根据该温度自动调整风扇的转速。
➢风扇框的风扇采用上下排气的方式,机柜底部的
进风口与机顶的后半部构成通风回路,从而为整个
机柜提供强制散热。风扇提供 N+1 冗余备份,一个
• BSC侧载频设备属性需要配置
:射频发射模式为“不合路”,
射频接收模式为“接收分路”。
典型配置S1/1/1
• S1/1/1前两个小区共
用一个DTRU模块,分
别接到两个小区的
DDPU;第三个小区使
用另外一块DTRU和
DDPU。
• BSC侧载频设备属性
需要配置:
DTRU1,射频发射模
式为“不合路”,射频接
为“不合路”,射频接收模
式为“接收独立”;DTRU2
:射频发射模式为“不合
路”,射频接收模式
为“接收分路”。
典型配置S3/3
• S3/3有一个DTRU需要跨小区。
• BSC侧载频设备属性需要配置
:
DTRU1、DTRU3,射频发射模
式为“宽带合路”,射频接收模式
为“接收分路”;
• DTRU2,射频发射模式为“不合
DCOM(合路单元) 组成,满配置时可配 6
块单板,其中最多可配 6 块DDPU。DCOM 只
有在小区配置大于 4载波的情况下使用。
➢DDPU、DCOM 的所有接口均在前面板,通
过线缆连接机柜内部其他单板或模块。
➢DAFU 插框主要完成射频信号的收发双工和
发射合路,接收分集和接收信号放大,低噪声
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.2.3华为基站故障处理实例1. 天馈连接鸳鸯线导致扩容载频后话务量减小现象描述:反映某 312 基站第二小区话务量减小,该站话务量减小是从扩容后,原来是一个载频,采用一个 CDU ,扩容后加了一块载频,同时将 CDU 更换为 EDU ,至此话务量急剧下降,连续 3 天话务量不足原来的 1/4 ,用户怀疑是覆盖范围减小。
告警信息:在告警台中观察不到任何关于该基站的告警,单板指示灯和运行状态均正常。
原因分析:由于用户增加了一块载频,该基站下的四块载频变为五块,但是 PSU 单板只用两块,所以初步分析可能由以下原因造成话务量减小:1 ) PSU 单板不够用,由于每两块 TRX 需要一个 PSU ,所以有可能是这个原因所致;2 )新更换的 EDU 有问题;3 )扩容时连接跳线时接头没有连接牢靠,造成驻波比过大;4 )小区的天馈连接错误。
处理过程:现场检查数据,没有任何问题,观察话统,发现的确从扩容后话务量就一直维持在 1ERL 左右,没有异常告警。
到达现场后加入一块 PSU 板,通过话统对该小区进行测量报告数量的测量,发现很少,话务量没有提高,将 1 、 2 小区的 EDU 更换,现象依旧,仔细检查 TRX 和EDU 之间的连线,也没有错误,又检查天馈连线,发现第二小区的 EDU 的第二个发射端口 TX/RX_ANTB 错误的连接到第一小区天线的发端口,这样以来,第二小区的 BCCH 和 TCH 是通过不同的天线发出去的,造成可能指配信道所在的载频信号很弱,进而发生切换或掉话,切分集接收也不正确,所以造成该小区吸收不了话务量。
将小区天线重新连接,二小区的话务量立刻提升了。
建议与总结:扩容,更换硬件时一定要信心连接线缆,避免连成鸳鸯线,交叉线,如果连接错误通常不会产生告警,故障比较隐蔽,同时会造成一些切换,掉话,话务量上不去的现象。
2. 数据配置不当导致 BTS3006A 在市电掉后出现非主 BCCH 载频退服现象描述:某基站业务信道可用率突然下降,严重影响了考核指标。
告警信息:市电掉告警, PSU 保护,扩展 C3 。
原因分析:由于 TCH 可用率 (%)= TCH 可用数目 / ( 1800/1900 小区 TCH 配置数目+ 900/850 小区 TCH 配置数目)所以到局里采集 TCH 性能测量分析,发现有几个基站在 7 : 30 左右小区 TCH 可用数目比实际配置的数据少了 8 个,该基站配置为 S2/2 ,也就是少了一个载频的TCH 信道。
查看相应的历史告警,发现该基站在 7 : 30 左右上报了市电掉, PSU 保护,扩展 C3 等告警,初步定位为该基站在市电掉后非主 BCCH 退服,但是局方配置的是 800 AH 的蓄电池,应该够我们基站正常工作了。
造成非主 BCCH 退服的原因有:1 ) TRX 驻波过大,造成 TRX 关功放( TCH 载频可能性较小);2 )人工闭塞 TRX ;3 ) TRX 硬件故障;4 )数据配置不当。
处理过程:1 )告警台查看小区历史告警,没有驻波告警,只有基站市电掉告警;2 )维护台查看基站单板工作状态,此时市电已有,所有工作状态正常,为解闭状态,与硬件上应该没有什么关系;3 )怀疑数据配置问题,检查数据配置,发现每块载频的设备属性中都有一个可关闭的选项,该选项用于控制 BSC 在基站掉电进入蓄电池供电模式时是否自动关闭此载频的功放以省电;4 )把非主 BCCH 载频的可关闭选项去掉,基站在市电掉后非主 BCCH 载频靠蓄电池供电工作正常。
建议与总结:由于 BTS3006A 是室外型基站,会上报市电掉告警,系统根据上报的市电掉告警和载频设备属性的可关闭配置,判断是否关闭该载频。
3. 门磁告警风扇告警直流欠压问题处理现象描述:某 BTS312 基站,配置为 S3/2/1 , 4 块 PSU ,一块 PMU ,告警台提示 PMU 门磁告警、风扇告警、直流欠压, PMU 单板 ALM 指示灯显示红色常亮,其它单板指示灯正常,业务正常。
告警信息: PMU 门磁告警、风扇告警、直流欠压。
原因分析:门磁告警可能的原因:1 )机柜被打开;2 )蓄电池柜门被打开;3 )门磁传感器损坏或传感器连接电缆故障。
风扇告警可能的原因:1 )风扇故障;2 )风扇与 PMU 背板 PWB 连接故障。
直流欠压告警可能原因:1 )直流输出(即母排电压)低于 22.5V ;2 )电源模块故障或负载过重。
处理过程:首先,检查门磁传感器损坏或传感器连接电缆,正常。
然后更换风扇,风扇告警依旧,排除是风扇故障;将风扇与 PWB 板连接的端子短接,风扇告警依然没有消除,排除风扇与 PMU 背板 PWB 连接故障。
测量母排电压为 26V 。
能引起这三种告警可能的原因一一排除,于是怀疑是 PMU 单板故障,更换 PMU 单板后,故障依旧,于是决定更换 PMU 、 PSU 单板的背板 PWB 尝试一下,断站更换 PWB 板,基站重新上电初始化后, PMU 门磁告警、风扇告警、直流欠压告警全部消失。
建议与总结: PWB 板故障、 PWB 与 CMB 的连线或 CBUS 总线故障都有可能引起PMU 单板告警,我们在处理时要具体问题具体分析。
另外电源背板故障还能导致 PMU 出现“机柜浸水”和“机柜烟雾”误告警。
4. 环境告警接头导致 CDU 单板通信告警现象描述:某基站雷击后基站中断,更换 TRX 后基站可以正常工作,但出现 2 小区两块 CDU 有单板通信告警。
该基站为 BTS312 基站,站型为 S(1/2/0) 。
使用扩展告警上报停电告警和环境告警。
告警信息:小区两块 CDU 有单板通信告警。
现场更换 2 小区两块 CDU ,加电后,发现所有 CDU 、 PMU 、 PSU 都单板通信告警。
原因分析:一般单板通信告警问题产生的主要原因有:1 、如果是某一块单板通信告警,可能是单板故障或与总线连接处有问题,可以更换单板和拔插单板。
2 、如果是几块单板通信告警,可能原因有:1 ) TMU 、 TDU 损坏;2 )某一单板故障或某一端口异常造成总线吊死;3 )总线故障;4 )机柜顶部匹配头故障;5 )数据配置和实际不一致;6 )机柜拨码开关不对。
本基站故障为由于雷击后扩展告警端口异常,造成总线吊死,导致 CDU 单板通信告警。
处理过程: 1 、因为椐用户介绍,该基站遭雷击,因此首先怀疑 CDU 单板故障,现场更换 2 小区两块 CDU ,加电后,发现所有 CDU 、 PMU 、 PSU 都单板通信告警;2 、此时判断问题可能和总线有关, TMU 板更换后,故障依旧。
打开后门观察 T DU ,运行灯正常,本着先简后繁的原则没有立即更换 TDU ,怀疑是 CDU 面板上 CBUS 插头短路,取掉所有 CDU 的 CBUS 插头,拔出 PMU 板,故障依旧;3 、将 CDU 和 PMU 恢复,拔掉机柜顶部 DCF 匹配头,故障依旧。
最后拔掉停电告警接头和环境告警接头,所有通信告警消失;4 、重新接上扩展告警,没有告警产生,故障排除。
建议与总结:现场处理基站单板通信故障时最好结合原理分析各种可能性,按照先简后繁操作。
5. 传输地和基站地存在压差导致传输不稳现象描述:某基站没有任何告警,但是传输不稳,时断时续,时好时坏, BSC 侧BIE 灯有时亮,有时一秒闪,有时候又灭。
传输好的时候,通过远端维护台查询基站单板状态,反应明显迟缓;传输不好的时候,基站不断初始化,但总是无法完成,显示通信超时。
告警信息:无。
原因分析:传输地跟基站地之间存在压差,会导致传输严重不稳,基站无法正常工作。
处理过程:首先怀疑传输问题,对 BSC 、 BTS 自环,无误;然后怀疑是基站问题,更换了所有有关的板子,故障依旧。
这样,排除了基站本身的故障,定位问题在传输上。
再次对 BSC 、 BTS 自环,结果时好时坏,用传输误码仪测误码,发现基站侧传输线自环后,观察 20 分钟,没有误码,但是一旦接上基站,误码率很大。
问题比较奇怪。
根据实际情况和故障现象,最后测量了传输地跟基站地之间的电阻,大约为 15 左右欧姆,这样造成两地之间存在了一个将近 8 伏的压差。
将传输地与基站地短接起来。
一切恢复正常。
6. TRX 与 TMU 版本不一致导致基站 GPRS 业务无法进行现象描述:在基站覆盖区域手机语音业务正常,但 GPRS 业务无法进行。
告警信息:无告警。
原因分析:1 、在 PCU 中未设置小区数据,没有开通小区的 GPRS 业务;2 、在 BSC 数据配置中,没有配置小区静态和动态的 PDCH 信道;3 、基站的各单板单板版本不一致,导致基站工作不正常,影响数据业务;4 、手机没有开通 GPRS 业务,或不支持 GPRS 业务。
处理过程:1 、确认用户手机支持并已开通 GPRS 业务;2 、在 PCU 维护台上查看小区数据,已配置 GPRS 业务数据,小区状态正常;3 、在 BSC 维护台上查看小区数据,确认小区配置了至少一条静态的 PDCH 信道;4 、在基站维护台上查看基站数据,发现 TRX 与 TMU 版本不一致,给 TRX 升级后业务正常。
建议与总结:这个问题其实是可以避免的。
只是由于我们在数据设定时没有按照基站升级规范把这个站的自动激活开关打开,使得基站的 TMU 和 TRX 版本保持一致。
现在回头思考一下,为我们在以后的工作中敲响警钟,任何一个小的操作失误都可以给客户带来损失!7. TDU 问题导致 312 基站的 TMU45 扩展告警不能上传现象描述:某局反映某 312 基站停电告警不能上传,在现场反复做停电告警测试,都没有上报告警。
告警信息:无。
原因分析:1 、告警数据(电平定义字)设定错误;2 、该路扩展告警在 TDU 上的管脚接错;3 、告警线不通;4 、配电柜的干节点吸合器不能正常工作;5 、 TDU 故障。
处理过程:1 、首先检查告警数据设定,定义为低电平告警。
与基站版本 (04.1130) 匹配;2 、现场检查告警线的焊接,接在 20 和 27 两个管脚是正确的;3 、用万用表测量告警线的是否导通,正常;4 、将告警线的干节点端子接到配电柜的对应端子上,进行停电告警测试,断开市电后,告警线上电压为 0 ,市电供电时,告警线有 5V 的高电平,说明配电柜能够正常判断市电的供给情况;5 、取下机顶的 DB37 告警插头,测量 TDU 的 20 和 27 管脚,发现只有 2.4V 的模拟电压,问题就出在这里了。
正常情况下,该端子应该有 5V 的模拟电压, 2.4V 的模拟电压是不能将停电告警上报给 BSC 告警台的。
骤进行更换 TDU 处理。
更换后测量 TDU 的两个管脚,有 5V 的模拟量。