毕业论文基站故障维护及实例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基站故障维护及实例分析
摘要现代人的生活中,已经很难离开移动通信技术,而移动基站作为通信顺畅的保障,基站设备的维护和管理就显得异常重要。
如何保证移动通信网络的网络质量已成为通信网络中比较重要的部分。
除了通信技术的越来越完善、通信设备的越来越成熟,移动基站在移动通信过程中起到了基础性和保证性的作用。
本文从移动基站的维护方面入手,论述了基站维护的一般步骤,并简要介绍了故障定位的常见方法,主要研究基站故障的处理方法,包括通话类故障的处理、网络类故障的处理、加载类故障的处理,基站报警故障等故障的分析处理,最后并列举了基站维护实例。
关键词移动基站;设备;故障维护;管理
1引言
随着网络时代的的飞快发展,移动通信进入了高速发展的通信时期,因此,移动基站的维护对于网络发展来说,显得越来越重要,尤其是随着移动基站数越来越多,网络越来越庞大,基站维护是网络运行的重要保障基础。
为了保证设备正常运行,机房装有许多配套设备,这些配套设备必须24小时监控,任何一种异常情况都必须得到及时有效地处理。
否则,将对机房中各系统的正常工作带来严重危害,后果不堪设想。
为了能保证设备的正常运转,提升网络指标,这就需要我们维护人员对这些基站进行定期或不定期的维护。
基站作为移动通信的重要组成部分,它是不可或缺的,通信技术的不断更新,需要基站也要做出相应的变化,基站是网通信的基础,因此,保证基站的正常运行是保证整个通信顺利进行的保障。
本文就以无线基站的故障维护进行介绍。
2基站维护步骤
2.1基站维护的一般步骤
基站维护的一般步骤分为四步,即故障信息收集,故障分析,故障定位,故障排除四个步骤,如图2-1所示。
图2-1系统维护的步骤
在故障处理过程中,必须遵守所在地的安全规范和相关的操作规程,否则可能会导致人身伤害或设备损坏。
基站维护的一般要求为只有经过BSS系统培训的,掌握BSS系统的理论基础、熟悉BSS设备的原理和组网的专业人员才能对设备进行相关操作。
基站维护的设备操作的注意事项要求维护人员严格遵守设备的操作规范,在接触设备
的操作要注意,对单板进行操作时必须佩带防静电手环,对于插拔、更换关键单板,须作好人员和板件的准备,以便应付不测,并且经常检查备件,保证常用备件的库存和完好性,防止受潮霉变,对备件与维护更换下来的坏件要分开保存,做好标记,用防静电袋妥善保管[1]。
对于数据的维护,必须做到严禁白天进行数据同步、数据更改操作,要求选择低话务量时段(如午夜),对于导致大量数据上报的操作,尽量选择低话务量时段(如午夜)进行,重要数据修改前必须备份且做好记录,修改后密切观察一段时间后(约一周)确认设备运行正常,才能删除备份数据,如果发生异常须及时恢复。
2.2故障定位的常见方法
(1)观察分析法
观察分析法就是当系统发生故障时,在设备和网管上将出现相应的告警信息。
通过观察设备上的告警灯运行情况,可以及时发现故障;故障发生时,网管上会记录非常丰富的告警事件和性能数据信息,通过分析这些信息,并结合SDH帧结构中的开销字节和SDH 告警原理机制,可以初步判断故障类型和故障点的位置。
(2)测试法
进行环回操作时,先将故障业务通道的业务流程进行分解,画出业务路由图,将业务的源和宿,经过的网元,所占用的通道和时隙号罗列出来。
然后逐段环回,定位故障网元。
故障定位到网元后通过线路侧和支路侧环回基本定位出可能存在故障的单板。
最后结合其他处理办法,确认故障单板予以更换排除故障,这就是测试法。
(3)拔插法
对最初发现某种电路板故障时,可以通过插拔一下电路板和外部接口插头的方法,排除因接触不良或处理机异常的故障的方法就是插拔法。
但在插拔过程中,应严格遵循单板插拔的操作规范。
插拔单板时,若不按规范执行,还可能导致板件损坏等其它问题的发生。
(4)替换法
当用拔插法不能解决故障时,可以考虑替换法。
替换法就是使用一个工作正常的物件去替换一个被怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。
这里的物件,可以是一段线缆、一块单板或一个设备。
(5)配置数据分析法
在某些特殊情况下,如外界环境的突然改变,或由于误操作,可能会导致设备的配置
数据遭到破坏或改变,导致业务中断等故障的发生。
此时,故障定位到网元单站后,可通过查询、分析设备当前的配置数据;对于网管误操作,还可以通过查看网管的用户操作日志来进行确认。
(6)更改配置法
更改配置法更改的配置内容可以包括时隙配置、板位配置、单板参数配置等。
因此更改配置法适用于故障定位到单个站点后,排除由于配置错误导致的故障。
更改配置法最典型的应用是排除指针问题。
(7)仪表测试法
仪表测试法一般用于排除传输设备外部问题以及与其它设备的对接问题。
通过仪表测试法分析定位故障,比较准确。
但是也会缺点,这就是对仪表比较高的需求[2]。
3主要故障的处理
基站的故障会有各种形式,很复杂,处理故障的方法也会有各种各样的方法,对此,文中列举了几种常见的基站故障的处理方式。
3.1通话类故障的处理
移动台一般在HPLMN中活动,但是在一些特殊的情况下,移动台可以选择其他PLMN 进行服务。
移动台选择网络的方式有两种:自动找网和手工找网。
移动台带卡开机或插入SIM后,检查是否存在上次登录的PLMN。
如果存在,就试图登录此院PLMN。
如果登录成功,则移动台用此PLMN服务。
如果登录失败且原因是没有合适小区,则移动台搜寻至少30个900M频道或者40个1800M频道(对射频信道进行搜索的过程隐含了对PLMN 的选择)。
如果登录失败且原因是位置更新失败,则不必选择上述信道,但必须向用户显示可以利用的PLMN。
用户可以选择自动或手工方式进行网络选择。
在自动找网方式下,移动台根据自己保存的PLMN列表的优先级进行网络选择;在手工模式下,移动台向用户显示可以利用的网络,按照用户的选择试图登录到指定的PLMN 中。
移动台的漫游过程对移动台的找网有一定的影响,其过程分为两种:国际漫游和国内漫游。
国际漫游是移动台登录到一个与HPLMN所在国家不同的国家的PLMN。
国内漫游是移动台登录到一个与HPLMN所在国家相同的国家的PLMN。
当移动台国内漫游时,将周期性搜寻HPLMN。
为了防止移动台在国内漫游时频繁登录一个禁止的位置区(LA),移动台将此LA存于移动台设备的一个“Forbidden Las for national roaming”表中。
此表在移动台关机或拔出SIM卡时被清除。
另外移动台将一些服务禁止的PLMN存于自己的SIM
卡中。
当且仅当进行手工找网选择此PLMN ,并且成功位置更新后,才将此PLMN 从服务禁止的PLMN 表中删除。
移动台找不到网是指在选择PLMN 或小区时失败[3]。
3.1.1打不通电话的故障
手机开机以后找到网络,拨号后发生以下现象:在对方电话并未占线的情况下,拨号后无振铃;拨号后听到振铃,然后被自动挂断;拨号后听到振铃,当接听时被自动挂断。
当这些现象出现时就有可能出现了通话故障,需要按以下步骤排查。
首先如果发现立即指配失败则检查失败时的指配命令,看有没有SDCCH 。
如有则说明小区容量不够,需重新配置或增加小区容量。
如没有则可能是数据配置有问题,查看数管台的小区寻呼参数的设置;然后如果发现出现立即指配完成而是在指配TCH 时出现失败,则看是否是TCH 。
如是则检查数管台的Abis 口数据映射关系。
如不是则说明小区容量不够,需重新配置或增加小区容量,如图4-1所示。
检查Abis 接口
立即指配完成
No Yes 有无可用SDCCH 重新配置或增加小区容量
No Yes
检查寻呼参数的设置
指配完成No Yes
有无可用TCH 重新配置或增加小区容量No Yes 检查Abis 接口数据映射关系
无线链路失败
A No 检查测量报告
B Yes
开始
图4-1打不通电话故障流程1
但是如果失败是在TCH 信道建立后出现无线链路失败,则观察该信道失败前的测量报告。
如是BTS 或手机的接收质量太差导致的,则可能有以下原因:
(1) BTS 连接不正确;
(2) TMU 时钟精度太差;
(3) 空间干扰太大;
(4) BSC 时钟精度不够;
(5) 天馈线系统问题。
而如果断链原因是网络侧没有路由,则可能是:
(1) BSC 交换网连接错误;
(2) TC 板工作异常;
(3) A 接口闭塞;
(4) MSC 无法获得漫游用户号码;
(5) MSC 侧闭塞了部分路由[4],如图4-2所示。
如不是以上原因,则需要仔细分析其他原因。
接收质量太差
B
Yes 可能原因:1.BTS 天馈连接不正确2.TMU 时钟精度太差3.空间干扰太大4.BSC 时钟精度不够5.天馈线系统问题
网络侧没有路由Yes
可能原因:1.2.TC 板工作异常
3.A 接口闭塞
4.MSC 无法获得漫游用户号码
5.MSC 侧闭塞了部分路由No BSC 交换网连接错误
No
其他原因
可能原因:
结束
TC 板程序不正常
A
图4-2打不通电话故障流程2
3.1.2打通后无话音故障
如果出现移动台可以振铃,但接听后没有话音,则可能出现了打通后无话音的故障,按着以下步骤基本可以解决。
(1) 查看网板时隙占用情况,看是否已经正确布网,即两个TCH 都已经正确交换;
(2)关闭DTX,看现象是否重现;
(3)查看信令分析仪表或通过BSC维护台查看Abis信令接口跟踪,看是否有呼叫重
建失败消息;
(4)复位TMU(DTMU或MCU)板,看现象是否重现;
(5)若仍有该现象,则可能是固定网侧交换机的交换出现错误交换;
(6)插拔TC单板或更换TC单板,看现象是否重现,不重现则是单板问题;
如果不是以上原因,则需要仔细分析其它原因。
3.1.3单向通话故障
手机可以打通电话,但是主被叫都是手机时,一方没有话音或者主被叫是手机和固定电话时,一方没有话音。
如果总是个别手机的现象,可能是手机送话器故障造成的,首先关闭DTX,看现象是否重现。
如果不是硬件问题则通过查询BSC维护台上单板维护的网板状态,查看网板时隙占用状态,看电路是否正常交换,如果在MSC处跟踪查询电路状况,如在某些电路端口始终不通则将该端口闭塞或更换TC板。
不然则是公网问题[5]。
3.1.4语音质量差故障
移动台开机以后找到网络,作为主叫或被叫均能打通电话,但话音质量太差。
则按照以下步骤一次排查。
(1)查看移动台上的信号强度,若强度很低,表明接收电平过低,尝试走到户外空旷
处进行通话;
(2)请对方检查移动台电池电压是否充足;
(3)确定是否与TRX或TRX的某些时隙有关,如是则复位TRX或更换TRX;
(4)通过信令分析仪表或BSC维护台上的Abis接口跟踪,查看移动台上报的测量报
告,确定是上行电平差还是下行电平差;
(5)如果是上行电平差,看移动台电源是否充足;
(6)如是下行电平差,可怀疑是覆盖问题,检查基站发射功率是否下降,用户是否处
于小区边缘;
(7)如果电平可以,但误码率高,怀疑是时钟不稳,尝试用仪表测量BTS、BSC的时
钟精度进行定位;
(8)如果电平、误码率都没有问题,可检查BSC、BTS之间传输线上的干扰;
(9)检查天馈系统。
3.1.5出现断话故障
断话就是话音断断续续,表示这条通话链路是建立起来并一直保存着的。
断话就是在
这条链路上的某些地方有一些断点,使话音不能正常的传送到接收方。
在这条链路中,形成断点的地方可能有:
(1)TC板工作不正常,先复位,如仍不能解决,需要更换TC板。
网络侧和基站测的
误码太大,这涉及到BSC的时钟、BTS的时钟精度和传输线之间的干扰;
(2)TRX的灵敏度太低,更换TRX;
(3)小区间同频干扰,重新配置小区数据;
(4)接收天线馈管不良,检查接收天线有无进水、腐蚀短路现象;
(5)确定移动台是否离基站过远或处于盲区;
(6)固定网设备异常。
3.1.6出现串话故障
串话即移动台在正常通话过程中听到另一路话音。
处理过程有查看网板布网情况,看实际是否出现少布网或重布网情况;还有就是怀疑交换侧时隙交换出错,这种现象在固定网中比较常见[6]。
3.1.7移动台频繁掉网故障
如果出现移动台频繁掉网故障,则应该检查系统消息下发是否正确,小区重选参数、随机接入控制参数是否在频繁变化。
用测试移动台检查移动台显示的C1值是否过小,如果是,检查影响C1值的几个参数是否设置适当,如MS最小允许接收电平、MS最大允许发射功率等;以及检查移动台的上下行接收电平,看移动台是否在覆盖不好的区域。
并且检查BTS输出是否抖动过大,如果是,检查TRX输出是否正常、天线固定是否不稳定。
3.2网络类故障问题
3.2.1移动台搜索不到网路
如果小区没有开工,应对其所属站点进行分级复位。
该操作会影响该站点下的其他小区的通话,在初始化时显示初始化各阶段的进度指示。
基站初始化分两大阶段完成:站点初始化和小区初始化。
站点初始化包含以下步骤:
(1)设置站点逻辑对象;
(2)设置站点硬件对象;
(3)设置站点扩展属性;
(4)建立多点连接;
(5)站点开工。
小区初始化包含以下步骤:
(6)建立TEI;
(7)建立信令信道连接;
(8)建立业务信道连接;
(9)设置小区属性;
(10)设置小区扩展属性;
(11)设置RC属性;
(12)设置RC扩展属性;
(13)设置信道属性;
(14)设置小区告警门限;
(15)小区开工;
(16)等待小区状态改变报告。
进行初始化操作后,维护台界面会实时显示每个阶段的操作结果。
如果成功则在阶段后面显示成功,用实心的五星表示该操作成功。
如果显示不成功,空心的五星表示该操作失败,并针对显示的失败原因进行相应的检查。
3.2.2移动台无法登录网络
如果小区未开工,对站点四级复位,看初始化流程是否正常。
首先判断小区开工的方法是在后台基站维护台上选择对应小区进行“获取小区属性”操作,如返回“小区未初始化”则表示小区未开工。
如能返回对应的信息则表示小区已经开工了。
对于未开工的小区,对其站点进行分级复位(该操作会影响该站点下的其他小区的通话),在初始化时显示初始化各阶段的进度指示。
基站初始化分两大阶段完成:站点初始化和小区初始化。
站点初始化包含以下步骤为设置站点逻辑对象、设置站点硬件对象、设置站点扩展属性、建立多点连接、站点开工四步。
小区初始化包含以下步骤:
(1)建立TEI;
(2)建立信令信道连接;
(3)建立业务信道连接;
(4)设置小区属性;
(5)设置小区扩展属性;
(6)设置RC属性;
(7)设置RC扩展属性;
(8)设置信道属性;
(9)设置小区告警门限;
(10)小区开工;
(11)等待小区状态改变报告。
进行初始化操作后,维护台界面会实时显示每个阶段的操作结果。
如果成功则在阶段后面显示成功,用实心的五星表示该操作成功。
如果不成功空心的五星表示该操作失败,并显示失败原因。
如果初始化显示数据出错,检查相应数据配置是否正常,如果初始化显示操作不能执行,表示基站的主控板对相应单板下配置出错,检查单板是否正常[7]。
(1)如小区已经开工,则检查该小区的时钟信号和BCCH对应的TRX板是否工作正
常,如不正常则进行相应的处理。
检查的方法为打开后台维护台的设备状态查
询,查看显示的单板状态。
如果变红则表示工作不正常。
如果异常请检查基站
的硬件是否正常、TRX与TMU是否正常通讯,各单板是否正常供电;
(2)对于双频移动台强制为单频造成的不能上网,改为双频即可;
(3)对于人为扰乱设置造成的不能上网,恢复为出厂设置即可。
3.2.3频繁位置更新故障的处理
在空闲方式下,MS频繁地出现时而显示所上网络,时而不显示所上网络的情况,这就是出现了频繁位置更新的故障。
处理此类故障时,首先查看接口信令,如果是“NORMAL LOCATION UPDATING”,移动台可能处于位置区重叠边界地区(很少发生),尝试往任意方向前进;如果频繁出现“IMSI ATTACH”接口消息,若不是人为地快速开关机,首先检查是否电平过低导致移动台接收不到基站消息而掉网;其次检查移动台是否正常渠道流入市面,曾发现走私移动台每两秒做一次位置更新,移动台未通过国家检查入口;如果移动台频繁位置更新是定期位置更新,则系统消息可能不正常,设置的位置更新周期可能过短,检查移动台是否正确收到该系统消息(如果有测试移动台,可以清楚看到该值T3212)。
然后修改系统消息中T3212的值,不同的系统消息中携带的位置区号不一致,保持一致。
3.3加载类故障分析与处理
3.3.1软件下载失败
基站软件下载过程失败,界面未提示“软件下载成功”,表明新版本软件没有下载到
基站。
此故障的解决主要有四步:
(1)确信线路连接正常;
(2)确信管理权设置正确;
(3)确信下载的软件与选择的类型相匹配;
(4)确信下载软件的版本号正确[8]。
3.3.2基站初始化失败
根据出错的初始化过程的步骤,仔细的检查并更正相应的数据配置,查看相应单板,使单板正常工作。
检查维护链路,并使维护链路保持通畅。
在初始化进程中随时可能发生错误,比如:
(1)“数据配置出错”、“消息与物理配置不一致”表示在BSC数管台配置数据有误,
请检查数据配置;或者说明BTS的拨码开关有误,请检查拨码开关设置;
(2)“通讯超时”表示BTS在规定的时间没有响应。
此时BSC会进行重发,如果仍然
超时,说明BSC到BTS的传输链路已断或BTS的TMU出现致命故障;
(3)“消息结构出错”、“消息类型出错”、“非法对象类别”、“不支持的对象
类”、“BTS号错误”、“TRX号错误”、“非法的属性标识”、“不支持的
属性”、“参数越界”表示BSC下发的命令有误,可能原因是BSC出现故障。
“参数越界”也有可能是数据配置有误引起[9]。
3.3.3信令类故障分析与定位
从维护台查询相应的维护链路,发现OML链路对应的信令链路状态不是多帧建链状态。
如果对应的OML链路是TEI未分配状态,那么请首先检查对应的数据配置是否正确;如果检查相应的数据配置和硬件配置是否一致;再查看LAPD板是否正常在位;如果确认对应的BIE板状态正确,板上的HW、E1线是否插好,BIE板相应E1端口状态不正常时,连接有误,然后检查基站的TMU板的状态是否正确[10]。
3.3.4RSL链路不通
从BSC维护台查询相应的信令链路发现链路状态不是多帧建立状态。
处理此类故障需要以下几步:
(1)如果链路的状态是TEI未分配状态,那么请重点检查相应链路的数据是否正确
配置;
(2)如果链路的状态是断链状态,请检查相应链路的数据是否和硬件的配置一致。
如果不一致,请调整数据配置,或者调整硬件配置,使二者保持一致;
(3)检查BSC的BIE板,看对应的单板的状态,E1线、HW线是否正确地插好了。
如果没有请将它们插好,并检查相应状态是否正常;
(4)检查相应的LAPD板是否在相应的位置,状态是否正常。
其它链路是否建链了;
(5)检查BTS的TMU板,看其状态是否正常;
(6)相应小区软件是否激活,是否正常运行;
(7)确保900M/1800M的载频属性正确;
(8)检查BTS机柜顶的匹配头是否插好[11]。
3.4天馈系统故障分析与处理
天馈系统负责为MS与BTS之间提供双工无线通道,下行方向指BTS与MS的无线通道,上行方向指MS→BTS的无线通道。
天馈系统的故障可以分别在其上下行两个通道排除。
3.4.1下行信号不好
(1)检查TRX模块(包含功率放大器)TX OUT端口输出是否正常,如不正常则更
换TRX模块;
(2)检查CDU模块TX/RX_ANT端口输出是否正常,如不正常则更换CDU;
(3)从与CDU模块TX/RX_ANT端口相连接的1/4英寸跳线接头处测试天线端的驻
波比,若驻波比正常则检查天线的俯仰角,并将其调整到合适的角度;
(4)如果1/4英寸跳线接头处测试天线端的驻波比不正常,逐段检查该端口与发信天
线之间连接电缆(包括塔放,避雷器)各连接端口的驻波比,下列情况都有可
能导致驻波比性能变坏:如接头没有安装好、接头处由于密封不好导致进水、
天馈避雷器驻波过大、天线驻波过大、天线进水等,根据具体原因采取相应措
施;
3.4.2下行信号时好时坏
(1)检查TRX模块(包含功率放大器)的输出(TXOUT端口)是否稳定,若不稳
定则更换TRX模块;
(2)检查室外天馈系统安装是否可靠,消除天线和馈线等随风大幅度摆动的因素。
3.4.3上行信号不好
(1)检查CDU有无塔放告警(TTA),如果有则更换塔放。
CDU塔放告警可查看面
板指示灯显示和操作维护台告警上报;
(2)检查CDU低噪声放大器(LNA)有无告警,如果有则更换CDU模块;
(3)检查CDU天线输入端口TX/RX_ANT到机柜顶的连接电缆是否正常,如不正常
则更换电缆;
(4)从机柜顶检查天馈线的驻波比,其步骤同下行信号不好的第四步类似[12]。
3.5基站告警故障的分析处理
3.5.1驻波比告警
在不匹配情况下,馈线上同时存在入射和反射波,两者叠加形成驻波,在入射波和反射波相位相同的地方振幅相加最大,形成波腹,入射波和反射波相位相反的地方振幅相减为最小,形成波节,则波幅与波节电压幅度之比为驻波比。
终端负载阻抗和特性阻抗越接近,反射系数越小,驻波比越接近于1,匹配也就越好。
处理驻波比的方法一般有置换法和步步为营法两种。
置换法就是用工作正常的CDU 置换发生告警的CDU,检验天馈系统是否正常。
具体方法为将有故障嫌疑的天馈系统的跳线,改装到工作正常的CDU的天线端口,TRU输入功率,观察CDU是否有告警。
如果有告警,说明天馈系统有故障;否则,CDU有故障。
而步步为营法就是当定位天馈系统有故障或怀疑天馈系统有故障时,可以采用该检查方法,定位是否需要更换天馈部件。
具体方法为测试从1/2跳线到天线之间的各段电缆的驻波比,如果某段电缆的驻波比大于1.5,说明该段电缆或接头有问题[13]。
3.5.2PA电压驻波告警
将怀疑有问题的TRU与其它正常小区的TRU互换,分别检查原告警小区和原正常小区是否出现相同告警。
具体分以下几种情况:
如果原告警小区仍然告警,原正常小区仍然正常,说明告警的产生与TRU无关,可能是PA、天馈或背板有问题,可以进一步采用互换板件的办法排查板件故障。
如果原告警小区告警消失,但原正常小区出现告警,说明TRU有问题,更换TRU。
如果原告警小区告警消失,但原正常小区也没有出现告警,可能是模块接触不良,可以将TRU换回[14]。
3.6因各种干扰引起的故障
移动通信系统中的干扰也会影响基站的正常工作,有同频干扰,邻频干扰,互调干扰等。
现在陆地蜂窝移动通信系统采用同频复用技术来提高频率利用率,增加系统容量,但同时也引入了各种干扰。