华为PTN传输隐性故障导致诺基亚LTE网络特定IP地址段eNB基站速率异常
华为PTN常见开局故障处理
PTN OAM 知识-PW OAM
PTN 设备将业务报文进行PW 封装后送到Tunnel 中进行承载。网络中存在Tunnel 和PW两 个层次,MPLS Tunnel 可以通过MPLS OAM 维护和管理,而PW 层则需要通过PWOAM 来 进行维护和管理 PW OAM 的主要检测方式是PW Ping,Ping 报文在Ingress 节点封装进PW 中,沿虚电路 发送,从而实现对PW 的检测
观察主控板的PROG 指示灯是否处于绿灯闪 主控板完成复位,
烁状态,若是,则主控板正处于复位状态
DCN 将自动恢复连接。
Page 12
DCN 故障处理案例1/3
•案例类型-IP 地址冲突导致网元间歇性脱管
•故障现象
两台非网关网元NE10 和NE30,分别通过ML-PPP 连接第三方SDH 设备,再连接到NE08 与网管保持通讯 NE10 和NE08 已配置业务且正常运行,NE30 为新创建的网元,未配置业务 NE30 创建后,NE10 和NE30 一直处于间歇性脱管状态,网管上报NE_COMMU_BREAK 和NE_NOT_LOGIN 告警
•步案骤例3 :类断开型新-G添加E 网端元口与工网管作之模间式的物不理一连致接,导并致将网该网元元间的通子网信掩中码断修改为16 位后,网络正常
故障现象:PTN 网元通过GE 链路互联组网,网元属性及DCN 参数已经正确 规划与配置,现场安装设备时,发现多处相邻网元之间无法通信,但各网元均 无告警上报
2.单向连通性检测(CC),源端MEP 将周期性的发送CC 帧,目的MEP 收到源端发送的CC 帧后,启动CC 检测功能。如果目的MEP 在一定时间之内没有收到源端的CC 报文,则自动上报ETH_CFM_LOC 告警。
5G基站传输侧IP地址配置冲突导致用户面频繁S1故障引发X2全部异常
5G基站业务IP地址配置冲突导致用户面频繁S1故障引发X2全部异常问题描述:xxx局点5G新开站_5Gxxxxxxx(NSA)HRD_H,5到4G X2出现异常,而且为到全部锚点站均异常。
4-5G站点X2 1条异常,只有到A2_XXXXXXXXX(NSA)HRD_H间X2出现异常。
5-4G X2全部异常4-5G X2个别异常处理过程:1.告警排查锚点站出现X2接口故障告警,对端基站为A2_XHXXXXXXX(NSA)HRD_H。
5G站出现用户面故障告警-S1,X2接口故障告警。
从X2故障告警判断,问题原因出现在5G侧。
2.收发光核查查询5G基站光模块信息,AAU收BBU光正常,BBU收PTN光均正常。
3.告警分析分析告警出现时间及恢复时间,存在一定规律性。
告警与传输侧相关,每40分钟,告警出4.传输侧排查联系传输侧排查,传输侧发现,汇聚机房PTN侧光模块存在问题,工队换了光模块后,观察一段时间后问题仍然存在,且仍然存在规律性。
该5G站点前期开站传输侧VLAN配置错误,后修改VLAN后站点才正常开通。
但是开通后就频繁出现用户面S1故障告警。
让传输侧数据重做后,观察故障告警仍然存在。
根因:5G基站传输侧IP地址配置冲突导致用户面频繁S1故障引发X2全部异常解决方案:怀疑可能与IP地址相关,可能原因为IP地址冲突。
联系传输侧核查全网业务IP地址,最终发现该站点与另一个基站IP地址一样,两者冲突出现用户面S1故障告警,修改5G基站IP地址,基站故障恢复。
建议与总结:更换IP后,告警未再出现,X2建立全部正常,根据本次故障,我们建议在站点开通时候应该仔细核查相关数据,IP地址由客户规划的情况下,在站点开通后应跟客户的IP地址规划表进行双向核查,在站点开通后站点应持续观察站点的状态,发现问题及时处理。
诺基亚与华为速率掉坑问题以及高丢包问题分析
NOKIA与HW速率掉坑问题以及高丢包问题分析1.问题描述某市有大面积的华为微站插花在诺基亚基站区域,插花在诺基亚基站区域的华为微站丢包异常高,造成volte丢包率下行异常高,volte下行丢包无法达到考核值,诺基亚基站和其他未插花华为基站总体丢包率较低,已经达到考核值,而插花在诺基亚区域的华为微站丢包偏高造成全网下行丢包率在0.4%左右,是考核值0.2%的两倍。
路测过程中发现当诺基亚基站向华为基站切花时或者特定场景诺基亚基站向华为基站切换时,存在切换后高误块的场景,造成下载速率偏低,远远达不到正常的下载速率,需要等待一会以后,下载速率才能达到正常值。
以上问题均发生在异厂家基站切换时。
但在子帧配比和特殊子帧配比SA2/SSP5配置下不存在该问题.2.问题分析2.1 ACK/NCK反馈模式TDD中一个上行子帧可能要反馈多个下行子帧的ACK/NACK,协议采用了两种上报模式,Bundling和Multiplexing。
∙Bundling模式将同一个用户不同下行子帧相同码字的ACK/NACK进行逻辑AND操作,发送1bit或者2bit 的ACK/NACK。
优点是比特数少,节约资源,用于下行信道质量较好,上行信道质量较差的情形;缺点是重传的数据量大。
--用较少的bit传输;∙Multiplexing模式将同一用户同一子帧的不同码字进行空间Bundling,即对两个码字的ACK反馈进行逻辑AND操作,传输最大4bit的ACK/NACK反馈。
优点是可以区分每个子帧的结果,有利于重传,用于下行信道质量差,上行信道质量好的情行;缺点是比特数大,占据较多资源。
--用较多的bit传输对于ACK/NCK的反馈模式,华为网络在SA2/SSP6和SA2/SSP7配置下,会参考小区中当前用户数,为终端配置bundling或multiplexing模式。
使用multiplexing模式主要是基于频谱效率的考虑。
另外,3GPP 36331协议中规定,如果终端和系统协商出来的版本是R8/R9,则终端和系统间ACK/NACK反馈模式是通过RRC_CONN_RECFG中的tdd-AckNackFeedbackMode 信元表征;如果终端和系统协商出来的版本是R10,对于Multiplexing模式且使用36213中的表格10.1.3-5, 10.1.3-6, and 10.1.3-7(R10协议引入)时,系统使用pucch-Format信元表征反馈模式,而不携带tdd-AckNackFeedbackMode信元;其他场景则使用tdd-AckNackFeedbackMode信元表征反馈模式。
华为PTN告警处理规范【最新】
电缆、光纤或光模块故障导致链路信号变差或中断。
处理步骤:
在网管上查询是否存在LTI告警或其它时钟相关告警,导致时钟没有同步,缓冲区入与出速率不一致。若存在,优先清除LTI告警和时钟相关告警后,查看本告警是否清除。
在网管上查看CES业务两端网元参数配置是否一致,例如“64K时隙”等。若不一致,修改配置参数,使两端一致。
在网管上查看两端端口是否存在LOOP_ALM告警,若存在,优化清除LOOP_ALM告警后,查看本告警是否清除。
对照网元规划表,查看上报告警的端口是否错插了纤缆,造成两端端口工作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BAD等硬件类告警。若存在,更换存在硬件类告警的单板后,查看本告警是否清除。
检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。
更换上报告警的处理板。若告警未消除,更换对端网元对应的处理板。
2.MPLS_TUNNEL_LOCV
告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。连续3个周期内没有收到希望的CV/FFD报文时出现此告警。
产生原因:
PW对端停止CV/FFD。
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。查看告警是否清除。
3. BD_STATUS
告警解释:BD_STATUS为物理单板离线告警。当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。
检查并确认电缆或光纤与接口良好连接。
解释:CES_LOSPKT_EXC为单位时间内CES业务的报文丢包数超过阈值告警。当单板检测到一定周期内(10s),每秒平均帧丢失个数超出上限阈值(缺省为100)时,即上报此告警。
TD基站故障案例
TD基站故障案例浅析刘晓霞(沧州移动分公司 网络部 质量控制中心 河北 沧州 061001)摘 要: 在日常的TD基站维护工作中出现的故障有很多种,如驻波比告警、偶联断链告警、实时钟设置告警等,这里对相关故障现象进行分析,并提出处理步骤。
关键词: TD基站;故障;分析中图分类号:TN929 文献标识码:A 文章编号:1671-7597(2012)1120155-021.1 告警描述在TD-SCDMA无线接入网中,Node B是TD-SCDMA网络的基站系统,它可以分解为基带单元(BBU)和远端射频单元(RR监控人员在维护平台发现站点出现下行驻波比告警,通过U)。
Node B在RNS中是负责无线传输和服务的一个逻辑节点。
动态数据查看驻波比,发现某一通道驻波比值超出正常范围,通过Uu接口完成空口与地面电路之间的信道转换与桥接,并通某站第15(对应8path)通道出现驻波比告警驻波比值:过Iub接口和RNC互连。
TD-SCDMA的网络如下图所示。
5.60,该告警会影响信号发射,信道占用等。
1.2 故障分析和解决故障分析:基站维护人员联系监控中心,确定是哪根path出问题,测量驻波比,看是否正常。
将出现告警的path与未出告警的path在RRU接头侧互换连接线,复位RRU,如果换线后告警消失,那么是接线问题,重新接线即可,如果告警固定不变,那么说明RRU内部此通道可能出现硬件故障。
如果告警跟着线走,那么说明此馈线或天线损坏,在天线接头侧互换连接线,复位RRU,若告警path固定不变,说明馈线损坏,若告警path变化,说明天线问题。
定位流程:图1 TD-SCDMA的网络结构BBU是TD-SCDMA分布式基站系统的主要组成部分,它完成基带信号的处理,时钟与监控功能,同时实现Iub接口、电源接口、本地维护接口、环境监控接口以及与室外GPS天线接处理步骤:根据告警信息,判断第1小区RRU第(8)path存口。
传输设备PTN MTU值配置错误导致5G演示速率低的案例-完成
传输设备PTN的MTU值配置错误导致5G演示速率低
一、关键词:速率低、传输、MTU
二、案例分类
1.问题分类:网络性能
2.手段分类:网络参数调整
三、优化背景
福建宁德蕉城三都寒垅开通了5G NSA站点,为用户提供5G 网络感知体验,小区带宽100MHz,上下行时隙配比为2:8。
测试终端为华为CPE1.0。
四、问题现象
福建宁德三都寒垅5G站点开通后,现场进行业务性能验证发现下行速率严重不达标,只有平均3Mbps左右,但是现场无线环境好:
五、原因分析
1、log分析
1)下行速率在速率在3~5Mbps之间波动;
2)下行信号质量好:CSI-RS RSRP=-60dBm;CSI-RS SINR=39dB;
3)终端RANK4调度;但MCS比较低(10左右),怀疑上游可能存在来水不足引发小包降阶。
4)PDSCH RB/Slot 平均才29,PDCCH DL Grant调度次数平均只有81次/s(正常数值应为1600或接近,下行调度的RB 数明显不足)。
2、排查sim卡是否被降速
测试卡是否超套餐引起限速,拨打移动1008查询是否当前测试卡未超套餐流量。
华为PTN ETH业务故障处理
PW/Tunnel故障:
原因可能是PW/Tunnel down、 业务流经的物理链路中断等等;
报文拥塞:
原因可能是带宽配置过小、同优先级的报文流量过大导致丢包,或网络上流经此端口
的流量超过端口实际的物理流量的范围而丢包等等;
存在物理或逻辑上环路故障(仅针对Elan):
原因可能是网络组网就存在物理环路,或水平分组配置不合理引起逻辑链路上的环 路或报文被环回的情况等等;
与客户确认结论:NodeB如果一段时间时钟跟踪不上,NodeB端口
就会停止向外发送数据,且NodeB对网络性能要求是1% clockpacket 的jitter小于等于20微秒.
否
拔插单板
是 TEMP_OVER 风扇是否停转 是
否 防尘板是否灰尘过多 是
否
风扇坏,更换风扇
清理灰尘
单板硬件坏,请联系 研发人员,更换单板
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 13
通用流程——TNL/PW异常处理流程
TNL/PW异常
HUAWEI TECHNOLOGIES CO., LTD.
Huawei Confidential
Page 11
故障定位流程篇——通用流程
ETH业务故障
是否存在HARD_BAD,BUS_ERR, TEMP_BAD告警 否
是ቤተ መጻሕፍቲ ባይዱ
硬件故障处理流程
nni侧Tunnel/Pw是否up 或存在异常告警
是
Tunnel/Pw异常处理流程
而SynLos告警是NodeB的时钟跟踪不上才会上报的。那么,究竟是业务中断 引起eNodeB的时钟跟踪不上而上报SynLos告警,还是时钟跟踪不上后,而 引起业务中断呢? 由于排除前者非常困难,因为还涉及到中间网络的分析。 那相比前者,确认后者是否NodeB时钟跟踪不上就会中止发送数据 ,及 NodeB时钟跟踪有那些性能要求的问题就更容易些。
华为LTE告警原因与处理建议
华为LTE常见告警处理建议2017-8-15华为LTE常见告警目录1射频单元业务不可用告警32小区不可用告警43射频单元维护链路异常告警44BBU IR接口异常告警55网元断连66传输光接口异常告警67S1接口故障告警68射频单元IR接口异常告警79License试运行告警710以太网链路故障告警811用户面故障告警812射频单元时钟异常告警913基站S1控制面传输中断告警914射频单元交流掉电告警915BBU IR光模块收发异常告警1016射频单元驻波告警1017远程维护通道故障告警1118小区服务能力下降告警1119射频单元光模块收发异常告警1120射频单元光接口性能恶化告警1221交流掉电告警1222时钟参考源异常告警1323射频单元硬件故障告警1324射频单元输入电源能力不足告警1425配置数据超出License限制告警1426射频单元ALD电流异常告警1427RRU组网级数与配置不一致告警1528射频单元发射通道增益异常告警1529星卡锁星不足告警1530星卡天线故障告警1531BBU IR光模块/电接口不在位告警1632天线设备维护链路异常告警1633制式间通信异常告警1634配置数据不一致告警1735系统时钟不可用告警1736时间同步失败告警1837射频单元软件运行异常告警1838BBU直流输出异常告警1839单板温度异常告警1940射频单元光模块/电接口不在位告警1941射频单元接收通道RTWP/RSSI过低告警19 42BBU单板维护链路异常告警2043BBU光模块收发异常告警2044RRU组网拓扑类型与配置不一致告警2145证书失效告警2146远程维护通道配置与运行数据不一致告警22 47系统无License运行告警2248单板不在位告警2249未配置时钟参考源告警2350MAC错帧超限告警2351单板下电告警2352单板硬件故障告警2453版本自动回退告警2454单板类型和配置不匹配告警2455单板软件运行异常告警2556机框类型配置与实际不一致告警2557射频单元工作模式与单板能力不匹配告警2558License Feature不可用告警2659传输光模块不在位告警2660单板软件同步失败告警2661射频单元CPRI接口异常告警2762射频单元光模块类型不匹配告警2863小区重配置失败告警2864BBU IR光接口性能恶化告警2865单板时钟输入异常告警2966射频单元过载告警2967射频单元温度异常告警2968星卡维护链路异常告警301 射频单元业务不可用告警故障原因:1、配置原因:小区配置与设备支持规格冲突;射频模块在共模SDR配置下, 制式间载波频率间隔、功率规格、载波数规格、带宽规格等配置错误;CPRI速率配置错误;SFN跨框场景下,扇区设备配置错误;ODI配置错误;2、软件原因:License资源不足;3、单板不可用:小区使用的CPRI链路故障;小区使用的基带单元故障;小区使用的射频单元收发通道故障;CPRI带宽不足;CPRI MUX场景单板不支持;数据链路故障;控制链路故障;时钟精度不足;处理建议:1、检查小区和设备规格,更换型号匹配设备;核查配置参数是否有误,调整正确参数配置;2、核查小区LICENSE,增加LICENSE。
华为 LTE移动基站告警名称 解释 影响
华为TD-LTE移动基站告警名称解释影响通过一天的整理,终于把这些告警弄出来了,拿出来和大家一起分享。
告警类别告警名字告警解释级别告警影响eNoDeB无线告警S1接口故障告警"S1AP(S1 Application Protocol)连接在底层SCTP链路资源可用时,eNodeB将向MME发起连接建立请求;MME对连接请求做合法性检查,检查不通过,将无法建立连接;eNodeB收到MME的响应后,如果发现MMEC冲突将无法建立连接。
当底层SCTP链路故障、S1AP协议层因数据配置错误或者MME异常无法建立连接时,产生此告警。
" 重要基站将释放已经接入该异常S1接口上的所有用户。
如果小区没有状态正常的S1接口,非调测态下,基站将去激活小区;调测态下,基站可以激活小区,但新的用户将无法接入到这些小区。
eNoDeB无线告警S1接口配置失败告警"当eNodeB上更新eNodeB名称、跟踪区域、支持的运营商变更时,将发起S1AP(S1 Application Protocol)接口配置更新。
当S1AP协议层配置更新异常时,产生此告警。
" 重要基站的最新配置数据将无法成功更新给核心网,导致基站与核心网的S1AP层配置数据不一致,会造成入网和寻呼失败。
eNoDeB无线告警X2接口故障告警"X2AP(X2 Application Protocol)连接在底层SCTP链路资源可用时,eNodeB将向对端eNodeB发起连接建立请求;对端eNodeB对连接请求做合法性检查,检查不通过,将无法建立连接;eNodeB收到对端eNodeB的响应后,如果发现对端eNodeB在黑名单中将无法建立连接。
当底层SCTP链路故障、X2AP协议层因配置错误或者对端eNodeB异常无法建立连接时,产生此告警。
" 重要基站释放正在通过产生告警的X2接口进行切换的用户,在该告警恢复前,基站将无法继续支持与对应基站间的X2接口切换流程,无法继续支持与对应基站间的小区干扰协调过程。
华为PTN故障处理手册v1.0版
华为PTN故障处理手册v1.0惠州公司网络维护中心2010年12月目录一、概述 (4)二、网络故障分析定位方法 (4)2.1告警分析法 (4)2.2性能统计分析法 (5)2.3OAM分析法 (7)2.4配置数据分析法 (11)2.5仪表测试分析法 (12)2.6环回法 (13)2.7排除法 (14)三、业务中断故障和业务恢复 (15)3.1流程图 (15)3.2查询误操作 (17)3.3检查告警 (17)3.4检查环回和装载 (18)3.5检查业务配置 (18)3.6应急恢复方案 (18)3.6.1倒换 (19)3.6.2复位 (19)3.6.3通过更换单板恢复业务 (19)四、常见故障处理方法 (20)4.1带内DCN故障处理 (20)4.2MPLS Tunnel故障处理 (24)4.3PW故障处理 (26)4.4CES业务故障处理 (27)4.5以太网业务故障处理 (31)4.6offload故障处理 ···············································错误!未定义书签。
4.7时钟故障处理 (35)4.8QoS故障处理 (36)4.9线性MSP故障处理 (40)4.10TPS故障处理 (42)4.11LAG故障处理 (45)4.12MPLS APS故障处理 (48)五、部件更换注意事项 (52)4.13部件分类说明 (53)4.14更换处理板 (54)4.15更换子卡 (56)4.16更换接口板 (57)4.17更换XCS单板 (58)4.18更换带有1+1保护的SCA单板 (60)4.19更换没有1+1保护的SCA单板 (62)4.20更换风扇板 (65)4.21更换PIU板 (66)4.22更换可插拔光模块 (67)4.23更换CF卡 (68)一、概述PTN网络故障处理在日常维护中显得至关重要,为了更好的开展PTN网络的日常维护,特编制PTN网络故障处理手册。
快速判断LTE基站PTN传输测是否有问题的5个步骤
LTE开通PTN传输测故障快速排查方法
1、查看基站对应PTN设备的对应光口是否有收光,是否有ETH LINK DOWN告警,如果有ETH LINK DOWN告警,则是BBU测光口插的不对,或BBU测光口光模块非1.25G光模块,或请现场施工人员用光功率计测一下BBU测是否能收到PTN发过去的光。
2、检查业务配置的正确性:
过滤出对应PWE3业务,选中对应PWE3业务,点击下菜单栏“业务接入接口”,查看接口与所属ETH-Trunk一致,如下图ETH-Trunk2.278,即ETH-Trunk2业务,查看VLAN是否与IP规划表保持一致。
3、用VCCV PING判断二层业务是否故障或不通
过滤出对应PWE3业务,选中对应PWE3业务,点击下菜单栏“拓扑”,绿色实线表示工作路由,绿色虚线表示保护路由,黄色实线表示实际业务所走路由,选中黄色实线所走路由对应的绿色实线或者绿色虚线,右键点击快速诊断;
在弹出菜单栏中首先选中一条,然后点击右上角“高级”,在新弹出菜单栏中,在“应答模式”一栏中选择“应用控制通道”,点击确定,然后执行;
执行完成后,“测试结果”下在整成情况下应显示为成功,丢包率应为0,如为“失败”,有丢包发生,则可判断为PWE3不通,可从tunnel判断,是否路由中有断纤,或路由不通,以及检查上行3900设备对应端口是否为“ACCESS”。
4、查看基站对应网关是否为up状态
5、查看远端基站RMON性能,是否有正常收发包,如无收发包,查看是否有光模块异常告警,通知现场施工人员,查看BBU光模块是否正常,或直接更换光模块,如仍有问题,可让现场人员重启下BBU。
经以上排查,都无问题,可基本判断PTN传输测正常,或向上一级反馈不通站点。
华为-无线网-TD-LTE_传输不足导致LTE室分低速率
旗开得胜主题:华为-无线网-TD-LTE 传输不足导致LTE室分低速率问题处理设备类型:eNodeB设备型号:eNodeB软件版本:BTS3900 V100R008C00SP116故障描述:资阳移动TD-LTE室分站点资阳分公司网管大楼共2个小区,其中1小区覆盖网管大楼1、2楼营业厅与办公区域,PCI=0;2小区覆盖3至7楼办公区域为,PCI=1,采用E 频段同频组网。
站点开通近一个月,优化人员发现在营业厅、办公楼采用CPE上网时,速率偏低,总体速率始终不到30Mbps。
故障诊断:一、问题分析处理流程图1旗开得胜2下载速率偏低可能原因: 1.基站设备问题;2.无线参数设置问题; 3.用户过多; 4.干扰;5.工程质量;6.传输参数设置 可能原因: 1.基站设备问题 是否该原因 可能原因:2.无线参数设置 是否该原因 可能原因:3.用户过多 是否该原因 可能原因:4.干扰是否该原因 可能原因:5.工程质量 是否该原因 可能原因:6.传输参数设置 是否该原因 提供解决方案 已经消除结束 YYYYYYN NNNNN二、分析故障现象可能原因:1、基站设备问题;2、无线参数设置不合理;3、用户数过多引起的单用户带宽偏低;4、无线干扰大,SINR低引起的信号质量差;5、室分系统工程质量差,引起的信号质量差;6、传输参数设置问题;二、处理步骤1.基站设备问题通过在OMC920上浏览当前告警,没有发现资阳分公司网管大楼室分没有告警,并且浏览历史告警,也没有故障出现。
排除基站设备故障导致下载速率低。
32.无线参数设置不合理通过核查小区无线参数,参数并没有异常。
由于资阳只有一个室分站,还没有宏站,不存在切换问题。
排除无线参数设置不合理导致下载速率低。
3. 用户数过多引起的单用户带宽偏低通过设置CPE密码,限制用户数接入,在单用户的情况下,下载速率依然不到30Mbps。
排除用户数过多引起的单用户贷款偏低导致下载速率低。
通道不平衡导致下行速率异常
通道不平衡导致下行速率异常【问题描述】LTE试商用交付项目,FM_松园头村大厦为双通道室外站点,单站验证测试发现在无线环境正常的情况下,2小区下行速率只有70Mbps,达不到峰值速率100Mbps。
无线环境满足近点要求【问题分析】查看2小区测试LOG,发现无线环境满足近点要求,RSRP=-95dBm,SINR=25dB,但是发现传输模式为TM2,RANK值为1,上不了双流,导致速率达不到峰值,可能有以下问题导致:1、基站告警导致速率偏低:无告警。
2、外界因素导致速率偏低:终端能力、PC性能、SIM卡开户配置、TCP配置等,同一款终端和PC在其他站点做业务时,速率正常,排除外界干扰;3、小区有其他用户:PDCCH DL Grant Count为1000,满调度,排除小区有其他用户接入;4、基站传输受限,导致来水量不足:在同站0小区和1小区测试,速率可以达到峰值速率100Mbps,说明传输侧没有问题(建议采用服务器UDP灌包判断是否传输受限:现场不满足此操作);0小区速率能达到峰值100Mbps5、传输模式配置错误:查询参数配置,传输模式配置为TM2/3自适应;6、干扰导致下行速率低:查看原始LOG,发现MCS稳定在28阶,BLER为0%,且下行速率稳定在70Mbps,排除下行干扰导致速率低。
7、怀疑双通道,其中一个通道异常,导致下行速率低:具体分析分以下三个步骤:开启0、1通道(默认):RSRP为-75dBm,SINR为25dB,下行速率约70Mbps;●关闭0通道,仅开启1通道:RSRP为-74dBm,SINR为27dB,下行速率约74Mbps;●关闭1通道,仅开启0通道:RSRP为-104dBm,SINR为13dB,下行速率约36Mbps;【处理过程】建议督导带领施工队对RRU本身和0通道天馈系统进行检查,排查是否为RRU本身问题或者是天馈系统问题,排查后,安排复测。
【建议总结】通过闭塞RRU的其中一个通道,然后前台分别做0通道、1通道的对比测试,对比两个通道和其中一个通道的RSRP值差异,如果RSRP相差大于5dB,则该通道异常,需排查RRU本身和天馈系统。
对接-IPPATH故障导致eNB每分钟释放一次UE
2014-2-15 华为机密,未经许可不得扩散 第1页, 共3页 1 IPPATH 故障导致eNB 每分钟释放一次UE1 现象描述新建eNB ,做定点测试,反馈当UE 接入问题eNB 后,每隔一分钟被eNB 自动释放,释放的原因是transport-resource- not- availible 。
UE 重新接入后,一分钟后再次被释放。
如此循环, eNB 小区无异常告警。
2 告警信息无3 原因分析分析S1信令跟踪,确实是一分钟eNB 主动发起释放一次,很有规律,释放的原因为传输资源不可用。
所以重点分析IPPATH 是否存在问题。
4 处理过程分析告警日志, 基站确实没有IPPATH 相关告警,而且尝试pingUGW 是可以ping通的,这样看起来传输似乎没有问题。
但是通过日志分析,可以看出释放的原因值为28,即为IPPATH承载故障,为什么IPPATH故障了小区没有告警,且正常激活呢?我们知道IPPATH的检测是通过发送GTPU包到对端,检查GTPU数据配置,STATICCHK设置为了disable。
MOD GTPU: TIMEOUTTH=5000, TIMEOUTCNT=3, DSCP=63, STATICCHK=DISABLE;在静态检测的开关关闭的情况下,还是会检测ippath链路状态的,按照协议的建议采用动态检测方式(即有用户在线才检测),如果检测结果是ippath链路存在故障,那么不上报告警,不去激活小区,但是会释放用户。
分析到这里可以确认是IPPATH故障了,但是按照检测机制,没有上报告警,但是什么原因导致IPPATH故障呢?前面提到UGW是可以ping通的,也就是说物理链路应该是没有问题的。
查看数据配置,发现传输是配置了VLAN的:ADD VLANCLASS: VLANGROUPNO=0, TRAFFIC=USERDATA, SRVPRIO=0, VLANID=610, VLANPRIO=0;ADD VLANCLASS: VLANGROUPNO=0, TRAFFIC=USERDATA, SRVPRIO=10, VLANID=610, VLANPRIO=1;ADD VLANCLASS: VLANGROUPNO=0, TRAFFIC=USERDATA, SRVPRIO=18, VLANID=610, VLANPRIO=2;ADD VLANCLASS: VLANGROUPNO=0, TRAFFIC=USERDATA, SRVPRIO=26, VLANID=610, VLANPRIO=3;ADD VLANCLASS: VLANGROUPNO=0, TRAFFIC=USERDATA, SRVPRIO=34, VLANID=610, VLANPRIO=4;ADD VLANCLASS: VLANGROUPNO=0, TRAFFIC=USERDATA, SRVPRIO=46, VLANID=610, VLANPRIO=5;检查GTPU的DSCP=63并没有在vlanclass中定义,这样eNB默认每分钟发送的DSCP为63的GTPU的检测报文,会被传输丢弃,无法得到响应,eNB认为IPPATH故障。
华为PTN传输隐性故障导致诺基亚LTE网络特定IP地址段eNB基站速率异常
故障描述:2015年1月27日中午14点30分,接到宁波余姚移动分公司投诉,余姚分公司有两个室分站,其中1个站点可正常上网,另一个站点上网异常,现场测试下载速率峰值只有1Mbps。
后经过对问题区域的拉网测试和一系列分析最终确定是由于华为PTN传输隐性故障导致诺基亚LTE网络特定IP地址段eNB基站下载速率异常,并且导致的一些用户投诉问题.在此次故障中,存在一下几个特征:(1)故障的表象从单个站点开始,排查具备片面性;该故障最初有宁波余姚分公司投诉开始,单个站点上网速率较低,分公司反映这类站点共计有5个,最初排障主要集中在单个站点的排障测试中,没能第一时间从全网考虑出发。
(2)无线主设备状态正常,无告警,排障具有隐蔽性;由于LTE网络的扁平化,用户感知的体验不好的排障由无线侧发起,在无线侧没有相关告警提示的情况下,增大了对站点排障的难度,拉长了故障处理时间。
(3)故障处理过程专业跨度较大,排障具有较强的不便性;本次故障涉及网优(具体指标查看)、无线(站点排查)、传输(定位故障原因落地侧)三个专业,故障处理过程专业跨度较大,在排障中具有很强的不便性。
流程图问题分析:❖首先对用户投诉的“NBYY移动新综合楼2ESTL”基站进行了初步分析排查:1、核查基站状态正常无告警,提取历史告警信息,也无任何历史告警;2、核查基站参数配置,问题发生时未进行过任何修改,参数配置核查亦无异常;3、后台查看指标情况,正常工作日上午会有峰值出现,峰值速率一般在50Mbps以上。
后台指标上看当天上午最大速率只有7Mbps,见下图-1:图-14、从指标上看,最大速率明显较日常下降很多,对基站进行重启操作后,无法恢复;采取TDS和TDL进行双重启同样无法恢复,且TDS侧站点指标均正常;❖1月27日余姚区域日常拉网测试时也反映发现下载速率异常:❖从余姚区域测试拉网结果来看,速率下降问题已经不是单个eNB站的问题而是区域性存在问题:1、15点后台跟踪基站LOG时发现有一个站点的LOG无法提取,后台ping该基站地址,发现时延非常大(2000ms左右,正常ping包时延不会超过10ms),对发现异常的站点均进行了Ping时延验证,发现都存在时延大的问题。
诺基亚LTEKPI 及性能相关告警
KPI及性能相关告警KPI的定义:KPI的counter:考虑与KPI及性能相关的告警,如果只关注平时正常运维的情况,不外乎两类:1.硬件类告警,导致基站或小区退服2.传输类告警,导致S1或X2连接中断下面讨论一些比较常见的告警类型。
1.RP3告警对于eNB而言,只要cell不是OnAir的状态,那么该小区均无法处理呼叫,而所有导致小区退服的告警都属于这一类,由于基站或小区退服了,所以该类告警会影响所有KPI及性能指标,区别只在市整个基站的指标还是某小区的指标。
一般而言,该类告警有两种7650BASESTATIONFAULTY和7653CELLFAULTY这两类告警通常是硬件告警,如BBU,RRU,Antenna,以及他们之间的链路出现硬件故障,最典型的当数RP3告警,FailureinopticalRP3interface,相比较RP3告警,模块的硬件故障从比例上来说要相对少很多所谓RP3即BBU与RRU的接口。
这种告警也是最常见的告警,告警内容多为光路告警。
目前这类告警常见的fault有0010、4064和2004。
其中0010和4064严重时会导致小区退服、基站退服。
但是2004一般只是小区性能下降,不会引起小区退服。
1.1Fault0010:Noconnectiontounit1、可以先尝试重启基站观察2、检查光口速率是否匹配(强制8x速率)BBU侧强制8x速率设置:先检查SWCONFIG中0X19000C字段,对于软件版本RL25,0x19000C=1,及代表8x光速率,0代表4x光速率;对于软件版本RL35,0x19000C=0,代表自适应,1代表4x,2代表8x,注意不同软件版本的区别。
RRU侧强制8x速率设置:telnet到RRU上,端口号是2323,使用命令rad–r0查看RRU的所有参数配置。
找到0xED这个参数,看一下它当前的值是0还是1。
0表示自适应,1表示强制8x。
命令:rad–pw0xED1-----表示设置0xED=1命令:rad–pw0xED0-----表示设置0xED=0改完之后再次使用rad–r0查看是否修改成功即可。
诺基亚LTE无线接通率分析流程和问题定位方法0608
接通率差小区分析流程和案例1、概况目前全网存在一部分小区接通率较低,重启操作后也无法解决。
针对这些疑难问题小区的分析,建立了一套可以帮助问题分析和定位的手段。
从这些小区的分析和优化结果来看,有一部分是由于小区存在弱覆盖、重叠覆盖等覆盖问题导致的接通率差,而另一部分是由于基站存在隐性故障导致。
2、接通率优化分析流程针对问题地接通率小区,可以按照以下流程进行排查。
具体处理流程如下:1、查看问题小区是否存在告警,如存在告警,通知排障组处理。
如果是双模站点,同时还要查看TDS侧是否也存在告警。
TDS侧的一般会影响LTE侧性能的告警包含RRU输入功率异常告警和RRU光功率低告警。
LTE侧的一般会影响性能的告警包含有Temperature alarm (0002)告警、Failure in optical RP3 interface (2004)、Baseband Bus failure告警闪退、Configuration error: Not enough HW for LCR (1868)。
2、查看问题小区是否存在拥塞,如存在拥塞,对其进行扩容、负载控制等参数调整。
PS:详见如下附件宁波诺基亚TDL大话务保障方案V1.docx3、查看问题小区是否存在干扰,如存在干扰,则对其进行排查干扰,确认干扰类型。
确认小区干扰一般看RSSI_PUSCH_AVG-SINR_PUSCH_AVG的差值如果大于-95,那就认为此小区存在干扰。
4、查看问题小区是否存在参数配置错误问题,一般会影响指标性能的参数可参考附表。
重要参数核查.docx5、对问题小区基站进行重启看指标是否恢复6、修改鲁棒性参数,对RRC接入成功率会有帮助,具体参数可以参考下表。
具体情况修改最小接入电平,如有效果,则确认为问题小区存在覆盖问题,如无效果,则确认问题小区存在隐性故障。
一般情况下,我们认为因为覆盖问题导致的小区-110最强覆盖率(%)基本小于85%,可以尝试修改最小接入电平等去确认,而-110最强覆盖率(%)大于85%的低接通率小区基本都由于隐性故障导致,可以请维护组帮忙去确认。
华为基站故障处理实例
5.2.3华为基站故障处理实例1. 天馈连接鸳鸯线导致扩容载频后话务量减小现象描述:反映某 312 基站第二小区话务量减小,该站话务量减小是从扩容后,原来是一个载频,采用一个 CDU ,扩容后加了一块载频,同时将 CDU 更换为 EDU ,至此话务量急剧下降,连续 3 天话务量不足原来的 1/4 ,用户怀疑是覆盖范围减小。
告警信息:在告警台中观察不到任何关于该基站的告警,单板指示灯和运行状态均正常。
原因分析:由于用户增加了一块载频,该基站下的四块载频变为五块,但是 PSU 单板只用两块,所以初步分析可能由以下原因造成话务量减小:1 ) PSU 单板不够用,由于每两块 TRX 需要一个 PSU ,所以有可能是这个原因所致;2 )新更换的 EDU 有问题;3 )扩容时连接跳线时接头没有连接牢靠,造成驻波比过大;4 )小区的天馈连接错误。
处理过程:现场检查数据,没有任何问题,观察话统,发现的确从扩容后话务量就一直维持在 1ERL 左右,没有异常告警。
到达现场后加入一块 PSU 板,通过话统对该小区进行测量报告数量的测量,发现很少,话务量没有提高,将 1 、 2 小区的 EDU 更换,现象依旧,仔细检查 TRX 和EDU 之间的连线,也没有错误,又检查天馈连线,发现第二小区的 EDU 的第二个发射端口 TX/RX_ANTB 错误的连接到第一小区天线的发端口,这样以来,第二小区的 BCCH 和 TCH 是通过不同的天线发出去的,造成可能指配信道所在的载频信号很弱,进而发生切换或掉话,切分集接收也不正确,所以造成该小区吸收不了话务量。
将小区天线重新连接,二小区的话务量立刻提升了。
建议与总结:扩容,更换硬件时一定要信心连接线缆,避免连成鸳鸯线,交叉线,如果连接错误通常不会产生告警,故障比较隐蔽,同时会造成一些切换,掉话,话务量上不去的现象。
2. 数据配置不当导致 BTS3006A 在市电掉后出现非主 BCCH 载频退服现象描述:某基站业务信道可用率突然下降,严重影响了考核指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故障描述:
2015年1月27日中午14点30分,接到宁波余姚移动分公司投诉,余姚分公司有两个室分站,其中1个站点可正常上网,另一个站点上网异常,现场测试下载速率峰值只有1Mbps。
后经过对问题区域的拉网测试和一系列分析最终确定是由于华为PTN传输隐性故障导致诺基亚LTE网络特定IP地址段eNB基站下载速率异常,并且导致的一些用户投诉问题.
在此次故障中,存在一下几个特征:
(1)故障的表象从单个站点开始,排查具备片面性;
该故障最初有宁波余姚分公司投诉开始,单个站点上网速率较低,分公司反映这类站点共计有5个,最初排障主要集中在单个站点的排障测试中,没能第一时间从全网考虑出发。
(2)无线主设备状态正常,无告警,排障具有隐蔽性;
由于LTE网络的扁平化,用户感知的体验不好的排障由无线侧发起,在无线侧没有相关告警提示的情况下,增大了对站点排障的难度,拉长了故障处理时间。
(3)故障处理过程专业跨度较大,排障具有较强的不便性;
本次故障涉及网优(具体指标查看)、无线(站点排查)、传输(定位故障原因落地侧)三个专业,故障处理过程专业跨度较大,在排障中具有很强的不便性。
流程图
问题分析:
首先对用户投诉的“NBYY移动新综合楼2ESTL”基站进行了初步分析排查:
1、核查基站状态正常无告警,提取历史告警信息,也无任何历史告警;
2、核查基站参数配置,问题发生时未进行过任何修改,参数配置核查亦无异常;
3、后台查看指标情况,正常工作日上午会有峰值出现,峰值速率一般在50Mbps以上。
后台指标上看当天上午最大速率只有7Mbps,见下图-1:
图-1
4、从指标上看,最大速率明显较日常下降很多,对基站进行重启操作后,无法恢
复;采取TDS和TDL进行双重启同样无法恢复,且TDS侧站点指标均正常;
1月27日余姚区域日常拉网测试时也反映发现下载速率异常:
从余姚区域测试拉网结果来看,速率下降问题已经不是单个eNB站的问题而是区域性存在问题:
1、15点后台跟踪基站LOG时发现有一个站点的LOG无法提取,后台ping该基站地址,
发现时延非常大(2000ms左右,正常ping包时延不会超过10ms),对发现异常的站点均进行了Ping时延验证,发现都存在时延大的问题。
于是反馈给传输侧进行
检查;
2、15点30分传输侧进行排查未发现告警,对其中一个站点进行了传输主备倒换,基
站ping包时延正常,平均在3ms左右,同时外场进行复测恢复正常;
图-2
3、怀疑是传输单板隐性故障,导致基站时延较大,对路测中发现的速率低小区进行传输主备单板倒换,外场复测速率恢复正常;
4、由于传输单板无告警,怀疑全网性的传输故障,对宁波全网LTE站点的当天6-15时的最大速率进行统计,并和上周同一时段下行最大速率(PDCP_DATA_RATE_MAX_DL)和平均速率(PDCP_DATA_RATE_MEAN_DL)进行对比,发现存在速率异常站点526个,主要集中在3个IP地址段,反馈给传输侧进行倒换。
解决措施
通过上述一系列的分析和定位,可以确定该LTE网络故障问题是由于华为PTN传输隐性故障导致的,所以对存在问题的基站提交给传输部门进行处理:
1、对一批基站进行传输倒换后进行现场测试验证,发现仍然有部分站点未恢复,也就是说简单的基站传输倒换并不能完全解决所有基站的问题;
2、最后传输侧采用新的故障处理方法,申请1月28日凌晨1点进行传输板倒换,然后将主传输板重启后再倒回主传输板操作;
问题解决:
28日凌晨1点对传输主备单板分别重启操作完成后,立马对前期存在问题的基站逐个进行了现场测试验证都已经恢复正常。
并且第二天白天对整个余姚区域进行了详细的拉网测试验证,拉网测试下载速率也已经恢复正常。
对全网速率KPI指标进行核查亦恢复正常,至此,由于传输隐性故障导致的局部性的速率下降问题得到解决。
三个传输问题IP地址段在故障解决后KPI速率统计对比如下表所示:
预防/监控措施:
在LTE网络中传输性能对业务性能影响很大,而且传输环节也是比较容易出现一些问题的一环,在以后的故障排查和问题分析时可以通过对基站ip地址的ping时延分析来快速定位是否是传输问题导致的网络故障,提高问题排查的效率。
同时希望传输部门也可以针对不同IP地址段的传输时延进行必要的监控统计,及时发现传输问题,减少对LTE终端用户感知的影响。