LTE_KPI问题分析定位指导书

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。










3.2.4 Counter关系式
指标
子指标
L.E-
L.E-RAB.FailEst.NoReply
RAB.FailEst.RNL L.E-RAB.FailEst.NoRadioRes L.E-RAB.FailEst.SecurModeFail
3.3 CQI占比
3.3.1 定义
统计周期内,小区内UE上报的CQI(CQI0~15)数量在整个CQI上 报数量中的比例。
对于恶化问题,首先执行本步骤,确认外部事件/历史操作与恶化 事件在时间/范围等方面的关联性。
对于整网问题,需要关注网络级的操作及是否有外部放号,新终端 发布等事件;对于基站级操作,推荐挑选TOP10小区进行分析。
对于TOP小区问题:进一步识别正常和异常站点的事件和操作差 异。
3.3.6 故障与告警核查
E-RAB是承载用户业务数据的接入层承载,它在小区内的建立 成功率,直接反映了小区为用户提供E-RAB承载建立的能力。
3.2.2 信令流程
3.2.3 问题定位思路
No. 失败原因
触 问题分析定位思路 发 因

1 L.E-RAB.FailEst.NoReply 因 eNB下发空口信令后,如果 未 在等待消息定时器内没有收 收 到终端回复消息,则会统计 到 为L.EUE RAB.FailEst.NoReply。 响 1.确认版本升级前后等待定 应 时器时长是否有变化。 而 2.确认eNodeB发送空口信令 导 HARQ状态,分析上行信道质 致 量,是否为弱覆盖或强干 E- 扰。 RAB 3.终端与基站兼容性问题。 建 立 失 败 的 次 数
1 整体定位思路
Step1、掉话KPI趋势分析--找到Top小区和Top时间段 Step2、Top小区异常原因分析--找到占比最大原因 Step3、Top小区分析是否存在Top用户
2 LTE重点关注指标:
CQI大于等于7的比例(%)、
RRC连接建立成功率(%)、
E-RAB建立成功率(%)、
RRC重建比例(%)、
动作3
外部事 件与历 史操作 检查
恶化场景
1.确认eNodeB异常操作的影响。 2.确认外部事件(新手机发布、重大集 会等)的影响。 3.确认是否存在周边去激活/断站/禁止 接入的情况。
故障与 动作4 告警核

无条件
1.针对TOP小区,核查TOP小区及其周围 小区是否有告警/故障日志,相关告警/ 故障发生的时间点与指标恶化时间点是 否一致;
影响 影响呼叫成功率,降低用户接入体验
3.1.2 信令流程
3.1.3 问题定位思路
No. 失败原因
触发因素 问题分析定位思路
1 L.RRC.SetupFail.ResFail 资源分配失 RRC建立阶段需要向小区申请
败而导致 的空口物理资源包
RRC连接建 括:SRI,SRS和CQI资源。当申
立失败的次 请小区资源失败导致RRC建立
无 详见子原因分析 线 层 问 题 导 致 ERAB 建 立 失 败 次 数
无 1.通过Debug日志查找对应 线 时间段有没有资源受限/资 资 源失败的打印;并确认受限 源 资源的类型。 不 2. 通过配置信息、产品规 足 格、License等信息分析该
导 类型资源受限的可能性。 致 3.转开发定位 ERAB 建 立 失 败 次 数
动作5 参数核 无条件 1.恶化场景关注参数变化的影响评估。 查
图6.1CQI低问题分析排查动作
动作补充说明
3.3.4 KPI定义检查
不同厂家的指标定义公式可能不相同
3.3.5 问题范围确认
问题范围确认与分段隔离,就是深入掌握问题的现象和特征。出现 CQI问题时,需要从以下方面进行分析。
问题特征确认
6 L.E-
安 1. 终端会对Security Mode
RAB.FailEst.SecurModeFail 全 Command消息进行完整性校
模 验时,如果完整性校验失
式 败,就回复Security Mode
配 Failure,可能为算法配置
置 或终端兼容性问题。
失 2.转开发定位。



E-
RAB
2 L.E-RAB.FailEst.MME
核 1.消息合法性检查失败(消 心 息错误,E-RAB ID重复) 网 2. 初始UE上下文建立流程 问 与其它S1AP层流程交叉导致 题 无法处理该消息(初始UE上 导 下文建立过程中收到MME发 致 送的UE CONTEXT RELEASE E- COMMAND消息) RAB 建 立 失 败 次 数
100%)
采集Debug日志进一步分析。
Biblioteka Baidu
3.2 E-RAB建立成功率
3.2.1 定义
定义 影响
e-RAB建立成功率 = (L.E-RAB.SuccEst(E-RAB建立成功次 数) / L.E-RAB.AttEst (E-RAB建立尝试次数)) * 100%。 L.E-RAB.AttEst统计的是eNODEB接收MME的ERAB SETUP REQUEST消息次数, L.E-RAB.SuccEst是指MME接收eNODEB的ERAB SETUP RESPONSE 消息次数(不包括重发)
计算方式:CQIk占比= CQIk上报数量/ CQI上报总数量,k=0 ~15
3.3.2 CQI与SINR关系
CQI:信道质量指示,本质上反应了当前的信道质量,即当前支持 的信道效率越低,表明信道质量越差。提升CQI从根本上需要提升 SINR。UE CQI上报值跟信道效率的对应关系见下表:
CQI是UE通过测量下行SINR而得到并进行上报,所以通过提升SINR 来提升CQI是根本措施,主要进行常规网络优化来解决。
影响 RRC重建过程是用户发起的RRC资源恢复过程。
根据36331协议,重建触发条件如下: 底层上报完整性检测失败 UE检测到无线链路失败 系统内切换失败 系统间切换失败 RRC重配置失败
RRC重建成功需要具备两个条件: 1.只有当UE发起重建请求的小区有可用的UE上下文,重建才能成功。 根据UE重建请求消息中的c-RNTI和PCI来查找UE的上下文,只有cRNTI和PCI是本站配置的c-RNTI和PCI,才能找到UE的上下文信息, 重建才能成功。否则重建会失败。协议中对UE设置重建请求的描述如 下:系统内或系统间切换失败场景,UE使用源小区的c-RNTI和PCI, 重建原因为切换失败。非切换失败场景,UE使用触发重建的小区的c-
3 L.E-RAB.FailEst.TNL
传 1. IPPATH和IPRT配置错
4 L.E-RAB.FailEst.RNL
5 L.ERAB.FailEst.NoRadioRes
输 误:查看IPPATH是否配置正 层 确,如果已经配置正确,则 问 请查看初始上下文建立请求 题 消息 导 (INIT_CONTEXT_SETUP_REQ 致 消息)中 E- transportlayeraddress的 RAB 信元值是否为配置的IPPATH 建 对端IP,如果不一致则需要 立 确认一下是基站配置错误还 失 是核心网填写错误。 败 2. 传输链路故障,可以根 次 据告警进行分析(如链路闪 数 断)。
还可以排查TOP站点与正常站点的参数修改差异,进一步缩小可疑参数 修改范围。
4 可保持性
4.1 重建成功率
4.1.1 定义
定义
RRC建立成功率 = (L.RRC.ReEst.Succ /L.RRC.ReEst.Att) * 100%。 L.RRC.ReEst.Att RRC重建请求次数 L.RRC.ReEst.Succ RRC重建成功次数
3.3.3 问题定位思路
整体的排查分5个大的动作,每个动作会再细分成几个子动作。每
动作 动作名 入口条
步骤 称

分析内容
动作1 KPI定 无条件 1.公式统计是否一致。 义检查
动作2
问题范 围确认
无条件
1.特征分析:地理特征(TOP小区)、时 间特征(恶化时间点)、分布特性(室 内外)、频段特征(双频组网)。 2.根据场景进行关联指标分析
3.3.1 定义 统计周期内,小区内UE上报的CQI(CQI0~15)数量在整
个CQI上报数量中的比例。 3.3.2 CQI与SINR关系 3.3.3 问题定位思路 动作补充说明 3.3.4 KPI定义检查 3.3.5 问题范围确认 [1] 问题特征确认 [2] 关联分析 3.3.6 故障与告警核查 3.3.7 参数核查 4 可保持性 4.1 重建成功率 4.1.1 定义 4.1.2 信令流程 4.1.3 问题定位思路 4.1.4 Counter关系式 4.2 掉线率 4.2.1 定义 4.2.2 信令流程 4.2.3 问题定位思路 4.2.4 Counter关系式 5 移动性 5.1 3.4G回流比(4G回流/重定向到3G的比例) 5.2 问题定位思路 5.2.1 RF优化 5.2.2 修改重定向到3G的 A2门限值
E-RAB掉线率(%)、
LTE重定向到3G的比例(%)
3 可接入性
3.1 RRC建立成功率
3.1.1 定义
定义
RRC建立成功率 = (L.RRC.ConnReq.Succ / L.RRC.ConnReq.Att) * 100%。 L.RRC.ConnReq.Succ统计的是小区接收UE返回的RRC Connection Setup Complete消息次数,L.RRC.ConnReq.Att 是指小区接收UE的RRC Connection Request消息次数(不包 括重发)

失败时,eNodeB会向UE发送
RRCConnRej消息,并且统计
L.RRC.SetupFail.Rej, 和
L.RRC.SetupFail.ResFail。
2 L.RRC.SetupFail.NoReply UE无应答而 eNB下发RRC Connection
导致RRC连 Setup消息之后,如果在等待
对于TOP站点恶化场景,需要分析告警/故障日志在上报的时间和范 围上是否与指标恶化对应。另外需要关注周边站点在恶化时段是否有新 增告警,站点异常后会导致周边小区远点用户增加。
3.3.7 参数核查
恶化场景: 1、对于全网恶化场景,挑选TOP 10小区,排查恶化时间点前后的参
数修改动作,并输出排查结果。 2、对于TOP小区恶化场景,除了排查恶化时间点前后的参数修改,
时间特征(恶化场景):鉴别为缓慢恶化场景还是突降场景,对于 突降场景确认恶化时间点。 地理特征(受影响的物理网元的范围确认):需要鉴别问题为全网 问题/TOP小区问题。 分布特征:鉴别问题为室内站还是室外站。 频段特征:对于多频段组网局点,需要隔离每个频段上的用户速率 和用户数变化情况。
关联分析
对于TOP小区恶化场景:TOP小区与非TOP小区共用网元(核心网/FTP 服务器/部分传输/测试终端等)可以直接排除,重点排查不同之处,如 基站配置、无线环境、告警等。外部事件与历史操作检查
接建立失败 RRCConnSetupCmp消息定时器
的次数
(15s)内没有收到RRC
Connection Setup Complete
消息,则会统计为
L.RRC.SetupFail.NoReply。
1.确认版本升级前后等待定
3 L.RRC.SetupFail.Rej
时器时长是否有变化。 2.确认RRC Connection Setup信令HARQ状态,分析上 行信道质量,是否为弱覆盖 或强干扰。 3.如果L.RRC.ConnSetup比 L.RRC.ConnReq.Att少很多, 说明L3处理msg3或者下发 msg4存在异常,转L3定位。 4.终端异常。
LTE网络KPI分析与定位
目录
1 整体定位思路 2 LTE重点关注指标: 3 可接入性 3.1 RRC建立成功率
3.1.1 定义 3.1.2 信令流程 3.1.3 问题定位思路 3.2 eRAB建立成功率 3.2.1 定义 3.2.2 信令流程 3.2.3 问题定位思路 3.2.4 Counter关系式 3.3 CQI占比
小区发送 L.RRC.SetupFail.Rej是指发
RRC
送RRC Connection Reject消
Connection 息次数。当前主要有三种场
Reject消息 景:
次数
1) 小区资源申请失败。
2) 超过eNB的规格用户数
(小区内最大用户数)。
3) CPU占用率过高触发消息
流控。(CPU占用率是否接近
相关文档
最新文档