网优KPI指标优化工作指导手册
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网优指标优化
工作指导手册
项目名称
文档编号
版本号
作者
x所有
大唐移动通信设备有限公司
本资料及其包含的所有内容为大唐移动通信设备有限公司(大唐移动)所有,受中国法律及适用之国际公约中有关著作权法律的保护。
未经大唐移动书面授权,任何人不得以任何形式复制、传播、散布、改动或以其它方式使用本资料的部分或全部内容,违者将被依法追究责任。
文档更新记录
目录
1 前言
话统是中国移动考核项之一,也是对网络质量的最直观反映。
日常话统监测是进行网络性能检测的一种有效手段。
通过日监测,识别突发问题小区,将问题消除在初级阶段。
通过周监测,识别网络性能持续短木板小区,针对性的进行提升优化。
话统主要包括以下几大类:接入性指标、保持性指标、移动性指标、业务量指标、产品运行类指标、系统可用性指标和网络资源利用率指标。
通过上述重点话统指标的监测,可以达到:识别突发问题、风险提前预警、话统的稳定与提升,目前系统需要重点关注的话统指标如下表:
2 优化的工作流程及内容
2.1优化工作总体流程
优化工作流程图
2.2优化工作内容
2.2.1数据生成
工作内容:
使用预定义和自定义的统计项及模板生成性能报表,通过提取报表,输出报表和重要指标失败原因列表给数据分析人员。
报表生成和提取相关操作请参考《模板指导手册》。
根据报表数据,选择指标最差N小区。
N小区的选择:对某项指标按照失败率最高进行排序,选取前20个小区,再对这20个小区进行失败次数分析,失败次数大于20次的(连接、切换、掉线等按失败次数大于20次为标准,建立失败指标按次数大于10次为标准)作为小区进行分析;另外需要对指标再进行失败次数的降序排序,如果有小区失败次数很多失败率也较高但是未在之前选的小区中,也需要将这些小区作为小区分析。
数据生成工作所需输入、工具和技术、输出如图所示:
2.2.2数据分析
工作内容:
指标变化趋势分析:根据报表数据,分析全网指标变化趋势,尤其是存在设备版本升级或参数全网性修改后,需要持续至少一周重点监测指标变化趋势;
小区分析:根据小区列表、重要指标失败原因列表、历史告警信息、网管数据、日志、数据、复测终端等信息进行分析。
先查看告警信息,确认有设备故障类告警是否和小区关联,再使用与基站软件版本匹配的工具进行指标统计和失败信令流程分析确认小区产生的原因,工具使用方法请参考《分析工具使用手册》。
数据分析工作所需输入、工具及技术、输出如图所示:
2.2.3问题处理
工作内容:
1)通过分析能够明确定位小区问题后,给出问题处理建议输出给相关问题处理人员:参数修改问题导给维护人员调整(和标定参数不一致的大规模参数修改需和确认);网络优化问题给出优化建议导给网优人员;由于设备故障引起的指标恶化问题导给排障人员处理;定位确认为产品缺陷要及时提交推动和跟踪版本解决。
2)通过分析无法明确定位小区产生原因的问题,需要复测后结合终端侧再进一步分析。
问题处理工作所需的输入、工具及技术、输出如图所示:
问题处理:输入、工具及技术、输出
2.2.4问题跟踪和核查
工作内容:
问题跟踪和核查环节,主要依据问题列表、问题处理工单、编号,内部讨论推动和核查问题解决,和外部其它环节沟通确认问题进展,以形成问题闭环,最终输出优化报告。
问题跟踪和核查工作所需的输入、工具及技术、输出如图所示:
问题跟踪和核查:输入、工具及技术、输出
2.3优化工作逻辑图
综合优化工作流程和内容,优化工作逻辑图如下:
优化工作逻辑图2.4优化工作模板和示例
1.优化工作参考模板
TOP小区处理跟踪表
.xlsx K P I参数修改记录
.xlsx
K P I问题处理工单
oc
报表示例
KPI报表示例.xlsx重要指标失败值示
例.x l s
3 连接建立成功率优化
3.1理论介绍
连接建立过程分为两个阶段:准备阶段和实施阶段。
在准备阶段中,会根据层的触发原因和系统广播中的接入限制信息,通过一系列检查来判断自己是否被允许进行接入过程,如果可以,则执行后续的实施阶段;否则的将启动相应的定时器,在该定时器超时前无法发起任何接入过程。
上述机制的目的是负荷拥塞控制,当网络负荷较重时限制某些进行接入。
3.2指标定义
连接建立是指处于空闲状态的或待开机的准备发起一个呼叫或响应寻呼时发起的过程。
出于降低接入时
延的考虑,系统将连接建立过程设计发生在和之间的S1连接建立前,也就是在尚未从获得任何上下文前,需要将连接建立完毕,因此该过程主要建立最基本的1。
连接建立成功意味着与网络建立了信令连接,是进行其他业务的基础。
连接建立成功率主要通过话务统计结果获得,推荐的公式为:
建立成功率= [连接建立完成次数]/[连接请求次数(不包括重发)];
公式中相关各指标的具体统计方式如下所示:
3.3
3.3.1正常过程
图建立过程正常流程
每当在中发现一条接口消息时,代表某一个连接建立的开始,此后所有的消息都可以提取相同的和。
当看到和消息时,标志着建立正常流程的结束。
3.3.2异常过程
i.连接建立完成超时
图连接建立完成超时
每当在中发现一条接口消息时,代表某一个连接建立的开始,此后所有的消息都可以提取相同的和。
当看到接口的和事件类接口的消息,并且第3条消息的定时器类型字段为时,标志着连接建立完成超时。
ii.连接建立拒绝
图连接建立拒绝
每当在中发现一条接口消息时,代表某一个连接建立的开始,如图2.10所示。
第1、2条消息为接口的、,2条消息有相同的小区标识与,是连接建立发生时基站为新分配的索引。
3.4优化方法介绍
系统内连接建立失败问题的可能原因大概分为如下几条:
建立失败主要的原因有:上行随机接入信道功率问题、小区重选参数问题、下行初始发射功率偏低、上行初始功控问题、拥塞问题或设备异常问题等。
当出现连接建立成功率低的问题时,首先按照上述问题分类,了解相关问题的范围,然后根据空口信号质量、参数配置、干扰和上下行功率调整及设备告警等方面入手逐一排查解决,排除这些影响连接建立成功率的客观因素,逐步提升该指标的成功率。
连接建立的过程主要包括以下3个个步骤:
连接建立成功信令流程
(1)首先通过0发送消息(注:0一直存在,用来传输映射到的信令。
)此消息主要携带初始()表示以及该连接建立的原因等信息,此高层消息会触发的底层试题进行基于竞争的随机接入过程,连接建立请求消息就对应于底层随机接入过程中的3
(2)通过底层的竞争接入冲突解决机制,接收到的消息,建立了与之间的1,为1配置层和逻辑层信道的属性。
还在此信令中对等各个实体的配置参数进行配置,连接建立消息就对应于底层随机接入过程中的4。
收到的信令后,和之间的1就建立起来了。
(3)在接收到消息后,向发送一个消息。
此消息中携带有上行方向的初始层的信令消息(如,,等),收到此消息后,将其中的消息转发给用于建立S1连接。
在第(2)步中,如果拒绝为建立连接,则通过0回复一条连接拒绝消息。
在该连接拒绝消息中,网络侧可以可选地携带一个禁止呼叫的定时器T302,该定时器和系统广播中的接入限制信息共同决定了是否被允许发起接入过程。
一般连接建立问题的定位方法如下,通用流程:
3.4.1上行随机接入的问题
发出消息,没有收到,如果此时的下行信道质量正常,一般是随机接入参数中的初始接收目标功率设置偏低的问题。
3.4.2小区重选参数问题
收到发的建立请求消息后,下发了消息而没有收到。
查看此时的,如果偏低,而且监视集中没有质量更好的小区,那么是覆盖的问题可以适当提高下行公共信道的功率。
如果此时监视集中有更好的小区,则可能是小区重选的问题,可以适当调整小区重选参数加快小区重选。
3.4.3下行初始发射功率偏低问题
收到消息而没有发出消息,如果此时下行的信号质量正常,那么可能是手机异常,否则可能是下
行初始功率过低导致下行不能同步。
3.4.4上行初始功控问题
发出消息而没有收到,由于上行初始功控会让的发射功率上升,如果是的发射功率不足导致,可以适当提高上行信道的初始期望功率和调整量等参数。
3.5相关案例介绍分析
3.5.1小区重选参数问题
问题描述:
华电集团专项2小区接入率很低,且主要集中在一五点到16点之间,查看小区无告警。
由于接入失败次数过多,影响全网一天的指标数据。
问题分析:
从信令看发起随机接入申请,发出后下发消息,终端无响应,造成连接建立完成超时,导致建立失败。
定位过程:
从最近一次的测量上报消息中可以看出,源小区为254,此时测量到的值为23,由此可以计算出的值为23-1411一八左右。
而测量到的相邻目标小区为62 ,值为34,小区在-107左右。
由此可以初步分析相关的场景是所处位置的信号质量不好,且存在模3干扰,最终导致连接建立定时器超时后连结建立失败。
解决建议:
查看基站配置后,该小区的参考信号功率为一五,已经为最大。
故不存在下行初始发射功率偏低问题。
通过现场复测抓取进一步分析,排除天线安装问题以及工参设置问题、排除存在大面积的弱覆盖问题。
通过分析,发现存在模三干扰严重,重新进行规划,修改小区的。
解决效果:
修改后,接入率有所提,指标数据恢复正常。
3.5.2小区上行功控参数设置问题
问题现象
技侦大楼0从7月一三日开始,接入请求次数变多还有伴随着大量失败,每天成功率基本在20%左右,失败发生在忙时时段,影响全网。
问题分析:
查看小区状态以及通道驻波均没有问题,从中看:均是下发之后终端无响应造成连接超时,导致接入失败。
查看基本上是为1和3的用户的失败,但是查看最近的均较高。
定位过程:
查看小区的以及小区状态正常,对此小区进行核查,发现参数在非持续调度功率设置上出现问题,当此小区是-95,全网当时都已经改成-70,通过对全网此参数的核查,发现还有理工学院22也是设置为-95,指标也很差。
解决建议:
效果:
把小区的非持续调度功率从-95修改到-70以后指标明显有提升:
3.5.3小区测试开关参数问题
问题现象:
在月苑二试扩3小区下收不到该小区信号,无法接入该小区,导致该路段信号较弱,较大区域形成弱覆盖。
问题分析:
测试车辆在月苑南路自西向东行驶至和墨香路交叉口区域,在交叉口区域该站下无法收到该小区信号,导致该路段覆盖较差,严重影响下载速率,机房核查小区状态正常,无告警情况。
图一
在后台对比核查参数发现,小区加载开关打开,且带真实用户的模拟快开关关闭,导致用户终端无法接入。
测试开关里有小区加载开关和带真实用户的模拟加载开关,小区加载开关打开的话,带真实用户的模拟加载开关就会生效。
当需要加扰测试时需要把小区加载开关打开,而此时如果带真实用户的模拟加载开关关闭,表示小区处于模拟用户加载情况,真实用户不能接入,如果带真实用户的模拟加载开关打开,表示是用真实用户进行加载,则真实用户可以接入。
月苑二试扩小区正是由于小区处于模拟加载状态,且关闭了带真实用户的模拟加载开关导致测试终端搜不到小区信号,无法正常接入;
解决建议:关闭小区加载开关
解决效果:
关闭小区加载开关后,终端能正常搜到小区信号,且接入正常。
如下图:
问题总结
对于无法接入小区的问题,建议处理措施:
a)核查小区状态和告警以及硬件问题情况。
b)核查是否由参数问题导致
小区加载开关默认关闭,在现网中进行模拟加载等测试时,测试完成后需要对参数及时进行恢复。
3.5.4SCTP内存池耗尽导致信令发送失败问题
问题描述:
南京F鼓楼四条巷专项L基站接入失败率很高,查看指标时段趋势,在有业务的时段都有接入失败率较高的问题存在。
实时查看小区无上行干扰,由于接入失败次数较多,影响全网全天的指标数据。
问题分析:
从指标劣化趋势看,在7点左右统计的接入失败次数最多,一个时段内高达22次的失败。
从信令看,在不断的在做更新,接入失败时是由于在随机接入过程中,上发, 回复但可能未收到,导致接入超时,侧未收到消息,具体信令情况如下:
通过解码可以得出此为过程:
定位过程:
从中,目标基站F鼓楼四条巷专项L所处位置属于边缘覆盖,F鼓楼四条巷专项2和F鼓楼四条巷专项3小区覆盖方向无其他小区衔接覆盖。
查看日志,对应失败的时间点事6:50 7:11 7:34 7:40,每个时间点都对应下面两条告警。
未知的消
息和定时器超时,从中统计失败原因都是收到建立完成消息超时。
通过分析日志,发现6:04--6:34半小时之间没有发送接收成功任何SCTP信令;存在很多信令发送失败的情况,原因为SCTP内存池耗尽。
查看71号日志以及OSP控制台日志,和配置文件里,发现对端100.68.一三1.214和100.68.一三1.221 同时配置为客户端和服务器,导致了基站内存池耗尽,消息发不出去,造成接入失败。
解决建议:
1、由于对端:100.68.一三1.214和:100.68.一三1.221 同时配置为客户端和服务器,这个配置触
发了SCTP内存耗尽,导致SCTP信令发送失败的现象,删除并只保留对端100.68.一三1.214和100.68.一三1.221 配置为客户端和服务器的其中一条。
2、升级新版本对此配置错误加保护,同时解决内存泄露的问题,以及增加对内存耗尽后的保护,来根本解决此问题的再次发生。
3.5.5全频带高干扰导致接入失败问题
干扰定义:在每个子帧轮询一次后都会统计出在100个中每个的值,当值高于10的个数大于等于3时为高,查询一八次(早9:00到晚一八:00每个小时一次数据,统计上行两个时隙),如果同一个站点(包括3个小区)超过6次干扰判定为干扰小区,其中超过20为干扰严重小区,在10~20之间的为干扰普通小区;如同一个小区多于6次超过80个的大于一五判定为全频带高干扰小区。
问题描述:
宁波城市元年-2小区无线接通率只有59.38%,从信令流程上看到的是存在大量基站收不到终端发上来的消息:
问题分析:
检查基站状态正常,查看小区无相关原因告警,从指标趋势看,平均分布在每个时段;从信令看发起由于给发起后下发消息,但未收到终端上发的消息,造成连接建立完成超时,导致连接建立失败。
查询上行低噪,发现较多的都存在较高的值。
对小区的进行监控,可以看到高干扰,并且邻区并无大量用户。
解决效果:
6月21日将城市元年-2小区开关打开,该小区前后一周的数据如下:
其中6月20太少:
4 建立成功率
4.1理论介绍
涉及话统打点
图1
图2
如或中A点所示,当收到来自的或者消息时统计该指标。
如果或者
消息中要求同时建立多个,则相应指标根据业务的按具体的建立数目分别进行累加。
如或中B点所示,当向发送或者消息时统计该指标。
如果或者
消息中同时携带多个的建立,则相应指标按各个业务的分别进行累加。
以=6的业务为主,所以不需要关注具体的业务类别的统计。
4.2指标定义
建立成功率=小区建立成功总次数/小区尝试建立总次数×100%
小区无线接通率=建立成功率×建立成功率。
4.3信令流程及失败原因
4.3.1正常过程
✓上下文建立过程基本流程
上下文建立过程基本流程
上下文建立流程是以S1 开始,此后所有的消息都可以提取相同的。
S1 消息标志着上下文建立基本流程的结束。
S1 消息的详细解码结果中,里面的承载个数等于1时,意味着这次上下文建立过程只是建立默认承载;而当此值大于1时,则意味着这次上下文建立过程除了建立默认承载外还要建立专用承载。
在S1 消息的详细解码结果中,里面的承载个数代表建立成功的默认承载和专用承载数目,里面的承载个数代表建立失败的默认承载和专用承载数目。
✓专用承载建立基本流程
专用承载建立基本流程
专用承载建立流程以S1 消息开始,此后所有的消息都可以提取相同的。
S1 消息标志着专用承载建立基本流程的结束。
4.3.2异常过程
i.上下文建立过程中等待能力信息超时
上下文建立过程中等待能力信息超时
当看到和S1 消息并且第3条消息的字段的值为时,标志着上下文建立流程中能力信息超时。
ii.上下文建立过程中等待安全模式完成超时
上下文建立过程中等待安全模式完成超时
当看到和S1 消息并且最后一条消息的字段的值为时,标志着上下文建立流程中安全模式命令消息超时。
iii.上下文建立过程中等待重配完成超时
上下文建立过程中等待重配完成超时
当看到和S1 消息并且最后一条消息的字段的值为时,标志着上下文建立流程中空口重配置消息超时。
iv.上下文建立过程中安全失败
上下文建立过程中安全失败
当看到消息时,标志着上下文建立流程中安全配置失败。
上下文建立过程中传输错误
v.
当看到S1 消息并且其详细解码中的字段为时,标志着上下文建立流程中传输错误。
上下文建立过程中内部其他错误
vi.
当看到S1 消息并且其详细解码中的字段不为、和时,标志着上下文建立流程中内部其他错误。
vii.专用承载建立过程中等待重配完成超时
专用承载建立过程中等待重配完成超时
当看到和S1 消息并且最后一条消息的字段的值为时,标志着专用承载建立流程中空口重配置消息超时。
4.4相关案例介绍分析
4.4.1路由关系未配无法接入的问题
问题描述:
兰州示范站,连接的是华为核心网,基站开通后,链路正常建立,小区正常,但是终端无法附着成功。
问题分析:
通过信令流程分析,在终端建立完成,鉴权、安全流程完成后,核心网下发了终端上下文建立的请求,之后基站直接回复了上下文建立失败,失败原因: : ,如下图:
定位过程:
根据信令流程提示,通过查看失败信令的前一条信令,核心网下发上下文建立请求消息中,携带的地址如下图,转化成十进制是:100.89.1.1:
而在基站的传输配置中,检查路由配置关系中发现,基站路由中没有添加到100.89.1.1这个网段的路由,所以导致了终端由于没有传输路由而上下文建立失败。
解决效果:
现场添加完成该网段路由后,终端附着成功,业务正常。
4.4.2网关配置错误导致无法附着
问题描述:
南京统计指标发现南体分校试扩L 建立全部失败,全天失败次数在两万多次,严重影响了全网指标。
问题分析:
通过提取该站的分析发现,终端建立已完成,鉴权和安全也已通过,核心网下发了终端上下文建立的请求后,基站直接回复了上下文建立失败,失败原因: : ,通过跟踪信令流程和看到的结果一样,如下图:
定位过程:
从中的消息中'01100100 01000100 11111101 00010001'B 对应的是100.68.253.17,通过核查确认核心网侧的确定是100.68.253.17。
对侧的路由设置进行检查,S1链路断链恢复后,该基站的路由中包含100.68.253.17的路由。
而后通过仔细核查该路由关系,发现该条路由关系中网关地址:100.68.一三 2.129和基站的地址:100.68.129.145不在同一个网段内,检查原始规划数据,发现和规划数据不一致,所以导致了终端由于传输错误而上下文建立失败。
解决效果:
现场修改网关地址后,终端成功附着,业务正常。
4.4.3安全参数配置问题
问题描述:
福州移动使用三星S4终端无法附着,查看,失败原因是“”。
问题分析:
1、查看目前基站安全开关为关闭,当此开关关闭时,基站默认选择空算法0进行完保。
(协议规定安全开关关闭时,默认一种算法进行完保,大唐目前默认空算法0)
查看安全开关节点:全局参数配置-全局测试开关全局测试开关
2、通过抓包,终端上报的能力中,不支持空算法0,所以终端接入时,基站使用默认空算法,导致终端安全模式失败。
定位结果:
打开安全开关,基站根据配置算法的优先级和终端支持的算法来选择对应适合的,即可保证终端完保通过。
解决建议:
按信令流程分析,当安全失败时,一般都是基站设置的算法终端部支持,所以首先查看安全开关是否关闭,如果关闭则打开。
安全开关打开后,如果终端不支持第一优先级算法,则会根据算法优先级一一选择。
解决效果:
打开安全开关后,三星S4终端能够成功附着。
5 切换成功率优化
5.1理论介绍
切换成功率是移动保持类的重要指标之一,按照涉及的网元关系可以分为内切换成功成功率、间(包括X2切换和S1切换)切换成功率。
切换成功率的高低,直接影响用户感受,是运营商重点考核的指标之一。
5.2指标定义
切换()是移动通信系统的一个非常重要的功能。
作为无线链路控制的一种手段,切换能够使用户在穿越不同的小区时保持连续的通话。
切换成功率是指所有原因引起的切换成功次数与所有原因引起的切换请求次数的比值。
切换主要的目的是保障通话的连续,提高通话质量,减小网内越区干扰,为用户提供更好的服务。
切换成功率主要通过话务统计结果获得,推荐的公式为:
间切换成功率= ( 间S1切换出成功次数间X2切换出成功次数) / ( 间S1切换出执行请求次数间X2切换出执行请求次数)
内切换成功率= 内切换出成功次数内切换出请求次数*100%
1)间切换相关的指标描述如下:
2。