LTE网络下手游空口时延优化分析方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
杭州LTE网络下手游空口时延优化分析方法最佳实践总结
杭州电信余杭分公司
仲展毅
1概述
在4G时代,移动网带宽大幅提升,同时智能手机和应用也得到了极大发展。
在智能手机应用中,网络游戏明显占据着非常重要的地位。
如何提高用户在手机游戏中的网络体验成为游戏开发商、游戏代理商和电信运营商积极探索的方向。
从终端到服务器,整个体系的每一个环节都会影响用户的使用感知,基站空口显然是不确定性最大的一个环节,了解空口对时延的影响,并找到改善时延的方法非常重要。
本次通过研究手游在网络上2种交互连接的运作机制,并以典型情况介绍说明卡顿的根本原因。
通过LTE无线空口的3个主要指标RSRP、SINR、负荷分别开展统计分析和现场评估,得出指标与时延的相关性以及提升方案,最后就LTE的一些特性对空口时延的影响进行分析并给出调整的实测情况。
2手机游戏机制
客户端与服务器间主要有2个交互连接,一个为TCP连接,一个为UDP连接。
游戏客户端与服务器间的TCP长连接由终端发起,通过这个TCP长连接进行心跳和其他信息交互,用以确认服务器状态正常,心跳间隔3 s,消息大小固定,流程如图示:
客户端与服务器TCP流程图
客户端和服务器之间交互的报文,除了TCP长连接报文以外,还有大量的UDP报文,传递玩家的操作信息。
主流网络游戏采用的同步机制为帧同步(非状态同步),主要流程如下:
广播帧流程图
当用户操作未及时上报,或客户端未及时收到服务器下发的广播消息时,都会体现为游戏中的卡顿。
由此可知,网络侧上下行的总时延超过60 ms会极大拉低用户感知,但60 ms是整个环路上总时延阈值,对于空口则需要将本段时延降低至接近极限值。
3空口时延影响因素
3.1 覆盖、干扰与时延
对杭州同一个MME下的E-UTRN进行大量拉网Ping测试,得到不同环境下空口时延的散点图:
RSRP与Ping时延散点图
通过进一步的数据分析,得到RSRP、SINR与Ping时延的样本点数的关系(此处并未考虑网络负荷的影响)。
➢RSRP与Ping时延关系数据统计分析:时延大于50 ms以上的采样点占比在各个RSRP区间均稳定在40%左右,差异并不大,可见RSRP与高时延
呈现弱相关性。
➢SINR与Ping时延关系数据统计分析:时延大于50 ms以上的采样点占比在各个SINR区间均稳定在40%左右,差异同RSRP一样不明显,可见SINR
与高时延同样呈现弱相关性。
3.2 负荷与时延
小区负荷直接影响调度,同时相邻小区负荷上升带来的干扰也会影响服务小区的空口环境。
小区负荷可以用话统数据中的上下行PRB利用率和CCE利用率来表征,在通常的话务模型下,这3种利用率指标也有一定的相关性。
分析杭州城区簇的拉网数据,汇总比较后得到PRB利用率与时延的关系:
1)上行PRB与上行时延统计
杭州城区簇拉网数据上行PRB与上行时延统计
上行PRB利用率与上行时延无明显相关性。
TOP 小区利用率大于54%时,游戏上行RTT时延会增大;利用率低于50%时,对上行RTT时延无明显影响。
2)上行PRB与下行时延统计
上行PRB利用率超过25%后,下行RTT时延大的样本点开始增多;利用率超过50%后,时延大的样本点比重变大。
从TOP小区来看,上行PRB利用率大于50%时,游戏下行RTT时延会增大;利用率低于40%时,对下行RTT 时延无明显影响。
因此应控制小区上行PRB利用率在50%以下,超过50%的小区应及时做载波扩容或负荷分担。
杭州城区簇拉网数据上行PRB与下行时延统计
3)下行PRB与上行时延统计
杭州城区簇拉网数据下行负荷与上行时延统计
下行PRB利用率与上行时延没有明显相关性,可判断下行PRB利用率对上行RTT影响较小。
4)下行PRB与下行时延统计
杭州城区簇拉网数据下行负荷与下行时延统计
从统计中可以看出,下行PRB利用率大于75%后,下行RTT时延样本点分布
开始发散。
从TOP小区看,在利用率超过80%后,下行RTT时延会显著增大。
因此应控制小区下行PRB利用率在80%以下,超过80%的小区应及时做载波扩容或负荷分担。
5)CCE利用率与时延统计
CCE利用率与上行时延
CCE利用率与下行时延
综合统计分析CCE利用率与上下行时延的数据发现,CCE利用率超过30%时,下行RTT时延样本点分布开始发散,CCE利用率大于42%时,游戏下行RTT时延会显著增大。
因此应控制小区CCE利用率在42%以下,超过42%的小区应及时做载波扩容或负荷分担。
3.3 小结
综上分析总结时延与无线覆盖、质量、容量的关系如下:
1)覆盖与空口时延呈现弱相关性;
2)质量与空口时延呈现弱相关性;
3)容量与空口时延呈现较强相关性,具体表现为:上行PRB利用率大于
50%、下行PRB利用率大于75%、CCE利用率大于42%,这3种情况都
会对时延造成明显影响,在现网中因尽量避免。
4影响时延的特性功能观察
除了考虑覆盖、质量和负荷的影响,还可以从调度算法、收敛阈值、特性功能等方面着手,快速降低空口时延。
相对于RF优化和容量调整,这些方法的周期更短,是非常好的补充手段。
4.1SRI周期
SRI用于UE主动向eNodeB请求分配上行带宽,当UE有新的上行数据需要被调度时将发送调度请求指示(SRI),流程如下图示。
UE向eNodeB发送SRI的周期称为SRI周期。
降低SRI周期会减少UE由于没有发送SRI而等待上行调度的时间,从而降低上行调度的平均时延,提升用户感知:
SRI流程图
在现场测试中,将SRI周期更改为5 ms后,时延从111 ms降到74 ms,下降37 ms。
此方案适用于低负荷小区。
4.2 上行IBLER目标值
上行调度中,LTE系统根据SINR选择上行调度的MCS,如图示:
上行调度MCS选阶流程图
MCS在决定速率的同时也决定了数据的抗干扰性能,选取合适的MCS等级不
仅能保证业务的速率需求,同时也能减少误块率,降低时延。
对于低速同时对时延要求较高的业务类型,在空口环境固定或无法进一步优化的情况下,对常规的IBLER(Initial BlockError Rate)目标进行干涉会有非常好的效果。
在现场测试中,将IBLER目标值由10%修改为5%,时延由102ms下降到83ms,下降19ms。
此方案较适用于上行高带宽需求较少的场景。
4.3 下行IBLER增强自适应
下行MCS选阶与上行的流程相似,系统按照UE上报的CQI选择传输数据时所用的MCS。
在CQI调整阶段,会设置IBLER,收敛最优值,根据HARQ-ACK判断上报的CQI与实际信道质量的偏离程度,对CQI进行调整。
现网打开了下行IBLER 增强自适应开关,IBLER 目标值根据信道波动程度,分别调整为5%、10%、30%。
关闭此开关后对边缘用户的下行时延有改善。
在现场试验点测试中,关闭自适应后时延有明显下降,从153 ms降为134 ms。
此方案适用于上行高带宽需求较少的场景。
4.4 DRX特性
DRX(Discontinuous Reception)即非连续接收,是指终端仅在必要的时间段打开接收机进入激活态,用以接收下行数据和信令,而在剩余时间段关闭接收机进入休眠态,停止接收下行数据和信令的一种节省终端电力消耗的工作模式。
在DRX工作模式下,DRX周期包含激活期和休眠期,分别对应UE的工作状态为激活态和休眠态,如图示。
在非DRX工作模式下,UE将一直打开接收机,保持激活态:
DRX周期流程图
现场试验点测试中,关闭DRX特性,时延由117ms下降到102 ms,下降15 ms。
此方案不适用于接入用户过多的场景。
5总结
通过研究发现LTE空口质量与时延呈弱相关性,单纯提高RSRP和SINR并不
能明显降低手机游戏的时延,而空口上下行以及信令的负荷与时延呈强相关性,在下行PRB利用率高于75%、上行PRB利用率高于50%、CCE(控制信道)利用率高于42%这3种情况下都会明显抬高时延,需及时优化扩容。
本次杭州城区试验测试调整SRI周期、上行IBLER目标值、关闭DRX特性、关闭下行IBLER增强自适应开关等4种方案都能够很好地降低小区整体时延以提高手游的用户使用感知。