MOS话音质量优化手段
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
MOS语音质量优化手段
1 MOS语音质量评估
1.1 MOS语音质量评价方法
最早的语音质量评测标准仅是基于无线指标的(RxQual),但实际语音在传输中会经过无线、传输、交换、路由等多个节点,任一环节出现问题都会导致用户语音感知差,仅仅考虑无线指标是无法发现和定位语音质量问题的,于是基于用户感知的语音质量评价方法逐渐成为用户语音服务质量评测的最主要标准。
常用的语音质量评价方法分为主观评价和客观评价。
早期语音质量的评价方式是凭主观的,人们在打通电话之后通过人耳来感知语音质量的好坏。
1996年开始制订相关的评测标准:MOS(Mean Opinion Score)测试。
它是一种主观测试方法,将用户接听和感知语音质量的行为进行调研和量化,由不同的调查用户分别对原始标准语音和经过无线网传播后的衰退声音进行主观感受对比,评出MOS分值,见下表:
MOS算法适用于评价各类端到端网络的语音质量,它综合考虑了感知中的各项影响因素(如编解码失真、错误、丢包、延时、抖动和过滤等)来客观地评价语音信号的质量,从而提供可以完全量化的语音质量衡量方法。
1.2 MOS语音评估算法原理
从MOS算法模型的结构图(见下图)中可以看到整个算法的处理流程。
参考信号和通过无线网络传输后的退化信号通过电平调整,再用输入滤波器模拟标准电话听筒进行滤波(FFT)。
这两个信号在时间上对准,并通过听觉变换。
这个变换包括对系统中线性滤波和增益变化的补偿和均衡,再通过认知模型,从而映射到对主观平均意见分的预测。
一般情况下,输出信号和参照信号的差异性越大,计算出的MOS分值就越低。
图一、MOS算法模型的结构图
2 MOS语音评估的几种优化手段研究
由于算法考虑了整个信号传输过程中的中断及衰变, 而不仅是空中接口部分,因此,影
响MOS的主要因素有以下几个方面:语音编码方案、Abis传输、Abis压缩、不连续发射、C/I、切换频次及质量(RxQual)对MOS的影响等。
2.1语音编码方案对MOS的影响
数字蜂窝移动通信系统中的语音编码技术都是采用混合编码方式。
但采用的激励源不同,构成的编码方案也不同。
GSM 系统对数字语音业务信道规定了三种标准,如下表所示:表二、GSM系统对数字语音业务信道规定的三种标准
,在编码过程中,残差被送到规则脉冲激励分析,执行基本的压缩算法,产生规则脉冲激励参数。
规则脉冲激励能很好地逼近残余信号,代价是13Kb/s 编码中有9.4Kb/s 为规则脉冲激励参数。
GSM-EFR 的编码方案基于码本激励线性预测(CELP)技术,GSM-EFR 方案中,采用码本激励来逼近残差信号,采用代数码本结构,不仅降低了码本的存储量和搜索量,更重要的是提供了频域控制函数,能更好地逼近残余信号,在12.2Kb/s 的编码中有8Kb/s 为激励参数。
半速率采用VCELP 编码方式,用固定的随机码本来逼近语音信号的余量信号,这种方法缺乏灵活性,不能很好地控制码本的频域特性,且压缩比高,最终5.6Kb/s 中只有2.8Kb/s 为激励参数,因此对语音质量有较大的影响。
另外,在信道编码的保护方面,由于半速率信道的差异性比全速率的差异性小,所以半速率信道编码的很大一部分用于误码保护,由于增强型全速率编码的速率12.2Kb/s 小于全速率的13Kb/s,在信道编码中也多一些保护,所以EFR 的使用可以更有效的改善用户感知。
一般情况下,对于GSM系统来说,如果无线环境相同,各语音编码方案MOS的平均分值关系为:增强型全速率(EFR)>全速率(FR)> 半速率(HR)。
下表为理论情况下不同的语音编码方案所对应的MOS值:
表三、理论情况下不同的语音编码方案所对应的MOS值
根据某地的室内实测数据分析,在不同语音编码速率下(C/I 值处于理想状况)相应的MOS平均值及最大值如下表所示:
表四、不同语音编码速率下的MOS平均值及最大值
结论:
结合理论值和某地的实测值,在C/I 值处于理想状况下,EFR设备的MOS分值比FR 设备的大0.4左右,FR设备的MOS分值比HR设备的大0.2左右。
2.2频繁切换对MOS的影响
切换是GSM 移动通信中最基本、最重要的特性。
在切换过程中需要借用TCH 帧(用作FACCH)来传送相关切换信令,这种暂时的中断是为保持网络的连接性能而完成向更合适小区切换的需要,但却是以牺牲话音的连续性为代价,对话音质量存在一定的影响。
特别是当出现频繁的乒乓切换时,连续的偷帧问题在用户听觉上会出现类似帧丢失引起的的话音中断情况,也就是对用户通话的影响更为明显。
下面我们对6秒内切换次数和1小时内乒乓切换两种情况对MOS值的影响进行了试验和分析:
2.2.16秒内切换次数对MOS的影响
BSC有一个切换流量控制参数可以控制两次切换之间的时间间隔,它的取值可以为SACCH周期的整倍数,即480毫秒的整倍数。
同时,由MOS 值产生的原理可知:理论上MOS 值在6 秒的通话时间内最多受到两次切换的影响。
所以,我们可以通过调整BSC的切换流量控制参数来试验在6秒通话时间内分别占用EFR和FR设备时发生0次、1次或2次切换时对MOS值的影响,试验结果如下:
表五、6秒通话时间内占用EFR和FR设备时发生多次切换时对MOS值的影响
图二、上行MOS受切换影响变化图
图三、下行MOS受切换影响变化图
图四、使用EFR时MOS受切换影响变化图
图五、使用FR时MOS受切换影响变化图
小结:
测试数据显示:MOS受切换影响,且切换频次的不同,MOS 值下降的幅度也不同。
1)占用EFR 通话时,在传送上下行话音的各6 秒时间内,切换一次时,上下行MOS均
值较最大值约下降1 左右,上下行MOS均值较没发生切换时的上下行MOS均值约下降0.8左右;切换两次时,上下行MOS 均值较最大值约下降2 左右,上下行MOS均值较发生1次切换时的上下行MOS均值约下降1左右;
2)占用FR 通话时,在传送上下行话音各6 秒时间内,切换一次时,上下行MOS 均值
较最大值约下降1 左右,上下行MOS均值较没发生切换时的上下行MOS均值约下降
0.9左右;切换两次时,上下行MOS 均值较最大值约下降1.5 左右,上下行MOS均
值较发生1次切换时的上下行MOS均值约下降0.6左右。
3)上面只是一个平均值的比较,在单个采样点值时会有所波动,最小值会达到2.1 左右,
这和切换发生在 6 秒语音的不同时间位置有关,在优化过程中这些较小的点值将直接影响平均的MOS 值以及百分比值。
2.2.2乒乓切换切换对MOS的影响
为了测试乒乓切换对MOS 的影响,模拟了由于同频同BSIC 而造成的切换失败,让手机不停的向错误小区发切换申请,同时利用BSC的切换失败时间惩罚参数来控制两次切换命令之间的时间间隔。
当通话分别占用EFR/FR/HR 发生切换失败时MOS 的变化情况如下:
图六、使用EFR时不同切换频度下MOS的变化图
表七、占用FR时不同的切换申请次数下MOS值得变化情况
图七、使用FR时不同切换频度下MOS的变化图
图八、使用HR时不同切换频度下MOS的变化图
结论:
通过上述切换影响实验,可以得出以下结论:
1)切换严重影响到MOS分值,且随着切换频次的增加,MOS可能下降到人耳无法忍受
的地步,造成一些影响指标的低值。
2)占用EFR 通话时,在传送上下行话音各6 秒种的时间内,切换一次时,上下行MOS
均值较最大值约下降1 左右,切换两次时,上下行MOS 均值较最大值约下降2 左右。
3)占用FR 通话时,在传送上下行话音各6 秒时间内,切换一次时,上下行MOS 均值
较最大值约下降1 左右,切换两次时,上下行MOS 均值较最大值约下降1.5 左右。
4)当分别占用EFR/FR/HR 且发生切换失败时(约等同于乒乓切换),切换命令越频繁,
则对应的MOS 值越低,产生的MOS 点值可能会接近于1。
2.3 不连续发射对MOS的影响
在一个通话过程中,单向的话音传送往往只占用到50%的总通话时间,不连续发射功能通过VAD 检测要传送的是否是话音,否则采用静默传送。
用静默来取代语音,也是一种失真,将严重影响主观感受。
开启不连续发射功能的好处是可以减少干扰和节省BTS 及MS 的电量。
但开启不连续发射功能后,对爆破音(如K、T、P 等)的传送会有一定的不准确性,影响话音质量。
本次试验我们选择了一个室内小区,在开启和关闭不连续发射功能时进行各进行了3次测试统计,每次测试时长为30分钟,测试结果如下:
结论:
通过对比在开启不连续发射前后MOS 的变化情况,可以得出以下结论:
1)上下行MOS 的平均值在开启和不开启不连续发射时基本一致。
2)MOS 算法得出的语音评估值不考虑静默帧,因此不连续发射功能是否开启不影响单个
MOS值,这是和MOS 的算法有关的。
但实际不连续发射功能的开启会降低单个通话过程中的话音质量,全网不连续发射功能的开启却能提升网络的C/I,有助于平均话音质量的提高。
2.4 A-BIS传输质量对MOS的影响
传输质量存在问题一般表现在传输出现大量的误码、滑码及传输闪断,在BSC 统计里包括了LAPD 信令重传、LAPD 坏帧及过负荷的统计,这几个计数器可以用来观察A-BIS 的传输质量情况,如果出现坏帧过多或信令重传严重的现象,一般就都是由于传输质量不好引起的。
传输质量的问题从原理上来看就相当于是丢失了一些话音帧,显然,这些话音帧的丢失将严重影响到话音质量。
根据MOS 评估的原理:在上行语音发送的时间内通过拨插来话方向的传输接口,在下行语音发送的时间内通过拨插去话方向的传输接口,使上下行传输出现ES(ESR),通过拨插的时间控制ES(ESR)的时间,研究不同ES(ESR)时间对MOS 值的影响程度。
注:ES(Errored seconds,incoming direction)影响到上行MOS 的值,ESR(Errored seconds,outgoing direction)影响到下行MOS 的值
结论:
1)在上行方向
✓随着闪断时间占话音时间的比例逐渐增大,上行的MOS 值出现明显的下降趋势。
✓当闪断时间占话音时间的比例为17%时,MOS 的最大值为2.99,最小值为2.09,波动范围在0.9 左右。
✓当闪断时间占话音时间的比例增大到33%和50%时,MOS 会出现最小值1,波动的范围较大,很不稳定。
✓当闪断时间占话音时间的比例大于50%时,传输质量很差,已经容易引起掉话和倒站现象。
2)在下行方向
✓随着闪断时间占话音时间的比例逐渐增大,下行的MOS 值出现明显的下降趋势。
✓当闪断时间占话音时间的比例为17%时,下行MOS 最大值为3.979,最小值为
2.479,平均值为
3.205,语音质量还在可接受的范围内。
✓当闪断时间占话音时间的比例增大到33%时,下行MOS 的平均值在2.8 左右,会出现最小值1。
语音质量变得比较差。
✓当闪断时间占话音时间的比例增大到50%时,MOS 的平均值在2.5 左右,出现最小值1。
语音质量变得更差。
✓当闪断时间占话音时间的比例大于50%时,传输质量已经非常差,很容易引起掉话和倒站现象。
2.5 LAPD信令压缩对MOS的影响
经测试,采用LAPD压缩方式的小区其MOS平均值为3.24,而不采用LAPD压缩方式的小区其MOS平均值为3.325,差值为0.085,相差比率为2.62%。
可见,压缩比越大,其MOS分值就越低。
同时,LAPD信令过分压缩有可能造成信令的丢失,在高话务或传输不稳的情况下,会出现基站不断重启,进而造成指标严重恶化,用户感知急剧下降。
因而,在传输资源充足的前提下,建议不使用LAPD信令压缩功能。
2.6 链路质量对MOS的影响
在语音评估的过程中,不同的链路和路由以及这些链路的质量也是影响MOS MOS值的一个重要因素。
如在某次的网络评估测试中,某网络的网络语音评估结果偏低,通过大量测试排除了设备和无线的原因,最终发现问题原因是长途交换和路由的问题。
在语音评估过程中电话有两条路由,通过锁定线路进行测试,发现某一条路由存在误码问题,解决路由误码问题后结果正常。
3、小结及建议
通过以上的试验和分析,目前影响MOS分值最大的因素为语音编码方案,其次为切换频度、传输质量和LAPD信令压缩方式,不连续发射功能的开启基本对MOS分值没有负面的影响,而通过全网不连续发射功能的开启却能提升网络的C/I,有助于平均话音质量的提高。
1)对于语音编码方案,如改为增强型全速率编码方案,则相邻的交换机也需修改,否则,
会影响交换机之间的切换。
对于是否更改编码方案,需慎重考虑。
2)对于频繁切换,一方面通过参数进行控制乒乓切换,另一方面,需合理控制天线俯仰角,
减少小区间过多的重叠覆盖,以理顺切换的次序及保证切换的必要性和有效性。
3)对于A-BIS和中继链路的传输质量,对于MOS分值的影响也是十分明显的,所以在日
常维护工作中,需要加强对传输质量的监控,保证发现传输质量问题和解决传输故障的及时性。
4)LAPD信令压缩方面,建议在传输资源允许的前提下,在适当时机将基站改为无压缩方
式,以保证基站运行的稳定性、减轻TRH负荷以及提升MOS质量。
5)对于质量(RxQual),由于其优化手段较为多样,本文中暂未涉及,但当其较差时也会
影响到MOS分值,因此,改善网络质量也是保证MOS质量的基础。
总之,在目前语音编码不变的前提下,可以通过合理控制过覆盖,并减少频繁切换,尽量提升网络质量(RxQual),从而全面提升MOS质量水平。