HD VOICE 的设计和应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
HD VOICE 的设计和应用
摘要:随着国内移动通信终端设计水平的不断提高,高清语音越来越受到消费者的关注和重视,好的语音质量需要科学严谨的设计方案和测试方法来保证,文章以我司 H4011 项目为例,详细介绍了从器件选型,原理图、PCB、结构设计及HD voice 评测实现的过程,让读者更清晰的把握设计相关的注意事项,规避一些常见的设计误区,对于 HD voice 设计有一个整体的兼顾。
关键词:HD voice ;双 MIC 消噪
一.HD voice 的设计要求
1.1HD voice 的介绍
HD Voice (High Definition Voice), 中文叫高清语音,他代表着数字化更清晰的语音质量 , 又名宽频语音,传统 GSM EFR 语音电话的带宽只有 300hz~3.4khz, HD Voice 采用了
WB_AMR(Wideband-Adaptive Multi rate)技术,把语音电话支持的带宽提升到 50hz~7khz 或者更高,并可优化通信品质,减轻环境噪音的影响,使手机间的通话更清晰原始的展现人的语音信息。最表象的体验就是你好像听到他本人在你身边的声音,其实他在电线的另外一端。目前欧洲的电信公司已经改造了他们的电信网络,实现了高清语音。国内也已实现了 3G WCDMA 和LTE 网络下的高清语音支持。
1.2实现HD voice 的必备条件
HD device 必须具备如下四个条件:
1.网络要求:网络支持 AMR-WB, AMR-NB 。运营商网络支持TFO/TrFO 技术。通话双方均处在支持 AMR-WB 的网络覆盖区域。
2.声学性能必须保持宽带语音质量,需要采用宽频电声器件,如宽频听筒。
3.支持双麦降噪功能。
4.了保持沟通的互动性和自然性,HD device 必须保持合理的终端延迟。
二.硬件设计要求
2.1平台选择
平台语音编解码要支持 NB-AMR 和 WB-AMR。且支持双麦克风语音跟踪和录音输入,延时<185ms。
2.2电声器件选型
1.喇叭要求低频充足,响度大,无杂音;
2.听筒要求使用宽频听筒,
3.麦克风要求频响曲线要尽可能的平滑,频响在 ±3dB 的框线范围内,信噪比
(SNR) >58dB,多麦克设计要使用相同型号的麦克风。
2.3原理图设计: 1.偏置电压电路上预留两组电容搭配进行滤波处理。2.信号线采用差分信号线设计,线路上预留 RC 网络。
2.4layout 走线设计:
1.元器件布局时,远离大电压、大电流、射频功放、天线投影区等强干扰源。
2.Mic 的供电电源要单独走线,并进行包地保护。
3.信号线走差分线,等长等间距,尽可能的短,并且上下左右包地处理,远离大电源、
时钟信号、射频信号线等干扰源,避免与强干扰源信号线平行,若实在规避不了,应尽量做
到隔层垂直交叉,多铺地保护。
4.滤波网络器件靠近器件摆放。
5.主麦克风摆放一般位于手机正面底部中间位置,麦克风防静电和抗干扰器件都就近放置。
三.结构设计要求
3.1音腔结构设计要求
影响HD voice 的结构因素如下:
1.主 / 副麦距离太近,导致 DSP 很难分辨正常的语音信号,语音信号直接被当作噪声给
消除了;
2.副麦部分或全部被用户遮挡,造成副麦不能给 DSP 提供噪声的信息,或者提供的信息
是不全的,导致降噪根本不能正常工作;
3.主/ 副麦密封不佳,不合理的回声信号被主/ 副麦拾取到。
4.听筒密封不好,导致低频衰减严重。
5.喇叭腔体太小或出声孔面积太小导致响度不够。喇叭腔体密封不好,导致低频衰减严重。
3.2MIC 腔体设计
1.主麦克风的位置及开孔要求
根据听筒距离机壳底部直线距离不同,要求如下:
2.副麦克的位置及开孔要求
(1)机壳背部上方中间区域。(2)机壳上边缘区域。
3.MIC 腔体设计要求:
MIC 通道长 L 不大于 5mm。MIC 前腔体积 <15mm3,麦克风的进声孔的直径在 1 ~ 1.5m。密封方式简单。麦克风堵孔前后的 SLR 差值
>25dB。
四.软件设计要求
实现HD voice 功能,软件上需要进行如下配置:
1.软件设计在上层进行操作,需要检查确认 modem 是否支持WB,支持则
AMRWB_LINK_SUPPORT = TRUE;如果不支持,请申请新的modem 包或 flavor build。
2.AP 端打开双麦的宏。MTK_DUAL_MIC_SUPPORT = yes
五.HD VOICE 效果评定
5.1降噪评定方法及原理
3QUEST(3 重通信语言质量分析)基于 ETSI 标准 EG202396-3,包含了宽带和窄带背景噪声下测试模式,可以很好的评估语音在各种噪声存在的情况下的传输质量,测试结果会得到 S-MOS,N-MOS 和 G-MOS, S-MOS 代表了语音信号的传输性能,N-MOS 代表了对背景噪声抑制的性能,G-MOS 代表了整体的性能。
MOS 的基本原理:
ITU-TP.830 描述了一种对语音的主观评定方法 :MOS(Mean Opinion Score) 方法。由不同的人分别对原始语料和经过系统处理后有衰退语料进行主观感觉对比,得出 MOS 分值,最后求平均值。MOS 得分采用五级评分标准,其方法是,由数十名试听者在相同信道环境中试听并给予评分,然后对评分进行统计处理,求出平均得分。由于主观和客观上的种种原因,每次试听所得的评分会有波动,为了减小波动的误差,需要尽可能的满足以下几点:
①试听者人数要足够多
②测试语音材料足够丰富
③试听环境尽量保持相同
④试听者的注意力等级尽可能相同
下表给出主观评定等级的质量等级、分数和相应的收听注意力等级。
MOS 语音质量的量化:
发明电话开始,语音质量的测量方式是凭主观的,人们摘起一个电话,然后由人耳来感知语音的好坏,这个方法是被广泛认同的。基于该主观评测,人类接听和感知语音质量的行为被调研和量化,如实际中采用到的PESQ(语音质量的知觉评估)客观测试方法。
PESQ 的基本原理:
PSEQ 工具是用来计算语音样本的 MOS-LQO (Mean Opinion Score
– Listening Quality Objective)值,PESQ 把在信号传输通过设备时提取的输出信号与参照信号进行比较计算出差异值。一般情况下,输出信号和参照信号的差异性越大,计算出的MOS 参数值就越低。实验证明其计算结果和主观评分结果是基本一致的。