双通道语音增强的DSP实现

合集下载

一种双通道语音增强方法

一种双通道语音增强方法

一种双通道语音增强方法钟金荣;梁宇;林嘉宇【期刊名称】《计算机工程与科学》【年(卷),期】2012(34)5【摘要】本文提出了一种用于语音识别的双麦克风语音增强算法.该算法主要利用两个语音通道之间语音信号的空间相关性和时间相关性,进行空时域滤波,消除噪声.在输入语音信噪比为0至20dB之间时,能获得较大的信噪比处理增益.该方法只采用了两个麦克风,结构简单;相对于维纳后滤波法,解除了要求两麦克风接收的噪声信号不相关的约束,可以去除点声源的非强相干噪声.和一般的波束形成算法相比,可以去除期望声源方向的弱相关噪声.%A voice recognition speech enhancement method for dual microphones is proposed . This method, making use of two voice signal spatial correlation and temporal correlation, can reduce noise by spatial-temporal prediction . When the input SNR is higher than OdB, remarkable improved SNR can be obtained. This method is based on two microphones> with a simple structure; the reduction to a point noise is remarkable; the irrelevance of noise between two microphones is not required; and the weak correlative noise on the target direction can be reduced.【总页数】6页(P172-177)【作者】钟金荣;梁宇;林嘉宇【作者单位】国防科学技术大学电子科学与工程学院,湖南长沙410073;国防科学技术大学电子科学与工程学院,湖南长沙410073;国防科学技术大学电子科学与工程学院,湖南长沙410073【正文语种】中文【中图分类】TN912.35【相关文献】1.一种双微阵列语音增强方法 [J], 曾庆宁;肖强;王瑶;谢先明;龙超2.一种基于组合深层模型的语音增强方法 [J], 李璐君;屈丹3.一种时频平滑的深度神经网络语音增强方法 [J], 袁文浩;梁春燕;娄迎曦;房超;王志强4.一种基于时频域特征融合的语音增强方法 [J], 袁文浩;时云龙;胡少东;娄迎曦5.一种基于GRU神经网络的语音增强方法 [J], 彭月;蒙祖强;杨丽娜因版权原因,仅展示原文概要,查看原文内容请购买。

基于双通道神经网络时频掩蔽的语音增强算法

基于双通道神经网络时频掩蔽的语音增强算法
第49卷 第 6 期 2021年 6 月
DOI:10.13245/j.hust.210609
华 中 科 技 大 学 学 报 (自 然 科 学 版 ) J. Huazhong Univ. of Sci. & Tech. (Natural Science Edition)
Vol.49 No.6 Jun. 2021
估计方向矢量,识别每路麦克风信号上用于定位的 语 音 主 导 的 时 频 (t ime-f r e q u e n c y ,T -F )单 元 ,使其 在强噪声和混响环境下仍得到准确方向矢量估计. 最 后 ,输入到 基于加权最小化无失真响应(w e i g h t ­ ed p o w e r minimization distortionless r e s p o n s e , W P D )优 化 准 则 的 卷 积 波 束 形 成 器 中 进 行 语 音 增 强,使去噪抑制混响效果同时达到最优.与几种不 同的语音增强方法相比,本文算法既消除了与语音 同方向的背景噪声,又消除了不同方向的噪声干 扰 ,得到的增强语音可懂度和清晰度都较高.并且 本研究根据神经网络训练的模型,不需要任何关于 麦克风阵列的先验知识,在噪声环境下有较强的鲁 棒性.
模 ,对双麦克风信号分别进行单通道神经网络初步语音增强,达到全面利用语音非线性特征改善感知度的目的:
其 次 ,提 出 一 种 基 于 自 适 应 掩 模 方 向 矢 量 定 位 法 ,精 确 计 算 语 音 、噪 声 的 空 间 协 方 差 矩 阵 和 方 向 矢 量 ,在带噪和
混响的环境下精确定位目标声源;最 后 ,输入信号到卷积波束形成器中,进一步去噪和抑 制 混 响 .实 验 结果 表
收 稿 日 期 2020-09-01. 作 者 简 介 贾海蓉(1977-),女,教授,E-mail: helenjia722@. 基 金 项 目 国家自然科学基金资助项目(12004275):山西省留学人员科技活动择优资助项目(20200017) ; 山西省回国留学

双传声器近讲语音增强算法的DSP实现

双传声器近讲语音增强算法的DSP实现
3 B lSg a 3 0 件系统简介 . 1 e i 0 硬 a n 基 于安 森 美公 司 提供 的 B lSga3" 台实 时 e i 0平 a n 0
调 用
f nci n c an u t h i0 o c mma d o n
ne ut t rp 通道 0 L r A ̄ WO
F l rn a d i e g n Mi i m Me n q a e ro a d b ev d r m p rp c ie o s e t g a ti n mu a S u r E r r n o s r e f o e s e t s f p cr r m, Me n v o a Op i n c r t S o e o
语音技术
⑥ @ @@ 闶 0 \ 6@ 嗡 ⑥⑥ /
文章编号 :0 2 8 8 {0 1 0 — 0 5 0 1 0 — 6 4 2 1 )7 0 4 — 4
算 双传声器近讲 语音 增强算法 的 D P实现 法实现 ・ S


奎 梁 维谦 ,
( 清华大学 a 微 电子与纳 电子学 系;b . .电子工程 系, 北京 10 8 ) 0 0 4
【 e od】cm u tnlado cn nl i pe nacm n;ad o a i ;i e u liesy K y w rs o pt i a uir seeaa s ;sec ehne et uir m s n n r r n ni ao t y ys h t y k g ta a t t
【 bt c Amn t l et kapi tn, w— i sec ehne eta ot spooe n e i d A s at i i a c s— l plaos atomc peh nacm n l rh i r sdad r le r 】 g o a ci g im p az

双传声器近讲语音增强算法的DSP实现

双传声器近讲语音增强算法的DSP实现

双传声器近讲语音增强算法的DSP实现胡奎;粱维谦【摘要】针对近讲模式,提出了一种可以DSP实现的双传声器语音增强算法,算法在安森美公司的BelaSigna 300 DSP平台上进行了实时实现.介绍了该算法的基本原理、BelaSigna 300 DSP系统的硬件结构、其软件编写方式及移植到DSP系统上后的算法处理流程和移植过程中的关键点分析.在白噪声、音乐噪声与广播噪声3种噪声环境下进行了实验,并从语谱图、MOS、SNR三个角度将该方法与谱减法、维纳滤波、MMSE进行了比较.实验结果表明,该算法对于3种类型的带噪语音,信噪比均可以最多提高20dB,提高后的信噪比在30 dB以上,并能较好地保持目标语音的语音质量.【期刊名称】《电声技术》【年(卷),期】2011(035)007【总页数】5页(P45-48,52)【关键词】计算听觉场景分析;语音增强;掩蔽;耳间强度差;DSP【作者】胡奎;粱维谦【作者单位】清华大学微电子与纳电子学系,北京100084;清华大学电子工程系,北京100084【正文语种】中文【中图分类】TN912;TN641 引言在现实生活中,各种类型的环境噪声无处不在。

如果受到噪声的干扰,语音通信时的话音质量会大打折扣,语音识别器的识别率也可能大大下降。

因此,语音增强一直是语音信号处理方向研究的热点。

常用的单通道语音增强方法有谱减法、维纳滤波法、MMSE法等。

它们仅适用于较为平稳的噪声,如白噪声,对于更为复杂的音乐噪声、广播噪声、冲击噪声则会失效。

计算听觉场景分析(Computational Audi⁃tory Scene Analysis,CASA)方面的研究试图通过模拟人的听觉特性来达到有效去除目标语音中的各类环境噪声[1-3]的目的。

基于CASA的语音增强方法主要是利用基音频率(F0)、语音开始与结束点、耳间强度差(Interaural Intensity Difference,IID)、耳间延时差(Interaural Time Difference,ITD)等特性信息将目标语音直接从背景噪声中分离出来,未对噪声场进行假设和建模。

双通道语音增强的DSP实现

双通道语音增强的DSP实现

双通道语音增强的DSP实现
杨帆;高勇
【期刊名称】《舰船电子工程》
【年(卷),期】2008(028)010
【摘要】双通道语音增强技术在自适应噪声对消系统中有着广泛的应用.在传统的双通道自适应噪声对消系统里,需要一个纯净的参考噪声作为辅助输入,但这在实际应用中很难做到.首先针对基本的自适应噪声对消原理,研究了一种改进的双通道自适应语音增强模型.该模型是一个基于TMS320C6713B芯片的双通道实时数据处理系统,以AD73311为数模转换器件,具有两路独立的A/D、D/A通道,能够实现语音信号的16位数据采集与处理.最后对此系统的DSP硬件设计作了简要介绍,并研究了该系统的软件设计以及算法实现.
【总页数】4页(P104-106,128)
【作者】杨帆;高勇
【作者单位】四川大学电子信息学院,成都,610065;四川大学电子信息学院,成都,610065
【正文语种】中文
【中图分类】TN911.72
【相关文献】
1.基于多频段谱减法的语音增强及其DSP实现 [J], 王贤波;李盛;张缓缓
2.关于语音增强算法技术及其DSP实现的研究 [J], 周伟;彭天伟
3.自适应滤波语音增强算法改进及其DSP实现 [J], 王瑜琳;田学隆;高雪利
4.基于FPGA的双通道语音增强系统设计与实现 [J], 肖佩霖;张岩
5.关于语音增强算法技术及其DSP实现的研究 [J], 周伟;彭天伟
因版权原因,仅展示原文概要,查看原文内容请购买。

语音增强在坦克舱强背景噪声下的DSP实现

语音增强在坦克舱强背景噪声下的DSP实现

只将D S P 的I / O电源 和 运放 电路 需 要 的正 负 电源 放
在 第五层 电源层 上 .而把 D S P 核心 电源 放在 第 四层
内层布 线层 上 . 主要 目的是在 保证 电源 去耦效 果 的


前提 下 . 尽 可能 减少层 数 。由于D S P 的核心 电源 只在 D S P 芯 片 内部 使用 , 并 没 有引 出相应 的外 部 走线 , 因
维普资讯
维普资讯
相邻 噪声信 号 幅度谱 的样 本平 均值 作 为功率 谱 的 ( ∞) 估计值 。图2 是谱减 原 理框 图 。
2 . 1 D S P系统 的硬 件设计
出 于 可 靠 性 考 虑 .采 用 了 高 密 度 球 栅 阵 列
T MS 3 2 0 c 6 7 1 3 b D S P 芯 片 的 核 心 电 流 典 型 值 为
改进 的谱减法 公式 如下 :

5 6 0 m A, 外设 电流 典型值 为7 5 mA。 一般 来说 , 选择 的 电 源最 大 输 出 电流 至 少要 达 到典 型 电流 的两倍 以
? 雾 ? 产品 开发与设计墨 。 0 、 _

最 理 想 的 去耦 方 式 是 在 芯 片 的每 一 对 电源 与 地 管脚 之 间接 上一 个 去耦 电容 , 但 是 受芯 片 封装 的 面积限制 . 这是 做不 到 的。因此 , 在 空间允 许 的情 况
续 的语音 信 号 。 由于 系 统有 多 个 I / O 端 口 ,如 采用 D S P 直 接处 理 每个 中断 , 则会 占用 很 多系统 资源 , 导
( B G A)的 组件 设计 ,普 通 的双 面板 已不 能满 足需

基于DSP的手机话音增强系统的研究与实现的开题报告

基于DSP的手机话音增强系统的研究与实现的开题报告

基于DSP的手机话音增强系统的研究与实现的开题报告一、课题研究背景及意义近年来,由于手机成为人们日常生活不可缺少的设备之一,因此手机话音质量的要求也日益提高。

但是受到通话环境、语音麦克风质量等多种因素的影响,手机通话的声音质量经常存在一些问题,例如低音量、杂音、回音等。

针对这些问题,可以采用数字信号处理(DSP)技术来提高手机通话的质量。

当前,DSP技术已广泛应用于手机话音增强系统中,可以实现自动增益控制、噪声消除、回音抑制等功能。

基于DSP的手机话音增强系统可以有效地提高通话质量,提高用户体验。

因此,本文计划设计并实现一套基于DSP的手机话音增强系统,研究其实现技术和性能,为改善手机通话质量,提高用户体验提供新的解决思路和方法。

二、研究内容及研究方向本文主要研究内容如下:1. DSP技术在手机话音增强系统中的应用原理和方法研究。

2. 基于MATLAB/Simulink的仿真研究,设计合适的DSP算法,验证系统增强效果。

3. 采用FPGA/ARM处理器实现系统硬件,验证实现效果。

4. 性能评估和测试,通过对DSP系统实际应用的评估和测试,评价系统的性能和性价比。

研究方向:基于DSP的手机话音增强系统设计、DSP算法优化、MATLAB/Simulink仿真、FPGA/ARM处理器实现。

三、研究计划及进度安排研究计划:1. 阶段一:阅读文献,调研现有的DSP技术在手机话音增强系统中的应用情况。

时间:2周。

2. 阶段二:基于MATLAB/Simulink进行仿真研究,设计合适的DSP 算法,验证系统增强效果。

时间:4周。

3. 阶段三:采用FPGA/ARM处理器实现系统硬件,验证实现效果。

时间:8周。

4. 阶段四:进行性能评估和测试,评价系统的性能和性价比。

时间:2周。

总计划完成时间:16周。

四、研究所需条件及保障措施硬件设备:个人电脑、MATLAB/Simulink、FPGA/ARM开发板。

软件工具:MATLAB/Simulink、Keil软件、Quartus II软件等。

双通道语音增强的DSP实现

双通道语音增强的DSP实现

总第172期2008年第10期舰船电子工程Ship Electronic Engineering Vol.28No.10104 双通道语音增强的DSP 实现3杨 帆 高 勇(四川大学电子信息学院 成都 610065)摘 要 双通道语音增强技术在自适应噪声对消系统中有着广泛的应用。

在传统的双通道自适应噪声对消系统里,需要一个纯净的参考噪声作为辅助输入,但这在实际应用中很难做到。

首先针对基本的自适应噪声对消原理,研究了一种改进的双通道自适应语音增强模型。

该模型是一个基于TMS320C6713B 芯片的双通道实时数据处理系统,以AD73311为数模转换器件,具有两路独立的A/D 、D/A 通道,能够实现语音信号的16位数据采集与处理。

最后对此系统的DSP 硬件设计作了简要介绍,并研究了该系统的软件设计以及算法实现。

关键词 双通道;自适应噪声对消;DSP 中图分类号 TN911.72DS P Implement ation of Two Cha nnel Speech Enha ncementYang Fa n Gao Yong(College of Electronics and Information Engineering ,Sichuan University ,Chengdu 610065)Abs t rac t The two channel speech enhancement technology is widely used in adaptive noise cancellation (ANC )systems.Pure reference noise is demanded as auxiliary input in traditional two channel ANC systems ,but it is hard to implement in ac 2tual environment.Based on the basic principle of ANC ,this paper presents a modified model of two channel adaptive speech enhancement.This model is a two channel real time data processing system based on TMS320C6713B ,with AD73311as its converting device.It includes two separate A/D ,D/A channels ,capable of implementing 162bit data acquisition and process 2ing.Then the DSP hardware system design is briefly introduced ,the system software design and the corresponding algorithm implementation are also investigated.Ke y w ords two channel ,adaptive noise cancellation ,DSP Class Nu m ber TN911.721 引言在现代舰船的工作环境里,无线语音通信不可避免的会受到各种环境噪声的影响,如舰船发动机、风机等机械噪声及海浪、风雨雷电等气象噪声。

语音增强技术在DSP芯片中的实现

语音增强技术在DSP芯片中的实现

4 结 束 语
该系统有效 的降低了背景噪声 提高 了信噪 比, 但还存在如何更好地改 善降噪量与 语音可懂度之 间

的矛盾

( 接第 6 上 7页 )
查、 代码和 数 值有 效 范 围 的检 查、 录 总 数 的检 查 记
等。文件检查包括检查 文件长度、 检查文 件的标识 、
制首 先要求输入 的数据 应经过 必 要 的授 权, 并经有 关 的 内部控制部 门检查 ; 其次 , 应采用各种技术 手段
检 查文件是否被感染病 毒等。
() 5 数据输 出控 制 。数据输 出控 制是 企业 为 了 保证输出信息的准确 、 可靠而采取 的各种控制措 施。 输 出数据控制一般应检查 输出数据是否与输入数据
相 一 致 , 出 数据 是 否 完 整 , 出数 据 是 否 能 满 足 使 输 输
对输 入数据的准确性进行校验 , 总数控 制校验 、 如 平
衡校验 、 数据 类型校验 、 重复输 入校验等 。 () 3 数据通 讯控 制 。数据通 讯控 制是 企业 为了 防止 数据在传输过程 中发 生错误 、 失 、 丢 泄密等 事故 的发生而采取的 内部控制措施 。企业应该采 用各 种 技 术手段 以保证数据 在传输过 程中的准确 、 安全 、 可 靠 。如将 大量的经 济业 务划分 成 小批 量 传输, 数据 传输 时应顺序编 码, 传输时要有发送和接 收的标识 。 收到被 传输 的数据 时要 有肯 定确认 的信 息反馈 , 每 批 数据 传输时要有 时间 、 日期记号等等 。 () 4 数据 处理控 制 。数据 处理控 制是 指 对计 算 机 会计 系统进行数据 处理 的有效性和可靠性进 行的 控制 :数据处理控 制分 为有 效性 控制 和 文件控 制 :

基于DSP的语音增强系统设计与实现的开题报告

基于DSP的语音增强系统设计与实现的开题报告

基于DSP的语音增强系统设计与实现的开题报告一、选题背景语音增强技术是指在语音信号中过滤掉杂音、回声、失真等因素,从而使语音信号更加清晰、稳定,提高语音信号的质量和可懂度的一种信号处理技术。

这项技术在语音通信、语音控制、语音识别等领域具有广泛的应用。

目前,DSP技术已经广泛应用于语音增强系统的设计与实现中。

与传统的滤波器技术相比,DSP技术具有更高的运算速度和更好的处理效果,能够更加精确地处理语音信号。

因此,基于DSP的语音增强系统已经得到了广泛的关注和研究。

二、研究内容和目的本研究旨在设计并实现一种基于DSP的语音增强系统,通过对语音信号进行滤波、降噪、增益等处理,提高语音信号的质量。

具体的研究内容包括以下几个方面:1. 语音信号的采集与处理:使用麦克风采集语音信号,并利用DSP 芯片处理语音信号,进行滤波、降噪等处理。

2. 语音信号的特征提取:通过对语音信号进行特征提取,提取出语音信号中的关键信息。

3. 语音增强算法的设计与实现:设计并实现一种基于DSP的语音增强算法,对语音信号进行增益、降噪等处理,使语音信号更加清晰、稳定。

4. 系统性能的评估:通过实验对系统的性能进行评估,包括语音信号的质量、增强效果等指标。

本研究旨在通过对基于DSP的语音增强系统的设计与实现,提高语音信号的质量和可懂度,为语音通信、语音控制、语音识别等领域的应用提供有力的支持。

三、研究方法和步骤本研究采用以下方法进行:1. 调研相关文献,了解基于DSP的语音增强系统的现状及发展趋势。

2. 设计基于DSP的语音增强系统,包括语音信号采集和处理、特征提取、语音增强算法设计等模块。

3. 实现基于DSP的语音增强系统并进行性能测试,评估系统的性能和增强效果。

4. 分析测试结果,提出改进策略,进一步完善系统的设计。

四、预期成果本研究预期的成果包括以下几个方面:1. 设计并实现一种基于DSP的语音增强系统,该系统能够针对不同的语音信号,进行滤波、降噪、增益等处理,提高语音信号的质量和可懂度。

iLBC语音增强模块算法在DSP上的实现与优化的开题报告

iLBC语音增强模块算法在DSP上的实现与优化的开题报告

iLBC语音增强模块算法在DSP上的实现与优化的开题报告一、课题研究背景及意义近年来,随着语音通信技术的不断发展,语音增强技术已经广泛应用于各个领域。

语音增强技术能够有效提高语音质量,降低环境噪音对于语音信号的影响,使得语音识别、语音合成和语音通信等领域的应用效果更加明显。

iLBC(internet Low Bitrate Codec)编码器是一种用于VoIP(Voice over Internet Protocol)应用的语音编码器,已广泛应用于语音通信领域。

本课题研究的目的是将iLBC语音增强模块算法实现在DSP上,并对其进行优化,以提高其处理能力和运行效率,以适应不同的语音通信场景需求。

该研究具有实际应用的意义,可为人们提供更高质量的语音通信服务,推动语音通信技术的发展。

二、研究内容与技术路线本课题研究的主要内容是将iLBC语音增强模块算法实现在DSP上,并对其进行优化,具体包括以下几个方面的研究内容:1.对iLBC语音增强模块算法进行分析和研究,深入了解其处理过程和原理。

2.进行DSP硬件平台的选择和设计,根据处理需求和算法特点选择合适的DSP硬件平台,进行系统设计和实现。

3.进行软件的设计和实现,根据算法特点和硬件平台的特性,设计优化算法,提高其处理能力和性能。

4.进行实验验证和评估,对实现的系统进行测试和评估,评估算法的性能和可用性。

该研究的技术路线如下:三、研究现状及存在问题目前,语音增强技术已经广泛应用于各个领域,相关研究也十分活跃。

在DSP平台上,也存在大量的语音增强算法的实现和优化研究。

例如,有学者对LPC(Linear Predictive Coding)算法在DSP平台上进行了实现和优化,提高了其性能和处理能力。

但是,在iLBC语音增强算法的实现和优化方面,还存在一些问题和挑战。

例如,iLBC语音增强算法具有较高的计算复杂度和较高的延迟,需要在DSP平台上进行精细优化才能达到较好的处理效果。

基于DSP的多码率多通道语音编解码算法G729I研究与实现

基于DSP的多码率多通道语音编解码算法G729I研究与实现

1引言随着多媒体信息技术和网络技术的高速发展 数字语音压缩技术的应用领域越来越广泛 为了在保证语音质量的前提下尽可能降低编解码率 以便于在有限的传输带宽内让出更多的信道来传输图像\文档\计算机文件和其它数据流 国际电信联盟0ITU-T 0于1996年3月推出了G.729建议的采用共轭结构代数码激励线性预测0CS-ACELP 0语音编码方案0这种方案将波形编码与参数编码结合起来 兼顾了传输速度与语音质量的要求 在4~16Kb /S 传输速率上能达到高质量的语音 且在8Kb /S 码率下合成音质不低于32Kb /SADPCM 的水平0不过G.729方案虽然能在中低速率上达到较好的合成语音质量 但计算复杂度较高 数据存储量大 这使得在理论上性能良好的语音编码方案在实际应用中还存在许多困难0因此 基于多通道的语音编解码的实时实现一直是有待研究的课题02G.729编解码算法原理ITU-T 描述的8kb /S 速率声码器协议G.729 所选帧长为10mS (80个抽样0 每一帧分成等长的两个子帧0算法采用分析合成法 编码器对输入的语音信号先进行预处理 然后进行10阶LPC 分析 将得到的LPC 参数转化为LSP 参数进行矢量量化9再对编码端得到的激励信号通过综合滤波器后得到合成语音信号 将合成语音信号与原始语音相减 得到残差信号9对残差信号进行感觉加权 然后进行基音分析\码本搜索 并分别求得自适应码本增益和固定码本增益9最后对各个参数进行编码0编码器端需要传输的参数有 LSP 参数\自适应码本标志及其增益\固定码本标志\固定码本标志及其增益0解码器则先对比特流分别进行解码 把解码得到的自适应和固定码本矢量分别乘以各自的增益后相加 得到激励信号 然后经过综合滤波器得到合成的语音信号 最后再经过后处理 增强语音0图1为G.729CS-ACELP 解码器算法的原理框图0图1G.729CS-ACELP 解码原理框图基于DSP 的多码率多通道语音编解码算法G.729I 研究与实现曹雪松蒋征胡瑞敏(武汉大学多媒体网络通信工程湖北省重点实验室1武汉430079)E-maiI *********************摘要在多媒体处理芯片VFAST 开发平台上1快速实现了G.729I 语音解码器O 首先1根据G.729I 多码率编解码算法的要求1介绍了VFAST 适合音视频开发的特点及其开发环境;然后1将解码算法移植到VFAST 平台并进行大量的优化1给出针对不同模块的优化策略O 由实验结果可知1使用论文给出的优化算法1可在VFAST 上快速实时实现G.729I 解码器1在单片VFAST 上可以全双工实时处理13路语音信号1满足语音实时通信的要求O 关键词G.729I 语音解码器VFAST VP6SIMD文章编号1002-8331-(2005)13-0081-04文献标识码A中图分类号TP311Research &Implementation of Multi-Rate and Multi-channelSpeech Decoder Algorithm G.729I Based on DSPcao Xuesong Jiang Zheng Hu Ruimin(The Key Lab of MuItimedia &Network Communication EngineeringWuhan UniverSity Wuhan 4300790AbstractA reaI-time G.729I Speech decoder iS propoSed baSed on media proceSSor VFAST.FirStIy according to thereguirement of G.729I decoder aIgorithmS the propertieS of VFAST are introduced.Then to repIant and optimize program the optimization methodS for reIevant moduIeS are preSented.FinaIIy the experimentaI reSuItS Show that the reaI-time G.729I decoder can be reaIized on VFAST uSing propoSed aIgorithmS and the number of channeIS provided by one chip of VFAST can reach aS high aS 13 and entireIy fuIfiI the demand of reaI-time voice communicationS.Keywords G.729I Speech decoding VFAST VP6 SIMD基金项目!国家自然科学基金(编号 602720970作者简介!曹雪松 硕士研究生 主要研究方向 多媒体信息处理0蒋征(1979-0 硕士研究生 主要研究方向 多媒体信息处理0胡瑞敏 教授博士G.729A是G.729的简化版本9与G.729相比9G.729A在感觉加权\开环基音分析\闭环基音搜索\固定码本搜索和后处理中进行了简化处理0在保持G.729码流兼容的同时降低复杂度到50%9同时也能保持良好的语音质量0G.729B是G.729的变速率版本9提供了静音压缩框架9它主要是通过活动语音检测VAD技术对语音和噪声进行分类9采用非连续传输DTX算法和舒适噪声填充CNG算法对无声信号进行处理9从而达到降低平均速率的目的9G.729B的平均速率为4kb/s0G.729D是G.729的低速率扩展版本9G.729D采用小容量的自适应码本9在码本结构\增益量化\第二子帧基音延时\后处理等方面进行了改进9算法速率降为6.4kb/s9语音质量下降很少0G.729E是G.729的高速率扩展版本9G.729E采用了前向/后向LP分析混合结构9在前向模式下采用了较大容量的自适应码本9在后滤波\感觉加权\码本结构等也进行了改进9算法速率为11.Skb/s0 G.729I则是支持以上三种码率及静音帧的统一的语音编解码方案03Leadtek VFAST芯片开发环境3.1VFAST芯片的结构特点VFAST是丽台公司为实现音视频的实时通信而设计的一种数字信号处理芯片0VFAST为上下位机结构的DSP0主要由七大模块组成9有VP Vision Processor处理器9MIPS-X39视频接口9哈夫曼处理器和总线控制器等0片内有32Mbyte闪存FLASH9SMbyte的DRAM和1Mbyte的SRAM0中央处理器MIPS-X3是一个32位的RISC Reduced In-struction Set Computer处理器9起到了整个VFAST的CPU的作用9主频为S0MHZ0MIPS往往用来实现高层应用控制的算法9并负责系统的调度0从处理器VP是计算核心部件9是一个高速并行的计算部件9用于处理程序中运算相对集中数据处理的部分0VP采用的是SIMD Singie Instruction Muitipie Data结构9具有强大的运算能力9专为音视频编解码算法而设计0VP6是VP的一个型号9由DATAPATH和RISC9两个内置内存DP/DM 2.4Kbyte 9Funnei Biock9象素处理单元PPU9算术逻辑单元ALU 9寄存器RF94个高精度累加器MAC9ROM/RAM等单元组成0VP的数据格式为64位9分四个bank9每个bank为16bit0在一个cycie内可以同时执行三条不同类型的指令9一条指令可以同时操作4个16bit的数据的加9减9乘9比较9乘加等操作9通过DMA通道与DRAM双向通信9能够进行高效的数据传输0VP服从MIPS的调度9自己的控制功能较弱03.2VFAST芯片的存储系统模型该项目的开发平台为丽台可视电话VFAST板9VFAST存储器有五种FLASH9SRAM9DRAM9DP/DM和ROM/RAM0前三组为MIPS存储器9FLASH相当于PC机的硬盘9SRAM为主存9相当于PC机的内存9DRAM为DMA存储器0后两组为VP6存储器9其中DP/DM为数据存储器9ROM/RAM为程序存储器0VFAST SDK具有三级存储器结构9其存储系统模型如下图2所示0VFAST各存储单元之间有五条数据通道9如图2所示箭头9两条一般数据通道9三条DMA通道0!FLASH-SRAM9一般数据通道9"SRAM-DP/DM9一般数据通道9# SRAM-DRAM9DMA通道9$SRAM-DP/DM9DMA通道9% DRAM-RAM9DMA通道0图2VFAST存储系统模型示意图4G.729I解码器在VFAST上实现及优化4.1系统总体设计论文主要介绍了在VFAST平台上实现多通道的语音实时编解码器的方案0在这个系统的开发工作中9笔者主要负责实现G.729I的解码部分0为了使系统具有根据不同语音信道传输模式对不同音频编解码器动态调用的能力9作者将G.729I 解码器做成了独立的静态库形式0并将其注册到VFAST系统的语音解码选取模式中9使系统能根据信道能力协商的结果做出正确的模式选择0同时给G.729I解码库设定五个外部接口函数9按执行顺序依次是系统初始化9解码初始化9解码一帧9解码析构9系统析构0为使多路编解码器之间不相互干扰并节省存储器空间9笔者定义了G.729I系统9编码和解码三个结构空间0系统结构空间定义并封装了所有全局的常数成员及编解码会话句柄9编码和解码结构空间则对全局变量和私有常数成员进行定义和封装在文中只涉及到解码部分 0在系统初始化时9系统结构空间对公用常数表分配空间并赋常数值9解码初始化则对全局变量分配空间并赋初值9同时建立自身常数表与系统结构空间常数表之间的映射不必另分配9多个解码器可公用一个常数表空间 0程序运行结束9析构的顺序是解码析构释放全局变量空间9后系统析构释放常数表空间04.2程序性能的优化由于VFAST开发平台支持C/C++编程语言的直接移植9因此在移植过程中要根据VP6的专用操作指令对代码进行转换9使程序的性能达到最优0由上面的讨论可知9VFAST中VP6的专用操作指令采用SIMD技术9特别适用于音视频编解码的运算0作者将G.729I的标准C函数转换为VP6汇编模块9支持6.4K\SK\11.SK三种码率及静音帧0为提高执行效率9加载至VFAST的程序基本上都是VP6汇编代码9少量的C语言只是起到MIPS对VP6程序模块的调度9解码器的程序中有很多函数需要多级循环嵌套和乘法操作9因此对程序代码中的循环操作进行优化是非常必要的0通过对运算过程的改进和对指令流程的重排9使用循环展开LU9ioop unroiiing的方法9通过增加循环体的大小来减少循环判决树的中断0LU算法更有效地利用了DSP地寄存器9最小化调用/存储的指令数目9同时还能最小化循环过程中内存接入的次数0在写VP6汇编程序过程中9也要注重效率9如在双周期指令后插入单周期指令9由于VP6支持64位指令字长9可以在一行代码上并行执行3条指令9同时在执行乘加指令MAC时9应尽量使4个bank数都有效9减少冗余操作0最后9还可以使用寄存器变量的引入9内联函数的设定和冗余操作的简化等技术来优化程序流程9从而充分降低运算量9提高程序的运行速度x0(-9>,x0(-8>,x0(-7>,...x0(10> x0(-8>,x0(-7>,x0(-6>,...x0(11> x0(-7>,x0(-6>,x0(-5>,...x0(12> x0(-6>,x0(-5>,x0(-4>,...x0(13>x0(-5>,x0(-4>,x0(-3>,...x0(14>.........x0(30>,x0(31>,x0(32>,...x0(49>*c1(27>c1(24>...c1(0>c2(0>c2(3>c2(6>...c2(27>=s(0>s(1>s(2>s(3>s(4>.........s(40>优化前指令周优化后指令周优化加速比期数(cycie/帧>期数(cycie/帧>优化后/优化前合成滤波Syn_fiite10857167315.41%求自适应码本Pred_it_3249261703 6.83%LSP->LPC变换Int_gipc12093357 2.95%静音帧解码Dec_cng757761088814.37%计算固定码本Decod_ACELP计算自适应码本和固定码本的增益Dec_gaine解码LSP系数D_ispe318937011.60%6.4K相位插值PhDisp8357445 5.32%G.729I解码模块115244138.28%96635636.85%4.3G729I解码器算法的优化笔者在ITU-T公布的G.729I语言定点代码基础上,利用Visuai C++的profiie工具,对G729I解码主要模块占用的运行时间作了测试,其中,自适应码本搜索及合成滤波约占解码算法运算量的70%,LSP->LPC变换复杂度也较高O所以,高效执行这些模块,是实现多路语音实时编解码的关键,应该充分利用VP6的特点,让其能够高效运行O4.3.1求自适应码本激励模块的VP并行实现及优化有的程序本身具备SIMD的特性,如数据的循环累加操作,即具有较好的数据无关性和对称性,无需修改或只进行简单修改即可变换成SIMD的形式O但有的模块并不具备明显的SIMD并行特性,需要经过相应的数据调整和重新排列才可满足SIMD并行的条件O调整和重新排列的代价不可过高,否则会抵消SIMD的加速效果而得不偿失O下例是G.729I中长时预测求自适应码本激励函数的核心部分for(=0<40++>{x1=x0++x2=x0c1=&inter_3i[frac1c2=&inter_3i[(3-frac>1s=0for(i=0,I=0i<10i++,I+=3>{s=L_mac(s,x1[-i1,c1[I1>s=L_mac(s,x2[i1,c2[I1>}}程序的主体是一个两级的for循环,表面上看,两级循环均不具备SIMD的特性O但实际上x1和x2,c1和c2具有很强的相关性,笔者避开程序的流程,使用LU算法示意如图3O展开时,x1和x2统一用x0表示O图中可看出,将c1和c2重新排列后可以实现SIMD并行O图3多级循环展开示意图!i=0"1"2"3##$首先,在整个程序中frac值不变,所以c1和c2相当于常数组,为此在两级循环之前按图3中的顺序(每隔三个地址取出后,再调整顺序连续存放>,将c1和c2数组存入寄存器r0~ r4中(一个寄存器存放4个16bit数,20个数则需要5个寄存器存放>,并保持不变O这样可以减少39次对c1和c2数组的寻址,大大节省了地址寻址的开销O其次,从x0[-91连续读取x0 [-91~x0[101存入r5~r9,取出后x0++,对应于不同的循环次数,依次从x0[-81x0[-71x0[-61开始读取,r5~r9的值相应改变O运用VP6专用操作指令MAC快速计算,使用指令MAC一次可以同时计算4次16bit数的乘法运算,4次加法和4次移位操作O只需5次MAC乘加即可完成对所有r0*r5+r1*r6+...+ r4*r9的求和,重复上一步40次结束O经测试,优化加速比达到6.83%,大大降低了指令周期数,充分运用了VP6的SIMD并行特性,使程序的执行效率大为提高O4.3.2LSP->LPC模块的VP并行算法及优化相对而言,不同的程序流程要灵活使用不同的策略O上例是在VP6微程序一级的并行O但有时模块中内层循环的数据前后有较强的相关性,下一次的循环要用到上一次的结果,不能四路并行,这时,就要从宏观上使用SIMD,即在MIPS调度VP6的层面的并行O主处理器给定相应的多路并行数据入口,协处理器整个运行过程都是多路SIMD并行计算O这是一种全局意义上SIMD特性OG.729I语音解码作线谱对系数转换为线性预测系数时,对两个子帧是先后执行的O针对本帧语音计算得到的量化与非量化的LP系数用于子帧2,子帧1的LP系数则由本帧与上一帧的差值求得OLSP的差值Subframe1gi(1>=0.5gi(preuious>+0.5gi(current>i=1,...,10Subframe2gi(2>=gi(current>i=1,...,10由g i计算多项式F1(z>和F2(z>的系数f1(i>,f2(i>Of1(0>=1,f1(-1>=0O f2(i>同理O计算对应于F!1(z>,F!2(z>的f1(i>,f2(i>Of1!(i>=f1(i>+f1(i-1>i=1,...,5f2!(i>=f2(i>+f2(i-1>i=1,...,5由于a(z>=(F!1(z>+F!2(z>>/2,得到LPC系数a iai=0.5f!1(i>+0.5f!2(i>i=1,...,50.5f!1(11-i>-0.5f!2(11-i>i=6,...,10由以上算法可知,在程序实现时,主函数两次调用Lsp_az (>函数,而每次执行Lsp_az(>函数又调用两次Get_lsp_pol(>函数,程序具有明显的相似性和对称性,经测试整段程序运算量最大的地方是Get_lsp_pol(>函数,而Get_lsp_pol(>函数内的两层循环又不易打开,故在此函数的内部是不能SIMD并行的O但两次调用Lsp_az(>函数之间四次调用Get_lsp_pol(>函数之间都没有前后的数据相关性,VP6的指令可以同时进行四路16bit数的系列操作,所以可将程序的流程进行合并,用VP6程序仅执行一遍Get_lsp_pol(>函数,则可完成整个四路LPC 系数的求解O从而使程序的效率至少提高了四倍O同时在数据寻址上也得到了简化,优化加速比为2.95%O4.4优化前后性能比较表1G.729I解码器VP6汇编模块优化前后对照表5测试与结论将G729I各码率下的所有功能模块用高效并行的VP程数据帧长度 byte 最坏 ms最好 ms平均 ms最大Ethelnet 帧 1518 3.747 3.684 3.721最小Ethelnet 帧 640.2190.1880.20764~1518区间内的均匀分布3.2730.8321.929图6RTL-Ethelnet 的时间行为示意图T x_max =Max{T x [k ][i ]\1!k !n i "N }则有:T nd_max =Max{T nd [k ][i ]\1!k !n i "N }!T p_max +MAX{T x_max T idle }=T p_max +T x_max其中 T p_max 为中断处理和执行传输控制算法所需的最长时间 该值可以在具体的节点上实测得到;T x_max 为节点进行数据帧传输所需最长时间 即传输最长Ethelnet 帧 根据IEEE802.3规定 最长Ethelnet 帧为1518字节 所需时间 预设介质空闲时间T idle 通常远远小于该值;T nd_max 为令牌在所有节点中的最大节点延迟O 这样可以得到最坏条件下的令牌周转时间:TRT max !n>T nd_max最坏条件下的令牌周转时间TRT max 即为节点实时发送队列中队首数据帧在获得发送权之前所需等待的最长时间RTL-Ethelnet 可以确保至多每隔TRT max 时间 节点即可获得最大1518字节的传输带宽 这种确定性的机制为在各个节点上采用实时调度算法调度实时数据帧的传输和进行可调度性分析提供了实施基础O为了对RTL-Ethelnet 的实时性能进行测试 搭建了由3台采用RTL-Ethelnet 方案的节点组成的实时Ethelnet 网段 节点配置为Pentium III 800MHZ 采用3COM 10Mbps EthelnetNIC 设备O 测试对象为节点在各种流量条件下的令牌周转时间O 作者在各个节点中设置了专门的实时任务负责产生数据帧 并保证各个节点的发送队列在测试时间内始终保持非空O表2为系统在三种设定情景中各自运行30分钟后产生的测试结果O表2测试结果5结语RTL-Ethelnet 为RT-Linux 下不同节点中的实时任务提供了一种进行实时确定性网络通信的途径O 该方案对原Linux 内核中的上层协议和应用而言 是完全透明的 它们不需进行任何改动即可在RTL-Ethelnet 下正常工作O 对应用RTL-Ethelnet 方案的目标系统的测试表明 该方案能够较好地保证通信的实时性O RTL-Ethelnet 目前仍处于完善阶段 基于虚拟令牌的传输控制子层的容错机制是下一步工作的重点O 收稿日期:2005年3月参考文献1.balabanov M Yodaiken V.ReaI-Time Linux[J].Linux JoulnaI 1996; 32.C M Klishna Kang G Shin.ReaI Time Systems[M].McGlaw-HiII ISbN 7-302-08808-X 20013.W Richald Stevens.TCP /IP IIIustlated[M].voIume 1-The plotocoIs Addison-WesIey 19944.IEEE 802.3standald[S].20025.Kyung Chang Lee Suk Lee.Pelfolmance evaIuation of switched Ethel-net fol leaI-time industly communications[J].Computel Standalds &Intelface 2002; 24 :411~4236.Rubini A Colbet J.Linux Device Dlivels[M].O'ReiIIy ISSN 0-59600-008-1 20017.ANSI /IEEE Standald 802.4.Token-passing bus access method and physicaI Iayel specifications[S].19858.MaIcoIm N Zhao W.The timed token plotocoI fol leaI-time comm.unication[J].IEEE Computels 1994;27 1 :35~419.MaIcoIm N Zhao W.Hald leaI-time comm.unication in muIti-access netwolks[J].JoulnaI of ReaI-Time Systems 1995;8 1 :35~77上接26页 解码时间 ms6.4kbps 8kbps 11.8kbps 6600 测试序列 6366246409980 自然语音772774780语音数据长度 ms序实现 其余的调度部分在MIPS 上完成 正确性方面通过了ITU-T 所有测试序列 效率测试数据如表2O表2三种码率下解码总时间对照表主要模块运行的总时间占解码总时间为70% 整个解码流程中还有其它衔接调度函数 及解码特征参数模块bits 2prm_ld 8c 保留C 函数 O 用系统提供的time_msec 函数 测出998帧解码总时间占语音长度的百分比为7.76% 约1:13O 以上数据得出如下结论:一是灵活地采用并行算法和优化策略 可以使VP 硬件的性能得以充分体现O 二是经优化后单片VFAST 可以同时解码十三路语音信号 能够实现高效的并行通信O 收稿日期:2004年8月参考文献1.杨行峻 迟惠生等.语音信号数字处理[M].电子工业出版社 19952.王炳锡.语音编码[M].西安电子科技大学出版社 20023.ITU-T Recommendation G.729.Coding of speech at 8kbit /s using Conjugate-Stluctule AIgeblaic-Code-Excited Lineal-Plediction CS-ACELP [S].1996-034.VFAST AlchitectulaI Refelence ManuaI.Leadtek 20015.VP6Miclocode Ploglammel's ManuaI.Leadtek 20016.黄永峰.因特网语音通信技术及其应用[M].人民邮电出版社 20027.林进 张兆庆 祝明发.基于SIMD 机器的优化数据传输的并行循环分割[J].计算机学报 1998; 7。

一种基于DSP的语音增强器的设计与实现

一种基于DSP的语音增强器的设计与实现

一种基于DSP的语音增强器的设计与实现
陈健;韩少华;陈红梅;傅丰林
【期刊名称】《电声技术》
【年(卷),期】2004(000)002
【摘要】提出了一种应用DSP实现语音增强的自适应数字降噪系统,采用改进的谱减法,通过两个可调参数的选择,较好地做到了降噪与提高语音可懂度之间的折衷,并指出为得到较好的降噪效果在实时实现时要注意的问题.实验表明此方法可有效地降低背景噪声,提高信噪比.
【总页数】3页(P34-36)
【作者】陈健;韩少华;陈红梅;傅丰林
【作者单位】西安电子科技大学,通信工程学院,陕西,西安,710071;西安电子科技大学,通信工程学院,陕西,西安,710071;西安电子科技大学,通信工程学院,陕西,西安,710071;西安电子科技大学,通信工程学院,陕西,西安,710071
【正文语种】中文
【中图分类】TN912.35
【相关文献】
1.一种基于DSP的变频器的设计与实现 [J], 苏日建;郭功兵
2.一种基于DSP的有源电力滤波器谐波提取方案的设计与实现 [J], 朱朝文;袁海文;郭鑫;弭寒光
3.一种基于自适应滤波的语音增强算法的DSP实现 [J], 曹晓琳;吴平;张素莉;丁铁夫
4.一种改进的基于NDK的DSP服务器端程序设计与实现 [J], 王星宇;丁兴军
5.一种基于DSP Builder的软件无线电调制器的设计与实现 [J], 孙旭;李哲英;钮文良
因版权原因,仅展示原文概要,查看原文内容请购买。

定点DSP上双通道G.726语音编解码器

定点DSP上双通道G.726语音编解码器

定点DSP上双通道G.726语音编解码器
顾益芳;金伟正;辛庆勋
【期刊名称】《电子测量技术》
【年(卷),期】2005(0)4
【摘要】文中介绍双通道G.726语音编解码器在定点数字信号处理器(DSP)上的实现。

并分别讲述系统的硬件结构和软件流程,给出该系统的试验结果。

【总页数】2页(P38-38)
【关键词】语音编码;实时实现;定点DSP;语音编解码器;双通道;数字信号处理器(DSP);软件流程;硬件结构;系统
【作者】顾益芳;金伟正;辛庆勋
【作者单位】武汉大学
【正文语种】中文
【中图分类】TN912.3;TP335.1
【相关文献】
1.定点DSP实现ITU-T G.726语音编解码标准 [J], 王海平;刘琚
2.LPC-10e语音编解码器定点DSP实现 [J], 艾浩军;胡瑞敏;刘赟;李德仁
3.基于定点DSP的AMR语音编解码器的实时实现 [J], 黄桃;李小文;刘琳
4.ITU G.726语音编码器在DSP上的实现 [J], 房德新;魏建强
5.ITU G.726语音编码器在DSP上的实现 [J], 房德新;魏建强
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总第172期2008年第10期舰船电子工程Ship Electronic Engineering Vol.28No.10104 双通道语音增强的DSP 实现3杨 帆 高 勇(四川大学电子信息学院 成都 610065)摘 要 双通道语音增强技术在自适应噪声对消系统中有着广泛的应用。

在传统的双通道自适应噪声对消系统里,需要一个纯净的参考噪声作为辅助输入,但这在实际应用中很难做到。

首先针对基本的自适应噪声对消原理,研究了一种改进的双通道自适应语音增强模型。

该模型是一个基于TMS320C6713B 芯片的双通道实时数据处理系统,以AD73311为数模转换器件,具有两路独立的A/D 、D/A 通道,能够实现语音信号的16位数据采集与处理。

最后对此系统的DSP 硬件设计作了简要介绍,并研究了该系统的软件设计以及算法实现。

关键词 双通道;自适应噪声对消;DSP 中图分类号 TN911.72DS P Implement ation of Two Cha nnel Speech Enha ncementYang Fa n Gao Yong(College of Electronics and Information Engineering ,Sichuan University ,Chengdu 610065)Abs t rac t The two channel speech enhancement technology is widely used in adaptive noise cancellation (ANC )systems.Pure reference noise is demanded as auxiliary input in traditional two channel ANC systems ,but it is hard to implement in ac 2tual environment.Based on the basic principle of ANC ,this paper presents a modified model of two channel adaptive speech enhancement.This model is a two channel real time data processing system based on TMS320C6713B ,with AD73311as its converting device.It includes two separate A/D ,D/A channels ,capable of implementing 162bit data acquisition and process 2ing.Then the DSP hardware system design is briefly introduced ,the system software design and the corresponding algorithm implementation are also investigated.Ke y w ords two channel ,adaptive noise cancellation ,DSP Class Nu m ber TN911.721 引言在现代舰船的工作环境里,无线语音通信不可避免的会受到各种环境噪声的影响,如舰船发动机、风机等机械噪声及海浪、风雨雷电等气象噪声。

这些环境噪声在发送端与通信者的话音一起进入发端麦克风,会极大降低话音通信的质量,严重时会导致接收端无法收听或理解错误,这对舰船的通信指挥和信息的交互非常不利,需要进行处理。

针对现代舰船这种特殊的工作环境,自适应噪声对消(ANC )是一种较为有效的语音增强方法[1]。

ANC 以噪声为处理对象,对它进行抑制或衰减,而在处理过程中,并不需要知道噪声的先验统计知识,因为它多使用了一个参考通道。

当语音信号以及信号统计特性发生改变时,自适应滤波器能自适应的调节它的权值来适应新的情况[2]。

DSP 芯片是一种非常适合数字信号处理运算的微处理器,以DSP 芯片为核心的嵌入式系统可3收稿日期:2008年6月23日,修回日期:2008年7月21日作者简介:杨帆,男,硕士研究生,研究方向:移动通信、DSP 开发、实时信号处理。

高勇,男,博士,副教授,研究方向:阵列信号处理、软件无线电、通信抗干扰技术、实时信号处理、嵌入式系统开发等。

2008年第10期舰船电子工程105 以实时、快速实现各种数字信号处理方法,并且具有速度快、精度高、小型化等显著优点。

本文针对基本的ANC 原理研究了一种改进的双通道语音增强方法,并在自行设计的语音DSP 板上进行了实现。

2 双通道语音增强方法2.1 自适应噪声对消原理自适应滤波器在双通道自适应噪声对消中得到了广泛的应用。

在噪声对消的情况下,可以使用图1所示的L MS 自适应滤波器。

图1 自适应噪声对消在图1中有两个通道,主通道和参考通道。

主通道接收从信号源发来的信号s ,但是受到噪声源的干扰,这使得主通道不但收到信号s ,也收到噪声n 0。

设参考通道收到的干扰为n 1。

由于传送路径不同,n 1和n 0是不同的。

但因两者均来自同样的噪声源,所以它们是相关的。

参考通道的作用就在于检测噪声,并通过自适应滤波调整其输出y ,使y 在最小均方误差意义下最接近主通道噪声。

这样,通过相减器,将主通道的噪声分量n 0对消掉。

先假设参考通道收到的有用信号为0,信号和噪声不相关。

在图1中,d 为自适应滤波器主通道的信号输入s +n 0。

则此系统的输出为:e =d -y =s +n 0-y(1)式(1)中,s 和n 0、n 1、y 无关。

将式(1)的等号两边取均方值,并且假设噪声均值为0,则自适应滤波器调整的结果,将使y 在均方误差最小的意义下,最接近主通道噪声分量n 0,因而使系统输出中的噪声大大降低。

所以:Min E{(n 0-y )2}=Min E{(e -s )2}(2)公式(2)说明,在最小均方误差意义下,y 最接近n 0等效于e 最接近s ,所以在噪声对消输出端提高了信噪比。

2.2 一种改进的双通道语音增强在图1中,如果参考通道输入的噪声n 0越接近于主通道里的背景噪声n 1,噪声对消器输出的结果越好。

若参考通道除检测到噪声n 1外,还收到信号分量s 1,则自适应滤波器的输出y 将包含信号分量,从而使噪声对消结果变坏。

可以证明[3]:p sp nout≈p sp n -1ref(3)式(3)中,(p s /p n )out 为噪声对消器的输出信号噪声比,而(p s /p n )ref 为参考通道的输入信号噪声比。

这就是说,参考信道的输入信噪比越强,噪声对消器的输出信号噪声比越差。

所以,为了获得好的噪声对消性能,应使参考通道检测到的信号噪声比尽可能小。

实际中,传统的双通道自适应噪声对消系统,很难得到一个纯净的参考噪声作为辅助输入。

下面介绍一种改进的双通道语音增强系统,该系统的主通道和参考通道的输入信号均包含有同一语音信息。

如图2所示:图2 混有语音信号的双通道语音增强系统在这个系统里,我们假设主通道和参考通道接收到的信号里包含同样来源的语音信息s ,我们定义主通道接收的信号为:s +n 0,参考通道接收的信号为:s +n 1。

将两路信号相加,语音信号得到初次增强:d =2s +n 0+n 1(4)将两路信号相减,并乘以一个增强因子β:x =β(n 0-n 1)(5)这里β是一个大于1的增强因子,在实际中可针对两个麦克风的距离进行校准。

这样,我们可以用(4)、(5)两式构成自适应对消系统的主通道信号以及参考通道信号,结合图1所描述的理想系统进行自适应噪声对消,最后得到输出信号e 即为增强后的较为纯净的语音信号。

3 DSP 实现DSP 是双通道数字系统的核心器件,本系统采用TI 公司的32位浮点运算芯片TMS320C6713B 。

它采用了八条指令并行执行的流水线结构,使用两级缓存(cache ),并具有丰富的外设资源[4]。

该芯片亦有多种时钟频率,基于成本和性能的折衷考虑,本方案选择的是时钟频率225M Hz 的GDP 封106 杨 帆等:双通道语音增强的DSP 实现总第172期装芯片。

3.1 DSP 系统的硬件设计本系统采用两块板堆叠的方式,上面一层主要实现模拟放大,以及信号的输入输出,其中包含核心器件AD73311,用于实现信号的数模以及模数转换。

并且考虑到以后的研究扩展需要,在板上也选择C YPRESS 公司的U SB 芯片C Y7C68013。

下面的电路板是一个6层板,这是基于系统可靠性的考虑。

因为合理的分层不但可以降低系统的电磁辐射,还可以保证信号的完整性[5~6]。

这个板上的芯片除了C6713,其它的核心器件还包括:一个256M 的32位SDRAM ,一个2M 的16位FL ASH ,一个40万门的FP GA 。

整个系统的原理框图如图3所示:图3 硬件系统原理框图在设计DSP 的连接电路时,要注意以下几个问题:1)本方案选择的FL ASH 是16位,则DSP 应该选择16位非同步ROM BOO T 模式,此时应该将DSP 的HD [4]、HD [3]脚分别上拉、下拉。

2)本方案选择的音频通信口为MCASP1,此时应该将控制HPI -EN 寄存器的HD [14]管脚下拉。

3)由于是一个双通道语音系统,而MCASP1口可以同时满足最高8路的数据传输需求,因此可以将DSP 的AXR1[1]、AXR1[2]管脚分别作为两路语音的DSP 输入,将AXR1[1]管脚作为语音的DSP 输出。

4)本系统的两个通道采样率以及时钟应该保证完全同步,因此,AD73311的位同步信号(SCL K )与DSP 的ACL KR1和ACL KX1相连;AD73311的帧同步信号(SDOFS ,SDIFS )与DSP的A FSR1和A FSX1相连。

通过对FP GA 进行编程,可以很容易完成这些连接。

3.2 DSP 系统的软件设计以及算法实现在硬件电路设计完毕之后,就可以进入以下软件设计的环节。

系统在实际应用之前,有很多地方需要初始化,这都需要通过编程对相应的寄存器进行配置,本节选择了其中最关键的几个部分进行初始化配置的论述。

要使DSP 运行起来,首先要有正确的时钟。

C6713有自己的PLL 控制器,可以方便的实现内部分频以及倍频,从而得到期望的时钟信号。

在本系统中,DSP 的最大工作频率为225M Hz ,外部时钟输入为40.96M Hz ,采样率为16KHz ,AD73311的输入时钟为4.096M Hz 。

相关文档
最新文档