【CN109637554A】基于CDR的MCLP语音去混响方法【专利】

合集下载

基于NMF的MCLP语音去混响方法研究

基于NMF的MCLP语音去混响方法研究

基于NMF的MCLP语音去混响方法研究麦克风阵列作为一种语音采集装置,其广泛应用于电话会议、演讲厅和助听器等封闭环境时,由于室内混响、噪声等因素的影响,很难获得高音质的语音信号。

为此学者们展开了一系列针对室内混响、噪声等影响因素的语音增强方法研究。

语音去混响技术作为语音增强的重要组成部分,它在语音识别、声源定位和地震数据分析等各个方面同样发挥着不可替代的作用,因此,开展封闭环境下语音去混响研究具有重要的理论意义和现实价值。

论文对混响的产生、混响表征、混响数学模型等基本理论知识进行系统地阐述,并对当前主要的语音去混响方法进行了详细的描述;最后,在此基础上,展开对实际封闭声学环境下多通道语音去混响方法的研究。

麦克风阵列采集到的混响语音信号通常分为三部分:直达语音部分、早期反射部分和后期混响部分。

由于混响早期反射部分对于提高语音的音质有益,而后期混响部分产生的掩蔽效应会严重降低语音清晰度、音质,所以去混响方法通常将直达语音部分和早期反射部分作为目标信号进行重构。

在论文中,主要对基于多通道线性预测(MCLP)的去混响方法进行了深入的探讨和研究,并在MCLP去混响理论的基础上进行改进处理以达到进一步提高语音去混响性能的目的。

原MCLP方法中通常直接用阵列采集信号对目标信号协方差进行初始化,为了研究协方差对MCLP方法的影响,论文提出了一种基于相干扩散功率比(CDR)的协方差初始化方案。

另外,纯净语音的短时傅里叶变换系数具有一定的稀疏性且大于混响语音信号的短时系数稀疏特性,因此可以通过提高输出信号的稀疏性来产生一个逼近于期望信号的信号作为最终的输出信号。

论文利用纯净语音信号的短时系数稀疏特性及其NMF的分解特性,提出将NMF应用到一种基于复广义高斯先验模型(CGG)的MCLP去混响方法中。

仿真实验结果表明,在相同条件下,两种改进的方法比常规的MCLP去混响方法具有更好的去混响效果。

语音去混响的方法、设备和系统[发明专利]

语音去混响的方法、设备和系统[发明专利]

专利名称:语音去混响的方法、设备和系统专利类型:发明专利
发明人:E·格斯那,G·N·迪金斯,D·古那万
申请号:CN201480020314.6
申请日:20140331
公开号:CN105122359A
公开日:
20151202
专利内容由知识产权出版社提供
摘要:提供了改进的音频数据处理方法和系统。

一些实现方式涉及把频域音频数据划分成多个子带并且为多个子带中每一个确定振幅调制信号值。

带通滤波器可以应用到每个子带中的振幅调制信号值,以便为每个子带产生带通滤波后的振幅调制信号值。

带通滤波器可以具有超过人类语音的平均节奏的中心频率。

可以至少部分地基于振幅调制信号值和带通滤波后的振幅调制信号值的函数为每个子带确定增益。

所确定的增益可以应用到每个子带。

申请人:杜比实验室特许公司
地址:美国加利福尼亚
国籍:US
代理机构:中国国际贸易促进委员会专利商标事务所
代理人:宋岩
更多信息请下载全文后查看。

去混响方法、装置、电子设备和存储介质[发明专利]

去混响方法、装置、电子设备和存储介质[发明专利]

专利名称:去混响方法、装置、电子设备和存储介质专利类型:发明专利
发明人:张国昌,于利标,韩润强,魏建强
申请号:CN202011218042.4
申请日:20201104
公开号:CN112489668A
公开日:
20210312
专利内容由知识产权出版社提供
摘要:本申请公开了一种去混响方法、装置、电子设备和存储介质,涉及语音技术和深度学习领域。

具体实现方案为:将采集的至少一路语音信号子带分解为多个子带信号;对每个子带信号,依据设定的时间偏移量进行偏移处理,得到每个子带信号的参考信号;将至少一路语音信号的每个子带信号,以及对应的参考信号输入去混响模型,以得到至少一路语音信号的每个子带信号所对应的理想比值膜IRM;对至少一路语音信号的各子带信号采用对应的IRM进行幅度谱增强,得到至少一路语音信号去混响的各子带信号;对同一路语音信号去混响的各子带信号进行子带合成,以得到各路去混响的语音信号。

由此,通过频带独立的去混响模型,可以较好的去除混响声。

申请人:北京百度网讯科技有限公司
地址:100085 北京市海淀区上地十街10号百度大厦2层
国籍:CN
代理机构:北京清亦华知识产权代理事务所(普通合伙)
代理人:张大威
更多信息请下载全文后查看。

音频去混响方法、装置、设备和存储介质[发明专利]

音频去混响方法、装置、设备和存储介质[发明专利]

专利名称:音频去混响方法、装置、设备和存储介质专利类型:发明专利
发明人:王赫麟,吴渤,翁超,苏丹
申请号:CN202110954696.1
申请日:20210819
公开号:CN114283827A
公开日:
20220405
专利内容由知识产权出版社提供
摘要:本申请公开了一种音频去混响方法、装置、设备和存储介质,属于计算机技术领域。

该方法包括:根据预设扩展帧数确定扩展音频段;将扩展音频段中每个音频帧的频谱数据输入时序注意力网络,得到每个参考音频帧的频谱数据对应的权重值;将每个参考音频帧的频谱数据与对应的权重值相乘,得到每个参考音频帧的调整后的频谱数据;根据每个参考音频帧的调整后的频谱数据、目标音频帧的频谱数据和去混响网络,确定去混响处理后的目标音频帧的音频数据。

采用本申请,考虑到了目标音频帧中产生的混响与参考音频帧之间的相关性,综合考虑参考音频帧和目标音频帧,来对目标音频帧实现较为精确的去混响处理,提高了去混响处理的准确性。

申请人:腾讯科技(深圳)有限公司
地址:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层
国籍:CN
代理机构:北京三高永信知识产权代理有限责任公司
代理人:张所明
更多信息请下载全文后查看。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[0010]
[0011] 并且对所述语音信号进行处理后得到处理后的语音信号为
[0012]
[0013]
[0014] 式中,dm(k ,n)为期望信号,b为离散时间,s(b)为时域内的纯净语音,vm(b)为背景 噪声,rm(l)为声源与第m个麦克风之间的房间冲击响应,长度为Lr,Rm(k ,l)为时频域内的房 间冲激响应,Lh为帧数,n∈{1 ,...,N}为帧指数,k∈{1 ,...,K}为频带指数,τ为线性延迟;
( 57 )摘要 本发明公开了基于CDR的MCLP语音去混响方
法,包括:步骤一、在单声源的封闭声学环境中 , 建立多个全向 麦克风的 均匀线性阵 列 ;计算 第m 个麦克风接收到的语音信号;并且对所述语音信 号进行处理 后得到处理 后的 语音信号 ;步骤二 、 在第m个麦克风接收到的语音中选择第i路信号 作为参考信号 ,计算得到MCLP语音信号为 ;并且 对所述MCLP语音进行代数换算后得到处理后的 MCLP语音信号;并且对所述MCLP语音的初始化值 进行确定。
xi(k)=[xi(k ,1) ,...,xi(k ,N)]T; di(k)=[di(k ,1) ,...,di(k ,N)]T; gm(k)=[gm(k ,0) ,...,gm(k ,Lg-1)]T;
2
CN 109637554 A
权 利 要 求 书
2/2 页
3 .如权利要求1所述的基于CDR的MCLP语音去混响方法,其特征在于,在所述步骤二中,
发明内容 [0005] 本发明设计开发了基于CDR的MCLP语音去混响方法,本发明将基于相干扩散功率 比(Coherent-to-Diffuse power Ratio,CDR)的双通道语音谱减法应用到多通道线性预测 (MCLP)去混响中对目标信号进行初始化,从而解决提高语音去混响性能的问题。 [0006] 本发明提供的技术方案为: [0007] 基于CDR的MCLP语音去混响方法,包括如下步骤: [0008] 步骤一、在单声源的封闭声学环境中,建立多个全向麦克风的均匀线性阵列; [0009] 计算第m个麦克风接收到的语音信号为
步骤二 、在第m个麦克风接收 到的 语音中 选择 第i路 信号作为参考 信号 ,计算得到MCLP 语音信号为
并且对所述MCLP语音进行代数换算后得到处理后的MCLP语音信号为
其中,所述MCLP语音的初始化值为
ቤተ መጻሕፍቲ ባይዱ式中,
2 .如权利要求1所述的基于CDR的MCLP语音去混响方法,其特征在于,在所述步骤二中, 所述代数换算包括:
4
CN 109637554 A
式中,α为平滑参数。 4 .如权利要求1所述的基于CDR的MCLP语音去混响方法,其特征在于,在所述步骤二中,
所述初始化值
能够通过自回归系数g(k)计算得到:
5 .如权利要求1所述的基于CDR的MCLP语音去混响方法,其特征在于,在所述步骤二中, 目标信号 为
6 .如权利要求1所述的基于CDR的MCLP语音去混响方法,其特征在于,在所述步骤二中, 目标信号协方差 为
式中,尺度参数γ>0,形状参数0<P≤2。
3
CN 109637554 A
说 明 书
1/7 页
基于CDR的MCLP语音去混响方法
技术领域 [0001] 本发明涉及语音信号处理领域,具体涉及基于CDR的MCLP语音去混响方法。
背景技术 [0002] 在一些相对封闭的声学环境中使用免提电话、电话会议、助听器、语音控制系统等 通信系统时 ,麦克风采集到的 信号往往会受到混响的影响导致语音的 清晰 度、可读懂度等 降低、进而影响通信系统的整体功能。因此研究如何去除语音混响即语音去混响也显得愈 发重要。 [0003] 经过多年的发展,人们提出了诸多去混响方法。主要包括基于多通道均衡的去混 响方法、基于谱估计和空间滤波器相结合的去混响方法以及基于概率模型的去混响方法。 在实际 应 用中 ,多通道均衡的 去混响方法易受到房间 冲激响应估计准确性等的 影响 ,且计 算量大 ;利 用波束形成的 单通道维纳滤波器去混响处理需要估计目 标 信号方向 角等参数 ; 多通道线性预测去混响方法会出现目标信号协方差等于零的情况,当情况严重时会导致输 出信号失真。 [0004] 谱减法自提出以来就获得了学者们的深入研究和广泛应用,在MCLP去混响方法 中 ,目标信号谱方差的 初始化严重影响去混响的 优劣 ,因此如何对其进行初始化也变得愈 发重要。
(10)申请公布号 CN 109637554 A (43)申请公布日 2019.04.16
权利要求书2页 说明书7页 附图3页
CN 109637554 A
CN 109637554 A
权 利 要 求 书
1/2 页
1 .基于CDR的MCLP语音去混响方法,其特征在于,包括如下步骤: 步骤一、在单声源的封闭声学环境中,建立多个全向麦克风的均匀线性阵列; 计算第m个麦克风接收到的语音信号为
( 19 )中华人民 共和国国家知识产权局
( 12 )发明专利申请
(21)申请号 201910038726 .7
(22)申请日 2019 .01 .16
(71)申请人 辽宁工业大学 地址 121001 辽宁省锦州市古塔区士英街 169号
(72)发明人 周城旭 王冬霞 何冲
(74)专利代理机构 北京远大卓悦知识产权代理 事务所(普通合伙) 11369
并且对所述语音信号进行处理后得到处理后的语音信号为
式中,dm(k ,n)为期望信号,b为离散时间,s(b)为时域内的纯净语音,vm(b)为背景噪声, rm(l)为声源与第m个麦克风之间的房间冲击响应,长度为Lr,Rm(k ,l)为时频域内的房间冲 激响应,Lh为帧数,n∈{1 ,...,N}为帧指数,k∈{1 ,...,K}为频带指数,τ为线性延迟;
代理人 李烨
(51)Int .Cl . G10L 21/0208(2013 .01) G10L 21/0216(2013 .01) G10L 21/0232(2013 .01) G10L 25/12(2013 .01) G10L 25/21(2013 .01)
( 54 )发明 名称 基于CDR的MCLP语音去混响方法
相关文档
最新文档