基于时频稀疏性的混叠语音分离及失真对策(续完)

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

得到各个时频单元的空间特征，以用白噪声作为模可
型训练用信号。
（）只需要分离一方位未知的目标语音，源２干扰方位固定（ＢＳＳＳ１问题）。例如干扰源来自固定方
（＝，ｌｐｔ｛，：
【，其他０
：｛ ” （）ｐ ‘ １７
付中华，亚丽赵（北工业大学西计算机学院，西西安陕７０７）１０２
・文论・
４２聚类分析和分离方法．
ｂ）Ｊ卜１训（ｔ）＝）乏（ｌＤ～－０（（ｏ￣）
（９１）
有了空间特征，下来是如何聚类和分类问接
■膏＆一
－Ｋｏｇ＃ “ ・ｒａｉ ‘ ｉｇ
语音技术凹＠＠６＠＠＠＠０Ｕ啼闶 ⑨
文章编号：０２８８２１）６０４－５１０－６４（０２０－０７０
基于时频稀疏性的混叠语音分离及失真对策（完）续
况，目的是作为其他隋况分离效果的一个参照。此先让各个声源单独发声，两只传声器观测到的根据混合信号，式（５对应的特征矢量集合，后用计算１）然
期望最大化（ｘｅｔｉｅｐｃａｏｔｎ—ｍｘｍｚｔｎＥ算法＿ａｉｉｉ，Ｍ）ａｏ６可以迭代得到该声源对应的ＧＭＭ模型参数。为了
以下０（简记为０。根据贝叶斯理论，验ｔ后概率与ＧＭ条件概率的关系如下Ｍ
ｐｌ＝Ｄ）（６１）
式中，（为先验概率，ＰＡ）即每个声源出现概率，果如无法用其他方法获得其信息，则一般假定所有声源以同等概率出现。由此，以将式（４的最大后验概可１）率分类方法转换成条件概率分类，即
发声，因此只有从混叠信号中对其模型进行估计。基于稀疏性假设，在混叠信号的所有时频单元中，仍有一部分保持原来的分布，而另外那些目标声源绝对占优的时频单元则变成目标声源的特征分布。因此
ｓ（） … ，一（）自空间特征对应的Ｇｔ，ｓ各ＭＭ分别为Ａ，１… ，Ⅳ１其中Ａ０Ａ，Ａ一，＝｛ｘ，）ｉ，，Ｐ，／，＝０ …
这里有几个关键问题：源数量和方位是否已知？声声
源数量或方位是否随时间变化？是否需要分离所有
Ｎ一。其中Ｐ为高斯分量的权重，为高斯分量１的均值矢量，为高斯分量的协方差矩阵。为了方
便计算，常采用对角协方差矩阵的Ｇ通ＭＭ。每个声
源对应的二元时频掩膜ＭＡ，）可根据最大后（ｋ就
声源？这些问题随着不同的应用，着不同的解决方有案。最复杂的问题就是所有声源数量方位都不知道，且可能随时间变化，这种情况下分离所有声源信号就是经典的ＢＳ问题，文献［４—１］Ｓ如１５。在实际应用中，常常有一些先验信息可以利用，问题变成ＳＳ使ＢＳ
叠信号分布会发生改变。无法控制让目标声源单独
总假定每个时频单元仅有单个声源能量绝对占优，这
仅是大概率事件而已，别是当干扰声并非稀疏信号特时，如风声、车噪等，目标失真将进一步加重。
下面考虑两种应用中的失真对策问题：（）语音增强或噪声抑制应用１
问题。笔者考虑如下三种情况的模型训练：
验概率方法进行估计
（
ｔ＝【，｛０其他，
＾
ｆ（Ｄ∽ ）。（（），ｐ九Ｉ（＝ｎｘＡｉ｝ｉｑ：ｏ
（４１）
（）非盲源分离（ｎ—ＢｉｄＳｕｃｅａｔｎ１ＵｌｏｒＳｐｒｉ，ｎｅａｏ
初始化时只有干扰信号，目标声源并未出现，于是可以采用ＥＭ算法估计干扰源ＧＭ模型。在实际分离Ｍ
生蔓塑蔓鲞团
ｎ语音技术ｎ
⑤６＠可＠响⑥０＠＠响 ⑥
囊一技曩
。ｏ￣ｎｇｉｎｆｔｎｒｆ
阶段，随着目标声源的出现，只传声器观测到的混两
题。根据前面的讨论，个声源对应的空间特征分每
其中，是ＧＭＭ中高斯分量的个数，是高斯均值Ｄ
的维数，即空间特征维数，此处为３。以上是采用ＧＭＭ进行模式识别的基本内容。
布可以用一个ＧＭ来描述， Ⅳ 个声源ｓ（）Ｍ令。ｔ，
（）１８
位的扬声器，目而标说话者方位事先无法确定。
由于干扰源方位固定，因此其空间特征会保持一
种固定的分布。类似通常语音增强的方法，假定系统
而ＧＭＭ的条件概率计算如下
ｐＤｌ＝∑Ｐ）（Ａ）（ｂＤ
■ ■ 投 ● 投稿网址：ｔ：Ａｄｏ．ｈｔ／ｕｉａｐ／Ｅｎ
ＵＳ）ＢＳ问题，即假定声源数量和方位均已知，随时不
式中，ｔ表示时频单元 ቤተ መጻሕፍቲ ባይዱ 的对应的空间特征，ｏ（即
ｏ＿嚷】，】（［［，ｔ去
（５１）
间变化，以单独控制各个声源。这是一种理想情且可
目的是得到各个声源对应的空间方位模型。为