基于时频稀疏性的混叠语音分离及失真对策(续完)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

得到各个 时频单元 的空 间特征 , 以用 白噪声 作为模 可
型训练用信 号 。
( )只需要分 离一方位未知 的 目标语音 , 源 2 干扰 方位 固定 ( B S S S1问题 ) 。例 如干扰 源来 自固定 方
( = , l p t { , :
【 , 其 他 0
: { ” () p ‘ 1 7
付 中 华 , 亚 丽 赵 ( 北工业大学 西 计 算 机 学 院 , 西 西安 陕 707 ) 10 2
・文 论・
4 2 聚 类分 析和分 离 方法 .
b) J 卜1 训 (t) = )乏 ( l D ~ - 0( ( o ̄ )
(9 1)
有 了空 间 特 征 , 下 来 是 如 何 聚 类 和 分 类 问 接
■膏& 一
-K o g# “ ・ r a i ‘ ig
语 音 技 术 凹 @ @6 @ @@ @0 U 啼闶 ⑨
文章 编 号 :0 2 88 2 1 ) 6 0 4- 5 10 - 64(02 0 - 0 7 0
基于 时频稀疏 性 的混 叠语音 分 离 及 失真 对策 ( 完 ) 续
况, 目的是作 为其 他 隋况分离效 果的一个参 照。 此先让各个声 源单独发声 , 两只传声器观 测到 的 根据 混合信号 , 式 (5 对 应 的特征矢 量集 合 , 后用 计算 1) 然
期 望最大 化 ( x et i epca o t n—m xm zt n E 算 法 _ ai i i , M) ao 6 可 以迭代 得 到该 声 源 对 应 的 G MM 模 型参 数 。为 了
以下 0( 简 记为 0。根 据 贝 叶斯 理论 , 验 t 后 概率 与 G M 条件概率 的关系如下 M
p l = D) (6 1)
式 中 ,( 为先 验概 率 , P A) 即每 个声 源 出现概 率 , 果 如 无法用其他 方法获得其信 息 , 则一般假定 所有声 源 以 同等 概率 出现 。 由此 , 以将 式 (4 的最 大后 验 概 可 1) 率分类方 法转换成 条件概率分类 , 即
发声 , 因此只有从混叠信号 中对其模型进行估计 。 基于稀疏性假设 , 在混叠信号的所 有时频单元 中, 仍有一部分保持原来 的分 布 , 而另外 那些 目标 声源绝 对 占优 的时频单元则变成 目标 声源的特征分布。因此
s() … , 一 ( ) 自空 间 特 征 对 应 的 G t , s 各 MM 分 别 为 A , 1… ,Ⅳ1其 中 A 0A , A 一 , ={ x , ) i , , P , / , =0 …
这里有 几个关键 问题 : 源数量和方位是 否 已知 ?声 声
源数 量或方位是 否 随时 间变 化?是 否需 要分 离 所有
N一 。其 中P 为高斯分量 的权重 , 为高斯分量 1 的均值 矢量 , 为高斯 分 量 的协方 差 矩 阵 。为 了方
便 计算 , 常采用 对角 协方 差矩 阵 的 G 通 MM。每 个声
源对 应 的二元 时 频掩 膜 M A, ) 可 根据 最 大后 ( k就
声 源?这些 问题 随着不 同的应用 , 着不 同的解 决方 有 案 。最复杂 的问题 就是所有声源 数量方位都不 知道 , 且 可能随时 间变化 , 这种情况下分 离所有声源信 号就 是 经典 的 B S问题 , 文献 [4—1 ] S 如 1 5 。在 实 际应 用 中, 常常有一些先 验信息可 以利用 , 问题变 成 S S 使 BS
叠信 号分布会发 生改 变 。无法 控 制让 目标 声源单 独
总假定每个 时频单元仅有 单个声源能量绝对 占优 , 这
仅是大概率事件而 已 , 别是当干扰声并非稀 疏信号 特 时, 如风声 、 车噪等 , 目标失真将 进一步加重 。
下 面考虑两种应用 中的失 真对策问题 : ( )语 音增强或噪声抑制应 用 1
问题 。笔者考 虑如下三种情况 的模型训练 :
验概 率方法 进行 估计

t =【 , { 0 其他 ,

f ( D∽ ) 。 ( ( ) ,p九I( = nx Ai } i q : o
(4 1)
( )非 盲 源 分 离 ( n—BidSuc ea tn 1 U l or Spr i , n e ao
初始 化 时只有 干扰 信号 , 目标声 源并 未 出现 , 于是 可 以采用 E M算 法估计干扰 源 G M 模型 。在 实际分 离 M
生 蔓 塑 蔓 鲞 团
n 语 音 技 术 n
⑤6 @ 可@ 响⑥0 @ @响 ⑥
囊 一 技 曩
。 o  ̄ngi nft n rf
阶段 , 随着 目标声 源 的出现 , 只传 声器 观测 到 的混 两
题 。根 据前 面 的讨 论 , 个 声源 对 应 的 空 间特 征 分 每
其中, 是 G MM 中高斯 分 量 的个 数 , 是 高斯 均 值 D
的维数 , 即空间特征维数 , 此处为 3 。 以上 是 采 用 G MM 进 行 模 式 识 别 的 基 本 内容 。
布 可 以 用 一 个 G M 来 描 述 , Ⅳ 个 声 源 s( ) M 令 。t,
() 1 8
位的扬声器 , 目 而 标说话者方位事先无法确定。
由于干 扰源方位 固定 , 因此其 空间特征会保持 一
种 固定 的分 布 。类似通 常语音增强 的方法 , 假定 系统
而G MM 的条件概率 计算如下
pDl =∑P ) ( A ) ( bD
■ ■ 投 ● 投稿 网址 : t :A do . ht / u i a p/ E n
US) B S 问题 , 即假 定 声 源数 量 和方 位均 已知 , 随 时 不
式 中, t 表示 时频单元 ቤተ መጻሕፍቲ ባይዱ 的对应 的空间特征 , o( 即
o_ 嚷 】 , 】 ([ [ , t去
( 5 1)
间变化 , 以单 独控制各个声 源 。这是一种 理想情 且可
目的是得 到各 个声 源对 应 的空 间方 位模 型 。为
相关文档
最新文档