说话人识别模型
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(ule Dsne Ecda i c ;当W为 i n t ) a 对应z 的逆协方差矩阵时 对应马氏 距离 M hloi i n ) 我们 ( aanb Ds c : a s a e t 在后面 还会介绍到一种对 LC参数特别有效的距离测度, P 在那里,W为用自 相关法计算 LC参数 P 时得到的自 相关矩阵,即(2 式中 25 - ) 的系数矩阵, 对应的距离测度被称为 IkrSt 距离测度 tu- i a a ao
那么 就认为说 话人身份与所声明的 身份相匹配, 否则认为不匹配;而在A I S 中,说 话人可能是 一组
说 人 的 个 这 说 人 应 板 l1, 可 的 话 的 数 这 需 分 与 组 话 中 一 , 组 话 对 模 集fl 为 能 说 人 个 , 时 要 别 这 xx 瓦" M ki = '
第三章
31引言
说话人识别模型
在第二章中,我们介绍了 如何把语音分成一I 吻顾的 语音段,然 后逐帧的提取各种特征参数的 过
程 。经过特征参数提取这个步骤之后 ,每一帧语音对 应一个特征参数矢量 ( 这个特征 参数矢量可能
包含上 一 章所介绍的各种特征参数)而一段语音就 , 被处理成一个 特征参 数矢 量的集合。 从随机过 程
人识别方法 。 模板 的形式有简单有复杂, 常用 的模板 形式包括平均值形式 的模板 、 码本形式 的模板 、
建立在随机分布认识上的 G M模板和建立在随机过程认识 L M 模板。本章将分别对这些模 M 的H M
板形式做简 单的介绍和分析 。并在最后给 出我的系统的大致设想并陈述理 由
32平均 值形式 的模板— .
个点 (-) 31
在 别 时 待 别 样 、到 板 距 定 为 识 的 候, 识 的 本点 模 的 离 义
d ,一, ) (一 (、 (一' x : x )x 、W 、 ) () 3 - 2
这里W 是一个 加权矩 阵 ,不 同的 W 对应不 同的距离测度 ,当 W 是一个 单位 阵时 ,对应 欧 氏距 离
人中的任意一 个。
呱。 m {} 。 id 一 n k () 3 - 4
平 均值形式的模板对应了 一 类最简单 的识别方法— 简单统计识别方法,这种 方法也是 说话人
识别领域最 初采用的方法 。这种方法认 为取平均的结果可 以使得那些反映 说话人 信息的成 分保 留下
别的一个直观 的描述 ,这 里重绘如下。
() 练 a 2 1
未 知 说 话人
()识别 b 图 31模板 匹配的说话人识别方法 -
21
32平均值形式的模板— -
简单统计识别方法
2 2
从 图 31中我们可 以看 出,模板 的形式是 说话人识别方法 中关键 的一环 ,不同的模板形式需要 - 不同的训练方法 、模板 比对方法和最后 的判决方法 可以说不 同的模板形 式也就决定 了不同的说 话
说 人 板 算 均 离得 因M 取 中 小 那个 为 能 配 对 话 模 ‘ 平 距 到 k 其 最 的 一 作 可 匹 的象 } - I '
如 , , 于 个门 d, 认 说 人 被 定 象 配, 则 说 人 是 组 能 话 果d, 小 某 限 o 则 为 话 与 指 对 匹 否 认为 话 不 这 可 说 , , ,
简 单统计 识别方法
平均值形式的模板是最简单的 模板,它取所 有训练 样本点的 平均值样本点来做参考模 板。记 一
个 话 的 练 本 的 合 {几 N 训 样 点 数 那 对 这 说 人 模 就 一 说 人 训 样 点 集 为、 、 为 练 本 总 , 么 应 个 话 的 板 是 },
的观 点看 ,每一个特征 参数矢量对应观测空间的一个样本点 ,一段语 音则对应一个样本 点的集合。 基于模板 的说话人 识别系统都包含 训练和识 别两个 子模块 。训练的过程 ,就是要 对训练语音的
样本点集合按某 种方式建立模板。 对多个人进行训 练以 后,可以得 到多 套模板。 识别的过程,就是 要把待识别语音的样本点集合与训 练所得到的各个模 板分别进行比 对,与 每个模板比对时都按某种 方法得到一个相似度的 评判, 最后综合 这些相似度的结果, 进行最终的判决。图 1 是对训 - 1 练和识
待 别 语 样 点 集 闪二 一 模 ,距 有 个 计 均 识 的 音 本 的 合 1 个 板 的 离 一统 平 ・ 到
、二 d; _ } (z x) ,
N‘ 胃 (-) 33
其中N 为识别样本点总数 式中的d就是我们最后用以 ' 衡量训 练语音和识别语音相需 计 与 个 的 S 中, 话 声 自 的 份, 此只 要 算 一 模板 距离歹 如 小 某 限 , 果歹 于 个门 姚,