基于连续隐马尔科夫的语音识别模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

判 断 是 否 收 敛 : /  ̄ P ( 0 并 计 算 { _ o 如 果 I I 小 于给 定
的闽值 则结束, 反之回到第二步继续进行循环。
. 3 . 3语音识别模 型 F I R 滤波器 的基本结 构可以理解为一个分节 的延 时线, 把 1
对 待识 别语 音信号 映射为观 察序列 , 然后对各 模 型求概
( ) = ∑h ( i ) x ( n - i ) H ( z ) = ∑h ( n ) z
1 . 2特征提取模型
特征提取 就是从语音信号 中提取具有代表性 的、 合适的特
由于P 和Pf D j 都 可以确定 ,因此 式 ( 5 . 3 . 1 9 ) 的大 小 由 征参数 。 尔频率倒谱系数 ( M F C C ) 能更 加充 分的利用人耳的听 P f D / ) 决定。 若其对应的隐马尔科夫模型为A , 则: 觉特性 , 因此本文中我们提取的特 征参数是M F C C 。 P ( O / w i ) - P f J P 个M F c C 系数公式为: 其 中, P M 可用前 向一 后 向概率算法 求出。 然后找 出最 大的P f 0 , 则其模型对应的词即为识别结果。
经过预 处理 、 特征 提取 、 训练 与识 别。
关键 词: 语 音 识别 ; 隐 马尔科 夫模 型 ; 预 处理特
1 模 型的建 立与验 证
本文我们所建立 的语音识 别门模型包括 语音信号预 处理
1 . 3 . 1模型建立
H M M 模型可以记为: A =f 7 r , A , B ) 。 为状态转移矩阵为: B 为
模块 、 特征提取模块及模式库训练 和待测语音识别模块 。
1 . 1预 处理
预处理主要包括 预加重 , 加窗分帧处理 , 端 点检测和 降噪
观 察值概率密度矩阵, 丌j 为各状态其实概率分布。
1 . 3 . 2模 型求解 H M M 在语音识 别中需要解决 估值、 解码和训练 三个基本 问
基于连续 隐马尔科夫的语音识别模型
梁 浩 杨 光 宇 ( 1 . 武汉大学 工学 部电 子信 息学院, 湖 北 武汉 4 3 0 0 7 2 : 2 . 武汉大 学新闻与 传播学院, 湖北 武汉 4 3 0 0 7 2 )
摘 要: 本文针对问题一建立了 基于连续隐马尔科夫模型的语音识别系统的模型。 该语音识别系统包括预处理, 特征提取以及声学模型三 个部分。 问题二要求以一个实际的例子则对问题一中建立的模型进行验证。 我们选择了“ 话费查询” 这个功能进行测试。 待测语音信号依次
1 . 1 . 4 降噪处理模 型 每 一节 的输 出加权累加, 可得到滤波器的输 出, F I R 滤波器的冲 激 响应h f n j 是有限长的, 数学上^ f 阶F I R 滤 波器可 以表示为:
Ⅳ 一l _ v一 1
后向算法求前 向 概 率和后向概率, 利用重估公式求a , 和b f J J ,
c “ ) = √ 寺 g c 岍o o s I 兹 一 o 。 5 - 5 ) ] I l , 2 , … . . . , p

1 . 4模型的验证
问题二要求 以一个实际的例子验 证语音 识别模型。 我们选
1 . 3训练与识别模型一一连续隐马尔科夫模型
模式 匹配是通 过计算待 识别语 音与已知语 音库中语音 的
题。
处理四个过程 。 I . 1 . 1预加 重模 型 预加 重 的中心思想是利用信 号特性 和噪声特性 的差别来
有效地对信号进行处理。即在噪声引入之前采用适当的网络,
( 1 ) 估值 问题
对于给定的观察序3  ̄ d O = f 0 , 0 , . , D 和模型 ;f 丌 , A , , 前 向概 率求解 。
w ) 1 f 0 . 5 4 — 0 . 4 5 c o s ( 2 n ' n / ( L 一 1 ) ) 0 L 一 1
, 、
V i t e r b i 算法求解。
( 3 )  ̄ 1 1 练算法

其他
对于给 定的观测序3  ̄ d O - - f D , , 0 , , …, D , 如 何修正模 型A参
择了 “ 话费查询 功能” 进行验证 。 为了达到 这个 目 标, 由问 题 二
中的规则 可知 我们 需要 以比较连 贯 的语速 用标准 普通话 说 出
1 . 1 . 3端点检测模 型
数, 使得 模 型产 生观 测序 y O o 的概 率P
最大, 一般 采 用
本文使用双门限端点检测对语音信号进行端点处理 。
H +N - 1
B a u m -W e l c h 算法。 算法步骤为: 确定A , B 的初始 值, 利用前 向一
Z =∑ l s g n [ x ( m ) ] - s g n [ x ( m 一 1 ) ] 1 w ( 刀 一 )
( 2 ) 解码 问题
人为地加 重发射机输入调制信号的高频分量。 1 . i . 2加窗分帧处理模型
对于给定的观察序列D = , , 0
Hale Waihona Puke Baidu
D 和模型A =r 丌 , A , B ) ,
本 文中选择 H a m m i n g 窗进 行加窗分帧处理 , H a m m i n g 窗函 求 模 型A对 应于观测 序列O 的最佳 状态 序列Q = q , … T , 即 寻找使 P f D M 达 到最 大 时, D 所 对应 的状 态序 列 , 可 以采 用 数如下:
率, 其中概率最大 的模 型对应的词即为识别结果 。 假 设每个词W , 都对应一个观察序Y d o = [ o , 0 . . , 0 , 则 语音识别 的问 题 可以认为是在 已 知语音观察序列0 的情况下, 寻 找与其最 匹配 的W ; , 即计算h  ̄ a r g ; m a x { P ( w ; / D j ) 。
相关文档
最新文档