一种改进的语音信号特征参数提取算法研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ten w au ep rmee ban ihrc g io aetru ht esmuaine p r ns h e f tr aa tr o tis g o nt nrt o g i lt x e me t. e s h e i h h o i
Ke r s f au x r cin;s o ・ me e e g ;s ott e o c s i g rt ;MF y wo d : e t r e ta t e o h r t n r t i y h r— me z r - r s ae i o n CC;s e c i as pehs n g l
心 频 率 在 Me 频 率 轴 上 是 均 匀 分 布 的 。在 线 性 频 率 上 , m l 当
较小时 , 相邻的, 间隔很小 , m 随着 m的增加 , 相邻的 间隔逐
渐 拉开 。另外 在频率较低 的区域 和, 间有 一段是线性 的。 之 语 音 信 号 MF C参 数 的计 算 步 骤 [ 述 如 下 : C 4 1 简 首 先 , 算 每 帧 信 号 的 离 散 功 率 谱 S n ; 次 , S 1 计 ()其 求 () 7 , 和 ( ) 各 离 散 频 率 点 上 的 乘 积 之 和 , 此 基 础 上 可 以 得 n在 在 到 个 参 数 P , - 1 … , — ; 次 , 尸 进 行 取 对 数 运 mm- , l 再 - O, 对 m 算 , 得 到 其 自然 对 数 L , 0 1 … , 1 接 下 来 对 每 个 自 可 m= , , M一 ; 然 对数 进行 离散 余 弦 变换 , 得 到 D , 0 1 … , l 最 后 , 将 mm= , , ;
第 1 9卷 第 2 期 1
Vo . 9 11 No2 .l
电子设 计 工程
El c r n c De i n En i e rn e to i sg g n e i g
2 1 年 1 月 01 1
NO .2 1 V 01
一
种 改进的语音信号特征参数提 取算 法研 究
频 率 的 转 换 关 系 是
的是 其 动 态 特 征 。 前 面 的 语 音 信 号 MF C参 数 仅 仅 反 映其 而 C
-5 ・l ) 29 lh 5g
( 4 )
静 态 特 性 , 显 然不 太 合 适 。 因 此 要 得 到 语 音 信 号 的 动 态 特 这 性 ,一 般 的方 法 是 通 过 差 分 倒谱 参 数 来 描 述 这 种 动 态 特 性 。
号 中 无 用 的冗 余 信 息 。 随 着 语 音 识 别 技 术 的 不 断 发 展 。 域 时 特 征 参 数 的种 种 不 足 逐 渐 暴 露 出 来 , 这些 特 征 参 数 缺 乏 较 如
一
种 新 参 数 , 过 实 验 验 证 。 具 有 比 MF C 参 数 更 高 的 准 经 它 C
语音信号是一 种短时平稳信 号 , 时变的 , 分复 杂 , 即 十 携 带很多有用 的信息 , 这些 信 息 包 括 语 义 、 人 特 征 等 , 特 征 个 其 参 数 的准 确 性 和 唯 一 性 将 直 接影 响 语 音 识 别 率 的 高 低 。 且 并 这也是语 音识别的基础【 1 1 征 参 数 应 该 能 够 比较 准 确 地 表 。特 达 语 音 信 号 的特 征 。 有 一 定 的 唯 一 性 。 具 上世纪 4 O年 代 。oe 等 人 提 出 了 “ibepeh 的概 pt r t vs lsec ” i 念 。 出语 谱 图 对 语 音 信 号 有 很 强 的 描 述 能 力 , 且 试 着 用 指 并 语 谱 信 息 进 行 语 音 识 别 , 就 形 成 了 最 早 的语 音 特 征 。 到 这 直 现 在 仍 有 很 多 的人 用 语 谱 特 征 来 进 行 语 音 识 别 闭 。后来 , 们 人 发 现 利 用 语 音 信 号 的时 域 特 征 , 以从 语 音 波 形 中 提 取 某 些 可 反 映 语 音 特 性 的 参 数 , 如 : 度 、 时 帧 平 均 能 量 、 时 帧 比 幅 短 短 过零 率 、 时 自相 关 系数 、 均 幅 度 差 函数 等 。这 些 参 数 不 但 短 平 能 减 小 模 板 数 目 、 算 量 及 存 储 量 , 且 还 可 以 滤 除 语 音 信 运 而
1 . 短 时 平 均 过 零 率 2
短 时平 均 过 零 率 翻 每 帧信 号 通 过 零 值 的 次 数 , 在 一 定 指 可
程 度 上 反 映语 音 信 号 ( } 谱 性 质 。其 定 义 如 下 : )的频
好 稳 定 性 。 区分 能 力 不 好 。 于 是 频 域 参数 开 始 作 为 语 音 信 且 号 的 特 征 . 如频 谱 、 振 峰 等 。 比 共 为 了提 高语音 识别 率 ,语 音信 号 的特 征 参数 要满 足 一定 的
MF C参 数 的计 算 是 以“ak 为其 频 率 基 准 的 , 和线 性 C br ” 它
作 者 简 介 : 彪 (9 2 ) 男 , 津人 , 士 , 王 18 一 , 天 硕 助教 。研 究 方 向 : 网络 通 信 与 多媒 体 。
-
5 - 9
《 电子设计 工 程)0 1年 第 2 期 21 1
确 率 。 定 程 度 上 提高 了语 言信 号 的识 别 率 。 一
1 相 关 理 论 介 绍
11 短 时 能 量 .
短 时 能 量 1 语 言 信 号 强 度 的度 量 参 数 , 映 语 音 信 号 3 ] 是 反
的幅度变换 。
语 音 信 号 ( )的 短 时 能 量 定 义 为 如 下 的 表 达 式 : nl
新 特 征 参 数 的第 3到 2 6列 。 22 改进 特 征 参 数 的理 论 依 据 . 文 中选 取 MF C参 数 与 短 时能 量 、短 时 过 零率 构 成 组 合 C 参数 的理 论 依 据 如 下 :
上 式 中 , 波 器 的 数 量 用 肘 表 示 ; 一 帧 语 音 信 号 的 点 滤 每 数 用 J表 示 , 7 、 r 从计 算 简便 的 角度 考 虑 , 一 般 为 2 6点 。选 取 Ⅳ 5 在 频 域 上 为 简单 三 角 形 的滤 波 器 是 其 中 心 频 率 ,这 些 中 厶
功 率 谱 。因 此 , 计 算 之 前 要 在 前 面 总结 的汉 语 语 音 频 谱 范 在
围 内设 置 一 定 数 量 的 滤 波 器 : H ()m= , , , 一 ,= ,, , 一 n , 0 1 … 』 1n 0 1 … 一 1 l f
\ /
式 ( ) , 常 数 , d为 一 帧 语 音 信 号参 数 。 7 中 k为 c和 按 此 公式 计 算 一 次 将 得 到 一 阶 M C F C参 数 ,计 算 两 次 得 到 二 阶 差 分参 数 , 次 类推 , 依 计算 r次 , 得 到 n阶差 分 参 数 。 t 将 文 中分 别 计算 语 音 信 号 MF C参 数 及 其 一 阶差 分 参 数 。再 将 C 二者合并 , 成一个 2 构 4列 的特 征 向量 , 其 作 为 语 音 信 号 的 将
收 稿 日期 :0 l 0 — 0 2 1一 9 1 稿 件 编 号 :0 1 9 6 2 10 0 3
s[ )i (≥ g (】二 <0 nn ,()0 x i )
一 ●. 丑 . 、,‘ , U 、
( 3 )
()
1 M e 尺 度 倒 谱 参 数 . 3 I
An i p o e p e h sg a e t r x r cin ag rt m e e r h m r v d s e c i n l a u ee t a t l o i f o h rsa c
W ANG Bio a
( te ai e at n, a i nvri r n cecs n o 2 0 3 C ia Ma m t s p r t B o i syo t adS i e , aj 7 1 1 , hn ) h cD me j U e t fA s n i
计 算 MF C参 数 要 按 帧 计 算 ,首先 对 语 音 信 号 进 行 傅 里 C
叶 变 换 得 到 其 功 率 谱 S n , 后 将 其 转 化 为 Me 频 率 [ 的 ( )然 l 4 1 下
处 理 办 法 可 以 用 下 面 的 公式 来 求 得 差 分 参 数 :
dn= ()— ・ ( ) cn () 7
=
∑ l [m]gx 一)l( m x )s[m1 n ) s ( 一n( 1 — n g ∑ In )s[(一)I [( 卜gxm1 s xm n o 】 g ( 2 )
要求 : 特征参数要能够较为有效地反映语音信号பைடு நூலகம்有用信息 , 并
且 不 互相 影 响 。 计算 要 简单 快捷 , 还要 具有 一定 的 唯一 性 。
得 了较 高 的识 别 率 。
关 键 词 :特 征 提 取 ; 时 能 量 ; 时过 零 率 ; C 语 音 信 号 短 短 MF C;
中 图分 类 号 : 13 1 1P l
文献标识码 : A
文 章 编 号 :17 — 26 2 l ) 10 5 — 3 6 4 6 3 {0 12 — 0 9 0
E ∑[mtnm】 ∑xmh — )z ) ( () n x )( ) = ( o — : Z )n =( ・n 1 = ( ( m m ^ )
其 中 , n 为 线 性 滤 波 器 的 单 位 冲 击 响 应 , h( ) h( ) 且 n=
∞ ( ) 表示 在信 号 的第 n个 点 开 始 加 窗 函数 时 的短 时 能 量 。 zn ,
其 中 , [是符号 函数 , s ] n g 即
笔 者 提 出 了一 种 新 的 特 征 参 数 。 在 Me 尺 度 倒 谱 参 数 它 l ( e. ae e s u C e i et, 称 MF C参 数 ) 基 础 上 M 1 cldC pt m ofc ns简 s r i C 的 加 入 了 语 音 信 号 的 短 时 能 量 和 短 时平 均 过 零 率 信 息 , 造 了 构
王 彪
( 宝鸡 文 理 学院 数 学 系 ,陕 西 宝 鸡 7 1 1 ) 20 3
摘 要 : 了提 高语 音 信 号 的 识 别 率 , 出 了一 种 改 进 的 语 音 信 号 特 征 提 取 算 法 。 算 法在 MF C 参数 的基 础 上 , 加 为 提 该 C 增 每 帧信 号 的短 时 能 量 和 短 时 过 零 率 , 得 新 参数 能 够 更 为 准 确 地 表 征 语 音 信 号 。 使 通过 仿 真 实 验 , 明 了新 特 征 参 数 取 说
Ab t a t I r e mp o e t es e c e o nt n r t , n i r v d s e c i a au ee t c in ag r h i p s n e . s r c : n o d r oi r v p e hr c g i o e a o e p e h s t h i a mp n g l e t r xr t o i m r e t d f a o l t s e T e s o t i n r ya d s o - mez r- r si g r t fe c a i n lb s d o CC p rmee sa e i c e s d i h h h r t - me e e g n h r t e o c sn ae o a h f me sg a a e n MF a a tr r n r a e n t e t i o r l oi ag rtm , h c k h e a a tr a r v d r c u ae r p e e t t n o e c i as I x li e a h w ih ma e te n w p mee c n p i e a mo e a c r t e r s n ai f p e h sg l . ti e p an d t t r s o o s n s h