基音周期检测ACF算法及MATLAB仿真
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音信号 ( ) n 的某帧信号的短时平均能量 的 定义为 :
收稿 日期 : 1 2 0—1 0 2—2 5
自相关 函数中产生一个 峰值 , 而当该 峰值又可以 同基 音频率的峰值相 比拟时 , 从而会 给基音值检测带来误
.
8 . 6
E = [ m x + ] ( ) ( m) =∑ ( ) m
一
就被称为一“ 。 帧” 一般要采用交叠分段 的方法 , 这是 为了使帧与帧之间平滑过渡 , 保持其连续性。前一帧
段具体的语音信号进行滤波、 采样、 分帧、 求短时 自
窗口长度的选择非常重要 , 窗长过短会使得分析窗内
相关函数 , 较准确地得到浊音语音信号的基音周期。
2 基 于 自相关 函数 的基音周 期 检测原 理
变化轨迹 曲线 , 或者是尽量相吻合 的轨迹 曲线。因为 它的重要性 , 基音的检测提取一直是一个研究 的课题。 为此提出了各种各样的基音检测算法 , 自相关 函数 如
工频的干扰 ; 高端截止频率设 为 90 z 0H 既可除去大部
能保留其一二次谐波。 2 2 分帧 .
分共振峰影响 , 又可 以当基音最高频率为 40 z 5 H 时仍
6 — 0 H 的带通滤波器对语音信号进行滤波 , 0 90 z 并利
用滤波后的 自相关函数来进行基音估计。将滤波器低
端截止频率设为 6 H , 0 z这是 因为可 以抑制 5 H 电源 0z
基音周期检测也称为基频检测 ( ihD t tn , P c e co ) t ei 它的目标是找出和声带振动频率完全一致 的基音周期
.
() 1
tm 0m 其 值 o ) ,:它 ( i
f ,m= 1 0一( 一1 Ⅳ )
( 2 )
…
其 中, = ,T 2 , 并且 Ⅳ为帧长 , 为帧移 n 0 I ,T …,
长度 。 由式 ( ) 明 , 1表 短时 平 均 能量 相 当于将语 音
信号的平方通过一个单位 冲激 响应为 (, 1 的线性 1 ) 滤波 器 的输 出。实验 统 计 发 现 , 音 中浊 音 段 的短 时 语
指导等。因为汉语是一种有调语 言, 基音 的变化模式
图 1 基 于 自相 关 函 数 的基 音 检 测 流程
差。为了克服这个困难 , 最常用 的方法是用一带宽为
称为声调 , 它携带着非常重要的具有辨意作用的信息 , 有 区别意义的功能 , 以, 所 基音的提取和估计对汉语更
是一个十分重要的问题。
肖正 安
( 北第二 师 范 学院 物理 与 电子信 息 学院 , 汉 400 ) 湖 武 3 25
摘 要 : 文在对 自相 关基音检测 算法进行 分析 的基础上 , 本 对此算 法进行 了深入 探讨 , 针对 具体 实例 , 考虑到检测准确度
和检 测速率 两方 面的 因素 , 引入 了三电平削波及 中值平 滑, 设计 了基 于 Maa t b的估计方 法; l 经验证 , 得到 了比较 准确 的浊
没有包含足够的数据点来进行 周期判断 , 且短时能量 变化剧 烈 ; 窗长过 长 , 时 能 量 是一 段 长 时 间 的平 均 , 短
采用 自 相关 函数基音周期检测流程如 图 1 所示 , 共包括六个模块 : 带通滤波 、 采样 、 分帧、 时能量分 短
不但不能反映语音信号基频 的细节变化部分 , 而且使
1 引言
基音是指发浊音 时声带振动所引起的周期性 , 而 基音周期是指声带振动频率的倒数 。基音周期是语音 信号最重要的参数之一 , 它描述 了语音激励源 的一个 重要特征。基音周期 信息在多个 领域有着 广泛 的应 用 , 语音识别、 如: 说话人识别、 语音分析与综合以及低 码率语音编码、 发音系统疾病诊断、 听觉残障者的语言
21 0 1年 2月
湖北第二师范学 院学报
Ju nlo b iUnv ri f u a o o ra fHu e iest o c t n y Ed i
F b 2 l e.O 1 V0 . 8 NO 2 12 o
第 2 卷第 2期 8
基音 周 期 检 测 A F算 法及 MA L B仿 真 C TA
平均 能量 远远 大于 清 音段 的短 时平 均 能 量 。因此 , 短
时平均能量 的计算给出了区分清音段与浊音段 的 依据 , ( 即 浊) > n 清 ) E( 。 24 自 . 相关 函数
图 3 “ 乐 ” 域 波 形 图 快 时
t x :1 ; hm i ( ) %使用海明窗 = ( ,) h= a m n N ; g E cn ( , t; n= ov h t ) %做卷积运算求短时能量 . Fgr;l ( n ;= i epo E ) g d% 画 图 u t 运行该程序后得到各采样点的短时能量如图 4 所 示 。从图中可以看 出 E 值大的对应于浊音, E 值 n 而 n 小的对应于清音 , 由此可以大致判断浊音变为清音或
倍 , 般 窗长选 为 1ms 2ms 一 0 一0 。 23 短 时能量 分析 .
得计算量增大。窗 口长度至少要大于基音周期的两
析、 相关计算、 自 基音周期估计 。
2 1 带通 滤波 .
பைடு நூலகம்
由于在某些浊音 中, 第一共振峰频率可能会等于
或低于基音频率。此 时, 如果其幅度很高 , 它就可能在
音 语 音 的基 音 周 期 。 关键词 : 音检测 ; 基 自相 关 函数 ; 电 平 削 波 三
中图分类号 :N 1. T 9 23
文献标识 码: A
文章编号 :6 4 17 3 x(0 10 - 8 -3 2 1 )20 60 0
作者简介 : 肖正安 (9 6一) 男, 17 , 湖北钟祥人 , 师, 士 , 究方向为数 字信号 处理及通信 电子线路 。 讲 硕 研
短时分析将语音流分为一段一段来处理 , 每一段
( C ) 、 值 提 取 算 法 ( P 、 均 度 差 函数 AF 法 峰 P A) 平
( M F 法、 A D ) 并行处理技术 、 倒谱法 、I 、 图法、 ST谱 F 小 波法等等。本文在对 自相关基音检测算法基本原理进 和后一帧的交叠部分称为帧移 。帧移与帧长的比值一 12 行分析的基础上 , 引入了三电平削波模块 , 然后通过对 般取为 0— / 。分帧时需对语音信号进行加窗操作 ,