02.刘振宇-基于隐马尔可夫模型的猪咳嗽声音识别的研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

参参考考模模型型库库
模模式式匹匹配配
后后处处理理

麦克风把语音输入,经过预处理阶段,对信号进行降
噪,之后进行咳嗽声音的特征提取,将咳嗽声音与咳嗽
声音的参考模型库进行模式匹配 ,匹配后的结果,即
为识别是否为咳嗽声音。
山西农业大学
Shanxi Agricultural University
实现隐马尔科夫模型分析咳嗽
山西农业大学
Shanxi Agricultural University
五、咳嗽声音识别运行过程
建立猪咳嗽声音识别系统是基于VQ量化以及HMM模型,把 线性预测倒谱系数及其差分、MFCC系数及其差分作为声音 识别的特征参数。声道生理结构的差异通过线性预测倒谱 反映,然而MFCC反映的则是声音的听觉频率非线性特性
山西农业大学
Shanxi Agricultural University
经过梅尔倒谱滤波器变换的功率谱,分别是在采样点数为 128,256,512的功率谱,在图中红,蓝分布为功率谱密度, 可以发现采样点数越大,功率谱密度越清晰,其中红色部分为咳 嗽的声音功率谱密度。
Power Spectrum (M = 43, N = 128, frames = 7P50o)wer Spectrum (M = 85,入 分帧 加窗 预加重处理
山西农业大学
Shanxi Agricultural University
去 去噪 噪
LLPPCCCC及 及其 其差 差分 分或 或MMFFCCCC及 及其 其差 差分 分的 的提 提取 取
训 训练 练V VQ Q、 、H HM MM M模 模板 板
测 测试 试V VQ Q、 、H HM MM M模 模板 板
4000
50
4000
50
Frequency [Hz]
Frequency [Hz]
3000
0
3000
0
2000
-50 -100
2000
-50 -100
1000
-150
1000
-150
0
0
2
4
Time [s]
-200
Power Spectrum (M = 171, N = 512, frames = 187) 4000 50
将一部分咳嗽声音保存成wav的格式,放在一个文件夹中, 作为一个检测的数据库.然后对检测咳嗽声音实行识别,系 统给出提示是否为此猪咳嗽声音.此步测得的准确率可达 到87.5%.在另一个模块中,在猪场中实时的录取猪的咳嗽 声音作为模板,将美尔频率倒谱系数的特征参数提取,然后 进行咳嗽声音识别,即输入一段声音,看是否为猪咳嗽声.
谢谢 THANKS
的反映信号能量分布,左图中黄颜色的部分即为咳
嗽声,右图将咳嗽声的提取放大的效果。对数功率谱
可以具象地表明信号变更情况。
Power Spectrum unmodified 4000
Power Spectrum modified through Mel Cepstrum filter
20 5000
10000
山西农业大学 三、隐马尔科夫模型的分析处理
Shanxi Agricultural University
声学模型训练
语音模型训练
语语音音训训练练数数据据、、噪噪声声数数 据据
声声学学模模型型
文文本本训训练练数数据据
语语音音模模型型//词词 典典
语语音音输输入入
预预处处理理与与数数学学 化化
特特征征提提取取
否 非 非法 法者 者
模 模式 式匹 匹配 配 匹 匹配 配成 成功 功? ?
识 识别 别结 结果 果 结 结束 束
山西农业大学
Shanxi Agricultural University
咳嗽识别运行过程
声音信号的描述可以从三个方面来讲:音调、音色和音量; 反映到其物理学特性就是:频率、波形和振幅。就频率而 言,咳嗽又不同的类型诸如:嘶哑地咳嗽声、金属音调咳 嗽声、鸡鸣样咳嗽、咳嗽声音低微或无声,嘶哑的咳嗽声 对应着低频的声音,而金属音调咳嗽又是高频的声音信号。 所以我们通过分析咳嗽音频率的不同来判断是哪一种咳嗽。 同样的,不同的咳嗽音有着各自的音色,体现出了不同的 波形,我们可以将波形通过程序描述出来,后期再通过数 字图像学的方法进行处理和识别,来辅助我们对于咳嗽音 的检测。振幅决定声音信号的响度,前面有述,不同的咳 嗽音有着不一样的响度,我们可以将它作为一种识别特征 来区别声音信号。
山西农业大学
Shanxi Agricultural University
通过matlab仿真后,得出结论,下面的四幅图形将 语音信号的波形、频谱、幅值、相位显示出来,便 于对信号的各个特征要素有个直观清楚的认识。
山西农业大学
Shanxi Agricultural University
其中不同的颜色表示不同的频率对应的功率,直观
3500
18 4500
9000
Frequency [Hz] Number of Filter in Filter Bank
3000
4000
16
8000
14 3500
7000
2500
12 3000
6000
2000
10 2500
5000
8
1500
2000
4000
6
1500
3000
1000
4
1000
2000
山西农业大学
Shanxi Agricultural University
基于隐马尔可夫模型的 猪咳嗽声音识别的研究
武志强 山西农业大学工学院
山西农业大学
Shanxi Agricultural University
研究内容
一、研究意义 二、研究现状 三、隐马尔科夫模型的分析处理 四、实现隐马尔科夫模型分析咳嗽 五、结论
山西农业大学
Shanxi Agricultural University
一、研究意义
若猪的呼吸道或肺部有炎症,就会引 发猪咳嗽。由于在大型养猪场猪的饲养 密度大,饲养员进行咳嗽声音的识别存 在很大的干扰,故仅通过人工方式监测 进行猪咳嗽声音识别就显得相当困难,重 要的是呼吸道感染会引起猪之间的传染, 造成猪场的猪大面积的死亡,因此研究 一套咳嗽声音实时监测系统具有重要的 意义。
山西农业大学
Shanxi Agricultural University
五。结论
基于HMM算法以及VQ量化,在matlab软件的基础上,对咳 嗽声音进行识别处理,特别是动物猪的咳嗽进行识别。由 于咳嗽声音是属于语音中的一部分,所以采用响应速度快, 分类相对准确的语音识别系统,算法是使用HMM,MFCC,VQ, 具有综合性能好的特点。HMM既能描述声音信号的动态变 化,又能描述声音个性特征统计分布的统计模型.
500
2
500
1000
0
0
2
4
Time [s]
0
0
2
4
Time [s]
山西农业大学
Shanxi Agricultural University
根据临界带宽的划分,可将声音频率划分成一系列三角形 的滤波器序列,即Mel滤波 器组,取每个三角形的滤波器 频率带宽内所有信号幅度加权作为某个带通滤波器的输出, 然后对所有滤波器的输出作对数运算,进一步做离散余弦 变换(DCT),即得到MFCC。通过Mel频率滤波器组得到的 Mel频谱,一般在Mel滤波器的选择中,Mel滤波器组都选 择三角形的滤波器。
算法程序分析主要是基于matlab来实现。 在matlab软件中主要是通过对数据的采集、 对信号的分析、信号的特征提取以及比对等步骤对咳嗽声 音进行分析。 ①程序运行说明 ②咳嗽声音识别流程 ③咳嗽识别运行过程
山西农业大学
Shanxi Agricultural University
程序运行说明
系统中的输入声音信号有两种方式输入:①由麦克风输入 并进行声卡数字化处理;②由录音笔录制声音信号再转入 PC机,然后再MATLAB程序中调用;之后,提取所需的线性 预测倒谱系数及其查分和梅尔倒谱系数及其差分作为特征 参数,最后进行VQ量化。
山西农业大学
Shanxi Agricultural University
3000
0
0
0
2
4
Time [s]
-200
Frequency [Hz]
2000
-50 -100
1000
-150
0
0
2
4
Time [s]
-200
山西农业大学
Shanxi Agricultural University
下面两幅图是声音信号的匹配,signal1为标准信号, signal2为待匹配信号,其中圈代表的是标准信号的 分布,叉代表的待匹配信号,他们的信号图分布基 本上吻合的。
将VQ量化与HMM识别相结合,选取LBG算法, 在进行码书设计、矢量量化的识别策略。 其中,VQ量化的声音识别能够高效地运用声音个性 特征的量化码本,对其各帧特性再特征空间中的分 布中心进行描述;HMM声音识别在描述声音信号的 动态特性的同时,又能描述声音个性特征的统计分布。
基 于
VQ 和
HMM 的 声 音 辨 认 系 统 流 程 图
山西农业大学
Shanxi Agricultural University
二、研究现状
刘红星等研究了基于共振峰和谐波能量的语音端 点检测方法,对于受非平稳复杂噪声影响的语音 信号适应性强;
石锐等研究的咳嗽音检测方法是基于高斯混合模 型,提高了系统的识别能力;
杨国清等探索了连续语音流中咳嗽信号的端点检 测方法,尽可能的减小了噪音和静音的影响。
相关文档
最新文档