浅谈语音信号时域与频域

合集下载

语音信号的频域分析

语音信号的频域分析

实验二:语音信号的频域分析实验目的:以MATLAB 为工具,研究语音信号的频域特性,以及这些特性在《语音信号处理》中的应用情况。

实验要求:利用所给语音数据,分析语音的频谱、语谱图、基音频率、共振峰等频域参数。

要求会求取这些参数,并举例说明这些参数在语音信号处理中的应用。

实验内容:1、 语音信号的频谱分析1.1加载“ma1_1”语音数据。

基于DFT 变换,画出其中一帧数据(采样频率为8kHz ,帧长为37.5ms ,每帧有300个样点)的频域波形(对数幅度谱)。

load ma1_1;x = ma1_1 (4161:4460); plot (x)N = 1024; k = - N/2:N/2-1;X = fftshift (fft (x.*hann (length (x)),N));plot (k,20*log10 (abs(X))), axis ([0 fix(N/2) -inf inf ])已知该帧信号的时域波形如图(a )所示,相应的10阶LPC 谱如图(b )所示。

问题1:这帧语音是清音还是浊音?基于DFT 求出的对数幅度谱和相应的LPC 谱相比,两者有什么联系和区别?问题2:根据这帧基于DFT 的对数幅度谱,如何估计出共振峰频率和基音周期?问题3:时域对语音信号进行加窗,反映在频域,其窗谱对基于DFT 的对数幅度谱有何影响?如何估计出窗谱的主瓣宽度?1.2对于浊音语音,可以利用其频谱)(ωX 具有丰富的谐波分量的特点,求出其谐波乘积谱:∏==R r r X HPSx 1)()(ωω式中,R 一般取为5。

在谐波乘积谱中,基频分量变得很大,更易于估计基音周期。

1.3加载“vowels.mat”语音数据,分别画出一帧/i/和一帧/u/(采样频率为10kHz,帧长为30ms,每帧有300个样点)的基于DFT的对数幅度谱。

其Matlab代码如下:load vowelsx = vowels.i_1(2001:2300);N = 1024; k= -N/2:N/2-1;X = fftshift (fft (x.*hann (length(x)),N));plot (k,20*log10(abs(X))), axis([0 fix(N/2) 0 100])x = vowels.u_1(2001:2300);N= 1024; k = -N/2:N/2-1;X = fftshift (fft (x.*hann(length(x)),N));plot (k,20*log10(abs(X))), axis([0 fix(N/2) 0 100])1.4画出一帧清音语音的基于DFT的对数幅度谱。

语音信号处理第3章-语音信号分析

语音信号处理第3章-语音信号分析

0.54 0.46cos[2n /( N 1)], 0 n ( N 1) (n) 0, n else
信息科学与工程学院 东南大学
预处理
窗函数的形状和长度对短时参数特征影响 很大 1.窗口形状
时域:要减小时间窗两端的坡度,使窗口边缘 两端不引起急剧变化而平滑过渡到零,这样可 以使截取出的语音波形缓慢降为零,减小语音 帧的截断效应; 频域:要有较窄的3dB带宽以及较大的旁瓣衰 减(较小的边带最大值)。这里只以典型的矩形 窗和汉明窗为例进行比较。
0
20
40
60
80
100
120
140
160
0.1 0.05 0 -0.05 -0.1
0
20
40
60
80 k = -21
100
120
140
160
信息科学与工程学院
东南大学
0.1 0.05 0 -0.05 -0.1
0
20
40
60
80
100
120
140
160
0.1 0.05 0 -0.05 -0.1
0
20
信息科学与工程学院 东南大学
矩形窗与汉明窗的比较
窗类型
矩形窗 汉明窗
旁瓣峰值
-13 -41
主瓣宽度
4π/N 8π/N
最小阻带衰减
-21 -53
汉明窗的主瓣宽度比矩形窗大一倍,即带宽约增 加一倍,同时其带外衰减也比矩形窗大一倍多, 汉明窗比矩形窗更为合适。因此,对语音信号的 短时分析来说,窗口的形状是至关重要的。
信息科学与工程学院 东南大学
数字化和预处理
经过数字化和预处理过程,语音信号就已 经被分割成一帧一帧的加过窗函数的短时 平稳信号 对每一个短时语音帧,利用数字信号处理 技术来提取语音特征参数。

语音信号时域和频域通俗理解

语音信号时域和频域通俗理解

语音信号时域和频域通俗理解语音信号是一种广泛使用的信号类型,它包含了人类声音的各种特征。

在理解语音信号时域和频域的表现时,首先需要理解这两个概念的基本含义。

时域:在时间域中,信号是按照时间顺序排列的一组值。

对于语音信号,每一帧或每个样本点都代表了声音在不同时刻的强度或幅度。

在语音信号处理中,时域分析通常涉及对这些样本点进行各种操作,如加权、过滤、卷积等。

时域分析可以揭示信号的瞬态特性,如声音的起始和结束,但其对频率成分的敏感性较低。

频域:在频域中,信号被转换成了频率成分的形式。

这意味着我们将信号分解为一系列不同频率的分量,每个分量都有其特定的幅度和相位。

在语音信号中,这些频率成分反映了声音的各个部分(如基频、谐波等)如何由不同的振动模式产生。

频域分析提供了对信号的全面理解,因为它能够揭示信号的能量如何分布在不同的频率上。

现在,让我们更深入地理解语音信号在时域和频域的表现:时域中的语音:当我们说话时,我们的声带会振动并产生声音。

这些振动会产生一系列的样本点,这些点在时间上按顺序排列。

如果我们观察这些样本点,我们可能会注意到声音的起始和结束,以及一些明显的变化。

但是,如果我们想了解更多关于声音的内容,比如它的基频或谐波结构,我们需要在频域中进行分析。

频域中的语音:当我们观察语音信号的频谱时,我们会看到一系列的频率成分。

这些成分可以代表基频、谐波以及其他声音特征。

例如,如果一个声音的主要成分是基频,那么我们可能会看到一个明显的峰值在低频区域。

如果一个声音包含多个谐波,我们可能会看到一系列更高或更低的频率成分。

了解这些频率成分可以帮助我们更好地理解声音的特征,比如音调、音量等。

总之,理解语音信号时域和频域的表现对于语音处理和通信等领域非常重要。

在时域中,我们关注声音的瞬态特性;而在频域中,我们关注声音的频率成分。

通过将信号从一种表示转换到另一种表示,我们可以更全面地了解和处理语音信号。

语音信号的时域特征与频域特征

语音信号的时域特征与频域特征

实验报告课程名称____________语音信号处理__________________ 实验项目语音信号的时域特征与频域特征实验仪器__台式计算机、Matlab软件、Cool Edit__系别____信息与通信工程学院_____专业_____电子信息工程专业______班级/学号_____学生姓名___________________实验日期_______2013/4/17________成绩_________________________指导教师_____________________实验一:语音信号的时域特征与频域特征一、实验目的使学生通过本实验观察语音信号在时域和频域的基本特征(语音波形、基音频率、过零数、共振峰),验证教材中关于语音信号在时域和频域的基本特征的概念与论述;通过采集语音数据与在实验中记录每个元音的基音周期、过零数、共振峰等环节熟悉这些语音的基本特征,为今后深入学习语音信号处理奠定基础。

二、实验内容学习音频编辑软件Cool Edit的使用方法及语音文件的建立;采集语音数据;观察语音波形;记录每个元音的基音周期(其倒数为基音频率)、过零数、共振峰;观察语音频域特征;分析不同元音的共振峰模式的特点(频率、相对振幅)。

三、实验原理元音与辅音在发音方法有如下基本区别:发元音时气流顺利通过声腔,声带颤动,形成的声波是周期性的;发辅音时气流暂时被阻不能通过或只能勉强挤出去。

元音具有基音与共振峰结构,辅音则不具有这两者。

基音由声带振动频率产生,决定语音的音高、音调。

在语音波形中表现为准周期峰值。

共振峰是语音频谱上的强频区,表现为频谱上呈峰状。

共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。

每个元音有特定的共振峰模式。

四、实验方法与实验步骤(一)音频编辑软件Cool Edit的使用方法及语音文件的建立①点击桌面上“cool edit”图标,选不同项可激活cool edit菜单中不同功能。

声音的时域频域分析

声音的时域频域分析

4000 4500
5000
4000 2000 0
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
不同类型声音对比分析
男声的频谱图 2000 1800 1600 1400
女声的频谱图 3000
幅度
2500
2000
1200 1000 800 600 400
1500
1000
500
200 0
0
500
1000 1500 2000 2500 3000 3500 4000 4500 5000 frequency/Hz
0
0
500
1000 1500 2000 2500 3000 3500 4000 4500 5000
不同类型声音对比分析
笛子的语谱图 钢琴的语谱图
20
20
频 率 /Hz
10
频 率 /Hz
频 率 /Hz
10
频 率 /Hz
幅度
15
15
10
5
5
0
0
2
4
6 时 间 /s 萨克斯的语谱图
8
10 x 10
-3
0
不同的采样频率 3.不同的采样频率
采样频率递增 5000HZ 11025HZ 22050HZ 明显感觉音质 变差,音量也 感觉变小 声音近乎无法 分辨,音质音 量均大幅降低
声音变嘈杂, 可以感觉出 音质变差
不同类型声音对比分析
男声的频谱图 2000 1800 1600 1400 2000 1800 1600 1400 1200 1000 800 600 400 200 0 采 样 频 率 将 为 原 来 的 1/2的 频 谱 图

语音信号的频域分析概述

语音信号的频域分析概述

第3页
2021年12月8日星期三
从广义上讲,语音信号的频域分析包括语音信号的 频谱、频谱包络、功率谱、倒频谱等。常用的频域分析 方法有带通滤波器组法、傅里叶变换法、线性预测法等 几种。本节介绍语音信号的傅里叶分析法。
短时傅里叶变换最重要的应用是语音分析与合成系 统,因为由短时博里叶变换可以精确地恢复语音波形。
第4页
2021年12月8日星期三语音信号及单片机处理语音信号及单片机处理
语音信号的频域分析概述
在语音信号处理中,傅里叶表示一直起主要作用。 其原因在于:一方面,稳态语音的生成模型由线性系统 组成,此系统由一个随时间周期变化或随机变化的源所 激励,因而系统输出频谱反映了激励与声道频率响应特 性;另一方面,语音信号的频谱具有非常明显的语言声 学意义,可以获得某些重要的语音特征(如共振峰频率 和带宽等)。
第2页
2021年12月8日星期三
语音信号是非平稳信号,其非平稳性是由发音器官 的物理运动过程而产生的。这个运动过程与声波振动 的速度比起来要缓慢得多,因此可以假定它在10~30 ms这样短的时间段内是平稳的。所以对语音信号处理 来说,短时分析的方法是有效的。短时分析应用于频 域分析就是短时傅里叶变换,相应的频谱称为“短时 谱”,即有限长度的傅里叶变换。

语音信号采集与时频域分析正文

语音信号采集与时频域分析正文

第一章引言语音信号是一种非平稳的时变信号,它携带着各种信息。

在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。

语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。

语音信号分析可以分为时域和频域等处理方法。

语音信号可以认为在短时间内(一般认为在 10~30ms 的短时间内)近似不变,因而可以将其看作是一个准稳态过程, 即语音信号具有短时平稳性。

任何语音信号的分析和处理必须建立在“短时”的基础上, 即进行“短时分析”。

时域分析:直接对语音信号的时域波形进行分析,提取的特征参数有短时能量,短时平均过零率,短时自相关函数等。

频域分析:对语音信号采样,并进行傅里叶变换来进行频域分析。

主要分析的特征参数:短时谱、倒谱、语谱图等。

本文采集作者的声音信号为基本的原始信号。

对语音信号进行时频域分析后,进行加白噪声处理并进行了相关分析,设计滤波器并运用所设计的滤波器对加噪信号进行滤波, 绘制滤波后信号的时域波形和频谱。

整体设计框图如下图所示:图1.1时频域分析设计图图1.2加噪滤波分析流程图第二章 语音信号时域分析语音信号的时域分析可直接对语音信号进行时域波形分析,在此只只针对语音信号的短时能量、短时平均过零率、短时自相关函数进行讨论。

2.1窗口选择由人类的发生机理可知,语音信号具有短时平稳性,因此在分析讨论中需要对语音信号进行加窗处理进而保证每个短时语音长度为10~30ms 。

通常选择矩形窗和哈明窗能得到较理想的“短时分析”设计要求。

两种窗函数的时域波形如下图2.1所示:samplew (n )samplew (n )图2.1 矩形窗和Hamming 窗的时域波形矩形窗的定义:一个N 点的矩形窗函数定义为如下{1,00,()n Nw n ≤<=其他(2.1)哈明窗的定义:一个N 点的哈明窗函数定义为如下0.540.46cos(2),010,()n n NN w n π-≤<-⎧⎨⎩其他= (2.2)这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图2.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;哈明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。

语音信号处理第4讲剖析

语音信号处理第4讲剖析
4.1概述 4.2语音分帧 4.3语音信号的时域分析 4.4语音信号的频域分析
4.1 概述
语音信号分析 语音信号处理的前提和基础,只有分析出可表示语音信号 特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和 语音识别等处理。
贯穿于语音分析全过程的是“短时分析技术” 语音信号从整体来看其特征及表征其本质特征的参数均是随时间而变
分析方法的不同: 模型分析方法和非模型分析方法
不论是分析怎么样的参数以及彩什么分析方法,在按帧进行 语音分析,提取语音参数之前,有一些经常使用的、共同的 短时分析技术必须预先进行,如语音信号的数字化、语音信 号的端点检测、预加重、加窗和分帧等,这些也是不可忽视 的语音信号分析的关键技术。
4.2 语音分帧
①表示语音信号比较直观、物理意义明确。 ②实现起来比较简单、运算量少。 ③可以得到语音的一些重要的参数。 ④只使用示波器等通用设备,使用较为简单等。
短时平均能量及含义
N 1
N 1
短时平均能量:E n xn 2(m ) (m )x(nm )2
m 0
m 0
每区一个n,得到一个 E n
短时能量及短时平均幅度分析
S ( e j ) k m x ( m ) x ( m k ) e j k X ( e j ) X * ( e j ) X ( e j ) 2
根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之 间的关系:
进行过预加重数字滤波处理后,接下来就要进行加窗分帧处 理。一般每秒的帧数约为33-100帧,视实际情况而定。分帧 虽然可以采用连续分段的方法,但一般要采用如图3-1所示 的交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持 其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧 长的比值一般取为0-1/2。

实验一、语音信号的时域特性和频域特性

实验一、语音信号的时域特性和频域特性

实验一、语音信号的时域特性和频域特性实验一、语音信号的时域特性和频域特性学院:信息与通信工程学院专业:通信工程班级:104学号:2010026410姓名:黄余芳指导教师:崔艳秋1.实验名称语音信号的时域特性和频域特性2.实验类型验证性实验3.实验目的观察并验证语音信号的时域特性和频域特性,理解并掌握典型的语音信号时域分析方法和频域分析方法,为深入学习数字语音信号处理的相关理论奠定基础。

4.实验设备安装有MATLAB的计算机5.实验内容1.输入并运行MATLAB代码。

2.观察语音信号的时域特性(1)发一个清音和一个浊音,由麦克风采集语音数据,参考实验内容1中的程序将这些数据分别存成两个“.wav”文件(例如[a]的语音存为“”,要求采样率为8000),存在本人的文件夹中。

(2)读取WA V文件,显示语音波形,观察清音和浊音波形的差异。

(3)读取WA V文件,计算并显示语音的短时能量(要求分帧加窗的帧长为256,帧移为128),观察并分析清音和浊音短时能量的差异。

(4)读取WA V文件,计算并显示语音的短时过零率(要求分帧加窗是的帧长为256,帧移为128),观察并分析清音和浊音短时过零率的差异。

3. 观察语音信号的频域特性(1)读取WA V文件,计算并显示一帧语音的原始信号、加窗信号、短时频谱(要求分帧加窗的窗函数为汉明窗、帧长为256,帧移为128),观察并分析清音和浊音短时频谱的差异。

(2)读取WA V文件,计算并显示不同窗函数情况下一帧语音的加窗信号、短时频谱(要求分帧加窗的窗函数分别为矩形窗和汉明窗、帧长为256,帧移为128),观察并分析不同的窗函数对短时谱分析的影响。

6.相关函数wavread、plot、fft7.MATLAB程序代码1. 输入并运行以下MATLAB代码。

(1) 短时能量clear;close all;Fs=11025;y=wavrecord(5*Fs,Fs,'double'); wavwrite(y,'f:\\a');soundview(y,Fs);x = wavread('f:\\a.wav');x = double(x);x = filter([1 -0.9375], 1, x); % 预加重FrameLen = 256;FrameInc = 128;s = enframe(x, FrameLen, FrameInc); energy = sum(abs(s), 2);figure;subplot(2,1,1);plot(x);title('语音信号时域波形');xlabel('样点数');ylabel('幅度');subplot(2,1,2);plot(energy);title('语音信号的短时能量');xlabel('帧数');ylabel('短时能量');legend('帧长FrameLen = 240'); (2) 短时过零率clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen = 256;FrameInc =128;tmp1 = enframe(x(1:end-1), FrameLen, FrameInc);tmp2 = enframe(x(2:end) , FrameLen, FrameInc);signs = (tmp1.*tmp2)<0;diffs = (tmp1 -tmp2)>0.02;zcr = sum(signs.*diffs, 2);figure;subplot(2,1,1);plot(x);title('语音信号时域波形');xlabel('样点数');ylabel('幅度');subplot(2,1,2);plot(zcr);xlabel('帧数');ylabel('短时过零率');title('语音信号的短时过零率');(3) 短时傅里叶变换clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(50,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*hamming(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加Hamming窗时语音频谱');(4) 显示清音短时过零率clear;close all;x = wavread('f:\\k.wav');x = double(x);FrameLen = 256;FrameInc =128;tmp1 = enframe(x(1:end-1), FrameLen, FrameInc); tmp2 = enframe(x(2:end) , FrameLen, FrameInc); signs = (tmp1.*tmp2)<0;diffs = (tmp1 -tmp2)>0.02;zcr = sum(signs.*diffs, 2);figure;subplot(2,1,1);plot(x);title('语音信号时域波形');xlabel('样点数');ylabel('幅度');subplot(2,1,2);plot(zcr);xlabel('帧数');ylabel('短时过零率');title('语音信号的短时过零率');2:语音信号的频域分析1.加汉明窗的浊音clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(125,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*hamming(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加Hamming窗时语音频谱2.加汉明窗的清音clear;close all;x = wavread('f:\\k.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(90,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*hamming(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加Hamming窗时语音频谱3.加矩形窗的浊音clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(125,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*rectwin(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加矩形窗时语音频谱)8.实验结果及其分析浊音(1) 短时能量00.51 1.52 2.53 3.54x 104-1012语音信号时域波形样点数幅度050100150200250300350050100语音信号的短时能量帧数短时能量帧长FrameLen = 240(2) 短时过零率00.51 1.52 2.53 3.54x 104-1-0.500.51语音信号时域波形样点数幅度0501001502002503003500102030帧数短时过零率语音信号的短时过零率(3) 短时傅里叶变换1截取的语音段样点数幅度0501001502002501窗选语音信号样点数幅度-1000频率/Hz对数幅度/d B 加Hamming 窗时语音频谱清音(1) 短时能量 x 10412语音信号时域波形样点数幅度0204060语音信号的短时能量帧数短时能量帧长FrameLen = 240(2) 短时过零率00.51 1.52 2.53 3.54x 104-1-0.50.51语音信号时域波形样点数幅度05101520帧数短时过零率语音信号的短时过零率 (3) 短时傅里叶变换1截取的语音段样点数幅度1窗选语音信号样点数幅度05001000150020002500300035004000-1000频率/Hz对数幅度/d B 加Hamming 窗时语音频谱(4) 显示清音短时过零率x 1041语音信号时域波形样点数幅度05101520帧数短时过零率语音信号的短时过零率加窗(1)加汉明窗的浊音050100150200250-101截取的语音段样点数幅度050100150200250-101窗选语音信号样点数幅度0100020003000400050006000-100-500频率/Hz 对数幅度/d B 加Hamming 窗时语音频谱(2)加汉明窗的清音050100150200250-101截取的语音段样点数幅度-101窗选语音信号样点数幅度-100-500频率/Hz 对数幅度/d B 加Hamming 窗时语音频谱(3)加矩形窗的浊音-101截取的语音段样点数幅度-101窗选语音信号样点数幅度-100-500频率/Hz 对数幅度/d B 加矩形窗时语音频谱分析:(1)对于浊音与清音,浊音的幅值比较明显,有一个的波动,能清楚的看清楚它的周期;而清音类似于白噪声,没有明显的幅值,很平缓。

语音信号的时域和频域特征

语音信号的时域和频域特征

24
25
4.2.2. 频域上的基音检测方法
在频域中,常常是用谐波分析法,即对浊音信号的谱线结 构进行分析来计算得到基音周期。
[注意] 在频域上可能不存在与基频对应的谱线。
26
4.3. 基音的平滑
由于在基音的提取过程中不可避免地要产生误差,主要是 基音周期减半或加倍的现象(根据方法的不同,误差的现象会 有所不同) 。一般情况下 90%左右的基音周期都会被准确提取, 但是总有少部分的基音是提取不准确的。因此需要采取平滑的 方法去掉这些奇异点。 在语音编码和汉语四声识别中,基音平滑直接影响到系统 的性能。
R (l ) =
N − l −1 n=0
∑S
w
(n + l ) ⋅ S w ( n)
当 l = n ⋅ T , n = 1,2 ,L 时, R(l) 函数接近局部极大值。 自相关法特点:在这个算法中使用了乘-累加操作。在数字
21
信号处理器中有专门的硬件指令来快速完成(只要一个周期) 这种乘-累加运算。因此这种算法在 DSP 中得到了普遍的应用。 无论是使用 AMDF 法或是自关法求语音信号的基音周期, 都要在基音周期 T 的范围内 [Tmin , Tmax ] 搜索 γ (l ) 或 R(l) 的极 值点位置。一般取 0.5 ⋅ Tmin < l < 1.5 ⋅ Tmax ,先计算所有的 γ (l ) 或 R(l) 值,然后再搜索得到基音。
3.3.2. 浊音谱的共振峰结构
频谱包络中有几个凸起点,与声道的谐振频率相对应。这 些凸起点称为共振峰(Formant) 。其频率称为共振峰频率。按 频率由低到高依次为第一共振峰、第二共振峰…。相应频率用 F1、F2、F3…来表示。
14

第4章语音信号的时域分析

第4章语音信号的时域分析
预加重、加窗、分帧等, ?本章重点:语音信号的各种时域分析技术,是语音处理技术
的基础知识。
第4章 语音信号的时域分析
4.2 语音信号的数字化和预处理
第4章 语音信号的时域分析
4.2 语音信号的数字化和预处理 ?信号数字化:放大、增益控制、反混叠滤波、取样、
A/D变换及编码(PCM 编码); ?预处理:预加重、加窗、分帧、端点检测等; ?图4.1:语音信号数字分析或处理的系统框图。
?数字化的反过程是从数字化语音中重构语音波形。 ?必须在D/A后加平滑滤波器,对重构的语音波形的高次谐波起
平滑作用,以去除高次谐波失真。 ?预滤波、取样、A/D和D/A变换、平滑滤波等许多功能可以用
一块芯片完成,在市场上有多种这样的集成芯片供选用。
第4章 语音信号的时域分析
4.2 语音信号的数字化和预处理
? ? Mn ?
?? x(m)w(n ? m) ?
m ???
n? N ?1 x(m)w(n ? m)
m?n
? ? 或 Mn ?
?? x(m) h(n ? m) ?
m???
n? N ?1 x(m) h(n ? m) ? x(n) ? h(n)
m? n
式中,h(n) =∣w(n)︳通常窗函数w(n)≥0 ,所以h(n) = w(n)。
?
x2k / 2
? ??0
I0(? )
——零阶贝塞尔函数,
k ?0 (k !)2
0? n? N?1 其他
第4章 语音信号的时域分析
?图4.3、 4.4 :窗函数的波形 ◆矩形窗主瓣最窄,频率分辨度
最高,频率泄漏最大; ◆ Blackman 窗频率分辨度最低,
频率泄漏最小。 ◆常用矩形窗、Hamming 窗。

语音信号处理的基础知识

语音信号处理的基础知识

语音信号处理的基础知识语音信号处理是一门涉及到声音录制、分析、编码、识别等多个学科的交叉领域,其在现代通信技术、人机交互等领域中发挥着重要作用。

本文将介绍语音信号处理的基础知识,包括语音的参数表示、语音的数字化、语音的编码和解码等方面。

一、语音的参数表示语音信号的参数表示是指将语音信号表示为具有物理意义的、易于处理的数学参数。

在语音信号的参数表示中,常用的方法包括时域参数和频域参数两种。

时域参数是指将语音信号分段,然后对每一段信号进行时域特征分析,将其表示为均值、方差、能量、过零率等参数。

时域参数的优点是对信号的采样率没有要求,因此对于不同采样率的语音信号都可以进行处理。

但是,时域参数的缺点是对于语音信号中的高频成分无法处理,因此无法反映语音信号的高频特性。

频域参数是指将语音信号进行傅里叶变换,将信号变换到频域后,对于每个频率分量进行幅度、相位等特征参数提取。

频域参数的优点在于可以反映语音信号的高频特性,因此在语音识别、声码器设计等方面有重要应用。

但是频域参数的缺点在于对于信号的采样率有一定要求,因此需要进行抽样和重构处理,这样会引入一定的误差。

二、语音的数字化语音的数字化是指将模拟语音信号转换为数字信号的过程,其目的在于便于存储和处理。

在数字化语音信号中,一般采用脉冲编码调制(PCM)技术进行采样和量化。

脉冲编码调制是一种通过改变脉冲宽度、位置和幅度等参数来表示信号的方法。

在语音数字化中,采用的是线性脉冲编码调制,即将模拟语音信号进行采样、量化后转换为数字信号。

采样是指将模拟信号在时间轴上离散化,量化是指将采样信号的振幅幅度量化为离散的数值。

采样和量化的具体实现可以采用多种算法,如最近邻量化、线性量化、对数量化和均衡限制量化等。

三、语音的编码和解码语音信号编码是指将语音信号转换为适合传输和存储的码流。

在语音信号编码中,常用的方法包括线性预测编码(LPC)、自适应差分编码(ADPCM)、快速傅里叶变换编码(FFT)、线性预测离散余弦变换编码(LPDCT)等。

实验1 语音信号时域与频域分析

实验1 语音信号时域与频域分析
• 首先对语音信号序列进行成对采样地查对采样 以确定是否发生过零 ,若发生符号变化 , 则表 示有一次过零 ,而后进行一阶差分计算 ,再求 取绝对值 , 最后进行低通滤波。
例: 任选一段语音信号 ,对其进行采样 , 画出采 样以后的时域波形。
[x1,fs]=wavread ( "c :\wang .wav ") ; %读取语音信 号
x),FrameLen4, FrameInc)), 2) ; subplot (5, 1,5) ;plot (amp) ; title ( " 短 时 平 均 能 量 图 "
四 、实验报告要求
1 、简述实验目的和实验原理; 2 、matlab程序清单及结果图形; 3 、实验结果分析
添加:VOICEBOX工具箱
MATLAB\r2007b\toolbox\ voicebox")) • 检验是否成功设置的方法:
which activlev.m
N太小 , 滤波器的通带变宽 , 短时能量随时间有剧烈 变化 , 不能得到平滑的能量函数。
• 窗口的选择(长度的确定)又需相对不同的基 音周期来选择 。通常情况下 , 一个语音帧内应 含有1—7个基音周期 。然而不同的人其基音周 期变化范围很大 , 因此窗口宽度(N) 的选择 有一个折衷选择为100—200(即10—20ms持续 时间) 。
语音信号特性是随时间而变化的 , 是一个非平稳 的随机过程 。但从另一方面 , 在一个相对短时间范 围内其特性基本保持不变 。对于这种特点是语音信 号处理的一个重要出发点 。 因此我们可以采用平稳 过程的分析处理方法来处理语音。
时域分析
• 时域分析是语音分析中最早使用 ,应用范围最 广的一种方法。
x),FrameLen 1, FrameInc)), 2) ; subplot (5, 1,2) ;plot (amp) ; title ( " 短 时 平 均 能 量 图 "

语音信号_实验报告

语音信号_实验报告

一、实验目的1. 理解语音信号的基本特性及其在数字信号处理中的应用。

2. 掌握语音信号的采样、量化、编码等基本处理方法。

3. 学习语音信号的时域、频域分析技术。

4. 熟悉语音信号的增强、降噪等处理方法。

二、实验原理语音信号是一种非平稳信号,其特性随时间变化。

在数字信号处理中,我们通常采用采样、量化、编码等方法将语音信号转换为数字信号,以便于后续处理和分析。

三、实验内容1. 语音信号的采集与预处理- 使用麦克风采集一段语音信号。

- 对采集到的语音信号进行预加重处理,提高高频成分的幅度。

- 对预加重后的语音信号进行采样,采样频率为8kHz。

2. 语音信号的时域分析- 画出语音信号的时域波形图。

- 计算语音信号的短时能量和短时平均过零率,分析语音信号的时域特性。

3. 语音信号的频域分析- 对语音信号进行快速傅里叶变换(FFT)分析,得到其频谱图。

- 分析语音信号的频谱特性,提取关键频段。

4. 语音信号的增强与降噪- 在语音信号中加入噪声,模拟实际应用场景。

- 使用谱减法对加噪语音信号进行降噪处理。

- 对降噪后的语音信号进行主观评价,比较降噪效果。

5. 语音信号的回放与对比- 对原始语音信号和降噪后的语音信号进行回放。

- 对比分析两种语音信号的时域波形、频谱图和听觉效果。

四、实验步骤1. 采集语音信号- 使用麦克风采集一段时长为5秒的语音信号。

- 将采集到的语音信号保存为.wav格式。

2. 预处理- 使用Matlab中的preemphasis函数对采集到的语音信号进行预加重处理。

- 设置预加重系数为0.97。

3. 时域分析- 使用Matlab中的plot函数画出语音信号的时域波形图。

- 使用Matlab中的energy和zero crossing rate函数计算语音信号的短时能量和短时平均过零率。

4. 频域分析- 使用Matlab中的fft函数对语音信号进行FFT变换。

- 使用Matlab中的plot函数画出语音信号的频谱图。

第03讲 语音信号变换域(频域+倒谱)分析

第03讲 语音信号变换域(频域+倒谱)分析

际上是Xn e j
在频域的取样,如下所示
j2k
N 1
j 2 km
Xn e N X n k xn m e N , 0 k N 1
m0
在语音信号数字处理中,都是采用 xn m 的离散傅立叶
变换 Xn k 代替 Xn e
变换(FFT)算法完成由
j , 并且可以用高效的快速傅立叶 xn m 至 Xn k 的转换。当然,
W e j 必须是一个冲激函数。窗长越长W,e j 的主瓣越狭
窄尖锐,则Xn e j
越接近X e j
。 但窗长太大时
,窗选信号已经不满足语音的短时平稳特性,此X时n e j
已不能正确反映短时语音的频谱了。为此,必须要折中选
择窗长。
▪ 令角频率 2 k n 则得到离散的短时傅立叶变换,它实
150
200
250
300
讨论:窗口形状对短时谱的影响
下面给出采样率8kHz,窗长400点(50ms)情况下 ,分别用矩形窗与汉明窗选取同一段浊音信号, 求得其对数幅度谱。简单分析一下不同的窗函数 对语音信号短时谱的影响。
矩形窗加窗的浊音波形及其短时频谱 汉明窗加窗的浊音波形及其短时频谱
由上图可看出:
(第二讲)
1 语音信号的频域分析
2 语音信号的倒谱分析
§3.4 语音信号的频域分析
▪ 语音信号的频域分析就是分析语音信号的频域特征。 从广义上讲,语音信号的频域分析包括语音信号的频 谱、功率谱、倒频谱、频谱包络分析等。
▪ 常用的频域分析方法有带通滤波器组法、傅里叶变换 法、线性预测法等几种。
▪ 本节介绍的是语音信号的傅里叶分析法。
“短时谱”
▪ 短时分析将语音流分为一段一段来处理,每一段称为一“帧” ;

第03讲 语音信号变换域(频域+倒谱)分析

第03讲 语音信号变换域(频域+倒谱)分析

由图可见:
由于窗长很短,所选出的语音段甚至不到一个基音周期长度, 因此语音段丢失了关于基音周期的信息,表现在短时谱上 就是反映基音频率和谐波的快速变化特点消失了,短时谱 中只保留着慢速变化的特点,也就是还保持着声道滤波器
的共振峰。由于矩形窗具有更高的频谱分辨率,因此其短
时频谱不如汉明窗平滑。
从以上对窗函数和短时频谱的讨论可以得出以下结论: • 1)矩形窗和汉明窗的主瓣狭窄且旁瓣衰减较大,具有低 通的性质。窗越长,主瓣越窄,加窗后的频谱能更好地逼 近短时语音的频谱。 • 2)窗长越长,频谱分辨率越高,但由于长窗的时间平均 作用导致时间分辨率相应下降,如共振峰在不同的基音周 期是要发生变化,但如果使用较长的窗则会模糊这种变化。 • 3)窗长越短,时间分辨率越高,但频率分辨率相应降低。 如采用短窗可以清楚地观察到共振峰在不同基音周期的变 化情况,但是基频以及谐波的精细结构在短时频谱图上消 失了。 • 4)由于时间分辨率和频谱分辨率的相互矛盾关系,在进 行短时傅里叶变换时,应根据分析的目的来折中选择窗长。
X n (e j ) xn (m)e jm
m 0 N 1
m


x m w n m e jm

m


x m e jm w n m
当w固定不变时, X n (e j ) 可视为信号 x m e jm 与窗函数 w n 的卷积,此时,短时傅立叶变换可看作线性滤波.
• 在语音信号数字处理中,功率谱具有重要意义,在一些语音 应用系统中,往往都是利用语音信号的功率谱。根据功率谱 定义,可以写出短时功率谱与短时傅里叶变换之间的关系:
S n (e ) X n (e ) X (e ) X n (e )

语音信号时域和频域通俗理解_概述及解释说明

语音信号时域和频域通俗理解_概述及解释说明

语音信号时域和频域通俗理解概述及解释说明1. 引言1.1 概述语音是人类最基本、也是最常用的沟通方式之一。

人们通过声音来传递信息和表达情感。

对于语音信号的分析和处理,时域和频域是两个重要的角度。

时域分析主要关注声音信号在时间上的变化规律,而频域分析则关注声音信号在频率上的成分组成。

1.2 文章结构本文将以通俗易懂的方式,对语音信号的时域和频域进行解释和说明。

首先,我们将介绍时域和频域分析的基本概念及其重要性,然后详细讨论时域与频域分析中涉及到的关键点和方法。

最后,我们将总结观点并给出读者一些启示和建议。

1.3 目的本文旨在帮助读者理解语音信号时域与频域这两个概念,并且能够清晰明了地认识到它们在语音信号处理中所起到的作用。

通过对时域与频域分析方法的说明,读者可以更好地理解并应用这些知识于实际问题中。

同时,本文也希望能够引发读者对语音信号处理的更深层次的思考和探索。

2. 语音信号时域与频域通俗理解:2.1 语音信号时域分析:语音信号的时域分析是对声音在时间上的变化进行研究和处理。

时域分析主要关注声音的振幅和时间之间的关系。

在时域中,我们可以观察到声音振动的波形图。

当我们录制一段语音时,在录制过程中,麦克风会将声音转换为电信号,并按照一定的采样率记录下来。

这些记录的电信号就是我们所说的波形图。

波形图横坐标表示时间,纵坐标表示振幅。

通过观察波形图,我们可以获得很多有用的信息。

例如,振幅可以告诉我们声音的强度或者说响度,而波形图上不同部分振幅大小和模式的变化可以揭示出不同语音特征(如元音、辅音等)以及语速、语调等信息。

2.2 语音信号频域分析:语音信号的频域分析是对声音中各种频率成分进行研究和处理。

频域分析更注重声音中各个频率成分之间的关系以及它们在声谱上呈现出来的特征。

通过傅里叶变换的方法,我们可以将时域中记录的波形图转换为频谱图。

频谱图显示了声音中不同频率成分在整个录制时间内的存在情况。

横坐标表示频率,纵坐标表示声音强度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随机信号分析及应用题目:浅谈语音信号时域与频域学生姓名学号指导教师王琳院系信息科学与技术学院专业电子信息科学与技术年级2011级摘要目的:研究语音信号的时域和频域分析的特点与应用。

方法:中英文相关文献结合分析。

结果:采用一系列图像分析和处理技术,实现了语音信号的基本处理的功能,经过测试运行,本设计圆满的完成了对语音信号的读取与打开;较好的完成了对语音信号的频谱分析,通过fft变换,得出了语音信号的频谱图。

结论:时域的表示较为形象与直观,频域分析则更为简练,剖析问题更为深刻和方便。

目前,信号分析的趋势是从时域向频域发展。

然而,它们是互相联系,缺一不可,相辅相成的。

关键词:语音信号,时域,频域,傅里叶变换AbstractObjective: to study the characteristics of speech signal in the time domain and frequency domain analysis and application. Methods: literature combined with analysis in both Chinese and English. Results: by using a series of image analysis and processing technology, can realize the function of the basic processing of speech signal, through the test run, this design successfully finished the reading of the speech signal and open; by FFT transformation, it is concluded that the figure of speech signal spectrum. Conclusion: the time-domain said more image and intuitive, frequency domain analysis is more succinct, analyze the problem more deeply and convenient. At present, the trend of the signal analysis from time domain to frequency domain development. However, they are linked to each other, be short of one cannot, complementary to each other.Key words: random signal, the time domain, frequency domain, the sampling theorem, the Fourier transform.引言语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。

作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。

可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作.语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系.并且一起发展。

一.语音信号的相关特性(一).语音信号的获取为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。

取样是将时间上连续的语音信号离散化为一个样本序列。

经过预滤波和采样后,由A/D变换器变换为二进制数字码。

语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D变换、量化处理的离散的数字语音信号。

我们可利用windows自带的录音机录制语音文件,图1-1是基于PC机的语音信号录制过程,声卡可以完成语音波形的A/D转换,获得WAV文件,为后续的处理储备原材料。

(二). 语音信号的特点1.在频域内,语音信号的频谱分量主要集中在300~3400Hz的范围内。

利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。

2.在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。

在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。

二.语音信号的时域分析(一).窗口的选择通过对发声机理的认识,语音信号可以认为是短时平稳的。

在5~50ms的范围内,语音频谱特性和一些物理特性参数基本保持不变。

我们将每个短时的语音称为一个分析帧。

一般帧长取10~30ms。

我们采用一个长度有限的窗函数来截取语音信号形成分析帧。

通常会采用矩形窗和汉明窗。

在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。

(二).短时能量1.由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。

因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。

定义短时能量为:其中N为窗长。

2.短时能量函数的应用(1).可用于区分清音段与浊音段。

En值大对应于浊音段,En值小对应于清音段。

(2)可用于区分浊音变为清音或清音变为浊音的时间(根据En值的变化趋势)。

(3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。

无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。

(三).短时平均过零率1.过零率可以反映信号的频谱特性。

当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横轴。

统计单位时间内样点值改变符号的次数具可以得到平均过零率。

定义短时平均过零率:其中sgn[]为符号函数,在矩形窗条件下,可以简化为2.短时平均过零率的应用(1)区别清音和浊音。

例如,清音的过零率高,浊音的过零率低。

此外,清音和浊音的两种过零分布都与高斯分布曲线比较吻合。

(2)从背景噪声中找出语音信号。

语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。

(3)在孤立词的语音识别中,可利用能量和过零作为有话无话的(四).短时自相关函数自相关函数用于衡量信号自身时间波形的相似性。

清音和浊音的发声机理不同,因而在波形上也存在着较大的差异。

浊音的时间波形呈现出一定的周期性,波形之间相似性较好;清音的时间波形呈现出随机噪声的特性,样点间的相似性较差。

因此,我们用短时自相关函数来测定语音的相似特性。

短时自相关函数定义为:(五).时域分析方法的应用1.基音频率的估计首先可利用时域分析(短时能量、短时过零率、短时自相关)方法的某一个特征或某几个特征的结合,判定某一语音有效的清音和浊音段;其次,针对浊音段,可直接利用短时自相关函数估计基音频率,其方法是:估算浊音段第一最大峰的位置,再利用抽样率计算基音频率。

2.语音端点的检测与估计可利用时域分析(短时能量、短时过零率、短时自相关)方法的某一个特征或某几个特征的结合,判定某一语音信号的端点,尤其在有噪声干扰时,如何准确检测语音信号的端点,这在语音处理中是富有挑战性的一个课题。

三.语音信号的频域分析(一).短时傅立叶变换由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为其中w(n-m)是实窗口函数序列,n表示某一语音信号帧。

令n-m=k',则得到:于是可以得到:短时傅立叶变换有两个变量:n和ω,所以它既是时序n的离散函数,又是角频率ω的连续函数。

与离散傅立叶变换逼近傅立叶变换一样,如令ω=2πk/N,则得离散的短时傅立叶变换如下:(二).语谱图水平方向是时间轴,垂直方向是频率轴,图上的灰度条纹代表各个时刻的语音短时谱。

语谱图反映了语音信号的动态频率特性,在语音分析中具有重要的实用价值。

被成为可视语言。

语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的。

时间分辨率高,可以看出时间波形的每个周期及共振峰随时间的变化,但频率分辨率低,不足以分辨由于激励所形成的细微结构,称为宽带语谱图;而窄带语谱图正好与之相反。

宽带语谱图可以获得较高的时间分辨率,反映频谱的快速时变过程;窄带语谱图可以获得较高的频率分辨率,反映频谱的精细结构。

两者相结合,可以提供带两与语音特性相关的信息。

语谱图上因其不同的灰度,形成不同的纹路,称之为“声纹”。

声纹因人而异,因此可以在司法、安全等场合得到应用。

(三).复倒谱和倒谱复倒谱是x(n)的Z变换取对数后的逆Z变换,其表达式如下:倒谱c(n)定义为x(n)取Z变换后的幅度对数的逆Z变换,即在时域上,语音产生模型实际上是一个激励信号与声道冲激响应的卷积。

对于浊音,激励信号可以由周期脉冲序列表示;对于清音,激励信号可以由随机噪声序列表示。

声道系统相当于参数缓慢变化的零极点线性滤波器。

这样经过同态处理后,语音信号的复倒谱,激励信号的复倒谱,声道系统的复倒谱之间满足下面的关系:由于倒谱对应于复倒谱的偶部,因此倒谱与复倒谱具有同样的特点,很容易知道语音信号的倒谱,激励信号的倒谱以及声道系统的倒谱之间满足下面关系:倒谱的求法:A:短时信号;B:短时频谱;C:对数频谱;D:倒谱系数;E:对数频谱包络;F:基本周期(四).基因周期估计浊音信号的倒谱中存在峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。

利用倒谱的这个特点,我们可以进行语音的清浊音判决,并且可以估计浊音的基音周期。

首先计算语音的倒谱,然后在可能出现的基因周期附近寻找峰值。

如果倒谱峰值超过了预先设置的门限,则输入语音判断为浊音,其峰值位置就是基因周期的估计值;反之,如果没有超出门限的峰值的话,则输入语音为清音。

(五).共振峰估计对倒谱进行滤波,取出低时间部分进行进行逆特征系统处理,可以得到一个平滑的对数谱函数,这个对数谱函数显示了输入语音段的共振峰结构,同时谱的峰值对应于共振峰频率。

通过此对数谱进行峰值检测,就可以估计出前几个共振峰的频率和强度。

对于浊音的声道特性,可以采用前三个共振峰来描述;清音不具备共振峰特点。

参考文献[1]徐靖涛.基于MATLAB的语音信号分析与处理[J].重庆科技学院学报2008年1月[2]陈怀琛.MATLAB及在电子信息课程中的应用[M].北京:电子工业出版社.2008年1月[3] 张雄伟等著,现代语音处理技术及应用,机械工业出版社,2009.[4] 赵力著,语音信号处理(第2版)[M],机械工业出版社,2010.[5]徐靖涛.基于MATLAB的语音信号分析与处理[J].重庆科技学院学报2008年1月。

相关文档
最新文档