第四章语音信号的短时频域分析
语音信号的频域分析

实验二:语音信号的频域分析实验目的:以MATLAB 为工具,研究语音信号的频域特性,以及这些特性在《语音信号处理》中的应用情况。
实验要求:利用所给语音数据,分析语音的频谱、语谱图、基音频率、共振峰等频域参数。
要求会求取这些参数,并举例说明这些参数在语音信号处理中的应用。
实验内容:1、 语音信号的频谱分析1.1加载“ma1_1”语音数据。
基于DFT 变换,画出其中一帧数据(采样频率为8kHz ,帧长为37.5ms ,每帧有300个样点)的频域波形(对数幅度谱)。
load ma1_1;x = ma1_1 (4161:4460); plot (x)N = 1024; k = - N/2:N/2-1;X = fftshift (fft (x.*hann (length (x)),N));plot (k,20*log10 (abs(X))), axis ([0 fix(N/2) -inf inf ])已知该帧信号的时域波形如图(a )所示,相应的10阶LPC 谱如图(b )所示。
问题1:这帧语音是清音还是浊音?基于DFT 求出的对数幅度谱和相应的LPC 谱相比,两者有什么联系和区别?问题2:根据这帧基于DFT 的对数幅度谱,如何估计出共振峰频率和基音周期?问题3:时域对语音信号进行加窗,反映在频域,其窗谱对基于DFT 的对数幅度谱有何影响?如何估计出窗谱的主瓣宽度?1.2对于浊音语音,可以利用其频谱)(ωX 具有丰富的谐波分量的特点,求出其谐波乘积谱:∏==R r r X HPSx 1)()(ωω式中,R 一般取为5。
在谐波乘积谱中,基频分量变得很大,更易于估计基音周期。
1.3加载“vowels.mat”语音数据,分别画出一帧/i/和一帧/u/(采样频率为10kHz,帧长为30ms,每帧有300个样点)的基于DFT的对数幅度谱。
其Matlab代码如下:load vowelsx = vowels.i_1(2001:2300);N = 1024; k= -N/2:N/2-1;X = fftshift (fft (x.*hann (length(x)),N));plot (k,20*log10(abs(X))), axis([0 fix(N/2) 0 100])x = vowels.u_1(2001:2300);N= 1024; k = -N/2:N/2-1;X = fftshift (fft (x.*hann(length(x)),N));plot (k,20*log10(abs(X))), axis([0 fix(N/2) 0 100])1.4画出一帧清音语音的基于DFT的对数幅度谱。
语音信号的短时分析

语音信号的短时分析一、实验目的1.在理论学习的基础上,进一步地理解和掌握语音信号短时分析的意义,短时时域分析的基本方法。
2.进一步理解和掌握语音信号短时平均能量函数及短时平均过零数的计算方法和重要意义。
二、实验原理及方法一定时宽的语音信号,其能量的大小随时间有明显的变化。
其中清音段(以清音为主要成份的语音段),其能量比浊音段小得多。
短时过零数也可用于语音信号分析中,发浊音时,其语音能量约集中于3kHz以下,而发清音时,多数能量出现在较高频率上,可认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数,因而,对一短时语音段计算其短时平均能量及短时平均过零数,就可以较好地区分其中的清音段和浊音段,从而可判别句中清、浊音转变时刻,声母韵母的分界以及无声与有声的分界。
这在语音识别中有重要意义。
三、实验仪器微型计算机,Matlab软件环境四、实验内容1.上机前用Matlab语言完成程序编写工作。
2.程序应具有加窗(分帧)、计算、以及绘制曲线等功能。
3.上机实验时先调试程序,通过后进行信号处理。
4.对录入的语音数据进行处理,并显示运行结果。
5.依据曲线对该语音段进行所需要的分析,并作出结论。
6.改变窗的宽度(帧长),重复上面的分析内容。
五、预习和实验报告要求1.预习课本有关内容,理解和掌握短时平均能量函数及短时平均过零数函数的意义及其计算方法。
2.参考Matlab有关资料,设计并编写出具有上述功能的程序。
六、上机实验报告要求:1.报告中,实验目的、实验原理、实验步骤、方法等格式和内容的要求与其它实验相同。
2.画出求得的、曲线,注明语音段和所用窗函数及其宽度。
阐述所作分析和判断的过程,提出依据,得出判断结论。
七、思考题1.语音信号短时平均能量及短时平均过零数分析的主要用途是什么?2.窗的宽度(帧长)的改变,对的特性产生怎样的影响?附:所用语音信号文件名为one.wavMatlab编程实验步骤:1.新建M文件,扩展名为“.m”,编写程序;2.选择File/Save命令,将文件保存在F盘中;3.在Command Window窗中输入文件名,运行程序;Matlab部分函数语法格式:读wav文件:x=wavread(`filename`)数组a及b中元素相乘: a.*b创建图形窗口命令:figure绘图函数:plot(x)坐标轴:axis([xmin xmax ymin ymax])坐标轴注解:xlabel(`…`) ylabel(`…`)图例注解:legend( `…`)一阶高通滤波器:y=filter([1-0.09375],1,x)分帧函数:f=enframe(x,len,inc)x为输入语音信号,len指定了帧长,inc指定帧移,函数返回为n×len的一个矩阵,每一行都是一帧数据。
语音信号短时分析.ppt

Z01 2N n 0 1Sg (Sw n (n) )Sg (Sw n (n1))
将Z应用于语音信号分析中
❖ 发浊音时,声带振动,因而声门激励是以此音调频 率为基频来使声道共振;尽管有若干个共振峰,但 其能量的分布集中于低于3KHz的频率范围内。
❖ 发清音时声带不振动,声道某部分阻塞产生类白噪 声激励,通过声道后其能量集中在比浊音时更高的 频率范围内。
0
-50
-100
-150 0
0.2
0.4
0.6
0.8
Normalized Frequency ( rad/sample)
Frequency domain 40
30
20
10
0
-10
-20 0
0.2
0.4
0.6
0.8
Normalized Frequency ( rad/sample)
语音信号的短时能量(语音信号强度 的度量参数)
❖ 在语音识别中正确的决定所要识别语音的起点、终 点对于提高识别率往往是重要的。
❖ 对于数字移动通信的手持机编译码器,在较长的无 声段应降低发射功率以节约其电池的消耗。
Hale Waihona Puke 语音有声和无声❖ 对于已经判定为语音段的部分,尚需决定其清音或 浊音,无论对于语音识别还是低速语音编译码器这 都是很重要的。这些问题可以概括为无声/有声判决 以及更细致的S/U/V判决。
N 1
Hann
w (n ) 0 .5 (1 c 2 os n( )0 ) ,n N 1 N 1
❖ 不同的窗口选择(形状、长度),将决定短时平均能量的性质。什么 样的窗口,其短时平均能量才能更好的反映语音信号的振幅变化哪?
语音信号的短时频域分析耿李广

本科毕业设计题目语音信号的短时频域分析学院信息工程学院专业电子信息工程班级081信工3班学号200883097姓名耿李广指导老师殷仕淑2012 年 5 月目录摘要 (1)第1章绪论 (3)1.1 课题的背景与意义 (3)1.2 国内外研究现状及发展趋势 (4)1.3 本文的仿真软件MATLAB (5)1.4 本文主要工作 (6)第2章语音信号的频域特点和抽样 (8)2.1 语音信号分析处理的一般流程 (8)2.2 语音信号的特点 (8)2.3 语音信号的抽样 (9)2.4 语音信号的分析技术 (11)第3章语音信号的频域分析 (12)3.1 语音信号分析的预处理 (12)3.2 利用短时博里叶变换求语音的短时谱 (13)3.3 语音信号的功率谱 (16)3.4 语音信号的语谱图 (17)3.5 复倒谱和倒谱 (19)第4章语音信号的综合仿真分析 (22)参考资料 (26)致谢 (27)附录 (28)语音信号的频域分析摘要语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。
其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。
将语音看为一种特殊的信号,即一种“复杂向量”来看待。
通过调用处理数字信号工具MA TLAB里的命令函数,利用数字信号处理的知识来解决问题。
像给一般信号做频谱分析一样,也分析了语音信号的频谱。
本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用MATLAB进行仿真分析。
关键词:语音信号;频域分析;MA TLABSpeech signal analysis in frequency domainAbstractSpeech signal acquisition and analysis techniques are a wide range of cross-scientific,Its application and development of voice study, sound measurement study, electronic measuring technology, and digital signal processing disciplines, such as close contact. Collection and analysis of voice one of the small-scale equipment, intelligence, digital and multi-functional development of more and more quickly, faster than the previous analysis has been substantially high. The voice is taken as a special signal, a complex vector. By using the command functions in the digital signal processing tool-MATLAB, the digital signal processing can solve many problems. The spectrum of voice signals are analyzed, which is the same as the spectrum analysis of common signals. This paper introduces the voice signal acquisition and analysis of the history of the development, as well as the characteristics of speechsignal,Collection and analysis methods,Recording machine through the PC section of my own voices,the use of MA TLAB for simulation analysis.Keywords:audio signal,acquisition and analysis,MATLAB第1章绪论随着现代计算机技术的普及和发展,数字电子产品的使用越来越深入到人们的日常生活中。
数字语音处理及MATLAB仿真.rar-第四章

定义 可得
yi (n) X n (e ji )e jin
x(m)w(n-m)也应当是宽度为N有限时宽的。现在在频
域内L个角频率上对 X n (e j )进行取样,根据这些取样所 恢复出的时间信号应该是x(m)w(n-m)进行周期延拓的
结果,延拓周期等于L。为使恢复的时域信号不产生
混叠,要求L N,故频域最小取样数为窗宽 SRf=N。
24
数字语音处理及MATLAB仿真 张雪英编著
在,为:
X (ej ) x(m)ejm
(4.8)
m
W (ej ) w(m)ejm
(4.9)
m
当n固定时,序列w(n-m)的傅里叶变换为:
w(n m)ejm W (ej )ejn
m
(4.10)
10
数字语音处理及MATLAB仿真 张雪英编著
值决定于窗口序列的长度N和形状。
22
数字语音处理及MATLAB仿真 张雪英编著
若使用哈明窗,W (ej ) 的近似带宽为
B 2FS (Hz) N
(4.20)
j
X n (e
)的采样率为2B
4Fs
N
( 采样/秒)
若使用矩形窗, W(e j )的近似带宽为
B Fs (Hz) N
X n (e j )的采样率为
数字语音处理及MATLAB仿真 张雪英编著
第四章 语音信号的短时时域分析
1 4.1 概述 2 4.2 傅里叶变换的解释 3 4.3 滤波器的解释 4 4.4 短时谱的时域及频域采样率 5 4.5 短时综合的滤波器组相加法
1
数字语音处理及MATLAB仿真 张雪英编著
语音信号的短时频域分析

语音信号的短时频域分析目录一、内容简述 (2)二、基础知识 (2)2.1 语音信号处理基础 (3)2.1.1 语音信号的特点 (5)2.1.2 语音信号的数字表示 (6)2.2 频域分析介绍 (7)三、短时傅里叶变换 (8)3.1 STFT的基本原理 (9)3.2 STFT的应用场景 (10)3.3 窗函数的选择和影响 (11)四、短时傅里叶变换的变体 (12)4.1 连续小波变换 (13)4.1.1 CWT的基本概念 (14)4.1.2 CWT与STFT的比较 (15)4.2 离散小波变换 (16)4.2.1 DWT的基本概念 (18)4.2.2 DWT在语音信号处理中的应用 (19)五、短时频域特征提取 (20)5.1 梅尔频率倒谱系数 (21)5.1.1 MFCC的计算过程 (23)5.1.2 MFCC在语音识别中的作用 (24)5.2 谐波和基频估计 (26)5.2.1 基本周期分析与提取 (26)5.2.2 基频和共振峰的定位 (28)六、短时频域分析在实际中的应用 (29)6.1 语音增强 (30)6.2 语音去噪 (32)6.3 说话人识别与语音合成 (33)七、总结 (35)7.1 短时频域分析方法总结 (36)7.2 语音信号处理领域的发展趋势 (37)7.3 下一步研究方向与思考 (38)一、内容简述语音信号的短时频域分析是语音处理领域中一项重要的技术,该技术主要通过对语音信号进行短时的时间窗口划分,然后在每个时间窗口内进行频域分析,从而提取语音信号的频率特性。
这种分析方法有助于我们理解语音信号在不同时间段的频率变化,对于语音识别、语音合成、音频信号处理等领域具有广泛的应用价值。
本文将详细介绍短时频域分析的基本原理、方法、步骤以及在实际应用中的效果评估。
通过本文的阅读,读者将能够了解如何对语音信号进行短时频域分析,从而深入理解和掌握这一技术的实际应用。
二、基础知识信号是信息传递的一种形式,可以是模拟的或数字的。
ch4(c)_语音信号的短时频域分析

15
本节完!
16
10
-125Hz
+125Hz
频域对称中心移到中点
逆FFT的时域对称中心移到中点
11
做FFT的点数和时间采样的点数N不同时——数据上采样N点,频谱上采 样M点 补零前后的FFT会有较大的不同,但两频谱的包络还是一致的。 设补零前数据长N,补零后数据长M(补了M-N个零值) ——补零前的FFT有N条谱线,分别代表的频率点是(0,1,...,N-1)*fs/N ——补零后的FFT有M条谱线,分别代表的频率点是(0,1,...,M-1)*fs/M。 直接补零的方式 M=1024; %M点抽取 m=0:M-1; y=zeros(1,M); y(1:N)=x; %补零 figure;plot(m,y,'-o');grid; freqy=m*Fs/M-Fs/2; Y=fftshift(abs(fft(y))); %M点fft figure;plot(freqy,Y,'-o');grid;
freq = n*Fs/N - Fs/2; %频率序列的定标 X = fftshift(abs(fft(x))); %采用 N= 8点的FFT时的FFT,做FFT的点数和时间 采样的点数相同 x_IFFT = ifft(fft(x)); figure; plot(freq, X);grid; figure; plot(t, x_IFFT); grid; t_ = (0:N-1)*Ts - N*Ts/2; % 等价的有 t_ = (0-N/2:N-1-N/2)*Ts; 即 t_ = (N/2: N/2 - 1)*Ts figure; plot(t_, x_IFFT);grid;
7
Ω = w*Fs=w/Ts 丢失了Ts信息,即丢失了两个频域采样点的时间信息,而仅仅将单位圆上采 样点的个数N以及采样点之间的间距ω保留了下来。 故要补充Ts采样信息,才可以对应到模拟角频率Ω clear; close all; % 该信号的数字周期N = 8,模拟周期T = N*Ts = 0.008s ,实际频率 f = 125 Hz w = pi/4; N = 2*pi/w; % N = 8 n = 0:N-1; % n = 0:N 可能会更好看一些,但是要清楚 第N+1点可是下一个采样周期的第一个点x = sin(n*w); h=plot(n, x, '-o'); %注意n没有定标,没有物理含义! Fs = 1000; %采样频率为1000Hz Ts = 1/Fs; t = n*Ts; % t 时间序列的给法永远只有这么一种,请铭记! T = N*Ts; %模拟周期T f = w*Fs/(2*pi); % 信号的真实频率f figure; plot(t, x)
第4章 短时频域分析

离散的短时傅里叶变换
与离散傅里叶变换和连续傅里叶变换的关系一样,若 令ω=2πk/N,则得离散的短时傅里叶变换,它实际上是在 频域的取样。
2 k N 2 km N
j
X n (e
) X n (k )
m
x(m)w(n m)e
j
0 k N 1
短时傅里叶变换的两种解释
X n (e j )
m
[ x(m)w(n m)]e jm
当n取不同值时窗w(n-m)沿着x(m)序列滑动,所 以w(n-m)是一个“滑动的”窗口。
由于窗口是有限长度的,满足绝对可和条件,所 以这个变换是存在的。与序列的傅里叶变换相同, 短时傅里叶变换随着ω作周期变化,周期为2π。
第四章 语音信号短时频域分析
1 2 3 4 5
4.1 概述
4.2 傅里叶变换的解释
4.3 滤波器的解释 4.4 短时谱的时域及频域采样率 4.5 短时综合的滤波器组相加法
4.1 概述
短时傅里叶变换
定义:短时傅立叶变换也叫短时谱(加窗的方式)
X n ( e j )
m
x(m) w(n m)e jm
② 当ω或k固定时, Xn(w)和Xn(k)看做是时间n的 函数。它们是信号序列和窗口函数序列的卷积, 此时窗口的作用相当于一个滤波器。 换具有相同的特性。
标准傅里叶变换或标准的离散傅里叶变换。此时与标准傅 里叶变换具有相同的性质,而Xn(k)与标准的离散傅里叶变
4.2 傅里叶变换的解释
短时傅里叶变换可写为
SR/fS即为与一般取样频率相比而得到的“过速率采样比”。
欠速率采样:
语音信号的频域分析

x(n) w(n) ejωn e-jωn 图5.7
Xn
(ejω)
⊕
a n( ω)
sinωn
w(n)sinωn
⊕
b n( ω)
STFT分析线性滤器的另一种形式 图5.8 - 16 -
cosωn 用实数实现图5.7的方框图 赵晓群 教授
同济大学电子与信息工程学院
第5章
语音信号的频域分析
1 X n (e ) 2 1 2
j
e j nW (e-j ) X (e j( ) )d e-j nW (e j ) X (e j( ) )d
就是有意义的。 观点:STFT 是平稳信号的 Fourier 变换经加窗平滑的结果。
同济大学电子与信息工程学院 - 9 赵晓群 教授
X (e ) m x(m)e
j
-j m
, W (e ) m w(m)e-jm
j
◆因 Xn(ejω) 是 x(m)w(n-m) 的 Fourier 变换, 则 Xn(ejω) 是 X(ejω) 与 ejωnW(e-jω) 的卷积,即
1 X n (e ) 2 1 2
第 5章
语音信号的频域分析
5.1
概述
第 5章
5.1 概述
语音信号的频域分析
语音感知与语谱特性关系密切,人对语谱特性更敏感。 ◆幅频谱特性相似的两段语音,感知相似。 ◆语谱具有语言声学意义,反应了重要的语音特征;
如共振峰频率、带宽等。
进行语音频谱分析是认识和处理语音信号的重要方法。 Fourier 分析是有效手段,是语音的重要分析工具。
同态分析、线性预测法等。
语音信号的短时分析

实验一语音信号的短时分析一、实验目的1.在理论学习的基础上,进一步地理解和掌握语音信号短时分析的意义,短时时域分析的基本方法。
2.进一步理解和掌握语音信号短时平均能量函数及短时平均过零数的计算方法和重要意义。
二、实验原理及方法一定时宽的语音信号,其能量的大小随时间有明显的变化。
其中清音段(以清音为主要成份的语音段),其能量比浊音段小得多。
短时过零数也可用于语音信号分析中,发浊音时,其语音能量约集中于3kHz以下,而发清音时,多数能量出现在较高频率上,可认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数,因而,对一短时语音段计算其短时平均能量及短时平均过零数,就可以较好地区分其中的清音段和浊音段,从而可判别句中清、浊音转变时刻,声母韵母的分界以及无声与有声的分界。
这在语音识别中有重要意义。
三、实验仪器微型计算机,Matlab软件环境四、实验步骤1.上机前用Matlab语言完成程序编写工作。
2.程序应具有加窗(分帧)、计算、以及绘制曲线等功能。
3.上机实验时先调试程序,通过后进行信号处理。
4.对录入的语音数据进行处理,并显示运行结果。
5.依据曲线对该语音段进行所需要的分析,并作出结论。
6.改变窗的宽度(帧长),重复上面的分析内容。
五、操作步骤所用语音信号文件名为"shop.wav",拷贝到MATLAB工作目录。
Matlab编程实验步骤:1.新建M文件,扩展名为“.m”,编写程序;2.选择File/Save命令,将文件保存在F盘中;3.在Command Window窗中输入文件名,运行程序;Matlab部分函数语法格式:读wav文件:x=wavread(`filename`)数组a及b中对应元素相乘: a.*b创建图形窗口命令:figure绘图函数:plot(x)坐标轴:axis([xmin xmax ymin ymax])坐标轴注解:xlabel(`…`)ylabel(`…`)图例注解:legend( `…`)一阶高通滤波器: y=filter([1-0.09375],1,x)voicebox工具箱介绍:分帧函数:f=enframe(x,len,inc)x为输入语音信号,len指定了帧长,inc指定帧移,函数返回为n×len的一个矩阵,每一行都是一帧数据。
语音信号时域分析

基于MATLAB 分析语音信号时域特征钱平(信号与信息处理 s101904010)一、时域特征实验原理及实验结果分析1.窗口的选择通过对发声机理的认识,语音信号可以认为是短时平稳的。
在5~50ms 的范围内,语音频谱特性和一些物理特性参数基本保持不变。
我们将每个短时的语音称为一个分析帧。
一般帧长取10~30ms 。
我们采用一个长度有限的窗函数来截取语音信号形成分析帧。
通常会采用矩形窗和汉明窗。
图1给出了这两种窗函数在帧长N=50时的时域波形。
0.20.40.60.811.21.41.61.82矩形窗samplew (n )0.10.20.30.40.50.60.70.80.91hanming 窗samplew (n )图1 矩形窗和Hamming 窗的时域波形矩形窗的定义:一个N 点的矩形窗函数定义为如下()⎩⎨⎧<≤=其他001Nn n whamming 窗的定义:一个N 点的hamming 窗函数定义为如下()⎪⎩⎪⎨⎧<≤--=其他00)12cos(46.054.0Nn N n n w π 这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;汉明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。
因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。
表1对比了这两种窗函数的主瓣宽度和旁瓣峰值。
00.10.20.30.40.50.60.70.80.91-80-60-40-200矩形窗频率响应归一化频率(f/fs)幅度/d B00.10.20.30.40.50.60.70.80.91-100-50Hamming 窗频率响应归一化频率(f/fs)幅度/d B图2 矩形窗和Hamming 窗的频率响应表1 矩形窗和hamming 窗的主瓣宽度和旁瓣峰值2.短时能量由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。
数字语音处理知识点总结

绪论语音信号处理是一门新兴的边缘学科,它是语音学与数字信号处理两个学科相结合的产物。
语音信号处理的目的是要得到某种语音特征参数以便高效地传输或存储,或者是通过某种处理运算以达到某种用途的要求。
通常认为,语音信息的交换大致上可以分为三类:(1)人与人之间的语言通信:包括语音压缩与编码、语音增强等。
(2)第一类人机语言通信问题,指的是机器讲话、人听话的研究,即语音合成。
(3)第二类人际语言通信问题,指的是人讲话、机器听话的情况,即语音识别和理解。
自20世纪80年代末期至今,语音合成技术又有了新的进展,特别是1990年提出的基音同步叠加(PSOLA)方法,使基于时域波形拼接方法合成的语音的音色和自然度大大提高。
语音编码的目的就是在保证一定语音质量的前提下,尽可能降低编码比特率,以节省频率资源。
语音编码技术主要有两个努力方向:一是中低速率的语音编码的实用化及如何在实用化过程中进一步提高其抗干扰、抗噪声能力,另一个是如何进一步降低其编码速率。
语音信号的数字模型人类的语音是由人的发声器官在大脑的控制下的生理运动产生的,人的发声器官由3部分组成:(1)肺和气管产生气源,(2)喉和声带组成声门,(3)由咽腔、口腔、鼻腔组成声道。
肺的发声功能主要是产生压缩气体,通过气管传送到声音生成系统,气管连接着肺和喉,它是肺与声道联系的通道。
响度——这是频率和强度级的函数,通常用响度(单位为宋)和响度级(单位为方)来表示。
人耳刚刚能听到的声音强度,称为“听阈”,此时响度级定为零方。
响度与响度级是有区别的,60方响度级比30方响度级的声音要响,但没有响了一倍。
响度是刻划数量关系的,2宋响度要比1宋响度的声音响一倍,1宋响度被定义为1kHz纯音在声响级为40dB时(声强为10^-12W/cm^2)的响度。
音高也称基音,物理单位为赫兹,主观感觉的音高单位是美(Mel),当声强级为40dB(或响度级为40方)、频率为1kHz 时,设定的音高为1000美。
语音信号处理课件第04章短时傅里叶分析

+ +
a n ( )
x(m )
sin n
w ( m )s i n m
b n ( )
j 2 2 1 / 2 ~j j n | X ( e ) | [ a ( ) b ( )] | X ( e ) | | e | n n n n ~ ~j 2 2 1 / 2 ~ | X ( e ) | [ a ( ) b ( )] n n n
窗形状对短时傅立叶变换的影响 - 矩形窗——主瓣窄,衰减慢; - 汉明窗——主瓣宽,衰减快; - 海明窗——主瓣窄,衰减快; 窗宽对短时频谱的影响 -窗宽长——频率分辨率高,能看到频谱快变化; -窗宽短——频率分辨率低,看不到频谱的快变化;
12
4.2.2 短时傅立叶变换--标准傅里叶变换的解释里叶变换写为另一种形式。设信号序列和窗
X ( e ) x ( m ) e
j m
j m
j m W ( e ) w ( m ) e j m
均存在。当n取固定值时,w(n-m)
j m j n j w ( n m ) e e W ( e )
8
m
4.2.2 短时傅立叶变换--标准傅里叶变换的解释
Xn(ej) X(ej)[ejn W (ej)] 1 j j n j Xn(e ) X(e )e W (e ) 2 1 jn j j( ) [ e W ( e ) X ( e )] d 2
18
4.2.3 短时傅立叶变换--滤波器的解释一
j j m X ( e ) [ x ( m ) e ] w ( n m ) n
实验1语音信号的时域和频域分析

N太大,能量随时间变化很小,不能反映语音信号的 幅度变化,波形的变化细节就看不出来;
N太小,滤波器的通带变宽,短时能量随时间有剧烈 变化,不能得到平滑的能量函数。
窗口的选择(长度的确定)又需相对不同的基 音周期来选择。通常情况下,一个语音帧内应 含有1—7个基音周期。然而不同的人其基音周 期变化范围很大,因此窗口宽度(N)的选择 有一个折衷选择为100—200(即10—20ms持续 时间)。
Z 2 f0 fs
借助平均过零数及取样频率可精确算出频率。
对于语音信号序列是宽带信号,所以不能简单地用上 面的公式计算频率。但是,可借助短时平均过零数来
得到其频谱的粗略估计。
语音信号的短时平均过零数定义为
Zn|sgn[x(m)]sgn[x(m1)]|w(nm)
|sgn[x(m)]sgn[x(m1)]|*w(n)
当选择不同长度的窗时的短时能量
[x,fs]=wavread('c:\wang.wav'); FrameLen1 = 51; FrameLen2 = 101; FrameLen3 = 201; FrameLen4 = 401; FrameInc = 80; subplot(5,1,1);plot(x);title('原波形图') amp = sum(abs(enframe(filter([1 -0.9375], 1,
四、实验报告要求
1、简述实验目的和实验原理; 2、matlab程序清单及结果图形; 3、实验结果分析
添加:VOICEBOX工具箱
解压voicebox.zip, 将整个目录voicebox复制到MATLAB的安
语音信号的短时时域分析数字语音处理及MATLAB仿真教学课件

对于随机信号,R(0)对应于平均功率
36
数字语音处理及MATLAB仿真 张雪英编著
3.6.2 语音信号的短时自相关函数
采用短时分析方法,定义语音信号短时自相关函数为
Rn k x mw n m x m k w n k m
每 10ms 内的过零数
过零率概率分布
33
数字语音处理及MATLAB仿真 张雪英编著
端点检测
端点检测目的:从包含语音的一段信号中确 定出语音的起点及结束点。
有效的端点检测不仅能使处理时间减到最少, 而且能抑制无声段的噪声干扰,提高语音处理的 质量。
34
数字语音处理及MATLAB仿真 张雪英编著
3.6 短时自相关分析
3.2.1 语音信号的预加重处理
预加重目的:为了对语音的高频部分进行加重, 去除口唇辐射的影响,增加语音的高频分辨率。 可通过一阶FIR高通数字滤波器来实现:
H (z) 1 z1
设n时刻的语音采样值为x(n) ,经过预加重处理后 的结果为
y(n) x(n) x(n 1)
5
数字语音处理及MATLAB仿真 张雪英编著
几种常见的短时处理方法是: 1. T[x(m)] x2 (m),h(n) w2 (n) Qn 对应于能量; 2. T[x(m)] sgn[x(m,)]sgn[x(m1)],h(n) w(n)
Qn 对应于平均过零率;
3. T[x(m)] x(m)x(mk),hn wnwn k
Qn 对应于自相关函数 ;
3.6.1 短时自相关函数
时域离散确定信号的自相关函数定义为:
R(k)
∑ ∞
xm
xm
第4章 语音信号短时频域及倒谱分析

对 数 幅 度 /dB
对 数 幅 度 /dB
浊 音
0 -20 -40 -60 -80
0
1000
2000 3000 f/Hz 加 Hamming窗 时 语 音 谱
4000
0 -20 -40 -60 -80
清 音
0
1000
2000 3000 f/Hz 加 Hamming窗 时 语 音 谱
4000
对 数 幅 度 /dB
wn m xm
(-∞≤m≤+∞)
的傅里叶变换或离散傅里叶变换。 (2) 当 或k 固定时,它们是一个卷积,这相当于滤波 器的运算。因此,语音信号的短时频域分析可以解释为傅 里叶变换或滤波器。
5
第四章语音信号短时频域及倒谱分析
“十二五”普通高等教育本科国家级规划教材
4.1 傅里叶变换 的解释
第四章语音信号短时频域及倒谱分析
“十二五”普通高等教育本科国家级规划教材
第四章 语音信号短时频域及倒谱分析
1
第四章语音信号短时频域及倒谱分析
“十二五”普通高等教育本科国家级规划教材
目
1
1 2
录
傅里叶变换的解释 2 滤波器的解释 短时综合的滤波器组相加法 4 语音信号的复倒谱和倒谱分析及应用
3
5
2
“十二五”普通高等教育本科国家级规划教材
i
hi (n) wi (n)e jin
X n (e ji ) e jin
x(n m)h (m)
m
(4.22)
26
4.3 短时综合的滤波器组相加法
“十二五”普通高等教育本科国家级规划教材
式(4.25)的图形解释
x(n)
语音信号时域和频域通俗理解_概述及解释说明

语音信号时域和频域通俗理解概述及解释说明1. 引言1.1 概述语音是人类最基本、也是最常用的沟通方式之一。
人们通过声音来传递信息和表达情感。
对于语音信号的分析和处理,时域和频域是两个重要的角度。
时域分析主要关注声音信号在时间上的变化规律,而频域分析则关注声音信号在频率上的成分组成。
1.2 文章结构本文将以通俗易懂的方式,对语音信号的时域和频域进行解释和说明。
首先,我们将介绍时域和频域分析的基本概念及其重要性,然后详细讨论时域与频域分析中涉及到的关键点和方法。
最后,我们将总结观点并给出读者一些启示和建议。
1.3 目的本文旨在帮助读者理解语音信号时域与频域这两个概念,并且能够清晰明了地认识到它们在语音信号处理中所起到的作用。
通过对时域与频域分析方法的说明,读者可以更好地理解并应用这些知识于实际问题中。
同时,本文也希望能够引发读者对语音信号处理的更深层次的思考和探索。
2. 语音信号时域与频域通俗理解:2.1 语音信号时域分析:语音信号的时域分析是对声音在时间上的变化进行研究和处理。
时域分析主要关注声音的振幅和时间之间的关系。
在时域中,我们可以观察到声音振动的波形图。
当我们录制一段语音时,在录制过程中,麦克风会将声音转换为电信号,并按照一定的采样率记录下来。
这些记录的电信号就是我们所说的波形图。
波形图横坐标表示时间,纵坐标表示振幅。
通过观察波形图,我们可以获得很多有用的信息。
例如,振幅可以告诉我们声音的强度或者说响度,而波形图上不同部分振幅大小和模式的变化可以揭示出不同语音特征(如元音、辅音等)以及语速、语调等信息。
2.2 语音信号频域分析:语音信号的频域分析是对声音中各种频率成分进行研究和处理。
频域分析更注重声音中各个频率成分之间的关系以及它们在声谱上呈现出来的特征。
通过傅里叶变换的方法,我们可以将时域中记录的波形图转换为频谱图。
频谱图显示了声音中不同频率成分在整个录制时间内的存在情况。
横坐标表示频率,纵坐标表示声音强度。
17.语言信号处理第四章短时傅里叶分析

4.1 短时傅里叶变换
一、短时傅里叶变换 的定义
X n (e j )
m jm jwm x ( m ) w ( n m ) e x ( m ) e n m 0 N 1
• 短时傅里叶分析是窗选语音信号的标准傅里叶变换。 • 它有两个自变量:n, ,既是关于时间n的离散函数, 又是关于角频率 的连续函数。 令
语谱图(Spectrogram):是一种时间依赖于傅
立叶分析的显示图形。它是一种三维频谱,可同时 在时间和频率上显示语音频谱随时间的变化
其纵轴为频率,横轴为时间;任意给定频率成分在 给定时刻的强弱用相应点的黑白度或色调的浓度来 表示。 记录语谱图的仪器称为语谱仪。
• 语谱仪实际上是一个带通滤波器组的中心频率输出随时间 发生连续变化,连续重复进行语音信号频率分析的仪器。
2 N 4 N
,频率分辨率高,但第一旁瓣衰减只有13.2dB ,频率分辨率下降,但第一旁瓣衰减 42dB
海明窗:第一个零点位置为
2. 窗口宽度的影响 频率分辨率
1 取样周期 f NT
窗宽 频率分辨率随窗口宽度的增加而提高,但时间分辨率降低。
N=500,取样率为10KHz,窗持续时间50ms 信号具有周期性
j m
令n m m'
w(m' ) x(n m' )e
m
j ( n m ' )
e j n [
jm ' x ( n m ' ) w ( m ' ) e ]
X n (e ) e
j
jn
~ j X n (e )
~ j X n (e )
概述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17
数字语音处理及MATLAB仿真 张雪英编著
可以画出短时傅里叶变换的滤波器解释的另 一种形式如图(4.3)所示,也分为复数运算和实 数运算两种。 同样要求线性滤波器近似为一个中心频率为 ω的窄带带通滤波器。
18
数字语音处理及MATLAB仿真 张雪英编著
冲激响应 x(n)
w(n)e jn
~ j X n( e )
(4.5)
可以看出,只有当w(0)≠0时,x(n)才能从 X n (e j ) 求出。
7
数字语音处理及MATLAB仿真 张雪英编著
此外,由功率谱定义,可以写出短时功率谱与短
时傅里叶变换的关系:
Sn (e ) X n (e ) X (e ) | X n (e ) |
* n
j
j
j
j
2
(4.6)
X n (e
j
)
m
x ( m ) w ( n m )e
j m
(4.1)
式中w(n-m)是窗函数。在式中,短时傅里叶变换有两 个变量,它们是离散时间n及连续频率ω
2
数字语音处理及MATLAB仿真 张雪英编著
4.1 概述
X n (e
若令 2π k N ,则得离散的短时傅里叶变换如下 2: πk 2 πkm j j
20
数字语音处理及MATLAB仿真 张雪英编著
4.4 短时谱的时域及频域取样率
短时傅里叶变换 X n (e j )同时是时间n以及角频率 ω的函数。由 X n (e j ) 来恢复x(n),首先遇到的就是
时域取样率和频域取样率的问题。
21
数字语音处理及MATLAB仿真 张雪英编著
1.时域取样率(ω 为固定值)
数字语音处理及MATLAB仿真 张雪英编著
第四章 语音信号的短时时域分析
1 2 3 4 5
4.1 概述
4.2 傅里叶变换的解释
4.3 滤波器的解释 4.4 短时谱的时域及频域采样率
4.5 短时综合的滤波器组相加法
1
数字语音处理及MATLAB仿真 张雪英编著
4.1 概述
语音信号可被看作是短时平稳信号,其某一帧的 短时傅里叶变换定义式如下:
w(m)e jm
(4.9)
当n固定时,序列w(n-m)的傅里叶变换为:
m
w(n m)e
j m
W (e
j
)e
jn
(4.10)
10
数字语音处理及MATLAB仿真 张雪英编著
根据卷积定理,有:
X n (e j ) [W (e j ) e jn ] *[ X (e j )]
(a)
冲激响应
w(n) cosω n
~ ( ) a n
e jn cosω n
+ +
X n (e
j
)
an(ω )
x(n)
+
sinω n bn(ω ) 冲激响应
w(n) sinω n -
~ b n ( )
(b)
cosω n
图 4.3 另一种用线性滤波对短时频谱分析的解释 (a)复数运算 (b)只有实数运算
)的采样率为
(采样/秒)
23
数字语音处理及MATLAB仿真 张雪英编著
2、频率取样率(n为固定值)
e j ) 2π为周期的ω的连续函数, 此时, X n (是以 下述一组频率值来取样:
用
(4.21)
k 2π k ,
L
k 0,1,, L - 1
j X ( e 设w(n)为有限时宽N, n ) 的短时付里叶反变换
13
数字语音处理及MATLAB仿真 张雪英编著
冲激响应 w(n) x(n)
e j n
X n (e
j
)
cos(ω n) x(n)
(a) 冲激响应 w(n) 冲激响应 w(n) an(ω ) bn(ω )
sin(ω n)
(b)
图 4.2 短时频谱分析的滤波表示 (a) 复数运算 (b) 只有实数运算
(4.16)
15
数字语音处理及MATLAB仿真 张雪英编著
结论:
j ( ) ) ,这说明 x( n) 经调制后,其付里叶变换为 X (e
调制使 x( n) 的频谱在频率轴上向左移动了
,线
性滤波器输出端的频谱等于乘积 X (e j ( ) )W (e j ) ,故 为了使输出频谱准确等于 X (e j ) , W (e j ) 应当是一个冲 激。即要求线性滤波器近似为一个窄带低通滤波器。
的傅里叶变换或离散傅里叶变换。 (2) 当 或k固定时,它们是一个卷积,这相当于 滤波器的运算。因此,语音信号的短时频域分析 可以解释为傅里叶变换或滤波器。
下面分别讨论这两种情况。
4
数字语音处理及MATLAB仿真 张雪英编著
4.2 傅里叶变换的解释
1. 求x(n)
将式(4.1)写作
X n (e j )
19
数字语音处理及MATLAB仿真 张雪英编著
cosω n x(n) w(n) w(n) sinω n x(n) w ( n ) cosω n w ( n ) sinω n (b) (a) ( ( )2 )
2
( (
)2 )2
( )1/2
xn (e
j
)
( )1/2
xn (e
j
)
图 4.4 得到短时频谱模值的两种方法 ( a ) 利用低通滤波器 ( b ) 利用带通滤波器
n=100
图 4.1 x(m)及 w(n-m)的示意图
6
数字语音处理及MATLAB仿真 张雪英编著
傅里叶逆变换公式为:
π j jm 1 w( n m ) x ( m ) X (e )e d n π 2π
(4.4)
令 m = n, 则
π j jn 1 x( n) X n (e )e d 2π w(0) π
N
) X n (k )
m
x(m)w(n m)e
X n (e )
j
N
,0 k N 1
(4.2)
的频率的取样。
它实际上就是
3
数字语音处理及MATLAB仿真 张雪英编著
4.1 概述
可以看出: (1)当n固定时,它们就是序列
wn mxm
(-∞≤m≤+∞)
j
(4.13)
j X ( e ) 的特性, 可见,为了使 X n (e )能够充分地表现
j X ( e ) 必须是一个冲激脉冲。 要求对于 W (e )来说,
j
11
数字语音处理及MATLAB仿真 张雪英编著
窗函数和窗宽对短时傅里叶谱的影响: 由于矩形窗有较高的旁瓣,在语音频谱分析中, 很少采用。实验表明,窗的主瓣宽度与窗宽度 N 成反比,选择窗宽时应根据应用需要,折衷考虑, 要得到好的时间分辨率要求用窄窗,而要得到好 的频率分辨率要求用宽窗。
16
数字语音处理及MATLAB仿真 张雪英编著
2.短时傅里叶变换的滤波器实现形式二 令: m n m
X n (e )
j m
x(n m) w(m)e j ( nm )
m jm x ( n m ) w ( m ) e ]
j m
e - jn [
(4.16)
j
令
则有
~ j X n (e )
m
x ( n m ) w( m ) e
jn
e
j n
X n (e
)(4.17)(418)X n (e ) e
j
~ ~ j jn ~ X n (e ) e [an ( ) jbn ( )]
SR 2CFS 采样/ 秒
(4.24)
SR/FS即为与一般取样频率相比而得到的“过速率采
样比”。
25
数字语音处理及MATLAB仿真 张雪英编著
欠速率采样:
x ( n )的短时谱所要求的取样率比起一般波形表
示来说,要增加到 2~4 倍。但有时在时域或频域用低
于理论上最小值的取样率,而 x ( n )仍能从混叠的短
x(m)w(n-m) 也应当是宽度为 N 有限时宽的。现在在频 域内L个角频率上对 X n (e j )进行取样,根据这些取样所 恢复出的时间信号应该是 x(m)w(n-m) 进行周期延拓的 结果,延拓周期等于 L 。为使恢复的时域信号不产生 混叠,要求L N,故频域最小取样数为窗宽 SRf=N。
功率谱 S n (e j ) 是自相关函数
Rn (k ) x ( m ) w( n m ) x ( m k ) w( n k m ) ∑ m ∞
∞
(4.7)
的傅里叶变换。
8
数字语音处理及MATLAB仿真 张雪英编著
窗函数的作用
1. 选出x(m)序列中被分析部分; 2.它的形状对时变傅里叶变换特性也有重要作用。
时变换中准确地恢复。
欠速率采样在短时谱估计,基音及共振峰分析,
数字语谱图以及声码器中得到应用。
26
数字语音处理及MATLAB仿真 张雪英编著
4.5 短时综合的滤波器组相加法
X n (e j ) 可表示为
X n (e )
或
ji
m ji n
w (n m) x(m)e
i m
若将w(n)的傅里叶变换记为 W (e j ) ,对于大多数窗 函数来说,W (e j ) 具有低通滤波器的特性,若它的 j X ( e ) 则具有与窗相同的带宽。低 带宽为BHz, n 通滤波器的带宽是由 W (e j第一个零点位置决定的。 ) 因为是 的傅里叶变换,因而 B的取 w(n),0 ≤n-1 ≤ N 值决定于窗口序列的长度N和形状。