语音信号的时域特征分析
第02讲 语音信号的数字化和预处理+时域分析
![第02讲 语音信号的数字化和预处理+时域分析](https://img.taocdn.com/s3/m/75e9ba2eb4daa58da0114ac9.png)
频谱泄露 较严重
矩形窗与汉明窗的比较
频谱分辨率高
窗类型
矩形窗
旁瓣峰值
• 假设语音信号的幅度符合Laplacian分布,此时信号幅度超过 4σx的概率很小,只有0.35%,因而可取Xmax=4σx,则 • 上式表明量化器中的每bit字长对SNR的贡献为6dB。
SNR(dB) 6.02 B 7.2
对重构的语音波形的高次谐波起平滑作用,去掉高次谐波失真。
• 汉明窗: (n) 0.54 0.46 cos[2n /( N 1)], 0 n ( N 1) 0, n else
矩 形 窗 2 1.8 1.6 1.4 1.2 1 0.9 0.8 0.7 0.6
hanming窗
w(n)
1 0.8 0.6 0.4 0.2 0
如下:
En x ( m)
m 0 2 n
N 1
• En是一个度量语音信号幅度值变化的函数,但它有一个缺陷, 即它对高电平非常敏感(因为它计算时用的是信号的平方)。
• 为此,可采用另一个度量语音信号幅度值变化的函数,即短
时平均幅度函数Mn,它定义为:
M n xn ( m)
m 0
N 1
0.7
0.8
0.9
1
0
幅度 /dB
-50
-100
0
0.1
0.2
0.3
0.4 0.5 0.6 归 一 化 频 率 (f/fs)
第三章-语音信号的特征分析讲解讲解学习
![第三章-语音信号的特征分析讲解讲解学习](https://img.taocdn.com/s3/m/0fd45b02f01dc281e53af064.png)
Magnitude (dB)
40 20
0 -20 -40 -60 -80 -100
0 50
Frequency domain
0.2
Fre0q.u4ency do0m.6ain
0.8
Normalized Frequency ( rad/sample)
0
-50
-100
-150 0
40 30 20 10
0 -10 -20
1 0.8 0.6 0.4 0.2
0 0
rectangular hamming hanning bartlett
50
100
150
200
250
❖ 几种不同的窗函数波形与频谱的比较
1
Hamming 0.8 哈明窗 0.6
Amplitude
0.4
0.2
0
1
Hanning 0.8
汉宁窗
0.6
Amplitude
0.4
0.2
0
1
矩形窗
0.8
Amplitude
0.6
0.4
0.2
0
Time domain
10
20 Tim3e0domain40
50
60
Samples
10
20 Tim3e0domain40
50
60
Samples
10
20
30
40
50
பைடு நூலகம்
60
Samples
Magnitude (dB)
Magnitude (dB)
帧和加窗的概念
❖ 短时分析将语音流分为一段一段来处理,每一段称 为一“帧”;
语音信号的时域特征提取
![语音信号的时域特征提取](https://img.taocdn.com/s3/m/fad04f574531b90d6c85ec3a87c24028905f8540.png)
语音信号的时域特征提取1.引言1.1 概述概述部分的内容可以按照以下方式来编写:第一段:引入语音信号分析的背景和重要性。
语音信号是人类沟通交流的重要方式之一,具有广泛的应用领域,例如语音识别、语音合成和语音增强等。
对语音信号进行分析和特征提取是实现这些应用的基础。
第二段:介绍语音信号的时域特征。
时域特征是指根据语音信号在时间上的变化特性而提取的特征。
时域分析可以通过分析语音信号的振幅、波形和频率等信息,揭示语音信号的基本特征和结构。
第三段:阐述时域特征提取在语音信号处理中的作用。
时域特征提取是语音信号处理的基础,可以帮助我们理解和描述语音信号的性质。
通过提取语音信号的时域特征,我们可以获取关于音频信号的基本信息,如能量、时长、频率等,为后续的语音信号分析和处理提供重要的依据。
第四段:指出文章将重点介绍常用的时域特征提取方法。
随着语音信号处理领域的发展,出现了许多时域特征提取方法,如短时能量、短时过零率和线性预测系数等。
本文将重点介绍这些常用的时域特征提取方法,讨论它们的原理、优缺点和应用场景。
最后一句:通过对语音信号的时域特征提取的研究,我们可以更好地理解和应用语音信号,为语音相关技术的进一步发展提供支持和指导。
编写完成后,可以进行适当修改和调整,以使概述部分内容更加连贯和易于理解。
1.2文章结构文章结构部分的内容可以按照以下方式编写:"1.2 文章结构"本篇长文将按照以下结构进行探讨语音信号的时域特征提取:第一部分为引言部分,简要概述了本文的研究背景和目标。
首先会阐明研究语音信号时域特征提取的意义,说明为什么时域特征提取在语音处理中如此重要。
接下来,会介绍文章的整体结构,以便读者对全文有一个清晰的了解。
最后,将明确本文的研究目的,即从理论和实践角度深入研究时域特征提取方法。
第二部分为正文部分,重点讨论时域特征提取的意义和常用方法。
首先,会详细说明时域特征提取在语音信号处理中的重要性以及它们对语音分析和识别任务的贡献。
语音信号的时域及频域特征
![语音信号的时域及频域特征](https://img.taocdn.com/s3/m/e0f236fcf90f76c661371a33.png)
(12)
当短时谱为使用 DFT 计算时,可以证明窗函数和插值函数需要满足一下条件:
r
h(n r ) w(r n pN ) ( p)
(13)
例如,我们可以特别地选择 W ( n) 为窗长为 N 的三角窗,而 h[ n] 为矩形窗,
1 n [0, N 1] h[ n] 0 其它
第一章 语音信号的时域及频域特征
1. 语音信号的主要特点
1.1. 语音信号带宽
语音信号的带宽约为 5KHz , 主要能量集中在低频段。 上图为一段语音信号语谱图。
1
1.2. 语音信号是典型的随机信号
1)人的每次发音过程都是一个随机过程。很难得到两次完全相同的发音样本。 2)在信号处理中,通常假设语音信号是短时平稳的。例如,可以认为在语音的浊 音段部分,语音的二阶矩统计量是平稳的(在 5~10mS 内),即二阶矩平稳,或称为宽平 稳。
2
2. 语音信号的时域波形
图 1.
语音信号的波形(shi4)
3
图 2. 语音信号波形(shi4)的局部细节
4
2.1. 语音时域信号特征
2.1.1. 语音时域信号的特点
1)清音段:能量低,过零率高,波形特点有点像随机的噪声。这部分信号常与语 音的辅音段对应。 2)浊音段:能量高,过零率低,波形具有周期性特点。所谓的短时平稳性质就是 处于这个语音浊音(元音)段中。 3)过渡段:一般是指从辅音段向元音段信号变化之间的部分。信号变化快,是语 音信号处理中最复杂、困难的部分。
r 取值为周期时刻采样分析短时谱,间隔为
h(n)
w( n)
T N 2。
N
h( n )
w(n)
语音信号采集与时频域分析正文
![语音信号采集与时频域分析正文](https://img.taocdn.com/s3/m/ff51f34890c69ec3d4bb753c.png)
第一章引言语音信号是一种非平稳的时变信号,它携带着各种信息。
在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。
语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。
语音信号分析可以分为时域和频域等处理方法。
语音信号可以认为在短时间内(一般认为在 10~30ms 的短时间内)近似不变,因而可以将其看作是一个准稳态过程, 即语音信号具有短时平稳性。
任何语音信号的分析和处理必须建立在“短时”的基础上, 即进行“短时分析”。
时域分析:直接对语音信号的时域波形进行分析,提取的特征参数有短时能量,短时平均过零率,短时自相关函数等。
频域分析:对语音信号采样,并进行傅里叶变换来进行频域分析。
主要分析的特征参数:短时谱、倒谱、语谱图等。
本文采集作者的声音信号为基本的原始信号。
对语音信号进行时频域分析后,进行加白噪声处理并进行了相关分析,设计滤波器并运用所设计的滤波器对加噪信号进行滤波, 绘制滤波后信号的时域波形和频谱。
整体设计框图如下图所示:图1.1时频域分析设计图图1.2加噪滤波分析流程图第二章 语音信号时域分析语音信号的时域分析可直接对语音信号进行时域波形分析,在此只只针对语音信号的短时能量、短时平均过零率、短时自相关函数进行讨论。
2.1窗口选择由人类的发生机理可知,语音信号具有短时平稳性,因此在分析讨论中需要对语音信号进行加窗处理进而保证每个短时语音长度为10~30ms 。
通常选择矩形窗和哈明窗能得到较理想的“短时分析”设计要求。
两种窗函数的时域波形如下图2.1所示:samplew (n )samplew (n )图2.1 矩形窗和Hamming 窗的时域波形矩形窗的定义:一个N 点的矩形窗函数定义为如下{1,00,()n Nw n ≤<=其他(2.1)哈明窗的定义:一个N 点的哈明窗函数定义为如下0.540.46cos(2),010,()n n NN w n π-≤<-⎧⎨⎩其他= (2.2)这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图2.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;哈明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。
信号处理中的时域分析方法及其应用
![信号处理中的时域分析方法及其应用](https://img.taocdn.com/s3/m/5358ed7b2a160b4e767f5acfa1c7aa00b52a9d6f.png)
信号处理中的时域分析方法及其应用在信号处理领域中,时域分析是一种基本的分析方法。
时域分析是指对信号在时间轴上的特性进行分析,它是从时间域的角度,对信号本身进行的分析和处理。
时域分析方法包括时域波形分析、自相关分析、互相关分析、谱分析等,本文将对这些方法进行介绍,同时介绍它们在实际应用中的表现。
一、时域波形分析时域波形分析指的是对信号波形形态的分析。
通过时域波形分析,可以对信号的震动、周期、幅值、偏移等特征进行分析和处理。
时域波形分析适用于振动信号、机械振动、声音信号、脑电信号等领域。
时域波形分析的方法有很多种,其中最常见的方法是傅里叶级数展开。
傅里叶级数展开是利用正弦函数和余弦函数的线性组合来表示周期函数的方法。
通过傅里叶级数展开,可以将不规则的波形化为一系列正弦信号的叠加,从而分析信号的频率成分和幅度。
另外,还有小波变换、离散余弦变换等方法也可以进行时域波形分析。
二、自相关分析自相关分析是指将同一信号在时间上进行平移,再进行相关分析的一种方法。
通过自相关分析,可以得到信号的自相关函数,从而得到信号的时间延迟、周期、相关性等信息。
在自相关分析中,自相关函数可以用以下公式来表示:R_{xx}[m]=\sum_{n=0}^{N-m-1}x[n]x[n+m]其中,x[n]表示原始信号,R_{xx}[m]表示信号在时间上平移m 个单位后的自相关函数。
通过自相关函数的分析,可以得到信号的自相似性和周期,同时对于极化信号、超声检测、遥感图像的分析中也有广泛的应用。
三、互相关分析互相关分析是指对两个不同信号进行相关分析的方法。
通过互相关分析,可以计算出两个信号之间的相似度。
对于两个信号之间具有强相关性的情况,可以使用互相关分析来分析它们之间的关系。
在互相关分析中,互相关函数可以用以下公式来表示:R_{yx}[m]=\sum_{n=0}^{N-m-1}x[n]y[n+m]其中,x[n]表示第一个信号,y[n]表示第二个信号,R_{yx}[m]表示两个信号相位不同后的互相关函数。
语音信号处理试验教程
![语音信号处理试验教程](https://img.taocdn.com/s3/m/1495380979563c1ec5da7137.png)
语音信号处理试验实验一:语音信号时域分析实验目的:(1)录制两段语音信号,内容是“语音信号处理”,分男女声。
(2)对语音信号进行采样,观察采样后语音信号的时域波形。
实验步骤:1、使用window自带录音工具录制声音片段使用windows自带录音机录制语音文件,进行数字信号的采集。
启动录音机。
录制一段录音,录音停止后,文件存储器的后缀默认为.Wav。
将录制好文件保存,记录保存路径。
男生女生各录一段保存为test1.wav和test2.wav。
图1基于PC机语音信号采集过程。
2、读取语音信号在MATLAB软件平台下,利用wavread函数对语音信号进行采样,记住采样频率和采样点数。
通过使用wavread函数,理解采样、采样频率、采样位数等概念!Wavread函数调用格式:y=wavread(file),读取file所规定的wav文件,返回采样值放在向量y中。
[y,fs,nbits]=wavread(file),采样值放在向量y中,fs表示采样频率(hz),nbits表示采样位数。
y=wavread(file,N),读取前N点的采样值放在向量y中。
y=wavread(file,[N1,N2]),读取从N1到N2点的采样值放在向量y中。
3、编程获取语音信号的抽样频率和采样位数。
语音信号为test1.wav和test2.wav,内容为“语音信号处理”,两端语音保存到工作空间work文件夹下。
在M文件中分别输入以下程序,可以分两次输入便于观察。
[y1,fs1,nbits1]=wavread('test1.wav')[y2,fs2,nbits2]=wavread('test2.wav')结果如下图所示根据结果可知:两端语音信号的采样频率为44100HZ,采样位数为16。
4、语音信号的时域分析语音信号的时域分析就是分析和提取语音信号的时域参数。
进行语音分析时,最先接触到并且夜市最直观的是它的时域波形。
毕业设计(论文)-基于盲源分离技术的语音信号噪声分析与处理[管理资料]
![毕业设计(论文)-基于盲源分离技术的语音信号噪声分析与处理[管理资料]](https://img.taocdn.com/s3/m/de5aab369ec3d5bbfc0a744a.png)
目录摘要 ............................................................................................................................. I II ABSTRACT ................................................................................................................. I V 第一章语音信号及噪声概述................................................................................. - 1 - 语音信号的概述 .................................................................................................... - 1 - 语音特性分析......................................................................................... - 1 -语音信号的基本特征............................................................................. - 2 -..................................................................................................................... - 3 -信噪比(Signal Noise Ratio,SNR) ........................................................ - 3 -信干比(signal-to-Interference Ratio,SIR) ........................................... - 4 - 第二章盲信号处理................................................................................................. - 5 - .................................................................................................................................. - 5 - 盲信号处理的基本概念......................................................................... - 5 -盲信号处理的方法和分类....................................................................... - 5 -盲信号处理技术的研究应用................................................................... - 6 -盲源分离法............................................................................................... - 7 -盲源分离技术........................................................................................... - 7 -盲分离算法实现....................................................................................... - 7 -盲源分离技术的研究发展和应用........................................................... - 8 - 独立成分分析 ........................................................................................................ - 9 - 独立成分分析的定义............................................................................... - 9 -ICA的基本原理..................................................................................... - 10 - 本文对ICA的研究目的及实现.......................................................................... - 12 - 第三章盲语音信号分离的实现及抑噪分析....................................................... - 15 - 盲语音信号分离的实现 ...................................................................................... - 15 - 盲信号分离的三种算法......................................................................... - 15 -不同算法的分离性能比较..................................................................... - 16 - 抑制噪声的算法仿真及结果分析 .................................................................... - 17 -抑噪算法仿真实现................................................................................. - 17 -................................................................................................................... - 20 -不同算法的分离性能比较..................................................................... - 28 - 第四章结论与展望............................................................................................... - 34 - 致谢................................................................................................................. - 36 - 参考文献................................................................................................................. - 37 - 附录................................................................................................................. - 37 -基于盲源分离技术的语音信号噪声分析与处理摘要语音信号盲分离处理的含义是指利用BSS技术对麦克风检测到的一段语音信号进行处理。
基于短时傅里叶变换的语音信号时频分析
![基于短时傅里叶变换的语音信号时频分析](https://img.taocdn.com/s3/m/e99b8807915f804d2b16c18c.png)
基于STFT 的语音信号时频分析摘要:视频分析是近年来信号处理的新热点。
本文首先介绍了语音信号STFT 的相关知识,随后利用MATLAB 将采集到的语音信号进行处理,并进行了信号时域和频域的相关分析。
关键词:语音信号 STFT 时频分析语音信号的短时傅里叶变换傅里叶变换是一种信号的整体变换,要么完全在时域,要么完全在频域进行分析处理,无法给出信号的频谱如何随时间变化的规律。
而有些信号,例如语音信号,它具有很强的时变性,在一段时间内呈现出周期性信号的特点,而在另一段时间内呈现出随机信号的特点,或者呈现出两个混合的特性。
对于频谱随时间变化的确定性信号以及非平稳随机信号,利用傅里叶变换分析方法有很大的局限性,或者说是不合适的。
傅里叶变换无法针对性的分析相应时间区域内信号的频率特征。
可以用一个窗函数与时间信号相乘积,当该窗函数的时宽足够窄,使取出的信号可以被看成是平稳信号时,就可以对乘积信号进行傅里叶变换,从而反映该时宽中的信号频谱变化规律。
早在1946年,Gabor 就提出了短时傅立叶变换(Short Time Fourier Transform ,STFT )的概念,用以测量声音信号的频率定位[64]。
给定一信号)()(2R L t x ∈,其STFT 定义为 式中 τττΩΩ-=j t e t g g )()(,及 1||)(||=τg ,1||)(||,=Ωτt g并且窗函数)(τg 应取对称函数。
STFT 的含义可解释如下:在时域用窗函数)(τg 去截)(τx (注:将)(t x ,)(t g 的时间变量换成τ),对截下来的局部信号作傅立叶变换,即得在t 时刻得该段信号得傅立叶变换。
不断地移动t ,也即不断地移动窗函数)(τg 的中心位置,即可得到不同时刻的傅立叶变换。
这些傅立叶变换的集合,即是),(Ωt STFT x ,如图1所示。
显然,),(Ωt STFT x 是变量),(Ωt 的二维函数。
信号的时域分析
![信号的时域分析](https://img.taocdn.com/s3/m/a5374dc3690203d8ce2f0066f5335a8103d2664a.png)
信号的相关性分析
总结词
相关性分析用于研究信号之间的相似性和关联性,有助于发现信号之间的内在联系和规 律。
详细描述
相关性分析是一种研究信号之间相似性和关联性的方法,通过计算两个信号之间的相似 度或相关性系数,可以发现它们之间的内在联系和规律。例如,在通信系统中,相关性
分析可以用于解调信号,提取出有用的信息。
信号的应用
01
02
03
04
通信系统
在通信系统中,信号用于传输 语音、图像、数据等信息,如 无线电波、光纤等。
控制系统
在控制系统中,信号用于传递 指令和反馈信息,如传感器、 执行器等。
测量系统
在测量系统中,信号用于表示 被测量物理量,如电压、电流 等。
生物医学工程
在生物医学工程中,信号用于 监测生理参数和诊断疾病,如 心电图、脑电图等。
80%
信号的特性
信号具有幅度、频率和相位等基 本特性,这些特性决定了信号所 携带的信息内容。
信号的分类
周期信号与非周期信号
根据信号是否具有重复性,可 以分为周期信号和非周期信号 。
连续信号与离散信号
根据信号取值方式的不同,可 以分为连续信号和离散信号。
确定信号与随机信号
根据信号是否具有确定性,可 以分为确定信号和随机信号。
周期信号
具有固定周期的信号,如正弦波和余 弦波。
03
信号的时域变换
信号的时域积分
总结词
描述信号在时间上的累积效果。
详细描述
时域积分是计算信号在某一时间点之前所有值的总和,用于描述信号在时间上的累积效果。在信号处理中,时域 积分常用于分析信号的幅度随时间的变化情况。
信号的时域微分
总结词
实验一语音信号的时域特性和频域特性
![实验一语音信号的时域特性和频域特性](https://img.taocdn.com/s3/m/86ff0338ba1aa8114431d95a.png)
实验一、语音信号的时域特性和频域特性学院:信息与通信工程学院专业:通信工程班级:104学号:2010026410姓名:黄余芳指导教师:崔艳秋1.实验名称语音信号的时域特性和频域特性2.实验类型验证性实验3.实验目的观察并验证语音信号的时域特性和频域特性,理解并掌握典型的语音信号时域分析方法和频域分析方法,为深入学习数字语音信号处理的相关理论奠定基础。
4.实验设备安装有MATLAB的计算机5.实验内容1.输入并运行MATLAB代码。
2.观察语音信号的时域特性(1)发一个清音和一个浊音,由麦克风采集语音数据,参考实验内容1中的程序将这些数据分别存成两个“.wav”文件(例如[a]的语音存为“a.wav”,要求采样率为8000),存在本人的文件夹中。
(2)读取WA V文件,显示语音波形,观察清音和浊音波形的差异。
(3)读取WA V文件,计算并显示语音的短时能量(要求分帧加窗的帧长为256,帧移为128),观察并分析清音和浊音短时能量的差异。
(4)读取WA V文件,计算并显示语音的短时过零率(要求分帧加窗是的帧长为256,帧移为128),观察并分析清音和浊音短时过零率的差异。
3. 观察语音信号的频域特性(1)读取WA V文件,计算并显示一帧语音的原始信号、加窗信号、短时频谱(要求分帧加窗的窗函数为汉明窗、帧长为256,帧移为128),观察并分析清音和浊音短时频谱的差异。
(2)读取WA V文件,计算并显示不同窗函数情况下一帧语音的加窗信号、短时频谱(要求分帧加窗的窗函数分别为矩形窗和汉明窗、帧长为256,帧移为128),观察并分析不同的窗函数对短时谱分析的影响。
6.相关函数wavread、plot、fft7.MATLAB程序代码1. 输入并运行以下MATLAB代码。
(1) 短时能量clear;close all;Fs=11025;y=wavrecord(5*Fs,Fs,'double'); wavwrite(y,'f:\\a');soundview(y,Fs);x = wavread('f:\\a.wav');x = double(x);x = filter([1 -0.9375], 1, x); % 预加重FrameLen = 256;FrameInc = 128;s = enframe(x, FrameLen, FrameInc); energy = sum(abs(s), 2);figure;subplot(2,1,1);plot(x);title('语音信号时域波形');xlabel('样点数');ylabel('幅度');subplot(2,1,2);plot(energy);title('语音信号的短时能量');xlabel('帧数');ylabel('短时能量');legend('帧长FrameLen = 240');(2) 短时过零率clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen = 256;FrameInc =128;tmp1 = enframe(x(1:end-1), FrameLen, FrameInc);tmp2 = enframe(x(2:end) , FrameLen, FrameInc);signs = (tmp1.*tmp2)<0;diffs = (tmp1 -tmp2)>0.02;zcr = sum(signs.*diffs, 2);figure;subplot(2,1,1);plot(x);title('语音信号时域波形');xlabel('样点数');ylabel('幅度');subplot(2,1,2);plot(zcr);xlabel('帧数');ylabel('短时过零率');title('语音信号的短时过零率');(3) 短时傅里叶变换clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(50,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*hamming(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加Hamming窗时语音频谱');(4) 显示清音短时过零率clear;close all;x = wavread('f:\\k.wav');x = double(x);FrameLen = 256;FrameInc =128;tmp1 = enframe(x(1:end-1), FrameLen, FrameInc); tmp2 = enframe(x(2:end) , FrameLen, FrameInc); signs = (tmp1.*tmp2)<0;diffs = (tmp1 -tmp2)>0.02;zcr = sum(signs.*diffs, 2);figure;subplot(2,1,1);plot(x);title('语音信号时域波形');xlabel('样点数');ylabel('幅度');subplot(2,1,2);plot(zcr);xlabel('帧数');ylabel('短时过零率');title('语音信号的短时过零率');2:语音信号的频域分析1.加汉明窗的浊音clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(125,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*hamming(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加Hamming窗时语音频谱2.加汉明窗的清音clear;close all;x = wavread('f:\\k.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(90,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*hamming(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加Hamming窗时语音频谱3.加矩形窗的浊音clear;close all;x = wavread('f:\\a.wav');x = double(x);FrameLen =256;FrameInc =128;s = enframe(x, FrameLen, FrameInc);ss=s(125,:); %选取一帧语音信号(可以通过观察短时能量的分布来判断哪一帧是清音段还是浊音段)f=ss'.*rectwin(length(ss));r=fft(f,512);r1=abs(r);r1=r1/max(r1);yuanlai=20*log10(r1);signal(1:256)=yuanlai(1:256);pinlv=(0:1:255)*11025/512;figure;subplot(3,1,1);plot(ss);axis([0,256,-1,1])title('截取的语音段');xlabel('样点数');ylabel('幅度');subplot(3,1,2);plot(f);axis([0,256,-1,1])title('窗选语音信号');xlabel('样点数');ylabel('幅度');subplot(3,1,3);plot(pinlv,signal);xlabel('频率/Hz');ylabel('对数幅度/dB');title ('加矩形窗时语音频谱)8.实验结果及其分析浊音(1) 短时能量0.51 1.52 2.53 3.54x 104-1012语音信号时域波形样点数幅度050100语音信号的短时能量帧数短时能量(2) 短时过零率0.511.52 2.533.54x 104-1-0.500.51语音信号时域波形样点数幅度102030帧数短时过零率语音信号的短时过零率(3) 短时傅里叶变换01截取的语音段样点数幅度5010015020025001窗选语音信号样点数幅度-1000频率/Hz对数幅度/d B加Hamming 窗时语音频谱清音(1) 短时能量x 104012语音信号时域波形样点数幅度0204060语音信号的短时能量帧数短时能量(2) 短时过零率x 104-1-0.500.51语音信号时域波形样点数幅度5010015020025030035005101520帧数短时过零率语音信号的短时过零率(3) 短时傅里叶变换01截取的语音段样点数幅度01窗选语音信号样点数幅度5001000150020002500300035004000-1000频率/Hz对数幅度/d B加Hamming 窗时语音频谱(4) 显示清音短时过零率x 10401语音信号时域波形样点数幅度05101520帧数短时过零率语音信号的短时过零率加窗(1)加汉明窗的浊音50100150200250-101截取的语音段样点数幅度50100150200250-101窗选语音信号样点数幅度100020003000400050006000-100-500频率/Hz对数幅度/d B加Hamming 窗时语音频谱(2)加汉明窗的清音-101截取的语音段样点数幅度50100150200250-101窗选语音信号样点数幅度-100-500频率/Hz对数幅度/d B加Hamming 窗时语音频谱(3)加矩形窗的浊音50100150200250-101截取的语音段样点数幅度-101窗选语音信号样点数幅度-100-500频率/Hz对数幅度/d B加矩形窗时语音频谱分析:(1)对于浊音与清音,浊音的幅值比较明显,有一个的波动,能清楚的看清楚它的周期;而清音类似于白噪声,没有明显的幅值,很平缓。
第1章-语音信号短时分析技术
![第1章-语音信号短时分析技术](https://img.taocdn.com/s3/m/f8e073f9f78a6529657d5308.png)
罗森贝格(Rosenberg)在研究中发现,如果在发浊音时声门 脉冲取如图所示的形状,可以获得比较好的合成语音效果。
gn c1 2o 1 scnoN sn1//N21N ,2,
0
0nN1
N1nN1N2 其它
40
发浊音时的声门脉冲
2、声道模型
(一)声管模型
把声道视作截面积变化的管子,研究声音沿管道是怎样传播的。
1、言语的过程和作用
想说阶段————大脑中枢活动 说出阶段————发音器官的活动 传送阶段————传送信息的物理过程起作用 接收阶段————听觉系统活动 理解阶段————大脑中枢活动
14
2、一些基本概念 音素和音节
① 音素(phoneme):语音的最小单位,由音素构成音节。 ② 音节(Syllable):说话时一次发出的,具有一个响 亮的中心,并被明显感觉的语音片断。
10
70年代:
• 70年代开始,人工智能技术开始引入到语音识别中。美
国国防部ARPA组织了有CMU等五个单位参加的一项大规 模语音识别和理解研究计划;
•70年代中,日本学者提出的动态时间弯折算法对小词表的 研究获得了成功,从而掀起了语音识别的研究热潮;
•70年代末,基于矢量量化码本生成的LBG算法被提出,从 而使矢量量化技术广泛地应用于语音识别、语音编码和说 话人识别中;
基音的范围约为70~350 Hz左右。
28
声道(vocal tract) 17cm 由咽腔、口腔和鼻腔三个空气腔体组成。
声道是一个分布参数系统,它有许多自然谐振频率(在这 些频率上其传递函数具有极大值),所以声道是一谐振腔, 它放大某一频率而衰减其他频率分量。谐振频率由每一瞬 间的声道外形决定。 如果声道的截面是均匀的,谐振频率将发生在
语音信号处理-第03章 语音信号的时域分析方法
![语音信号处理-第03章 语音信号的时域分析方法](https://img.taocdn.com/s3/m/4a766e777fd5360cba1adbdb.png)
1 2 − 3x 2σ x
PL ( x) =
− 1 e 2σ x 2σ x
2x
二、零均值 三、非平稳时变信号;短时平稳:10~30ms
§3.2语音信号短时分析方法
语音信号的开窗分析技术: (1)均匀窗: (2)非均匀窗:各种国际标准 (3)重叠窗(Overlap) 设:语音信号为S(n),加窗语音记为 Sw(n) = W[S(n)] = S(n) w(n-m),n=0~(N-1) 则语音处理系统可表示为
5
基于能量和过零率的双门限法检测法
首先用短时能量做第一次判断,然后在此基础上 用短时平均过零率做第二次判断。 这种方法端点的确定与以后的判决无关,因此称 为显式法。
三、短时相关分析
短时自相关函数性质 • 1. R w( −l ) = R w(l ) 为偶函数; • 2. 在-N+1~N-1之间有值; • 3. R ( 0 ) = ∑ s ( n ) ≥ R ( k ) 为最大值。 • 4.当时域信号为周期信号时,自相关函 数也是周期性函数,两者周期相同。 浊音:呈现‘准’周期性、逐渐衰减
300
350
400
450
女声汉语拼音a的一帧信号(在采样频率为 22050Hz的情况下,取20ms作为一帧),短 时过零率为46。
0 .3
0 .2
0 .1
0
-0 . 1
-0 . 2
-0 . 3
-0 . 4
0
50
100
150
200
250
300
350
400
450
男声汉语拼音s的一帧信号(在采样频率为 22050Hz的情况下,取20ms作为一帧),短 时过零率为183。
第3章时域分析
![第3章时域分析](https://img.taocdn.com/s3/m/209b0cc6195f312b3169a59d.png)
第三章时域分析刘健副教授liujian@课件下载地址:课件下载地址voicesp2013@/voicesp123456北京科技大学3.1 语音分析方法概述语音分析是语音合成及语音识别的基础。
短时分析技术——贯穿语音分析全过程语音分析的三种方法:(1)时域分析法——时域波形图。
(2)频域分析法——频谱图。
(2)频域分析法频谱图(3)语谱分析法——语谱图。
(1)时域分析法语音的时域分析采用时域波形图。
坐是,纵坐是。
横坐标是时间,纵坐标是幅值。
(2)频域分析法频域分析包含:语音信号的频谱、功率包含信的率谱、倒频谱、频谱包络、短时间谱等。
常用的频域分析方法有:a带通滤波器组法a.带通滤波器组法。
b.傅里叶变换法。
c.线性预测法等。
(3)语谱分析法语谱分析法是另种用于语音分析的有效方语谱分析法是另一种用于语音分析的有效方法。
语谱分析法始于20世纪40年代,当时研制成功语谱仪,能生成语谱图。
语谱图可以在二维(时间及频率)图上表示音强的关系,提供了有关不同时间不同频率的相对音强的有价值的信息。
对音强的有价值的信息3.2 语音的时域分析三种常用的时域分析方法:三种常用的时域分析方法(1)过零分析(2)幅度分析/能量分析(3)相关分析3.2 语音信号数字化-采样量化语音信号数字化采样量化采样:一个数字信号取样之后,变成离散时间信号,接下来就是要用数字方式来表示这个离散时间信号上的每个取样值的每个取样值。
量化:一个电位波形会有固定的电压范围,一个取样值可以是在此电压范围内的任何电位。
如果只能用固值可以是在此电压范围内的任何电位如果只能用固定数目的位来表示这些取样值,那么这些二进数字就只能代表固定的几个电位值,这个转换就是量化只能代表固定的几个电位值这个转换就是量化(quantization),而转换之后只允许存在的几个电位值(quantization level)就是量化阶数(quantization level)。
声音的时域频域分析
![声音的时域频域分析](https://img.taocdn.com/s3/m/f9c59ffcf705cc1755270912.png)
音高
音高也称基音,物理单位为赫兹,主观感觉
的音高单位为“美”(Mel)。当声强级为40dB, 频率为1kHZ时,设定音高为1000美。 音高与响度之间具有互为补充的关系,例如 可用频率补充声强使得人们感觉像度相同,也可用 声强补充频率使得人们感觉音高相同。
2.
不同声音的区别与分析
声音类型
The kinds of voice
0
0
500
1000 1500 2000 2500 3000 3500 4000 4500 5000
不同类型声音对比分析
笛子的语谱图 钢琴的语谱图
20
20
频 率 /Hz
10
频 率 /Hz
频 率 /Hz
10
频 率 /Hz
幅度
15
15
10
5
5
0
0
2
4
6 时 间 /s 萨克斯的语谱图
8
10 x 10
-3
0
0
0
500
1000
1500
2000 2500 3000 frequency/Hz
3500
4000
4500
5000
频率
0 500 1000 1500 2000 2500 3000 frequency/Hz 3500 4000 4500 5000
不同类型声音对比分析
类型 性别差异 乐器差异 语种差异
时域图 图1-1 图2-1 图3-1 波形主要由占空比 和响度决定,不同 类型的声音时域图 差别较大。乐器的 响度普遍高于人声, 男生的响度略高于 女生。
若空气流经声带时,声带为完全舒展开的,声道 将会形成一个狭隘的通道形成湍急的空气流,发 出摩擦清音;或是完全闭合,在气流达到开启点 后快速释放,经声道形成爆破清音。
语音信号时域和频域通俗理解_概述及解释说明
![语音信号时域和频域通俗理解_概述及解释说明](https://img.taocdn.com/s3/m/03fc5ac5a1116c175f0e7cd184254b35eefd1a3e.png)
语音信号时域和频域通俗理解概述及解释说明1. 引言1.1 概述语音是人类最基本、也是最常用的沟通方式之一。
人们通过声音来传递信息和表达情感。
对于语音信号的分析和处理,时域和频域是两个重要的角度。
时域分析主要关注声音信号在时间上的变化规律,而频域分析则关注声音信号在频率上的成分组成。
1.2 文章结构本文将以通俗易懂的方式,对语音信号的时域和频域进行解释和说明。
首先,我们将介绍时域和频域分析的基本概念及其重要性,然后详细讨论时域与频域分析中涉及到的关键点和方法。
最后,我们将总结观点并给出读者一些启示和建议。
1.3 目的本文旨在帮助读者理解语音信号时域与频域这两个概念,并且能够清晰明了地认识到它们在语音信号处理中所起到的作用。
通过对时域与频域分析方法的说明,读者可以更好地理解并应用这些知识于实际问题中。
同时,本文也希望能够引发读者对语音信号处理的更深层次的思考和探索。
2. 语音信号时域与频域通俗理解:2.1 语音信号时域分析:语音信号的时域分析是对声音在时间上的变化进行研究和处理。
时域分析主要关注声音的振幅和时间之间的关系。
在时域中,我们可以观察到声音振动的波形图。
当我们录制一段语音时,在录制过程中,麦克风会将声音转换为电信号,并按照一定的采样率记录下来。
这些记录的电信号就是我们所说的波形图。
波形图横坐标表示时间,纵坐标表示振幅。
通过观察波形图,我们可以获得很多有用的信息。
例如,振幅可以告诉我们声音的强度或者说响度,而波形图上不同部分振幅大小和模式的变化可以揭示出不同语音特征(如元音、辅音等)以及语速、语调等信息。
2.2 语音信号频域分析:语音信号的频域分析是对声音中各种频率成分进行研究和处理。
频域分析更注重声音中各个频率成分之间的关系以及它们在声谱上呈现出来的特征。
通过傅里叶变换的方法,我们可以将时域中记录的波形图转换为频谱图。
频谱图显示了声音中不同频率成分在整个录制时间内的存在情况。
横坐标表示频率,纵坐标表示声音强度。
信号特征的时域提取方法 -回复
![信号特征的时域提取方法 -回复](https://img.taocdn.com/s3/m/9d86e7a39a89680203d8ce2f0066f5335a816732.png)
信号特征的时域提取方法-回复提取信号特征是信号处理领域的重要任务之一。
信号的特征可以描述信号的频率、幅度、相位等属性,对于信号的分类、识别、分类和应用有着重要的作用。
时域是一种常用的信号分析方法,通过对信号的时序特征进行提取和分析,可以获得信号的重要特征信息。
本文将介绍几种常用的时域提取方法,并详细阐述每种方法的原理和应用。
一、时域特征提取的基本原理时域特征提取是通过对信号的时序进行分析,提取信号在时间轴上的各种特征。
常用的时域特征包括均值、方差、峰值、时间差等。
这些特征可以用于描述信号的振幅、变化速度、周期性等属性。
时域特征提取的基本原理如下:1. 信号的均值提取:均值是指信号在给定时间段内的平均值。
通过计算信号的均值可以得到信号的直流分量,用于描述信号的整体水平。
2. 信号的方差提取:方差是指信号在给定时间段内的离散程度。
通过计算信号的方差可以了解信号的波动性和不确定度。
3. 信号的峰值提取:峰值是指信号在给定时间段内的最大值或最小值。
通过求取信号的峰值可以了解信号的最高点或最低点,并描述信号的波动性。
4. 信号的时间差提取:时间差是指信号在给定时间段内相邻点之间的时间间隔。
通过计算信号的时间差可以了解信号的变化速率和周期性。
二、常用的时域特征提取方法1. 信号的平均值提取方法平均值是信号数据的统计量,可以描述信号的整体水平。
平均值的提取方法主要有两种:一种是简单的平均值方法,另一种是加权平均值方法。
简单平均值方法是将信号的所有数据进行求和后除以数据点的个数。
这种方法适用于信号没有明显变化趋势的情况。
加权平均值方法是根据信号的变化趋势对数据进行加权求和后再除以权重的总和。
这种方法适用于信号具有明显变化趋势的情况。
2. 信号的方差提取方法方差是信号数据的统计量,可以描述信号的离散程度。
方差的提取方法主要有两种:一种是简单的方差方法,另一种是加权方差方法。
简单方差方法是先求出信号的平均值,然后将每个数据点与平均值的差值的平方求和后除以数据点的个数。
语音质量分析报告
![语音质量分析报告](https://img.taocdn.com/s3/m/191c7b839fc3d5bbfd0a79563c1ec5da50e2d60e.png)
语音质量分析报告【语音质量分析报告】一、引言语音质量是指语音信号的清晰度和完整度,是评估语音通信系统的关键指标之一。
本报告将对语音质量进行全面的分析,包括对语音信号的信噪比、失真、延迟、韵律等方面进行评估。
通过对语音质量的分析,可以为优化语音通信系统提供有效的参考依据。
二、评估指标1. 信噪比:信噪比是评估语音质量的重要指标之一,表征了语音信号与背景噪声的比值。
信噪比越高,语音信号的清晰度越高。
通过对语音信号的录制和分析,我们测得该语音样本的信噪比为20dB,属于良好水平。
2. 失真:失真是指语音信号在传输和处理过程中发生的变形和变化,导致语音质量下降。
失真一般分为量化失真、非线性失真和编解码失真等几种类型。
通过对语音信号的频谱分析和比较,我们发现该语音样本的失真较小,信号的频谱和时域特征基本保持完整。
3. 延迟:延迟是指语音信号从发出到接收之间的时间差,也称为信号传输的延时。
延迟时间越短,通信的实时性越高。
通过对通话录音的分析,我们测得该语音样本的延迟为200ms,符合实时通信的要求。
4. 韵律:韵律是指语音信号中的节奏、音调和重音等音频特征,直接影响到语音的自然度和可懂度。
通过对语音样本的语调和节奏的分析,我们发现该语音样本的韵律比较准确,语音的自然度较高。
三、存在问题在对语音质量进行分析的过程中,我们也发现了一些问题:1. 前期处理不足:语音录制过程中,可能存在一些干扰信号和噪声,对语音质量产生一定的影响。
在后期处理过程中,应加强对噪声的滤除和降噪处理,提高语音信号的清晰度。
2. 网络传输问题:语音通信过程中,网络传输可能存在一定的延迟和丢包率,导致语音质量下降。
应针对网络传输问题进行优化,提高语音通信的稳定性和实时性。
3. 设备问题:语音质量还受到录音设备和播放设备的影响。
在选择和配置设备时,应考虑到设备的音质和性能,在保证语音质量的前提下选择合适的设备。
四、改进措施为了提高语音质量,我们提出以下改进措施:1. 优化录音环境:在录制语音信号时,应选择一个良好的录音环境,降低干扰信号和噪声的干扰。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中北大学课程设计说明书学生姓名:蒋宝哲学号: 24学生姓名:瓮泽勇学号: 42学生姓名:侯战祎学号: 47学院:信息商务学院专业:电子信息工程题目:信息处理实践:语音信号的时域特征分析指导教师:徐美芳职称: 讲师2013 年 6 月 28 日中北大学课程设计任务书2012-2013 学年第二学期学院:信息商务学院专业:电子信息工程学生姓名:蒋宝哲学号: 24 学生姓名:瓮泽勇学号: 42 学生姓名:侯战祎学号: 47 课程设计题目:信息处理实践:语音信号的时域特征分析起迄日期: 2013年6 月7日~2013年6月 28 日课程设计地点:学院楼201实验室、510实验室、608实验室指导教师:徐美芳系主任:王浩全下达任务书日期: 2013 年 6 月 7 日语音信号的采集与分析摘要语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。
其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。
本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。
关键词:语音信号,采集与分析, Matlab0 引言通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。
语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。
因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。
并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。
现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。
让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。
随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。
作为高科鼓应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。
它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。
可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。
我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。
语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活跃的前沿学科保持密切的联系.并且一起发展。
语音信号采集与分析是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。
对语音信号采集与分析的研究一直是数字信号处理技术发展的重要推动力量。
因为许多处理的新方法的提出,首先是在语音信号处理中获得成功,然后再推广到其他领域。
1.语音信号的介绍1.1 语音信号的特点通过对大量语音信号的观察和分析发现,语音信号主要有下面两个特点:①在频域内,语音信号的频谱分量主要集中在300~3400Hz的范围内。
利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。
②在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。
在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。
下面是一段语音信号的时域波形图(图2-1)和频域图(图2-2),由这两个图可以看出语音信号的两个特点。
Frequency(Hz)Time(s)x 104图2-1语音信号时域波形图图2-2语音信号频域波形图Figure 2-1Speech signal time-domain waveform Figure 2-2 Frequency-domain speech signal waveform1.2语音信号的采集在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:①抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率),以防止混叠干扰。
②抑制50Hz的电源工频干扰。
这样,预滤波器必须是一个带通滤波器,设其上、下截止颜率分别是fH和fL,则对于绝人多数语音编译码器,fH=3400Hz、fL=60~100Hz、采样率为fs=8kHz;而对丁语音识别而言,当用于电话用户时,指标与语音编译码器相同。
当使用要求较高或很高的场合时fH=4500Hz或8000Hz、fL=60Hz、fs=10kHz或20kHz。
为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。
采样也称抽样,是信号在时间上的离散化,即按照一定时间间隔△t在模拟信号x(t)上逐点采取其瞬时值。
采样时必须要注意满足奈奎斯特定理,即采样频率fs必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建波它是通过采样脉冲和模拟信号相乘来实现的。
下图时一段语音信号在采样频率44.1KHz 情况下的频谱图。
原始信号x 104x 104-0.200.20.40.6抽取后的信号11.522.53对上述信号进行1/80采样频率抽取,即采样频率变为将近500Hz 时,由于采样频率比较小,所以采样点数就稀疏,所得离散信号就越偏离于原信号,频谱也发生了混叠。
在采样的过程中应注意采样间隔的选择和信号混淆:对模拟信号采样首先要确定采样间隔。
如何合理选择△t 涉及到许多需要考虑的技术因素。
一般而言,采样频率越高,采样点数就越密,所得离散信号就越逼近于原信号。
但过高的采样频率并不可取,对固定长度(T )的信号,采集到过大的数据量(N=T/△t ),给计算机增加不必要的计算工作量和存储空间;若数据量(N )限定,则采样时间过短,会导致一些数据信息被排斥在外。
采样频率过低,采样点间隔过远,则离散信号不足以反映原有信号波形特征,无法使信号复原,造成信号混淆。
根据采样定理,当采样频率大于信号的两倍带宽时,采样过程不会丢失信息,利用理想滤波器可从采样信号中不失真地重构原始信号波形。
量化是对幅值进行离散化,即将振动幅值用二进制量化电平来表示。
量化电平按级数变化,实际的振动值是连续的物理量。
具体振值用舍入法归到靠近的量化电平上。
语音信号经过预滤波和采样后,由A /D 变换器变换为二址制数字码。
这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。
市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D 变换、量化处理的离散的数字信号。
在实际工作中,我们可以利用windows 自带的录音机录制语音文件,图2-3是基于PC机的语音信号采集过程,声卡可以完成语音波形的A/D转换,获得W A VE文件,为后续的处理储备原材料。
调节录音机保存界面的“更改”选项,可以存储各种格式的W A VE文件。
图2-3 基于PC机的语音信号采集过程Figure 2-3 Voice PC-based signal acquisition process采集到语音信号之后,需要对语音信号进行分析,如语音信号的时域分析、频谱分析、语谱图分析以及加噪滤波等处理。
2 语音信号的分析2.1语音信号分析技术语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理[8]。
而且,语音合成的音质好坏,语音识别率的高低,也都取决于对语音信号分桥的准确性和精确性。
因此语音信号分析在语音信号处理应用中具有举足轻重的地位。
贯穿于语音分析全过程的是“短时分析技术”。
因为,语音信号从整体来看其特性及表征其本质特征的参数均是随时间而变化的,所以它是一个非乎稳态过程,不能用处理乎稳信号的数字信号处理技术对其进行分析处理。
但是,由于不同的语音是由人的口腔肌肉运动构成声道某种形状而产生的响应,而这种口腔肌肉运动相对于语音频率来说是非常缓慢的,所以从另一方面看,虽然语音倍号具有时变特性,但是在一个短时间范围内(一般认为在10~30ms的短时间内),其特性基本保持不变即相对稳定,因面可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。
所以任何语音信号的分析和处理必须建立在“短时”的基础上.即进行“短时分析”,将语音信号分为一段一段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为10~30ms。
这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。
根据所分析出的参数的性质的不同,可将语音信号分析分为时域分析、频域分析、倒领域分析等;时域分析方法具有简单、计算量小、物理意义明确等优点,但由于语音信号最重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,所以相对于时域分析来说频域分析更为重要。
本文将简要介绍时域分析、频域分析以及语谱图分析。
2.2 语音信号的时域分析语音信号的时域分析就是分析和提取语音信号的时域参数。
进行语音分析时,最先接触到并且也是最直观的是它的时域波形。
语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。
时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。
这种分析方法的特点是:①表示语音信号比较直观、物理意义明确。
②实现起来比较简单、运算且少。
③可以得到语音的一些重要的参数。
④只使用示波器等通用设备,使用较为简单等。
语音信号的时域参数有短时能量、短时过零率、短时白相关函数和短时平均幅度差函数等,这是语音信号的一组最基本的短时参数,在各种语音信号数字处理技术中都要应用[6]。
在计算这些参数时使用的一般是方窗或汉明窗。
2.2.1 短时能量及短时平均幅度分析设语音波形时域信号为x(l)、加密分帧处理后得到的第n 帧语音信号为 Xn(m ),则Xn(m)满足下式:()()()()n x m w m x n m m =+ 01m N ≤≤- (3-1) 10~(1)(){m N m w m =-==, 0, 其他值 (3-2)其中,n =0,1T ,2T ,…,并且N 为帧长,T 为帧移长度。