语音信号的倒谱分析共62页
语音信号处理PPT_第三章_语音信号分析
En
xn (m )
2
m 0
T[x]=x2
短时能量及短时平均幅度分析
En是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即 它对高电平非常敏感(因为它计算时用的是信号的平方)。为此, 可采用另一个度量语音信号幅度值变化的函数,即短时平均幅度 N 1 函数Mn,它定义为:
M
n
xn (m )
它与12位线性转换器等效。
预处理
由于语音信号的平均功率谱受声门激励和口鼻辐射影响,高频端 大约在800Hz以上按6dB /倍频程跌落,要在预处理中进行预加重 (Preemphasis)处理。 预加重目的: 提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整 个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参 数分析。 预加重可在语音信号数字化时在反混叠滤波器之前进行,不仅可 以进行预加重,而且可以压缩吸纳后的动态范围,有效提高信噪 比。 预加重一般在语音信号数字化之后,利用数字滤波器实现: 1 H (z) 1 z 值接近1。
S N R ( d B ) 6 .0 2 B 7 .2
x2 X S N R ( d B ) 1 0 lg 2 6 .0 2 B 4 .7 7 2 0 lg m a x e x
A/D转换器分为线性和非线性转换器两类。 目前的线性A/D转换器绝大部分是12bits的(即每一个采样 脉冲转换为12位二进制数)。非线性A/D转换器则是8位的,
n n
短时相关分析
右图中:N=401,Fs=8kHz a、b是浊音信号,c位清 音信号,由图可以看出浊 音信号的自相关函数具有 一定得周期性,而清音信 号的自相关函数缺乏周期 性。
7-语音信号的同态滤波和倒谱分析NEW10n
• 如果设语音信号为 x(n) ,则通过第一个卷积特征系统 ˆ ˆ D*[ ]变换为系统 x1 (n) + x 2 (n) ; ˆ ˆ • 设 x1 (n) 为声门激励信号, x2 (n) 为声道冲击响应,则 如果两者处于不同的位置,并且互不交替,那么,适当的 设计线性系统,便可将两者分开处理; • 或者是提取其中之一,而同时抑制另一个;
∗
D∗−1 [
]
• D*[ ]将两时间序列的卷积运算变为两时间序列的加法运算; • 具体而言, D*[ ]包括三步:①z变换将两时间序列的卷积变成 相应z变换之乘积;②采用对数运算将相乘的两个z变换变成它 们各自的对数的和;③逆z变换将z域转换回到时域; • 卷积特征系统D*[ ]如下图:
x1 (n) ∗ x2 (n) Ζ[
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
第四节 复倒谱的性质和计算方法
• 复倒谱的几个重要性质:证明过程略
ˆ (1)即使序列x(n)是有限长的,其复倒谱 x(n) 总是无
1 arg[ X ( N )] ⎧ 2 π N为奇数 r=⎨ 1 N −1 N +1 ⎩ 2π {arg[ X ( 2 )] + arg[ X ( 2 )]} N为偶数
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
浊音的倒谱分析实例
• 浊音倒谱分析如下图; 原信号
对数谱:DFT 后求对数,包 含慢变化包络 和快变化周期 性细致结构;
语音信号的倒谱分析
因为
ˆ X ' (Z ) X ' (Z ) X (Z )
求复倒谱的一种有效的递推算法
ˆ Z[nx(n)] Z (nx(n))Z[ x(n)]
ˆ n( x(n)) {nx(n)} x(n)
n 1
l ˆ ˆ x(n) ( ) x(l ) x(n l ) x(n) x(0) l 0 n 可推导出: ˆ x ( n)
i 1
P
ˆ e(n) s(n) s(n) s(n) ai s(n i) ai s(n i)
i 1 i 0
P
P
线性预测原理
线性预测是目前分析语音信号的最有效的方法之一,分 析的结果是得到一组信号的全极点模型参数,所以又称 为信号参数模型法。 这个方法的基本思想是将被分析信号模型化,即用有限 数目的模型参数来描述信号中的信息,具体来说,将被 分析信号s(n)视为某系统(即模型)的输出,而系统的 输入,在s(n)为确定性信号是采用单位取样序列。在s(n) 为随机信号是采用白噪声序列。
Linear
Prediction
1947年维纳提出; 1967年板仓等人应用于语音分析与合成;
语音信号处理与分析的核心技术
提供了预测功能;
提供了声道模型和声道模型的参数估计方法;
基本思想:
语音样本之间存在相关性,一个语音信号的样本可 以用过去若干个样本的线性组合来逼近;
ˆ s ( n) a i s ( n i )
g jZ
j 0
Q
j
, A( Z ) ai Z i
i 0
P
g j 和ai都是实数,且a0 1。如果能有一种算法,可能根据已知的s (n) 正确的估计出这些参数,那么未知的系统V(Z)便可求得。由于 E ( Z )V ( Z ) S ( Z ),根据V ( Z )和S ( Z )便可以求得E(Z),从而全部解决 解卷的的问题。
实验三 语音信号的mel频率倒谱参数
实验四 语音信号的mel 频率倒谱参数1 实验目的通过Matlab 编程掌握语音信号的mel 频率倒谱参数的求解方法。
2 实验原理人耳听到声音的高低与声音的频率成对数关系,即:Mel(f)=2595lg(1+f/700),实际频率f 的单位是Hz.根据Zwicker 的工作,临界频率带宽随着频率的变化而变化,并与Mel 频率的增长一致。
类似与临界带的划分,可以将语音频率划分成一系列三角形的滤波器序列,如下图所示.取每个三角形的滤波器频率带宽内所有信号幅度加权和作为某个带通滤波器的输出,然后对所有滤波器输出做对数运算,再进一步做离散余弦变换得到MFCC 。
具体步骤如下:(1)三角滤波器的输出则为此频率带宽内所有信号幅度谱加权和。
()()()()()()()|()||()|()()()()c l h l n n k o l k c l k o l h l k Y l X k X k c l o l h l c l ==--=+--∑∑l = 1,2,....,40(2)对所有滤波器输出作对数运算ln(())Y l l = 1,2,....,40(3)作离散余弦变换(DCT )得到Mel 频率倒谱参数(MFCC)。
2411ln(())cos[()]224i l C Y l i l π==-∑i = 1,2,...,P ,P 为MFCC 参数的阶数,取P =16。
3 实验过程4 实验结果[x,fs,bits]=wavread('c:\WINDOWS\Media\chimes.wav');x=x(:,1);x=x';len=length(x);N=256;M=128;Fn=fix((len-N)/M+1);y=[];for i=1:Fndown=1+(i-1)*M;up=down+N-1;temp=x(down:up);temp=temp.*hamming(N)';y=[y;temp];endL=40;R=16;k=0:N/2;f=fs/N*k;%ÕâÀï²»ÒªÔÙ³ýÒÔ2mel=2595*log(1+f/700);%melm=max(mel)melm=2595*log(1+fs/1400);r=0:L+1;tri=melm/(L+1)*r;s=[];for j=1:Fntemp1=y(j,:);p=abs(fft(temp1));for l=1:Ltri1=[tri(l),tri(l+1),tri(l+2)];low=find((mel>=tri1(1))&(mel<=tri1(2)));high=find((mel>=tri1(2))&(mel<=tri1(3)));w=[(mel(low)-tri1(1))/(tri1(2)-tri1(1)),(tri1(3)-mel(high))/(tri1(3)-tri1(2))];%ÕâÀﶪÁËÀ¨ºÅ£¬²¢ÇÒ±äÁ¿Ãû×Ö¸ã´í%tri3=tri(3)%tri2=tri(2)% w2=(tri(3)-mel(high))/(tri(3)-tri(2))m(l)=sum(w.*p([low,high]),2);endl=1:L;for q=1:Rc(q)=sqrt(2/N)*sum(log(m).*cos((l-0.5)*q*pi/L),2);ends=[s;c];endplot(s')%³ÌÐò±àдʱעÒâ±äÁ¿µÄÃû³Æ¸ãÇå³þ£¬²»ÒªÈ¡Ïà½üµÄÃû×Ö¡£À¨ºÅ²»ÒªÂ©µô¡£。
语音信号处理课件 第05章同态滤波及倒谱分析
M
∞
k
5.4 语音信号两个卷积分量复倒谱的性质
ˆ ˆ 3) 对 X ( z ) 进 行 逆 z 变 换 得 到 x ( n ) : ˆ x(n) = Z 令βk
5.4 语音信号两个卷积分量复倒谱的性质
语音信号可看作是声门激励信号和声道冲激响应 的卷积 1.声门激励信号的复倒谱:(主要分析浊音激励)
x(n) =
∑α
r =0
M
r
δ ( n − rN p ) , M 和 r 均 为 正 整 数
且 0 ≤ r ≤ M , α r为 幅 度 因 子 ,N p为 用 样 点 数 表 示 的 基 音 周 期 。 ˆ 求 x(n) : 1) X ( z ) =
第5章 语音的同态滤波及倒谱分析
5.1 5.2 5.3 5.4 5.5 5.6 概述 同态信号处理的基本原理 复倒谱和倒谱 语音信号两个卷积分量复倒谱的性质 避免相位卷绕的算法 语音信号的复倒谱分析实例
5.1 概述
在这一章中讨论的同态处理方法是一种非线性方法. 它能将两个信号通过乘法合成的信号或通过卷积合 成的信号分开.
两个特征系统(它们只取决于信号的组合规则)
第一个系统以若干信号的卷积组合作为其输入,并将它变 换成对应输出的相加性组合。 第二个系统是一个普通线性系统,它服从叠加原理。
一个线性系统(它仅取决于处理的要求)。
第三个系统是第一个系统的逆变换,即它将信号的相加性 组合反变换为卷积组合。
这种同态系统的重要性在于,可以使这种系统的设计简化 为线性系统的设计问题。
5.1 概述
广义叠加原理
小四边形表示输入矢量之间的运算、小三角形表示输入矢量与 标量之间的运算、小圆形表示输出矢量之间的运算、小菱形表 示输出矢量与标量之间的运算。 输入矢量之间的运算和输出矢量之间的运算可以为: 加法、 乘法或卷积等运算。 输入矢量或输出矢量与标量之间的运算可以为: 乘法、幂或开方等运算
倒谱分析
图
图
图
(2).倒频谱的应用
分离信息通道对信号的影响
图2.26对数功率谱关系图。
在机械状态监测和故障诊断中,所测得的信号,往往是由故障源经系统路径的传输而得到的响应,也就是说它不是原故障点的信号,如欲得到该源信号,必须删除传递通道的影响。
如在噪声测量时,所测得之信号,不仅有源信号而且又有不同方向反射回来的回声信号的混入,要提取源信号,也必须删除回声的干扰信号。
若系统的输入为x(t),输出为y(t),脉冲响应函数是h(t),两者的时域关系为: y(t)=x(t)*h(t)
频域为: Y(f)=X(f)*H(f)或Sy(f)=Sx(f)*|H(f)|2
对上式两边取对数,则有:
(2.11)
式(2.72)关系如图(2.26)所示,源信号为具有明显周期特征的信号,经过系统特性logGk(f)的影响修正,合成而得输出信号logGy(f)。
对于(2.72)式进一步作傅里叶变换,即可得幅值倒频谱:
(2.12)
即:
(2.13)
以上推导可知,信号在时域可以利用x(t)与h(t)的卷积求输出;在频域则变成X(f)与H(f)的乘积关系;而在倒频域则变成Cx(q)和Ch(q)相加的关系,使系统
特特性Ch(q)与信号特性Cx(q)明显区别开来,这对清除传递通道的影响很有用处,而用功率谱处理就很难实现。
图(2.26b)即为相应的倒频谱图。
从图上清楚地表明有两个组成部分:一部分是高倒频率q2,反映源信号特征;另一部分是低倒频率q1,反映系统的特性。
两部分在倒频谱图上占有不同的倒频率范围,根据需要可以将信号与系统的影响分开,可以删除以保留源信号。
语音信号处理PPT_第三章_语音信号分析
3.2 数字化和预处理
➢ 语音信号的数字化一般包括放大及增益控制、反混叠滤波、
采样、A/D变换及编码(一般就是PCM码);如下图:
语音信号
带通滤 波器
自动增益控制 (AGC)
模/数转换 (A/D)
脉冲编码 调 制 ( PCM )
存入计算机
➢ 预处理一般包括预加重、加窗和分帧等。 ➢ 分析和处理之前必须把要分析的要分析的语音信号部分从输
② R n (是k )偶函数 ,即 Rn(k)Rn(k)
③ 当k=0时,自相关函数有最大值,即 Rn(0)Rn(k)
并且 等R于n (确0 ) 定性信号序列的能量或随机序列的平均功率。
短时相关分析
右图中:N=401, Fs=8kHz a、b是浊音信号,c位清 音信号,由图可以看出浊 音信号的自相关函数具有 一定得周期性,而清音信 号的自相关函数缺乏周期 性。
但是在一个短时间范围内(一般认为在10-30ms的短时间内), 其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳 态过程,即语音信号具有短时平稳性。
不论是分析怎么样的参数以及采用什么分析方法,在按帧进 行语音分析,提取语音参数之前,有一些经常使用的、共同的短 时分析技术必须预先进行,如语音信号的数字化、语音信号的端 点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号 析的关键技术。
语音信号分析在语音信号处理中具有举足轻重的地位。
分类:
参数性质
时域分析 频域分析 倒谱域分析
分析方法
模型分析方法 非模型分析方法
简单、计算量小、 物理意义明确
感知特性 较好,更 为重要
依据语音信号 产生的数学模 型来分析和提 取表征这些模 型的特征参数
不进行模型化 分析
语音信号数字处理-倒频谱和线谱对
图1
3
通常,不同元音间的激励信号差异很小,因此在类似语音识别这 样的应用中,研究者更关心的是声道的特性,因为从某种意义上 讲,声道的特性是不同语音之间特征的差异所在。
人们只能观察到实际的语音,即卷积的结果,要想从中求出声道 特性,即卷积运算的一个变元,是很困难的。从两个信号之间卷 积的结果中求出其中某一个信号的过程称为“解卷积”。 我们对线性系统熟悉。如果能把上面的卷积系统转换为线性系统, 那么只要估计出激励,通过线性性就可以容易地求出声道特征了。 那么是否可以把这种卷(积)性信号变成加性信号呢?答案是肯定 的。卷积同态信号处理方法可以解决这类问题。
1
Z Z log X Z X Z Z
1
1 Z Z X Z X Z X Z Z 1 Z Z X Z Z n x n 4.8
,可以证明,
ˆ (n) x ˆ (n) x c(n) 2
即:倒谱是复倒谱的偶分量,是偶对称的
14
可以证明,复倒谱和倒谱都有很强的衰减特性, 即随着|n|的增加,复倒谱和倒谱均按至少 1/|n|的速度衰减。(郑方、徐明星,《信号处理原理》清华大学出版社)
该结论说明,在信号的复倒谱和倒谱中,能量 大部分集中在低时部分(|n|的部分),因此用很 少几个有限点就可以近似代替原始信号的特征, 起到了很好的压缩作用。复倒谱和倒谱,尤其 是倒谱,其衰减特性在语音识别的参数提取中 发挥了很大的作的角度看(实)倒谱。 语音生成模型为全极点滤波器,极点在Z平面的 单位园内。语音信号用x(n)表示,其Z变换为X(Z)
语音信号的同态滤波及倒谱分析
*
[ ]
y1 ( n ) y 2 ( n )
* *
x(n)
X (z)
ln[ ]
ˆ X (z)
Z
1
ˆ x(n)
Z[
]
[
]
ˆ y (n)
ˆ Y (z)
exp[ ]
Y (z)
Z
1
* *
y (n)
Z[
]
[
]
12
3. 复倒谱和倒谱
13
3. 复倒谱和倒谱
复倒谱和倒谱P49
复倒谱:一个时间序列的Z变换的对数所对应的时间序列
) X 2 (e
j
)
( ) 1 ( ) 2 ( )
( ) 2 k
24
5. 复倒谱分析中的相位卷绕问题
递推法解决相位卷绕
d d ˆ X (z) [ln X ( z )] X (z) dz dz X ( z ) dz zX ( z ) d ˆ d ˆ X ( z ) z X ( z ) X ( z ) z X (z) dz dz dz d
z d dz X ( z ) nx ( n )
d
ˆ n x ( n ) x ( n ) nx ( n )
k
ˆ k x ( k ) x ( n k ) nx ( n ) k ˆ n x(k ) x(n k ) k 0
n
ˆ Y (z)
对数谱函数
峰值检测
共振峰 28
6. 同态滤波在语音信号处理中的应用
同态声码器
L1 ( n )
第3章 语音信号分析(全)
x1 (n) x2 (n)
D
L
D
ˆ y ( n)
1
ˆ ˆ x1 (n) x2 (n)
ˆ ˆ y1 (n) y2 (n)
x(n)
ˆ x ( n)
y1 (n) y2 (n)
y(n)
b)同态系统的组成
D1
D 是特征子系统 L
是线性子系统
振 幅
· ·· · · · · ·· · ·· ·· ·
x(n)= x(nT):取样值 时间 采样周期(T)
第3章 语音信号分析
量化: 幅值方向的离散化
量化信噪比
SNR(dB) 6.02 B 7.2
其中,B表示量化字长 B=7bit时,SNR=35dB,可以满足一般通信系统 的要求。
Fn (k )
N k 1 m 0
x ( m) x ( m k )
n n
(0 k K )
第3章 语音信号分析
极小值
图3-9 与图3-5有相同语音段的AMDF函数的例子
第3章 语音信号分析
短时平均幅度差函数的作用 求语音序列的基音周期 用于区分语音中的清音段和浊音段
0 m N 1 K
m 0 ~ ( N 1 K ) m 其他值
第3章 语音信号分析
图3-6 修正短时自相关函数计算中窗口长度的说明
第3章 语音信号分析
3.3.4 短时平均幅度差函数
平均幅度差函数( AMDF) Average Magnitude Difference Function 短时平均幅度差函数的定义
语音信号处理PPT_第三章_语音信号分析
① ②
③
应用: 区分清音和浊音; 从背景噪声中找出语音信号,判断寂静无声段和有声段的起点和 终点位置; 当语音以某些音位开始或结尾时(弱摩擦音、弱爆破音、鼻音 等),过零率和短时平均能量一起结合使用,更为有效。
短时过零率分析
实际问题: 如果输入信号中包含有50Hz的工频干扰或者A/D转换器的工作点有 偏移(等效于输入信号有直流偏移),计算的过零率参数很不精 确。 解决方法: ① A/D转换器前的防混叠带通滤波器低端截止频率应高于50Hz,有 效抑制电源干扰。 ② 采用低直流漂移器件,也可以算出每一帧的直流分量并加以滤除。
3.2 数字化和预处理
语音信号的数字化一般包括放大及增益控制、反混叠滤波、 采样、A/D变换及编码(一般就是PCM码);如下图:
语音信号 带通滤 波器 自动增益控制 (AGC) 存入计算机 模/数转换 (A/D) 脉冲编码 调 制 ( PCM )
预处理一般包括预加重、加窗和分帧等。 分析和处理之前必须把要分析的要分析的语音信号部分从输 入信号中找出来,叫做语音信号的端点检测。
有时窗口长度的选择,更重要的是要考虑语音信号的基音周期。 通常认为在一个语音帧内应包含1~7个基音周期。然而不同人的 基音周期变化很大,所以N的选择比较困难。通常在10kHz取样频率 下,N折中选择为100~200点为宜(即10~20ms持续时间)。
3.3 语音信号的时域分析
语音信号的时域分析就是分析和提取语音信号的时域参数。 应用范围:常用于最基本的参数分析及应用,如语音的分割、预 处理、大分类等。 特点: ①表示语音信号比较直观、物理意义明确。 ②实现起来比较简单、运算量少。 ③可以得到语音的一些重要的参数。 ④只使用示波器等通用设备,使用较为简单等。
(完整word版)语音信号进行倒谱分析
实验三 语音信号进行倒谱分析一、 实验目的、要求1. 理解倒谱分析的作用2. 掌握倒谱分析求基音周期的方法3. 了解LPC 倒谱分析方法二、实验原理1.倒谱分析原理同态信号处理也称为同态滤波,实现将卷积关系变换为求和关系的分离处理,即解卷。
如 进行如下3步处理对于语音信号进行解卷,可将语音信号的声门激励信息及声道响应信息分离开来,从而求得声道共振特征和基音周期,用于语音编码、合成和识别。
同态信号处理的基本原理(1)第一个子系统D*[](特征系统)完成将卷积信号转化为加性信号的运算。
)(ˆ1n x 和 )(ˆ2n x信号也均是时域序列,但它们所处的离散时域显然不同于x(n)所处的离散时域,故把它称之为复倒频谱域。
)(ˆn x是x(n)的复倒频谱,简称为复倒谱,有时也称为对数复倒谱。
复倒谱具体计算公式其中倒谱计算公式为:2 线性预测原理线性预测分析的基本思想由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值。
通过使实际语音抽样和线性预测抽样之间的误差在某个准则下达到最小值来决定唯一的一组预测系数,而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。
线性预测分析的基本原理每个采样值由前面的p 个采样值线性组合所构成。
记为x '(n),有:)(ˆ)(ˆ)(ˆ)](ˆ)(ˆ[)](ˆ[)3()(ˆ)(ˆ)(ˆ)(ln )(ln )(ln )2()()()()]([)1(212111212121n x n x n x z X z X Z z X Z z X z X z Xz X z X z X z X z X z X n x Z =+=+==+=+=⋅==--12()()()x n x n x n =*1ˆ()[ln (())]x n Z Z x n -=[()]()ˆ()ln ()ˆˆ()[()]jw jw jw jw DFT x n X e Xe X e xn IDFT X e ===要提高预测精度,就是要预测系数{k a }的取值使e(n)最小。
语音信号分析
汉宁窗的时域、频域的幅度响应特性
Magnitude (dB)
50
1
0 0.9
0.8
-50
0.7
-100
0.6
-150
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
汉明窗的时域、频域的幅度响应特性
预处理:窗口的长度
❖ 采样周期Ts=1/fs,窗口长度N和频率分辨率Δf之间存在下 列关系: Δf=1/NTs
❖ 可见,采样周期一定时,Δf随窗口宽度N的增加而减小,即 频率分辨率相应得到提高,但同时时间分辨率降低;如果窗 口取短,频率分辨率下降,而时间分辨率提高,因而二者是 矛盾的。应该根据不同的需要选择合适的窗口长度。
坦,保持在低频到高频的整个频带中,能用 同样的信噪比求频谱,以便于频谱分析或声 道参数分析
H z 1 z 1
预处理:分帧
❖ 进行过预加重数字滤波处理后,接下来就要进行加 窗分帧处理。一般每秒的帧数约为33-100帧,视实 际情况而定。
❖ 分帧虽然可以采用连续分段的方法,但一般要采用 如图3-2所示的交叠分段的方法,这是为了使帧与 帧之间平滑过渡,保持其连续性。
1.短时自相关函数
❖ 定义语音信号xn(m)的短时自相关函数Rn(k)的计算式如下:
N 1k
Rn (k) xn (m)xn (m k),0 k K m0
❖ 这里K是最大的延迟点数。
❖ 短时自相关函数具有以下性质:
(1)如果xn(m)是周期的(设周期为N),则自相关函数是同 周期的周期函数,即Rn(k)=Rn(k+Np)。
4第三章 语音信号分析---频域、倒谱、线性预测 语音信号处理 课件
冲激序列 发生器
基音周期TP
声门脉冲
Av
模型G(z)
清/浊音 开关
随机噪声
发生器
AN
线性系统
声道V(z)
辐射模型
R(z)
简化
u(n)
时变数字
x(n)
滤波器(h(n))
23
2.同态信号处理的基本原理 (1)特征系统D*[] 完成将卷积信号转化为加性信号的运算。
x(n )x1(n )x2(n ) 进行如下处理:
10
11
从短时频谱图中可知: (1)快速变化,由激励信号引起的; (2)慢速变化,声道滤波器的共振峰特性引 起的; (3)采用汉明窗得到的短时频谱较矩形窗平 滑,因而在语音分析中汉明窗用得较普遍。
12
4.频谱、功率谱的作用 (1). 可以得到基频、共振峰频率等物理量
短时频谱
短时功率谱
一帧浊音信号短时频谱和功率谱
§3.4 语音信号的频域分析
一、短时傅立叶变换求语音的短时谱 二、Biblioteka 音的短时谱的临界带特征矢量1
为了使 Xn(ejw) 能够与 X (e jw ) 具有相同的性质,
则要求
W是(e一jw个) 冲激函数。窗长N越长,
的主W瓣(e越jw狭) 窄尖锐,则
越逼Xn近(e j于w )
。
但窗长X (Ne j太w) 大,窗选信号不满足语音的短时平稳
特性,
不能正Xn确(e反jw映) 短时语音的频谱了。
为此,必须要合理选择窗长N。
4
3.短时功率谱和短时谱的关系
S n (e j) w X n (e j) w X n * (e j) w |X n (e j) w |2
4.短时功率谱和短时自相关函数的关系
第03讲 语音信号变换域(频域+倒谱)分析
际上是Xn e j
在频域的取样,如下所示
j2k
N 1
j 2 km
Xn e N X n k xn m e N , 0 k N 1
m0
在语音信号数字处理中,都是采用 xn m 的离散傅立叶
变换 Xn k 代替 Xn e
变换(FFT)算法完成由
j , 并且可以用高效的快速傅立叶 xn m 至 Xn k 的转换。当然,
W e j 必须是一个冲激函数。窗长越长W,e j 的主瓣越狭
窄尖锐,则Xn e j
越接近X e j
。 但窗长太大时
,窗选信号已经不满足语音的短时平稳特性,此X时n e j
已不能正确反映短时语音的频谱了。为此,必须要折中选
择窗长。
▪ 令角频率 2 k n 则得到离散的短时傅立叶变换,它实
150
200
250
300
讨论:窗口形状对短时谱的影响
下面给出采样率8kHz,窗长400点(50ms)情况下 ,分别用矩形窗与汉明窗选取同一段浊音信号, 求得其对数幅度谱。简单分析一下不同的窗函数 对语音信号短时谱的影响。
矩形窗加窗的浊音波形及其短时频谱 汉明窗加窗的浊音波形及其短时频谱
由上图可看出:
(第二讲)
1 语音信号的频域分析
2 语音信号的倒谱分析
§3.4 语音信号的频域分析
▪ 语音信号的频域分析就是分析语音信号的频域特征。 从广义上讲,语音信号的频域分析包括语音信号的频 谱、功率谱、倒频谱、频谱包络分析等。
▪ 常用的频域分析方法有带通滤波器组法、傅里叶变换 法、线性预测法等几种。
▪ 本节介绍的是语音信号的傅里叶分析法。
“短时谱”
▪ 短时分析将语音流分为一段一段来处理,每一段称为一“帧” ;
第4章 语音信号短时频域及倒谱分析
对 数 幅 度 /dB
对 数 幅 度 /dB
浊 音
0 -20 -40 -60 -80
0
1000
2000 3000 f/Hz 加 Hamming窗 时 语 音 谱
4000
0 -20 -40 -60 -80
清 音
0
1000
2000 3000 f/Hz 加 Hamming窗 时 语 音 谱
4000
对 数 幅 度 /dB
wn m xm
(-∞≤m≤+∞)
的傅里叶变换或离散傅里叶变换。 (2) 当 或k 固定时,它们是一个卷积,这相当于滤波 器的运算。因此,语音信号的短时频域分析可以解释为傅 里叶变换或滤波器。
5
第四章语音信号短时频域及倒谱分析
“十二五”普通高等教育本科国家级规划教材
4.1 傅里叶变换 的解释
第四章语音信号短时频域及倒谱分析
“十二五”普通高等教育本科国家级规划教材
第四章 语音信号短时频域及倒谱分析
1
第四章语音信号短时频域及倒谱分析
“十二五”普通高等教育本科国家级规划教材
目
1
1 2
录
傅里叶变换的解释 2 滤波器的解释 短时综合的滤波器组相加法 4 语音信号的复倒谱和倒谱分析及应用
3
5
2
“十二五”普通高等教育本科国家级规划教材
i
hi (n) wi (n)e jin
X n (e ji ) e jin
x(n m)h (m)
m
(4.22)
26
4.3 短时综合的滤波器组相加法
“十二五”普通高等教育本科国家级规划教材
式(4.25)的图形解释
x(n)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
eˆ(n) 非零 ,0,值 nn取 Np,其 2Np,他 3Np值 ,
❖ 由上式可以得出以下结论:一个周期冲激的有限长度序列, 其复倒谱也是一个同周期长度的周期冲激序列,只是其长度 变为无限长度、振幅随着K值的增加而衰减,衰减速度比原 来序列要快,显然,周期冲激序列的倒谱的这些性质对于语 音信号的分析是很有用的,这意味着除了原点之外,可以用 “高时窗”来从语音信号的倒谱中提取浊音激励信号的倒谱, 从而使倒谱法提取音调成为现实。
卷积同态信号处理系统
同态系统可以分解为两个特征系统(即特征系统和逆 特征系统)(指取决于信号的组合规则)和一个线 性系统(仅取决于处理要求)
卷积同态信号处理系统
卷积同态信号处理系统
❖ 由于加性信号的Z变换结果仍为加性信号,所以倒谱这种时 域信号,是可以用线性系统来处理的,经线性处理之后,如 欲在恢复出语音信号,则可以采用逆特征系统来实现,即特 征系统的逆运算。即将线性系统输出的加性倒谱信号:
2
c(n)称为倒频谱,简称为谱 倒Cepstrum。
复倒谱经过正逆两个特征系统变换后,序列可以还原为 本身。但是倒谱经过正逆两个特征系统变换后,序列不 可以还原为本身。
由序列的复倒谱求倒谱的方法
如果已知一x(n个 )的实 复序 倒 xˆ(n列 ), 谱那么可 xˆ(n)求 以出 由 它的倒 c(n)。 谱 首先xˆ(n将 )表示为一个偶 xˆe(n)对 和称 一序 个列 奇 xˆo(n)对 之称 和 的形式:
语音信号的倒谱分析
❖ 解卷算法可以分为两大类:
第一类是首先为线性系统V(Z)建立一个模型,然后对模型 参数按照某种最佳准则进行估计,这种方法称为参数解 卷方法。采用的模型可以分为全极点模型(AR模型)和 零极点模型(ARMA模型),如果采用最小均方误差准则 对AR模型进行估计,就得到线性预测编码算法(LPC)。
❖ 如果复倒谱是一个反因果序列:
xˆ(n)xˆ(n)u(n)
❖ 则可以推导出:
0 n0
xˆ(n)
பைடு நூலகம்
c(n)
n0
2c(n) n 0
❖ 只有当x(n)是一个因果最小相位序列是其复倒谱序
列才是一个因果稳定序列。这要求x(n)应满足两个
条件:1 x(n)=x(n)u(n);2 X(Z)=Z[x(n)]的零极点都
绝大多数数字信号 问处 题理 中X,(Z),Xˆ(Z),Y(Z),Yˆ(Z)的收敛域 都包含单位圆,Z变 正换 反都可以利用正 利负 叶福 变换来代替。
求得复倒谱的另一征 个系 特统
N2
X(expjw) F[x(n)] x(n)exp( jwn)
nN1
Xˆ(expjw) ln[X(expjw)]
xˆ(n) F1[Xˆ(expjw)] 1 Xˆ(expjw)exp(jwn)dw
2
语音信号的倒谱
求得倒谱的特征系统
N2
X (expjw) F[x(n)] x(n)exp( jwn)
nN1
C(expjw) ln[X (expjw) ]
c(n) F1[C(expjw)] 1
C(expjw)exp(jwn)dw
第二类算法称为非模型解卷。同态信号处理完成解卷任 务就是其中最重要的一种。
语音信号的倒谱分析
❖ 对信号进行分析得出它的倒谱参数的过程称为同态 处理。
❖ 对语音信号的某一帧同样可以分析出它的短时倒谱 参数,总的说来,无论对于语音通信、语音合成或 语音识别,倒谱参数所含的信息比其他参数多,也 就是语音质量好,识别正确率高。
卷积同态信号处理系统
特征系统与逆特征系统的组成
语音信号的倒谱
xˆ(n)是x(n)的复倒谱,其英C文 om为plexsCtreupm。 同样yˆ(n)是y(n)的复倒谱。复倒谱 的所 离处 散时域称为复 域倒 。谱 特征系统将离散时 的域 卷中 积运算转换为 谱复 域倒 中加运算, 而逆特征系统则为 运其 算逆 。
❖ 但其缺点是运算量比其他参数大,尽管如此,倒谱 分析方法仍不失为一种有效的语音信号的分析方法。
同态分析的基本原理
❖ 有很多客观物理现象中的信号,其中各组成分量的组 合,并不是按照加法组合原则组合起来的,如图像信 号、地震信号、调制信号、语音信号等,它们都不是 加性信号,而是乘积性或卷积性组合的信号。
已知倒谱求复倒谱的方法
要想由倒谱求复倒谱,首先复倒谱必须满足一 定的条件,比如是因果序列
x ˆ(n)x ˆ(n)u(n)
c(n则)xˆe(n)12[xˆ(n)xˆ(n)]1212xˆxˆx(ˆ(n(n)n))nnn000
因此
2c(n) n 0
xˆ(n)
c(n)
n0
0 n 0
已知倒谱求复倒谱的方法
应该在单位圆内。
语音信号倒谱和复倒谱的性质
❖ 根据语音信号产生的模型,在z域中语音信号S(Z)等于激励 信号E(Z)和声道传输函数V(Z)的乘积,即S(Z)=E(Z)V(Z)。 经过同态系统后可以得到:
sˆ(n)eˆ(n)vˆ(n)
❖ 先讨论声门激励信号。除了人们发清音时,声门激励是能量 较小、频谱均匀分布的白噪声之外;发浊音时,声门激励是 以基调周期为周期的周期脉冲序列
x ˆ(n)x ˆe(n)x ˆo(n)
❖ 由于偶对称序列的DTFT是实函数,奇对 称序列的DTFT是虚函数。
由序列的复倒谱求倒谱的方法
X ˆ(ejx ) w lp n X ([ejx ) w ]l pX n (ejx ) w j p A [X ( re g jx ) w ]p RX ( ee [jx ) w ]p jIm X (e [jx ) w ]p
因此
c(n)xe(n)1 2[x ˆ(n)x ˆ(n)]
相位倒谱的概念
假设 p(n)F 1 [A[rX ( gejxw )p ]]
则 称p(n)p 为(n 相)位x 倒ˆo(谱n)。1 2[x ˆ(n)x ˆ(n)]
不难看出 c(n, )表现的X是 (expjw)的模函数的特征 p(n)表现的X是 (expjw)的相位函数的特征, 而xˆ(n)则包含两个方面。 的特征
❖ 显然,这时不能用线性系统来处理,而必须用满足该 组合规则的非线性系统来处理。但是非线性系统地分 析非常困难。
❖ 同态信号处理法就是设法将非线性问题转化为线性问 题来处理的一种方法。按照被处理的信号来分类,大 体上可以分为乘积同态信号处理和卷积同态信号处理。
❖ 由于语音信号可以视为声门激励信号和声道响应信号 的卷积结果。我们仅讨论卷积同态信号处理系统的问 题。