语音信号处理作业
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课堂作业1:
1、语音信号的特点是什么?画出数字模型
语音信号的最基本组成单位是音素。音素可以分为“浊音”和“清音”两大类,语音信号的频谱分量主要集中在300~3400HZ的范围内,其采样率为8kHZ,某些语音系统将此频率扩展到7~9KHZ,其采样率也提高到15~20kHZ。语音信号具有短时性。
2、简述语音信号的特点,基频、共振峰是什么含义?
语音一般由清音和浊音组成,浊音的声带振动基本频率,又称基音频率。声道可以看成是一根具有非均匀截面的声管,在发音时起共鸣的作用,。当元音激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。共振峰为频谱中明显的几个凸起点,它的出现频率与声道的谐振频率相对应。
3、简述短时分析方法,怎样用AMDF判基音?
由于语音信号的准平稳特性,任何语信号数字处理算法和技术都建立在“短时”基础上。语音信号中一组基本短时参数有:短时能量E,短时平均幅度M和短时过零率Z。短时自相关函数和短时频谱(或短时功率谱)是语音信号非常重要的一对短时参数,分别在时域和频域中表征了语音信号的一些主要特征。短时基音周期是语音信号重要的参数之一。用短时自关函数进行基音周期估计是寻找它的最大峰值点的位置,而用短时AMDF进行基音周期估计是寻找它的最深谷值点的位置。
4、短时傅立叶分析的含义?采样时如何考虑?
语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅立叶变换不能用来直接表示语音信号,而应该用短时傅立叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱”。
课堂作业二:
1、画出同态滤波中特征系统框图,写出倒谱定义式
卷积同态系统的框图
复倒谱^
()n x 是x(n)的Z 变换取对数后的逆Z 变换,其表达式如下: ^1[ln [()]]Z Z x n x -= (7)
* X ’(n) Y’(n) + + * + + X(n) D *[ ] L[ ] D -1*[ ] y(n)
倒谱c(n)定义为x(n)取Z 变换后的幅度对数的逆Z 变换,即
1()[ln |()|]c n z X z -= (8)
2、 相位卷绕是什么?怎样避免?
相位伸展或相位解卷绕的前提条件是相邻采样点相位差的绝对值小于pi ,即要求
lARG[H(k)]一ARG[H(k —1)]I 3、写出声道冲激响应序列的复倒谱特点。说明如何在语音信号的复倒谱中分离出声道冲激响应,得到声道冲激响应有何用途? 在时域上,语音产生模型实际上是一个激励信号与声道冲激响应的卷积。对于浊音,激励信号可以由周期脉冲序列表示;对于清音,激励信号可以由随机噪声序列表示。声道系统相当于参数缓慢变化的零极点线性滤波器。这样经过同态处理后,语音信号的复倒谱,激励信号的复倒谱,声道系统的复倒谱之间满足下面的关系: ^^^ ()()()s n e n v n =+ (9) 由于倒谱对应于复倒谱的偶部,因此倒谱与复倒谱具有同样的特点,很容易知道语音信号的倒谱,激励信号的倒谱以及声道系统的倒谱之间满足下面关系: ()()()s e v n n n c c c =+ (10) 浊音信号的倒谱中存在着峰值,它的出现位置等于该语音段的基音周期,而清音的倒谱中则不存在峰值。利用这个特点我们可以进行清浊音的判断,并且可以估计浊音的基音周期。 课堂练习3: 1、简述LPC 方程的建立过程, LPC 系数与语音模型有什么关系? LP 分析为线性时不变因果稳定系统V (z )建立一个全极点模型,并利用均方误差准则,对已知的语音信号s(n)进行模型参数估计。 如果利用P 个取样值来进行预测,则称为P 阶线性预测。假设用过去P 个取样值()()(){} 1,2,S n S n S n p ---K 的加权之和来预测信号当前取样值()S n ,则预测信号()S n ∧为: ()() 1p k k S n a n k ∧==-∑ (1) 其中加权系数用 k a 表示,称为预测系数,则预测误差为: ()()()()() 1p k k e n s n S n s n a n k ∧==-=--∑ (2) 要使预测最佳,则要使短时平均预测误差最小有: ()2min E e n ε⎡⎤==⎣⎦ (3) ()20,(1)k e n k p a ⎡⎤∂⎣⎦ =≤≤∂ (4) 令 ()()(),,i k E s n i S n k φ=--⎡⎤⎣⎦ (5) 最小的ε可表示成: ()() min 10,00,p k k a k εφφ==-∑ (6) 显然,误差越接近于零,线性预测的准确度在均方误差最小的意义上为最佳,由此可以计算出预测系数。 通过LPC 分析,由若干帧语音可以得到若干组LPC 参数,每组参数形成一个描绘该帧语音特征的矢量,即LPC 特征矢量。由LPC 特征矢量可以进一步得到很多种派生特征矢量,例如线性预测倒谱系数、线谱对特征、部分相关系数、对数面积比等等。不同的特征矢量具有不同的特点,它们在语音编码和识别领域有着不同的应用价值。 2、Levison-Durbin 算法的作用是什么? 以2阶预测器为例,写出算法的各步 3、LSP 参数是什么?与H(z)有无关系? LSP (Line-Spectrum Pair )系数,即线谱对参数,是与线性预测系数完全等价的另一种有效表示方式,由于LSP 参数具有比线性预测系数更好的内插特性和量化特性.把线性预测系数转换为LsP 参数后可以在量化时使用更少的比特获得同样的精度。 1、LSP 参数是LPC 系数的频域表示,是LPC 分析一种 2、LSP 用p 个离散频率ωi θi 表示|H(ej ω)|2 3、一对LSP 参数表示一个谐振点,因此一对参数的误差只影响该对点附近的语音特性;可根据听觉特性分配量化比特数 4、应用在低编码速率 极零模型 全极模型不能表示时 解法: 同态预测法 极零-> ->全极->LPC