数字语音处理(精华版)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

36·语音编码设计指标:1)编码速率 2)质量:主观 MOS 与客观 SNR.3)延时 4)复杂度 37.语音信号常用方法:分段信噪比。 38.均 匀 量 化 PCM 的 信 噪 比 : SNR(dB)=6.02--7.2B。 信噪比与信号方差无关, 它仅取决于量 化间隔。 39.自适应量化 PCM 自适应方案分为前馈自适应和反馈自 适应。 调整幅度分为量化间隔可变和量化台 阶可变。 自适应量化是指量化器特征自适应于 输入信号幅度变化。 40.自适应预测编码:如果对残差序列 e(n)做量化和编码,在同样信号量化噪 声比条件下, 所需的量化比特数就可以 减少, 从而达到压缩编码的目的, 给予 这一原理方法称为预测编码, 当预测系 数是适应的随语音信号变化时, 又称自 适应预测编码 41.斜率过载:在译码器中,所恢复的 阶梯波的上升或下降有可能跟不上信 号的变化, 因而产生滞后, 这就造成失 真。称为斜率过载 2)如何克服斜率过载失真,只要增加 量化电平。 42.颗粒噪声:在译码器中所得到的将 是峰--峰值等于 2 的等幅脉冲序列,这 便形成一种噪声,称为颗粒噪声。 43.短时傅里叶变换:
14·过零率:单位时间内过零的次数。 浊音:过零率低能量高,清音:过零率 高能量高。 15· 端点检测目的: 从包含语音的一段 信号中确定出语音的起点及结束点。
16·自相关函数: 时域离散确定信号:
H ( z ) G ( z )V (z) R ( z )
8·模型局限性及解决办法: 声道的传输函数具有全极点的性质, 这 对于元音和大多数辅音来说是比较符 合实际的, 但对于鼻音和阻塞音来说由 于出现了零点, 这种模型就不够准确了, 一种解决办法是在 V(z) 中引入若干个 零点但这样将使模型复杂化, 另一种是 适当提高阶数 P,使得全极点模型能更 好的逼近具有此种零点的传输函数。 9· 预加重含义: 加入一阶高通滤波器。 10· 预加重处理目的: 目的是为了对语 音的高频部分进行加重, 去除口唇辐射 的影响, 增加语音的高频分辨率 11· 预 加重处理技术:一般通过传递函数为:
通数字滤波器来实现预加重。 12·短时平均能量主要用途: 1)可以作为区分浊音和清音的特征参 数 2)在信噪比较高的情况下短时能量 还可以作为区分有声和无声的依据 3) 可以作为辅助的特征参数用于语音识 别中。 13 常用的窗有两种:一种是矩形窗, 窗 函 数 如 下 :
2)清音的短时自相关函数没有周期性, 也不具有明显突出的峰值, 其性质类似 于噪声。3)不同的窗对短时自相关函 数结果有一定影响。 18·短时自相关函数(求峰值)两个峰 值之间的距离为周期。 短时平均幅度差 函数 (求谷值) 两个谷值之间的距离为 周期。 19· 采用双限门比较的两极判决法: 第 一级判决 :1) 先根据语音短时能量的轮 廓选取一个较高的门限 T1 进行一次粗 判: 语音起止点位于该门限与短时能量 包络交点所对应的时间间隔之外。
音信号进行中心削波处理, 在进行自相 关计算。
自相关函数性质:1)对称性: R(K)=R(-K) 2)在 K=0 处为最大值, 即 对 于 所 有 K 来 说
判别基音周期的方法:1·短时自相关 函数法。2·短时平均幅度差函数。 22· 线性预测编码就是利用过去的样值 对新样值进行预测, 然后将样值的实际 值与预测值相减,得到一个误差信号, 显然误差信号的动态范围远小于原始 语音信号的动态范围, 对误差信号的进 行量化编码, 可大大减少量化所需的比 特数,使编码速率降低。
ais (n i )
i 1
p
27·最佳矢量量化器:在给定条件下, 失真最小的矢量量化器, 称为这个条件 下的最佳矢量量化器。 (2)设计最佳矢量量化器的两个必要 条件:1)在给定码书的条件下,寻找
缺点:语音质量差,自然度较低。 3)混合编码: 在保留参数编码技术上, 引用波形编码准则去优化激励源信号, 克服原有波形和参数编码的弱点, 汲取 所长。 34· 语音信号存在大量冗余: 样点值之 间相关性。 35·信源:PCM 信道:奇偶性 有效性 可靠性
Xn(e )
jw
m
x(m)w(n m) e
里 叶 变

jwn





x(e )
jw
m
x ( m) e
2

jwn
f ( m)
44 自定义预测如何提高信噪比,量化 噪比定义:
SNR
E[q (n)]
2
E[ s (n)]
=Gp·SNRq
线性预测分析条件:
i ai Gu (n) e(n)
系统表达式: Gu(n)*h(n)=s(n) 3)线性预测误差 e(n) e(n)=s(n)-s^(n)
p i E ( n ) s ( z ) s( z ) a iz i 1 p A( z ) E ( z ) 1 a i iz s( z ) i 1
P 阶线性预测器传递函数
P (z ) a i z
i 1
p
i
信源空间的最佳划分, 使平均失真最小。 2)在给定划分的条件下,寻找最佳码 书,使平均失真最小。
2)Z 域:
Gu(n) s (n) ais (n i )
i 1
F
28·LBG 算法:设置矢量量化器的主任 务:设计码书 Yn,对于给定码字数目 N 的情况下, 由两个必要条件可推导出一 个矢量量化器的设计算法。 1) 算法一: 已知信源分布特性设计算法, 2)算法二: 已知训练序列的设计算法。 29·初始码书的选取方法:1)随机法: 从训练序列中随机选取 N 个矢量作为 初 始 码 字 , 构 成 初 始 码 书 Yn={Y1,Y2...Yn]. 2)分裂法:计算所训练序列 Ts 形心,将之作为第一个码字 Y1. 30· 降低复杂度的矢量量化系统是树形 搜索。 31.设计树形结构方法:1) 1)从树叶开始设计:根据码字距离最 近配对,并找出码字对中心, (Y000.Y001)--Y00...........(Y00.Y01)---Y0..... .........且树叶数 N=8, 2)从树根开始设计:利用分裂法得 Y0 与 Y1,逐次求得 Y00..........Y11. 32.在存储量上, 二叉树多于全搜索, 2) 树形搜索矢量量化器的特点: 以适当提 高空间复杂度来降低时间复杂度。 33.语音编码分类:1)波形编码:重建 后波形与原始波形保持一致。特点: 语 音质量好,适应能力强,算法简单,易 于实现,抗噪声性能强,缺点:所需的 编码速率高,一般在 16~64kbit/s。 2)参数编码:以语音信号产生数字模 型为基础, 对数字语音进行分析, 提出 一组特征参数, 这些参数携带有语音信 号主要信息编码, 它们只需较少的比特 数, 在解码后可由这些参数, 重新合成 语音信号。 特点: 可实现低速率语音编 码,其编码速率可低至 2.4bit/s 以下。
的 傅里 叶 变 (n - m)x(m) 换或离散傅里叶变换。当
R(k )
m
x( M ) x(m k )

或 K 固定
时, 它们就是一个卷积, 相当于滤波器 的运算。 21·基音周期估值的两种方法:第一种 方法: 先对语音信号进行低通滤波, 在
时域离散随机信号:
N 1 先对语 R(k ) ) x(m) x(m k进行自相关计算。第二种方法, 2 N 1 m N
另一种是汉明窗,窗函数:

0.54 0.46cos[2n /( N 1)] 0 n N 0, 其他
门限 T2 相交的两个点 C 和 D, 于是 CD 段就是双门限方法根据短时能量所判 定的语音段。第二级判决: 以短时平均过零率为标准, 从 C 点往左 和 D 点往右搜索,找到短时平均过零 率低于某个门限 T3 的两点 E 和 F,这 便是语音段的起止点。门限 T3 是由背 景噪声的平均过零率所确定的。 20 · 当 n 固 定 时 , 它 们 就 是 序 列
1, 0 n N 1 ( n) 其他 0,
可简化为:
z
n

1 2
m n ( N 1)
| sgn[x(m)] sgn[x(m 1)] |
n
2)根据背景噪声的平均能量确定一个 较低的门限 T2 ,并从 A 点往左、从 B 点往右搜索, 分别找到短时能量包络与
1·语音信号处理的三大分支:语音合 成(说) ,语音编码(压缩) ,语音识别 (听) ,语音增强。2·语音是怎样生成 的: 空气由肺部排入喉部, 经过声带进 入声道, 最后由嘴辐射出声波, 这就形 成了语音。 3·浊音:发音时声带振动的音称为浊 音,它能量高,过零率低。 为周期性斜三角脉冲。清音: 声带不振 动, 能量低过零率高非周期脉冲, 可用 随机白噪声激励。 4·掩蔽效应:一个声音的听感觉感受 受同时存在的另一个声音的影响的现 象。 掩蔽效应的应用: 它指人耳只对最明显 的声音反应敏感, 对于不敏感的反应较 不敏感,应用此原理人们发明了 MP3 等压缩的数字音乐格式, 只突出记录人 耳较为敏感的中频段声音, 大大压缩了 存储空间。 5·听觉机理: ( 1)外耳:机械振动, (2)中耳:限幅放大, (3)内耳:耳 蜗。 6·语音信号数字模型:1)激励模型、 2)声道模型、3)辐射模型。 7·语音生成系统的传递函数:
线性预测方程:
R(k) - a iR ( k i ) 0
i 1
p
23·模型增益 G,增益常数 G^2=Ep. 24· 量化分为标量量化和矢量量化。 标 量量化: 把抽样后的信号值逐个进行量 化。 矢量量化: 先把信号序列的每 K 个连续 样点分成一组, 形成 k 维欧氏空间中的 一个矢量,然后对此矢量进行量化。 25· 矢量量化能降低信码率, 传输的是 角标。 码书:最小失真值所对应的量化矢量 Yi,把所有 N 个量化矢量构成集合{Yi},. 码字:码书中的矢量称为码字。 26· 失真测度: 是以什么方法来反映用 码字 Yi 代替信源矢量 X 时所付出的代 价, 统计平均值:D=E[d(x,Q(x))]
| R ( K ) | R (0)
3) 对于确定信
号,R(0)对应于能量对Hale Waihona Puke Baidu随机信号 R (0)对应于平均功率。 17· 浊音和清音的短时自相关函数有以 下特点 :1) 短时自相关函数可以很明显
H(z) 1 z
1
的 一 阶 FIR 高
的反映出浊音信号的周期性
1) s ^ ( n )
相关文档
最新文档