多媒体技术基础(林福宗)-03数字声音编码

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(SB-ADPCM)
3.9 线性预测编码(LPC)的概念 3.10 GSM声音简介 3.11 话音编码标准摘要
3.11.1 编码算法的性能 3.11.2 话音编码标准
3章 数字声音编码
2
3.1 声音简介
声音是什么
➢ 声音是听觉器官对声波的感知,而声波是通过空气 或其他媒体传播的连续振动
➢ 声音的强弱体现在声波压力的大小上,音调的高低 体现在声音的频率上
CD: compact disc audio DAT: digital audio tape
3章 数字声音编码
20~20000 20~20000
9
3.3 声音质量的MOS评分标准
声音质量的衡量方法
➢ 声音带宽法
等级由高到低依次是DAT、CD、FM、AM和数 字电话
➢ 主观质量度量
度量方法类似于电视节目中的歌手比赛,由评委 对每个歌手的表现进行评分,然后求出平均值
精度是在模拟信号数字化过程中度量模拟信号的 最小单位,因此也称量化阶(quantization step size)
0~1 V的电压用256个数表示时,量化阶等于 1/256 V
➢ 样本位数的大小影响到声音的质量,位数越多,声 音质量越高,所需存储空间也越多;位数越少,声 音质量就越低,所需存储空间也越少
3章 数字声音编码
7
3.2 声音信号数字化(续3)
➢ 采样精度的另一种表示方法是信号噪声比, 简称为信噪比(signal-to-noise ratio,SNR), 并用下式计算
SN R10log10 ((V V sn ig on isa el))2 2 20log10 V V sn ig on isa el
3.7.1 自适应脉冲编码调制(APCM) 的概念
3.7.2 差分脉冲编码调制(DPCM)的 概念
3.7.3 自适应差分脉冲编码调制 (ADPCM)
3.7.4 G.726 ADPCM编译码器
3.8 G.722 SB-ADPCM编译码器
3.8.1 子带编码(SBC) 3.8.2 子带-自适应差分脉冲编码调制
(bit/s)
体声 数据率(kb/s) (Hz)
8
8
单道声
64.0
200~3 400
AM 11.025
8
单道声
88.2
20~15000
FM 22.050
16
立体声
705.6
50~7000
CD
44.1
16
立体声
1411.2
DAT
48
16
立体声
1536.0
*AM: amplitude modulation FM: frequency modulation
➢ 高保真声音(high-fidelity audio): 10 ~ 20 000 Hz
➢ 声音(audio): 20~ 20 000Hz ➢ 话音(speech): 300~3000/3400 Hz ➢ 亚音/次音(subsonic): < 20 Hz ➢ 超声(ultrasonic): > 20 000 Hz
模拟
声音
信号
采样
量化
编码
数字
声音
图3-2 声音的采样和量化 3章 数字声音编码
01100011001···
5Fra Baidu bibliotek
3.2 声音信号数字化(续1)
采样频率
➢ 采样频率由根据奈奎斯特理论(Nyquist theory)确定 奈奎斯特理论指出,采样频率不应低于声音信号 最高频率的两倍,这样就能把以数字表达的声音 还原成原来的声音,这叫做无损数字化(lossless digitization)
3章 数字声音编码
4
3.2 声音信号数字化
数字化的概念
➢ 采样和量化
连续时间的离散化通过采样来实现,就是每隔相等的一 段时间采样一次,这种采样称为均匀采样(uniform sampling)
连续幅度的离散化通过量化(quantization)来实现,就是 把信号的强度划分成一小段一小段,如果幅度的划分是 等间隔的,就称为线性量化,否则就称为非线性量化。 图3-2表示了声音数字化的概念
5
优(Excellent)
3.4.1 PCM的概念 3.4.2 均匀量化 3.4.3 非均匀量化
3.5 PCM在通信中的应用
3.5.1 频分多路复用 3.5.2 时分多路复用 3.5.3 数字通信线路的数据传输率
3.6 增量调制与自适应增量调制
3.6.1 增量调制(DM) 3.6.2 自适应增量调制(ADM)
3.7 自适应差分脉冲编码调制
其中,Vsignal表示信号电压,Vnoise表示量化噪 声电压(模拟信号的采样值和与它最接近的数 字数值之间的差值),SNR的单位为分贝(db)
3章 数字声音编码
8
3.2 声音信号数字化(续4)
声音质量和数据率—— 质量度量
质量 电话*
采样频率 样本精度 单道声/立 (未压缩的) 频率范围
(kHz)
➢ 假设被采样信号的最高频率为fmax,则采样定律可用 公式表示为
fs 2fmax
3章 数字声音编码
6
3.2 声音信号数字化(续2)
采样精度
➢ 度量声音波形幅度的精确程度,用每个声音样本的 位数(即bps)表示
例如每个声音样本用16位表示,测得的声音样本 值是在[0~65535]范围里的数,它的精度是 1/65536
➢ 有时同时采取两种方法评估,有时以主观质 量度量为主
3章 数字声音编码
10
3.3 声音质量的MOS评分标准(续)
主观平均分(mean opinion score,MOS)
➢ 对声音主观质量度量比较通用的标准是5分制, 各档次的评分标准见表3-2
表3-2 声音质量MOS评分标准
分数
质量等级
失真级别
➢ 声音用电压信号表示时,声音信号在时间和幅度上 都是连续的模拟信号,如图3-1所示
➢ 声波具有普通波所具有的特性,例如反射 (reflection)、折射 (refraction)和衍射(diffraction)等
图3-1 声音是一种连续的波
3章 数字声音编码
3
3.1 声音简介(续1)
声音的频率
第3章 数字声音编码
第3章 数字声音编码目录
3.1 声音简介
3.1.1 声音是什么 3.1.2 声音的频率范围
3.2 声音信号数字化
3.2.1 从模拟过渡到数字 3.2.2 模拟信号与数字信号 3.2.3 声音信号数字化 3.2.4 声音质量与数据率
3.3声音质量的MOS评分标准 3.4 脉冲编码调制(PCM)
相关文档
最新文档