多媒体技术基础(林福宗)-03数字声音编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(SB-ADPCM)
3.9 线性预测编码(LPC)的概念 3.10 GSM声音简介 3.11 话音编码标准摘要
3.11.1 编码算法的性能 3.11.2 话音编码标准
3章 数字声音编码
2
3.1 声音简介
声音是什么
➢ 声音是听觉器官对声波的感知,而声波是通过空气 或其他媒体传播的连续振动
➢ 声音的强弱体现在声波压力的大小上,音调的高低 体现在声音的频率上
CD: compact disc audio DAT: digital audio tape
3章 数字声音编码
20~20000 20~20000
9
3.3 声音质量的MOS评分标准
声音质量的衡量方法
➢ 声音带宽法
等级由高到低依次是DAT、CD、FM、AM和数 字电话
➢ 主观质量度量
度量方法类似于电视节目中的歌手比赛,由评委 对每个歌手的表现进行评分,然后求出平均值
精度是在模拟信号数字化过程中度量模拟信号的 最小单位,因此也称量化阶(quantization step size)
0~1 V的电压用256个数表示时,量化阶等于 1/256 V
➢ 样本位数的大小影响到声音的质量,位数越多,声 音质量越高,所需存储空间也越多;位数越少,声 音质量就越低,所需存储空间也越少
3章 数字声音编码
7
3.2 声音信号数字化(续3)
➢ 采样精度的另一种表示方法是信号噪声比, 简称为信噪比(signal-to-noise ratio,SNR), 并用下式计算
SN R10log10 ((V V sn ig on isa el))2 2 20log10 V V sn ig on isa el
3.7.1 自适应脉冲编码调制(APCM) 的概念
3.7.2 差分脉冲编码调制(DPCM)的 概念
3.7.3 自适应差分脉冲编码调制 (ADPCM)
3.7.4 G.726 ADPCM编译码器
3.8 G.722 SB-ADPCM编译码器
3.8.1 子带编码(SBC) 3.8.2 子带-自适应差分脉冲编码调制
(bit/s)
体声 数据率(kb/s) (Hz)
8
8
单道声
64.0
200~3 400
AM 11.025
8
单道声
88.2
20~15000
FM 22.050
16
立体声
705.6
50~7000
CD
44.1
16
立体声
1411.2
DAT
48
16
立体声
1536.0
*AM: amplitude modulation FM: frequency modulation
➢ 高保真声音(high-fidelity audio): 10 ~ 20 000 Hz
➢ 声音(audio): 20~ 20 000Hz ➢ 话音(speech): 300~3000/3400 Hz ➢ 亚音/次音(subsonic): < 20 Hz ➢ 超声(ultrasonic): > 20 000 Hz
模拟
声音
信号
采样
量化
编码
数字
声音
图3-2 声音的采样和量化 3章 数字声音编码
01100011001···
5Fra Baidu bibliotek
3.2 声音信号数字化(续1)
采样频率
➢ 采样频率由根据奈奎斯特理论(Nyquist theory)确定 奈奎斯特理论指出,采样频率不应低于声音信号 最高频率的两倍,这样就能把以数字表达的声音 还原成原来的声音,这叫做无损数字化(lossless digitization)
3章 数字声音编码
4
3.2 声音信号数字化
数字化的概念
➢ 采样和量化
连续时间的离散化通过采样来实现,就是每隔相等的一 段时间采样一次,这种采样称为均匀采样(uniform sampling)
连续幅度的离散化通过量化(quantization)来实现,就是 把信号的强度划分成一小段一小段,如果幅度的划分是 等间隔的,就称为线性量化,否则就称为非线性量化。 图3-2表示了声音数字化的概念
5
优(Excellent)
3.4.1 PCM的概念 3.4.2 均匀量化 3.4.3 非均匀量化
3.5 PCM在通信中的应用
3.5.1 频分多路复用 3.5.2 时分多路复用 3.5.3 数字通信线路的数据传输率
3.6 增量调制与自适应增量调制
3.6.1 增量调制(DM) 3.6.2 自适应增量调制(ADM)
3.7 自适应差分脉冲编码调制
其中,Vsignal表示信号电压,Vnoise表示量化噪 声电压(模拟信号的采样值和与它最接近的数 字数值之间的差值),SNR的单位为分贝(db)
3章 数字声音编码
8
3.2 声音信号数字化(续4)
声音质量和数据率—— 质量度量
质量 电话*
采样频率 样本精度 单道声/立 (未压缩的) 频率范围
(kHz)
➢ 假设被采样信号的最高频率为fmax,则采样定律可用 公式表示为
fs 2fmax
3章 数字声音编码
6
3.2 声音信号数字化(续2)
采样精度
➢ 度量声音波形幅度的精确程度,用每个声音样本的 位数(即bps)表示
例如每个声音样本用16位表示,测得的声音样本 值是在[0~65535]范围里的数,它的精度是 1/65536
➢ 有时同时采取两种方法评估,有时以主观质 量度量为主
3章 数字声音编码
10
3.3 声音质量的MOS评分标准(续)
主观平均分(mean opinion score,MOS)
➢ 对声音主观质量度量比较通用的标准是5分制, 各档次的评分标准见表3-2
表3-2 声音质量MOS评分标准
分数
质量等级
失真级别
➢ 声音用电压信号表示时,声音信号在时间和幅度上 都是连续的模拟信号,如图3-1所示
➢ 声波具有普通波所具有的特性,例如反射 (reflection)、折射 (refraction)和衍射(diffraction)等
图3-1 声音是一种连续的波
3章 数字声音编码
3
3.1 声音简介(续1)
声音的频率
第3章 数字声音编码
第3章 数字声音编码目录
3.1 声音简介
3.1.1 声音是什么 3.1.2 声音的频率范围
3.2 声音信号数字化
3.2.1 从模拟过渡到数字 3.2.2 模拟信号与数字信号 3.2.3 声音信号数字化 3.2.4 声音质量与数据率
3.3声音质量的MOS评分标准 3.4 脉冲编码调制(PCM)
3.9 线性预测编码(LPC)的概念 3.10 GSM声音简介 3.11 话音编码标准摘要
3.11.1 编码算法的性能 3.11.2 话音编码标准
3章 数字声音编码
2
3.1 声音简介
声音是什么
➢ 声音是听觉器官对声波的感知,而声波是通过空气 或其他媒体传播的连续振动
➢ 声音的强弱体现在声波压力的大小上,音调的高低 体现在声音的频率上
CD: compact disc audio DAT: digital audio tape
3章 数字声音编码
20~20000 20~20000
9
3.3 声音质量的MOS评分标准
声音质量的衡量方法
➢ 声音带宽法
等级由高到低依次是DAT、CD、FM、AM和数 字电话
➢ 主观质量度量
度量方法类似于电视节目中的歌手比赛,由评委 对每个歌手的表现进行评分,然后求出平均值
精度是在模拟信号数字化过程中度量模拟信号的 最小单位,因此也称量化阶(quantization step size)
0~1 V的电压用256个数表示时,量化阶等于 1/256 V
➢ 样本位数的大小影响到声音的质量,位数越多,声 音质量越高,所需存储空间也越多;位数越少,声 音质量就越低,所需存储空间也越少
3章 数字声音编码
7
3.2 声音信号数字化(续3)
➢ 采样精度的另一种表示方法是信号噪声比, 简称为信噪比(signal-to-noise ratio,SNR), 并用下式计算
SN R10log10 ((V V sn ig on isa el))2 2 20log10 V V sn ig on isa el
3.7.1 自适应脉冲编码调制(APCM) 的概念
3.7.2 差分脉冲编码调制(DPCM)的 概念
3.7.3 自适应差分脉冲编码调制 (ADPCM)
3.7.4 G.726 ADPCM编译码器
3.8 G.722 SB-ADPCM编译码器
3.8.1 子带编码(SBC) 3.8.2 子带-自适应差分脉冲编码调制
(bit/s)
体声 数据率(kb/s) (Hz)
8
8
单道声
64.0
200~3 400
AM 11.025
8
单道声
88.2
20~15000
FM 22.050
16
立体声
705.6
50~7000
CD
44.1
16
立体声
1411.2
DAT
48
16
立体声
1536.0
*AM: amplitude modulation FM: frequency modulation
➢ 高保真声音(high-fidelity audio): 10 ~ 20 000 Hz
➢ 声音(audio): 20~ 20 000Hz ➢ 话音(speech): 300~3000/3400 Hz ➢ 亚音/次音(subsonic): < 20 Hz ➢ 超声(ultrasonic): > 20 000 Hz
模拟
声音
信号
采样
量化
编码
数字
声音
图3-2 声音的采样和量化 3章 数字声音编码
01100011001···
5Fra Baidu bibliotek
3.2 声音信号数字化(续1)
采样频率
➢ 采样频率由根据奈奎斯特理论(Nyquist theory)确定 奈奎斯特理论指出,采样频率不应低于声音信号 最高频率的两倍,这样就能把以数字表达的声音 还原成原来的声音,这叫做无损数字化(lossless digitization)
3章 数字声音编码
4
3.2 声音信号数字化
数字化的概念
➢ 采样和量化
连续时间的离散化通过采样来实现,就是每隔相等的一 段时间采样一次,这种采样称为均匀采样(uniform sampling)
连续幅度的离散化通过量化(quantization)来实现,就是 把信号的强度划分成一小段一小段,如果幅度的划分是 等间隔的,就称为线性量化,否则就称为非线性量化。 图3-2表示了声音数字化的概念
5
优(Excellent)
3.4.1 PCM的概念 3.4.2 均匀量化 3.4.3 非均匀量化
3.5 PCM在通信中的应用
3.5.1 频分多路复用 3.5.2 时分多路复用 3.5.3 数字通信线路的数据传输率
3.6 增量调制与自适应增量调制
3.6.1 增量调制(DM) 3.6.2 自适应增量调制(ADM)
3.7 自适应差分脉冲编码调制
其中,Vsignal表示信号电压,Vnoise表示量化噪 声电压(模拟信号的采样值和与它最接近的数 字数值之间的差值),SNR的单位为分贝(db)
3章 数字声音编码
8
3.2 声音信号数字化(续4)
声音质量和数据率—— 质量度量
质量 电话*
采样频率 样本精度 单道声/立 (未压缩的) 频率范围
(kHz)
➢ 假设被采样信号的最高频率为fmax,则采样定律可用 公式表示为
fs 2fmax
3章 数字声音编码
6
3.2 声音信号数字化(续2)
采样精度
➢ 度量声音波形幅度的精确程度,用每个声音样本的 位数(即bps)表示
例如每个声音样本用16位表示,测得的声音样本 值是在[0~65535]范围里的数,它的精度是 1/65536
➢ 有时同时采取两种方法评估,有时以主观质 量度量为主
3章 数字声音编码
10
3.3 声音质量的MOS评分标准(续)
主观平均分(mean opinion score,MOS)
➢ 对声音主观质量度量比较通用的标准是5分制, 各档次的评分标准见表3-2
表3-2 声音质量MOS评分标准
分数
质量等级
失真级别
➢ 声音用电压信号表示时,声音信号在时间和幅度上 都是连续的模拟信号,如图3-1所示
➢ 声波具有普通波所具有的特性,例如反射 (reflection)、折射 (refraction)和衍射(diffraction)等
图3-1 声音是一种连续的波
3章 数字声音编码
3
3.1 声音简介(续1)
声音的频率
第3章 数字声音编码
第3章 数字声音编码目录
3.1 声音简介
3.1.1 声音是什么 3.1.2 声音的频率范围
3.2 声音信号数字化
3.2.1 从模拟过渡到数字 3.2.2 模拟信号与数字信号 3.2.3 声音信号数字化 3.2.4 声音质量与数据率
3.3声音质量的MOS评分标准 3.4 脉冲编码调制(PCM)