多媒体技术Ch03 数字声音编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2.1 脉冲编码调制(PCM) -线性预测编码(LPC) 和自适应脉冲编码调制 (APCM)
3.2.2 增量调制(DM)与自适 应增量调制(ADM)
3 of 66
3.1.1 声音简介
▪ 什么是声音?
• 声音是听觉器官对声波的感知,而声波是通过空气 或其他媒体传播的连续振动
• 在20度的空气中,声波的传播速度是343.2m/s
概念上最简单、理论上最完善、最早研制成功、使用 最为广泛、数据量最大的编码系统
25 of 66
3.2.1 脉冲编码调制
▪ PCM实际上是模拟信号数字化。
• 采样:每隔一段时间读声音的幅度 • 量化:把采样得到的声音幅度转换成数字值
▪ 量化可分为均匀量化和非均匀量化两类。
26 of 66
3.2.1 脉冲编码调制
保护带
每一个信号的频率平移到一个特定的频率范围内
33 of 66
3.2.1 PCM在通信中的应用
▪ 时分多路复用
• 在一条通信线路上使用不同时段“同时”传送多个 独立信号的通信方法
• 核心思想:将时间分成等间隔的时段,为每对用户 指定一个时间间隔,每个间隔传输信号的一部分
34 of 66
3.2.1 PCM在通信中的应用
S(k) 缓冲器
量化器
信道
逆量 化器
Sr(k)
量化阶 适配器
边信道
(a)前向自适应APCM
40 of 66
3.2.1 自适应脉冲编码调制
• 后向自适应(backward adaptation)
• 从量化器刚输出的过去样本中提取量化阶信息。 • 不需要传送边信息。
S(k) 量化器
信道
逆量 化器
Sr(k)
12 of 66
3.1.1 声音简介
声音的产生、传播、处理、感知示例
13 of 66
3.1.1 声音简介
声音用电压信号表示时,声音信号在时间和幅度上都是 连续的模拟信号
14 of 66
3.1.2 声音信号数字化
声音的采样和量化
模拟
声音
信号
采样
量化
编码
数字
声音
01100011001···
15 of 66
(signal-to-noise ratio,SNR),
ቤተ መጻሕፍቲ ባይዱ
信号电压
SNR 10 log10
(Vsignal )2 (Vnoise )2
20
log10
Vsignal
Vnoise
单位为分贝 (dB)
20
log10
Vsignal Vsignal (1 /
2n
)
6.02n
量化噪声电压 (模拟信号的采样值 和与它最接近的数字 数值间的差值)
• 只用1位对话音信号编码,称为“1位系统”
43 of 66
3.2.2 增量调制与自适应增量调 制
▪ 自适应增量调制(Adaptive Delta Modulation, ADM)
• 根据输入信号斜率的变化自动调整量化阶Δ的大小, 以减少斜率过载和粒状噪声。
• 检测到斜率过载时增大量化阶Δ,斜率减小时降低量 化阶Δ
0 dB 10 dB 20 dB 60 dB 70 dB 80 dB 90 dB 120 dB 140 dB 160 dB
7 of 66
3.1.1 声音简介
• 音调的高低体现在声音的频率上。
440Hz 880Hz • 一个纯音可以用正弦波来表示,只有一个对应的频
率;更复杂的声音可以由一系列纯音组成。
3.1.2 声音信号数字化
▪ 采样(sampling):连续时间的离散化
• 均匀采样:每隔相等的一段时间采样一次
▪ 量化(quantization):连续幅度的离散化
• 线性(均匀)量化:幅值划分等间隔 • 非线性(非均匀)量化:幅值划分间隔不等
16 of 66
3.1.2 声音信号数字化
fs 2 fmax
29 of 66
3.2.1 脉冲编码调制
➢ 两种非均匀量化方法:μ律压扩算法和A律压扩算法
30 of 66
3.2.1 脉冲编码调制
Original analog signal and its corresponding PCM signals.
Decoded staircase signal.
Reconstructed signal after lowpass filtering
31
ITU标准
▪ 国际电信联盟(International Telecommunication
Union, ITU)标准
ITU
ITU-R
ITU-T
ITU-D
SG1
SG2 … SG16-Multimedia
调制解调器和接口: V.34 V.25ter
系统: H.320-ISDN H.323-LAN H.324-PSTN T.120-DATA
量化阶 适配器
(b)后向自适应APCM
量化阶 适配器
41 of 66
数字话音信号 (a)
(b) 数字话音信号 幅值直方图
(c) 信号幅度差值直方图
Li, Drew, & Liu
42
3.2.2 增量调制与自适应增量调 制
▪ 增量调制(△调制,Delta Modulation, DM)
• 预测编码技术:对实际信号与预测信号之差的极性进行编码。 如果极性为“正”,用“1”表示;反之用“0”表示,或相反
24路PCM的帧结构
• 24路制:
• 每秒钟传送8000帧,每帧 125μs
• 12帧组成1复帧(用于同步)。 • 每帧由24个时间片(信道)和1
位同步位组成 • 每个信道每次传送8位代码,1
帧有24 × 8 +1=193位(位) • 数据传输率R=8000×193=
1544 kb/s • 每一个话路的数据传输率=
▪ 声音的频率
• 声音(audio): 20~ 20 000Hz • 高保真声音(high-fidelity audio): 10 ~ 20 000 Hz • 话音(speech): 300~3000/3400 Hz • 亚音/次音(subsonic): < 20 Hz • 超声(ultrasonic): > 20 000 Hz
8000×8=64 kb/s
35 of 66
3.2.1 PCM在通信中的应用
▪ 30路制:
• 每秒钟传送8000帧,每帧125 s • 16帧组成1复帧(用于同步) • 每帧由32个时间片(信道)组成 • 每个信道每次传送8位代码 • 数据传输率:R=8000×32×8=2048 kb/s • 每一个话路的数据传输率=8000×8=64 kb/s
17 of 66
3.1.2 声音信号数字化
▪ 采样精度或量化阶(quantization step size)
• 可用每个声音样本的位数(即bps)表示,大小影响到 声音的质量
• 度量声音波形幅度的精确程度,度量模拟信号的最 小单位
18 of 66
3.1.2 声音信号数字化
• 采样精度也可用信号噪声比表示,简称为信噪比
第3章 数字声音编码
1
目录
3.1 简介
3.1.1 声音简介
33..标11..32准声声音音信质号量数的字MO化S评分33..(编22D..34P码话C差M调音分)制与编脉(自码A冲D适器编PC应码M差)调分制脉冲
3.2 声音的编码
-子带编码(SBC)
3.2.1 脉冲编码调制(PCM) -线性预测编码(LPC) 和自适应脉冲编码调制 (APCM)
• 根据输入信号幅度大小来改变量化阶大小的一种波 形编码技术
• 自适应
• 瞬时自适应:量化阶大小每隔几个样本就改变 • 音节自适应:量化阶大小在较长时间里发生变化
39 of 66
3.2.1 自适应脉冲编码调制
• 前向自适应(forward adaptation)
• 根据未量化的样本值来确定量化阶的大小,并对其进行编 码作为边信息(side information)传送到接收端
3.2.2 增量调制(DM)与自适 应增量调制(ADM)
2 of 66
目录
3.1 简介
3.1.1 声音简介
33..标11..32准声声音音信质号量数的字MO化S评分33..(编22D..34P码话C差M调音分)制与编脉(自码A冲D适器编PC应码M差)调分制脉冲
3.2 声音的编码
-子带编码(SBC)
4 of 66
3.1.1 声音简介
5 of 66
3.1.1 声音简介
• 声波具有普通波所具有的特性,例如反射 (reflection)、折射 (refraction)和衍射(diffraction)等
6 of 66
3.1.1 声音简介
• 声音的强弱体现在声波压力的大小上,可用 decibels(dB)来衡量。
编码: G.7xx-Audio H.261-Video H.263-Video H.264-Video(MPEG-4 AVC)
VCEG开发的标准
32 of 58
3.2.1 PCM在通信中的应用
▪ 频分多路复用
• 在一条通信线路上使用不同频段同时传送多个独立 信号的通信方法
• 模拟载波通信的主要方法
• 对声音主观质量度量比较通用的标准是5分制
声音质量MOS评分标准
分数
质量等级
失真级别
5
优(Excellent)
无察觉
4
良(Good)
(刚)察觉但不讨厌
3
中(Fair)
(察觉)有点讨厌
2
差(Poor)
讨厌但不反感
1
劣(Bad)
极讨厌(令人反感)
23 of 66
目录
3.1 简介
3.1.1 声音简介
33..标11..32准声声音音信质号量数的字MO化S评分33..(编22D..34P码话C差M调音分)制与编脉(自码A冲D适器编PC应码M差)调分制脉冲
8 of 66
声波示例
1
1
0.5
0.5
0.005 0.01 0.015 0.02
-0.5
-0.5
-1
-1
1
0.5
0.005 0.01 0.015 0.02 -0.5
-1
0.005 0.01 0.015 0.02
9 of 66
声波示例
10 of 66
3.1.1 声音简介
11 of 66
3.1.1 声音简介
19 of 66
3.1.2 声音信号数字化
• 声音质量和数据率—— 质量度量
质量
采样频率 样本精度 单道声/立 (未压缩的)数
(kHz)
(bit/s)
体声
据率(kb/s)
频率范围 (Hz)
电话*
8
8
单道声
64.0
200~3400
AM
11.025
8
单道声
88.2
100~6600
FM
22.050
16
立体声
压力的峰值
Threshold of hearing Rustle of leaves Very quiet room Conversation Busy street Loud radio Train through station Threshold of discomfort Threshold of pain Damage to ear drum
20 of 66
3.1.2 声音信号数字化
21 of 66
3.1.3 声音质量的衡量方法
▪ 声音质量的衡量方法
• 客观质量度量
• 声音带宽、信噪比(SNR)、采样精度
• 主观质量度量
• 主观平均分(MOS)
22 of 66
3.1.3 声音质量的MOS评分标准
• 主观平均分(mean opinion score,MOS)
均匀量化?非均匀量化?
27
3.2.1 脉冲编码调制
均匀量化
➢ 采用相等的量化间隔对采样得到的信号作量化。 ➢ 量化误差(量化噪声):量化后的样本值Y和原始值X
的差e=y-x。
28 of 66
3.2.1 脉冲编码调制
▪ 非均匀量化
• 大的输入信号采用大的量化间隔,小的输入信号采 用小的量化间隔
• 可在满足精度要求的情况下用较少的位数来表示
36 of 66
3.2.1 PCM在通信中的应用
数字通信线路的数据传输率
二次复用示意图
37 of 66
3.2.1 PCM在通信中的应用
• T1/E1,T2/E2,T3/E3,T4/E4和T5/E5的数据传输率
38 of 66
3.2.1 自适应脉冲编码调制
▪ 自适应脉冲编码调制(Adaptive Pulse Code Modulation, APCM)
3.2 声音的编码
-子带编码(SBC)
3.2.1 脉冲编码调制(PCM) -线性预测编码(LPC) 和自适应脉冲编码调制 (APCM)
3.2.2 增量调制(DM)与自适 应增量调制(ADM)
24 of 66
3.2.1 脉冲编码调制(PCM)
▪ 脉冲编码调制(Pulse Code Modulation,PCM)
705.6
20~11000
CD
44.1
16
立体声
1411.2
5~20000
DAT
48
16
立体声
1536.0 20~20000
*AM: amplitude modulation FM: frequency modulation
CD: compact disc audio DAT: digital audio tape