多媒体技术及应用数字音频技术培训课件(ppt 60张)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
振幅
t
重要 振幅:音量的大小 指标 周期:重复出现的时间间隔 频率:指信号每秒钟变化的次数
2-3
多媒体 音频技术
2.1 数字音频基础
次声波
20Hz
声音按频率分类:
可听声波
20kHz
超声波
f(Hz)
语音信号频率范围:300Hz-3kHz 声音质量的频率范围:
CD-DA
频带
10 20 50 200
FM广播 AM广播 电话 3.4k 7k 15k 20k
2-15
多媒体 音频技术
2.2 数字音频压缩标准
标准 说明 G.711 采样8kHz,量化8bit,码率64kbps
二、音频压缩技术标准
分类
电话语 G.721 采用ADPCM编码,码率32kbps 音质量 G.723 采用ADPCM有损压缩,码率24kbps G.728 采用LD-CELP压缩技术,码率16kbps 调幅广 采样16kHz,量化14bit,码率 G.722 播质量 224(64)kbps 高保真 采样44.1kHz,量化16bit,码率 MPEG 立体声 705kbps (MPEG三个压缩层次,384音频 64kbps)
多媒体 音频技术
第二章 数字音频技术
多媒体 音频技术
第二章 数字音频技术
2.1 数字音频基础 2.2 数字音频压缩标准 2.3 声卡与电声设备 2.4 MIDI与音乐合成 2.5 音频编辑软件 2.6 语音识别技术 本章小结
多媒体 音频技术
2.1 数字音频基础
一、声音的基本概念 声音是通过一定介质传播的连续的波。 声波 A 周期
2.1 数字音频基础
二、声音的数字化 1.声音信号的类型 模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程
模拟信号
采样
量化
A/D ADC
编码
数字信号
模拟信号
D/A DAC
数字信号
2-6
多媒体 音频技术
2.1 数字音频基础
连续的模拟声音信号 声音信号的采样
3.声音数字化过程
示意
离散的音频信号
f(Hz)
2-4
多媒体源自文库音频技术
2.1 数字音频基础
声音的传播携带了信息,它是人类传播信 息的一种主要媒体。 声音的三种类型: 波形声音:包含了所有声音形式 语音:不仅是波形声音,而且还有丰富的 语言内涵(抽象→提取特征→意义理解) 音乐:与语音相比,形式更规范。 音乐是符号化的声音。
2-5
多媒体 音频技术
2-9
44.1
多媒体 音频技术
2.1 数字音频基础
三、音频的文件格式 1.WAV文件 WAV是Microsoft/IBM共同开发的PC 波形文件。因未经压缩,文件数据量很大。 特点:声音层次丰富,还原音质好 2.MP3文件 MP3(MPEG Audio layer3)是一种按 MPEG标准的音频压缩技术制作的音频文件。 特点:高压缩比(11:1),优美音质
2-16
多媒体 音频技术
2.2 数字音频压缩标准
三、音频压缩工具 音频文件转换:Audio Converter、另存 为 MP3压缩工具:MP3Resizer
2-17
多媒体 音频技术
2.3 声卡与音箱
一、声卡(声音卡、音频卡) 1.声卡的主要功能 声卡是负责录音、播音和声音合成的一种 多媒体板卡。其功能包括:
2-10
多媒体 音频技术
2.1 数字音频基础
3.RA文件 RA(RealAudio,即时播音系统)新型流 式音频,RA、RM、RMX。 特点:在低速的广域网上实时传输音频 4. WMA文件 WMA(Windows Media Audio)是 Windows Media格式中的一个子集(音频 格式)。 特点:压缩到MP3一半
① ② ③ ④ ⑤ ⑥
录制、编辑和回放数字音频文件 控制和混合各声源的音量 记录和回放时进行压缩和解压缩 语音合成技术(朗读文本) 语音识别技术 具有MIDI接口(乐器数字接口)
2-18
多媒体 音频技术
2.3 声卡与音箱
声波
2.声卡的组成原理
A/D 数据处理 D/A
喇叭
话筒输入 线性输入
2-8
多媒体 音频技术
2.1 数字音频基础
5.声音数字化的数据量 音频数据量=采样频率×量化位数 ×声道数/8(字节/秒)
采样频率 (kHz) 11.025 22.05 量化位数 (bit) 8 16 8 16 8 16
数据量(KB/s)
单声道 10.77 21.53 21.53 43.07 43.07 86.13 立体声 21.53 43.07 43.07 86.13 86.13 172.27
2-11
多媒体 音频技术
2.1 数字音频基础
5. MIDI和RMI文件 MIDI(乐器数字接口)是由一组音乐、乐 谱或乐器符号的数字集合。 特点:播放效果与硬件相关,数据量很小, 音质不高、音色单调等 6.VOC文件 创新公司开发的声音文件格式,由文件头 块和音频数据块组成。
2-12
多媒体 音频技术
2.1 数字音频基础
四、音频的采集与处理 1.声音的采集 录音软件 专业录音棚 唱盘活录音带转录 数字音频库
2.声音的处理 剪接、降噪、均衡、效果、动态处理、格 式转换。
2-13
多媒体 音频技术
2.2 数字音频压缩标准
编码器 传输/存储 解码器
输出音频信号
一、音频压缩方法概述
输入音频信号
压缩编码技术是指用某种方法使 数字化信息的编码率降低的技术
音频信号能压缩的基本依据: ① 声音信号中存在大量的冗余度; ② 人的听觉具有强音抑制弱音的现象; ③ 低频段敏感、高频段不敏感。
2-14
多媒体 音频技术
2.2 数字音频压缩标准
音频信号压缩编码的分类: ①无损压缩(熵编码) 霍夫曼编码、算术编码、行程编码 ②有损压缩 波形编码--PCM、DPCM、ADPCM 子带编码、矢量量化 参数编码--LPC 混合编码--MPLPC、CELP
2-7
多媒体 音频技术
2.1 数字音频基础
采样频率 量化位数 声道数
4.声音数字化三要素
每秒钟抽取声 每个采样点用 使用声音通道的 波幅度样本的 多少二进制位 个数 次数 表示数据范围 采样频率越高 量化位数越多 立体声比单声道 声音质量越好 音质越好 的表现力丰富, 数据量也越大 数据量也越大 但数据量翻倍 11.025kHz 22.05 kHz 44.1 kHz 8位=256 16位=65536 单声道 立体声
t
重要 振幅:音量的大小 指标 周期:重复出现的时间间隔 频率:指信号每秒钟变化的次数
2-3
多媒体 音频技术
2.1 数字音频基础
次声波
20Hz
声音按频率分类:
可听声波
20kHz
超声波
f(Hz)
语音信号频率范围:300Hz-3kHz 声音质量的频率范围:
CD-DA
频带
10 20 50 200
FM广播 AM广播 电话 3.4k 7k 15k 20k
2-15
多媒体 音频技术
2.2 数字音频压缩标准
标准 说明 G.711 采样8kHz,量化8bit,码率64kbps
二、音频压缩技术标准
分类
电话语 G.721 采用ADPCM编码,码率32kbps 音质量 G.723 采用ADPCM有损压缩,码率24kbps G.728 采用LD-CELP压缩技术,码率16kbps 调幅广 采样16kHz,量化14bit,码率 G.722 播质量 224(64)kbps 高保真 采样44.1kHz,量化16bit,码率 MPEG 立体声 705kbps (MPEG三个压缩层次,384音频 64kbps)
多媒体 音频技术
第二章 数字音频技术
多媒体 音频技术
第二章 数字音频技术
2.1 数字音频基础 2.2 数字音频压缩标准 2.3 声卡与电声设备 2.4 MIDI与音乐合成 2.5 音频编辑软件 2.6 语音识别技术 本章小结
多媒体 音频技术
2.1 数字音频基础
一、声音的基本概念 声音是通过一定介质传播的连续的波。 声波 A 周期
2.1 数字音频基础
二、声音的数字化 1.声音信号的类型 模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程
模拟信号
采样
量化
A/D ADC
编码
数字信号
模拟信号
D/A DAC
数字信号
2-6
多媒体 音频技术
2.1 数字音频基础
连续的模拟声音信号 声音信号的采样
3.声音数字化过程
示意
离散的音频信号
f(Hz)
2-4
多媒体源自文库音频技术
2.1 数字音频基础
声音的传播携带了信息,它是人类传播信 息的一种主要媒体。 声音的三种类型: 波形声音:包含了所有声音形式 语音:不仅是波形声音,而且还有丰富的 语言内涵(抽象→提取特征→意义理解) 音乐:与语音相比,形式更规范。 音乐是符号化的声音。
2-5
多媒体 音频技术
2-9
44.1
多媒体 音频技术
2.1 数字音频基础
三、音频的文件格式 1.WAV文件 WAV是Microsoft/IBM共同开发的PC 波形文件。因未经压缩,文件数据量很大。 特点:声音层次丰富,还原音质好 2.MP3文件 MP3(MPEG Audio layer3)是一种按 MPEG标准的音频压缩技术制作的音频文件。 特点:高压缩比(11:1),优美音质
2-16
多媒体 音频技术
2.2 数字音频压缩标准
三、音频压缩工具 音频文件转换:Audio Converter、另存 为 MP3压缩工具:MP3Resizer
2-17
多媒体 音频技术
2.3 声卡与音箱
一、声卡(声音卡、音频卡) 1.声卡的主要功能 声卡是负责录音、播音和声音合成的一种 多媒体板卡。其功能包括:
2-10
多媒体 音频技术
2.1 数字音频基础
3.RA文件 RA(RealAudio,即时播音系统)新型流 式音频,RA、RM、RMX。 特点:在低速的广域网上实时传输音频 4. WMA文件 WMA(Windows Media Audio)是 Windows Media格式中的一个子集(音频 格式)。 特点:压缩到MP3一半
① ② ③ ④ ⑤ ⑥
录制、编辑和回放数字音频文件 控制和混合各声源的音量 记录和回放时进行压缩和解压缩 语音合成技术(朗读文本) 语音识别技术 具有MIDI接口(乐器数字接口)
2-18
多媒体 音频技术
2.3 声卡与音箱
声波
2.声卡的组成原理
A/D 数据处理 D/A
喇叭
话筒输入 线性输入
2-8
多媒体 音频技术
2.1 数字音频基础
5.声音数字化的数据量 音频数据量=采样频率×量化位数 ×声道数/8(字节/秒)
采样频率 (kHz) 11.025 22.05 量化位数 (bit) 8 16 8 16 8 16
数据量(KB/s)
单声道 10.77 21.53 21.53 43.07 43.07 86.13 立体声 21.53 43.07 43.07 86.13 86.13 172.27
2-11
多媒体 音频技术
2.1 数字音频基础
5. MIDI和RMI文件 MIDI(乐器数字接口)是由一组音乐、乐 谱或乐器符号的数字集合。 特点:播放效果与硬件相关,数据量很小, 音质不高、音色单调等 6.VOC文件 创新公司开发的声音文件格式,由文件头 块和音频数据块组成。
2-12
多媒体 音频技术
2.1 数字音频基础
四、音频的采集与处理 1.声音的采集 录音软件 专业录音棚 唱盘活录音带转录 数字音频库
2.声音的处理 剪接、降噪、均衡、效果、动态处理、格 式转换。
2-13
多媒体 音频技术
2.2 数字音频压缩标准
编码器 传输/存储 解码器
输出音频信号
一、音频压缩方法概述
输入音频信号
压缩编码技术是指用某种方法使 数字化信息的编码率降低的技术
音频信号能压缩的基本依据: ① 声音信号中存在大量的冗余度; ② 人的听觉具有强音抑制弱音的现象; ③ 低频段敏感、高频段不敏感。
2-14
多媒体 音频技术
2.2 数字音频压缩标准
音频信号压缩编码的分类: ①无损压缩(熵编码) 霍夫曼编码、算术编码、行程编码 ②有损压缩 波形编码--PCM、DPCM、ADPCM 子带编码、矢量量化 参数编码--LPC 混合编码--MPLPC、CELP
2-7
多媒体 音频技术
2.1 数字音频基础
采样频率 量化位数 声道数
4.声音数字化三要素
每秒钟抽取声 每个采样点用 使用声音通道的 波幅度样本的 多少二进制位 个数 次数 表示数据范围 采样频率越高 量化位数越多 立体声比单声道 声音质量越好 音质越好 的表现力丰富, 数据量也越大 数据量也越大 但数据量翻倍 11.025kHz 22.05 kHz 44.1 kHz 8位=256 16位=65536 单声道 立体声