音频处理技术
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图4-11 录音机操作面板 2006年08月22日 第四章 音频处理技术 24
4.4.2 抓取CD、VCD和DVD音轨
获取数字音频的另一个快捷途径就是从不同的多媒体 产品中直接抓取音轨信息,转换并压缩成自己所需的音频 格式。一般的音频工具软件都具有直接抓取音乐CD的能力, 而另一些软件则可以从更多媒体格式中抓取音轨。 特别提示:在使用抓取音轨来采集数字音频时,应该 遵守有关法律规定,取得相应的使用权,避免以后的知识
2006年08月22日 第四章 音频处理技术 28
5.2 MIDI设备配置与连接
两台MIDI设备之间可以通过接口发送信息而进行相互 通信。
一台MIDI设备可以有1~3个端口:
MIDI In 接口——接收来自其它MIDI设备上的MIDI信息;
MIDI Out接口——用来输出本设备生成的MIDI信息;
声音按频率可分为三类:
A O 图4-1 声波的振幅与频率 t
低于20 Hz的声音称为次声
频率范围在20 Hz~20 kHz范围的可听声称为音频 频率高于20 kHz的称为超音频(或超声)
第四章 音频处理技术 3
2006年08月22日
1
1.2
音频基础知识
音频的相关概念 音频(Audio)是指频率在20Hz~20kHz范围内 的可听声音,是多媒体信息中的一种媒体类型—— 听觉类媒体。 目前多媒体计算机中的音频主要有波形音频、 CD音频和MIDI音乐3种形式。
7
8 9
RealAudio文件
Windows Media Audio文件 MIDI文件
.RA/.RM/.RAM
.WMA/.ASF/.ASX/.WAX .MID/.RMI/.CMI/.CMF
2006年08月22日
第四章 音频处理技术
7
2 音频的数字化与编码
计算机处理音频信号之前,必须将模拟的声 音信号数字化,产生数字音频。具体过程包括: 采样、量化、编码 。
4.2.4 音频采样的数据量
数字音频的采样数据量主要取决于两方面因素: 音质因素,由采样频率、量化位数和声道数3个参数 决定。 时间因素,采样时间越长,数据量越大。
2006年08月22日
第四章 音频处理技术
14
单位时间的数据量可用下式表示:
v=
fc· b· s
8
式中,v为单位时间的数据量(KB/s);fc为采样频率 (kHz);b为量化位数(bit);s为声道数。 具体计算时,需要将单位时间的数据量v与采样时间t相 乘,并注意采样频率的单位换算。 下表给出了在不同条件下一分钟数字化音频所产生的 数据量。
4.5.1 什么是MIDI
MIDI是Musical Instrument Digital Interface的缩写, 译为乐器数字化接口。它规定了电子乐器和多媒体计算机之 间进行联接的硬件及数据通信协议,是多媒体计算机所支持 的又一种声音产生方法---MIDI方法。
MIDI格式的数字化文件可以看作是乐谱的数字化描述, 它记录的是乐器的种类,音阶的高低、长短、强弱,速度等 因素,这些被称为MIDI消息,存储为MIDI文件。当需要播放 时,从相应的MIDI文件中读出MIDI消息,通过音乐合成器产 生相应的声音波形,经过放大后,再由扬声器输出。因为 MIDI文件保存的是一系列由MIDI消息组成的“乐谱”。因此 MIDI的播放音质是与设备有关的。
2006年08月22日
第四章 音频处理技术
5
1.2
Leabharlann Baidu
音频的相关概念
2、CD音频 CD-音频(CD-Audio)是存储在音乐CD光盘中的数字音 频,可以通过CD-ROM驱动器读取并采集到多媒体计算机系 统中,并以波形音频的相应形式存储和处理。
3、MIDI音乐
也称MIDI音频。它将音乐符号化并保存在MIDI文件中, 并通过音乐合成器产生相应的声音波形来还原播放。 音频是时间的函数,具有很强的前后相关性,所以实 时性是音频处理的基本要求。
产权纠纷。
2006年08月22日
第四章 音频处理技术
25
4.3 编辑数字音频
音频编辑一般包括音频内容剪切、合成以及音质和效果
的编辑等方面。
① 多音轨(Multiple Tracks) ② 切边(Trimming) ③ 拼接和组合(Splicing and Assembly ④ 音量调节(Volume Adjustments) ⑤ 格式转换(Format Conversion)
2006年08月22日 第四章 音频处理技术 17
混合编码介于波形编码和参数编码之间,集中了这两种 方法的优点,可在较低的码率上得到较高的音质 。
2006年08月22日
第四章 音频处理技术
18
3 音频卡
多媒体计算机系统中都有音频信号处理功能,但实现方 法各不相同。美国苹果公司的Macintosh计算机一开始就被 设计成具有音频处理能力的多媒体计算机,而使用Windows 平台的PC系列机,起初没有声音处理能力 ,而是通过扩充 一个专门的音频处理部件——音频卡来实现其声音处理的。
4.2.1 采样与采样频率
采样是每间隔一段时间读取一次声音信号幅 度,使声音信号在时间上被离散化。
2006年08月22日
第四章 音频处理技术
8
2.1
采样与采样频率
数字化音频的过程如下图所示。
(a) 模拟音频信号
(b) 音频信号的采样
(c) 采样信号的量化
2006年08月22日 第四章 音频处理技术 9
图4-9 音量控制台 2006年08月22日 第四章 音频处理技术 23
3、开始录音 可以使用Windows系统中的“录音机”工具或专门的音 频处理软件来录音。Windows系统中提供的录音机程序只能 录制60秒的音频数据。如果要录制更长时间的数字音频,可 使用专门音频处理软件,这些工具软件,不仅能够录制任意 时长的音频文件,还可以提供更为灵活多样的编码格式。
4.3.1 音频卡的功能
① 录制和播放数字声音文件
② 控制音量和混音效果
③ 声音文件的压缩与解压缩 ④ MIDI接口与音乐合成
2006年08月22日 第四章 音频处理技术 19
3.2 音频卡的组成与工作原理
话筒Mic
放大器
混合信号 处理器
放大器
音频输出
线路输入Line in CD输入
DSP
音乐合成器
图4-8 设置录音参数
根据具体情况和用途确定适当的采样参数。
在Wind2K系统中,提供了录音参数的选择设置功能,其 中的音质选择分为CD音质、电话质量、收音质量和Default Quality等4种,如图4-8所示 。
2006年08月22日 第四章 音频处理技术 22
2、检测输入音频的强度
主要是为了防止录音过程中出现失真。在Win2K环境下, 可通过“音量控制”对话框来检测、调节进入计算机的音 源强度。
多媒体应用项目增色。但是,过多地音效处理(尤其是重
复同一效果)会适得其反。所以,千万不要偏面追求音效。 还有,一旦一种声音特效被处理并混合到音轨中之后,就 再也无法对它进行复原编辑了,因此务必保存最初的文件, 这样如果出现问题还可以重新编辑。
2006年08月22日 第四章 音频处理技术 27
4.5 MIDI音乐
图4-6 音频卡的外围接口连接示意
更追求功能的简单和较好的音效,所以简化了原来声卡上 的MIDI和游戏杆功能,使之成为专门的声音处理部件。
2006年08月22日 第四章 音频处理技术 21
4.4 数字音频的采集与编辑
4.4.1 录音采集
1、选择采样参数
采集音频之前,首 先要有合适的环境和音 源,还需要聘请专业创 作人员、音响工程师, 租用录音设备等。还要
2006年08月22日
第四章 音频处理技术
4
1.2 音频的相关概念
1、波形音频:
是由外部声音源通过数字化过程采集到多媒体计 算机中的所有声音形式。语音是波形声音中人的说 话声音,具有内在的语言学、语音学的内涵。多媒 体计算机可以利用特殊的方法分析、研究、抽取语 音的相关特征,实现对不同语音的分辩、识别以及 通过文字合成语音波形等。
⑥ 重采样或降低采样率(Resampling or Down sampling)
2006年08月22日 第四章 音频处理技术
26
⑦ 渐出和渐隐(Fade-ins and Fade-outs) ⑧ 均衡(Equalization) ⑨ 时间拉伸(Time Stretching) ⑩ 数字信号处理(Digital Signal Processing-DSP) 利用各种声音特效来处理原始录音数据能够极大地为
MIDI Thru接口——将从MIDI In端口传来的信息发送到 另一台相联的MIDI设备上。
2006年08月22日
第四章 音频处理技术
29
在进行MIDI通信时,用户可以通过标准的MIDI电缆来 相互连接各端口。MIDI电缆是一根屏蔽的双绞线和两端带 有插入式的5针D型插头组成,如图4-13所示。
2006年08月22日 第四章 音频处理技术 6
1.3 数字音频的文件格式
序号 1 2 3 4 5 6
音频文件名称 Wave文件 AIFF文件 Audio文件 Sound文件 Voice文件 Mpeg音频文件
后缀名 .WAV .AIF/.AIFF .AU .SND .VOC .MP1/.MP2/.MP3
音频处理技术
本章要点: •1 音频基础知识 •2 音频的数字化与编码
•3 音频卡
•4 数字音频的采集与编辑
•5 MIDI音乐
•6 音频工具软件
2006年08月22日 第四章 音频处理技术
2
1
音频基础知识
1.1 声音的物理特征
声音信号通常用一种连续的波形来表示。波形的最大位移 称为振幅A,反映音量。波形中两个连续波峰(或波谷)之间 的距离称为周期T。周期的倒数1/T即为频率f,以赫兹(Hz) T 为单位。频率反映了声音的音调。
采样位数 16 bit 采样频率 22 KHz
2006年08月22日
第四章 音频处理技术
13
2.3 声道
反映音频数字化质量的另一个因素是声道个数。记录声 音时,如果每次生成一个声波的数据,称为单声道;每次生 成二个声波数据,称为双声道(立体声);每次生成二个以 上声波数据,称为多声道(环绕立体声)。
2006年08月22日
第四章 音频处理技术
11
2.2
量化与量化位数
01001010
+127 … +64 +32 0 -32 -64 … -128
采样位数 8 bit 采样频率 11 KHz
2006年08月22日
第四章 音频处理技术
12
2.2 量化与量化位数
0010101100011000
+32767 … +512 +128 0 -128 -512 … -32768
采样频率: 是指将模拟声音波形数字化时,每秒钟所抽取 声波幅度样本的次数,其计算单位是kHz(千赫兹)。 一般来讲,采样频率越高声音失真越小,用于存储 数字音频的数据量也越大。
2006年08月22日
第四章 音频处理技术
10
2.2 量化与量化位数
量化
就是把采样得到的声音信号幅度转换为数字 值,是声音信号在幅度上被离散化。量化位数是 每个采样点能够表示的数据范围,常用的有8位、 12位和16位。
游戏接口
MIDI接口
In和Out
图4-13 MIDI与游戏口电缆
2006年08月22日 第四章 音频处理技术
系统总 线接口
MIDI与 游戏接 口
系统总线 图4-5 音频卡的一般组成与结构示意
2006年08月22日
第四章 音频处理技术
20
3.3
音频卡的I/O接口
一般的音频卡都配有Line-in、Mic-in、Line-Out、 Speaker-Out、Joysticks/MIDI等接口,如图4-6所示。 需要说 明的是,有 的音频卡不 再提供LineOut插孔,目 前一些新的 音频卡产品
2006年08月22日 第四章 音频处理技术 15
2006年08月22日
第四章 音频处理技术
16
2.5 音频数据编码
音频数据压缩编码的方法有多种,可分为无损压缩和有 损压缩两大类。无损压缩主要包含各种熵编码;而有损压缩 则可分为波形编码、参数编码、感知编码和同时利用多种技 术的混合编码,图4-4给出了音频数据压缩编码的主要方法。 波形编码是在模拟音频数字化(抽样和量化)的过程中, 根据人耳的听觉特性进行编码,并使编码后的音频信号与原 始信号的波形尽可能匹配,实现数据的压缩。 参数编码把音频信号表示成某种模型的输出,利用特征 提取的方法抽取必要的模型参数和激励信号的信息,且对这 些信息编码,最后在输出端合成原始信号。