数字音频处理技术
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 模拟音频与数字音频
模拟音频技术是以模拟电压的幅度表示声音的强弱,模拟声音的录制是 将代表声音波形的电信号转换到适当的媒体上,如磁带,唱片,播 放时讲记录在媒体上的信号还原为声音波形。 在计算机中,所有信息均以二进制数字表示,声音信号也是用一系列数 字表示,各种幅度的物理量也是不同的数字,称为数字音频。其特 点是保真度好,动态范围大。 数字音频是通过采样和量化把模拟量表示的音频信号转换成由许多二进 制数0和1构成的数字音频文件。
第四章 数字音频处理技术
主讲人 杨岚
4.1 音频概述
4.1.1 数字音频基础
多媒体技术的特点是计算机交互式综合处理声、文、图信息,音频和视频的同步, 使视频图像更具真实性。 1 声音的基本概念 从物理角度说,声音是因为物体振动而产生的;从听觉角度讲,声音有四种属性: 高低、长短、强弱和音色。总体来讲声音信号所携带的信息Leabharlann 体可以分为语 音、音乐和音响三类。
(2)MIDI和MPC
MIDI规范允许MIDI装置以预先说明的方式通信。其中规定了MPC包括一个内部合成器 和标准MIDI端口 。 MIDI装置应有一个或多个下列端口: MIDI In 、 MIDI Out 、 MIDI Thru 。每个端口有特定的用处,如发送、接受或在 MIDI 装置间转发MIDI 消息。这种设计允许同时控制所连接的多个MIDI 装置。 以下几种情况,使用MIDI 谱曲比是使用波形音频更合适: 需要播放长时间高质量音乐。 需要以音乐做背景音响效果,同时从CD-ROM 中装载其他数据,如显示图像、文 字。 需要以音乐做背景音响效果,同时播放波形音频或实现文语转换,以实现音乐 和语音同时输出。
4.1.2 音乐合成和MIDI规范
1. 音乐合成
自应用调频(FM)技术以来,其音乐已经很逼真,但后来又有了更为真实 的音乐合成技术波形表(Wavetable)合成。 (1)乐音的几个要素 音调(声波的基频,基频越低,越低沉),音强(对声音强度的衡量,是 乐音基础)和音色(由声音频谱决定,各阶谐波不同,随时间衰减的 程度不同,音色也不同)。若把一个乐音放在运动的旋律中,它还应 具备时值,即持续时间。
3 数字音频的形成
声音的数字化是通过采样,量化和编码完成的,声音采样和量化过程当 中所用的主要硬件设备是模数转换器(Analog to Digital Converter ADC)。 (1)音频采样 把模拟声音转换成数字音频的过程称为采样,采样的时间间隔称为采样 周期,原则上采样频率越高,即采样间隔越短,数字音频的音质就 越有保证,但避免音频文件过大,一般采用合适的采样频率即可。 (2)音频量化 通常把对声波波形幅度的数字化表示称为量化。量化的过程是先将采样 后的信号按 整个声波的幅度划分成有限个区段的集合,把落入某个 区段内的样值归为一类,并赋予相同的量化值。 (3)音频的编码机制 模拟信号经过采样和量化后,形成一系列离散信号(脉冲数字信号), 这种脉冲数字信号可以按照一定方式进行编码,再形成计算机内部 运行的数据。所谓编码就是按照一定格式把经过采样和量化得到的 离散数据记录下来,并在有效的数据中加入一些用于纠错,同步和 控制的数据。常用最方便简单的编码是脉冲编码调制(Pulse Code Modulation PCM),未经压缩,失真小,抗干扰,传输稳定。
(3)MIDI 1.0 技术规范
4.2 常用数字音频文件格式
1 MIDI 格式(.mid) 它采用数字方式对乐器演奏出来的声音进行记录(每个音符记录为一个数字),然后播 放时再对这些记录通过FM或波表合成。其目的是解决各种电子乐器间的兼容问题, MIDI 规范不仅定义了计算机音乐程序、音乐合成器以及电子音乐设备之间交换音 乐信号的方式,而且还规定了不同厂家的电子乐器与计算机连接的电缆和硬件以 及设备间数据传输的协议。 MIDI 本身不直接提供声音数据,它是 一个协议,只 包含用于产生特定声音的指令,这些指令包括调用何种MIDI 设备的声音、声音的 强弱以及持续的时间等。 相对于保存真实采样数据的声音文件, MIDI 文件显得更加紧凑,它有几个变通的格式, 如CMF 文件,RIFF 文件子格式,RMID 文件。 2 CD 格式(.cda) 它是常用音频格式中音质最好的文件格式之一,声音上基本忠实于原声,是音响发烧友 首选。 CD 格式的音频以.cda 形式存在于光盘中,几乎所有媒体播放器都支持这 种格式,标准的CD 采样足16位,甚至最高达24位。 3 WAVE 格式(.wav) 它是 Microsoft 开发的,最为经典的Windows 多媒体音频格式,应用极其广泛,采用 无损压缩,缺点是文件体积较大,它使用三个参数表示声音:采样位数、采样频 率和声道数。其文件大小公式为:(采样频率*采样位数*声道)*时间/8 4 WMA 格式(.wma) 也是 Microsoft 开发的一种音频格式,其实它就是ASF 的音频格式。它以减少数据流 量保持音质的方法达到比MP3 格式更高的压缩比,一般都可达18:1左右,但音质 要强于MP3,因此常作为网络电台的首先编码格式,且含内置版权保护技术。 5 MP3 格式(.mp3) 它是目前应用最广泛的有损压缩数字音频格式,全称为MPEG Audio Layer-3
6 MP4 格式 7 RA 格式(.ra) 8 APE 格式(.ape) 9 AIFF 格式(.aif) 10 AU 格式(.au) 11 VQF 格式(.vqf)
(1)声音的定义
声音是机械振动在弹性介质中传播的机械波,是随时间连续变化的物理量。 它有三个重要特性: 振幅,即波的高低幅度,表示声音的强弱。 周期,即两个相邻波之间的时间长度。 频率,即每秒波振动的次数,以Hz(赫兹)为单位。 (2)声音的特点 声音的传播方式:声音依靠介质的振动进行传播。介质有空气,液体和固体,声音 在不同介质中传播距离不同。 声音的频率范围:不同的声音有不同的频率范围,人耳范围20-20kHz,分次声和超 声。 声音的传播方向:声音以振动波的形式从声源向四周传播,分直达声,反射声。 声音的三要素:音调(代表声音的高低与频率有关),音强(声音的强度或音量) 和音色(影响音色的因素是复音,人们通过音色来辨别声源种类) 声音的主要性质:连续性(在时间轴上是连续信号,具有连续性和过程性),相关 性(构成声音的数据,前后之间具有强烈的相关性),实时性(对处理声音 的计算机硬件和软件提出很高要求)。
2 MIDI 规范
(1)MIDI基本术语 MIDI是音乐与计算机结合的产物,是Musical Instrument Digital Interface 乐器数字接口的英文缩写,泛指数字音乐的国际标准,始建于1982年。MIDI标 准规定了不同厂家的电子乐器与计算机连接的电缆和硬件,它还指定从一个装 置传送数据到另一个装置的通信协议。 MIDI文件:存放MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个 通道的演奏定义。 通道(Channel):MIDI可为16个通道提供数据,每个通道访问一个独立的逻辑合成 器。 音序器(Sequencer):是为MIDI作曲而设计的计算机程序或电子装置,它能够用来 记录、编辑、播放MIDI文件,大多数音序器能输入、输出MIDI文件。 合成器(Synthesizer):是利用数字信号处理器或其他芯片来产生音乐或声音的装 置。其发声的质量和声部取决于合成器能够同时播放的独立波形的个数。 乐器(Insrument):合成器能产生特定的声音,但不同的合成器,乐器的音色号不 同,声音质量也不同;比如多数乐器都能合成钢琴的声音,但不同乐器因为音 色号不同,它们输出的声音是有差异的。 复音(polyphone):指的是合成器同时支持的最多音符数。 音色(Timbre):指的是声音的音质。音色取决于声音的频率组成,但非正式用法 中,它指的是与特定乐器相关的特殊声音。 音轨(Track):一种用通道把MIDI数据分隔成单独组、并行组的文本概念。 合成音色映射器(Path Apper):它是一种软件,为了适应Microsoft MIDI合成音 色,分配表规定合成音色编号。 通道映射(Channel Mapping):它把发送装置的MIDI通道号变换成适当的接口装置 的通道号。
(2) 计算机音乐的合成
• • 计算机音乐系统由演奏控制器,音源和MIDI接口组成。 演奏控制器是一种输入和记录实时乐曲演奏信息的设备,主要用来产生 演奏信息,并不发声。 音源是计算机音乐系统的核心,是具体产生声音波形的部分。目前在计算 机音乐系统中使用的音源有:数字合成音源,采样音源和物理模型化音源。 数字合成音源:该音源由硬件芯片实现,常用的合成方法是调频合成, 即FM合成。音频卡中常用的合成芯片YM3812就是一种广泛使用的音乐合成 芯片,采用的就是FM合成方式,能够在软件的控制下产生变化极为丰富的 各种音色。 采样音源:一种真实声音片段的音源,它事先把真实乐器发出的声 音,经采样,量化后以数字的形式记录下来,固化在称为声波速查表的 ROM区中,称为波形表(Wavetable)合成。 物理模型化音源:与其他两种音源有着本质不同,既没有波形发生 器,也不存在采样波形,而是利用计算机的强大处理能力和高速的实时响 应能力模拟出各种演奏信息的相应波形。