声音媒体的采集与处理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.4.3 音频文件的格式
存储声音信息的文件格式主要有:WAV文件、MIDI 文件、MP3、VOC文件、AIF文件、RMI文件以及 SNO文件等。
1. WAV文件
WAV文件,是Microsoft公司开发的一种波形文件 格式,是Windows本身存放数字声音的标准格式, 采用“.wav”作为扩展名。
5. MIDI文件
MIDI提供了电子乐器与计算机内部之间的 连接界面和信息交流方式。MIDI格式的文 件采用“.mid”作为扩展名。*.mid文件 重放的效果完全依赖声卡的档次。*.mid 格式的最大用处是在电脑作曲领域。* .mid文件可以用作曲软件写出,也可以通 过声卡的MIDI口把外接音序器演奏的乐曲 输入电脑里,制成*.mid文件。
音频处理系统 部件
图2-163音频处理系统
2.4.2声音的数字化
声音是一种纵波,为了使计算机能够处理这 样的模拟信号,必须先将这种模拟波形转换 成二进制的数字形式,形成数字声音信号后 才能在计算机中使用。
计算机中广泛应用的数字化声音文件有两类 :一类是采集各种原始声音,经过数字化处 理后得到的数字文件(也称为波形文件); 还有一类是专门用于记录乐器声音的MIDI 文件。
利用该格式记录的声音文件能够和原声基本一致, 质量非常高,但由于WAV格式存放的一般是未经压 缩处理的音频数据,所以体积都很大(1分钟的CD 音质需要10M字节),不适于在网络上传播。
2. MP3文件
MP3的全称是MPEG-1 Audio Layer 3,是一种以 高保真为前提下实现的高效压缩技术。MPEG音频 文件的压缩是一种有损压缩,MPEG3音频编码具 有10:1~12:1的高压缩率,基本保持低音频部 分不失真,牺牲声音文件中12KHz到16KHz高音 频部分的质量来换取文件的尺寸,相同长度的音乐 文件,用*.mp3格式来储存,一般只有*.wav文 件的1/10。
量化
量化过程是把采样幅值归并到有限的幅度 等级上,将其表示成一个离散振幅值的集 合。
量化精度
量化精度由量化样本的位数(量化比特, bit per sample)衡量,分为8bit、16bit 和32bit。8bit的量化位数每个采样点可以 表示256个(0--255)不同量化值, 16bit的 量化位数则可以表示为216,即65536个不 同的量化值。量化位数越高音质越好,数 据量也越大。
声卡,也叫音频卡,是计算机进行声音处理 的适配器。声卡可以把来自话筒、收录音机 、激光唱机等设备的语音、音乐等声音变成 数字信号交给电脑处理,并以文件形式存盘 ,还可以把数字信号还原成为真实的声音输 出。
音箱(扬声器)是将音频信号转换为声音( 物理声波)的一种设备。音箱内自带的功率 放大器对音频信号进行放大处理后由音箱本 身回放发出声音。
声音的数字化处理就是将模拟的(连续的) 声音波形数字化(离散化),包括采样、量 化和编码三个过程。连续时间的离散化通 过采样来实现,连续幅度的离散化通过量 化来实现。
采样
采样指在有规律的时间间隔T内,对模拟 信号进行检测和测量,抽取模拟信号的一 个瞬时幅度值,如图所示。
连续信号S(t)的采样样本可表示为: S(t)={S(T), S(2T), S(3T),…, S(nT)}
声音媒体的采集与处理
音频信号简介
通常,音频信号用一种模拟的连续波形表示, 具有频率、幅度两个基本参数,人耳能感知的声 音频率大约在20~20000Hz之间,在这种频率范 围里感知的声音幅度大约在0~120dB之间。
人耳对不同频率的声音敏感程度是不一样的, 中频段(3 kHz~5 kHz)最敏感,幅度很低的信 号都能被人耳听到。低频区和高频区较不敏感, 能被人耳听到的信号幅度比中频段要高得多。
是音乐设备数字接口缩写。 这种接口技术的作用就 是使电子乐器与电子乐器,电子乐器与电脑之间通 过一种通用的通讯协议进行通讯,是数字音乐的国 际标准。
MIDI声音与数字化波形声音完全不同,它不是对声 波进行采样、量化和编码,而是将电子乐器的弹奏 过程记录为一连串数字,例如用什么乐器 如按了哪一个键、力度多大、时间多长等等。然后 由声卡上的声音合成器根据这些数字所代表的意义 合成音乐,再通过音箱或耳机播放。所以MIDI文件 实际上是一种字符表格,它描述了各种音符以及这 些音符的播放方式及时延的乐谱。
编码
编码是将量化后的整数值用二进制数来表示。 采样频率越高,量化数越多,编码用的二进制
位数也就越多,数字化的信号越能逼近原来的 模拟信号,但音频数据量也越大。 在编码过程中通常采用一定的算法来压缩数字 数据以减Biblioteka Baidu存贮空间和提高传输效率,因此不 同的编码方法会形成不同的数字声音文件格式 。
MIDI(Musical Instrument Digital Interface)
MP3技术使在较小的存储空间内,存储大量的音 频数据成为可能,所以MP3成为目前最为流行的 一种音乐文件。
4. RealAudio文件
是Real Networks公式推出的一种文件格 式,最大的特点就是可以实时传输音频信 息,尤其在网速较慢的情况下,仍然可以 较为流畅的传输数据,因此RealAudio主 要适用于网上在线音乐欣赏。
其中,T为采样周期
采样频率
采样频率可以表示成f=1/T,即采样频率是对声音 波形每秒钟进行采样的次数。
人耳听觉的频率上限在20kHz左右,根据采样理 论,为了保证声音不失真,采样频率应在40kHz 左右。采样频率越高,所获得的波形越接近于实 际波形,声音保真度越高,但音频数据量也越大 。
经常使用的采样频率有11.025kHz(低品质)、 22.05kHz(适用于语音和中等品质的音乐)和 44.1kHz(用于CD品质的音乐)等。
2.4.1音频制作系统的硬件组成
录音、混音或是其它音乐制作过程,都是基于 音频制作系统所具有的硬件设备完成的,包括 声音输入、输出和处理部件。
声音输入部件主要是麦克风、录音机 声音的输出部件有耳机、扬声机、扩音机、录
音机等 音频处理部件是声卡。
麦克风也称话筒,用于采集声音信号,并将 采集到的物理声波转换成电信号,传输到处 理设备(计算机)中。