第4章声音素材

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第4章声音素材

模块4.1学习目标

1．了解音频的相关概念及其分类。

2．熟悉音频格式的应用。

3．掌握Cool Edit Pro录音编辑软件的使用。

模块4.2学习内容

学习要点

1．学习音频格式的分类。

2．了解音频的关键技术和音频编辑软件。

4.1音频信号

4.1.1 模拟信号与数字信号

早在20世纪80年代以前，计算机既不能出声，也不能播放含有声音的动画和视频，计算机只能显示字符和一些简单的图形，因为当时的声音和视频技术采用的是模拟技术，与数字计算机不兼容。

1．模拟信号

我们知道，声波的本质是空气的振动，它可以分解为无数个正弦波。每个正弦波有振动的快慢（决定声音的高音与低音）及振幅大小（决定声音的强弱）的变化，它的波形是连续的，经过话筒将连续的声波变成电信号，这种电信号也是连续的，通常将这种连续变化的信号称为模拟信号，将处理模拟信号的电路称为模拟电路。采用模拟电路处理模拟信号的技术称为模拟技术。

由于计算机内部采用二进制数字信息，要将模拟信号直接存储到计算机中是不可能的。

2．数字信号

20世纪80年代以后，模-数转换技术、大规模集成电路技术与光盘存储技术的出现和发展，使这一设想有了实现的可能。所谓模-数转换技术是指将模拟信号和数字信号相互转换的技术，依靠该技术，声音、视频等模拟信号可首先转换为数字信号，再经编码压缩转换为二进制信息输入到计算机内处理和存储；另一方面，也可将计算机内存储的二进制信号变换为输出的模拟信号，使喇叭发出声音或使显示器放出影片。这种将模拟信号转化为数宇信号来进行处理和存储的技术也称为数字技术。

4.1.2 数字音频的类型

声音是多媒体计算机中使用最多的信息之一。数字音频的种类可分为以下几种：

1．按用途

声音按用途分类包括三种，即：语音、音乐、音效。

（1）语音。语音即人说话的声音，比如一个多媒体教学片的解说词，影像光盘的配音等，语音是多媒体作品不可缺少的内容。在多媒体作品的创作中，解说词常占用了很大的部分。

（2）音乐。音乐是多媒体作品不可缺少的，作为世界性共同语言，音乐可淋漓尽致地将一个多媒体作品的喜怒哀乐气氛烘托出来，成为多媒体音频中不可缺少的组成部分。

（3）音效。即自然界所有物体所发出的声音，包括鸟叫、打雷、下雨、闪电、爆炸、

脚步、掌声、笑声、流水等。这些声音可与画面构成在一起，形成一个酷似真实的世界。

2．按声源

声音的来源主要有三种，即声波数字化、MIDI合成、素材库。

（1）声波数字化。是将声音通过数字化音频设备（例如声卡、录音笔）由模拟信号转换为数字音频信号。例如将记录在录音磁带上声音转变为数字化声音。其中，声波数字化最典型的实例是将语音数字化。

（2）MIDI合成。声音来源的另外一种方法是通过数字化音乐设备直接产生。最典型的数字化音乐设备为数字键盘与电脑合成器。人们在数字键盘上弹奏乐曲，或者在电脑上利用音序器在五线谱上谱曲，音乐就随之产生了。

（3）素材库。素材库收集了大量的音效素材，供多媒体制作方采用，这种用于商业用途的音效素材对专业多媒体制作者来说是不可缺少的。

3．按声音格式

声卡处理的声音信息在计算机中以文件的形式存储。Windows使用的标准数字音频文件称为波形文件，扩展名为W A V；扩展名为VOC的声音文件主要用于DOS程序；扩展名为MID的文件用于存储MIDI类声音信息；它比W A V文件更节省空间。声音存储文件的格式有很多种，除以上介绍的以外，经常用到的还有AIF、mp3等。

4.1.3 数字化声音

普通磁带或唱片上录制的声音是模拟信号（以波形表示），计算机直接处理的信号必须是经过二进制编码的数字化信号。

数字化声音就是要将模拟的声音信号转变为数字信号，以解决声波在计算机中的存储、编辑、处理、播放等问题。

将模拟声音信号转换成数字声音信号的模数转换（A/D或ADC）包括采样和量化两个过程，如图4-1-1所示，这可通过多媒体计算机的声卡来进行。

图4-1-1 采样与量化

（1）采样。采样就是将时间上连续的声波信号按特定的时间间隔进行分割，从而得到一系列不连续的点，这些点大致可以代表原始模拟信号的变化情况。

单位时间采样的次数称为采样频率。采样频率越高，这些点越密集，跟原始信号就越近似，失真就越小，就越能逼真地还原原有信号的信息，采样频率越高，数据量就越大，所以要在精确度和数据量之间合理地兼顾。

对声音进行采样的三种标准以及采样频率分别为：语音效果（11.025 kHz）、音乐效果（22.05 kHz）、高保真效果（44.1 kHz），目前声卡的最高采样率为44.1kHz。

（2）量化。量化就是用二进制数码来记录采样所得到的不连续点声波幅值，对声波每次采样后存储、记录声音振幅所用的位数称为采样位数。16位声卡的采样位数就是16。量化位数决定了音乐的动态范围，量化位数有8位和16位两种。8位声卡的声音从最低音到最高音只有256个级别，16位声卡有65536个高低音级别。显然，用来保存这些幅值的二进制位数越多，幅度变化的间隔就越细致，就越能逼真地表示声音幅值的变化情况。声波的采样如图4-1-2所示。

图4-1-2 声音的数字化过程

在完成采样与量化后，按时间序列将这些二进制数输入到计算机并储存起来，就得到了数字化的声音。

4.1.4 常用音频文件的格式

（1）W A VE 格式的声音文件

对声音进行采样量化后得到二进制数值的声音数据，将这些数据有序地存储到一个文件中，形成波形数字化文件，即W A VE格式声音文件（扩展名.wav）。计算机中声音的采样频率和信号量化的二进制数的位数都影响到数字化后声音的品质和声音文件的数据量。采样频率越高，信号量化的二进制数的位数越大，声音的失真越小，当然数据量也越大。8kHz、16位的声音大致相当于电话的通话音质，44.1kHz、128位的声音音质就跟自然声音比较接近了。

（2）MIDI格式音乐数据文件

MIDI是数字乐器接口的国际标准，它定义了电子音乐设备与计算机的通讯接口，规定了使用数字编码来描述音乐乐谱的规范。常见的MIDI设备有电子琴等。计算机中以MID为扩展名的文件称为MIDI文件，其中存放的是对MIDI设备的命令，即每个音符的频率、音量、通道号等指示信息。最后播出的声音是由MIDI设备根据这些信息产生的。MIDI声音可以用于配音。

由此可见，MIDI产生声音的方法与数字化波形文件差别很大。它能指挥各音乐设备的运转，而且具有统一的标准格式，能够模仿原始乐器的各种演奏技巧甚至演奏的效果，而且文件非常小，一般一首歌曲只有几kB到几十kB，适合在网络上传播。

（3）CD Audio音乐文件

CD Audio音乐文件的扩展名为.cda，它是CD唱片采用的格式，记录的是波形流，声音纯正、音质好。但缺点是无法编辑，文件很大，一般一张光盘只能存放十几首CD音乐。

（4）MP3格式声音文件

MPEG－3声音文件的扩展名.mp3，是网上最为流行的音乐存放、下载格式。它具有压缩率高的特点，一般压缩率可高达10:1～12:1。也就是说，1 min CD音质的音乐，未经压缩需要10 MB的存储空间，而经过MP3压缩编码后只有1 MB左右。因其压缩率大，在网络、可视电话与通信方面应用广泛，但和CD唱片相比，其音质尚不能令人非常满意。

4.2常用音频编辑软件的使用

目前流行的音频编辑播放软件很多，表4.2.1即为主要的几种：

表4.2.1 常用音频编辑软件

第4章 声音素材