声音信号的获取与处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验一声音信号的获取与处理

声音媒体是较早引入计算机系统的多媒体信息之一,从早期的利用PC机内置喇叭发声,发展到利用声卡在网上实现可视电话,声音一直是多媒体计算机中重要的媒体信息。在软件或多媒体作品中使用数字化声音是多媒体应用最基本、最常用的手段。通常所讲的数字化声音是数字化语音、声响和音乐的总称。在多媒体作品中可以通过声音直接表达信息、制造某种效果和气氛、演奏音乐等。逼真的数字声音和悦耳的音乐,拉近了计算机与人的距离,使计算机不仅能播放声音,而且能“听懂”人的声音是实现人机自然交流的重要方面之一。

采集(录音)、编辑、播放声音文件是声卡的基本功能,利用声卡及控制软件可实现对多种音源的采集工作。在本实验中,我们将利用声卡及几种声音处理软件,实现对声音信号的采集、编辑和处理。

实验所需软件:

Windows录音机

Cool Edit Pro 2.1

进行实验的基本配置:

●●Intel Pentium 120 CPU或同级100%的兼容处理器

●●大于16MB的内存

●●8位以上的DirectX兼容声卡

1.1 实验目的和要求

本实验通过麦克风录制一段语音信号作为解说词并保存,通过线性输入录制一段音乐信号作为背景音乐并保存。为录制的解说词配背景音乐并作相应处理,制作出一段完整的带背景音乐的解说词。

1.2 预备知识

1.数字音频和模拟音频

模拟音频和数字音频在声音的录制和播放方面有很大不同。模拟声音的录制是将代表声音波形的电信号转换到适当的媒体上,如磁带或唱片。播放时将纪录在媒体上的信号还原为波形。模拟音频技术应用广泛,使用方便。但模拟的声音信号在多次重复转录后,会使模拟信号衰弱,造成失真。

数字音频就是将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理,主要包括采样和量化两个方面。

2.数字音频的质量

数字音频的质量取决于采样频率和量化位数这两个重要参数。采样频率是对声音波形每秒钟进行采样的次数。人耳听觉的频率上限在2OkHz左右,根据采样理论,为了保证声音不失真,采样频率应在4OkHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz 等。采样频率越高,声音失真越小、音频数据量越大。量化数据位数(也称量化级)是每个采样点能够表示的数据范围,经常采用的有8位、12位和16位。例如,8位量化级表示每个采样点可以表示256个(0-255)不同量化值,而16位量化级则可表示65536个不同量化值。

量化位数越高音质越好,数据量也越大。反映数字音频质量的另一个因素是通道(或声道)个数。单声道是比较原始的声音复制形式, 每次只能生成一个声波数据。立体声(双声道)技术是每次生成二个声波数据,并在录制过程中分别分配到两个独立的声道出输出,从而达到了很好的声音定位效果。四声道环绕(4.1声道)是为了适应三维音效技术而产生的,四声道环绕规定了4个发音点:前左、前右,后左、后右,并建议增加一个低音音箱,以加强对低频信号的回放处理。Dolby AC-3音效(5.1声道)是由5个全频声道和一个超重低音声道组成的环绕立体声。

在多媒体音频技术中,存储声音信息的文件有多种格式,如Wav、Midi、Mp3、Rm、VQF等等。

1)Wav格式

Wav格式的文件又称波形文件,是用不同的采样率对声音的模拟波形进行采样得到的一系列离散的采样点,以不同的量化位数(16位、32位或64位)把这些采样点的值转换成二进制数得到的。Wav是数字音频技术中最常用的格式,它还原的音质较好,但所需存储空间较大。

2)Midi格式

Midi是Musical Instrument Digital Interface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,并于 1988年正式提交给MIDI制造商协会,便成为数字音乐的一个国际标准。MIDI标准规定了电子乐器与计算机连接的电缆硬件以及电子乐器之间、乐器与计算机之间传送数据的通信协议等规范。 MIDI标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。Midi文件纪录的是一系列指令而不是数字化后的波形数据,所以它占用存储空间比Wav文件要小很多。

3)MP3格式

MP3是对MPEG Layer 3的简称,是目前最热门的音乐文件。其技术采用MPEG Layer 3标准对W AVE音频文件进行压缩而成,特点是能以较小的比特率、较大的压缩率达到近乎CD音质。其压缩率可达1:12,每分钟CD音乐大约需要1兆的磁盘空间。

4)Rm格式

Rm是RealMedia文件的简称。Real Networks公司所制定的音频视频压缩规范称为RealMedia,是目前在Internet上相当流行的跨平台的客户/服务器结构多媒体应用标准,它采用音频/视频流和同步回放技术来实现在Intranet上全带宽地提供最优质的多媒体,同时也能够在Internet上以28.8Kbps的传输速率提供立体声和连续视频。

1.3 实验内容与步骤

一.实验内容:

1.1.硬件与软件的准备

目前,多媒体计算机中的音频处理工作主要借助声卡,从对声音信息的采集、编辑加工,直到声音媒体文件的回放这一整个过程都离不开声卡。声卡在计算机系统中的主要作用是声音文件的处理、音调的控制、语音处理和提供MIDI接口功能等。

进行录制音频信号所需的硬件除了声卡,还有麦克风、音箱以及外界的音源信号设备(如CD唱机、录音机等),把麦克风、音箱、外界音源信号设备与声卡正确连接完成硬件准备工作。在Windows的【控制面板】/【多媒体】中选择正确的录音和回放设备,并对其进行调试。

2.2.用Windows录音机录制解说词

使用Windows录音机录制任意一段语音信号作为解说词,录制完毕后把文件存为Wav 格式,文件名为【示例1_1】。

3.3.使用Cool Edit录制背景音乐

使用Cool Edit 2.1录制任意一段语音信号作为背景音乐,要求录制的声音文件

采样频率为44100Hz,立体声,量化位数为16位,保存文件为Wav格式,文件名【示例1_2】。4.4.使用Cool Edit编辑和处理背景音乐

相关文档
最新文档