第二章 模拟音频和数字音频

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章模拟音频和数字音频

人耳是声音的主要感觉器官,人们从自然界中获得的声音信号和通过传声器得到的声音电信号等在时间和幅度上都是连续变化的,时间上连续、而且幅度随时间连续变化的信号称为模拟信号(例如声波就是模拟信号,音响系统中传输的电流、电压信号也是模拟信号),记录和重放信号的音源就是模拟音源,例如磁带/录音座、L P/L P电唱机等;时间和幅度上不连续或是离散的,只有0和l两种变化的信号称为数字信号,记录和重放数字信号的音源叫做数字音源,例如C D/C D机、D V D/D V D播放机等。究竟模拟音频与数字音频有什么不同呢?数字音频究竟有些什么优点呢?这些都是下面要介绍的。

模拟音频信号记录

录音泛指把声能转变为其他形式的能量而加以存储,录音时采用的存储媒介主要是磁性材料,如磁带、磁盘等,也可以是感光材料,如光盘等。由此录音技术也可分为磁记录和光记录两种。另外,近年来半导体内存件发展很快,成为一种新型的记录和存储设备。

在本节中将重点介绍磁带录音技术。

一、磁带录音装置的基本结构

磁带录音装置一般由磁头、机械传动(称为“机芯”)机构和电路三部分组成。

二、模拟录音载体---磁带

三、录音和放音的基本原理

1.消音原理

磁带在录音前,必须将原有的声音信号(剩磁)抹去,称之为消音或消磁。

2.录音与录音偏磁原理

录音是将声音电信号以剩磁的形式保存在磁带上。

3.放音原理

放音是将磁带上保存的剩磁信号还原成相应的声音电信号.

第二节数字音频基础

传统的信号都是以模拟手段进行处理的,称为模拟信号处理。所谓模拟音频是指用电信号(电压、电流)来模仿声音物理量的变化。因为声音是在时间和幅度上都连续变化的信号,所以模拟电信号在时间和幅度上也是连续变化的,故称之为模拟音频信号。

模拟音频信号处理有很多弊端,如抗干扰能力差,容易受机械振动、模拟电路的影响产生失真,远距离传输受环境影响较大等。

数字信号是以数字化形式对模拟信号进行处理,它在时间和幅度上都是离散的。

随着大规模集成电路以及计算机技术的飞速发展,加之数字信号处理理论和技术的成熟和完善,数字信号处理已逐渐取代了模拟信号处理。因为数字音频信号抗干扰性强,

无噪声积累可做到多代复制和长距离传输无失真!

数字音频信号的优点主要有以下几个方面:

①精度高:模拟信号处理的精度主要由元器件决定,很难达到0.001。而数字信号处理的精度主要决定于字长,14位字长就可达到0.0001的精度。

②灵活性高:数字信号处理系统的性能主要决定于乘法器的系数,而系数存放于内存中,因而只需改变存储的系数就可得到不同的系统,比改变模拟系统方便得多。

③可靠性强:因为数字系统只有“o”和“1”两种信号,因而受周围环境的温度及噪声的影响较小。而模拟系统的各元器件都有一定的温度系数,且电平是连续变化的,易受温度、噪声、电感效应等的影响。

④易于大规模集成:由于数字化部件具有高度规范性,便于大规模集成、大规模生产,而对电路参数要求不如模拟装置苛刻,故产品成品率高。

⑤可实现时分复用:可利用数字信号处理器同时处理几个信道的信号。

⑥便于处理、存储和交换,实现二维甚至多维信号的处理,包括二维或多维滤波、频谱分析等。

把模拟的电信号变为数字电信号这一过程称为模拟信号数字化,即模/数转换(A/D)。

A/D转换通常采用P C M(脉冲编码调制)技术来实现。A/D转换过程包括三个阶段,即取样、量化、编码。下面分别介绍。

一、取样

取样也叫采样,是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点来表示,使其成为时间上离散的脉冲序列。显然,取样点需要足够密集,才能很好地表达原始模拟信号的特征。

每秒钟取样的次数称为取样频率或取样率,比如:C D的取样率为44.1k H z,表示每秒钟取样44100次。

某一数字取样系统的取样频率为44k H z,假定有一个36k H z(>22k H z)的频率进入取样器,则依据上式,在得到的样品中就会包括有36k H z、8k H z的两个频率信号,取样输出电路中有一个过滤22k H:以上频率的滤波器进行滤波,结果36k H z的信号被滤掉,而8k H z的信号保留了下来,成为干扰信号,这就是信号混叠现象.

大家可以发现,上下波形之所以不吻合,是因为取样点不够多,或严谨一点说,是取样频率不够高。这种情况,我们称之为低频失真。

一个常见的低频失真的例子如电影上车辆行驶时车轮转动的情况(一个典型的“马车轮效应的例子),飞速转动的车轮有时看起来似乎是静止不动甚至会向反方向转动(类似的情况也发生在直升飞机的翼片和螺旋桨上面)。

二、量化

所谓量化,就是度量采样后离散信号幅度的过程,度量结果用二进制数来表示。量化精度就是度量时分级的多少。

模拟信号通过取样已变成一个时间上离散的脉冲样品序列,但在电平幅度上仍会在其动态范围内有连续变化,即可能出现任意幅值。

1.量化比特数

量化等级通常用二进制的位数咒表示,称为量化比特数。以位的二进制数字可以有2n个量化级数,比如8位(8b i t),并不是把纵坐标分成8份,而是分成28—256份;同理16位是把纵坐标分成216—65536份;而24位则分成224=16777216份。

C D的量化精度为16b i t(16位二进制数),换算为十进制,分级数等于65536(216)。也就是说,以C D的标准,可以分辨出1/65536级的幅度变化。但如果信号的幅度变化比1/65536级还小呢?答案很简单:量不出结果,就像用精细到1m m的尺子去量一根头发的直径一样。量不出结果就没有资料,将来还原成模拟信号时就会形成背景噪声,专业术语叫量化噪声。量化噪声是数字音源信噪比提高的主要限制,对于C D规格,假设最强信号为一个单位,噪声大小就是1/65536个单位,因此,它的信噪比为65536(216),即96d B。

1.为什么要压缩

标准的C D音质处理,也就是说1秒钟内取样44.1千次,每次的资料量16×2=32b i t(因为立体声是两个声道)。

而一个字节(B y t e)含有8位(b i t),那么1秒钟内的资料量则为44.1k×.32b i t/(8b i t B y t e)=176.4k B。一个汉字在计算机中占用两个字节,那么176.4k B的空间可以存储176.4k/2—88200个汉字,也就是说1秒钟的数字音频资料量与近九万个汉字(一部中篇小说)的资料量相当。由此可见,数字音频文件的资料量是十分庞大的。

数字信号的数码率——比特率

数码率又称比特率,是单位时间内传送的二进制序列的比特数,通常用k b p s作为单

位。数码率与取样频率和量化比特数之间的关系为:数码率=取样频率×量化比特数,例如声音信号的取样频率48k H z,量化比特数为16b i t,则每声道的数码率为:48×103×16=768k b p s

对于双声道立体声数字信号,其总数据率为:2×768k b p s=1536k b p s=1.536M b p s

第三节数字音频信号的压缩编码

在对数字音频信号进行存储和传输时,通常要对其进行压缩编码和纠错编码。压缩编码的目的是降低数字音频信号的资料量和数码率,以提高存储和传输的有效性;纠错编码的目的是为信号提供纠错、检错的能力,以提高存储和传输的可靠性。

1.为什么要压缩

立体声C D音质信号,它每秒的码流是44.1K×16×2≈1.4M b p s。这样高的码流,对于数字音频的存储、处理和传输提出了很高的要求。对音频的压缩理论,是从研究人耳的听感系统开始的,首先

第一个特点是人耳对各频率信号的灵敏度是不同的,在2k~4k频段,很低的电平就能被人耳听到,其他频段时,相对要高一点的电平才能听到,这就是说在听觉阈值以下的电平可以去掉,相当于压缩了资料。

第二个特点就是频率之间的掩蔽效应,其实就是指人耳接收信号时,不同频率之间的相互干扰。当电平高的频率点和相对来说电平较低的不同频率点同时出现时,电平低的频率点的声音将听不到。因为人耳的灵敏度不一样,所以不同频率点的掩蔽程度是不一样的。低于掩蔽阈值的信号将不编码,高于掩蔽阈值的信号将重新分配量化比特值,实施压缩,这是M P E G能得到较高的压缩比,又能保证音质的重要原因。

第三个特点是指短暂掩蔽效应,指在一个强信号之前或之后的弱信号,也会被遮蔽掉。这样可以利用人耳的感觉特性,对数据流本身进行压缩,做到既能降低码流,又能通过科学的压缩方法提高码流的效率,而又不影响音质本身。

相关文档
最新文档