浅析数字音频的原理和理论应用解读
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅析数字音频的原理和理论应用
王庆华
滨州市人民广播电台山东省滨州市256600
摘要
数字音频是随着数字信号处理技术、计算机技术、多媒体技术的发展而形成的一种全新的声音处理手段。在现代生活中可以说普遍存在,随处可见,这种技术带给我们带来了听觉上的享受,作为工作者更应该掌握它的基本原理和应用,发展的看待这种技术,能够更好地驾驭它并在其基础上有所发展。
关键词:采样率码率采样量化编码 A/D数模转化 D/A模数转化
数字音频是一种利用数字化手段对声音进行录制、存储、编辑、压缩或播放的技术。而所谓的数字化就是把计算机数据的存储是以0、1的形式存取的,那么数字音频就是首先将音频文件转化,接着再将这些电平信号转化成二进制数据保存,播放的时候就把这些数据转换为模拟的电平信号再送到喇叭播出,数字声音和一般磁带、广播、电视中的声音就存储播放方式而言有着本质区别。相比而言,它具有存储方便、存储成本低廉、存储和传输的过程中没有声音的失真、编辑和处理非常方便等特点。
一、模拟音频技术
人耳是声音的主要感觉器官,人们从自然界中获得的声音信号和通过传声器得到的声音电信号等在时间和幅度上都是连续变化的,时间上连续,而且幅度随时间连续变化的信号称为模拟信号(例如声波就是模拟信号,音响系统中传输的电流,电压信号也是模拟信号),记录和重放信号的音源即使模拟音源,例如磁带/录音座、LP/LP电唱机等;唱片(LP)表面上起伏跌宕(细小到你很难看见,而且并非是表面纹路形成的沟痕的底部,事实上这些跌宕起伏是存在于纹路的两侧)或者是磁带上的磁粉引起的磁场强度来表示音箱上振膜的即时位置,比如说,当唱片表面在某一时刻比前一时刻的纹路呈下降趋势时,音箱上的振膜就会向里收缩;如果呈上升趋势,音箱上的振膜就会向外舒张,从而产生声音,这是原始
的模拟音频。
二、数字音频技术
传统的信号都是以模拟手段进行处理的,称为模拟信号处理。模拟音频信号处理有很多弊端,如抗干扰能力很差,容易受机械振动、模拟电路的影响产生失真,远距离传输受环境影响较大等。而数字音频技术是通过把模拟信号进行时间上的离散化和幅度上的量化处理以后,变为一连串数字信号加以存储或传输。因为数字信号不会因存储、传输或重放过程中引起音质变化,是越来越多采用数字音频技术的主要原因。
把模拟的电信号变为数字电信号这一过程称为模拟信号数字化,即模/数转换(A/D)。A/D转换通常使用PCM(脉冲编码调制)技术来实现,未经过数据压缩,直接量化进行传输则被称为PCM(脉冲编码调制)。A/D转换过程包括三个阶段,即取样、量化、编码。
三、模数转换(A/D)原理
模数转换是将模拟信号转换成数字信号的系统,是一个滤波、采样保持和编码的过程。
首先来总览一下模数转换,如图:
1、采样的定义:采样指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点来表示,使起称为时间上离散的脉冲序列。
每秒钟采样的次数称为采样频率,用ƒs表示;样本之间的时间间隔称为取
样周期,用T表示,T=1/ƒs。例如:CD的采样频率为44.1kHz,表示每秒钟采样44100次。常用的采样频率有8kHz、22.05kHz、44.1kHz、48kHz等。
2、量化的定义:就是度量采样后离散信号幅度的过程,度量结果用二进制数来表示。量化精读就是度量时分级的多少。
量化就是把采集到的数值送到量化器(A/D转换器)编码成数字,每个数字代表一次采样所获得的声音信号的瞬间值。量化时,把整个幅度划分为几个量化级(量化数据位数),把落入同一级的样本值归为一类,并给定一个量化值。量化级数越多,量化误差就越小,声音质量就越好。
量化过程:量化级对应的二进制位数称为量化位数,量化位数是每个采样点能够表示的数据范围,有时也称采样位数(Digitalizing bit),量化位数(大小)决定了模拟信号数字化以后声音的动态范围。
量化级是描述声音波形的数据是多少位的二进制数据,通常用bit做单位,如16bit、24bit。16bit量化级记录声音的数据是用16位的二进制数,因此,量化级也是数字声音质量的重要指标。量化可以归纳为两类:一类称为均匀量化,另一类称为非均匀量化。采用的量化方法不同,量化后的数据量也不同。
3、编码(Encoding)的定义:采样、量化后的信号还不是数字信号,需要按一定的格式将离散的数字信号记录下来,并在数据的前、后加上同步、纠错等控制信号,再把它转换成数字编码脉冲,这一过程称为编码。
编码有一定格式标准,最简单的编码方式是二进制编码。用这样方式组成的脉冲串的频率等于采样频率与量化比特数的积,称为所传输数字信号的数码率(音频:数据率、视频:码率)。显然,采样频率越高,量化比特数越大,数码率就越高,所需要的传输带宽就越宽。计算公式如下:
数码率(bps)=采样频率(Hz)×量化位数(bit)×声道数(bit/s)
四、数字信号接口及相关指标
1、AES/EBU接口
采用110Ω同轴电缆或双绞线。允许电缆长度为100~300M。
2、标准型民用接口(IEC958,类型2)
标准型民用接口,采用特性阻抗为75Ω的同轴电缆来进行不平衡的电气连接。常用于准专业级或民用级数字音频设备的技术规格中,比如CD播放机和DAT 机。
3、SPDIF-2接口
在大多数双通道设备中,接口是不平衡式的,并采用75Ω同轴电缆和75Ω的BNC型接口端子,每个通道一个。电平为TTL兼容电平(0~5V)。
4、多通道音频数字接口(MADI)
是以双通道AES/EBU接口标准为基础的多通道数字音频设备间的互连标准。可以通过一条75Ω的同轴电缆或光纤来串行传输56个通道的线性量化音频数据。输出电压峰一峰值应为0.3V~0.6V,最长的同轴电缆长度不超过50M。
5、IEEE l394火线接口
是IEEE标准化组织制定的一项具有视频数据传输速度的串行接口标准,英文取名为firewire。接口最快传输速率达到了400Mbit/s,而且IEEE l394B标准已经将速度提升到了800 Mbit/s甚至l.6G bit/s;
五、常用数字音频格式
BWF格式 (.S48):2001年5月被定义为广播音频数据文件和波形格式规范(GY/T 168-2001)。该格式帧格式同MPEG-1 LayerII,特指48kHz采样精度,16比特量化的立体声格式,编辑精度4ms。由于其易于编辑、剪切和拥有大量制作信息,目前为电台内部使用的标准格式,
WAVE(.WAV)格式:是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。对存储空间需求太大不便于交流和传播。
Real Audio格式(RA):RA、RAM和RM都是由Real Networks公司推出的一种文件格式,最大的特点就是可以实时传输音频信息,尤其是在网速较慢的情况下,仍然可以较为流畅地传送数据。