音频编码原理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

音频编码原理

●采样频率:

声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储形转换成一连串的二进制数据来再现原始声音的,实现这个步骤使用的设备是模/数转换器(A/D)它以每秒上万次的速率对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本。将一串的样本连接起来,就可以描述一段声波了,把每一秒钟所采样的数目称为采样频率或采率,单位为Hz (赫兹)。采样频率越高所能描述的声波频率就越高。

采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。

◎常用的采样率:

在当今的主流采集卡上,采样频率一般共分为22.05KHz、44.1KHz、48KHz 三个等级,22.05 KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD 音质界限,48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出来了,所以在电脑上没有多少使用价值。

●采样位数:

光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度,称为采样位数。采样位数可以理解为采集卡处理声音的解析度。数值越大,解析度就越高,录制和回放的声音就越真实。

我们首先要知道:电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之,在播放时则是把数字信号还原成模拟声音信号输出。

采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方--256,16位则代表2的16次方--64K。比较一下,一段相同的音乐信息,16位声卡能把它分为64K个精度单位进行处理,而8位声卡只能处理256个精度单位,造成了较大的信号损失,最终的采样效果自然是无法相提并论的。

◎ MP3压缩率:

由于压缩率与音质有关,以下表格仅供参考:

●码率:

码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒。

码率=采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WA V文件,它的数据速率则为44.1K×16×2 =1411.2 Kbps。我们常说128K的MP3,对应的WA V的参数,就是这个1411.2 Kbps。

MP3是由WA V经MPEG1 Layer3编码转换而成的,本身实际是一种有损压缩,但由于人耳的听力范围是从20HZ-20000HZ,压缩掉的部分在此范围之外,人耳基本感觉不出,但是人耳之外的某些器官能够感觉到这些振动,所以为了追求高保真效果,码率应是越高越好。MP3的码率只能从高至低转换,如192kbps>128kbps。若想获得码率更高的MP3,最好从原CD提取音轨再经WA V 转至MP3。

◎码率的几种表现形式:

VBR(Variable Bitrate Rate)动态比特率,也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式。使用这个方式时,你可以选择从最差音质/最大压缩比到最好音质/最低压缩比之间的种种过渡级数,在MP3文件编码之时,程序会尝试保持所选定的整个文件的品质,将选择适合音乐文件的不同部分的比特率来编码。主要优点是可以让整首歌都能大致达到我们的品质要求,缺点是编码时无法估计压缩出来的文件大小。

CBR(Constants Bitrate Rate)即常数比特率,就是静态(恒定)比特率的意思,CBR是一种固定采样率的压缩方式。当在一个带宽受限的信道中进行多媒体通讯的时候CBR是非常有用的,因为这时候受限的是最高码率,CBR可以更好的易用这样的信道。但是CBR不适合进行存储,因为CBR将导致没有足够的码率对复杂的内容部分进行编码(从而导致质量下降),同时在简单的内容部分会浪费一些码率。CBR优点是压缩快,能被大多数软件和设备支持,缺点是占用空间相对大,效果不十分理想,现已逐步被VBR的方式取代。

ABR(Average Bitrate Rate)平均比特率,是VBR的一种插值参数。Lame针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR也被称为“Safe VBR”,它是在指定的平均Bitrate内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量。举例来说,当指定用192kbps ABR对一段wav文件进行编码时,Lame会将该文件的85%用192kbps固定编码,然后对剩余15%进行动态优化:复杂部分用高于192kbps 来编码、简单部分用低于192kbps来编码。与192kbps CBR相比,192kbps ABR在文件大小上相差不多,音质却提高不少。ABR编码在速度上是VBR编码的2到3倍,在128-256kbps范围内质量要好于CBR。可以做为VBR和CBR的一种折衷选择。

●音频文件大小的计算:

音频编码率(Kbps为单位)×文件总长度(秒为单位)÷8 = 文件大小(MB 为单位)

例如CD即为未经压缩的音频文件,采样44.1k,16位,双声道。

音频编码率=44.1×16×2=1411Kbps÷1024=1.38Mbps,一般的MP3压缩后为128kbps

如果以一张CD放一个小时计算的话,CD总量=1.38×3600/8=621MB,当然CD大约放1小时多点,顶多也就700MB。

相关文档
最新文档