数字音频压缩原理.

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数字音频压缩原理

由于压缩编码过程是一个极其复杂的数学运算过程，一般读者不会对它们有兴趣。然而，用一些通俗易懂的文字来说明数字文件可以压缩而不丢失重要数据的基本概念，对理解还是有帮助的。

常见的PCM（Pulse code modulation，脉冲编码调制）可以将脉冲音频信号编码调制为数字格式。理论上讲，PCM可以将输入信号源的全部脉冲音频信号转换为数字信号，例如101011100100101100010111。在解码后再变为与输入信号源完全相同的脉冲音频信号，用于播出。

值得一提的是，现实中的编码调制并不是将输入信号源的全部脉冲音频信号转换为数字信号，而是通过不同的采样频率和量化精度，仅将输入信号源的部分脉冲音频信号转换为数字信号。在满足不同欣赏质量的前提下，尽量减少数字文件的体积。从这一点上讲，通过编码调制后的数字信号还原后是不可能恢复出与源脉冲音频信号完全相同的脉冲音频信号的。关于编码调制的采样频率和量化精度等，不是本文的重点，就不展开讲了。

常见的LPCM（Linear Pulse Code Modulation，线性脉冲编码调制）就是一种非压缩音频数字化技术。在普通CD，及其它各种要求高音频质量的场合中已经得到广泛的应用。其音频质量主要取决于编码调制时采样频率和量化精度。

但是，这种无压缩技术产生的数字文件还是很大的。难以存储在一些容量较小的存储设备中。

比如：电影光盘。在视频文件占用了大部分存储空间的情况下（视频质量越好，占用的空间越大），留给音频信号的空间就相当有限。因此，压缩技术就应运而生了。

之所以用“原理”二字，是因为常用的无损压缩技术实际执行过程是很复杂的。

去0法

任何电影的声轨都不可能总是有声音存在的，有些镜头是没有声音的。

假定一段声轨中有一半时间有声音，而另一半是完全没有声音。这声轨可能的数据流是10101110010100000 0000000。这些0反映了场景里寂静无声，但仍然要占用存储空间。使用无损压缩后，数据流中的0全部被丢弃，变成1_1_111__1_1____________。使所需占用的空间减少了很多。而在解码时，0会被解码技术填充进去，使数据流又恢复为101011100101000000000000。

短代长法

对出现频率高（重复出现）的数据串，用比较短的数据串代替。

例如，数据串101011100100101100010111在整个信号流中出现了N次，那么完全没有必要每次都完整地记录、存储这个数据串。而是仅用001来标记这个数据串N次，也就是只占据N个001的空间。在解码时，通过数据串代码表查询到001所对应的是101011100100101100010111，再把这个长数据串“填”到其原来的位置即可。这样就节省了很多的空间。

如果短代长法+去0法，那节省的空间就更多了。

复杂的压缩技术

当然，实际的音频数据流绝不可能那么简单，因此压缩算法就指导编码器对实际音频信号流进行实时分析，进行压缩处理。还有像如何将可变码流百分百地同步还原成恒定码流，或者加入音质控制体系等等。

可见，成为一种完整的音频格式，或者其采用的压缩音频算法，不仅仅像丢失0和简化重复那么简单。而是采取更复杂的统计模型来分析数据构成形式，再进行丢弃或不丢弃哪些数据的操作。

值得指出的是，都是无损压缩的话，不管压缩比（或数据流量、占用空间）大小如何，解码还原出来的音频信号就与不压缩时一模一样。

由此可见，无压缩和无损压缩解码还原出来的音频信号是一样的。没有孰优孰劣之分。

但是，对于有些存储设备来讲，无损压缩的数据流体积可能还是过大。那就不得退而求有损压缩了。

大家熟知的标准杜比数字和DD+声轨都是有损压缩格式。在压缩中不仅丢失0，也丢失一些被认为对人的听觉不敏感的1。

大量的实际测试表明，尽管丢弃了一些1，这些音频格式的品质也是相当优秀的（当然比不上无损压缩的）。

这种有损压缩之所以得到广泛应用，是因为过去的DVD容量有限，高清电视传输带宽的有限。

在高清电视领域，杜比数字和DD+技术由于其占用有限带宽却能提供品质相当高的多声道音频的特性而方兴未艾，已经成为全球高清电视的事实性标准。

随着蓝光光盘的普及，传输带宽的加大，以及存储设备的进步，有损压缩会逐步消亡。