音频压缩算法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第7章凌阳音频压缩算法261
第7章凌阳音频压缩算法
7.1背景介绍
7.1.1音频的概述(特点,分类)
我们所说的音频是指频率在20Hz~20kHz的声音信号,分为:波形声音,语音
和音乐三种,其中波形声音就是自然界中所有的声音,是声音数字化的基础.语音也
可以表示为波形声音,但波形声音表示不出语言,语音学的内涵.语音是对讲话声音
的一次抽象.是语言的载体,是人类社会特有的一种信息系统,是社会交际工具的符
号.音乐与语音相比更规范一些,是符号化了的声音.但音乐不能对所有的声音进行
符号化.乐谱是符号化声音的符号组,表示比单个符号更复杂的声音信息内容. 7.1.2数字音频的采样和量化
将模拟的(连续的)声音波形数字元化(离散化),以便利数字计算机进行处理
的过程,主要包括采样和量化两个方面.
数字音频的质量取决于:采样频率和量化位数这两个重要参数.此外,声道的数目,相应的音频设备也是影响音频质量的原因.
7.1.3音频格式的介绍
音频文件通常分为两类:声音文件和MIDI文件
(1)声音文件:指的是通过声音录入设备录制的原始声音,直接记录了真实声音
的二进制采样数据,通常文件较大;
(2)MIDI文件:它是一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设
备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件尺寸较小.
1)声音文件的格式
WAVE文件——*.WAV
WAVE文件使用三个参数来表示声音,它们是:采样位数,采样频率和声道数.
在计算机中采样位数一般有8位和16位两种,而采样频率一般有11025Hz(11KHz),
22050Hz(22KHz),44100Hz(44KHz)三种.我们以单声道为例,则一般WAVE文
件的比特率可达到88K~704Kbps.具体介绍如下:
(1)WAVE格式是Microsoft公司开发的一种声音文件格式,它符合RIFF(Resource InterchangeFileFormat)文件规范;
第7章凌阳音频压缩算法262
(2)用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持.
(3)WAVE格式支持MSADPCM,CCITTALaw,CCITTLaw和其它压缩算法,
支持多种音频位数,采样频率和声道,是PC机上最为流行的声音文件格式. (4)但其文件尺寸较大,多用于存储简短的声音片段.
AIFF文件——AIF/AIFF
(1)AIFF是音频交换文件格式(AudioInterchangeFileFormat)的英文缩写,是苹果计算机公司开发的一种声音文件格式;
(2)被Macintosh平台及其应用程序所支持,NetscapeNavigator浏览器中的LiveAudio也支持AIFF格式,SGI及其它专业音频软件包同样支持这种格式. (3)AIFF支持ACE2,ACE8,MAC3和MAC6压缩,支持16位44.1Kz立体声.
Audio文件——*.Audio
(1)Audio文件是SunMicrosystems公司推出的一种经过压缩的数字声音格式,是Internet中常用的声音文件格式;
(2)NetscapeNavigator浏览器中的LiveAudio也支持Audio格式的声音文件. MPEG文件——*.MP1/*.MP2/*.MP3
(1)MPEG是运动图像专家组(MovingPictureExpertsGroup)的英文缩写,代表MPEG标准中的音频部分,即MPEG音频层(MPEGAudioLayer);
(2)MPEG音频文件的压缩是一种有损压缩,根据压缩质量和编码复杂程度的不同可分为三层(MPEGAudioLayer1/2/3),分别对应MP1,MP2和MP3这三种声
音文件;
(3)MPEG音频编码具有很高的压缩率,MP1和MP2的压缩率分别为4:1和6:
1~8:1,而MP3的压缩率则高达10:1~12:1,也就是说一分钟CD音质的音
乐,未经压缩需要10MB存储空间,而经过MP3压缩编码后只有1MB左右,
同时其音质基本保持不失真,因此,目前使用最多的是MP3文件格式. RealAudio文件——*.RA/*.RM/*.RAM
(1)RealAudio文件是RealNerworks公司开发的一种新型流式音频(Streaming Audio)文件格式;
(2)它包含在RealMedia中,主要用于在低速的广域网上实时传输音频信息;
(3)网络连接速率不同,客户端所获得的声音质量也不尽相同:对于28.8Kbps的连
接,可以达到广播级的声音质量;如果拥有ISDN或更快的线路连接,则可获
得CD音质的声音.
2)MIDI文件——*.MID/*.RMI
(1)MIDI是乐器数字接口(MusicalInstrumentDigitalInterface)的英文缩写,是数
字音乐/电子合成乐器的统一国际标准;
(2)它定义了计算机音乐程序,合成器及其它电子设备交换音乐信号的方式,还规第7章凌阳音频压缩算法263
定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议,可用于为不同乐器创建数字声音,可以模拟大提琴,小提琴,钢琴等常见
乐器;
(3)在MIDI文件中,只包含产生某种声音的指令,这些指令包括使用什么MIDI 设备的音色,声音的强弱,声音持续多长时间等,计算机将这些指令发送给声
卡,声卡按照指令将声音合成出来,MIDI在重放时可以有不同的效果,这取
决于音乐合成器的质量;
(4)相对于保存真实采样资料的声音文件,MIDI文件显得更加紧凑,其文件尺寸通常比声音文件小得多.
7.1.4语音压缩编码基础
语音压缩编码中的数据量是指:数据量=(采样频率×量化位数)/8(字节数)×声道
数目.