高品质音乐文件基础知识(wav)

合集下载

WAV文件格式分析与详解

WAV文件格式分析与详解作者：王若钧何杉来源：《数字技术与应用》2014年第03期摘要：WAV文件格式信息是对WAV文件编程的重要依据。

揭开WAV文件格式的奥秘是开发功能强大的具有自主知识产权的语音处理软件的关键。

本文结合波形文件的基本知识，较系统地说明了WAV文件的存储原理、文件结构、WAV文件头格式、基于PCM编码的数据组织，内容全面、清楚、准确，还包含了一些新汇集的参数。

可作为开发人员的参考资料。

关键词：文件格式 WAV 编码声音中图分类号：TP311 文献标识码：A 文章编号：1007-9416（2014）03-0093-021 引言WAV文件是在PC机平台上很常见的、最经典的多媒体音频文件，最早于1991年8月出现在Windows 3.1操作系统上，文件扩展名为WAV，是WaveFom的简写，也称为波形文件，可直接存储声音波形，还原的波形曲线十分逼真。

WAV文件格式简称WAV格式是一种存储声音波形的数字音频格式，是由微软公司和IBM联合设计的，经过了多次修订，可用于Windows，Macintosh，Linix等多种操作系统，详述如下。

2 波形文件的基础知识2.1 波形文件的存储过程声源发出的声波通过话筒被转换成连续变化的电信号，经过放大、抗混叠滤波后，按固定的频率进行采样，每个样本是在一个采样周期内检测到的电信号幅度值；接下来将其由模拟电信号量化为由二进制数表示的积分值；最后编码并存储为音频流数据。

有的应用为了节省存储空间，存储前，还要对采样数据先进行压缩。

2.2 WAV文件的编码编码包括了两方面内容，一是按一定格式存储数据，二是采用一定的算法压缩数据。

WAV格式对音频流的编码没有硬性规定，支持非压缩的PCM（Puls Code Modulation）脉冲编码调制格式，还支持压缩型的微软自适应差分脉冲编码调制Microsoft ADPCM（Adaptive Differential Puls Code Modulation）、国际电报联盟（International Telegraph Union）制定的语音压缩标准ITU G.711 a-law、ITU G.711-law、IMA ADPCM、ITU G.723 ADPCM （Yamaha）、GSM 6.10、ITU G.721 ADPCM编码和其它压缩算法。

wav音频文件的内部结构

wav音频文件的内部结构wav音频文件是一种无损的音频文件，相对于MP3来说音质较好，当然文件大小也很大。

A WAVE file is often just a RIFF file with a single “WAVE” chunk which consists of two sub-chunks –a “fmt ” chunk specifying the data format and a “data” chunk containing the actual sample data. Call this form the “Canonical form”其文件的内部格式如下：用表格统计各个部分的含义如下：一个简单的示例如下所示：chunk 结构typedef struct waveChunk {unsigned int chunkID; //RIFFunsigned int chunksize; //存储整个文件的文字数unsigned int WaveID; //WAVE}WAVE;typedef struct tWAVEFORMATEX {short wFormatTag; // format typeshort nChannels; // number of channels (i.e. mono, stereo...) unsigned int nSamplesPerSec; // sample rateunsigned int nAvgBytesPerSec; // for buffer estimationshort nBlockAlign; // block size of datashort wBitsPerSample; // number of bits per sample of mono datashort cbSize; // the count in bytes of the size of/* extra information (after cbSize) */} WAVEFORMATEX, *PWAVEFORMATEX;typedef struct dataChunk {unsigned int Subchunk2ID; //dataunsigned int Subchunk2size; //data sizeunsigned char *data; //data}WAVE;Q&A8bit/16 bit 样值的二进制编码表示一样吗？现有的wav支持哪几种音频编码方法？data format在数据域中除了单声道-量化位数为8音频数据之外PCM存储格式按照补码的形式存放。

多媒体音频格式解析WMA WAV OGG AAC APE FLAC

多媒体音频格式解析WMA WA V OGG AAC APE FLAC[转载] 收藏首先博士像先讲一讲何谓“真人真唱”铃声－－我们有时候会看到，手机说明明明写着真人真唱，而且手机的营业员也这么说，我们很高兴买回去后，发现却不能播放MP3！其实，这是因为了解不足所产生的误会，所谓的真人真唱，通常指的是使用日AMAHA声音芯片的手机，使用MMF可以有短暂的人声和动物声的逼真模拟，而并不是专指MP3，而且不只MP3能支持唱整首歌，WA V、AAC、WMA等很多种文件格式也支持。

首先博士像先讲一讲何谓“真人真唱”铃声－－我们有时候会看到，手机说明明明写着真人真唱，而且手机的营业员也这么说，我们很高兴买回去后，发现却不能播放MP3！其实，这是因为了解不足所产生的误会，所谓的真人真唱，通常指的是使用日AMAHA声音芯片的手机，使用MMF可以有短暂的人声和动物声的逼真模拟，而并不是专指MP3，而且不只MP3能支持唱整首歌，WAV、AAC、WMA等很多种文件格式也支持。

MP3：MP3是利用一种音频压缩技术，由于这种压缩方式的全称叫MPEG Audio Layer3，所以人们把它简称为MP3。

因为人耳只能听到一定频段内的声音，而其他更高或更低频率的声音对人耳是没有用处的，所以MP3技术就把这部分声音去掉了，从而使得文件体积大为缩小，但在人耳听起来却并没有什么失真。

MP3可以将声音用1∶10甚至1∶12的压缩率进行压缩，举个例子一般来说一张光碟容量为650M，作为CD它能容纳的不过是60到90分钟的音乐（15 首左右的歌曲），一首5分钟的歌曲要占用50M左右的空间，而一首5分钟的MP3歌曲体积只有4～5M，一张光碟能放上一百多收首MP3歌曲。

MP3的体积小，音质却非常接近CD，是一种很不错的音乐文件格式。

单音铃声：九十年代中后期，随着移动通讯由模拟网络发展到数字网络，音乐铃声开始出现了，这种铃声是通过专用的“可编程铃声电路”产生音乐信号，再通过扬声器或听筒来发出音乐的，但这种铃声虽然有音调的变化，但无法表现出自然界声音的音色和发音过程，因而无法模拟出乐器的真实效果。

影响音频质量的几种重要的参数

影响音频质量的几种重要的参数影响音频质量的几种重要的参数（一）采样率:这是音频当中比较重要的技术参数。

也就是采集音频的时候的上限频率。

人们所能听到的频率在22khz左右，在此上的声音人是听不到的，大家都知道，乐器发出的声音是机械震动，其中一些严重超出这个范围的频率。

为了保证音频不是真，一般的采样率在44.1khz，也就是说比我们可以听到的声音频率超过一倍左右。

这样就保证了音乐的保真程度。

还有一些比较次的就采用22khz的采样率，刚好是我们的耳朵不能听到的声音的范围。

这里要注意一点：人类的声带能发出的最高频率在3.2khz左右，所以一般来说只要采样率超过了8khz，那么语音的音质就足够好了。

（二）码率数这是衡量音质的重要标准。

表示一秒钟的数据流流量，单位是kbps，这个单位中要注意：p是英文per的缩写，也就是表示kb每秒。

b是位的单位，是计算机中最小的度量单位，表示一个二进制数。

1kb=1000b。

这里注意一下与字节B之间的区别，一个字节相当于8b。

显然在同一种压缩格式的状态下，码率越大，音质的保真程度就越高。

但是这种关系绝不是简单的正比例关系。

而是根据压缩算法而不同。

（三）声道数现在一般用的有单声道和立体声，立体声的录制机制是在演唱现场，用两个录音器分别在左右录制，然后数字化刻录。

在放音时也是两个音箱分别发音左右两个录音器录制的声音，所以会显得啷个音箱在发音是略微有差别，以此达到有立体感的目的。

这时由于左右的声音在储存时是分开的，比单声道的文件大小要大一倍。

对于采样机制有些了解之后，再介绍一下典型的几种音频格式（一）wav这个音乐格式是最原始的波形文件，是没有经过任何压缩处理的文件。

一般的播放器，手机，MP3都支持的格式。

但是这种格式的文件之大，是让人难以接受的，一般的3分钟左右的歌曲就要达到50M 左右，使得储存特别麻烦，占据的空间最大。

如果对于wav格式的音频不改成其他的格式，直接压缩，音质会变得相当差。

WAV文件格式相关资料集

endianFile offset (bytes)Field Size (bytes)播放软件利用此值可以估描述WAVE文件的基本单元是“sample”，一个sample 代表采样一次得到的数据。

因此如果用44KHz采样，将在一秒中得到44000个sample。

每个sample可以用8位、24位，甚至32位表示（位数没有限制，只要是8的整数倍即可），位数越高，音频质量越好。

其数值不确定,取决于编码格1（WAVE_FORMAT_PCM）; 编码格通道数，单声道为1，双声采样频率（每秒样本数）常用的采样频率有11025,每秒数据量；其值为：通道数×每数据块的调整数（按字节算的），如果有多个声道，对每个声道而言，样“RIFF”大写字符串"RIFF",标明该“WAVE”;WAVE 标志所有WAV格式的文件此处为字符串“fmt ”播放软件需要一次处理多个该值大小每样本的数据位数，表示每个对于PCM文件为16。

指除前8字节的fmt标志，最后一位为空littlefield name4biglittlelittle littlelittlelittlelittlelittle……biglittlebigbiglittle224224444442文件长度从下一个字段首地址开始到文件末尾的对基本格式块的扩充部分，根据AudioFormat 有所不同。

“data”数据标记符语音数据大实际的声音此处有一个值得注意的细节，8位代表无符号的数值，而16位或16位以上代表有符号的数值。

例如，如果有一个10bit的样本，由于sample位数要求是8的倍数，我们就需要把它填充到16位。

16位中：0-5位补0，6-15位是原始的10bit数据。

这就是左补零对齐原则上述只是单声道，如果要处理多声道，就需要在任意给定时刻给出多个sameple。

例如，在多声道中，给出某一时刻，我们需要分辨出哪些sample是左声道的，哪些sample是右声道的。

数字音频基础知识

MID文件主要用于原始乐器作品，流行歌曲的业余表演，游戏音轨以及电子贺卡等。＊.mid文件重放的效果完全依赖声卡的档次。
数字音频专业知识
WMA格式——最具实力的敌人
WMA (Windows Media Audio) 由微软开发。音质要强于MP3格式，更远胜于RA格式，它以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的，WMA的压缩率一般都可以达到1：18左右。
低音：音色深沉浑厚，擅于表现庄严雄伟和苍劲沉着的感情。（鼓声）
声音基础知识
响度（loudness ）响度：又称音量、音强，指人主观上感觉声音的
大小，由―振幅（amplitude）和人离声源的距离决定，振幅越大响度越大，人和声源的距离越小，响度越大。（单位：分贝dB）
声音基础知识
音色（music quality）音色：又称音品，由发声物体本身材料、结构决定。每个人讲话的声音以及钢琴、提琴、笛子等各种乐器所发出的不同声音，都是由音色不同造成的。
数字音频专业知识
3.6 常见的数字音频文件格式常见的数字音频文件格式有很多，每种格式都有自己的优
点、缺点及适用范围。 CD格式——天籁之音 CD音轨文件的后缀名为：cda 标准CD格式是的采样频率，速率88K/秒，16位量化位
数，近似无损的。 CD光盘可以在CD唱机中播放，也能用电脑里的各种播放
特点：音质好，压缩比比较高，被大量软件和硬件支持，应用广泛。
适用于：适合用于一般的以及比较高要求的音乐欣赏。
数字音频专业知识
MIDI——作曲家的最爱
MIDI（Musical Instrument Digital Interface）乐器数字接口 MIDI数据不是数字的音频波形，而是音乐代码或称电子乐谱。MIDI文件每存1分钟的音乐只用大约5～ 10KB。

被遗忘的时光wav格式

被遗忘的时光wav格式随着科技进步的不断加快，我们与周围世界的交流日益频繁，尤其是在数字娱乐领域，各种高清、流畅的视频、音频体验让人目不暇接。

但是，有些奇妙的体验只可以被保存在具有某种特殊格式的文件中，比如wav格式。

wav格式被广泛用于数字音频存储，但它远远不止于此。

以下是本篇文章的重点：1. 被遗忘的时光wav（Waveform Audio File Format，波形音频文件格式）格式是一种标准化的、未压缩的音频文件格式。

这种格式使用PCM采样，并且通常采用44.1kHz采样率及16位的采样深度。

wav格式最初由IBM和微软共同开发，现在已成为数字音频领域中最常见的格式之一。

当我们回顾过去时，wav格式似乎已经陪伴了我们很长时间。

1991年，wav格式基本上已成为计算机上嵌入式、CD-ROM和互联网上音频的标准格式。

在这段时间里，wav格式已经确立了它被广泛认可的位置，并在运用领域拓展了许多新的技术领域。

2. Wav格式在音乐领域的重要性Wav格式成为了音乐领域主流的音频格式之一。

在复古的录音机和万花筒内部的信息记录方式中，也可以找到wav格式的影子。

对于一些音乐制作人员而言，wav格式可能是他们最爱的格式。

它可以提供无损旋转任何样式的音频文件，也适合自然环境记录和播放。

在今天，虽然数码播放器和云音乐变成了主流，但高音质音乐的发展是wav格式的显著标志之一。

wav格式虽然占用空间较大，但在保证音质的前提下，它的播放效果却是最为优秀的，这也是我个人最钟爱wav格式的原因。

3. Wav格式在电脑领域的闪光点通常来说，Wav格式具有非常好的兼容性。

它可以在几乎任何设备上运行，包括PC、Mac、智能手机、平板电脑等等。

如果您正在寻找高清声音或原始录音的无损格式，wav是绝佳的选择。

另外，wav格式也是一种开放和可编程的文件格式。

这意味着任何人都可以利用标准的格式和编码器开发自己的软件和应用程序。

它也支持与其他格式的无缝互操作性，这使得它成为数字音频处理的一个重要平台。

常见音频格式、一些有关音乐、CD的几个概念

常见音频格式、一些有关音乐、CD的几个概念常见音频格式、一些有关音乐、CD的几个概念2011年09月08日重要提醒：系统检测到您的帐号可能存在被盗风险，请尽快查看风险提示，并立即修改密码。

| 关闭网易博客安全提醒：系统检测到您当前密码的安全性较低，为了您的账号安全，建议您适时修改密码立即修改 | 关闭常见音频格式、一些有关音乐、CD的几个概念2011-09-08 20:48:54| 分类：音乐Help| 标签：|字号大中小订阅一、音乐格式:1、WAV格式 WAV格式是微软公司开发的一种声音文件格式，也叫波形声音文件，是最早的数字音频格式，WAV格式支持许多压缩算法，支持多种音频位数、采样频率和声道，采用44.1kHz的采样频率，16位量化位数，因此WAV的音质与CD相差无几，但WAV格式对存储空间需求太大不便于交流和传播。

WAV来源于对声音模拟波形的采样。

用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点，以不同的量化位数（8位或16位）把这些采样点的值转换成二进制数，然后存入磁盘，这就产生了声音的WAV文件，即波形文件。

补充：无损格式，缺点：体积十分大！2、MP3格式MP3的全称是Moving Picture Experts Group Audio Layer III。

简单的说，MP3就是一种音频压缩技术，由于这种压缩方式的全称叫MPEG Audio Layer3，所以人们把它简称为MP3。

MP3是利用 MPEG Audio Layer 3 的技术，将音乐以1:10 甚至 1:12 的压缩率，压缩成容量较小的file，换句话说，能够在音质丢失很小的情况下把文件压缩到更小的程度。

而且还非常好的保持了原来的音质。

正是因为MP3体积小，音质高的特点使得MP3格式几乎成为网上音乐的代名词。

每分钟音乐的MP3格式只有1MB左右大小，这样每首歌的大小只有3-4兆字节。

使用MP3播放器对MP3文件进行实时的解压缩(解码)，这样，高品质的MP3音乐就播放出来了。

高保真音乐文件有哪些格式

高保真音乐文件有哪些格式高保真音乐文件有哪些格式2010-11-15 19：51一般来说，有APE、WAV、FLAC以及DTS格式。

一、WAV格式WAV为微软公司(Microsoft)开发的一种声音文件格式，它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持，该格式也支持MSADPCM，CCITT ALAW等多种压缩运算法，支持多种音频数字，取样频率和声道，标准格式化的WAV文件和CD格式一样，也是44.1K的取样频率，16位量化数字，因此在声音文件质量和CD相差无几！WAV打开工具是WINDOWS的媒体播放器。

(千千静听也可播放WAV音乐文件)。

通常使用三个参数来表示声音：量化位数、取样频率和声道数。

声道有单声道和立体声之分，取样频率一般有11025Hz(11kHz)，22050Hz(22kHz)和44100Hz(44kHz)三种，不过尽管音质出色，但在压缩后的文件体积过大！相对其他音频格式而言是一个缺点，其文件大小的计算方式为：WAV格式文件所占容量=(取样频率X量化位数X声道)X时间/8(字节=8bit)目前支持WAV设计的手机主要为智能手机，如索尼爱立信P910和诺基亚N90以及采用微软OS的多普达等手机，而其它一些非智能手机的产品，如果宣传支持WAV格式则多半属于只是支持单声道的。

二、APE格式APE是目前流行的数字音乐文件格式之一。

与MP3这类有损压缩方式不同，APE是一种无损压缩音频技术，也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后，你还可以再将APE格式的文件还原，而还原后的音频文件与压缩前的一模一样，没有任何损失。

APE的文件大小大概为CD的一半，但是随着宽带的普及，APE格式受到了许多音乐爱好者的喜爱，特别是对于希望通过网络传输音频CD的朋友来说，APE可以帮助他们节约大量的资源。

WAV、APE、FLAC、CD的区别和联系

WAV、APE、FLAC、CD的区别和联系很多人并不是非常清楚无损音乐和无损格式的。

1、无损音乐，是指对声音文件（母文件）进行无损压缩所得到的音乐文件，它在音质方面，与母文件是完全一样的，是母文件的一个完整数字拷贝。

2、MP3、WMA、OGG等为有损压缩音乐文件格式。

之所以进行有损压缩，主要是在不过度损害音质的前提下获得较小的体积，以便于网络传输和存放。

有损音乐一般以切割掉人耳听力范围之外的数字信息为主，当然为了追求小体积，也存在着大量削弱音质的音乐文件。

3、无损能够在100%保存原文件的所有数据的前提下，将音频文件的体积压缩到更小，而将压缩后的音频文件还原后，能够实现与源文件相同的大小、相同的码率。

4、目前常见的、主流的无损压缩格式目前有APE、FLAC、WAV，此外还有WavPack、LPAC、WMALossless、AppleLossless、TTA、Tak、La、OptimFROG、Shorten等。

5、严格来说，wav波形文件是音乐CD碟片的数字记录，是音乐由物理介质（CD碟）转换为数字形式所得到的声音文件；而APE、FLAC、WavPack、WMALossless等则是对WAV 波形文件进行无损压缩，即再加工得到。

所以，wav是无损音乐文件，而APE、FLAC等则是无损压缩音乐文件。

WAV波形文件在媒体播放器里直接播放，而APE等其他压缩格式则需要经过解压（解码）还原成WAV再进行播放。

APE、FLAC、WAV与CD碟的区别与联系：CD碟与APE、FLAC、WAV只是存储介质不同。

CD碟片直接从录音棚灌注而成，以物理碟片形式存在，不同的录音设备和灌注技术决定了CD碟的音质，比如现在的碟片好于过去的碟片，德国黑胶碟优于国内一般唱片公司发行的碟片；APE、FLAC、WAV都是将CD碟物理存储改为数字化存储，只要抓轨正确，一般均能实现100%的数据拷贝，音乐信息完全一样。

不同在于，WAV格式是抓轨直接得到的文件，数据庞大，但可以在任何媒体播放器上直接播放；为了减少占用空间，就出现了无损压缩格式APE和FLAC。

Wav目前最通用的格式,音质好,但是文件较大Mp3目

声音的格式
Wav：目前最通用的格式，音质好，但是文件较大 Mp3：目前互联网上音乐的主流，文件小，CD级的音质 Midi：利用数字化乐器制作的声音，主要用于乐曲的播放，文件非常小
一、MIDI是乐器数字接口 (Musical Instrument Digital Interface) 二、声音波形文件(WAV) 三、MPEC音频文件（MP1/MP2/MP3）四、流式音频：Windows Media Audio(WMA) 五、流式音频：RealMedia(RA/RM/RAM) 六、流式音频：QuickTime(MOV) 七、CD-DA：最常见的CD音轨格式。在CD机和电脑上都能正常播放。
声音编辑处理软件
GoldWave
数字音乐编辑器
录制声音
录制开始后变为
，单击，停止
播放快退
快放
别忘了保存声音文件哦！！
练习1：
录一段声音。
编辑声音
第一步：选择波形
• 左单击，设置开始位置 • 右单击，设置结束位置
选中区域
改变显示比例便于精确选择*（ “查看”菜单）
简单编辑
复制 1. 复制： 2. 选择插入点：在波形图上左单击 3. 粘贴：
三、VCD声音
用超级解霸的“声音解霸/控制/播放并且录音”生成WAV文件，或把MP3 转换为wav文件；
四、网上下载MP3等五、声音软件
Sound Forge：全套的音频处理，工具和效果制作等功能，双声道音频编辑器 Cool Edit：数字声音的制作/编辑软件，支持多种格式之间的转换 GoldWave：数码录音及编辑软件 Cake Walk：制作音频和音乐，音乐作曲工具
变量数值指：控制要加入的声音音量，越大（%），加入的声音越大。

流行无损音乐格式介绍

流行无损音乐格式介绍无损音乐格式是指音频文件在压缩过程中不会丢失任何音频数据的文件格式。

与有损音乐格式相比，无损音乐格式可以提供更高质量的音频，但同时也需要更大的存储空间。

在一项有损压缩算法中，音频文件会根据一些原则和规则丢弃一些不重要或听觉上不明显的音频数据，从而减小文件的大小。

这种压缩方法可以有效地减小音频文件的大小，但它也会导致音质的损失。

而无损音乐格式则采用了不同的压缩算法，它们能够以更高的压缩比不丢失音频数据的情况下，减小音频文件的大小。

下面介绍几种常见的无损音乐格式：1. WAV（Waveform Audio File Format）WAV是一种容器格式，它可以存储以线性脉冲调制（PCM）编码的无损音频。

PCM编码将音频信号直接转换为数字数据，因此它保留了音频中的所有信息。

由于PCM编码占用大量存储空间，所以WAV文件通常较大。

2. FLAC（Free Lossless Audio Codec）FLAC是一种无损压缩格式，它可以将音频文件压缩到原始文件大小的50%至70%左右。

与WAV相比，FLAC文件更小，但仍然保留了音频文件的完整信息。

FLAC是一种开放源代码格式，并得到了广泛的应用。

3. ALAC（Apple Lossless Audio Codec）ALAC是苹果公司开发的无损音乐编码格式。

它与FLAC类似，可以提供与原始音频相同的音质，但ALAC在苹果设备上有更好的兼容性。

虽然ALAC文件大小较大，但它可以在苹果音乐播放器和流媒体设备上实现高质量的音频播放。

4. APE（Monkey's Audio）APE是一种无损压缩格式，由Monkey's Audio开发。

与FLAC和ALAC 类似，APE可以将音频文件压缩到原始文件大小的50%至70%左右。

APE文件通常具有更高的压缩比和更快的解压速度，但由于其私有性和较少的兼容性，它在市场上的使用较为有限。

5. WMA Lossless（Windows Media Audio Lossless）WMA Lossless是微软公司开发的一种无损音频格式。

几种常见无损音频格式

几种常见无损音频格式Wav格式WAV为微软公司（Microsoft)开发的一种声音文件格式，用于保存Windows平台的音频信息资源，该格式也支持MSADPCM，CCITT A LAW等多种压缩运算法，支持多种音频数字，取样频率和声道，标准格式化的WAV文件和CD格式一样，也是44.1K的取样频率，16位量化数字。

WAV音频格式的优点包括：简单的编/解码（几乎直接存储来自模/数转换器（ADC）的信号）、普遍的认同/支持以及无损耗存储。

常见的WAV文件使用PCM无压缩编码，这使WAV文件的质量极高，体积也出奇大，对于PCM WAV，恐怕也只有无损压缩的音频（例如ape和flac）才能和其有相同的质量，平时我们常见的mp3（即使码率为320kbps）,wma和wav的质量都差很远！Ape格式WAV作为数字音乐文件格式的标准，因格式容量过大，使用起来很不方便。

因此，一般情况下我们把它压缩为MP3或APE格式。

压缩方法分为无损压缩（常见的有.ape和.flac），有损压缩（常见的有.mp3），以及混成压缩（常见的有.mpeg）。

常见的MP3格式从压缩的状态还原回去的话，势必会产生损失。

然而APE格式能毫无损失地保留原有音质。

并且把APE还原成原来的WAV格式时，与原文件的MD5值不变。

APE的本质，其实它是一种无损压缩音频格式。

减小文件体积的同时，得到的文件与压缩前的源文件完全一致。

所以APE被誉为“无损音频压缩格式”，APE音频文件是可以直接被播放的。

目前市面上常见的主流播放器均支持ape格式的播放，例如foobar2000，千千静听等。

Flac格式FLAC与MP3相仿，都是音频压缩编码，但FLAC是无损压缩，也就是说音频以FLAC编码压缩后不会丢失任何信息，将FLAC文件还原为WAV文件后，与压缩前的WAV文件内容相同。

可以使用播放器(如千千静听等市面主流播放器)直接播放FLAC 压缩的文件，就象通常播放你的MP3文件一样。

研究音频的本质,详解各种音频格式的区别

研究音频的本质，详解各个音频格式的区别总共分为6个部分，分别是wav格式的介绍，有损格式的介绍，无损压缩格式的介绍，各音频格式的频谱分析，以及基于分析在音频文件选择上做的推荐，后添加有损压缩格式的比较。

1.wav音频格式的三大参数，及各参数对于音频文件的含义wav文件有4个参数，分别是采样频率，声道数，量化位数，以及码率共4个而这4个参数里最好理解的就是声道数，所以不对此参数进行介绍那么我将要介绍的参数就是采样频率F，量化位数B，和码率R采样频率在三个参数里面最重要的是采样频率，后面两个参数都是基于在传输存储过程中根据要求而得到的，唯独采样频率，它是把模拟世界的信号带到数字世界的桥梁。

在讲采样频率前，我们可以先回忆一下我们初中时学抛物线时的情景。

在初中时，老师教我们画抛物线时，是用什么方法画的？？如果大家回想起来的话，就应该记得，是5点法。

是的，用5个点就可以近似的把抛物线给画出来。

音频信号是啥呢？其实是余弦波，只是这个余弦波的频率和幅值都是随时间的变量而已。

我们要对这个音频信号进行记录，不可能把每一时刻的值都记录，但是，我们可以参考画抛物线的方法，用尽量少的点去精确的描绘这个音频信号。

而采样频率，它干的就是这个活，也就是一秒内我们要记录这个音频信号多少个点，就能近似精确的表达这个音频信号。

在信号处理，有这么一个定理，叫奈奎斯特定理。

这个定理怎么得来，你们不用知道，这个是信号处理专业的人才需要知道。

我们只需了解的是，这个定理它告诉我们，如果我们要精确的记录一个信号，我们的采样频率必须大于等于音频信号的最大频率的两倍，记住，是最大频率。

也就是F>=2*fmax。

而在wav格式里，F=44.1kHz。

我们知道，人耳的听音频率范围是20-20kHz，也就是说，如果我们要精确记录这个音频信号，采样频率最低起码是40kHz。

这就是为啥是44.1kHz而不是其他的频率。

量化位数虽然有了采样频率，我们可以精确记录音频信号，然而，这些记录过的音频信号是模拟量，对于计算机而言，是无法处理的。

wav是什么格式

wav是什么格式wav是一种音频文件格式，它被广泛用于存储音频数据。

在本文中，我们将深入探讨wav文件格式的定义、结构、优点和用途。

首先，我们需要了解wav文件是如何定义的。

WAV是“Waveform Audio File Format”的缩写，它是由微软和IBM联合开发的一种无压缩音频文件格式。

这种格式最初是为Windows操作系统设计的，但现在已成为多个操作系统上通用的标准音频文件格式。

wav文件有一些特点。

它是一种无损压缩的音频格式，这意味着它可以完全还原原始录音的声音细节。

它支持多种音频解析度和采样频率，并且不会导致声音质量的损失。

此外，wav文件可以存储单声道或立体声音频。

让我们深入了解wav文件的结构。

一个wav文件由多个区块组成，每个区块都有特定的功能。

以下是常见的wav文件区块：1. RIFF头（RIFF Chunk）：该区块指定文件的类型，并存储了文件整体大小的信息。

2. 格式信息（Format Chunk）：该区块包含了音频数据的格式信息，如采样频率、通道数和采样深度等。

3. 数据区块（Data Chunk）：该区块存储了实际的音频数据。

此外，wav文件还可以包含其他附加信息的区块，如扩展信息（Chunk Extension），标签信息（Cue Chunk）和循环信息（Loop Chunk）等。

这些区块提供了更多关于音频文件的信息和元数据。

wav文件的优点之一是广泛的兼容性。

几乎所有的音频编辑和处理软件都支持wav文件格式。

它可以在多个平台和操作系统上无缝播放和处理，而不需要进行特殊的转换或解码。

此外，wav文件还提供了高质量的音频录制和编辑功能。

由于它是一种无压缩格式，可以保留音频的原始质量，不会引入任何失真或压缩伪像。

这使得wav文件非常适合专业音频录制和后期制作，如音乐制作、电影制作和广播等。

wav文件的用途非常广泛。

它可以用于存储和传输音乐、语音、环境声音等各种类型的音频数据。

WAV文件格式说明

1. 音频简介经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;当然也可以有 16bit 的单声道或 8bit 的立体声, 等等。

采样率是指：声音信号在“模→数”转换过程中单位时间内采样的次数。

采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件，采样数据为八位的短整数（short int 00H-FFH）；而对于双声道立体声声音文件，每次采样数据为一个16位的整数（int），高八位(左声道)和低八位(右声道)分别代表两个声道。

人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。

这和电影的每秒 24 帧图片的道理差不多。

每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个wav 文件的播放长度。

譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是"22050HZ / 16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到),那么它的每秒的传输速率(位速, 也叫比特率、取样率)是 22050*16*2 = 705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒), 播放时间：424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。

WAV文件格式分析详解

WAV文件格式分析详解WAV是一种非常常见的音频文件格式，它被广泛用于存储音乐、录音和其他音频数据。

以下是对WAV文件格式的详细分析：1.WAV文件的基本结构：-WAV文件是由一系列音频样本组成的。

每个样本表示一个特定时刻的音频振幅值。

- WAV文件以RIFF（Resource Interchange File Format）文件标识符开头。

- WAV文件由多个子块（chunk）组成，每个子块包含特定类型的数据。

- 子块包括文件头（"fmt "）块，音频数据（"data"）块和其他可选的附加块。

2. 文件头（"fmt "块）：-文件头描述了WAV文件的格式和属性。

-文件头包含了采样率、音频通道数、样本大小（位数）等信息。

-附加块（可选）可能包含其他的扩展信息，如压缩格式、块对齐等。

3. 音频数据（"data"块）：-音频数据块是WAV文件中实际存储音频样本值的部分。

- 它以一个子块标识符（"data"）开头，紧随其后的是存储音频样本的二进制数据。

4.WAV文件属性：-采样率：表示每秒播放的样本数，常用的有44.1kHz（CD音质）和48kHz（DVD音质）。

- 音频通道数：表示同时播放的声道数，常见的有单声道（Mono）和立体声（Stereo）。

-样本大小：表示每个样本的位数，常用的有8位、16位和24位。

-比特率：表示每秒传输的位数，由采样率、样本大小和通道数决定。

-块对齐：表示每个子块的字节数，为样本大小×通道数。

5.WAV文件的优点和应用：-WAV文件具有较高的音质，因为它是无损压缩的。

-WAV文件是一种开放的标准，可以在不同的操作系统和平台上使用。

-WAV文件适用于存储和传输音频数据，如音乐、录音、语音等。

综上所述，WAV文件格式是一种常见的音频文件格式，它以RIFF文件标识符开始，由文件头、音频数据和附加块组成。

APE、DTS、WAV、FLAC、MP3+常见音乐格式详解

APE、DTS、WAV、FLAC、MP3 常见音乐格式详解什么是dts音乐DTS是“Digital Theatre System”的缩写，是“数字化影院系统”的意思，DTS总公司位于美国加州的洛杉矾。

公司主要架构分为两大部分，一部分是以电影音乐的录音现场及电影院的编、解码为主的专业用“数字影院系统”，另一部分是以家庭用解码器的开发及DVD/LD/CD等套装软件为主的消费电子用“DTS技术”两大部份。

DTS公司推出了多种声场技术，其中DTS Digital Surround是最广为流传的一种，属于5.1声道系统，人们通常说的DTS技术，或者DTS环绕，一般就是指DTS Digital Surround。

DTS采用CAC(Coherent Acoustics Coding，相干声学编码)方式工作，和Dolby Digital一样也属于利用心理声学原理来对声轨进行编码的有损的数字压缩技术。

在电影院中，DTS的声迹录音采取了特殊的声画分离的数字立体声，数字声迹录在光盘上，由专用的光盘驱动器读取，另外在拷贝的模拟声迹与画幅之间录有时间同步码，用来控制光驱还音与画面的同步。

DTS分左、中、右、左环绕、右环绕5个声道，加上低音声道组成5.1声道，这一点和杜比数字相同。

但DTS在DVD中标准的数据流量为1536kbps，而Dolby Digital的数据流量是384Kbps,448Kbps，最高可提升到640Kbps，显然相比之下DTS具体更高的数据流量，也就具有更低的数字压缩比。

数据压缩比越低，占用的记录空间越大，但其重放音质就有可能越好，加之DTS采取高比特、高取样率等措施，使之对原音重现的追求上就更进了一步，因此DTS被很多人认为比Dolby Digital具体更好的效果。

DTS技术开发出来以后，一在电影界公布，马上受到大导演斯皮尔伯格和环球影业公司的高度重视，得到斯皮尔伯格大力支持，并率先在大型科幻电影“侏罗纪公园”中尝试采用DTS技术。

流行无损音乐格式介绍

流行无损音乐格式介绍无损音乐格式———WAVWAV(Wave Audio Files)格式是微软公司开发的一种声音文件格式，也叫波形声音文件，是最早的数字音频格式，被Windows平台及其应用程序广泛支持。

WAV格式支持许多压缩算法，支持多种音频位数、采样频率和声道，采用44.1kHz的采样频率，16位(或8位)量化位数，因此WAV的音质与CD相差无几，但WAV格式对存储空间需求太大，不便于交流和传播。

D上的音乐在 windows中是不能够直接认出的，无法直接拷贝到硬盘中(其它的格式windows是可以认识的，比如数据文件、VCD、DVD等，惟独CD不行)。

所以，为了把CD上的歌曲拷贝到硬盘中，需要专门的软件实现，这个过程叫做抓轨。

有很多软件可以实现这个功能。

最常见的、大家认为最好的，就是EAC(EAC.exe)，经过抓轨出来的音乐以WAV 格式保留在硬盘中。

当把CD上的音乐抓轨后，这个原始文件(WAV)很大(一盘CD上的音乐，约700M左右)，如果把它分离成单首歌曲，那每个文件的大小约20到60M。

这样大的文件既占用硬盘空间，也不适合在网上传播。

所以，通常要把这个原始的大文件进行压缩。

其压缩方式有多种，可以分为两大类。

一类是没有损失的压缩，比如用猴子(Monkeys Audio.exe)就可以实现，它可以把、原始的音WAV文件压缩到原来大小的50——60%，文件格式是APE。

(可能就是免费高效的猴子捧红了ape) 。

另外一类压缩方式是有损失的压缩，能把文件压缩得更小，可以比ape文件还要小1半以上，常见的音乐有损压缩形式就是MP3。

但缺点明显：声音质量下降，文件越小，质量越差。

越来越多的人选择APE格式，网络传播是功不可灭的，众多的音乐发烧友在网上交流APE格式音乐，在百度搜索“APE音乐下载”约有916,000个相关网页，且数量每日俱增。

而只要安装一些流行的影音播放软件，就可以直接对APE进行播放。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

高品质音乐文件基础知识(wav)序：如果是播放器，最好是将DTS CD、DTS DVD Audio、DSD编码的SACD音乐等转换成PCM DVD Audio编码来播放，效果较佳。

1.常见编码音乐文件属性：1.1.MP3文件枚举编码：MPEG 1 Layer 3声道[声音数]：立体声频率[采样频率]：44100 Hz比特[量化位数]：16 Bits码率[比特率]：128 Kbps/320 Kbps1.2.APE/.cue文件枚举编码：Monkey's Audio 3.99声道[声音数]：5.1声道频率[采样频率]：44100 Hz比特[量化位数]：16 Bits码率[比特率]：728 Kbps/769 Kbps/789 Kbps/790 Kbps/826 Kbps1.3.FLAC/.cue文件枚举编码：FLAC Audio声道[声音数]：立体声频率[采样频率]：44100 Hz比特[量化位数]：16 Bits码率[比特率]：872 Kbps/920 Kbps/936 Kbps/1.01 Mbps1.4.WAV文件枚举编码：DVD DTS Audio声道[声音数]：5.1声道频率[采样频率]：44100 Hz比特[量化位数]：16 Bits码率[比特率]：1.41 Mbps1.5.WAV/.cue文件枚举编码：PCM Audio声道[声音数]：立体声频率[采样频率]：44100 Hz比特[量化位数]：16 Bits码率[比特率]：1.41 Mbps比特率-量化位数*采样频率*声音数-16*44100*2-1411200 bps≈1411 kbps≈1.41 Mbps2.音频文件参数于MP3音乐，它的音质，只是CD的1/10到1/4左右。

较之于DVD Audio，相去更远。

2.1量化位数又名比特率，其单位为bit（比特）。

量化位是对模拟音频信号的幅度进行数字化。

通常量化位数有8bit（8位）、16bit 和24bit。

8位就是将声音从低到高分成28-256个级别；16位就是将声音幅度分成216-65536个级别；24位就是224-16777216个级别，很吓人了。

当然，总是比不上模拟声音的，那可是无限的级别啊。

我们常见的CD光盘音频文件其量化位数一般为16位。

2.2采样频率定义了每秒从连续信号中提取并组成离散信号的采样个数。

通俗的讲就是指每秒钟采集多少个声音样本，是衡量声音文件的质量标准。

其单位是Hz（赫兹）。

采样频率越高，则在单位时间内计算机得到的声音样本数据就越多，对声音波形的表示也越精确。

CD音质的采样频率一般是44100Hz（或记为44.1kHz，即44.1千赫兹）。

2.3声道数就是录音时的音源数量或回放时相应的扬声器数量。

我们常见的音乐声道有单声道、双声道立体声、2.1声道、5.1多声道环绕以及7.1多声道环绕等。

其中“.1”声道，则是一个超低音声道，这一声道可以产生频响范围20～120Hz的超低音。

2.4码率也叫比特率，单位是bps（bit per second比特/秒）。

是指将模拟声音信号转换成数字声音信号后，单位时间内的二进制数据量。

在相同的编码格式下，比特率越大的音质就越好（不同格式，无法比较）。

比特率=量化位数×采样频率×声道数。

比如CD格式的立体声音频，其比特率-16×44100×2-1411200 bps ≈ 1411 kbps （1411千比特每秒）。

2.5音频文件容量：文件在存储器上的大小，单位是Byte（B、字节，1 byte包含8位二进制的数字），有时也记为KB（千字节）、MB（兆字节）、GB（千兆字节）以及TB（千千兆字节）等。

音频文件容量大小=量化位数×采样频率×声道数×时间（秒）÷8。

比如1分钟的CD格式的立体声音频文件，其大小-16×44100×2×60÷8-10584000 Byte ≈10 MB（即10兆）。

3.音频文件音频编码3.1PCMPulse Code Modulation，脉冲编码调制，是数字通信的编码方式之一。

简而言之，就是将模拟信号数字化。

其更高精度的编码是LPCM（线性PCM）。

该编码方法量化位数包括8 bit、16 bit、24 bit和32 bit；采样频率包括44.1kHz、48kHz、96kHz和192kHz 几个规格。

PCM（或者LPCM）是我们该教程主要要谈及的编码格式，16 bit/44.4 kHz的PCM用于CD光盘；16 bit/48 kHz一直到24bit/192 kHz的LPCM用于我们教程的DVD Audio光盘制作。

3.2MLPMeridian Lossless Packing，英之宝无损压缩技术，是一种专用于DVD Audio的真正无损编码技术，几乎所有的DVD Audio光盘都采用了这种编码格式，它将PCM源文件无损压缩，可以在不影响音频质量的同时，有效地将磁盘空间扩充为原来的两倍，从而可以使DVD Audio碟能够携带同一节目的立体声和多声道声轨。

3.3DTSDigital Theater System，数字化影院系统。

它也是一种声音编码方式，通常所见的是DTS5.1声道环绕声系统，每个声道的源音频信号都是由PCM数字信号编码而来的。

由于6声道PCM文件容量太大，无法装进一个CD或DVD光盘中，故需要对原始的PCM 信号编码压缩后再封装，这就是DTS编码。

比如一个CD品质的6声道文件，其码率为16×44100×6-4233600 bps-4233.6 kbps，太大，一个CD装不了几首歌曲，用DTS压缩编码（标准压缩比为3:1），刚好压成1411.2 kbps，符合CD格式要求，这样制作出的多声道CD称为DTS CD。

同样，DTS DVD Audio光盘也是如此编码压缩法。

故理论上而言，DTS格式的音频是比不上PCM或者LPCM原始数字化音频的。

3.4DSDDirect Stream Digital，直接比特流数字编码，是SACD（Super Audio CD超级音频CD）的编码模式。

一种不同于PCM的编码方式，它采用1 bit的量化位数，但高达2.8224 MHz的采用频率进行编码，故可以计算出立体声DSD编码码率-1×2822400×2-5644.8 kbps，相当于CD格式的4倍。

DSD和PCM两种主要的声音编码方式路线有所不同，前者使用低量化位数，高采样率，后者使用高量化位数，相对较低的采样率；前者用于SACD光盘，后者用于CD或DVD Audio光盘。

有发烧者认为，同样双声道立体声，24bit/192kHz的LPCM格式的DVD Audio光盘，码率-24×192000×2-9216 kbps，即使其码率高于DSD编码的SACD，但SACD音质还是要好于DVD Audio。

是否如此，各位烧友自己烧烧去吧。

3.5DSTDirect Stream Transfer，直接音频流转换，是一种将DSD进行无损压缩的编码方法，其目的是为节省存储空间。

其压缩比在1/2到1/3间动态变化。

注意，它不是上面所说的DTS，那是将PCM进行压缩的一种方法。

4.1.wav微软公司开发的一种声音文件格式，它是无损音频文件，源音频文件，其编码格式一般就是PCM（LPCM）。

后续的音频制作教程中，我们需要将各式的音频文件制作成“***.wav”文件，才能进行进一步的制作（此处“***”表示您所需要转换的歌曲之名称）。

值得注意的是，有损压缩音频文件转换为wav后并不能提高其品质，比如mp3文件转换成wav，其品质并没有达到CD格式，还是mp3的品质。

4.2.ape音乐无损压缩格式之一。

由软件Monkey’s Audio压制得到，软件开发者为Matthew T. Ashland。

所谓无损压缩，即品质与音乐源文件一样，但容量大为缩小。

无损压缩格式的音频文件在还原为wav文件后，数据与源文件相同。

4.3.flacFree Lossless Audio Codec，自由无损音频压缩编码。

该压缩方法不会破坏任何原有音频资讯，可以还原音乐光盘音质。

它也是无损压缩音频文件，压缩率比ape稍小一些。

在还原为wav文件以后，音乐品质与原音乐光盘相同，近年来逐步成为主要的无损压缩音频文件格式。

4.4.dtsDigital Theater System，数字化影院系统，一种用于电影和音乐的高质量多声道环绕技术。

DTS压缩编码技术可以得到高比特率和高采样率，而且是多声道（一般为5.1声道）的音频文件。

我们从网络上得到的*.dts音乐文件一般是含多个音轨（5.1）的CD 品质的音乐。

4.5.cuecuesheet，是指光盘映像辅助文件或称标记文件，按照文本文件格式编制，它不是音乐文件。

我们从网络上下载或购买的音频压缩文件（ape、flac、dts等），一般与cue 文件成对出现。

后者可将ape、flac或dts整个音频文件按音轨分割成单个的歌曲，有助于将前者刻录成光盘，同时也有助于将前者转换为单个的wav音轨文件。

4.6.nrg一种光盘镜像文件。

所谓光盘镜像，就是可存储于电脑中的与原光盘一样品质的文件。

刻录软件NERO制作的文件就是.nrg格式。

网络上下载的音乐nrg文件，就相当于我们购买的音乐光盘，可以是立体声CD，也可以是多声道的DTS CD格式。

4.7.mdfMirror Disc File，也是一种原版光盘映像文件，因此可以用虚拟光驱软件打开。

一般mdf文件与mds文件成对使用，且放在同一目录下，就好像前述的cue和flac等文件成对使用一样。

可以使用一些软件直接刻录mds文件，还原成原立体声或多声道的CD光盘。

4.8.iso也是一种常见的光盘映像文件，可以用虚拟光驱软件打开。

多种格式的光盘都可以复制成iso文件以便于储存和传输。

各类光盘音质好坏，从数据上比较：CD < DTS DVD Audio < DVD Audio < SACD。

5.1CDCompact Disc小型激光唱片。

明晃晃的一张盘子，伴随我们多年了！它横扫当年的音乐磁带，音质又远优于很多人喜欢的mp3，目前仍然是音乐爱好者最喜欢的物品了。

普通的CD一般是立体声（两声道）音乐；市面上也有多声道的DTS CD光盘。

5.2DVD AudioDVD音频光盘（不同于我们经常看到的DVD电影碟片，那叫DVD Video视频光盘），运用杜比实验室的MLP无损压缩技术，DVD-Audio光碟可以容纳多达6个声道的24bit/96kHz声音信号，包括一个分离的低音声道。