WAVE文件格式详解

合集下载

Wave文件格式解析

Wave文件格式解析

Wave文件是用于多媒体文件存储的Microsoft RIFF(Resource Interchange File Format 资源交换档案标准)规范的子集之一。

一个RIFF文件以一个文件头(File Header)开始,接着是一系列数据块(data chunk)。

一个Wave文件常常是一个带有一个单“WAVE”块的RIFF文件。

该“WAVE”chunk由两个子快组成,一个“fmt”chunk用于详细说明数据格式,一个“data”chunk包含实际的样本数据。

这种形式我们称为规范形式。

下面我们看一个具体的例子,声音文件如下:
52 49 46 46 24 08 00 00 57 41 56 45 66 6d 74 20 10 00 00 00 01 00 02 00
22 56 00 00 88 58 01 00 04 00 10 00 64 61 74 61 00 08 00 00 00 00 00 00
24 17 1e f3 3c 13 3c 14 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 11 ce 1a 0d
上图所示例子,该WAVE文件采用PCM编码。

该音频具有双声道,每个样点进行16位量化编码,双声道的一个样点占4字节,存储顺序是每个样点的左右声道交替存储。

对于Data块,根据声道数和采样率的不同情况,布局如下(每列代表8bits):1、8 Bit 单声道:
2、8 Bit 双声道
3、16 Bit 单声道:
4、16 Bit 双声道。

常用音频格式介绍

常用音频格式介绍

常用音频格式介绍
音频格式是文件的一种格式,可以存储声音信息,有助于为多种设备
提供有关声音的服务。

它为音乐和声音文件的处理提供了便利。

其中,常
用的音频格式有WAV、MP3、AAC、WMA等。

WAV(Wave)格式是一种无损音频格式,是微软公司和IBM公司开发的,它们同时也设计了ADPCM等压缩格式,能够在数字设备中储存音频数据,由于它的简易性、完整性和容量大,一般被用来存储CD质量的音乐
文件。

MP3(MPEG-1 Audio Layer 3)格式是压缩后的音频文件格式,使用MPEG-1和MPEG-2的音频编码技术,能将原本音频资料压缩到原来的一半
至一十分之一,但保持很高的音质。

AAC(Advanced Audio Coding)格式是一种无损压缩的音频编码技术,可以将原始的音频文件压缩到原来的一半至一十分之一,其压缩率和编码
效率比MP3高,相比之下,AAC在压缩率以及传输速度上都有更好的表现。

WMA(Windows Media Audio)格式是一种无损的数字音频编码技术,
它是微软公司开发的,不仅可以表示CD质量的音频,还可以存储较少的
音乐数据,以满足不同的网络带宽要求。

OGG(Ogg Vorbis)格式是一种无损的音频压缩格式,它是自由软件
的后来者,它的压缩率比MP3和AAC的压缩率高,能够在不降低声音质量
的情况下再次压缩音频文件。

wav文件格式分析

wav文件格式分析

一. RIFF概念在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为"资源互换文件格式"(Resources lnterchange File Format),简称RIFF。

例如声音的WAV文件、视频的AV1文件等等均是由此结构衍生出来的。

RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由"辨别码"、"数据大小"及"数据"所组成。

图一、块的结构示意图辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。

一般而言,chunk本身并不允许内部再包含chunk,但有两种例外,分别为以"RIFF"及"L1ST"为辨别码的chunk。

而针对此两种chunk,RIFF又从原先的"数据"中切出4个Byte。

此4个Byte称为"格式辨别码",然而RIFF又规定文件中仅能有一个以"RIFF"为辨别码的chunk。

图二、RIFF/LIST块结构只要依循此一结构的文件,我们均称之为RIFF档。

此种结构提供了一种系统化的分类。

如果和MS一DOS 文件系统作比较,"RIFF"chunk就好比是一台硬盘的根目录,其格式辨别码便是此硬盘的逻辑代码(C:或D:),而"L1ST"chunk即为其下的子目录,其他的chunk则为一般的文件。

至于在RIFF文件的处理方面,微软提供了相关的函数。

视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放怎样的目录,而在该目录下仅能放何种数据。

二. WAV文件格式WAVE文件是非常简单的一种RIFF文件,它的格式类型为"WAVE"。

Wave文件格式解析

Wave文件格式解析

Wave文件是用于多媒体文件存储的Microsoft RIFF(Resource Interchange File Format 资源交换档案标准)规范的子集之一。

一个RIFF文件以一个文件头(File Header)开始,接着是一系列数据块(data chunk)。

一个Wave文件常常是一个带有一个单“WAVE”块的RIFF文件。

该“WAVE”chunk由两个子快组成,一个“fmt”chunk用于详细说明数据格式,一个“data”chunk包含实际的样本数据。

这种形式我们称为规范形式。

下面我们看一个具体的例子,声音文件如下:
52 49 46 46 24 08 00 00 57 41 56 45 66 6d 74 20 10 00 00 00 01 00 02 00
22 56 00 00 88 58 01 00 04 00 10 00 64 61 74 61 00 08 00 00 00 00 00 00
24 17 1e f3 3c 13 3c 14 16 f9 18 f9 34 e7 23 a6 3c f2 24 f2 11 ce 1a 0d
上图所示例子,该WAVE文件采用PCM编码。

该音频具有双声道,每个样点进行16位量化编码,双声道的一个样点占4字节,存储顺序是每个样点的左右声道交替存储。

对于Data块,根据声道数和采样率的不同情况,布局如下(每列代表8bits):1、8 Bit 单声道:
2、8 Bit 双声道
3、16 Bit 单声道:
4、16 Bit 双声道。

WAV文件的头信息

WAV文件的头信息

{
char cRiffFlag[4];
UIN32 nFileLen;
char cWaveFlag[4];
char cFmtFlag[4];
char cTransition[4];
UIN16 nFormatTag ;
UIN16 nChannels;
04H 4 long int 文件长度
08H 4 char "WAVE"#34;标志
10H 4 过渡字节(不定)
14H 2 int 格式类别(10H为PCM形式的声音数据)
16H 2 int 通道数,单声道为1,双声道为2
18H 2 int 采样率(每秒样本数),表示每个通道的播放速度, (Hz) sample frequency
UIN16 nSamplesPerSec;
UIN32 nAvgBytesperSec;
UIN16 nBlockAlign;
UIN16 nBitNumPerSample;
char cDataFlag[4];
UIN16 nAudioLength;
} WAVEFORMAT;
16位PCM int 32767 -32767
///////////////////////////////////////////////////////////////////////下面是常用来表示的数据结构
unsigned short tag; /* MS PCM = 1 */
1CH 4 long int 波形音频数据传送速率,其值为通道数×每秒样本数×每样本的数据位数(bit)/8。播放软件利用此值可以估计缓冲区的大小。
20H 2 int 数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。

解读Wave文件头结构

解读Wave文件头结构

解读Wave,文件头解释,可以用16位编辑器UltraEdit打开,然后可以观察文件的结构。

我发现对应C语言里面的字WORD(32位),16进制文件对应2个字节(Byte),而DWORD(64位),对应4个字节。

然后顺便普及一下16进制文件的存储规律,对于WORD,先存储低位字节,然后存储高位字节,而DWORD,则先存储低两位的低位,然后是低两位的高位,然后是高两位的低位,然后是高两位的高位。

介绍一下W A VE文件的结构:标志符(RIFF)数据大小格式类型("W A VE")"fmt"Sizeof(PCMW A VEFORMAT)PCMW A VEFORMAT"data"声音数据大小声音数据查到C语言中对应的W A V的文件头结构如下:Typedef struct{W A VEFORMAT wf;//波形格式;WORD wBitsPerSample;//W A VE文件的采样大小;}PCMW A VEFORMAT;W A VEFORMAT结构定义如下:typedef struct{WORD wFormatag;//编码格式,包括W A VE_FORMAT_PCM,W A VEFORMAT_ADPCM等WORD nChannls;//声道数,单声道为1,双声道为2;DWORD nSamplesPerSec;//采样频率;DWORD nAvgBytesperSec;//每秒的数据量;WORD nBlockAlign;//块对齐;}W A VEFORMAT;然后我们根据实际的一个文件的文件头进行对比分析,然后大家就应该明白了:首先是一串“52 49 46 46”这个是Ascii字符“RIFF”,这部分是固定格式,表明这是一个W A VE文件头。

然后是“E4 3C 00 00”,这个是我这个W A V文件的数据大小,记住这个大小是包括头文件的一部分的,包括除了前面8个字节的所有字节,也就等于文件总字节数减去8。

WAVE文件格式分析

WAVE文件格式分析

WAVE文件格式分析
WAVE文件格式是一种用于存储音频数据的文件格式,它是由微软和IBM共同开发的,是Windows操作系统中普遍使用的音频文件格式之一、WAVE是英文"Waveform Audio File Format"的缩写,意为波形音频文件格式。

在WAVE文件的数据部分,音频采样数据以二进制形式存储。

每一个采样值表示了音频信号在特定时间点上的振幅。

振幅大小由采样的位数决定,常见的位数包括8位、16位、24位和32位。

位数越大,表示的振幅范围越广,音质也越高,但同时也会占用更多的存储空间。

此外,WAVE文件还支持多通道音频数据的存储,如立体声、环绕声等。

多通道的音频数据将各个通道的音频采样值依次交错存储,以便于播放软件正确解析和处理多通道的音频数据。

总结起来,WAVE文件格式是一种无损音频文件格式,能够保存音频的完整信息。

它采用了无压缩的PCM编码方式,可以保存各种音频属性的数值,并支持多通道的音频数据存储。

此外,WAVE文件还支持附加信息的存储,提供了便于操作和管理音频文件的功能。

因此,WAVE文件格式在音频文件存储与处理中具有广泛的应用价值。

wav文件格式分析

wav文件格式分析

一. RIFF概念在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为"资源互换文件格式"(Resources lnterchange File Format),简称RIFF。

例如声音的WAV文件、视频的AV1文件等等均是由此结构衍生出来的。

RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由"辨别码"、"数据大小"及"数据"所组成。

图一、块的结构示意图辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。

一般而言,chunk本身并不允许内部再包含chunk,但有两种例外,分别为以"RIFF"及"L1ST"为辨别码的chunk。

而针对此两种chunk,RIFF又从原先的"数据"中切出4个Byte。

此4个Byte称为"格式辨别码",然而RIFF又规定文件中仅能有一个以"RIFF"为辨别码的chunk。

图二、RIFF/LIST块结构只要依循此一结构的文件,我们均称之为RIFF档。

此种结构提供了一种系统化的分类。

如果和MS一DOS 文件系统作比较,"RIFF"chunk就好比是一台硬盘的根目录,其格式辨别码便是此硬盘的逻辑代码(C:或D:),而"L1ST"chunk即为其下的子目录,其他的chunk则为一般的文件。

至于在RIFF文件的处理方面,微软提供了相关的函数。

视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放怎样的目录,而在该目录下仅能放何种数据。

二. WAV文件格式WAVE文件是非常简单的一种RIFF文件,它的格式类型为"WAVE"。

wave是什么格式「常见的wave格式的扩展名」

wave是什么格式「常见的wave格式的扩展名」

wave是什么格式「常见的wave格式的扩展名」1、WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为“WAV”,数据本身的格式为PCM或压缩型WAVE文件格式是一种由微软和IBM联合开发的用于音频数字存储的标准,它采用RIFF文件格式结构,非常接近于AIFF和IFF格式符合 PIFF。

2、wave是录音时用的标准的windows文件格式,文件的扩展名为“wav”,数据本身的格式为pcm或压缩型,属于无损音乐格式的一种。

3、WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为“WAV”,数据本身的格式为PCM或压缩型怎样打开若是在电脑上打开,使用Windows自带的媒体播放器就可以打开,如今主流的音频播放器都支持打开WAV文件,如千千静听,Rea。

4、wave ,它的后缀是 wav 音频格式。

5、Wave档案是由微软公司所制订的声音规格,由於历史久远,加上微软在其作业系统中大量使用WAVE格式的声音档案,使得此种格式已经成为电脑的标准声音格式,例如进入Windows与离开Windows的声音,与操作滑鼠时的各种事件的声音等等。

6、Wave格式支持MSADPCMCCITT A律CCITTμ律和其他压缩算法,支持多种音频位数采样频率和声道,是PC机上最为流行的声音文件格式但其文件尺寸较大,多用于存储简短的声音片段一般来说,采样的样本尺度信息量越大。

7、WAV为微软公司Microsoft开发的一种声音文件格式,它符合RIFFResource Interchange File Format文件规范,用于保存Windows 平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩。

8、1Wave格式是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持2AIFF是音频交换文件格式的英文缩写,是。

wav文件文件头格式

wav文件文件头格式

一、WAVE文件格式剖析WA VE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。

RIFF是英文ResourceInterchangeFileFormat的缩写,每个W A VE文件的头四个字节便是“RIFF”。

WA VE文件由文件头和数据体两大部分组成。

其中文件头又分为RIFF/WAV 文件标识段和声音数据格式说明段两部分。

W A VE文件各部分内容及格式见附表。

常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。

采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。

采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。

WA VE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。

W A VE文件是由样本组织而成的。

在单声道W A VE文件中,声道0代表左声道,声道1代表右声道。

在多声道W A VE文件中,样本是交替出现的。

WA VE文件格式说明表偏移地址字节数数据类型内容文件头00H4char"RIFF"标志04H4longint文件长度08H4char"WA VE"标志0CH4char"fmt"标志10H4过渡字节(不定)14H2int格式类别(10H为PCM形式的声音数据)16H2int通道数,单声道为1,双声道为218H2int采样率(每秒样本数),表示每个通道的播放速度,1CH4longint波形音频数据传送速率,其值为通道数×每秒数据位数×每样本的数据位数/8。

播放软件利用此值可以估计缓冲区的大小。

20H2int数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。

Wave文件格式

Wave文件格式

WAV简介WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字,因此在声音文件质量和CD相差无几! WAV打开工具是WINDOWS的媒体播放器。

通常使用三个参数来表示声音,量化位数,取样频率和声道数。

声道有单声道和立体声之分,取样频率一般有11025Hz(11kHz) ,22050Hz(22kHz)和44100Hz(44kHz) 三种,不过尽管音质出色,但在压缩后的文件体积过大!相对其他音频格式而言是一个缺点,其文件大小的计算方式为:WAV格式文件所占容量 = (取样频率 X 量化位数 X 声道) X 时间 / 8 (字节 = 8bit)目前支持WAV设计的手机主要为智能手机,如索尼爱立信P910和诺基亚N90以及采用微软OS的多普达等手机,而其它一些非智能手机的产品,如果宣传支持WAV格式则多半属于只是支持单声道的。

WAV剖析WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为“WAV”,数据本身的格式为PCM或压缩型。

WAV文件格式是一种由微软和IBM联合开发的用于音频数字存储的标准,它采用RIFF文件格式结构,非常接近于AIFF和IFF格式。

符合 PIFF Resource Interchange File Format规范。

所有的WAV都有一个文件头,这个文件头音频流的编码参数。

WAV文件作为最经典的Windows多媒体音频格式,应用非常广泛,它使用三个参数来表示声音:采样位数、采样频率和声道数。

声道有单声道和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz(44kHz)三种。

WAV(PCM)文件格式分析

WAV(PCM)文件格式分析
16H 2 int 通道数,单声道为1,双声道为2
18H 2 int 采样率(每秒样本数),表示每个通道的播放速度,
1CH 4 long int 波形音频数据传送速率,其值为通道数×每秒数据位数×每 样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。
样本大小 数据格式 最大值 最小值
8位PCM unsigned int 225 0
16位PCM int 32767 -32767�
0CH 4 char "fmt"标志
10H 4 过渡字节(不定)
14H 2 int 格式类别(10H为PCM形式的声音数据)
W AVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE文件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。在多声道WAVE文件中,样本是交替出现的。
WAVE文件格式说明表
偏移地址 字节数 数据类型 内 容
8位立体声 0声道(左) 1声道(右) 0声道(左) 1声道(右)
16位单声道 0声道低字节 0声道高字节 0声道低字节 0声道高字节
16位立体声 0声道(左)低字节 0声道(左)高字节 1声道(右)低字节 1声道(右)高字节
WAVE文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上,剩下的位置为0,这样8位和16位的PCM波形样本的数据格式如下所示。
常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。采样值是指每一次采样周期内声音模拟信号的积分值。

wave文件(.wav)格式、PCM数据格式

wave文件(.wav)格式、PCM数据格式

wave文件(*.wav)格式、PCM数据格式1. 音频简介经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;当然也可以有 16bit 的单声道或 8bit 的立体声, 等等。

采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。

采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位(左声道)和低八位(右声道)分别代表两个声道。

人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。

这和电影的每秒 24 帧图片的道理差不多。

每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个wav 文件的播放长度。

譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是"22050HZ / 16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到),那么它的每秒的传输速率(位速, 也叫比特率、取样率)是 22050*16*2 = 705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒), 播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。

WAV文件格式说明

WAV文件格式说明

1. 音频简介经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;当然也可以有 16bit 的单声道或 8bit 的立体声, 等等。

采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。

采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位(左声道)和低八位(右声道)分别代表两个声道。

人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。

这和电影的每秒 24 帧图片的道理差不多。

每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个wav 文件的播放长度。

譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是"22050HZ / 16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到),那么它的每秒的传输速率(位速, 也叫比特率、取样率)是 22050*16*2 = 705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒), 播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。

WAVE文件格式解析

WAVE文件格式解析

WAVE⽂件格式解析WAVE ⽂件作为Windows多媒体中使⽤的声⾳波形⽂件格式之⼀,它是以RIFF(Resource Interchange File Format)格式为标准的。

这⾥不针对RIFF⽂件格式做介绍,不太了解的可以参考“”⼀⽂。

WAVE⽂件构成每个WAVE⽂件的头四个字节便是“RIFF”。

WAVE ⽂件由⽂件头和数据体两⼤部分组成。

其中⽂件头⼜分为 RIFF/WAV ⽂件标识段和声⾳数据格式说明段两部分。

相对于RIFF⽂件,只是将“RIFF”chunk的form id替换为“WAVE”。

下表是⼀个典型的WAVE⽂件各部分构成及其长度字段。

注意所有数据采⽤windows默认的⼩端存储。

(FOURCC是⼀个特殊的四字节码,判断时按照字符顺序判断即可。

)域长度内容说明chunkID4Chunk ID: "RIFF",FOURCC四字节码chunksize4Chunk size: 4+nWAVEID4WAVE ID: "WAVE",FOURCC四字节码WAVE chunks n Wave chunks包含格式信息和⾳频采样数据,分为“format” chunk和“data”chunk两部分。

Format chunkFormat chunk⽤于说明data chunk中PCM数据的格式。

主要三种不同的format chunk格式(不同的格式码)。

如下表:域长度内容说明ckID4Chunk ID: "fmt ",FOURCC四字节码,注意最后⼀个填充是空格。

cksize4Chunk size: 16 or 18 or 40 wFormatTag2Format code,格式码nChannels2Number of interleaved channels,采样声道数(交织存储)nSamplesPerSec4Sampling rate (blocks per second),⾳频采样率nAvgBytesPerSec4Data rate,⾳频码率nBlockAlign2Data block size (bytes),⾳频数据块⼤⼩(单位字节)wBitsPerSample2Bits per sample,量化位数(⽐如8bits、16bits、32bits)cbSize2Size of the extension (0 or 22),扩展字段长度wValidBitsPerSample2Number of valid bits,有效的位长度dwChannelMask4Speaker position mask,声道描述掩码,⽐如左声道、右声道等SubFormat16GUID, including the data format code,数据格式码标准中定义的wFormatTag(Format code)可取值范围如下表:Format Code PreProcessor Symbol Data 0x0001WAVE_FORMAT_PCM PCM0x0003WAVE_FORMAT_IEEE_FLOAT IEEE float,[-1.0f,1.0f] 0x0006WAVE_FORMAT_ALAW8-bit ITU-T G.711 A-law 0x0007WAVE_FORMAT_MULAW8-bit ITU-T G.711 µ-law 0xFFFE WAVE_FORMAT_EXTENSIBLEDetermined by SubFormatPCM格式当wFormatTag为0x0001时,表⽰WAVE⽂件中存储的是PCM格式的⾳频数据。

WAV文件操作

WAV文件操作

WAVE文件格式剖析WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。

RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是“RIFF”。

WAVE文件由文件头和数据体两大部分组成。

其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。

WAVE文件各部分内容及格式见附表。

常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。

采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。

采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件,采样数据为八位的短整数(short int00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。

WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。

WAVE文件是由样本组织而成的。

在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。

在多声道WAVE文件中,样本是交替出现的。

WAVE文件格式说明表PCM数据的存放方式:WAVE文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需的最小字节数。

首先存储低有效字节,表示样本幅度的位放在i的高有效位上,剩下的位置为0,这样8位和16位的PCM波形样本的数据格式如下所示。

运用多媒体WAV文件格式二三例 2000/11/20 软件世界徐济仁陈家松多媒体技术近年来发展很快,较好品质的声卡可以提供16位的立体声及44KHZ的播放录制能力,它不仅可以提供原音逼真的取样,其合成的音质也十分理想,有的声卡还加入了数字信号处理器,可编程控制的DSP具有强大的运算能力,它可以用来作声音信息的压缩和一些特殊效果的处理。

具有此功能的声卡提供的WAV文件提供的语音信息可以满足语音特征识别的要求。

流行无损音乐格式介绍

流行无损音乐格式介绍

流行无损音乐格式介绍无损音乐格式是指音频文件在压缩过程中不会丢失任何音频数据的文件格式。

与有损音乐格式相比,无损音乐格式可以提供更高质量的音频,但同时也需要更大的存储空间。

在一项有损压缩算法中,音频文件会根据一些原则和规则丢弃一些不重要或听觉上不明显的音频数据,从而减小文件的大小。

这种压缩方法可以有效地减小音频文件的大小,但它也会导致音质的损失。

而无损音乐格式则采用了不同的压缩算法,它们能够以更高的压缩比不丢失音频数据的情况下,减小音频文件的大小。

下面介绍几种常见的无损音乐格式:1. WAV(Waveform Audio File Format)WAV是一种容器格式,它可以存储以线性脉冲调制(PCM)编码的无损音频。

PCM编码将音频信号直接转换为数字数据,因此它保留了音频中的所有信息。

由于PCM编码占用大量存储空间,所以WAV文件通常较大。

2. FLAC(Free Lossless Audio Codec)FLAC是一种无损压缩格式,它可以将音频文件压缩到原始文件大小的50%至70%左右。

与WAV相比,FLAC文件更小,但仍然保留了音频文件的完整信息。

FLAC是一种开放源代码格式,并得到了广泛的应用。

3. ALAC(Apple Lossless Audio Codec)ALAC是苹果公司开发的无损音乐编码格式。

它与FLAC类似,可以提供与原始音频相同的音质,但ALAC在苹果设备上有更好的兼容性。

虽然ALAC文件大小较大,但它可以在苹果音乐播放器和流媒体设备上实现高质量的音频播放。

4. APE(Monkey's Audio)APE是一种无损压缩格式,由Monkey's Audio开发。

与FLAC和ALAC 类似,APE可以将音频文件压缩到原始文件大小的50%至70%左右。

APE文件通常具有更高的压缩比和更快的解压速度,但由于其私有性和较少的兼容性,它在市场上的使用较为有限。

5. WMA Lossless(Windows Media Audio Lossless)WMA Lossless是微软公司开发的一种无损音频格式。

wav_FILE

wav_FILE

wav文件格式2008-11-01 12:55:11| 分类:数据编码|字号订阅WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。

RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是“RIFF”。

WAVE 文件由文件头和数据体两大部分组成。

其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。

WAVE文件各部分内容及格式见附表。

常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。

采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。

采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。

WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。

WAVE文件是由样本组织而成的。

在单声道WAVE文件中,声道0代表左声道,声道1代表右声道。

在多声道WAVE文件中,样本是交替出现的。

WAVE文件格式说明表偏移地址字节数数据类型内容文件头00H4char"RIFF"标志04H4long int文件长度08H4char"WAVE"标志0CH4char"fmt"标志10H4过渡字节(不定)14H2int格式类别(10H为PCM形式的声音数据)16H2int通道数,单声道为1,双声道为218H2int采样率(每秒样本数),表示每个通道的播放速度,1CH4long int波形音频数据传送速率,其值为通道数×每秒数据位数×每样本的数据位数/8。

播放软件利用此值可以估计缓冲区的大小。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
WAVE文件格式详解
WAVE文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。
RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个
字节便是“RIFF”。WAVE文件由文件头和数据体两大部分组成。其中文件头又分
为RIFF/WAV文件标识段和声音数据格式说明段两部分。WAVE文件各部分内容及
16H 2 int 通道数,单声道为1,双声道为2
18H 2 int 采样率(每秒样本数),表示每个通道的播放速度,
1CH 4 long int 波形音频数据传送速率,其值为通道数×每秒数据位数×每样
本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。
20H 2 int 数据块的调整数(按字节算的),其值为通道数×每样本的数据位
值/8。播放软件需要一次处理多个该值大小的字节数据,以便将其
值用于缓冲区的调整。
22H 2 每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多
个声道,对每个声道而言,样本大小都一样。
16位立体声 0声道(左)低字节 0声道(左)高字节 1声道(右)低字节 1声道(右)高字节
WAVE文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需
的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上,
剩下的位置为0,这样8位和16位的PCM波形样本的数据格式如下所示。
而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八
位和低八位分别代表左右两个声道。
WAVE文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAVE文
件是由样本组织而成的。在单声道WAVE文件中,声道0代表左声道,声道1代表右
声道。在多声道WAVE文件中,样本是交替出现的。
格式见附表。
常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit
的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信
号在“模→数”转换过程中单位时间内采样的次数。采样值是指每一次采样周期
内声音模拟信号的积分值。
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);
样本大小 数据格式 最大值 最小值
8位PCM unsigned int 225 0
16位PCM int 32767
24H 4 char 数据标记符"data"
28H 4 long int 语音数据的长度
PCM数据的存放方式:
样本1 样本2
8位单声道 0声道 0声道
8位立体声 0声道(左) 1声道(右) 0声道(左) 1声道(右)
16位单声道 0声道低字节 0声道高字节 0声道低字节 0声道高字节
WAVE文件格式说明表
偏移地址 字节数 数据类型 内 容
文件头
0ቤተ መጻሕፍቲ ባይዱH 4 char "RIFF"标志
04H 4 long int 文件长度
08H 4 char "WAVE"标志
0CH 4 char "fmt"标志
10H 4 过渡字节(不定)
14H 2 int 格式类别(10H为PCM形式的声音数据)
相关文档
最新文档