wav 声音文件介绍
wav格式「wav格式的音频一般占用存储空间较大」
wav格式「wav格式的音频一般占用存储空间较大」WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大每分钟的音。
WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持WAV 格式支持许多压缩算法,支持多种音频位数采样频率和声道,采用441kHz的采样频率,16位量化位数。
WAV是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大每分钟的。
WAV格式视频文件是比较常见的格式,用Windows自带播放器就可以进行播放了1找到WAV格式视频2鼠标右键点击WAV格式视频,然后选择打开方式3点击打开方式之后,选择WindowsMediaPlayer进行打开4选择WindowsMediaPlayer之后。
Hz四种WAV文件采用的是RIFF格式结构至少是由3个块构成,分别是RIFFfmt和Data所有基于压缩编码的WAV文件必须含有fact块此外所有其它块都是可选。
WAV是真正的无损格式 WAV为微软公司Microsoft开发的一种声音文件格式,它符合RIFFResource Interchange File Format文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM。
wav是完全无损的非压缩音频格式,容量比较大,很多电子播放设备不支持,你可以将它转换成mp3wma格式就可以了我一般用cooledit 转换。
一首3分钟左右的音乐文件在30M至50M之间其后期可经无损压缩为APE,FLAC等无损格式,也可压为MP3,AAC,wma等有损格式有些手机,MP3等录音文件也为wav,但那是低端的,文件一般很小不是以上所说的无损音频。
多媒体音频格式解析WMA WAV OGG AAC APE FLAC
多媒体音频格式解析WMA WA V OGG AAC APE FLAC[转载] 收藏首先博士像先讲一讲何谓“真人真唱”铃声--我们有时候会看到,手机说明明明写着真人真唱,而且手机的营业员也这么说,我们很高兴买回去后,发现却不能播放MP3!其实,这是因为了解不足所产生的误会,所谓的真人真唱,通常指的是使用日AMAHA声音芯片的手机,使用MMF可以有短暂的人声和动物声的逼真模拟,而并不是专指MP3,而且不只MP3能支持唱整首歌,WA V、AAC、WMA等很多种文件格式也支持。
首先博士像先讲一讲何谓“真人真唱”铃声--我们有时候会看到,手机说明明明写着真人真唱,而且手机的营业员也这么说,我们很高兴买回去后,发现却不能播放MP3!其实,这是因为了解不足所产生的误会,所谓的真人真唱,通常指的是使用日AMAHA声音芯片的手机,使用MMF可以有短暂的人声和动物声的逼真模拟,而并不是专指MP3,而且不只MP3能支持唱整首歌,WAV、AAC、WMA等很多种文件格式也支持。
MP3:MP3是利用一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。
因为人耳只能听到一定频段内的声音,而其他更高或更低频率的声音对人耳是没有用处的,所以MP3技术就把这部分声音去掉了,从而使得文件体积大为缩小,但在人耳听起来却并没有什么失真。
MP3可以将声音用1∶10甚至1∶12的压缩率进行压缩,举个例子一般来说一张光碟容量为650M,作为CD它能容纳的不过是60到90分钟的音乐(15 首左右的歌曲),一首5分钟的歌曲要占用50M左右的空间,而一首5分钟的MP3歌曲体积只有4~5M,一张光碟能放上一百多收首MP3歌曲。
MP3的体积小,音质却非常接近CD,是一种很不错的音乐文件格式。
单音铃声:九十年代中后期,随着移动通讯由模拟网络发展到数字网络,音乐铃声开始出现了,这种铃声是通过专用的“可编程铃声电路”产生音乐信号,再通过扬声器或听筒来发出音乐的,但这种铃声虽然有音调的变化,但无法表现出自然界声音的音色和发音过程,因而无法模拟出乐器的真实效果。
常用音频格式介绍
常用音频格式介绍WAV APE FLAC WMA OGG MP3WAV格式WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。
WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播.WAV来源于对声音模拟波形的采样。
用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。
Microsoft Sound System软件Sound Finder可以转换AIF SND和VOD文件到WAV格式。
该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。
APE格式APE的本质,其实它是一种无损压缩音频格式。
庞大的WAV音频文件可以通过Monkey''sAudio这个软件进行“瘦身”压缩为APE。
很时候它被用做网络音频文件传输,因为被压缩后的APE文件容量要比WAV源文件小一半多,可以节约传输所用的时间。
更重要的是,通过Monkey''s Audio解压缩还原以后得到的WAV文件可以做到与压缩前的源文件完全一致。
所以APE被誉为“无损音频压缩格式”,Monkey''s Audio被誉为“无损音频压缩软件”。
与采用WinZip或者WinRAR这类专业数据压缩软件来压缩音频文件不同,压缩之后的APE音频文件是可以直接被播放的。
Monkey''s Audio会向Winamp中安装“in_APE.dll”插件,从而使Winamp也具备播放APE文件的能力。
C#使用NAudio合并mp3、wav音频文件
C#使⽤NAudio合并mp3、wav⾳频⽂件1.什么是wav格式WAV为(Microsoft)开发的⼀种声⾳⽂件格式,它符合RIFF(Resource Interchange File Format)⽂件规范,⽤于保存Windows平台的信息资源。
通常使⽤三个参数来表⽰声⾳,量化位数,取样频率和振幅。
量化位数分为8位,16位,24位三种,声道有单声道和之分,单声道振幅数据为n*1矩阵点,⽴体声为n*2矩阵点,取样频率⼀般有11025Hz(11kHz) ,22050Hz(22kHz)和44100Hz(44kHz) 三种。
标准格式化的WAV⽂件和CD格式⼀样,也是44.1K的取样频率,16位量化数字,因此在声⾳⽂件质量和CD相差⽆⼏。
2. WAV⽂件的组成偏移地址⼤⼩字节数据块类型内容00H~03H44字符资源交换⽂件标志(RIFF)04H~07H4长整数从下个地址开始到⽂件尾的总字节数08H~0BH44字符WAV⽂件标志(WAVE)0CH~0FH44字符波形格式标志(fmt ),最后⼀位空格。
10H~13H4整数过滤字节(⼀般为00000010H),若为00000012H则说明数据头携带附加信息(见“附加信息”)。
14H~15H2整数格式种类(值为1时,表⽰数据为线性PCM编码)16H~17H2整数通道数,单声道为1,双声道为218H~1BH4长整数采样频率1CH~1FH4长整数波形数据传输速率(每秒平均字节数)20H~21H2整数DATA数据块长度,字节。
22H~23H2整数PCM位宽随后2字节2整数附加信息(可选,由上⽅过滤字节确定)......................以上为对wav格式的基本了解,最近碰到⼀个需要合并⾳频⽂件的需求,奈何对此⽂件了解过少,最后借助于git地址:,结合⽂件流进⾏处理。
3.话不多说上代码。
⾸先是安装Naudio的包。
3.1.上传⾳频⽂件并调⽤合并⽅法【伪代码】public void UploadOrCombineAudioFile(){HttpFileCollection files = HttpContext.Current.Request.Files;if (files == null || files.Count < 1)return;string upfileType = HttpContext.Current.Request.Form["upfileType"];//⽂件格式类型/*...省略符...*/int maxSize = 1024 * 1024 * 100;//单⽂件上传最⼤限制List<string> dirDic = new List<string> { ".mp3", ".mp4", ".pcm", ".wav" };//⽂件格式限制string uploadPath = HttpContext.Current.Server.MapPath("~/AudioFile/TempFile/");//临时路径if (!Directory.Exists(uploadPath))Directory.CreateDirectory(uploadPath);string fileType = string.Empty;for (var i = 0; i < files.Count; i++){var postedfile = files[i];var inputStream = postedfile.InputStream;if (inputStream.Length > 0){string thisfileName = files[i].FileName;fileType = Path.GetExtension(thisfileName);if (postedfile.InputStream == null || postedfile.InputStream.Length > maxSize || !dirDic.Contains(fileType.ToLower()))return;/*...我是省略符...*/int ReadLen = 0;string uploadFileName = uploadPath + thisfileName;byte[] bytes = new byte[10240];using (FileStream stream = new FileStream(uploadFileName, FileMode.OpenOrCreate))//保存⽂件到指定待合并⽂件路径下{while ((ReadLen = inputStream.Read(bytes, 0, bytes.Length)) > 0){stream.Write(bytes, 0, ReadLen);}}}}List<string> filepaths = new List<string>(Directory.GetFiles(uploadPath));//获取待合并⽂件路径//⽂件合并后路径string savePath = HttpContext.Current.Server.MapPath("~/AudioFile/ComBineFile/" + DateTime.Now.ToString("yyyyMMdd") + "/"); if (!Directory.Exists(savePath))Directory.CreateDirectory(savePath);/*...我是省略符...*/byte[] buffer = new byte[10240];string savefullName = savePath + DateTime.Now.ToString("yyyyMMddHHmmssff") + upfileType;if (upfileType.ToLower().Equals(".mp3"))CombineMp3(filepaths, savefullName);//mp3合并else if ((upfileType.ToLower().Equals(".wav")))CombineWav(filepaths, savefullName);//wav合并/*...我是省略符...*/return;}3.2 .mp3格式合并//命名空间using System.IO;using NAudio;using NAudio.Wave;///<summary>/// Mp3格式合并///</summary>///<param name="inputFiles">待合并⽂件路径</param>///<param name="outputfullName">输出⽂件名</param>private void CombineMp3(List<string> inputFiles, string outputfullName){using (FileStream outputStream = new FileStream(outputfullName, FileMode.OpenOrCreate)){foreach (string file in inputFiles){Mp3FileReader reader = new Mp3FileReader(file);if ((outputStream.Position == 0) && (reader.Id3v2Tag != null)){outputStream.Write(reader.Id3v2Tag.RawData, 0, reader.Id3v2Tag.RawData.Length);}Mp3Frame frame;while ((frame = reader.ReadNextFrame()) != null){outputStream.Write(frame.RawData, 0, frame.RawData.Length);}}}}3.3.wav格式合并///<summary>/// wav格式合并///</summary>///<param name="inputFiles">待合并⽂件</param>///<param name="outputfullName">输出⽂件名</param>private void CombineWav(List<string> inputFiles, string outputfullName){WaveStream waveStream = WaveFormatConversionStream.CreatePcmStream(new WaveFileReader(inputFiles[0])); using (WaveFileWriter waveFileWriter = new WaveFileWriter(outputfullName, waveStream.WaveFormat)){foreach (string file in inputFiles){waveStream = WaveFormatConversionStream.CreatePcmStream(new WaveFileReader(file));byte[] bytes = new byte[waveStream.Length];waveStream.Position = 0;waveStream.Read(bytes, 0, (int)waveStream.Length); waveFileWriter.Write(bytes, 0, bytes.Length);}}}未完待续....。
wav格式结构
W A V实际上是Waveform Audio File Format(波形音频文件格式)的简称,它是微软公司开发的一种声音文件格式。
W A V实际上是对PCM格式的的一种包装,W A V取样频率可以是44100Hz、22050Hz、11025Hz等,量化位数可以8位或16位,声道数可以是单声道,也可以是立体声。
W A V文件包含了一个“fmt ”段落和一个“data”段落,“fmt”段落包含了音源样本的参数信息,“data”段落包含了实际的音源数据。
在W A V文件中,“fmt”段通常包含以下信息:1. 格式说明标志位(Subchunk1ID):4个字节,等于“fmt ”或者“wFormatTag”。
2. 格式说明标志位长度(Subchunk1Size):4个字节,等于16或者所使用的单声道位数与有关设置的乘积加上2。
3. 音频流的通道数(nChannels):2个字节,表示每个声道的样本数。
4. 每秒的采样数(nSamplesPerSec):4个字节,表示每秒的采样频率。
5. 采样点振幅位数(nAvgBytesPerSec):4个字节,等于每秒发送字节数,这是nChannels和nSamplesPerSec的乘积的两倍加一再除以8的结果。
6. 音频流码的位深度(nBlockAlign):2个字节,等于nChannels 和nAvgBytesPerSec的乘积除以8的结果。
7. 总采样点数(wNumBlocks):2个字节,等于采样点数。
8. 格式说明标志位(Subchunk2ID):4个字节,等于“data”。
9. 格式说明标志位长度(Subchunk2Size):4个字节,等于采样点数乘以nChannels再乘以nAvgBytesPerSec除以8的结果。
以上信息仅供参考,如需了解更多信息,建议咨询专业人士。
计算机常用声音文件格式
计算机常用声音文件格式计算机中常用的声音文件格式有很多种,每种格式有其特定的用途和优势。
以下是一些常见的声音文件格式:1. WAV(Waveform Audio File Format):WAV 是一种无损音频文件格式,通常用于存储高质量的音频。
它支持多种音频编解码器,因此可以存储各种音频数据。
2. MP3(MPEG Audio Layer III):MP3 是一种有损音频压缩格式,它可以显著减小文件大小而保持相对较高的音质。
由于其高度的压缩率,MP3 是在线音乐和音频传输中广泛使用的格式。
3. AAC(Advanced Audio Coding):AAC 是一种有损音频编码标准,通常用于在相对较低的比特率下提供较高的音频质量。
它是许多音频和视频格式(例如MP4)的默认音频编码。
4. FLAC(Free Lossless Audio Codec):FLAC 是一种无损音频压缩格式,它可以保持原始音频质量而不损失任何数据。
FLAC 文件相对较大,但适用于对音质要求较高的场景,例如专业音乐制作。
5. OGG(Ogg Vorbis):OGG 是一个开放的、免费的多媒体容器格式,其中包括音频编码格式Vorbis。
OGG Vorbis 提供了一种有损的音频压缩方案,类似于MP3,但通常在相同比特率下提供更好的音质。
6. MIDI(Musical Instrument Digital Interface):MIDI 不是一种音频文件格式,而是一种包含音符、音量和乐器信息的数字音乐标准。
MIDI 文件很小,用于存储音符和乐器信息,而不是音频本身。
7. AIFF(Audio Interchange File Format):AIFF 是一种无损音频文件格式,常用于Mac平台。
与WAV类似,AIFF支持高质量音频数据。
这些格式的选择取决于具体的应用场景、存储需求、音频质量要求等因素。
例如,对于音乐制作和专业录音,无损格式如WAV、FLAC可能更为适用;而对于在线音乐流媒体,有损格式如MP3、AAC更为常见。
wav文件头详解,看懂wav文件
wav⽂件头详解,看懂wav⽂件⼯作中部门萌新常问的wav⽂件头格式及怎么看wav⽂件,且有时会遇到 “伪.pcm” 格式现总结如下: WAV是最常见的声⾳⽂件格式之⼀,是微软公司专门为Windows开发的⼀种标准数字⾳频⽂件,该⽂件能记录各种单声道或⽴体声的声⾳信息,并能保证声⾳不失真。
但WAV⽂件有⼀个缺点,就是它所占⽤的太⼤(每分钟的⾳乐⼤约需要12兆磁盘空间)。
它符合资源互换⽂件格式(RIFF)规范,⽤于保存Windows平台的⾳频信息资源推荐⼀个好⽤的16进制⽂件查看的⼯具:HxDx64对于完全0基础的,推荐下⾯⽹站中的详细解释,⽐较详细:(侵删)1.RIFF块(RIFF-Chunk)偏移地址字节数数据类型内容&H004String‘RIFF‘⽂件标志&H044UInteger⽂件总长&H08 4 String ‘WAVE‘⽂件标志2.格式化块(Format-Chunk)偏移地址字节数数据类型内容&H0C4String‘fmt‘标志&H104UInteger块长度&H12 2 UShort PCM格式类别&H142 UShort 声道数⽬&H184 UInteger 采样率&H1C 4 UInteger 传输速率&H1E 2UShort 数据块对齐&H202UShort 每样本bit数&H22 2UShort 可选3.附加块(Fact-Chunk) *当前块偏移地址需要根据实际数据变更偏移地址字节数数据类型内容&H264String‘fact‘标志&H2A4UInteger块长度&H2E4UInteger附加信息4.数据块(Data-Chunk) *当前块偏移地址需要根据实际数据变更偏移地址字节数数据类型内容&H324String‘data‘⽂件标志&H364UInteger数据块总长按照相关头格式,来观察字节即可Example:(取⾃上⾯博客)。
WAV文件的头信息
{
char cRiffFlag[4];
UIN32 nFileLen;
char cWaveFlag[4];
char cFmtFlag[4];
char cTransition[4];
UIN16 nFormatTag ;
UIN16 nChannels;
04H 4 long int 文件长度
08H 4 char "WAVE"#34;标志
10H 4 过渡字节(不定)
14H 2 int 格式类别(10H为PCM形式的声音数据)
16H 2 int 通道数,单声道为1,双声道为2
18H 2 int 采样率(每秒样本数),表示每个通道的播放速度, (Hz) sample frequency
UIN16 nSamplesPerSec;
UIN32 nAvgBytesperSec;
UIN16 nBlockAlign;
UIN16 nBitNumPerSample;
char cDataFlag[4];
UIN16 nAudioLength;
} WAVEFORMAT;
16位PCM int 32767 -32767
///////////////////////////////////////////////////////////////////////下面是常用来表示的数据结构
unsigned short tag; /* MS PCM = 1 */
1CH 4 long int 波形音频数据传送速率,其值为通道数×每秒样本数×每样本的数据位数(bit)/8。播放软件利用此值可以估计缓冲区的大小。
20H 2 int 数据块的调整数(按字节算的),其值为通道数×每样本的数据位值/8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。
WAV文件格式说明
1. 音频简介经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;当然也可以有 16bit 的单声道或 8bit 的立体声, 等等。
采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。
采样值是指每一次采样周期内声音模拟信号的积分值。
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位(左声道)和低八位(右声道)分别代表两个声道。
人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。
这和电影的每秒 24 帧图片的道理差不多。
每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个wav 文件的播放长度。
譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是"22050HZ / 16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到),那么它的每秒的传输速率(位速, 也叫比特率、取样率)是 22050*16*2 = 705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒), 播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。
WAV文件文件头格式概述
各种WAV文件头格式 文件头格式 各种
采样、 比特 律量化的PCM语音信号的 比特A律量化的 语音信号的WAV文件头格式表(共58字节) 文件头格式表( 字节) 表 2 8KHz采样、8比特 律量化的 采样 语音信号的 文件头格式表 字节
偏移地址 00H 04H 08H 10H 14H 16H 18H 1CH 20H 22H 26H 2AH 32H 36H 4 4 8 4 2 2 4 4 2 4 4 8 4 4 字节数 数据类型 char long int char long int int Int long int long int int long int char char char long int "RIFF" 文件总长-8 "WAVEfmt " 12000000H(ALAW) 06 00H 声道数 采样率 每秒播放字节数 采样一次占字节数 量化数 "fact" 0400000000530700H定 "data" 采样数据字节数 内容 文件头定义为 char riff_id[4]="RIFF" long int size0=文总长-8 char wave_fmt[8] long int size1=0x12 int fmttag=0x06 int channel=1 或2 long int samplespersec long int bytepersec int blockalign=0x01 long int bitpersamples=8 char wave_fact="fact" char temp char wave_data="data" lont int size2=文长-58
常用的声音格式
常用的声音格式
常用的声音格式包括以下几种:
1. WAV:WAV是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式之一。
该格式的音频文件通常比较大,主要用于存储长时间、大容量的声音片段,但由于该格式是未经压缩的,所以也广泛应用于通信、网络和多媒体等领域。
2. MP3:MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。
该格式使用了混合音频编码技术,将音频数据压缩后存储在较小的文件中,同时保持了相当不错的音质。
3. AAC:AAC(Advanced Audio Coding)是一种音频编码格式,它是MPEG-2标准所定义的一种音频编码技术。
该格式支持多声道,提供比MP3更好的音质和更小的文件大小。
AAC被广泛应用于网络流媒体、移动设备和CD/DVD生产等方面。
4. FLAC:FLAC(Free Lossless Audio Codec)是一种无损音频压缩格式,其设计目标是生成无损音乐文件。
FLAC文件大小相对于WAV文件较小,同时保留了原始音频的质量。
FLAC广泛应用于数字音乐播放器、CD/DVD制作和网络传输等领域。
5. WMA:WMA(Windows Media Audio)是一种音频编码格式,由微软公司开发。
WMA支持多种比特率和采样率,并具有一些高级功能,如数字版权管理(DRM)。
WMA文件通常比MP3文件小,但音质相似。
以上是常用的声音格式,每种格式都有其特点和适用场景。
在实际应用中,可以根据需要选择合适的音频格式。
wave是什么格式「常见的wave格式的扩展名」
wave是什么格式「常见的wave格式的扩展名」1、WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为“WAV”,数据本身的格式为PCM或压缩型WAVE文件格式是一种由微软和IBM联合开发的用于音频数字存储的标准,它采用RIFF文件格式结构,非常接近于AIFF和IFF格式符合 PIFF。
2、wave是录音时用的标准的windows文件格式,文件的扩展名为“wav”,数据本身的格式为pcm或压缩型,属于无损音乐格式的一种。
3、WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为“WAV”,数据本身的格式为PCM或压缩型怎样打开若是在电脑上打开,使用Windows自带的媒体播放器就可以打开,如今主流的音频播放器都支持打开WAV文件,如千千静听,Rea。
4、wave ,它的后缀是 wav 音频格式。
5、Wave档案是由微软公司所制订的声音规格,由於历史久远,加上微软在其作业系统中大量使用WAVE格式的声音档案,使得此种格式已经成为电脑的标准声音格式,例如进入Windows与离开Windows的声音,与操作滑鼠时的各种事件的声音等等。
6、Wave格式支持MSADPCMCCITT A律CCITTμ律和其他压缩算法,支持多种音频位数采样频率和声道,是PC机上最为流行的声音文件格式但其文件尺寸较大,多用于存储简短的声音片段一般来说,采样的样本尺度信息量越大。
7、WAV为微软公司Microsoft开发的一种声音文件格式,它符合RIFFResource Interchange File Format文件规范,用于保存Windows 平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩。
8、1Wave格式是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持2AIFF是音频交换文件格式的英文缩写,是。
常见音频格式盘点分析
常见音频格式盘点分析
音频格式是指在进行数字音频存储时所用的文件格式,它用来描述音
频文件的特性,压缩方式,支持的技术及其他格式信息。
常见的音频格式
有WAV、AIFF、MP3、OGG、FLAC、WMA等。
1、WAV格式
WAV格式是一种比较常用的数字音频格式,它是由微软公司和IBM开
发的,主要用于存储CD上播放的音频文件。
WAV文件是无损的,能够恰
到好处的保存原始录制的音频数据,但是WAV文件大小很大,不利于传输
和存储。
2、AIFF格式
AIFF格式(Audio Interchange File Format)是苹果公司开发的一
种无损音频格式,主要用于存储音频数据,它也可以用来创建音频CD,
类似于WAV格式,AIFF文件也很大,且不方便存放和传输。
3、MP3格式
MP3是一种经过索尼公司和编码艺术家开发的音频压缩格式,它利用
了哈夫曼编码、时间冗余和混合编码等技术,使音频文件体积大大缩小,
很适合于在网络上传输和存储。
MP3质量和文件大小之间通常是成反比的,一般而言MP3格式的质量要比WAV格式低。
4、OGG格式
OGG格式是一种开放的、免费的带有许可证的压缩音频格式,它提供
比MP3更高的压缩比,并具有较好的声音质量,现在被广泛应用到了网络
和智能手机上。
5、FLAC格式
FLAC格式(Free Lossless Audio Codec)是一种无损压缩的音频格式。
WAV格式中常见的压缩编码
WAV格式中常见的压缩编码(compression code)WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchang e File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道。
标准格式化的WAV文件采样频率为44100Hz,采样比特为16bit,因此标准的(这里说标准,只是一种广泛采用的波形音频方案)WAV文件和C D音频格式一样,也是44.1KHz的取样频率,16位量化数字,在声音文件质量和CD音频相差无几。
下面由useiee详细介绍一下WAV格式文件常见的10种压缩码形式(Compression Cod e)。
[1]1. PCM/uncompressedPulse Code Modulation,脉码调制信号。
是模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。
Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。
PCM脉码调制数字音频格式是70年代末发展起来的,80年代初由飞利浦和索尼公司共同推出。
PCM的音频格式也被DVD-A所采用,它支持立体声和5.1环绕声,1999年由DVD讨论会发布和推出的。
PCM的采样精度从14bit发展到16bit、18bit、20bit直到24bit;采样频率从44.1kHz 发展到192kHz。
到目前为止PCM这种单纯依赖提高采样规格的技术,其可改进的地方已经越来越来小。
只是简单的增加PCM比特率和采样率,不能从底层改善它的根本问题。
2. Microsoft ADPCMAdaptive Differential Pulse Code Modulation,自适应差分脉码调制信号。
几种常见无损音频格式
几种常见无损音频格式Wav格式WAV为微软公司(Microsoft)开发的一种声音文件格式,用于保存Windows平台的音频信息资源,该格式也支持MSADPCM,CCITT A LAW等多种压缩运算法,支持多种音频数字,取样频率和声道,标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化数字。
WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。
常见的WAV文件使用PCM无压缩编码,这使WAV文件的质量极高,体积也出奇大,对于PCM WAV,恐怕也只有无损压缩的音频(例如ape和flac)才能和其有相同的质量,平时我们常见的mp3(即使码率为320kbps),wma和wav的质量都差很远!Ape格式WAV作为数字音乐文件格式的标准,因格式容量过大,使用起来很不方便。
因此,一般情况下我们把它压缩为MP3或APE格式。
压缩方法分为无损压缩(常见的有.ape和.flac),有损压缩(常见的有.mp3),以及混成压缩(常见的有.mpeg)。
常见的MP3格式从压缩的状态还原回去的话,势必会产生损失。
然而APE格式能毫无损失地保留原有音质。
并且把APE还原成原来的WAV格式时,与原文件的MD5值不变。
APE的本质,其实它是一种无损压缩音频格式。
减小文件体积的同时,得到的文件与压缩前的源文件完全一致。
所以APE被誉为“无损音频压缩格式”,APE音频文件是可以直接被播放的。
目前市面上常见的主流播放器均支持ape格式的播放,例如foobar2000,千千静听等。
Flac格式FLAC与MP3相仿,都是音频压缩编码,但FLAC是无损压缩,也就是说音频以FLAC编码压缩后不会丢失任何信息,将FLAC文件还原为WAV文件后,与压缩前的WAV文件内容相同。
可以使用播放器(如千千静听等市面主流播放器)直接播放FLAC 压缩的文件,就象通常播放你的MP3文件一样。
常见的文件(含音乐)格式
常见的声音文件格式常见的声音文件格式包括cda、wav、midi以及mp3。
在网络上常采用的音频文件格式包括wmv、rm、mov。
1. cda: CD Audio的缩写,Philips公司开发,CD音乐所用的格式。
2. wav: Wave波形文档,没有经过压缩的存储格式。
不会失真,但文件较大,1分钟约1.5MB。
3. midi: 电子音乐,常用来作网页背景音乐。
文件小,易失真,1分钟约30KB以下。
4. mp3: 采用去除人耳听不见频率的压缩技术,文件小,失真程度较小,1分钟约1MB。
5. wmv(wma单纯声音):Microsoft公司开发的网络流媒体格式,播放软件Windows内嵌的Media Player1,1分钟约1.5MB的wav文件,转成wmv格式后约为850KB。
6. asf: Microsoft公司早期开发的网络流媒体格式,目前已逐渐被wmv 格式取代。
7. rm(ra单纯声音):RealNetworks公司开发的网络流媒体格式,播放软件为Real player。
1分钟1.5MB的wav文件,转成rm后约为1.3MB。
8. mov: Apple公司开发的线路串流格式,播放软件为QuickTimePlayer,试用版免费。
1分钟1.5MB的Wav档,转档后约为2.5MB,品质很好,不易失真。
常见的文件格式AACE:Ace压缩档案格式ACT:Microsoft office助手文件AIF,AIFF:音频互交换文件,Silicon Graphic and Macintosh应用程序的声音格式ANI:Windows系统中的动画光标ARC:LH ARC的压缩档案文件ARJ:Robert Jung ARJ压缩包文件ASD:Microsoft Word的自动保存文件;Microsoft高级流媒体格式(microsoft advanced streamingformat,ASF)的描述文件;可用NSREX打开 Velvet Studio例子文件ASF:Microsoft高级流媒体格式文件ASM:汇编语言源文件,Pro/E装配文件ASP:动态网页文件;ProComm Plus安装与连接脚本文件;Astound介绍文件AST:Astound多媒体文件;ClarisWorks“助手”文件Axx:ARJ压缩文件的分包序号文件,用于将一个大文件压至几个小的压缩包中(xx取01-99的数字)A3L:Authorware 3.x库文件A4L:Authorware 4.x库文件A5L:Authorware 5.x库文件A3M,A4M:Authorware Macintosh未打包文件A3W,A4W,A5W:未打包的Authorware Windows文件BBAK:备份文件BAS:BASIC源文件BAT:批处理文件BIN:二进制文件BINHex:苹果的一种编码格式BMP:Windows或OS/2位图文件BOOK:Adobe FrameMaker Book文件BOX:Lotus Notes的邮箱文件BPL:Borlard Delph 4打包库BSP:Quake图形文件BUN:CakeWalk 声音捆绑文件(一种MIDI程序)CC0l:台风波形文件CAB:Microsoft压缩档案文件CAD:Softdek的Drafix CAD文件CAM:Casio照相机格式CAP:压缩音乐文件格式CAS:逗号分开的ASCⅡ文件CCB:Visual Basic动态按钮配置文件CCH:Corel图表文件CCO:CyberChat数据文件CCT:Macromedia Director Shockwave投影CDA:CD音频轨道CDF:Microsoft频道定义格式文件CDI:Philip的高密盘交互格式CDM:Visual dBASE自定义数据模块文件CDR:CorelDRAW绘图文件;原始音频CD数据文件CDT:CorelDRAW模板CDX:CorelDRAW压缩绘图文件;Microsoft Visual FoxPro索引文件CFG:配置文件CGI:公共网关接口脚本文件CGM:计算机图形元文件CH:OS/2配置文件CHK:由Windows磁盘碎片整理器或磁盘扫描保存的文件碎片CHM:编译过的HTML文件CHP:Ventura Publisher章节文件CHR:字符集(字体文件)CHT:ChartViem文件;Harvard Graphics矢量文件CIF:Adaptec CD 创建器 CD映像文件CIL:Clip Gallery下载包CIM:SimCity 2000文件CIN:OS/2改变控制文件用于跟踪INI文件中的变化CLASS:Java类文件CLP:Windows 剪贴板文件CLL:Crick Software Clicker文件CLS:Visual Basic类文件CMD:Windows NT,OS/2的命令文件;DOS CD/M命令文件;dBASEⅡ程序文件CPI:Microsoft MS-DOS代码页信息文件CPL:控制面板扩展名,Corel颜色板CPP:C++代码文件CPR:Corel提供说明书文件CPT:Corel 照片-绘画图像CST:Macromedia Director Cast文件CUR:Windows光标文件DDBF:dBASE文件,一种由Ashton-Tate创建的格式,可以被ACT!、Lipper、FoxPro、Arago、Wordtech、Xbase和类似数据库或与数据库有关产品识别;可用数据文件(能被Excel 97打开);Oracle 8.1.x表格空间文件DBX:DataBearn图像;Microsoft Visual FoxPro表格文件DCT:Microsoft Visual FoxPro数据库容器DCU:Delphi编译单元文件DCX:Microsoft Visual FoxPro数据库容器;基于PCX的传真图像;宏DIR:MacromediaDirector文件DLL:动态链接库DOC:FrameMaker或FrameBuilder文档;Word Star文档、WordPerfect文档、Microsoft:Word文档;DisplayWrite文档DOT:Microsoft Word文档模板DPL:Borland Delph 3压缩库DRV:驱动程序DRW:Micrografx Designer/Draw;Pro/E绘画文件DSF:Micrografx Designer VFX文件DSG:DOOM保存的文件DSM:Dynamic Studio音乐模块(MOD)文件DSP:Microsoft Developer Studio工程文件DSQ:Corel QUERY(查询)文件DST:刺绣机图形文件DSW:Microsoft Developer Studio工作区文件DTA:World Bank(世界银行)的STARS数据文件DTD:SGML文档类型定义(DTD)文件DTED:地面高度数字数据(图形的数据格式)文件DTF:Symantec Q&A相关的数据库数据文件DTM:DigiTrakker模块文件DUN:Microsoft拔号网络导出文件DV:数字视频文件(MIME)DWG:AutoCAD工程图文件;AutoCAD或Generic CADD老版本的绘图格式DXR:Macromedia Director受保护(不可编辑)电影文件EEDA:Ensoniq ASR磁盘映像EDD:元素定义文档(FrameMaker+SGML文档)EDE:Ensoniq EPS磁盘映像EDK:Ensoniq KT磁盘映像EDQ:Ensoniq SQ1/SQ2/Ks32磁盘映像EDS:Ensoniq SQ80磁盘映像EDV:Ensoniq VFX-SD磁盘映像EFA:Ensoniq ASR文件EFE:Ensoniq EPS文件EFK:Ensoniq KT文件EFQ:Ensoniq SQ1/SQ2/Ks32文件EFS:Ensoniq SQ80文件EFV:Ensoniq VFX-SD文件EMD:ABT扩展模块EMF:Windows增强元文件EML:Microsoft Outlook Express邮件消息(MIME RTC822)文件EXE:可执行文件(程序)FFAV:Microsoft Outlook导航条FAX:传真类型图像FCD:虚拟CD-ROMFDF:Adobe Acrobat表单文档文件FLA:Macromedia Flash电影FND:Microsoft Explorer保存的搜索文件(Find applet)FON:系统字体FRT:Microsoft FoxPro报表文件FRX:Visual Basic表单文本;Microsoft FoxPro报表文件FXP:经Microsoft FoxPro编译的源文件GGDM:铃声、口哨声和声音板模块格式GetRight:GetRight未完成的下载文件GHO:Norton 克隆磁盘映像GID:Windows 95全局索引文件(包括帮助状态)GIF:CompuServe位图文件GL:动画格式GRP:程序管理组HHEX:Macintosh BinHex2.0文件HLP:帮助文件;Date CAD Windows帮助文件HPP:C++程序头文件HQX:Macintosh BinHex 4.0文件HT:HyperTerminal(超级终端)HTM,HTML:超文本文档HTT:Microsoft超文本模板HTX:扩展HTML模板IICO:Windows图标IDX:Microsoft FoxPro相关数据库索引文件;Symantec Q&A相关数据库索引文件;Microsoft OutlookExpress文件IMG:GEM映像INF:信息文件INI:初始化文件;Mwave DSP Synth的“nwsynth.ini” GMS安装;Cravis Ultrasound bank安装INP:Oracle 3.0版或早期版本的表单源代码INRS:INRS远程通信声频INS:InstallShield安装脚本;X-Internet签字文件;Ensoniq EPS字簇设备;Cell/ⅡMAC/PC抽样设备INT:中间代码,当一个源程序经过语法检查后编译产生一个可执行代码IOF:Findit文档IQY:Microsoft Internet查询文件ISO:根据ISD 9660有关CD-ROM文件系统标准列出CD-ROM上的文件ISP:X-Internet签字文件IST:数字跟踪设备文件ISU:InstallShield卸装脚本IT:脉冲跟踪系统音乐模块(MOD)文件ITI:脉冲跟踪系统设备ITS:脉冲跟踪系统抽样,Internet文档位置IV:Open Inventor中使用的文件格式IVD:超过20/20微观数据维数或变量等级文件IVP:超过20/20的用户子集配置文件IVT:超过20/20表或集合数据文件IVX:超过20/20微数据目录文件IW:Idlewild屏幕保护程序IWC:Install Watch文档JJ62:Ricoh照相机格式JAR:Java档案文件(一种用于applet和相关文件的压缩文件)JAVA:Java源文件JAR:Java档案文件(一种用于applet和相关文件的压缩文件)JAVA:Java源文件JFF,JFIF,JIF:JPEG文件JPE,JPEG,JPG:JPEG图形文件JS:javascript源文件JSP:HTML网页,其中包含有对一个Java servlet的参考KKAR:卡拉OK MIDI文件(文本+MIDI)LLAB:Visual dBASE标签文件LBT,LBX:Microsoft FoxPro标签文件LDB:Microsoft Access加锁文件LHA:LZH更换文件后缀LOG:日志文件LZH:LH ARC压缩档案MM1V:MPEG相关文件(MIME"mpeg"类型)M3D:Corel Motion 3D动画文件M3U:MPEG URL(MIME声音文件)MAM:Microsoft Access宏MAQ:Microsoft Access查询文件MAR:Microsoft Access报表文件MBX:Microsoft Outlook保存email格式;Eudora邮箱MCW:Microsoft Word的Macintosh文档MDB:Microsoft Access数据库MDN:Microsoft Access空数据库模板MDW:Microsoft Access工作组文件MID:MIDI音乐MMM:Microsoft多媒体电影MOV:QuickTime for Windows电影MP2:第二层MPEG音频文件MP3:第三层MPEG音频文件MPA:MPEG相关文件,MIME“mpeg类型”MPE,MPEG,MPG:MPEG动画文件MPP:Microsoft工程文件;CAD绘图文件格式MPR:Microsoft FoxPro菜单(已编译)MSI:Windows 安装器包MSN:Microsoft 网络文档;Descent Mission文件OOBD:Microsoft Office活页夹OBJ:对象文件OBZ:Microsoft Office活页夹向导OCX:Microsoft对象链接与嵌入定制控件ODS:Microsoft Outlook Express邮箱文件OFT:Microsoft Outlook模板OPX:OPL扩展DLL(动态链接库)OSS:Microsoft Office查找文件OST:Microsoft Exchange / Outlook 离线文件PPAL:压缩文件PART:Go!Zilla部分下载文件PAS:Pascal源代码PCS:PICS动画文件PDF:Adobe Acrobat可导出文档格式文件(可用Web浏览器显示);Microsoft系统管理服务器包定义文件;NetWare打印机定义文件PHP,PHP3:包含有PHP脚本的HTML网页PHTML:包含有PHP脚本的HTML网页;由Perl分析解释的HTMLPM5:Pagemaker 5.0文件PM6:Pagemaker 6.0文件PPS:Microsoft Powerpoint幻灯片放映PPT:Microsoft Powerpoint演示文稿PRF:Windows系统文件,Macromedia导演设置文件PSD:Adobe photoshop位图文件PSM:Protracker Studio模型格式;Epic游戏的源数据文件PST:Microsoft Outlook个人文件夹文件PWL:Windows 95口令列表文件QQIF:QuickTime相关图像(MIME);Quicken导入文件QT,QTM:QuickTime电影QTI,QTIF:QuickTime相关图像QTP:QuickTime优先文件QTS:Mac PICT图像文件;QuickTime相关图像QTX:QuickTime相关图像RRA:RealAudio声音文件RAM:RealAudio元文件RAR:RAR压缩档案(Eugene Roshall格式)REC:录音机宏;RapidComm声音文件REG:注册表文件REP:Visual dBASE报表文件RES:Microsoft Visual C++资源文件RM:RealAudio视频文件RMF:Rich Map格式(3D游戏编辑器使用它来保存图)ROM:基于盒式磁带的家庭游戏仿真器文件(来自Atari 2600、Colecovision、Sega、Nintendo等盒式磁带里的ROM完全拷贝,在两个仿真器之间不可互修改)Rxx:多卷档案上的RAR压缩文件(xx=1~99间的一个数字)SSAV:游戏保存文件SB:原始带符号字节(8位)数据SBK:Creative Labs的Soundfont 1.0 Bank文件;(Soundb laster)/EMU SonndFont v1.x Bank文件SBL:Shockwave Flash对象文件SCF:Windows Explorer命令文件SCH:Microsoft Schedule+1SCP:拨号网络脚本文件SCR:Windows屏幕保护;传真图像;脚本文件SFX:RAR自解压档案SHTML:含有服务器端包括(SSI)的HTML文件SPL:Shockwave Flash对象;DigiTrakker抽样SQL:Informix SQL查询;通常被数据库产品用于SQL查询(脚本、文本、二进制)的文件扩展名STM:.shtml的短后缀形式,含有一个服务端包括(SSI)的HTML文件;Scream Tracker V2音乐模块(MOD)文件STR:屏幕保护文件SWA:在Macromedia导演文件(MP3文件)中的Shockwave声音文件SYS:系统文件TT64:Commodore 64仿真器磁带映像文件THEME:Windows 95桌面主题文件TIF,TIFF:标签图像文件格式(TIFF)位图TMP:Windows临时文件TRM:终端文件TXT:ASCⅡ文本格式的声音数据TZ:老的压缩格式文件VVBA:VBase文件VBP:Microsoft Visual Basic工程文件VBW:Microsoft Visual Basic工作区文件VBX:Microsoft Visual Basic用户定制控件VQE,VQL:Yamaha Sound-VQ定位器文件VQF:Yamaha Sound-VQ文件(可能出现标准)VRF:Oracle 7配置文件VSL:下载列表文件(GetRight)WWAB:Microsoft Outlook文件WAD:包含有视频、玩家水平和其他信息的DOOM游戏的大文件WAL:Quake 2正文文件WAV:Windows波形声形WBK:Microsoft Word备份文件WFM:Visual dBASE Windows表单WFN:在CorelDRAW中使用的符号WIZ:Microsoft Word向导WRL:虚拟现实模型WWL:Microsoft Word内插器文件XXLK:Microsoft Excel备份XLL:Microsoft Excel内插器文件XLM:Microsoft Excel宏XLS:Microsoft Excel工作单XLT:Microsoft Excel模板XLV:Microsoft Excel VBA模块XLW:Microsoft Excel工作簿/工作区ZZAP:Windows软件安装配置文件ZIP:Zip文件000-999:用于为老版本(或备份)文件编号(比如:被安装程序改变的CONFIG.SYS 文件);又可用于为小范围的PC应用程序的多个用户相关数据文件编号12M:Lotus 1-2-3 97 SmartMaster文件123:Lotus 1-2-3 97文件2D:VersaCAD的2维绘画文件2GR,3GR:在Windows之下的VGA图形驱动程序/配置文件386:在386或更高级处理器上使用的文件3D:VersaCAD的3维绘画文件3DM:3D NURBS建模器,Rhino3DS:3D Studio(DOS下)格式文件386:在386或更高级处理器上使用的文件4GE:Informix 4GL编译后代码4GL:Informix 4GL源代码。
格式
MP3早已成为了时尚元素中一个不可或缺的流行符号,它所支持的音频格式有8种左右,而常见的音频格式只有6种。
今天我们就向大家介绍一下这几种常见的音频格式。
WAV格式WAV是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。
“*.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV 文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数。
MP3格式MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。
根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。
需要提醒大家注意的地方是:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz 到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。
由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为*.mp3格式的发展提供了良好的条件。
直到现在,这种格式还是风靡一时,作为主流音频格式的地位难以被撼动。
但是树大招风,MP3音乐的版权问题也一直是找不到办法解决,因为MP3没有版权保护技术,说白了也就是谁都可以用。
MP3格式压缩音乐的采样频率有很多种,可以用64Kbps或更低的采样频率节省空间,也可以用320Kbps的标准达到极高的音质。
我们用装有Fraunhofer IIS Mpeg Lyaer3的MP3编码器(现在效果最好的编码器)MusicMatch Jukebox 6.0在128Kbps的频率下编码一首3分钟的歌曲,得到2.82MB的MP3文件。
WAV格式解析
ID big-endian FOURCC 值为'R' 'I' 'F' 'F' Size little-endian data字段中数据的字节数Data big-endian包含其它的chunkID big-endian FOURCC 值为 'f' 'm' 't' ' 'Size little-endian数据字段包含数据的⼤⼩。
如⽆扩展块,则值为16;有扩展块,则值为 16 + 2字节扩展块长度 + 扩展块长度或者值为18(只有扩展块的长度为2字节,值为0)Data little-endianformat_tag2字节,表⽰⾳频数据的格式。
如值为1,表⽰使⽤PCM格式。
little-endianchannels2字节,声道数。
值为1则为单声道,为2则是双声道。
little-endiansamples_per_sec采样率,主要有22.05KHz,44.1kHz和48KHz。
little-endianbytes_per sec⾳频的码率,每秒播放的字节数。
samples_per_sec *channels * bits_per_sample / 8,可以估算出使⽤缓冲区的⼤⼩little-endianblock_align数据块对齐单位,⼀次采样的⼤⼩,值为声道数 * 量化位数 / 8,在播放时需要⼀次处理多个该值⼤⼩的字节数据。
WAV格式解析WAV为微软公司(Microsoft)开发的⼀种声⾳⽂件格式,它符合RIFF(Resource Interchange File Format)⽂件规范,⽤于保存Windows平台的⾳频信息资源,被Windows平台及其应⽤程序所⼴泛⽀持,该格式也⽀持MSADPCM,CCITT A LAW等多种压缩运算法,⽀持多种⾳频数字,取样频率和声道,标准格式化的WAV⽂件和CD格式⼀样,也是44.1K的取样频率,16位量化数字,因此在声⾳⽂件质量和CD相差⽆⼏。
声音文件的格式
Wav格式 Wav格式:由microsoft公司的一种音频文件格式。其缺 格式: 点是文件体积较大(1分钟cd音质的wav文件要占用 10mb左右的硬盘空间)。 Midi格式: Midi格式:midi是数字音乐/电子合成乐器的统一国际 格式 标准。一分钟的midi文件只有3.4kb,要比wav文件小 得多。 Mp3格式: Mp3格式:一种具有很高的压缩率的音频文件。1分钟 格式 Cd音质的音乐,经过mp3压缩后只有1mb左右,同时音 质基本保持不失真。
作业要求
• 每个同学找齐所有格式的文件(各一个, wav,midi,mp3,wma) • 总结查找的方法 • 打字练习内容:课本p2第一段第三句话, 从“本单元将以windows的媒体播放 器……学习多媒体的处理技术。”
录音机的使用
1、录音:如何知道声音已经录制好? 2、保存 3、进行简单的编辑 4、录音的条件:电脑,话筒(条件可许,回家各自 试验)
声音文件的格式
Real audio格式:real networks公司开发的一种新 audio格式: 格式 型音频流文件格式,主要用于在低速率的因特网上实 时传输音频信息。其文件比mp3更小,所以成为在线 音乐和在线广播事实上的标准格式。 Wma格式: Wma格式:由microsoft公司推出的与mp3格式齐名的 格式 一种音频格式。它在压缩比和音质方面超过了mp3和 au: 1 每位同学介绍不同的动植物各一种(一种 植物,一种动物),小组同学不能重复。 2 要有文字,图片(至少3张),动物的声音。 3 资料保存在网络上。 4 利用资料做成演示文稿,其中一页要求插入 声音。也保存在网络上。
濒危物种
一.确定课题:确定你想要研究的濒危动植物。 二.从以下几方面进行介绍:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 音频简介经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等. 44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;当然也可以有 16bit 的单声道或 8bit 的立体声, 等等。
采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。
采样值是指每一次采样周期内声音模拟信号的积分值。
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位(左声道)和低八位(右声道)分别代表两个声道。
人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。
这和电影的每秒 24 帧图片的道理差不多。
每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个 wav 文件的播放长度。
譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是 "22050HZ /16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到),那么它的每秒的传输速率(位速, 也叫比特率、取样率)是 22050*16*2 =705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒),播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。
但是这还不够精确, 包装标准的 PCM 格式的 WAVE 文件(*.wav)中至少带有 42 个字节的头信息, 在计算播放时间时应该将其去掉,所以就有:(424644-42) / (22050*16*2/8) ≈ 4.8140816(秒). 这样就比较精确了.关于声音文件还有一个概念: "位速", 也有叫做比特率、取样率, 譬如上面文件的位速是705.6kbps 或 705600bps, 其中的 b 是 bit, ps是每秒的意思;压缩的音频文件常常用位速来表示, 譬如达到 CD 音质的 MP3 是: 128kbps / 44100HZ.2. wave文件格式2.1 概述WAVE文件是计算机领域最常用的数字化声音文件格式之一,它是微软专门为Windows系统定义的波形文件格式(Waveform Audio),由于其扩展名为"*.wav"。
WAVE是录音时用的标准的WINDOWS文件格式,文件的扩展名为“WAV”,数据本身的格式为PCM或压缩型。
WAV文件格式是一种由微软和IBM联合开发的用于音频数字存储的标准,它采用RIFF文件格式结构,非常接近于AIFF和IFF格式。
符合 PIFF Resource Interchange File Format规范。
所有的WAV都有一个文件头,这个文件头音频流的编码参数。
WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。
| Data Chunk || ID = "data" |-------------------------------------------图 Wav格式包含Chunk示例Fact Chunk=======================================| |所占字节数| 具体内容 |=======================================| ID | 4Bytes | "fact" |---------------------------------------| Size | 4Bytes | 4 |---------------------------------------| data | 4Bytes |解压后的音频数据的大小(B)|---------------------------------------图 Fact Chunk2.3 Wave文件格式详细说明别名字节数类型注释ckid 4 char "RIFF" 标志, 大写cksize 4 int32 文件长度。
这个长度不包括"RIFF"标志和文件长度本身所占字节, 下面的子块大小也是这样。
fcc type 4 char "WAVE" 类型块标识, 大写。
ckid 4 char 表示"fmt" chunk的开始。
此块中包括文件内部格式信息。
小写, 最后一个字符是空格。
cksize 4 int32 文件内部格式信息数据的大小。
FormatTag 2 int16 音频数据的编码方式。
1 表示是 PCM 编码Channels 2 int16 声道数,单声道为1,双声道为2SamplesPerSec 4 int32 采样率(每秒样本数), 比如 44100 等 BytesPerSec 4 int32 音频数据传送速率, 单位是字节。
其值为采样率×每次采样大小。
播放软件利用此值可以估计缓冲区的大小。
BlockAlign 2 int16 每次采样的大小 = 采样精度*声道数/8(单位是字节); 这也是字节对齐的最小单位, 譬如 16bit 立体声在这里的值是 4 字节。
播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。
BitsPerSample 2 int16 每个声道的采样精度; 譬如 16bit 在这里的值就是16。
如果有多个声道,则每个声道的采样精度大小都一样的。
[cbsize] 2 int16 [可选]附加数据的大小。
[...] x[ckid] 4 char "fact".ckid 4 char 表示 "data" chunk的开始。
此块中包含音频数据。
小写。
cksize 4 int32 音频数据的长度...... 文件声音信息数据(真正声音存储部分)[......] 其它 chunk2.4 Windows平台上WAVEFORMAT结构的认识PCM和非PCM的主要区别是声音数据的组织不同,这些区别可以通过两者的WAVEFORMAT结构来区分。
下面以PCM和IMA-ADPCM来进行对比。
WAVE的基本结构 WAVEFORMATEX 结构定义如下:1typedef struct2{3WORD wFormatag; //编码格式,包括WAVE_FORMAT_PCM,WAVEFORMAT_ADPCM4WORD nChannls; //声道数,单声道为1,双声道为2;56DWORD nSamplesPerSec; //采样频率;78DWORD nAvgBytesperSec;//每秒的数据量;910WORD nBlockAlign; //块对齐;1112WORD wBitsPerSample; //WAVE文件的采样大小;1314WORD cbSize; // The count in bytes of the size of extra15// information(after cbSize). PCM中忽略此值16} WAVEFORMATEX;IMAADPCMWAVEFORMAT结构定义如下:1Typedef struct2{3WAVEFORMATEX wfmt;45WORD nSamplesPerBlock;67} IMAADPCMWAVEFORMAT;IMA-ADPCM中的的wfmt->cbsize不能忽略,一般取值为2,表示此类型的WAVEFORMAT 比一般的WAVEFORMAT多出2个字节。
这两个字符也就是nSamplesPerBlock。
"fact" chunk的内部组织在非PCM格式的文件中,一般会在WAVEFORMAT结构后面加入一个 "fact" chunk, 结构如下:view sourceprint?1 typedef struct{23 char[4]; //“fact”字符串45 DWORD chunksize;67 DWORD datafactsize; // 音频数据转换为PCM格式后的大小。
89 } factchunk;datafactsize是这个chunk中最重要的数据,如果这是某种压缩格式的声音文件,那么从这里就可以知道他解压缩后的大小。
对于解压时的计算会有很大的好处!2.5 "data" chunk的内部组织从 "data" chunk的第9个字节开始,存储的就是声音信息的数据了,(前八个字节存储的是标志符 "data" 和后接数据大小size(DWORD)。
这些数据可以是压缩的,也可以是没有压缩的。
3. PCM数据格式PCM(Pulse Code Modulation)也被称为脉码编码调制。
PCM中的声音数据没有被压缩,如果是单声道的文件,采样数据按时间的先后顺序依次存入。
(它的基本组织单位是BYTE(8bit)或WORD(16bit))一般情况下,一帧PCM是由2048次采样组成的( 参考/forum/showthread.php?129458-请问PCM格式的音频流,每次读入或输出的块的大小是必须固定为4096B么&s=e79e9dd1707157281e3725a163844c49 )。
Wave文件的格式非常混乱。
如果把wave文件的格式比作盆汤,毫无疑问有太多的厨师在完全未经协调的情况下,向这道汤里添加了太多的佐料。