多种音频格式解释
7种常见的音频格式简析
7种常见的音频格式简析(MP3,WMA,WAV,APE,FLAC,OGG,AAC)MP3全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer Ⅲ),是当今最为流行的一种数字音频编码和有损压缩格式,在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。
它设计用来大幅度地降低音频数据量,而对于大多数用户来说重放的音质与最初的不压缩音频相比感觉不到很大的下降。
简单地说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。
MP3是利用MPEG Audio Layer 3 的技术,将音乐以1:10 甚至1:12 的压缩率,压缩成容量较小的文件。
换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度,而且还可以较好的保持了原来的音质。
另外,正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。
每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。
使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。
● MP3格式特点MP3是一个有损数据压缩格式,它丢弃掉脉冲编码调制(PCM)音频数据中对人类听觉不重要的数据(类似于JPEG是一个有损图像压缩),从而达到了小得多的文件大小(其在较大的压缩率以及基本保持低音频部分不失真的情况下,以牺牲声音文件中12kHz到16kHz的高音频部分来实现小文件)。
MP3音频可以按照不同的位速进行压缩,提供了在数据大小和声音质量之间进行权衡的一个范围。
另外,MP3格式使用了混合的转换机制将时域信号转换成频域信号。
例如,我们平时在网上见到的一些低质的MP3有64kbps,但好的也有320kbps的,两者声音差距也相当明显。
研究音频的本质,详解各种音频格式的区别
研究音频的本质,详解各个音频格式的区别总共分为6个部分,分别是wav格式的介绍,有损格式的介绍,无损压缩格式的介绍,各音频格式的频谱分析,以及基于分析在音频文件选择上做的推荐,后添加有损压缩格式的比较。
1.wav音频格式的三大参数,及各参数对于音频文件的含义wav文件有4个参数,分别是采样频率,声道数,量化位数,以及码率共4个而这4个参数里最好理解的就是声道数,所以不对此参数进行介绍那么我将要介绍的参数就是采样频率F,量化位数B,和码率R采样频率在三个参数里面最重要的是采样频率,后面两个参数都是基于在传输存储过程中根据要求而得到的,唯独采样频率,它是把模拟世界的信号带到数字世界的桥梁。
在讲采样频率前,我们可以先回忆一下我们初中时学抛物线时的情景。
在初中时,老师教我们画抛物线时,是用什么方法画的??如果大家回想起来的话,就应该记得,是5点法。
是的,用5个点就可以近似的把抛物线给画出来。
音频信号是啥呢?其实是余弦波,只是这个余弦波的频率和幅值都是随时间的变量而已。
我们要对这个音频信号进行记录,不可能把每一时刻的值都记录,但是,我们可以参考画抛物线的方法,用尽量少的点去精确的描绘这个音频信号。
而采样频率,它干的就是这个活,也就是一秒内我们要记录这个音频信号多少个点,就能近似精确的表达这个音频信号。
在信号处理,有这么一个定理,叫奈奎斯特定理。
这个定理怎么得来,你们不用知道,这个是信号处理专业的人才需要知道。
我们只需了解的是,这个定理它告诉我们,如果我们要精确的记录一个信号,我们的采样频率必须大于等于音频信号的最大频率的两倍,记住,是最大频率。
也就是F>=2*fmax。
而在wav格式里,F=44.1kHz。
我们知道,人耳的听音频率范围是20-20kHz,也就是说,如果我们要精确记录这个音频信号,采样频率最低起码是40kHz。
这就是为啥是44.1kHz而不是其他的频率。
量化位数虽然有了采样频率,我们可以精确记录音频信号,然而,这些记录过的音频信号是模拟量,对于计算机而言,是无法处理的。
常见音频格式及其含义
常见音频格式及其含义传统的视频剪辑是应用线性编辑机器,直接将连接的多路信号通过切换台剪辑,或者使用磁带介质进行插入或者覆盖编辑进行的。
现在随着计算机技术的发展和高运算速率的计算机的普及使得数字化的视频后期剪辑技术不断发展。
为了更有效地存储和编辑影像文件,在后期编辑的过程中,首先需要对其进行压缩处理。
而视频文件的不同格式事实上就是多种不同的压缩标准。
常见的视频文件格式有哪些呢。
用于存储影像的视频格式多种多样,其中最有代表性的就是MPEG数字视频格式和A Vl 数字视频格式。
常用的视频存储格式主要有以下几种。
一、AVI格式(Audio/Video Interleave)它的英文全称为Audio Video Interleaved,即音频视频交错格式。
它于1992年被Microsoft 公司推出,随Windows3.1一起被人们所认识和熟知。
所谓“音频视频交错”,就是可以将视频和音频交织在一起进行同步播放。
这种视频格式的优点是兼容性好、调用方便、图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的A VI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的A VI格式视频,所以我们在进行一些A VI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时间、只有声音没有图像等一些莫名其妙的问题,如果用户在进行A VI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决。
谈到A VI格式不能不说说DV-A VI格式:DV的英文全称Digital Video Format,是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。
目前非常流行的数码摄像机就是使用这种格式记录视频数据的。
它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。
音频编码格式介绍
由于其高效的压缩和良好的音质,AAC在移动设备上广泛使用,如 iPhone、Android等。
AAC编码格式的优缺点
优点
高音质、高压缩效率、良好的兼容性和多声道支持。
缺点
相对于无损压缩格式,AAC仍然是一种有损压缩格式,会损失一些音频细节。
04 FLAC编码格式
FLAC编码格式的特点
无损压缩
格式也是一个不错的选择。
WAV编码格式的优缺点
优点
无损压缩、兼容性强、能够保留原始音频的所有细节。
缺点
存储空间大、传输速度慢、不适合网络传输和流媒体应用。
THANKS FOR WATCHING
感谢您的观看
FLAC编码格式的应用场景
音乐收藏
对于那些希望保留原始音乐质量 的人来说,FLAC是一个很好的选 择,特别是对于那些珍贵的或稀 有的音乐收藏。
高品质音频需求
对于那些对音质有高要求的音乐 爱好者或专业音频工作者,FLAC 是一个理想的选择。
备份
由于FLAC能够无损压缩,它也常 被用作备份原始音频文件的格式, 以防止数据丢失。
缺点
由于采用有损压缩,部分音频细节会 丢失;一些老旧的设备可能不支持播 放MP3格式;版权保护机制较弱,容 易遭受盗版侵权。
03 AAC编码格式
AAC编码格式的特点
高质量
AAC编码格式提供了较高的音频质量,接近 于无损压缩。
压缩效率
相对于MP3,AAC提供了更高的压缩效率, 文件大小相对较小。
兼容性
有16位、24位等。
02 MP3编码格式
MP3编码格式的特点
1 2
高压缩率
MP3采用了一种名为MPEG-2 Layer III的压缩算 法,能够在较低的比特率下实现较高的音质。
常用音频格式介绍
常用音频格式介绍
音频格式是文件的一种格式,可以存储声音信息,有助于为多种设备
提供有关声音的服务。
它为音乐和声音文件的处理提供了便利。
其中,常
用的音频格式有WAV、MP3、AAC、WMA等。
WAV(Wave)格式是一种无损音频格式,是微软公司和IBM公司开发的,它们同时也设计了ADPCM等压缩格式,能够在数字设备中储存音频数据,由于它的简易性、完整性和容量大,一般被用来存储CD质量的音乐
文件。
MP3(MPEG-1 Audio Layer 3)格式是压缩后的音频文件格式,使用MPEG-1和MPEG-2的音频编码技术,能将原本音频资料压缩到原来的一半
至一十分之一,但保持很高的音质。
AAC(Advanced Audio Coding)格式是一种无损压缩的音频编码技术,可以将原始的音频文件压缩到原来的一半至一十分之一,其压缩率和编码
效率比MP3高,相比之下,AAC在压缩率以及传输速度上都有更好的表现。
WMA(Windows Media Audio)格式是一种无损的数字音频编码技术,
它是微软公司开发的,不仅可以表示CD质量的音频,还可以存储较少的
音乐数据,以满足不同的网络带宽要求。
OGG(Ogg Vorbis)格式是一种无损的音频压缩格式,它是自由软件
的后来者,它的压缩率比MP3和AAC的压缩率高,能够在不降低声音质量
的情况下再次压缩音频文件。
音频文件格式全介绍
音频文件格式全介绍作者:苏信时间:2021年7月本文已经刊登于《新电脑》2021年7月号,请勿转载.自从PC支持多以来,陆陆续续地出现了许多音频格式.这些格式既有流行的也有不那么流行的,它们的,本文向你一一道来。
主流目前的主流音频格式其实不少。
不同的格式有自己的用途,比如大家都应该很熟悉的MP3格式就是用于聆听用途的。
下面我们逐一介绍:存在便是永恒—WW是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。
不客气地说,它实际上是Apple电脑的AIFF格式的克隆。
通常我们使用W格式都是用来保存一些没有压缩的音频,但实际上W格式的设计是非常灵活(非常复杂)的,该格式本身与任何数据都不冲突,换句话说,只要有软件支持,你甚至可以在W格式里面存放图像。
之所以能这样,是因为W文件里面存放的每一块数据都有自己的标识,通过这些标识可以告诉用户究竟这是什么数据。
在WINDOWS平台上通过ACM(Audio press ion Manager)结构及相应的驱动程序(在这里通常称为CODEC,编码/),可以在W文件中存放超过20种的压缩格式,比如ADPCM、G、CCITT G。
711、G.723等等,当然也包括MP3格式。
图表-使用音频编辑软件WeCN()列出Windows安装了的ACM驱动信息虽然W文件可以存放压缩音频甚至mp3,但由于它本身的结构注定了它的用途是存放音频数据并用作进一步的处理,而不是像mp3那样用于聆听。
目前所有的音频播放软件和编辑软件都支持这一格式,并将该格式作为默认文件保存格式之一。
这些软件包括:Sound Forge,Cool Edit Pro, WeLab等等。
由于W的支持实在是太广泛了,可以说,即使Windows退出历史舞台,W格式也不会.老当益壮– mp3第二个要提到的就是改变了世界的mp3了。
这个比喻相信大家都**意。
各种音频格式介绍大全
各种音频格式介绍大全AAC音频的来源及特性其实,AAC的技术早在1997年就成型了,当时被称为MPEG-2 AAC,但是随着2000年MPEG-4音频标准的出台,MPEG-2 AAC被用在这一标准中,同时追加了一些新的编码特性,所以它就改称为MPEG-4 AAC。
与MP3不同,AAC的技术掌握在多家厂商手中,这使得AAC编码器非常多,既有纯商业的编码器,也有完全免费的编码器。
纯商业的编码器如Fraunhofer IIS 的FhG、杜比公司的Dolby AAC,免费的有Free AAC、苹果公司的iTune,Nero也通过它的Nero 6提供了Nero AAC。
AC是一种高压缩比的音频压缩算法,它的压缩比可达20:1,远远超过了AC-3、MP3等较老的音频压缩算法。
一般认为,AAC格式在96Kbps码率的表现超过了128Kbps的MP3音频。
AAC另一个引人注目的地方就是它的多声道特性,它支持1~48个全音域音轨和15个低频音轨。
除此之外,AAC 最高支持96KHz的采样率,其解析能力足可以和DVD-Audio的PCM编码相提并论,因此,它得到了DVD论坛的支持,成为了下一代DVD的标准音频编码。
AAC的家族非常庞大,有9种规格,可适应不同场合应用的需要。
其中LC 低复杂性规格去掉了预测和增益控制模块,降低了复杂度,提高编码效率,是目前使用得最多的规格。
CD:一般来说大家能听到最好的音频格式就是CD了,CD是无损的格式,所以能最大限度的还原声音,而且CD的解码比起其他格式,如MP3等要容易,但同时CD的体积也很大,标准CD格式也就是44.1K的采样频率,速率1411KB/S,16位量化位数,其实CD是以音轨的形式存在的,在电脑上识别为*.cda的样子,这个cda文件只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。
所以直接复制这个文件到硬盘上是没有用的,如果想复制的话我们只有用软件把它转换成其他的格式。
多媒体音频格式解析WMA WAV OGG AAC APE FLAC
多媒体音频格式解析WMA WA V OGG AAC APE FLAC[转载] 收藏首先博士像先讲一讲何谓“真人真唱”铃声--我们有时候会看到,手机说明明明写着真人真唱,而且手机的营业员也这么说,我们很高兴买回去后,发现却不能播放MP3!其实,这是因为了解不足所产生的误会,所谓的真人真唱,通常指的是使用日AMAHA声音芯片的手机,使用MMF可以有短暂的人声和动物声的逼真模拟,而并不是专指MP3,而且不只MP3能支持唱整首歌,WA V、AAC、WMA等很多种文件格式也支持。
首先博士像先讲一讲何谓“真人真唱”铃声--我们有时候会看到,手机说明明明写着真人真唱,而且手机的营业员也这么说,我们很高兴买回去后,发现却不能播放MP3!其实,这是因为了解不足所产生的误会,所谓的真人真唱,通常指的是使用日AMAHA声音芯片的手机,使用MMF可以有短暂的人声和动物声的逼真模拟,而并不是专指MP3,而且不只MP3能支持唱整首歌,WAV、AAC、WMA等很多种文件格式也支持。
MP3:MP3是利用一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。
因为人耳只能听到一定频段内的声音,而其他更高或更低频率的声音对人耳是没有用处的,所以MP3技术就把这部分声音去掉了,从而使得文件体积大为缩小,但在人耳听起来却并没有什么失真。
MP3可以将声音用1∶10甚至1∶12的压缩率进行压缩,举个例子一般来说一张光碟容量为650M,作为CD它能容纳的不过是60到90分钟的音乐(15 首左右的歌曲),一首5分钟的歌曲要占用50M左右的空间,而一首5分钟的MP3歌曲体积只有4~5M,一张光碟能放上一百多收首MP3歌曲。
MP3的体积小,音质却非常接近CD,是一种很不错的音乐文件格式。
单音铃声:九十年代中后期,随着移动通讯由模拟网络发展到数字网络,音乐铃声开始出现了,这种铃声是通过专用的“可编程铃声电路”产生音乐信号,再通过扬声器或听筒来发出音乐的,但这种铃声虽然有音调的变化,但无法表现出自然界声音的音色和发音过程,因而无法模拟出乐器的真实效果。
多媒体文件格式
多媒体文件格式多媒体文件格式是用于存储、传输和呈现各种类型多媒体内容的文件格式。
多媒体文件可以包括音频、视频、图像和文本等多种形式的数据。
本文将介绍一些常见的多媒体文件格式,以及它们的特点和用途。
一、音频文件格式⒈ MP3格式MP3是一种常用的音频压缩格式,它能够在保持较高音质的同时,将音频文件的大小大大减小。
MP3格式广泛应用于音乐播放和存储设备中。
⒉ WAV格式WAV是一种无损的音频文件格式,它能够保持较高的音质,但文件大小较大。
WAV格式通常用于专业音频处理和录制过程中。
⒊ FLAC格式FLAC是一种无损的音频文件格式,它能够保持原始音质,同时将文件大小大大减小。
FLAC格式适用于对音质要求高的应用场合,如音乐制作和无损音乐存储。
二、视频文件格式⒈ AVI格式AVI是一种常见的视频文件格式,它可以包含多种编码和压缩方式。
AVI格式适用于在计算机和各种播放设备上播放和编辑视频。
⒉ MP4格式MP4是一种常用的视频文件格式,它采用较高的压缩比,能够在保持较好画质的同时,减小文件大小。
MP4格式广泛应用于在线视频播放和移动设备上。
⒊ MKV格式MKV是一种开放、通用的多媒体容器格式,可以包含多种音频、视频和字幕等文件。
MKV格式适用于存储高清视频和特殊功能的需要。
三、图像文件格式⒈ JPEG格式JPEG是一种常用的图像文件格式,它采用有损压缩方法,能够在减小文件大小的同时,保持较好的图像质量。
JPEG格式广泛应用于数字照片和网络图片。
⒉ PNG格式PNG是一种无损压缩的图像文件格式,它能够保持图像的细节和透明效果。
PNG格式适用于需要保持图像质量和透明背景的应用场合。
⒊ GIF格式GIF是一种支持动画和透明效果的图像文件格式,它能够将多张图像合并成一个文件进行播放。
GIF格式适用于制作简单动画和图标等应用。
四、文本文件格式⒈ TXT格式TXT是一种纯文本文件格式,它只包含文本的字符信息,不支持样式和格式。
各种音频格式详解
各种音频格式详解说说这种格式好?它的确可以将所有声音都表现出来,但是要有好的音源,要是用MP3之类的歌曲转换的话,还是别了,他不会多音质有任何提高,反而会使文件体积变为以前的10倍以上。
实在是没必要。
当今世界上音质最好的音频格式是什么?当然是CD了。
它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。
它会让你感受到天籁之音。
CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。
一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。
注意:不能直接的复制CD格式的*.cda 文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WA V,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。
推荐大家使用这种方法。
WA V:无损的音乐是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。
“*.W A V”格式支持MSADPCM、CCITT A LA W等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WA V文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,看到了吧,WA V格式的声音文件质量和CD相差无几,也是目前PC 机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WA V格式。
MP3:流行的风尚MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。
根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。
常用音频文件格式
常用音频文件格式1、cd——*.cda文件——基本无损——不能直接拷贝即我们通常所说的CD音轨,是我们所熟悉的CD音乐光盘中的文件格式。
标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。
CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。
一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短。
在电脑上看到的“*.cda文件”都是44字节长,不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用Windows Media Player/格式工厂把CD格式的文件转换成WAV。
2、wav、wave格式——波形文件——基本无压缩WAV是波形文件,可直接存储声音波形,还原的波形曲线十分逼真。
WAV文件格式简称WAV格式是一种存储声音波形的数字音频格式,是最常见的声音文件格式之一,是微软公司专门为Windows开发的一种标准数字音频文件,该文件能记录各种单声道或立体声的声音信息,并能保证声音不失真。
但WAV文件有一个致命的缺点,就是它所占用的磁盘空间太大(每分钟的音乐大约需要12兆磁盘空间)。
声音文件质量和CD相差无几。
能够真实记录自然声波形,基本无压缩,数据量大。
3、mp3格式——音频压缩技术——占用空间小MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3,简称为MP3。
它被设计用来大幅度地降低音频数据量。
利用 MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。
用MP3形式存储的音乐就叫作MP3音乐,能播放MP3音乐的机器就叫作MP3播放器。
最高参数的MP3(320Kbps)的音质较之CD的,FLAC和APE无损压缩格式的差别不多,其优点是压缩后占用空间小,适用于移动设备的存储和使用。
音频格式介绍
⾳频格式介绍⾳频格式介绍电脑上常见的⾳频通常分为合成声⾳(midi)和波形声⾳(pcm)两⼤类。
其中,合成声⾳是⼀种⾳乐演奏指令的序列,就像乐谱⼀样,可以利⽤声⾳输出设备或与电脑相连的电⼦乐器进⾏演奏,本⾝不包含具体声⾳数据,依靠具体的声⾳合成器。
⽽波形声⾳则是通过录⾳设备录制的原始声⾳波形,直接记录了真实声⾳的⼆进制采样数据。
就像是图像中的⽮量图和点阵图⼀样。
相应的⾳频格式有三类:合成声⾳格式:(如铃声),主要有:midi,sp-midi,mmf,rtttl, i-melody,e-melody等。
有⼀些软件可以进⾏相互转换,如:Mobile Music Pro,Quick Ringtone等。
波形声⾳格式:主要有:wav,mp3,mp3pro, ra, rma, wma, ogg, vqf, aiff, au, voc, vox, cda,ac-3,aac,mp4,pcm,adpcm,a-law,u-law, g711, g721, g722, g723.1, g726, g728, g729, amr, amr-wb等。
有很多软件可以进⾏相互转换,如:cool edit,winamp等。
混合声⾳格式:mod、dls等,类似midi⽂件,但还包含波表,不依赖于硬件合成器。
下⾯简单介绍⼀下各种⾳频格式:下⾯有⼀篇⽂章《⾳频⽂件格式全介绍》对⾳频格式介绍的已经⽐较全⾯了。
这⾥只对他没有介绍的⾳频格式进⾏⼀些介绍。
⼀、 sp-midi最近推出的Scalable Polyphony MIDI Specification (简称SP-MIDI),⼤概可以译成“可升级的MIDI复⾳”。
已经成为3gpp标准⾳频标准的⼀部分。
SP-MIDI的功能实现借助于⼀种新的MIDI消息,这种消息被称为最⼤同时和弦(Maximum Instantaneous Polyphony - MIP)消息。
这种MIP消息根据所需的和弦等级来定义SP-MIDI内容的⾳乐编配。
常见音频格式盘点分析
常见音频格式盘点分析
音频格式是指在进行数字音频存储时所用的文件格式,它用来描述音
频文件的特性,压缩方式,支持的技术及其他格式信息。
常见的音频格式
有WAV、AIFF、MP3、OGG、FLAC、WMA等。
1、WAV格式
WAV格式是一种比较常用的数字音频格式,它是由微软公司和IBM开
发的,主要用于存储CD上播放的音频文件。
WAV文件是无损的,能够恰
到好处的保存原始录制的音频数据,但是WAV文件大小很大,不利于传输
和存储。
2、AIFF格式
AIFF格式(Audio Interchange File Format)是苹果公司开发的一
种无损音频格式,主要用于存储音频数据,它也可以用来创建音频CD,
类似于WAV格式,AIFF文件也很大,且不方便存放和传输。
3、MP3格式
MP3是一种经过索尼公司和编码艺术家开发的音频压缩格式,它利用
了哈夫曼编码、时间冗余和混合编码等技术,使音频文件体积大大缩小,
很适合于在网络上传输和存储。
MP3质量和文件大小之间通常是成反比的,一般而言MP3格式的质量要比WAV格式低。
4、OGG格式
OGG格式是一种开放的、免费的带有许可证的压缩音频格式,它提供
比MP3更高的压缩比,并具有较好的声音质量,现在被广泛应用到了网络
和智能手机上。
5、FLAC格式
FLAC格式(Free Lossless Audio Codec)是一种无损压缩的音频格式。
7种常见的音频格式简析
7种常见的音频格式简析(MP3,WMA,WAV,APE,FLAC,OGG,AAC)MP3全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer Ⅲ),是当今最为流行的一种数字音频编码和有损压缩格式,在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。
它设计用来大幅度地降低音频数据量,而对于大多数用户来说重放的音质与最初的不压缩音频相比感觉不到很大的下降。
简单地说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。
MP3是利用MPEG Audio Layer 3 的技术,将音乐以1:10 甚至1:12 的压缩率,压缩成容量较小的文件。
换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度,而且还可以较好的保持了原来的音质。
另外,正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。
每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。
使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。
● MP3格式特点MP3是一个有损数据压缩格式,它丢弃掉脉冲编码调制(PCM)音频数据中对人类听觉不重要的数据(类似于JPEG是一个有损图像压缩),从而达到了小得多的文件大小(其在较大的压缩率以及基本保持低音频部分不失真的情况下,以牺牲声音文件中12kHz到16kHz的高音频部分来实现小文件)。
MP3音频可以按照不同的位速进行压缩,提供了在数据大小和声音质量之间进行权衡的一个范围。
另外,MP3格式使用了混合的转换机制将时域信号转换成频域信号。
例如,我们平时在网上见到的一些低质的MP3有64kbps,但好的也有320kbps的,两者声音差距也相当明显。
常见的文件(含音乐)格式
常见的声音文件格式常见的声音文件格式包括cda、wav、midi以及mp3。
在网络上常采用的音频文件格式包括wmv、rm、mov。
1. cda: CD Audio的缩写,Philips公司开发,CD音乐所用的格式。
2. wav: Wave波形文档,没有经过压缩的存储格式。
不会失真,但文件较大,1分钟约1.5MB。
3. midi: 电子音乐,常用来作网页背景音乐。
文件小,易失真,1分钟约30KB以下。
4. mp3: 采用去除人耳听不见频率的压缩技术,文件小,失真程度较小,1分钟约1MB。
5. wmv(wma单纯声音):Microsoft公司开发的网络流媒体格式,播放软件Windows内嵌的Media Player1,1分钟约1.5MB的wav文件,转成wmv格式后约为850KB。
6. asf: Microsoft公司早期开发的网络流媒体格式,目前已逐渐被wmv 格式取代。
7. rm(ra单纯声音):RealNetworks公司开发的网络流媒体格式,播放软件为Real player。
1分钟1.5MB的wav文件,转成rm后约为1.3MB。
8. mov: Apple公司开发的线路串流格式,播放软件为QuickTimePlayer,试用版免费。
1分钟1.5MB的Wav档,转档后约为2.5MB,品质很好,不易失真。
常见的文件格式AACE:Ace压缩档案格式ACT:Microsoft office助手文件AIF,AIFF:音频互交换文件,Silicon Graphic and Macintosh应用程序的声音格式ANI:Windows系统中的动画光标ARC:LH ARC的压缩档案文件ARJ:Robert Jung ARJ压缩包文件ASD:Microsoft Word的自动保存文件;Microsoft高级流媒体格式(microsoft advanced streamingformat,ASF)的描述文件;可用NSREX打开 Velvet Studio例子文件ASF:Microsoft高级流媒体格式文件ASM:汇编语言源文件,Pro/E装配文件ASP:动态网页文件;ProComm Plus安装与连接脚本文件;Astound介绍文件AST:Astound多媒体文件;ClarisWorks“助手”文件Axx:ARJ压缩文件的分包序号文件,用于将一个大文件压至几个小的压缩包中(xx取01-99的数字)A3L:Authorware 3.x库文件A4L:Authorware 4.x库文件A5L:Authorware 5.x库文件A3M,A4M:Authorware Macintosh未打包文件A3W,A4W,A5W:未打包的Authorware Windows文件BBAK:备份文件BAS:BASIC源文件BAT:批处理文件BIN:二进制文件BINHex:苹果的一种编码格式BMP:Windows或OS/2位图文件BOOK:Adobe FrameMaker Book文件BOX:Lotus Notes的邮箱文件BPL:Borlard Delph 4打包库BSP:Quake图形文件BUN:CakeWalk 声音捆绑文件(一种MIDI程序)CC0l:台风波形文件CAB:Microsoft压缩档案文件CAD:Softdek的Drafix CAD文件CAM:Casio照相机格式CAP:压缩音乐文件格式CAS:逗号分开的ASCⅡ文件CCB:Visual Basic动态按钮配置文件CCH:Corel图表文件CCO:CyberChat数据文件CCT:Macromedia Director Shockwave投影CDA:CD音频轨道CDF:Microsoft频道定义格式文件CDI:Philip的高密盘交互格式CDM:Visual dBASE自定义数据模块文件CDR:CorelDRAW绘图文件;原始音频CD数据文件CDT:CorelDRAW模板CDX:CorelDRAW压缩绘图文件;Microsoft Visual FoxPro索引文件CFG:配置文件CGI:公共网关接口脚本文件CGM:计算机图形元文件CH:OS/2配置文件CHK:由Windows磁盘碎片整理器或磁盘扫描保存的文件碎片CHM:编译过的HTML文件CHP:Ventura Publisher章节文件CHR:字符集(字体文件)CHT:ChartViem文件;Harvard Graphics矢量文件CIF:Adaptec CD 创建器 CD映像文件CIL:Clip Gallery下载包CIM:SimCity 2000文件CIN:OS/2改变控制文件用于跟踪INI文件中的变化CLASS:Java类文件CLP:Windows 剪贴板文件CLL:Crick Software Clicker文件CLS:Visual Basic类文件CMD:Windows NT,OS/2的命令文件;DOS CD/M命令文件;dBASEⅡ程序文件CPI:Microsoft MS-DOS代码页信息文件CPL:控制面板扩展名,Corel颜色板CPP:C++代码文件CPR:Corel提供说明书文件CPT:Corel 照片-绘画图像CST:Macromedia Director Cast文件CUR:Windows光标文件DDBF:dBASE文件,一种由Ashton-Tate创建的格式,可以被ACT!、Lipper、FoxPro、Arago、Wordtech、Xbase和类似数据库或与数据库有关产品识别;可用数据文件(能被Excel 97打开);Oracle 8.1.x表格空间文件DBX:DataBearn图像;Microsoft Visual FoxPro表格文件DCT:Microsoft Visual FoxPro数据库容器DCU:Delphi编译单元文件DCX:Microsoft Visual FoxPro数据库容器;基于PCX的传真图像;宏DIR:MacromediaDirector文件DLL:动态链接库DOC:FrameMaker或FrameBuilder文档;Word Star文档、WordPerfect文档、Microsoft:Word文档;DisplayWrite文档DOT:Microsoft Word文档模板DPL:Borland Delph 3压缩库DRV:驱动程序DRW:Micrografx Designer/Draw;Pro/E绘画文件DSF:Micrografx Designer VFX文件DSG:DOOM保存的文件DSM:Dynamic Studio音乐模块(MOD)文件DSP:Microsoft Developer Studio工程文件DSQ:Corel QUERY(查询)文件DST:刺绣机图形文件DSW:Microsoft Developer Studio工作区文件DTA:World Bank(世界银行)的STARS数据文件DTD:SGML文档类型定义(DTD)文件DTED:地面高度数字数据(图形的数据格式)文件DTF:Symantec Q&A相关的数据库数据文件DTM:DigiTrakker模块文件DUN:Microsoft拔号网络导出文件DV:数字视频文件(MIME)DWG:AutoCAD工程图文件;AutoCAD或Generic CADD老版本的绘图格式DXR:Macromedia Director受保护(不可编辑)电影文件EEDA:Ensoniq ASR磁盘映像EDD:元素定义文档(FrameMaker+SGML文档)EDE:Ensoniq EPS磁盘映像EDK:Ensoniq KT磁盘映像EDQ:Ensoniq SQ1/SQ2/Ks32磁盘映像EDS:Ensoniq SQ80磁盘映像EDV:Ensoniq VFX-SD磁盘映像EFA:Ensoniq ASR文件EFE:Ensoniq EPS文件EFK:Ensoniq KT文件EFQ:Ensoniq SQ1/SQ2/Ks32文件EFS:Ensoniq SQ80文件EFV:Ensoniq VFX-SD文件EMD:ABT扩展模块EMF:Windows增强元文件EML:Microsoft Outlook Express邮件消息(MIME RTC822)文件EXE:可执行文件(程序)FFAV:Microsoft Outlook导航条FAX:传真类型图像FCD:虚拟CD-ROMFDF:Adobe Acrobat表单文档文件FLA:Macromedia Flash电影FND:Microsoft Explorer保存的搜索文件(Find applet)FON:系统字体FRT:Microsoft FoxPro报表文件FRX:Visual Basic表单文本;Microsoft FoxPro报表文件FXP:经Microsoft FoxPro编译的源文件GGDM:铃声、口哨声和声音板模块格式GetRight:GetRight未完成的下载文件GHO:Norton 克隆磁盘映像GID:Windows 95全局索引文件(包括帮助状态)GIF:CompuServe位图文件GL:动画格式GRP:程序管理组HHEX:Macintosh BinHex2.0文件HLP:帮助文件;Date CAD Windows帮助文件HPP:C++程序头文件HQX:Macintosh BinHex 4.0文件HT:HyperTerminal(超级终端)HTM,HTML:超文本文档HTT:Microsoft超文本模板HTX:扩展HTML模板IICO:Windows图标IDX:Microsoft FoxPro相关数据库索引文件;Symantec Q&A相关数据库索引文件;Microsoft OutlookExpress文件IMG:GEM映像INF:信息文件INI:初始化文件;Mwave DSP Synth的“nwsynth.ini” GMS安装;Cravis Ultrasound bank安装INP:Oracle 3.0版或早期版本的表单源代码INRS:INRS远程通信声频INS:InstallShield安装脚本;X-Internet签字文件;Ensoniq EPS字簇设备;Cell/ⅡMAC/PC抽样设备INT:中间代码,当一个源程序经过语法检查后编译产生一个可执行代码IOF:Findit文档IQY:Microsoft Internet查询文件ISO:根据ISD 9660有关CD-ROM文件系统标准列出CD-ROM上的文件ISP:X-Internet签字文件IST:数字跟踪设备文件ISU:InstallShield卸装脚本IT:脉冲跟踪系统音乐模块(MOD)文件ITI:脉冲跟踪系统设备ITS:脉冲跟踪系统抽样,Internet文档位置IV:Open Inventor中使用的文件格式IVD:超过20/20微观数据维数或变量等级文件IVP:超过20/20的用户子集配置文件IVT:超过20/20表或集合数据文件IVX:超过20/20微数据目录文件IW:Idlewild屏幕保护程序IWC:Install Watch文档JJ62:Ricoh照相机格式JAR:Java档案文件(一种用于applet和相关文件的压缩文件)JAVA:Java源文件JAR:Java档案文件(一种用于applet和相关文件的压缩文件)JAVA:Java源文件JFF,JFIF,JIF:JPEG文件JPE,JPEG,JPG:JPEG图形文件JS:javascript源文件JSP:HTML网页,其中包含有对一个Java servlet的参考KKAR:卡拉OK MIDI文件(文本+MIDI)LLAB:Visual dBASE标签文件LBT,LBX:Microsoft FoxPro标签文件LDB:Microsoft Access加锁文件LHA:LZH更换文件后缀LOG:日志文件LZH:LH ARC压缩档案MM1V:MPEG相关文件(MIME"mpeg"类型)M3D:Corel Motion 3D动画文件M3U:MPEG URL(MIME声音文件)MAM:Microsoft Access宏MAQ:Microsoft Access查询文件MAR:Microsoft Access报表文件MBX:Microsoft Outlook保存email格式;Eudora邮箱MCW:Microsoft Word的Macintosh文档MDB:Microsoft Access数据库MDN:Microsoft Access空数据库模板MDW:Microsoft Access工作组文件MID:MIDI音乐MMM:Microsoft多媒体电影MOV:QuickTime for Windows电影MP2:第二层MPEG音频文件MP3:第三层MPEG音频文件MPA:MPEG相关文件,MIME“mpeg类型”MPE,MPEG,MPG:MPEG动画文件MPP:Microsoft工程文件;CAD绘图文件格式MPR:Microsoft FoxPro菜单(已编译)MSI:Windows 安装器包MSN:Microsoft 网络文档;Descent Mission文件OOBD:Microsoft Office活页夹OBJ:对象文件OBZ:Microsoft Office活页夹向导OCX:Microsoft对象链接与嵌入定制控件ODS:Microsoft Outlook Express邮箱文件OFT:Microsoft Outlook模板OPX:OPL扩展DLL(动态链接库)OSS:Microsoft Office查找文件OST:Microsoft Exchange / Outlook 离线文件PPAL:压缩文件PART:Go!Zilla部分下载文件PAS:Pascal源代码PCS:PICS动画文件PDF:Adobe Acrobat可导出文档格式文件(可用Web浏览器显示);Microsoft系统管理服务器包定义文件;NetWare打印机定义文件PHP,PHP3:包含有PHP脚本的HTML网页PHTML:包含有PHP脚本的HTML网页;由Perl分析解释的HTMLPM5:Pagemaker 5.0文件PM6:Pagemaker 6.0文件PPS:Microsoft Powerpoint幻灯片放映PPT:Microsoft Powerpoint演示文稿PRF:Windows系统文件,Macromedia导演设置文件PSD:Adobe photoshop位图文件PSM:Protracker Studio模型格式;Epic游戏的源数据文件PST:Microsoft Outlook个人文件夹文件PWL:Windows 95口令列表文件QQIF:QuickTime相关图像(MIME);Quicken导入文件QT,QTM:QuickTime电影QTI,QTIF:QuickTime相关图像QTP:QuickTime优先文件QTS:Mac PICT图像文件;QuickTime相关图像QTX:QuickTime相关图像RRA:RealAudio声音文件RAM:RealAudio元文件RAR:RAR压缩档案(Eugene Roshall格式)REC:录音机宏;RapidComm声音文件REG:注册表文件REP:Visual dBASE报表文件RES:Microsoft Visual C++资源文件RM:RealAudio视频文件RMF:Rich Map格式(3D游戏编辑器使用它来保存图)ROM:基于盒式磁带的家庭游戏仿真器文件(来自Atari 2600、Colecovision、Sega、Nintendo等盒式磁带里的ROM完全拷贝,在两个仿真器之间不可互修改)Rxx:多卷档案上的RAR压缩文件(xx=1~99间的一个数字)SSAV:游戏保存文件SB:原始带符号字节(8位)数据SBK:Creative Labs的Soundfont 1.0 Bank文件;(Soundb laster)/EMU SonndFont v1.x Bank文件SBL:Shockwave Flash对象文件SCF:Windows Explorer命令文件SCH:Microsoft Schedule+1SCP:拨号网络脚本文件SCR:Windows屏幕保护;传真图像;脚本文件SFX:RAR自解压档案SHTML:含有服务器端包括(SSI)的HTML文件SPL:Shockwave Flash对象;DigiTrakker抽样SQL:Informix SQL查询;通常被数据库产品用于SQL查询(脚本、文本、二进制)的文件扩展名STM:.shtml的短后缀形式,含有一个服务端包括(SSI)的HTML文件;Scream Tracker V2音乐模块(MOD)文件STR:屏幕保护文件SWA:在Macromedia导演文件(MP3文件)中的Shockwave声音文件SYS:系统文件TT64:Commodore 64仿真器磁带映像文件THEME:Windows 95桌面主题文件TIF,TIFF:标签图像文件格式(TIFF)位图TMP:Windows临时文件TRM:终端文件TXT:ASCⅡ文本格式的声音数据TZ:老的压缩格式文件VVBA:VBase文件VBP:Microsoft Visual Basic工程文件VBW:Microsoft Visual Basic工作区文件VBX:Microsoft Visual Basic用户定制控件VQE,VQL:Yamaha Sound-VQ定位器文件VQF:Yamaha Sound-VQ文件(可能出现标准)VRF:Oracle 7配置文件VSL:下载列表文件(GetRight)WWAB:Microsoft Outlook文件WAD:包含有视频、玩家水平和其他信息的DOOM游戏的大文件WAL:Quake 2正文文件WAV:Windows波形声形WBK:Microsoft Word备份文件WFM:Visual dBASE Windows表单WFN:在CorelDRAW中使用的符号WIZ:Microsoft Word向导WRL:虚拟现实模型WWL:Microsoft Word内插器文件XXLK:Microsoft Excel备份XLL:Microsoft Excel内插器文件XLM:Microsoft Excel宏XLS:Microsoft Excel工作单XLT:Microsoft Excel模板XLV:Microsoft Excel VBA模块XLW:Microsoft Excel工作簿/工作区ZZAP:Windows软件安装配置文件ZIP:Zip文件000-999:用于为老版本(或备份)文件编号(比如:被安装程序改变的CONFIG.SYS 文件);又可用于为小范围的PC应用程序的多个用户相关数据文件编号12M:Lotus 1-2-3 97 SmartMaster文件123:Lotus 1-2-3 97文件2D:VersaCAD的2维绘画文件2GR,3GR:在Windows之下的VGA图形驱动程序/配置文件386:在386或更高级处理器上使用的文件3D:VersaCAD的3维绘画文件3DM:3D NURBS建模器,Rhino3DS:3D Studio(DOS下)格式文件386:在386或更高级处理器上使用的文件4GE:Informix 4GL编译后代码4GL:Informix 4GL源代码。
研究音频的本质,详解各种音频格式的区别
研究音频的本质,详解各个音频格式的区别总共分为6个部分,分别是wav格式的介绍,有损格式的介绍,无损压缩格式的介绍,各音频格式的频谱分析,以及基于分析在音频文件选择上做的推荐,后添加有损压缩格式的比较。
1.wav音频格式的三大参数,及各参数对于音频文件的含义wav文件有4个参数,分别是采样频率,声道数,量化位数,以及码率共4个而这4个参数里最好理解的就是声道数,所以不对此参数进行介绍那么我将要介绍的参数就是采样频率F,量化位数B,和码率R采样频率在三个参数里面最重要的是采样频率,后面两个参数都是基于在传输存储过程中根据要求而得到的,唯独采样频率,它是把模拟世界的信号带到数字世界的桥梁。
在讲采样频率前,我们可以先回忆一下我们初中时学抛物线时的情景。
在初中时,老师教我们画抛物线时,是用什么方法画的??如果大家回想起来的话,就应该记得,是5点法。
是的,用5个点就可以近似的把抛物线给画出来。
音频信号是啥呢?其实是余弦波,只是这个余弦波的频率和幅值都是随时间的变量而已。
我们要对这个音频信号进行记录,不可能把每一时刻的值都记录,但是,我们可以参考画抛物线的方法,用尽量少的点去精确的描绘这个音频信号。
而采样频率,它干的就是这个活,也就是一秒内我们要记录这个音频信号多少个点,就能近似精确的表达这个音频信号。
在信号处理,有这么一个定理,叫奈奎斯特定理。
这个定理怎么得来,你们不用知道,这个是信号处理专业的人才需要知道。
我们只需了解的是,这个定理它告诉我们,如果我们要精确的记录一个信号,我们的采样频率必须大于等于音频信号的最大频率的两倍,记住,是最大频率。
也就是F>=2*fmax。
而在wav格式里,F=44.1kHz。
我们知道,人耳的听音频率范围是20-20kHz,也就是说,如果我们要精确记录这个音频信号,采样频率最低起码是40kHz。
这就是为啥是44.1kHz而不是其他的频率。
量化位数虽然有了采样频率,我们可以精确记录音频信号,然而,这些记录过的音频信号是模拟量,对于计算机而言,是无法处理的。
音频文件格式及其他知识
音频文件格式及其他知识目前市场上有各种类型的音频文件。
虽然我们可能都熟悉MP3,但AAC、FLAC、OGG或WMA呢?为什么有这么多音频标准?有没有最好的音频格式?哪些重要,哪些可以忽略?一旦你意识到所有的音频格式都属于三类,那就非常简单了。
如果你知道类别的含义,你可以在类别中选择最适合你需求的格式。
今天2T就给大家介绍十种常见的音频文件格式。
10种最常见的音频格式未压缩的音频格式未压缩的音频由真实的声波组成,这些声波已被采集并转换为数字格式,无需任何进一步处理。
因此,未压缩的音频文件往往是最准确的,但它们会占用大量的磁盘空间,24位96KHz立体声每分钟约34 MB。
音频文件格式:PCMPCM代表脉码调制,原始模拟音频信号的数字表示。
模拟声音以波形形式存在。
要将波形转换成数字位,必须以特定的间隔(或脉冲)对声音进行采样和记录。
这种数字音频格式有“采样率”(制作样本的频率)和“位深度”(用多少位来表示每个样本)。
不涉及压缩。
数字录音是模拟声音的近乎精确的表现。
这是PCM CD和DVD中最常用的音频格式。
PCM的一个子类型称为线性脉码调制,以线性间隔采集样本。
LPCM是PCM最常见的形式,这就是为什么这两个术语在这个时候几乎可以互换。
音频文件格式:WAVWAV代表波形音频文件格式(有时称为Windows音频)。
这是微软和IBM在1991年建立的标准。
很多人以为所有的WAV文件都是未压缩的音频文件,其实并非如此。
WAV是不同音频格式的Windows容器。
这意味着WAV文件可能包含压缩音频,但它们很少用于此目的。
大多数WAV文件包含PCM格式的未压缩音频。
WAV文件只是脉码调制的一个包装器,更适合Windows系统。
但是,Mac系统通常可以毫无问题地打开WAV文件。
音频文件格式:AIFFAIFF代表音频交换文件格式。
类似于微软和IBM为Windows开发WAV的方式,AIFF是苹果在1988年为Mac系统开发的一种音频文件格式。
7种常见的音频格式简析MP3,WMA,WAV,APE,FLAC,OGG,AAC
7种常见的音频格式简析MP3,WMA,WAV,APE,FLAC,OGG,AAC展开全文一、MP3全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer Ⅲ),是当今最为流行的一种数字音频编码和有损压缩格式,在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。
它设计用来大幅度地降低音频数据量,而对于大多数用户来说重放的音质与最初的不压缩音频相比感觉不到很大的下降。
简单地说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3。
MP3是利用MPEG Audio Layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的文件。
换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度,而且还可以较好的保持了原来的音质。
另外,正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词。
每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节。
使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了。
● MP3格式特点MP3是一个有损数据压缩格式,它丢弃掉脉冲编码调制(PCM)音频数据中对人类听觉不重要的数据(类似于JPEG是一个有损图像压缩),从而达到了小得多的文件大小(其在较大的压缩率以及基本保持低音频部分不失真的情况下,以牺牲声音文件中12kHz到16kHz的高音频部分来实现小文件)。
MP3音频可以按照不同的位速进行压缩,提供了在数据大小和声音质量之间进行权衡的一个范围。
另外,MP3格式使用了混合的转换机制将时域信号转换成频域信号。
例如,我们平时在网上见到的一些低质的MP3有64kbps,但好的也有320kbps的,两者声音差距也相当明显。
音频格式讲解
SPDIF
• Coaxial接口
– 同轴音频接口(Coaxial),标准 为SPDIF,在视听器材的背板上有 Coaxial作标识,主要是提供数字 音频信号的传输。通过电信号方式 传输。
• Toslink接口
– Toslink接口又称光纤音频接口,全名Toshiba Link,这是 日本东芝(TOSHIBA)公司较早开发并设定的技术标准, 在大多数视听器材的背板上有Optical作标识。现在几乎所 有的数字影音设备都具备这种格式的接头。Toslink光纤曾 大量应用在普通的中低档CD、LD、MD、DVD机及组合音 响上。光纤连接可以实现电气隔离,阻止数字噪音通过地 线传输,有利于提高DAC的信噪比。光纤连接的信号要经 过发射器和接收器的两次转换,会产生严重影响音质的时 基抖动误差(Jitter)。
功放芯片即声音放大芯片,功能就是功率放大以推动喇叭发声工作。
声音输入/输出端口较简单,它起的作用就是音频信号的输入和输 出。
声道
声道被认为是一个滤波器,有许多共振峰,其频率受随时间变化 的声道形状所控制,例如舌的移动就会改变声道的形状。许多话音编 码器用一个短期滤波器(short term filter)来模拟声道。
• (4)5.1声道:5.1声道已广泛运用于各类影院和家 庭影院中,一些比较知名的声音录制压缩格式,例 如杜比AC-3(Dolby Digital)、DTS等都是以5.1声 音系统为技术蓝本的。其中“.1”声道是一个专门设 计的超低音声道,即LFE声道,LFE (low frequency effects)是低频音效的加强声道。这一声 道可以产生频响范围为20~120Hz的超低音。其实 5.1声音系统来源于4.1环绕,只是在原来的基础上 增加了一个中置单元。中置单元负责传送低于80Hz 的声音信号,在欣赏影片时有利于加强人声,把对 话集中在整个声场的中部,以增加整体效果。中央 声道大部份时间负责重放人物对白的部份;前置主 左/右声道则是用来弥补在屏幕中央以外或不能从屏 幕看到的动作及其它声音;后置环绕音效则是负责 外围及整个背景音乐,让人感觉置身于整个场景的 正中央,万马奔腾的震撼、喷射机从头顶呼啸而过 的效果,就是拜它所赐;而马达声、轰炸机的声音 或是大鼓等震人心弦的重低音,则是由重低音喇叭 一手包办。如图所示为一款5.1声道音箱。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
音频格式音频的频率:20-20KHZ,采样频率:44KHZ,低频段:30-150HZ,中低频段:150-500HZ, 中高频段:500-5000HZ,高频段:5000-20000HZ。
目前,大部分音乐文件如下:CD、OGG、MP3、ASF.WMA、WAV、MP3PRO、RM、REAL、APE、MODULE、MIDI、VQF1,CD是英文Compact Disc的缩写,意为激光唱片其专业术语原为“数字化精密型唱片及放唱系统”。
它可以说是所以音频文件中音质最好的,不过它的最大弱点就是容量太大.2,Ogg是一种新的音频压缩格式,类似于MP3等现有的音乐格式。
但有一点不同的是,它是完全免费、开放和没有专利限制的。
Vorbis 是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放性的多媒体系统。
目前该计划只实现了Ogg这一部分。
Ogg Vorbis文件的扩展名是.OGG。
这种文件的设计格式是非常先进的。
现在创建的OGG文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。
3,MP3是第一个实用的有损音频压缩编码。
在mp3出现之前,一般的音频编码即使以有损方式进行压缩能达到4:1的压缩比例已经非常不错了。
但是,mp3可以实现12:1的压缩比例,这使得mp3迅速地流行起来。
mp3之所以能够达到如此高的压缩比例同时又能保持相当不错的音质是因为利用了知觉音频编码技术,也就是利用了人耳的特性,削减音乐中人耳听不到的成分,同时尝试尽可能地维持原来的声音质量,MP3这个扩展名表示的当然就是MP3压缩格式文件了。
MP3的全称实际上是MPEG Audio Layer-3,而不是MPEG 3。
由于MP3具有压缩程度高(1分钟CD音质音乐一般需要1M字节)、音质好的特点,所以MP3是目前最为流行的一种音乐文件。
在网上有很多可以下载MP3的站点,还可以通过一些交换软件(比如Napster)进行音乐交换。
不过由于音乐工业的强烈抵制(版权问题),这些服务都面临着关闭或改为收费服务的压力。
播放MP3最出名的软件是WinAMP。
4, ASF.WMAASF和WMA都是微软公司针对Real公司开发的新一代网上流式数字音频压缩技术。
这种压缩技术的特点是同时兼顾了保真度和网络传输需求,所以具有一定的先进性。
也是由于微软的影响力,这种音频格式现在正获得越来越多的支持,比如前文说的WinAMP也可以播放。
另外也可以使用Windows的媒体播放机。
5,WAV是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。
不客气地说,它实际上是Apple电脑的AIFF格式的克隆。
通常我们使用WAV格式都是用来保存一些没有压缩的音频,但实际上WAV格式的设计是非常灵活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你甚至可以在WAV格式里面存放图像。
之所以能这样,是因为WAV文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据。
6, mp3PROmp3PRO格式与mp3是兼容的,所以它的文件类型也是mp3。
mp3PRO播放器可以支持播放mp3PRO或者mp3编码的文件;普通的mp3播放器也可以支持播放mp3PRO编码的文件,但只能播放出mp3的音质。
但是,虽然mp3PRO是一种优秀的技术,由于技术专利费用的问题以及其他技术提供商比如Microsoft的竞争,mp3PRO 并没有得到很大的流行。
大家可以从Coding Technologies的网站下载Demo播放/压缩工具和Winamp的播放插件。
目前也有许多专业音频编辑软件比如Cool Edit Pro 2.0支持mp3PRO格式,但播放器除了刚才说的和Music Match Juke Box就基本没有了。
最关键的是由于Microsoft的媒体播放机不支持,使得mp3PRO 失去了流行的机会。
前段时间Coding Technologies推出了最新的MPEG-4 aacPlus,通过将SBR技术应用在AAC(Advanced Audio Codec)技术中而获得更卓越的音质。
Coding Technologies并表示SBR将会成为MPEG-4的核心技术。
7,rm是目前网络上流行的主流多媒体文件格式之一,该类文件必须使用基于 RealNetworks 公司开发的RealMedia 引擎的播放器(例如 RealPlayer)才能正常播放。
8,real格式是RealNetworks公司网络音频和视频解决方案,通过很高的压缩比,使用“流式”(streaming)播放媒体技术,从而使人们能够在网上实时收听音频及收看视频。
9,APE是目前世界上惟一得到公认的音频无损压缩格式,由于它的采样率高达800kbps~1400kbps,接近于音乐CD的1411.2kbps,远远高于MP3的128kbps,因此它在压缩后的音质和源文件音质几乎毫无差异,其音质之佳已经过了严格的盲听测试,得到了全世界发烧友的公认,聆听APE将使你如临天籁胜地,更好地理解到音乐所要表达的内涵。
10,Module(简称mod)是数码音乐文件,由一组samples(乐器的声音采样)、曲谱和时序信息组成,告诉一个mod 播放器何时以何种音高去演奏在某条音轨的某个样本,附带演奏一些效果比如颤音等。
因而mod与纯正的象WAV或AU那样的没有包含时序信息的样本文件不同,与象MIDI文件那样的不携带任何附加样本/乐器的文件也不同(与现在支持DLS技术的MIDI倒是有点相似,不过mod的体积要比DLS MIDI小得多。
)。
mod 起源于Amiga计算机,当时的文件扩展名是MOD,为了区分具体的类型和整个结构体系,通常使用mod来表示整个Module格式体系。
由于该格式起源很早,因此曾经非常流行,因为mod提供了一种具有可以接受的音质水平而又非常廉价的制作音乐的方法。
而且这种文件的音质效果对于当时的电脑硬件水平来说效果比MIDI要好,文件的体积也不大,好处是轻而易见的。
随着高质量的音响硬件的使用,新一代的mod的声音质量甚至可以提升到接近专业设备的水平。
这使得mod成为一种介乎于象WAV或VOC那样的纯正样本数据文件和象General MIDI那样的纯正时序信息文件之间的混合体,成为一种比较灵活的音频格式。
11,MIDI的全称是The Musical Instrument Digital Interface,乐器数字界面。
MIDI使得人们可以利用多媒体计算机和电子乐器去创作、欣赏和研究音乐。
MIDI由三个部分组成,分别是:通信协议Communication Protocol,连接器Connector(硬件界面)及其传播格式,称为标准MIDI文件Standard MIDI Files。
12,VQF是日本YAMAHA公司购买NTT公司的技术开发出来的一种音频压缩格式,矛头直指MP3。
主要卖点是压缩比比MP3高,而且音质还比MP3好(YAMAHA自己及其支持者如是说,在我看来不相伯仲)。
但由于VQF是YAMAHA 公司的专有格式,受到的支持(播放器)相当有限,所以影响力不如MP3。
VQF需要YAMAHA公司的VQF播放器才能播放。
其他播放器比如WinAMP需要安装支持插件才能播放。
!比特率和采样率解释比特率(Kbps)数字信道传送数字信号的速率称为数据传输速率或比特率.比特率这个词有多种翻译,比如码率等,表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最少的单位,要么是0,要么是1。
比特率与音视频压缩的关系简单的说就是比特率越高音视频的质量就越好,但编码后的文件就越大;如果比特率越少则情况刚好翻转。
例如:以500Kbps来编码音视频。
其中 bps是比特1K= 1010=1024b就是比特(bit)s就是秒(second)p就是每(per)所以,以500kbps来编码表示经过编码后的音视频数据每秒钟需要用500K的比特来表示在基带传输系统中用比特率表示传输的信息码率.比特率Rb是指单位时间内传输的二元比特数,单位是b/s.例如计算机串口的传输码率最高到115200b/s. 符号率或波特率Rs是指单位时间内传输的调制符号数,即指三元及三元以上的多元数字码流的信息传输速率,单位是baud/s. 在M进制调制中,比特率Rb和波特率Rs之间的关系为: Rb=Rslog2M 采样率是指采样样本与总样本数之比,采样数率是单位时间采样数。
如果是仪器中,采样速率为40MSa/s,说明每秒采样数量为40M个,但是不能使用40MHz表示。
把模拟音频转成数字音频的过程,就称作采样,简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。
采样率(KHZ)44KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。
原则上采样率越高,声音的质量越好。
MAIN_DATA 部分长度是否变化决定于 FRAMEHEADER 的 bitrate 是否变化,一首 MP3 歌曲,它有三个版本:96Kbps(96 千比特位每秒)、128Kbps 和 192Kbps。
Kbps(比特位速率),表明了音乐每秒的数据量, Kbps 值越高,音质越好,文件也越大,MP3 标准规定,不变的 bitrate 的 MP3 文件称作 CBR,大多数 MP3文件都是 CBR 的,而变化的 bitrate 的 MP3 文件称作 VBR,每个 FRAME 的长度都可能是变化的。