MP3文件组织结构概述
MP3文件格式剖析
文章编号:1006-5342(2002)06-0077-03MP3文件格式剖析Ξ范建军(咸宁师范高等专科学校 计算机系,湖北 咸宁 437005)摘 要:MP3的全称是MPEG Audio Layer -31由于MP3具有压缩程度高、音质好的特点,所以MP3是目前最为流行的一种音乐文件1文章以国际标准化组织(IS O )和国际电工委员会(IEC )联合颁布的IS O/IEC 11172-3(MPEG-1第三部分:音频)标准为依据,结合MP3的特点,详细剖析MP3文件的格式结构1关键词:MPEG;MP3文件;MP3解码器中图分类号:TP37 文献标识码:A1 MP3解码器的组成和工作原理[1]一个基本的MP3解码器组成如图1所示:图1 IS O/MPEG audio 层3(MP3)解码器的结构 它一般包括分流器(M UX )、霍夫曼解码器、逆量化器、逆M DCT 器、合成滤波器组和边信号解码器1其工作流程是从输入的MP3比特流中查找第一个帧头部进行同步、接着进行边信号解码、比例因子解码、霍夫曼数据解码、逆量化频谱、频谱重新排序(动态去窗口)、逆M DCT 处理、通过多相滤波器组合成,最后产生PC M 数据流并送往音箱播放声音12 MP3文件的格式结构[2]MP3音频文件的结构如图2所示:帧帧111帧T ag图2 MP3音频文件的结构一个MP3音频文件被分成若干个称为帧的小块,每一个帧都是独立的1每一个帧都有自己的头部和音频信息1MP3音频文件没有头部1因此,可以切割MP3音频文件的任何部分并正确地播放它1当希望读取有关MP3音频文件的信息时,通常是查找第一个帧就足以获得,读这第一个帧的头部,同时假定其它帧也有同样的信息(并不总是这样的)1T ag 常常被用于描述MP3音频文件1MP3帧结构如图3所示:帧头CRC 校验(可选)边信号信息比例因子音频数据图3 MP3帧结构在一个帧中,其头部是由最前面的4个字节(32位)组成1头部最前面的11位总是被设置为1并称它为“帧同步”1因此,可以搜索整个文件以确定第一次出现连续11个被设置为1的地方,然后读整个头部并检测其值是否正确1在下面的表中你将了解到在头部的每一位的精确含义,以对每个值检测其有效性1被指定为保留,无效,坏和不允许的每一个值说明这是一个无效的头部1帧可以有一个CRC 校验,但这较为罕见1如果存在CRC 校验,这个CRC 是16位长,它跟在帧的头部之后;如果你需要读其它帧的头部或仅仅希望计算这个帧的CRCΞ收稿日期:2002-09-20第22卷第6期 咸 宁 师 专 学 报 V ol.22,N o.62002年12月 Journal of Xianning T eachers College Dec.2002以比较从文件中读出的帧,你可以计算帧的长度并使用它1这实际上是一个非常好的检测MP3头部有效性的方法1在CRC的后面就是S ide In fo(边信号信息)1边信号信息后面是Scale factor(比例因子)信息1再之后就是音频数据1 211 帧头部详细剖析每个帧头部的长度为4字节1其数据结构如下:typedef struct-tagHeader{unsigned int sync:11;//同步信息unsigned int version:2;//版本unsigned int layer:2;//层unsigned int error2protection:1;//CRC校正unsigned int bit2rate2index:4;//位率索引unsigned int sam ple2rate2index:2;//采样率索引unsigned int padding:1;//空白字unsigned int extension:1;//私有标志unsigned int channel2m ode:2;//立体声模式unsigned int m ode extension:2;//保留unsigned int copyright:1;//版权标志unsigned int original:1;//原始媒体unsigned int em phasis:2;//强调方式}HE ADER,3LPHE ADER;其中:sync(同步信息):11位,全部被设置为11Version(版本):2位,设置如下: 00-MPEG版本2151 01-保留1 10-MPEG版本21 11-MPEG版本11layer(层):2位,设置如下: 00-保留1 01-层III1 10-层II1 11-层I1error-protection(出错保护):1位,设置如下: 0-CRC保护(在帧头后面允许16位CRC校验码)1 1-无保护1bit2rate2index(位率索引):4位,设置如下:设置值V1,L1V1,L2V1,L3V2,L1V2,L2V2,L30000free free free free free free000132323232328(8)0010644840644816(16)0011965648965624(24)010012864561286432(32)010116080641608064(40)011019296801929680(48)01112241129622411256(56)100025612811225612864(64)1001288160128288160128(80)1010320192160320192160(96)设置值V1,L1V1,L2V1,L3V2,L1V2,L2V2,L31011352224192352224112(112)1100384256224384256128(128)1101416320256416320256(144)1110448384320448384320(160)1111bad bad bad bad bad bad 注释:所有的值单位是kbpsV1-MPEG版本11V2-MPEG版本2和版本2151L1-层I1L2-层II1L3-层III1“free”意味着可变位率1“bad”意味着这不是一个允许的值1sam ple2rate2index(采样率索引):2位,设置如下:设置值MPEG1MPEG2MPEG215 0044100220501102501480002400012000103200016000800011保留保留保留 注释:所有的值单位是H z1Padding(空白字):1位,设置如下: 0-帧没有填充位1 1-帧带有一个额外的填充位1Extension(私有标志):1位,目前此位的作用未知1 channel2m ode(立体声通道模式):2位,设置如下: 00-立体声1 01-Joint立体声(S tereo)1 10-Dual立体声(S tereo)1 11-S ingle立体声(M ono)1m ode extension(模式扩展):2位,仅对Joint立体声通道模式有效,设置如下:设置值Intensity stereo MS stereo 00off off01on off10off on11on onC opyright(版权标志):1位,设置如下: 0-音频数据没有版权保护1 1-音频数据有版权保护1Original(原始媒体):1位,设置如下: 0-原始媒体的拷贝1 1-原始媒体1Em phasis(强调方式):2位,设置如下: 00-无 01-50/15ms 10-保留 11-CCIT J117212 MPEG音频T ag的MP3v1详细剖析它包含的信息有艺术家(Artist),标题(T itle),影集87咸宁师专学报 第22卷(Album),出版年份(Y ear)和音乐风格(G enre)1对于注释(C omments)还有额外的空间1T AG的大小始终是128字节长,并且位于所有音频数据之后1可以通过读MP3音频文件的最后128个字节而获取T ag1T ag各相关信息分配如下:长度(字节)位置(字节)描 述3(0-2)T ag标识1必须包含‘T AG’,如果T ag存在并且正确130(3-32)T itle 30(33-62)Artist 30(63-92)Album长度(字节)位置(字节)描 述4(93-96)Y ear30(97-126)C omment1(127)G enre 规范要求所有的填充域都用NU LL字符(ASCII0)填充;然而,并不是所有的应用程序都遵守这个规定(一个例子是WinAm p用空格<space>ASCII32,填充填充域)1在MP3v111结构中,有一小部分被建议改变1注释域的最后一个字节可以被用于指定在一个影集中歌曲的音轨数1如果信息是未知,则它包含一个NU LL字符(ASCII0)1 MP3文件对音乐的风格进行了限制,共254种1G enre 返回的只是MP3风格的序列号,具体还需要定位,在这里把所有类型以常数形式列出:0’Blues’20’Alternative’40’AlternR ock’60’T op40’1’Classic R ock’21’Ska’41’Bass’61’Christian Rap’2’C ountry’22’Death Metal’42’S oul’62’P op/Funk’3’Dance’23’Pranks’43’Punk’63’Jungle’4’Disco’24’S oundtrack’44’S pace’64’Native American’5’Funk’25’Euro-T echno’45’Meditative’65’Cabaret’6’G runge’26’Ambient’46’Instrumental P op’66’New Wave’7’Hip-H op’27’T rip-H op’47’Instrumental R ock’67’Psychadelic’8’Jazz’28’V ocal’48’E thnic’68’Rave’9’Metal’29’Jazz+Funk’49’G othic’69’Showtunes’10’New Age’30’Fusion’50’Darkwave’70’T railer’11’Oldies’31’T rance’51’T echno-Industrial’71’Lo-Fi’12’Other’32’Classical’52’E lectronic’72’T ribal’13’P op’33’Instrumental’53’P op-F olk’73’Acid Punk’14’R&B’34’Acid’54’Eurodance’74’Acid Jazz’15’Rap’35’H ouse’55’Dream’75’P olka’16’Reggae’36’G ame’56’S outhern R ock’76’Retro’17’R ock’37’S ound Clip’57’C omedy’77’Musical’18’T echno’38’G ospel’58’Cult’78’R ock&R oll’19’Industrial’39’N oise’59’G angsta’79’Hard R ock’任何其它的值都被认为是“Unknown”1MPEG音频T ag MP3v2这是新建议的T AG格式,它与MP3v1和MP3v111不同1有关它的信息请查看网站http://w w w1id31com/1参考文献:[1]林福宗1多媒体技术基础[M]1北京:清华大学出版社,20011136~1431[2]余崇智,李存珠,张志力等1运动图像及其伴音的压缩与编码[M]1南京:南京大学出版社,19951235~250197第6期 范建军 MP3文件格式剖析。
MP3解剖报告
实物解剖研究报告项目名称:基于DSP的MP3播放器解剖报告研究人:叶春梅专业:电子信息科学与技术班级:1011电科学号:2010111148指导老师:张静湖北文理学院2013、5、5一、简介MP3是术语MPEG-1 Audio Layer-3的缩写,是一种音频压缩标准,采用这种音频标准压缩的数字音频文件,能以较小的压缩率、较大的压缩比获得近乎完美的CD音质。
MPEG语音编码具有很高的压缩率。
我们知道,CD的采样频率为44100赫兹,数据以16比特量化,采用立体声双声道播放,所以,在1分钟内,CD音质的未压缩WAV格式文件的大小约10MB。
MP1和MP2的压缩率分别可达1:4和1:6,MP3的压缩率可以高达1:12。
从这个意义上讲,以往每分钟CD音质的音乐经过MP3格式压缩编码后,就只有1MB左右,而其音色和音质可基本不失真,保持完整。
二、MP3的结构其主要结构包括:数据端口、存储器、微处理器、数字信号处理器(DSP)、显示屏、播放控制、音频端口、放大器、电源和耳机等组件。
·解码芯片:MP3播放器的心脏解码芯片的作用顾名思义就是存储在介质上的MP3文件解码。
它是MP3工作中最重要的一环,是影响MP3的音质表现的决定性因素。
MP3是一种有损压缩的格式,如果MP3播放器拥有优秀的解码芯片就能够更好的还原音频信号的质量,很大程度上弥补音频的损失。
相反的话,低端的解码芯片会令MP3的解码信息进一步丢失。
此次解剖的MP3采用的解码芯片是TCC730Y KM854 A0321。
它的位置如下图所示。
二、MP3播放器的工作原理MP3播放器是利用数字信号处理器DSP(Digital Sign Processer)来完成处理传输和解码MP3文件的任务的。
DSP掌管随身听的数据传输,设备接口控制,文件解码回放等活动。
DSP能够在非常短的时间里完成多种处理任务,而且此过程所消耗的能量极少。
一个完整MP3播放机要分几个部分:中央处理器、解码器、存储设备、主机通讯端口、音频DAC和功放、显示界面和控制键。
mp3音频格式解析
MPEG2.5 384 1152 576
【每帧采样数表】
帧长度是压缩时每一帧的长度,包括帧头。它将填充的空位也计算在内。LayerI 的一个空位长 4 字节,LayerII 和 LayerIII 的空位是 1 字节。当读取 MPEG 文件时必 须计算该值以便找到相邻的帧。
注意:因为有填充和比特率变换,帧长度可能变化。 从头中读取比特率,采样频率和填充, LyaerI 使用公式: 帧长度(字节) = 每帧采样数 / 采样频率(HZ) * 比特率(bps)/ 8 +填充 * 4 LyerII 和 LyaerIII 使用公式: 帧长度(字节)= 每帧采样数 / 采样频率(HZ) * 比特率(bps)/ 8 + 填充 例: LayerIII 比特率 128000,采样频率 44100,填充 0 =〉帧大小 417 字节
每帧持续时间(秒) = 每帧采样数 / 采样频率(HZ)
可以这么理解:每帧采用数就是要采取的总数,采样率就是采取的速度,相除 就得到时间。 这样通过计算可知 MPEG1 Layer III 采样率为 44.1KHz 的一帧持续时间为 26.12...不是整数,不过我们权且认为它就是 26 毫秒吧。 如果是 MPEG2 Layer III 采样率为 16KHz 的话那一帧要持续 36 毫秒,这个相差 还是蛮大的,所以还是应该通过计算来获的,当然可以按 MPEG 版本,层数和采样 率来建一个表,这样直接查表就可以知道时间了。
G
1
(9) 填充位(填充用来达到正确的比特率。)
0 – 没有填充
1 – 填充了一个额外的空位
H
1
(8) 私有 bit,可以用来做特殊应用。例如可以
用来触发应用程序的特殊事件。
I
mp3 十六进制解析
mp3 十六进制解析全文共四篇示例,供读者参考第一篇示例:MP3 是一种数字音频格式,其音频数据以十六进制形式存储,通过解析这些十六进制数据,我们可以了解音频文件的结构和内容。
本文将介绍如何解析MP3 文件的十六进制数据,以及其中的一些关键信息。
我们需要明白MP3 文件是如何组织的。
一个典型的MP3 文件由多个帧(frame)组成,每个帧包含一段音频数据。
每个帧的开头是一个帧同步字(frame sync),用于标识帧的开始。
帧同步字的值为0xFF,即十进制的255,表示帧的开始。
在帧同步字之后的一部分是帧头(frame header),用于描述帧的一些重要信息,包括比特率、采样率、声道模式等。
帧头通常占据一个字节,我们可以通过解析这个字节来获取这些信息。
帧头字节的格式如下:- 最高两位为帧同步字的保留位,固定为11;- 接下来四位为MPEG 版本(Version ID),用于指示MPEG 标准的版本;- 接下来两位为层信息(Layer),表示音频数据的编码层;- 接下来一位为保护位(CRC check),用于指示是否启用CRC 校验。
接着是帧头中的比特率(bitrate)字段,用于表示音频数据的比特率。
比特率字段的取值与MPEG 版本、层信息有关,不同的组合对应不同的比特率。
在十六进制数据中,我们可以通过解析比特率字段来获取比特率信息。
在帧头中还包括声道模式(channel mode)字段,用于表示音频数据的声道模式,包括单声道、立体声、双声道和立体声(joint stereo)模式。
解析声道模式字段可以帮助我们了解音频数据的声道配置。
通过解析MP3 文件的十六进制数据,我们可以获取关于音频文件的详细信息,包括比特率、采样率和声道模式等。
这些信息对于音频文件的解码和播放非常重要,通过深入了解MP3文件的十六进制结构,我们可以更好地理解数字音频文件的工作原理。
MP3 文件的十六进制解析是一个有趣且重要的技术,通过解析帧头的一些关键字段,我们可以了解MP3文件的结构和内容,进一步探索数字音频文件的工作原理。
MP3帧结构
7.4.4MP3帧结构(1)介于ID3V2和ID3V1之间的部分称作MP3帧,这些帧构成了MP3的音频部分。
每个MP3帧由帧头和数据块组成,之间还可能包含2个字节的CRC校验位,校验位是否存在依赖于帧头的第16比特位的值。
以比特率为区分标准,MP3可以分为可变比特率和不变比特率两种格式。
比特率代表每秒钟的数据量,一般单位是kbps。
比特率越高,MP3的音质越好,但是文件也越大。
每个MP3帧固定时长为26ms,因此可变比特率的帧大小可能是不同的,而不变比特率的帧大小是固定的,只要分析了第1个帧的大小就可以知道后面帧的大小。
帧头长度是4个字节,也就是32比特,其布局如下所示。
每个比特的意义在表7-3中做了详细的介绍。
1.AAAAAAAA AAABBCCD EEEEFFGH IIJJKLMM表7-3帧头的比特描述标识长度位置描述A1131~2111位的帧同步数据,可以通过查找同步位来确定帧的起始位置B220~19MPEG音频版本号,其中MPEG2.5为非官方版本00MPEG2.501保留版本10MPEG211MPEG1C218~17层(Layer)版本号00保留版本号01Layer3 10Layer211Layer1D116保护位,0代表帧头后紧跟2个字节的CRC校验位;1代表无保护E415~12比特率索引值,根据表7-4中的内容可以查询比特率的值,单位是kbpsF211~10抽样率索引值,根据表7-5中的内容可以查询抽样率的值,单位是HzG19填充位,0代表无填充,1代表有填充。
对于Layer1,填充位长度为4个字节;Layer2和Layer3的填充位长度为1个字节H18私有标识位I27~6声道模式00立体声01联合立体声10双声道11单声道J25~4模式的扩展,只有声道模式为01才有意义K13版权标识L12原版标识M21~0目前此标志位很少使用表7-4比特率索引表(单位:kbps)比特位V1L1V1L2V1L3V2L1V2L2V2L3 00000000000001323232323280010644840644816001196564896562401001286456128643201011608064160806401101929680192968001112241129622411256100025612811225612864续表比特位V1L1V1L2V1L3V2L1V2L2V2L3 1001288160128288160128 1010320192160320192160 1011352224192352224112 1100384256224384256128 1101416320256416320256 1110448384320448384320 1111000000表7-5抽样率索引(单位:Hz)比特位MPEG1MPEG2MPEG2.50044100220501120501480002400012000103200016000800011000MP3帧体的大小由MPEG版本号、比特率、抽样率和填充位4个因素确定。
mp3结构图说明
MP3播放器结构图解分析作者:佚名来源: 发布时间:2010-2-3 11:51:40 [收藏] [评论]MP3播放器结构图解分析与以前需要移动部件来读取磁带或CD上的编码数据的音乐播放器形式不同,MP3播放器采用固态存储器。
MP3播放器只不过是一个嵌置有软件应用程序的数据存储设备,允许用户将MP3文件传递到MP3播放器。
MP3播放器还包含用来从CD或网站复制音乐的实用程序,并且能够按您希望的播放顺序组织和创建歌曲列表。
这个歌曲列表称为“播放列表”。
MP3播放器聚了许多技术。
它的每个元件单独看来并没有什么创新性,但是结合在一起时就能够创造出一个前所未有的消费产品。
除了储存音乐之外,MP3播放器还必须播放音乐并且使用户能听到播放的音乐。
为此,播放器需要:1.从存储器中提取歌曲2.解压MP3编码3.通过数模转换器运行解压后的数据4.放大模拟信号,以便用户听到歌曲内部结构不同播放器的特定组件可能有所不同,以下是典型的MP3播放器的基本部件:•数据端口•存储器•微处理器•数字信号处理器(DSP)•显示屏•播放控件•音频端口•放大器•电源Rio MP3播放器的内部。
您可以看到LCD面板、几个大芯片(微处理器、DSP芯片和I/O控制器)、放大器和按钮。
播放器插入电脑的USB端口、FireWire端口或并行端口来传输数据。
基于USB端口的播放器传输数据的速度是使用并行端口的播放器的许多倍。
MP3文件保存在播放器的存储器中。
存储器类型包括:•内置闪存•CompactFlash卡•SmartMedia卡•存储棒•内置微型驱动器除了最后一种存储器外,其他都属于固态存储器。
固态存储器的优点是它没有运动部件。
无运动部件意味着播放器更强的可靠性并且音乐在播放中不会出现跳跃。
包含微型硬盘的MP3播放器存储容量比闪存设备多出10-150倍。
微处理器是播放器的大脑。
它通过播放控件监视用户输入,在LCD面板上显示当前歌曲的信息,并且向DSP芯片发送指令,告诉它该如何处理音频。
MP3文件结构及编解码流程
MP3文件结构及编解码流程转自:/wlsfling/article/details/5875959MP3文件结构及编解码流程分类: Multimedia2010-09-10 15:42 10952人阅读评论(0) 收藏举报header layer存储数据结构扩展audioAGENDA* MP3简介* MP3文件结构——Tag_v2(ID3v2)标签帧——数据帧——Tag_v1(ID3v1)标签帧*MP3编解码流程*MP3文件的播放流程一、MP3简介:MP3全称MPEG 1 audio layer 3,其中MPEG(Moving Picture Experts Group)标准包括视频和音频标准,其中音频标准已制定出 MPEG-1、MPEG-2、MPEG-2 AAC和MPEG-4。
MPEG-1和MPEG-2标准使用同一个音频编码解码族—— Layer1、Layer 2、Layer3。
它根据压缩质量和编码复杂程度进行划分的,分别对应MP1、MP2、MP3 这三种声音文件,并根据不同的用途,使用不同层次的编码。
MPEG 音频编码的层次越高,编码器越复杂,压缩率也越高MPEG-2一个新特点是采用低采样率扩展降低数据流量,另一特点是多通道扩展,将主声道增加为5个。
MPEG Audio Layer 1、Layer2、Layer3三个层使用相同的滤波器组、位流结构和头信息,采样频率为32KHz、44.1KHz、48KHz。
Layer 1是为数字压缩磁带DCC(Digital Compact Cassette)设计的,数据流384kbps;压缩率4:1; Layer 2在复杂性和性能间作了权衡,数据流量下降到256kbps-192kbps;压缩率6:1-8:1;Layer 3一开始就为低数据流量而设计,数据流量在128kbps-112kbps,压缩率高达10:1-12:1;Layer 3增加了MDCT变换,使其频率分辨能力是Layer 2的18倍,Layer 3还使用了与MPEG Video 类似的平均信息量编码(Entropy Coding),减少了冗余信息。
mp3的工作原理
mp3的工作原理
MP3的工作原理是基于音频数字化和压缩技术。
下面是MP3的工作原理的简要解释:
1. 采样: MP3是一种数字音频格式,它从模拟音频信号开始,通过采样将其转换为数字信号。
这就是通过在特定时间间隔内测量音频信号的振幅来实现的。
2. 数字化: 一旦采样完成,音频信号将被转换成一系列二进制数值。
这些数值代表了在特定时间点上记录的采样数据。
3. 压缩: 为了减小文件的大小,并方便存储和传输,MP3使用了一种称为音频压缩的技术。
它通过删除或降低不必要的音频数据来实现压缩。
这些不必要的数据可以是听觉上不明显的,比如较低的音频频率或较小的声音。
4. 帧化: MP3音频数据被分成一系列连续的帧。
每个帧都包含一些音频数据。
5. 哈夫曼编码: MP3使用一种称为哈夫曼编码的技术进行数据压缩。
该编码方法使用变长编码来表示经常出现的音频信号模式,以便更有效地存储数据。
6. 填充: MP3文件由固定大小的帧组成。
如果音频数据不足以填充整个帧,填充数据将被添加到最后一个帧中,以保持一致的文件结构。
7. 解码: 在播放MP3文件时,它需要使用MP3解码器来还原音频数据。
该解码器将应用与编码相反的过程,解压缩和恢复原始音频数据。
8. 播放: 解码后的音频数据被发送到扬声器或其他音频设备以产生声音。
总结起来,MP3的工作原理涉及音频信号的采样、数字化、压缩和解码等过程,从而最终实现音频播放。
MP3文件格式解析
MP3文件格式解析Peter Lee 2008-06-05目录一、概述二、整个MP3文件结构三、MP3帧格式1. 帧头格式2. MAIN_DATA四、ID3标准1. ID3V12. ID3V2五、MP3文件实例剖析六、资料一、概述MP3 文件是由帧(frame)构成的,帧是MP3 文件最小的组成单位。
MP3 的全称应为MPEG1 Layer-3 音频文件,MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组,特指活动影音压缩标准,MPEG 音频文件是MPEG1 标准中的声音部分,也叫MPEG 音频层,它根据压缩质量和编码复杂程度划分为三层,即Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3 这三种声音文件,并根据不同的用途,使用不同层次的编码。
MPEG 音频编码的层次越高,编码器越复杂,压缩率也越高,MP1 和MP2 的压缩率分别为4:1 和6:1-8:1,而MP3 的压缩率则高达10:1-12:1,也就是说,一分钟CD 音质的音乐,未经压缩需要10MB的存储空间,而经过MP3 压缩编码后只有1MB 左右。
不过MP3 对音频信号采用的是有损压缩方式,为了降低声音失真度,MP3 采取了“感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3 文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。
二、整个MP3文件结构MP3文件大体分为三部分:TAG_V2(ID3V2),Frame, TAG_V1(ID3V1)ID3V2包含了作者,作曲,专辑等信息,长度不固定,扩展了ID3V1的信息量。
Frame...Frame一系列的帧,个数由文件大小和帧长决定每个FRAME的长度可能不固定,也可能固定,由位率bitrate决定每个FRAME又分为帧头和数据实体两部分帧头记录了mp3的位率,采样率,版本等信息,每个帧之间相互独立ID3V1包含了作者,作曲,专辑等信息,长度为128BYTE。
MP3工作原理[图解]
用户输入(如键盘) RS232LCDARM7TDMIUSBMP3解码/DAC/音频放大器IDE连接器SDRAMMP3 全称是MPEG Audio Layer 3,MPEG 压缩格式是由运动图象专家组(Motion Picture Experts Group)制定的关于影像和声音的一组标准,其中MP3 就是为了压缩声音信号而设计的是一种新的音频信号压缩格式标准。
CD 唱片采样率频率为 44.1MHz, 16Bits, 数据量为 1.4Mbps,而相应的 MP3 数据量仅为112kbps 或者 128kbps,是原始数据量的 1/12。
也就是说传统的一张 CD 现在可以存放 10 倍甚至更多容量的音乐,但是在人耳听起来, 感受到的音乐效果却没有什么不同。
MP3 随身听的工作原理,其实很简单,反正就是有一块不知什么型号的控制芯片,控制解码芯片和 LCD 液晶屏,由解码芯片把内置闪存或者是外插闪存卡之中的 MP3 文件解码,然后经数模转换,最后从耳机输送到我们的耳朵中。
也就是说一共没几块芯片。
你如果拆一个 MP3 随身听看看,你会发现里面比较大的半导体芯片惟独 4、5 片。
现在新一代的 MP3 随身听在技术上是非常先进的,最具代表性的是 NOMAD II,基于美国 CirrusLogic 最新的 EP7209 MCU (微程序控制器)芯片组,它的作用实际上就像电脑里的 CPU,经过软件解码,可以支持多种网络音乐格式,包括 MP3,以及日后的 WMA 格式。
而国内使用这种芯片创造的 MP3 随身听也即将问世。
起初, MP3 文件只能由电脑来播放,而随着互联网的发展,文件小、音质可与 CD 媲美的 MP3 音乐越来越适合人们在 Internet 上传递,而广为流行。
再加之全世界范围内的 MP3 下载网站泛滥,使人们传统的听音乐习惯发生了改变。
MP3 的逐渐流行,随时随地欣赏MP3 音乐的需求越来越高,这就创造了MP3 播放器的市场。
mpeg化学结构
mpeg化学结构MPEG化学结构MPEG(Moving Picture Experts Group)是一种常见的视频和音频编码格式,广泛应用于数字媒体领域。
MPEG化学结构是指MPEG编码格式的基本构成和组织方式,本文将详细介绍MPEG化学结构的相关内容。
一、MPEG化学结构概述MPEG化学结构由三个主要部分组成:媒体编码、传输和解码。
媒体编码部分负责将原始音频和视频数据进行压缩编码,传输部分负责将编码后的数据传输到接收端,解码部分负责将接收到的数据进行解码还原为原始音视频信号。
二、媒体编码1. 音频编码MPEG音频编码采用了有损压缩的技术,通过去除人耳无法察觉的音频信号细节,以减小数据量。
最常用的MPEG音频编码格式有MP3、AAC等。
这些编码格式能够在保持较高音质的同时,显著降低文件大小。
2. 视频编码MPEG视频编码采用了基于帧的压缩方式,将连续的视频帧进行预测和差分编码,进一步降低数据冗余。
最常见的MPEG视频编码格式有MPEG-1、MPEG-2、MPEG-4等。
这些编码格式在不同应用场景下具有不同的特点,如MPEG-1适用于VCD、MPEG-2适用于DVD、MPEG-4适用于互联网视频等。
三、传输1. 压缩传输MPEG压缩传输技术通过对编码后的音视频数据进行进一步压缩,减小数据量,提高传输效率。
常见的MPEG压缩传输技术有MPEG Transport Stream(MPEG-TS)、MPEG Program Stream (MPEG-PS)等。
2. 网络传输MPEG网络传输技术是指通过网络传输MPEG编码的音视频数据。
在互联网传输中,常用的MPEG网络传输协议有Real-Time Streaming Protocol(RTSP)、Hypertext Transfer Protocol (HTTP)等。
这些协议能够实现音视频的实时传输和流媒体播放。
四、解码媒体解码部分负责将接收到的MPEG编码数据进行解码,还原为原始音视频信号。
MP3文件结构
• 频率: (对于MPEG-1) 00-44.1kHz 01-48kHz 频率: (对于MPEG- 000110-32kHz 11-未定义; 1011-未定义;
为: b; 则其换算表如下: 则其换算表如下: b a b a 1 32 9 2 40 10 3 48 11 4 56 12 5 64 13 6 80 14 7 96 15 8 112 16
128 160 192 224 256 320
帧头内容概述( 帧头内容概述(续)
• 帧长调节: 用来调整文件头长度, 0-无需调 帧长调节: 用来调整文件头长度, 0整, 1-调整; 1-调整; • 声道模式: 表示声道, 00-立体声, 01-Joint 声道模式: 表示声道, 00-立体声, 01Stereo, 10-双声道, 11-单声道; 10-双声道, 11-单声道; • 版权: 文件是否合法, 0-不合法, 1-合法; 版权: 文件是否合法, 0-不合法, 1-合法; • 原版标志: 是否原版, 0-非原版, 1-原版; 原版标志: 是否原版, 0-非原版, 1-原版;
MP3文件结构概述 MP3文件结构概述
Байду номын сангаас
一般MP3文件(ID3 v1.0)结构的组成 一般MP3文件(ID3 v1.0)结构的组成
• 文件的主体是由许多个帧组成的; 文件的主体是由许多个帧组成的; • 文件头部分: 大小不限, 内容类似说明; 文件头部分: 大小不限, 内容类似说明; • 文件尾部分: 大小为128字节, 该文件的说明 文件尾部分: 大小为128字节,
MP3的组成
MP3基本构成(一). MP3基本知识及构成1、MP3是什么?MP3是一种有损数字音频压缩格式。
全称是Mpeg-1 audio Layer 3,其中MPEG是Moving Picture Experts Group的缩写,意思是动态图象专家组。
所谓“有损压缩音频格式”也就是对数字音频使用了对音质有损耗的压缩方式,以达到缩小文件大小的目的,来满足复制、存储、传输的需要。
MP3的压缩率可以达到1:12,但在人耳听起来,却并没有什么失真,因为它将超出人耳听力范围的声音从数字音频中去掉,而不改变最主要的声音。
此外,MP3随身听也可以上传、下载其他任何格式的电脑文件,具有移动存储功能。
2、MP3随身听的构成MP3随身听其实就是一个功能特定的小型电脑。
在它小小的机身里,拥有存储器(存储卡)、显示器(LCD显示屏)、中央处理器[MCU(微控制器)或解码DSP(数字信号处理器)] 等,其基本构成如下图:MP3基础知识篇当微型操作系统加载完成后,MCU开始为操作系统所控制,执行它所指定的各种功能。
对于MP3随身听而言,这个功能最主要的就是播放MP3音乐了。
播放的过程就是MP3音乐文件的解码过程,MCU利用自身的CPU的运算能力来承担繁重的MP3音乐文件解码任务。
当MP3音乐下载至MP3随身听后一般多存储在机身内置闪存或硬盘里,在播放的过程中,MCU将其从存储介质里读取出来,缓冲在RAM中,解码后播放出来。
由于此时的信号是数字信号,耳机此类的模拟设备还无法播放,这时就需要由数/模转换器(DAC)来完成将数字信号转变为模拟信号的工作,然后通过耳机就可以播放出美妙的音乐了。
(二). MP3性能参数和技术知识1、SRS(WOW)环绕音响效果SRS(Sound Retrieval System)效果简单地说就是3D立体音响效果。
WOW是由SRS、TRUBASS、BRIGHTNESS组成,能够把音质提升到从低到高的全景3D效果。
mp3m讲义p4知识与维修图文
Mp3/mp4知识与维修
5、固件
1)固件(FrimWare):一般来说,担任着一个系统最基础、 最底层工作的软件才可以称之为固件。
2)固件的重要性 在MP3播放器中,固件就是播放器的灵魂,因为播放
器除了固件以外没有其它软件了。因此,固件也就决定 着播放器的功能及性能。由这一点来看,播放器的固件 与它的硬件有着几乎相同的地位,而在某些程度上来说 固件可能更重要一些。
Mp3/mp4知识与维修
2、MP3播放器的构成 mp3播放器是一种对mp3等音乐文件进行存储、解
码和播放的微小型数字音频设备。此外还具有移动存 储功能。其实就是一个功能特定的小型电脑。在它小 小的机身里,拥有存储器(存储卡)、显示器(LCD显 示屏)、中央处理器(MCU(微控制器))或解码DSP (数字信号处理器)等.
mp3mp4知识与/mp4知识与维修
一、mp3基础知识 二、mp4基础知识 三、mp3与mp4的维修技术
Mp3/mp4知识与维修
一、MP3播放器基础知识
1、MP3格式简介 MP3是一种有损数字音频压缩格式,全称是Mpeg-1
audio Layer 3,其中MPEG是Moving Picture Experts Group的缩写。所谓“有损压缩音频格式”也就是对 数字音频使用了对音质有损耗的压缩方式,以达到缩 小文件大小的目的,来满足复制,存储,传输的需要。 MP3的压缩率可以达到1:12。
Mp3/mp4知识与维修
4、常见的MP4播放器
.能播放视频的MP3 :这种播放器其实不算是MP4,本质上是
MP3,视频播放只不过是其附件功能,被称作MP4,纯 粹是商业炒作。这种播放器局限性极大屏幕很小(0.8~1.8 英寸),闪存容量小,支持特定的格式(MTV、MP4、 MPV和DMV等),而且大多数是采用OLED和CSTN等 低端屏幕,所以准确地说,这只能称作可播放视频的MP3 罢了。代表有:金邦炫彩王、炫彩飞艇等。
MP3详解
MP3详解-MP3代码的总体框架Mp3解码过程了解Mp3的解码总体上可分为9个过程:比特流分解,霍夫曼解码,逆量化处理,立体声处理,频谱重排列,抗锯齿处理,IMDCT变换,子带合成,pcm输出。
为了解上述9个过程的由来,简要描述mp3的压缩流程。
声音是一个模拟信号,对声音进行采样,量化,编码将得到PCM数据。
PCM又称为脉冲编码调制数据,是电脑可以播放的最原始的数据,也是MP3压缩的源。
为了达到更大的数据压缩率,MPEG标准采用子带编码技术将PCM数据分成32个子带,每个子带都是独立编码的(参考《数字音频原理与应用》221页)。
然后将数据变换到频域下分析,MPEG采用的是改进的离散余弦变换,也可以使用傅利叶变换(参考《数字音频原理与应用》225)。
再下来为了重建立体声进行了频谱按特定规则的排列,随后立体声处理,处理后的数据按照协议定义进行量化。
为了达到更大的压缩,再进行霍夫曼编码。
最后将一些系数与主信息融合形成mp3文件。
解码是编码的反过程大概如下:●所谓比特流分解是指将mp3文件以二进制方式打开,然后根据其压缩格式的定义,依次从这个mp3文件中取出头信息,边信息,比例因子信息等。
这些信息都是后面的解码过程中需要的。
(这部分是代码理解中的难点)。
●霍夫曼编码是一种无损压缩编码,属于熵编码。
Mp3的解码可以通过公式实时进行数据的解码,但往往采用的是通过查表法实现解码(节省了CPU时间资源)。
(这部分是mp3解码工作量中最大的一部分,也是代码理解中的难点)。
●逆量化处理只是几个公式的操作,代码理解中不难●立体声处理:这部分的处理也只是对几个公式的操作,代码理解不难,但原理上理解有些难度(**参考:了解下面的部分可以较好地理解代码中的立体声处理函数Joint Stereo 是一种立体声编码技巧,主要分为 Intensity Stereo(IS)和 Mid/Side (M/S) stereo两种。
IS 的是在比较低流量时使用,利用了人耳对于低频讯号指向性分辨能力的不足,将音讯资料中的低频分解出来合成单声道资料,剩余的高频资料则合成另一个单声道资料,并另外纪录高频资料的位置资讯,来重建立体声的效果。
MP3文件的结构与编程
有一个朋友喜欢听MP3,为了获取MP3,写了一个程序,专门从一家音乐网站上搜索下载mp3,一下子下载了有上千首。
这时朋友又犯愁了,这些MP3的歌曲名字都是使用1,2,3,4,。
等数字命名,挑选起来十分不方便。
虽然MP3播放器能够读出MP3文件信息的歌曲名,但歌曲文件本身的名字却不利于自己管理。
于是就想写一个小程序实现MP3自动更名。
查了一些资料,研究了一下MP3的文件结构。
研究MP3的结构,就不能不研究ID3标签。
ID3标签是MP3音乐档案中的歌曲附加讯息,它能够在MP3中附加曲子的演出者、作者以及其它类别资讯,方便众多乐曲的管理。
缺少ID3标签并不会影响 MP3的播放,但若没有的话,管理音乐文件也会相当的麻烦。
如果你在网上download MP3,里面多半已经写有预设的ID3讯息。
ID3,一般是位于一个mp3文件的开头或末尾的若干字节内,附加了关于该mp3的歌手,标题,专辑名称,年代,风格等信息,该信息就被称为ID3信息,ID3信息分为两个版本,v1和v2版。
其中:v1版的ID3在mp3文件的末尾128字节,以TAG三个字符开头,后面跟上歌曲信息。
v2版一般位于mp3的开头,可以存储歌词,该专辑的图片等大容量的信息。
但ID3并不是MP3标签的ISO国际标准,ID3的各种版本目前只是一个近乎事实上的标准,并没有人强迫播放器或者编码程序必须支持它。
ID3V1大概有两个版本,由于ID3V1.0没有包括曲目序号的定义,所以Michael Mutschler在1997年进行了改进,引入了版本1.1。
通过占用备注字段的最后两个字节,用一个00字节作标记,另一个字节改为序号,可以让ID3支持曲目编号了。
一个字节的空间让ID3 V1.1支持最高到255的曲目序号,考虑到一张唱片超过256个曲目的可能性极小,这个改进还是相当合理的。
但ID3V1只有128个字节可以使用,如果要在MP3中储存更多的信息,比如歌词,专辑图片等,显然是无法达到的,于是产生了ID3V2。
了解MP3内部结构
目前国内MP3产品鱼龙混杂,质量层次不齐,消费者常常无所适从,不知道如何去分别各种MP3的好坏。
从今天开始,我们将请国内少数拥有自主研发能力的MP3专业厂商之一——魅族的工程师向读者深入介绍MP3技术普及的文章。
这些文章将对广大读者更加深入的了解MP3技术层面的知识,增强购买时的分辨能力都有很大的帮助。
首先来了解一下MP3的内部结构。
我们以魅族ME为例子对MP3各部件的结构、功能做一个解剖。
下面是一台魅族ME,我们把它打开来看看它由几部分组成。
首先我们可以看到主机四个角有四颗螺丝,这是固定整个机壳用的。
把螺丝打开后就可以把面板取下来。
打开前后盖、取下面板之后可以看到机器内部正面的图片,我们可以看到主要是LCD液晶屏、五维导航键以及FLASH闪存芯片。
接着把两侧的挡板和背板、拆下来就可以完全看到裸机的情况了,外壳完全拆掉的情况如下图所示:第2页:双层电路板结构良好品质保障拆掉外壳后我们开始来分析主机的组成结构,把主机拿在手上,从侧面可以看出主机由两块电路板组成,上层主要是显示部分、主芯片、FLASH、闪存,下层主要是供电部分以及FM收音电路。
部分MP3如魅族ME/MI、JNC SSF-800、iRiver3XX系列还有经典的帝盟RIO800等都是这种双电路模块设计,这样设计的好处是两部分功能分开独立,干扰更小,性能也更加稳定,当然设计也更加复杂,成本更高一些。
一些中低端的MP3则是单电路模块设计,但干扰大、效果自然也不如前者好。
第3页:主电路板设计及解码芯片简介接下来我们把两块电路模块分开来,分别分析它们的组成结构。
首先我们看看主电路板,刚才我们已经知道它的正面主要是LCD液晶屏、五维导航键和FLASH闪存,现在我们来看看它的反面。
从图中可以看到,主电路板反面主要由三步分组成:USB接口电路、解码主芯片及主晶振还有音频输出及录音。
解码主芯片是MP3最重要的组成部分之一,就像电脑的CPU、显卡的GPU,直接影响MP3的功能、音质。
MP3播放器的工作原理
MP3播放器的工作原理标题:MP3播放器的工作原理引言概述:MP3播放器是一种便携式音频设备,能够存储和播放数字音频文件。
它的工作原理涉及数字音频文件的编码、存储和解码等过程。
本文将详细介绍MP3播放器的工作原理。
一、数字音频文件的编码1.1 声音信号采样:声音信号通过麦克风采集后,需要进行模拟到数字的转换,即采样。
1.2 量化:采样后的声音信号需要进行量化,将连续的模拟信号转换为离散的数字信号。
1.3 压缩编码:为了减小音频文件的大小,音频信号经过压缩编码,其中MP3采用了有损压缩算法。
二、数字音频文件的存储2.1 存储介质:数字音频文件存储在MP3播放器的内存芯片中,通常采用闪存或硬盘。
2.2 文件格式:MP3播放器支持的音频文件格式主要包括MP3、WAV、AAC 等。
2.3 文件管理:MP3播放器通过文件系统管理存储的音频文件,方便用户查找和播放。
三、数字音频文件的解码3.1 解码器:MP3播放器内置解码器,能够将压缩编码的音频文件解压缩还原为原始音频信号。
3.2 解码过程:解码器根据MP3格式的编码规则,对音频文件进行解码,还原出原始的音频数据。
3.3 数字模拟转换:解码后的数字音频信号需要通过数字模拟转换器转换为模拟信号,输出到耳机或扬声器。
四、音频输出4.1 耳机接口:MP3播放器通过耳机接口将音频信号传输到耳机,用户通过耳机听到音乐。
4.2 扬声器输出:部分MP3播放器还具有内置扬声器,可以直接输出音频信号。
4.3 音量控制:用户可以通过MP3播放器上的音量按钮来控制音频输出的大小。
五、播放控制5.1 播放模式:MP3播放器支持单曲循环、随机播放、顺序播放等多种播放模式。
5.2 播放列表:用户可以创建播放列表,将多个音频文件按照自己的喜好进行组织和播放。
5.3 播放控制:MP3播放器提供播放、暂停、快进、快退等控制按钮,方便用户对音频文件进行操作。
总结:MP3播放器通过数字音频文件的编码、存储、解码等过程,实现了便捷的音频播放功能。
MP3音频文件解析
MP3音频文件解析五、MP3文件认识上的几个误区1.每帧播放时长都为26ms? 很多博客和文章都提到,Mp3文件每个帧的播放时长(Frame_PlayingTime)是26ms,这个结论是错误的。
公式应该是这样的:一个帧的播放时长=一个帧的采样个数*一次采样的时间=一个帧的采样个数*(1/采样...2011-08-25 22:28 阅读(718) 评论(1)四、Mp3文件类型及其判断根据前两篇文章的分析,帧分为标签帧和数据帧,MP3文件类型是根据数据帧的类型来分的,文件类型如下表:位率相等(Constant BitRate) CBR Mp3文件位率不等(Variable BitRate) Xi...2011-08-25 22:27 阅读(1339) 评论(1)三、Mp3帧分析(数据帧)一、帧帧头长4字节,是的,是4个字节,共32位。
帧头后面可能有两个字节的CRC 校验,这两个字节的是否存在决定于FRAMEHEADER 信息的第16bit,为0 则帧头后面无校验,为1 则有校验,校验值长度为2 个字节,(后面是可变长度的附加信息,对于标准的MP3文件来...2011-08-25 22:25 阅读(2648) 评论(3)二、Mp3帧分析(标签帧)第一部分中提过,Mp3文件由帧组成,帧分成标签帧和数据帧,本文就Mp3文件的帧进行分析。
一、标签帧 MP3帧头中除了存储一些象private、copyright、original的简单音乐说明信息以外,没有考虑存放歌名、作者、专辑名、年份等复杂信息,而这些信息在...2011-08-25 21:56 阅读(1450) 评论(2)一、MP3文件概述(原创和摘抄)一、概述 MP3 文件是由帧(frame)构成的,帧是 MP3 文件最小的组成单位。
MP3 的全称应为MPEG1 Layer-3 音频文件,MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组,特指活动影音压缩标准,MPEG音...2011-08-23 22:49 阅读(655) 评论(1)。
iemocap文件夹构造
iemocap文件夹构造摘要:1.iemocap 文件夹构造简介2.iemocap 文件夹的组成部分3.iemocap 文件夹在学术研究中的应用4.iemocap 文件夹的构造方法5.iemocap 文件夹的优缺点分析6.结论正文:iemocap 文件夹构造是一个在计算机科学和信息工程领域中广泛使用的概念。
iemocap 文件夹是一个用于存储和管理图像、音频、视频等多媒体数据的文件夹。
它具有良好的组织和分类功能,使得研究者能够方便地管理和分析多媒体数据。
iemocap 文件夹的组成部分包括图像、音频、视频、文本等文件。
其中,图像和音频文件通常采用特定的格式存储,如JPEG、PNG、WAV、MP3 等。
这些文件按照特定的结构组织,以便于研究者进行检索和分析。
iemocap 文件夹在学术研究中的应用非常广泛。
例如,在计算机视觉、语音识别、自然语言处理等领域,研究者可以利用iemocap 文件夹中的多媒体数据进行模型训练和算法验证。
通过使用iemocap 文件夹,研究者可以更加高效地开展研究工作。
要构造一个iemocap 文件夹,首先需要收集和整理多媒体数据。
这些数据可以从网络、数据库、实验室等多种途径获取。
接着,需要将这些数据按照特定的格式进行存储,并建立相应的文件结构。
最后,可以使用专门的工具和软件对iemocap 文件夹进行管理和分析。
iemocap 文件夹具有许多优点,例如良好的组织和分类功能、方便的数据检索和分析等。
然而,它也存在一些缺点,如数据量较大,对计算机硬件和软件的要求较高。
此外,由于多媒体数据可能涉及隐私和版权等问题,因此在使用iemocap 文件夹时需要遵循相关的法律法规。
总之,iemocap 文件夹构造是一个在计算机科学和信息工程领域中具有重要意义的话题。
通过了解iemocap 文件夹的组成部分、应用领域以及构造方法,我们可以更好地利用这一工具开展研究工作。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Higher frequencies generally needs more space for encoding (thats why many codecs cut all
B 2 (20,19) MPEG Audio version
00 - MPEG Version 2.5
01 - reserved
10 - MPEG Version 2
11 - MPEG Version 1
C 2 (18,17) Layer deion
00 - reserved
frequencies above cca 16kHz) and lower tones requires less. So if some part of song doesnt consist
of higher tones then using eg. 192kbps is wasting of space. It should be enough to use only eg.
1.帧头HEADER 格式如下:
AAAAAAAA AAABBCCD EEEEFFGH IIJJKLMM
13 个帧头字符的含义如下:
Sign Length
(bits)
Position
(bits)
Deion
A 11 (31-21) sync (all bits set)
Size = (144 * 128000) / 44100 + 1 = 417 bytes
2.MAIN_DATA:
MAIN_DATA 部分长度是否变化决定于HEADER 的bitrate是否变化,一首MP3 歌曲,它有三个版本:96Kbps(96 千比特位每秒)、128Kbps 和192Kbps。Kbps (比特位速率), 表明了音乐每秒的数据量,Kbps 值越高,音质越好,文件也越大,MP3标准规定,不变的bitrate 的MP3 文件称作CBR,大多数MP3 文件都是CBR 的,而变化的bitrate 的MP3 文件称作VBR, 每个 的长度都可能是变化的。下面是CBR 和VBR 的不同点:
L1 - Layer I
L2 - Layer II
L3 - Layer III
"free" means variable bitrate.
"bad" means that this is not an allowed
The s in parentheses are from different sources which
缩后的文件在回放时能够达到比较接近原音源的声音效果。
二.整个MP3 文件结构:
MP3 文件大体分为三部分:TAG_V2(ID3V2),, TAG_V1(ID3V1)
ID3V2 包含了作者,作曲,专辑等信息,长度不固定,扩展了ID3V1 的信息量。
一系列的帧,个数由文件大小和帧长决定
1110 448 384 320 448 384 320 (160)
1111 bad bad bad bad bad bad
NOTES: All s are in kbps
V1 - MPEG Version 1
V2 - MPEG Version 2 and Version 2.5
0100 128 64 56 128 64 32 (32)
0101 160 80 64 160 80 64 (40)
0110 192 96 80 192 96 80 (48)
0111 224 112 96 224 112 56 (56)
1000 256 128 112 256 128 64 (64)
的存储空间,而经过MP3 压缩编码后只有1MB 左右。不过MP3 对音频信号采用的是有损压缩方式,为了降
低声音失真度,MP3采取了“感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉
噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3 文件,并使压
1001 288 160 128 288 160 128 (80)
1010 320 192 160 320 192 160 (96)
1011 352 224 192 352 224 112 (112)
1100 384 256 224 384 256 128 (128)
1101 416 320 256 416 320 256 (144)
If you want to jump over 2 minutes in song, it is not a problem with CBR because you are able
simply count amount of Bytes which is necessary to skip. But it is impossible with VBR.
. 每个 的长度可能不固定,也可能固定,由位率bitrate 决定
. 每个 又分为帧头和数据实体两部分
. 帧头记录了mp3 的位率,采样率,版本等信息,每个帧之间相互独立
ID3V1 包含了作者,作曲,专辑等信息,长度为128BYTE。
三.MP3的 格式:
每个 都有一个帧头HEADER,长度是4BYTE(32bit),帧头后面可能有两个字节的CRC 校
1)CBR:固定位率的 的大小也是固定的(公式如上所述),只要知道文件总长度,和帧长即可由播放每帧需26ms 计算得出mp3 播放的总时间,也可通过计数帧的个数控制快进、快退慢放等操作。
2)VBR:VBR 是XING 公司推出的算法,所以在MP3 的 里会有“XING"这个关键字(现在很多流行的小软件也可以进行VBR 压缩,它们是否遵守这个约定,那就不得而知了),它存放在MP3 文件中的第一个有效 里,它标识了这个MP3 文件是VBR 的。同时第一个 里存放了MP3 文件的 的总个数,这就很容易获得了播放总时间,同时还有100 个字节存放了播放总时间的100 个时间分段的 的INDEX,假设4 分钟的MP3 歌曲,240S, 分成100 段,每两个相邻INDEX 的时间差就是2.4S, 所以通过这个INDEX,只要前后处理少数的,就能快速找出我们需要快进的 头,可参考下文:
2)数据帧大小:
Size = (((MpegVersion == MPEG1 ? 144 : 72) * Bitrate) / SamplingRate) + PaddingBit
例如: Bitrate = 128000, a SamplingRate =44100, and PaddingBit = 1
验,这两个字节的是否存在决定于HEADER 信息的第16bit, 为0 则帧头后面无校验,为1 则有校验,
校验值长度为2 个字节,紧跟在HEADER 后面,接着就是帧的实体数据了,格式如下:
HEADER
CRC(free)
MAIN_DATA
4 BYTE
0 OR 2 BYTE
长度由帧头计算得出
00 off off
01 on off
10 off on
11 on on
K 1 (3) Copyright
0 - Audio is not copyrighted
1 - Audio is copyrighted
L 1 (2) Original
01 - Layer III
10 - Layer II
11 - Layer I
D 1 (16) Protection bit
0 - Protected by CRC (16bit crc follows header)
1 - Not protected
E 4 (15,12) Bitrate index
lengths should be arbitrary so you have to either go by and counts (time consuming
and very unpractical) or use another mechanism for approximate count.
bits MPEG1 MPEG2 MPEG2.5
00 44100 22050 11025
01 48000 24000 12000
10 32000 16000 8000
11 reserv. reserv. reserv.
G 1 (9) Padding bit
0 - is not padded
1 - is padded with one extra bit
H 1 (8) Private bit (unknown purpose)
I 2 (7,6) Channel Mode
00 - Stereo
96kbps.
And it is the principle of VBR. Codec looks over and then choose bitrate suitable for its
sound quality.
It sounds perfect but it brings some problems:
claim that those s are valid for V2,L2 and V2,L3. If
anyone can confirm please let me know.
F 2 (11,10) Sampling rate frequency index (s are in Hz)