MP4文件格式解析-----个人总结
主流MP4视频格式讲解与下载
主流MP4视频格式讲解与下载□RAIN 发表于2007-3-7 20:24:00推荐3GP 格式视频分辨率为:176 x 144. 3GP是一种3G流媒体视频编码格式,主要是为了配合3G网络的高传输速度而开发的,也是手机中常见的一种视频格式。
某些厂商直接将手机芯片应用到MP3当中,也将3GP格式引入了MP3行业,虽然目前采用手机芯片的MP3还很少,但这仍是一股不可忽视的力量,笔者相信它有着不容小觑的发展潜力。
MP4 格式视频分辨率为:320 x 240;如果您的手机可以播放3GP格式,就可以播放MP4格式,但是必须要您的手机支持:320 x 240的分辨率才可以播放本站的MP4格式视频,否则请下载3GP格式视频A VI 格式视频分辨率为:220 x 176;A VI,音频视频交错(Audio Video Interleaved)的英文缩写。
A VI这个由微软公司发表的视频格式在视频领域已经存在好几个年头了。
A VI格式调用方便、图像质量好,但缺点就是文件体积过于庞大。
分为:手机A VI格式和MP4专用A VI 格式;请下载符合你的手机或者MP4的A VI格式视频。
ASF 格式视频分辨率为:320 x 240;ASF (Advanced Streaming format高级流格式)。
ASF 是MICROSOFT 为了和现在的Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式。
ASF使用了MPEG4 的压缩算法,压缩率和图像的质量都很不错。
因为ASF 是以一个可以在网上即时观赏的视频“流”格式存在的,所以它的图像质量比VCD 差一点点并不出奇,但比同是视频“流”格式的RAM 格式要好。
如果要在电脑上播放ASF格式请下载安装播放器:/about/Mp4_Player.html*.RA/RM/RAM*.RM,Real Networks公司所制定的音频/视频压缩规范Real Media中的一种,Real Player 能做的就是利用Internet资源对这些符合Real Media技术规范的音频/视频进行实况转播。
什么是MP4的视频播放格式
什么是MP4的视频播放格式视频播放格式是指MP4播放器可以支持播放的视频文件格式。
MP4播放器和MP3播放器相比,最大的区别就是可以播放视频文件,也就是我们通常说的电影文件。
视频文件的格式有很多,MP4播放器支持MPEG4、AVI、DivX和XviD等格式视频文件中的一种或几种。
部分MP4会随机带有视频格式转换软件,可以将很多种视频格式转换成MP4播放器直接可以直接播放的格式。
MPEG4是以微软的MPEG4 v3标准为原型发展而来的。
它的视频部分采用MPEG4格式压缩,具有可与DVD媲美的高清晰画质;音频部分则以MP3格式进行高质量压缩;最后,由视频部分和音频部分组合成效果足以让我们耳目一新的AVI文件。
最让人赞叹的是,MPEG4的压缩比十分惊人:一张标准容量的CD-ROM光盘,就可以存放约80分钟逼近DVD(MPEG2)质量的高清晰度电影节目。
这就意味着,即使没有DVD驱动器,只通过普通光驱我们也一样可以欣赏精彩的高清晰度电影。
但是目前的MPEG4并不完美,虽然在普通画面方面它已可与DVD相比,但是,MPEG4毕竟是属于一种高压缩比的有损压缩算法,在表现影片中爆炸、快速运动等画面时,它的缺点就开始暴露出来了——轻微的马赛克和色彩斑驳等VCD里常见的问题在这里也开始上演,其图像质量还无法完全和DVD采用的MPEG-2技术相比。
但愿日后随着MPEG4的制作和播放软件进一步完善压缩和解压缩算法来逐步改进。
AVI格式如果你是一名游戏玩家,应该会注意到很多游戏的片首动画都是AVI格式的吧。
比如很多人喜欢玩的《仙剑奇侠传》,片首那段极富中国传统色彩(青山、绿水、白鹭)的动画就是采用的AVI格式。
AVI有一个专业的名字,叫做音频视频交错(Audio Video Interleaved)格式。
它的背景不可小看,它是由Microsoft公司开发的一种数字音频与视频文件格式,原先仅仅用于微软的视窗视频操作环境(VFW ,Microsoft Video for Windows),现在已被大多数操作系统直接支持。
MP4文件格式解析-----个人总结讲解
目录1.引言 (1)2.MP4中一些概念详解 (1)3.MP4文件结构分析 (1)3.1box结构 (1)3.2MP4总体结构 (2)3.3Movie box(moov) (3)3.3.1Movie Header box(mvhd) (3)3.3.2Trak box (4)3.4Media box (6)3.4.1Media header box(mdhd) (6)3.4.2Hdlr box (7)3.4.3Minf box (7)3.5Sample Table Box(stbl) (8)3.5.1Sample Description Box(stsd) (8)3.5.2Time To Sample Box(stts) (8)3.5.3Sample Size Box(stsz) (8)3.5.4Sample To Chunk Box(stsc) (8)3.5.5Sync Sample Box(stss) (9)3.5.6Chunk Offset Box(stco) (9)MP4文件格式解析总结1.引言MP4是一种常见的多媒体容器格式,对应MPEG-4标准,这种容器格式非常全面开放,被认为可以在其中嵌入任何形式的数据,各种编码的视频、音频等都可以。
在MP4文件中,媒体的描述信息与媒体数据是分开的,并且媒体数据的组织也很自由,不一定要按照时间顺序排列。
同时,MP4也支持流媒体,MP4目前被广泛用于封装h.264视频和AAC音频,是高清视频的代表。
MP4格式的官方文件后缀名是“.mp4”,还有其他的以mp4为基础进行的扩展或者是缩水版本的格式。
2.MP4中一些概念详解MP4文件格式中,所有的内容存在一个称为movie的容器中。
一个movie可以由多个tracks组成。
每个track就是一个随时间变化的媒体序列,track里的每个时间单位是一个sample,它可以是一帧视频,或者一段连续的压缩音频。
sample按照时间顺序排列。
mp4
谢谢观看
MPEG-4标准构成
MPEG-4码流主要包括基本码流和系统流,基本码流包括音视频和场景描述的编码流表示,每个基本码流只包 含一种数据类型,并通过各自的解码器解码。系统流则指定了根据编码视听信息和相关场景描述信息产生交互方 式的方法,并描述其交互通信系统。
系统
图1MPEG-4系统把音视频对象及其组合复用成一个场景,提供与场景互相作用的工具,使用户具有交互能力。 MPEG-4的数据在3个层中进行传输,这3层分别是压缩层、同步层和传输层。其中,压缩层是执行媒体解码的系统 组件,接收从同步层传来的压缩数据,并完成解码操作。同步层负责各个压缩媒体的同步和缓冲,一方面接收来 自传输层的同步层数据包(SL),从流中提取同步数据,为以后的同步解码和基本流解码的合成做准备;另一方面, 实现压缩的数据流和同步信息封装层的同步数据包,并将它们传输到传输层。传输层完成各种传输协议的描述, 使用DMIF应用接口,通过接口定义数据流的传输接口,并定义信道建立和断开的信号。MPEG-4的系统终端模型如 图1所示。
mp4
文件格式
目录
01 分部
03 MPEG-4标准构成
02 MPEG-4的特点 04 应用
MP4是一套用于音频、视频信息的压缩编码标准,由国际标准化组织(ISO)和国际电工委员会(IEC)下属 的“动态图像专家组”(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通过,第二版 在1999年12月通过。MPEG-4格式的主要用途在于上流、光盘、语音发送(视频),以及电视广播。
MPEG-4包含了MPEG-1及MPEG-2的绝大部份功能及其他格式的长处,并加入及扩充对虚拟现实模型语言 (VRML, VirtualReality Modeling Language)的支持,面向对象的合成档案(包括音效,视讯及VRML对 象),以及数字版权管理(DRM)及其他互动功能。而MPEG-4比MPEG-2更先进的其中一个特点,就是不再使用宏 区块做影像分析,而是以影像上个体为变化记录,因此尽管影像变化速度很快、码率不足时,也不会出现由一系列的子标准组成,被称为部 (part)(有时也译为卷),包括以下的部分: 第一部分(ISO/IEC -1):系统:描述视讯和音频数据流的控制、同步以及混合方式(即混流 Multiplexing,简写为MUX)。 第二部分(ISO/IEC -2):视讯:定义了一个对各种视觉讯息(包括自然视讯、静止纹理、计算机合成图形 等等)的编译码器。(例如XviD编码就属于MPEG-4 Part2) 第三部分(ISO/IEC -3):音讯:定义了一个对各种音频讯号进行编码的编译码器的集合。包括高阶音频编 码(AdvancedAudio Coding,缩写为AAC)的若干变形和其他一些音频/语音编码工具。 第四部分(ISO/IEC -4):一致性:定义了对本标准其他的部分进行一致性测试的程序。 第五部分(ISO/IEC -5):参考软件:提供了用于演示功能和说明本标准其他部分功能的软件。 第六部分(ISO/IEC -6):多媒体传输整合框架(DMIF for Delivery Multimedia IntegrationFramework) 第七部分(ISO/IEC -7):优化的参考软件:提供了对实作进行优化的例子(这里的实作指的是第五部分)。 第八部分(ISO/IEC -8):在IP络上传输:定义了在IP络上传输MPEG-4内容的方式。
mp4格式原理
MP4是一种常见的视频文件格式,其工作原理是通过压缩和编码技术实现视频数据的存储和传输。
具体来说,MP4文件采用了一种名为MPEG-4(Moving Picture Experts Group-4)的压缩技术,它通过对视频数据进行压缩,使得视频文件能够更小、更易于存储和传输。
在MP4文件中,视频数据被编码为一系列的帧,每一帧都代表了视频中的一个瞬间。
这些帧被压缩后存储在文件中,以便于后续的播放和传输。
同时,MP4文件还包含了音频数据,这些音频数据与视频数据同步播放,使得视频更加生动有趣。
为了实现视频数据的压缩,MPEG-4采用了多种技术,包括空间预测、运动补偿、量化、编码等。
其中,空间预测和运动补偿是MPEG-4中最核心的技术。
空间预测是指通过对当前帧与其相邻帧进行比较,预测当前帧中哪些像素值会发生变化,从而减少需要编码的数据量。
而运动补偿则是通过预测当前帧与上一帧之间的运动矢量,来减少需要编码的数据量。
除了这些技术之外,MPEG-4还采用了分块编码的方式,将每一帧图像分割为多个小块,对每个小块进行独立的编码。
这种分块编码的方式使得MPEG-4能够更好地处理复杂的图像变化和运动。
总的来说,MP4格式的工作原理是通过采用多种压缩和编码技术,实现对视频数据的有效存储和传输。
这些技术使得MP4文件能够更小、更易于存储和传输,同时也保证了视频的播放质量和流畅度。
MP4文件格式的解析,以及MP4文件的分割算法
MP4⽂件格式的解析,以及MP4⽂件的分割算法MP4⽂件格式的解析,以及MP4⽂件的分割算法 mp4应该算是⼀种⽐较复杂的媒体格式了,起源于QuickTime。
以前研究的时候就花了⼀番的功夫,尤其是如何把它完美的融⼊到视频点播应⽤中,更是费尽了⼼思,主要问题是处理mp4⽂件庞⼤的“媒体头”。
当然,流媒体点播也可以采⽤flv格式来做,flv也可以封装H.264视频数据的,不过Adobe却不推荐这么做,⼈家说毕竟mp4才是H.264最佳的存储格式嘛。
这⼏天整理并重构了⼀下mp4⽂件的解析程序,融合了分解与合并的程序,以前是c语⾔写的,应⽤在linux上运⾏的服务器程序上,现在改成c++,⽅便我在其他项⽬中使⽤它,⾄于⽤不⽤移植⼀份c#的,暂时⽤不到,等有必要了再说吧。
这篇⽂章先简单介绍⼀下mp4⽂件的⼤体结构,以及它的分割算法,之后再写⽂章介绍如何把mp4完美应⽤在点播项⽬中。
⼀、MP4格式分析 MP4(MPEG-4 Part 14)是⼀种常见的多媒体容器格式,它是在“ISO/IEC 14496-14”标准⽂件中定义的,属于MPEG-4的⼀部分,是“ISO/IEC 14496-12(MPEG-4 Part 12 ISO base media file format)”标准中所定义的媒体格式的⼀种实现,后者定义了⼀种通⽤的媒体⽂件结构标准。
MP4是⼀种描述较为全⾯的容器格式,被认为可以在其中嵌⼊任何形式的数据,各种编码的视频、⾳频等都不在话下,不过我们常见的⼤部分的MP4⽂件存放的AVC(H.264)或MPEG-4(Part 2)编码的视频和AAC编码的⾳频。
MP4格式的官⽅⽂件后缀名是“.mp4”,还有其他的以mp4为基础进⾏的扩展或者是缩⽔版本的格式,包括:M4V, 3GP, F4V等。
mp4是由⼀个个“box”组成的,⼤box中存放⼩box,⼀级嵌套⼀级来存放媒体信息。
box的基本结构是: 其中,size指明了整个box所占⽤的⼤⼩,包括header部分。
mp4文件格式详细解析
mp4⽂件格式详细解析⽬录1. 概述2. mp4⽂件基本信息3. 封装格式重要概念4. 重要box介绍5. 其他box介绍6. 实⽤技术7. 开源软件参考[1] ISO/IEC 14496-12:2015[2] wikipedia/MPEG-4[3] wikipedia/ISO base media file format[4] wikipedia/MPEG-4 Part 14[5] Tocy/多媒体⽂件格式之MP4[6] Phil Cluff/What's in the box_![7] /gpac/mp4box.js[8] tao/Android⾳视频系列:视频容器操作篇 -- mp4容器打包实现[9] LiaoJunXiong/使⽤gpac封装mp4[10] Jameson Steiner/Fun with Container Formats – Part 21. 概述mp4或称MPEG-4 Part 14,是⼀种多媒体容器格式,扩展名为.mp4。
历史[6]:2001年,apple的QuickTime格式,.qt和.mov的后缀名。
2001年,MPEG-4 Part1,把基于QuickTime的box布局的容器格式添加到了MPEG-4标准。
2004年,标准⽂档把编码和容器格式的说明分开。
MPEG-4 Part12,定义了容器格式通⽤的box结构,即ISO媒体⽂件格式(ISO base media file format, ISOBMFF)。
MPEG-4 Part14,基于Part12进⾏了细化,定义了⽤于存储MPEG-4内容的容器格式,即.mp4格式。
图1 MP4 File Format.png以下是各标准⽂档的链接:QuickTime:QuickTime/QTFFMPEG-4 Part12:ISO/IEC 14496-12:2015MPEG-4 Part14:ISO/IEC 14496-14:2018,官⽹上这部分是付费的。
MP4文件格式入门
Movie header atom 定义了整个 movie 的特性,例如 time scale 和 duration,它的 atom 类型是'mvhd'。
字段 尺寸 类型 版本 标志 生成时间 修订时间 Time scale
长度(字节) 4 4 1 3 4 4 4
字段 尺寸 类型
长度(字节) 4 4
描述 这个 movie header atom 的字节数 moov
以下是实际的 sample_100kbit.mp4 的部分字节,可以看到结果是
主要包含四个子 atom,movie header atom(mvhd), 一个 audio track atom(trak), 一个 video track atom(trak)。
mp4 文件例子
Darwin Streaming Server 里面有一些很好的工具,可以帮助分析 mp4 文件格式。
但是如果可以自己逐字节的 parse 文件,可以更好的了解 mp4 文件格式。这里我就逐字节的分析文件结构。 文件例子是 DSS 里面包含的 sample_100kbit.mp4
Movie Atom - MOOV
The time value for the start time of the current selection.
The duration of the current selection in movie time scale units.
当前时间 下一个待添加 track 的 ID 值。0 不是一个有效的 ID 值。
Overview and Introduction
Core Concepts
MP4文件格式详解——结构概述
MP4文件格式详解——结构概述一、基本概念1、文件,由许多Box和FullBox组成。
2、 Box,每个Box由Header和Data组成。
3、 FullBox,是Box的扩展,Box结构的基础上在Header中增加8bits version和24bits flags。
4、 Header,包含了整个Box的长度size和类型type。
当size==0时,代表这是文件中最后一个Box;当size==1时,意味着Box长度需要更多bits来描述,在后面会定义一个64bits的largesize 描述Box的长度;当type是uuid时,代表Box中的数据是用户自定义扩展类型。
5、 Data,是Box的实际数据,可以是纯数据也可以是更多的子Boxes。
6、当一个Box的Data中是一系列子Box时,这个Box又可成为Container Box。
Box的结构用伪代码表示如下:[cpp] view plaincopyprint?1.aligned(8) class Box (unsigned int(32) boxtype,optional u nsigned int(8)[16] extended_type)2.{3.unsigned int(32) size;4.unsigned int(32) type = boxtype;5.if (size==1)6.{7.unsigned int(64) largesize;8.}9.else if (size==0)10.{11.// box extends to end of file12.}13.if (boxtype==‘uuid’)14.{15.unsigned int(8)[16] usertype = extended_type;16.}结构如下图:文件基本结构描述图二、MP4文件格式(ISO-14496-12/14)MP4文件概述MP4文件就是由各式各样的Box组成的,下表中列出了所有必选或可选的Box类型,√代表Box必选。
5分钟入门MP4文件格式
5分钟⼊门MP4⽂件格式本⽂主要内容包括,什么是MP4、MP4⽂件的基本结构、Box的基本结构、常见且重要的box介绍、普通MP4与fMP4的区别、如何通过代码解析MP4⽂件等。
写作背景:最近经常回答团队⼩伙伴关于直播 & 短视频的问题,⽐如 “flv.js的实现原理”、“为什么设计同学给的mp4⽂件浏览器⾥播放不了、但本地可以正常播放”、“MP4兼容性很好,可不可以⽤来做直播” 等。
在解答的过程中,发现经常涉及 MP4 协议的介绍。
之前这块有简单了解过并做了笔记,这⾥稍微整理⼀下,顺便作为团队参考⽂档,如有错漏,敬请指出。
⾸先,介绍下封装格式。
多媒体封装格式(也叫容器格式),是指按照⼀定的规则,将视频数据、⾳频数据等,放到⼀个⽂件中。
常见的MKV、AVI 以及本⽂介绍的 MP4 等,都是封装格式。
MP4是最常见的封装格式之⼀,因为其跨平台的特性⽽得到⼴泛应⽤。
MP4⽂件的后缀为.mp4,基本上主流的播放器、浏览器都⽀持MP4格式。
MP4⽂件的格式主要由 MPEG-4 Part 12、MPEG-4 Part 14 两部分进⾏定义。
其中,MPEG-4 Part 12 定义了ISO基础媒体⽂件格式,⽤来存储基于时间的媒体内容。
MPEG-4 Part 14 实际定义了MP4⽂件格式,在MPEG-4 Part 12的基础上进⾏扩展。
对从事直播、⾳视频相关⼯作的同学,很有必要了解MP4格式,下⾯简单介绍下。
MP4⽂件由多个box组成,每个box存储不同的信息,且box之间是树状结构,如下图所⽰。
box类型有很多,下⾯是3个⽐较重要的顶层box:ftyp:File Type Box,描述⽂件遵从的MP4规范与版本;moov:Movie Box,媒体的metadata信息,有且仅有⼀个。
mdat:Media Data Box,存放实际的媒体数据,⼀般有多个;虽然box类型有很多,但基本结构都是⼀样的。
mp4有哪些功能
mp4有哪些功能MP4(MPEG-4)是一种常见的多媒体文件格式,通常用于存储音频和视频。
它提供了许多功能和特性,使其成为一个广泛使用的文件格式。
下面是MP4的一些常见功能:1. 视频播放:MP4文件可以存储电影、电视节目、音乐视频等。
它支持多种视频编解码器,如H.264、H.265、MPEG-4等,提供了高质量的视频播放体验。
2. 音频播放:MP4文件也可以存储音频,支持多种音频编解码器,如AAC、MP3、AC3等。
它可以提供高质量的音频播放效果,适用于存储音乐、有声书籍等。
3. 字幕支持:MP4文件支持字幕功能,可以在播放视频时显示字幕,以便观众更好地理解和享受内容。
它可以支持多种字幕格式,如SRT、ASS、SSA等。
4. 多语言支持:MP4文件可以同时存储多个音轨和字幕轨道,使用户能够在播放时选择不同的语言版本。
这对于多语言影片或电视节目非常有用,可以方便观众在不同语言版本之间进行切换。
5. 元数据存储:MP4文件支持存储丰富的元数据信息,如标题、艺术家、专辑名、封面图片等。
这些元数据可以方便地查看和管理,使用户能够更轻松地组织和浏览文件。
6. 文件大小压缩:MP4文件使用先进的压缩算法,可以在保持高质量的情况下将文件大小大大缩小。
这对于存储和传输文件非常有用,可以节省存储空间和带宽。
7. 网络流媒体:MP4文件可用于流媒体传输,可以在网络上实时播放音视频内容。
它支持自适应码率(ABR)技术,可以根据网络状况自动调整视频质量,确保用户无缝观看。
8. 硬件设备兼容性:MP4文件在许多设备上都有广泛的兼容性,如计算机、智能手机、平板电脑、电视机等。
这使得用户可以在不同的设备上方便地播放和共享MP4文件。
总之,MP4是一种功能强大的多媒体文件格式,具有视频播放、音频播放、字幕支持、多语言支持、元数据存储、文件大小压缩、网络流媒体、硬件设备兼容性等众多功能。
它为用户提供了全方位的多媒体体验,使用户能够享受高质量的音视频内容。
mp4 不是标准视频文件
mp4 不是标准视频文件MP4 不是标准视频文件。
MP4,全称MPEG-4 Part 14,是一种常见的数字多媒体容器格式,用于存储音频、视频和字幕数据。
然而,很多人误以为MP4是标准的视频文件格式,实际上,MP4只是一个容器格式,而不是一种视频编解码标准。
在这篇文档中,我们将探讨MP4不是标准视频文件的原因,以及它与视频编解码标准之间的关系。
首先,我们需要明确MP4和视频编解码标准的概念。
视频编解码标准是一种规范,用于指导数字视频的编码和解码过程,以确保视频在不同设备上的播放和传输。
常见的视频编解码标准包括H.264、H.265、VP9等。
而MP4作为容器格式,其作用是将不同编解码标准的音视频数据打包在一起,并提供存储和传输的功能。
其次,MP4并不限定使用特定的视频编解码标准。
这意味着,MP4格式的文件可以使用不同的视频编解码标准进行编码,例如H.264、H.265等。
因此,我们不能简单地认为MP4就是一种标准的视频文件格式,而应该关注其中所包含的具体视频编解码标准。
另外,由于MP4是一种开放的容器格式,它可以容纳各种不同类型的音视频数据,这也导致了MP4文件的复杂性和灵活性。
这种灵活性使得MP4格式成为了目前最为流行的视频容器格式之一,但也带来了一些问题。
由于MP4可以容纳多种不同的编解码标准,当我们播放一个MP4文件时,需要保证播放设备支持该文件所使用的视频编解码标准,否则就会出现无法播放或者画面卡顿的情况。
因此,我们需要明确MP4和视频编解码标准之间的关系。
MP4并不是标准的视频文件格式,它只是一种容器格式,可以容纳不同的视频编解码标准。
在选择视频文件格式时,我们需要考虑到所使用的视频编解码标准,以确保视频的播放和传输质量。
同时,作为视频创作者,我们也需要了解不同视频编解码标准的特点,以便选择适合自己创作需求的编解码标准,从而提高视频的质量和兼容性。
综上所述,MP4并不是标准的视频文件格式,它只是一种容器格式,可以容纳不同的视频编解码标准。
多媒体文件格式(一):MP4格式
多媒体⽂件格式(⼀):MP4格式在互联⽹常见的格式中,跨平台最好的应该就属MP4⽂件了。
因为MP4⽂件既可以在PC平台的Flashplayer中播放,⼜可以在移动平台的Android、iOS等平台中进⾏播放,⽽且使⽤系统默认的播放器即可以播放。
MP4格式是最常见的多媒体⽂件格式。
⼀、MP4 格式标准介绍MP4格式标准为ISO-14496 Part 12、ISO-14496 Part 14,标准内容不是很多,下⾯我们来介绍⼀下格式标准中⼀些重要的信息。
MP4是⼀种描述较为全⾯的容器格式,被认为可以在其中嵌⼊任何形式的数据,各种编码的视频、⾳频等都不在话下,常见的⼤部分的MP4⽂件存放的AVC(H.264)或MPEG-4(Part 2)编码的视频和AAC编码的⾳频。
MP4格式的官⽅⽂件后缀名是“.mp4”,还有其他的以mp4为基础进⾏的扩展或者是阉割版的格式,如:M4V, 3GP, F4V等。
MP4是由⼀个个“Box”组成的,⼤Box中存放⼩Box,⼀级嵌套⼀级来存放媒体信息。
下⾯我们来楚关于Box的⼏个概念:MP4⽂件由许多个Box与FullBox组成。
每个Box由Header和Data两部分组成。
FullBox是Box的扩展,其在Box结构的基础上,在Header中增加8位version标志和24的flags标志。
Header包含了整个Box的长度的⼤⼩(size)和类型(type),当size等于0时,代表这个Box是⽂件的最后⼀个Box。
当size等于1时,说明Box长度需要更多的位来描述,在后⾯会⾃定义⼀个64位的largesize⽤来描述Box的长度。
当type等于uuid时,说明这个Box 中的数据是⽤户⾃定义扩展类型。
Data为Box的实际数据,可以是纯数据,也可以是更多的⼦Box。
当⼀个Box中Data是⼀系列的⼦Box时,这个Box⼜可以称为Container(容器)Box。
介绍了MP4的格式标准后,下⾯我们来介绍是三个MP4分析⼯具,为后续理解MP4⽂件⼀些关键信息做辅助⼯具。
MP4文件格式解析
MP4⽂件格式解析⽂章转⾃:1.ISO/IEC 14496标准ISO/IEC 14496是MPEG专家组制定的MPEG-4标准,分为多个部分(仍在更新)。
参考:第⼀部分(ISO/IEC 14496-1):系统:描述视频和⾳频数据流的控制、同步以及混合⽅式(即混流Multiplexing,简写为MUX)。
第⼆部分(ISO/IEC 14496-2):视频:定义⼀个对各种视觉信息(包括⾃然视频、静⽌纹理、计算机合成图形等等)的编解码器。
(例如XviD编码就属于MPEG-4 Part 2)第三部分(ISO/IEC 14496-3):⾳频:定义⼀个对各种⾳频信号进⾏编码的编解码器的集合。
包括⾼级⾳频编码(Advanced Audio Coding,缩写为AAC)的若⼲变形和其他⼀些⾳频/语⾳编码⼯具。
第四部分(ISO/IEC 14496-4):⼀致性:定义对本标准其他的部分进⾏⼀致性测试的程序。
第五部分(ISO/IEC 14496-5):参考软件:提供⽤于演⽰功能和说明本标准其他部分功能的软件。
第六部分(ISO/IEC 14496-6):多媒体传输集成框架(DMIF for Delivery Multimedia Integration Framework)第七部分(ISO/IEC 14496-7):优化的参考软件:提供对实现进⾏优化的例⼦(这⾥的实现指的是第五部分)。
第⼋部分(ISO/IEC 14496-8):在IP⽹络上传输:定义在IP⽹络上传输MPEG-4内容的⽅式。
第九部分(ISO/IEC 14496-9):参考硬件:提供⽤于演⽰怎样在硬件上实现本标准其他部分功能的硬件设计⽅案。
第⼗部分(ISO/IEC 14496-10):⾼级视频编码或称⾼级视频编码(Advanced Video Coding,缩写为AVC):定义⼀个视频编解码器(codec)。
AVC和XviD都属于MPEG-4编码,但由于AVC属于MPEG-4 Part 10,在技术特性上⽐属于MPEG-4 Part2的XviD要先进。
MP4格式详解
MP4格式详解1. 概览 (实例,很好) QuickTime 常⽤的⼀些Box mdhd 存放视频流创建时间,长度等信息 avc1 视频宽⾼、extionsion中有sps、pps信息(关于和esds) esds:aac⾳频头信息、视频vos、vo头信息() stts:定义每个sample时长(+) ctts:重建P、B帧的DTS、CTS。
stsc:sample-chunk映射表 stsz:指定了每个sample的size stco、co64:Chunk位置偏移表,指定了每个chunk在⽂件中的位置() elst:使某个track的时间戳产⽣偏移。
较少见, mp4a:另有mp4v,不同的mp4分⽀。
c实现的mp4的解析: () 主流编码器的 以下是⼀个典型的mp4格式的⽂件。
后⾯将逐⾏分析格式规范。
2. 详解 下⾯的内容翻译⾃ ISO_IEC_14496-12。
2.1 Box的概念 Box以⼀个header开头,它提供了 size 和 type。
ftpy Box Header ⽀持压缩或扩展⼤⼩(32或64位,可变)以及压缩、扩展类型(32位或完整的通⽤唯⼀标识符,即UUID)。
标准的Box都使⽤紧凑型(32位),⼤多数Box都使⽤紧凑型(32位)⼤⼩。
通常只有媒体数据框需要64位⼤⼩。
⼤⼩是整个Box的⼤⼩(包括size、type、header)、字段和所有包含的框。
这有助于⽂件的⼀般解析。
语法:aligned(8) class Box (unsigned int(32) boxtype, optional unsigned int(8)[16] extended_type) {unsigned int(32) size;unsigned int(32) type = boxtype;if (size==1) {unsigned int(64) largesize;} else if (size==0) {// box extends to end of file}if (boxtype==‘uuid’) {unsigned int(8)[16] usertype = extended_type;}} size:整型,为整个Box的⼤⼩(包含⼦Box),如果size是1,则使⽤largesize表⽰更⼤的范围(8字节),如果size是0则此Box作为⽂件中最后⼀个Box,范围直⾄⽂件末尾(only used for a Media Data Box)。
mp4文件格式解析--个人总结
路漫漫其修远兮,吾将上下而求索 - 百度文库目录1.引言 (1)2.MP4中一些概念详解 (1)3.MP4文件结构分析 (2)3.1box结构 (2)3.2MP4总体结构 (3)3.3Movie box(moov) (3)3.3.1Movie Header box(mvhd) (4)3.3.2Trak box (5)3.4Media box (6)3.4.1Media header box(mdhd) (6)3.4.2Hdlr box (7)3.4.3Minf box (8)3.5Sample Table Box(stbl) (8)3.5.1Sample Description Box(stsd) (8)3.5.2Time To Sample Box(stts) (9)3.5.3Sample Size Box(stsz) (9)3.5.4Sample To Chunk Box(stsc) (9)3.5.5Sync Sample Box(stss) (9)3.5.6Chunk Offset Box(stco) (9)MP4文件格式解析总结1.引言MP4是一种常见的多媒体容器格式,对应MPEG-4标准,这种容器格式非常全面开放,被认为可以在其中嵌入任何形式的数据,各种编码的视频、音频等都可以。
在MP4文件中,媒体的描述信息与媒体数据是分开的,并且媒体数据的组织也很自由,不一定要按照时间顺序排列。
同时,MP4也支持流媒体,MP4目前被广泛用于封装h.264视频和AAC音频,是高清视频的代表。
MP4格式的官方文件后缀名是“.mp4”,还有其他的以mp4为基础进行的扩展或者是缩水版本的格式。
2.MP4中一些概念详解MP4文件格式中,所有的内容存在一个称为movie的容器中。
一个movie可以由多个tracks组成。
每个track就是一个随时间变化的媒体序列,track里的每个时间单位是一个sample,它可以是一帧视频,或者一段连续的压缩音频。
mp4是什么意思
mp4是什么意思
Mp4是一种媒体文件格式,它是根据ISO(国际标准化组织)14496-14规范设计和开发的。
它是一种容易在不同的设备和操作系统上播放的多媒体文件格式。
MP4文件使用在许多应
用中,比如在视频转换等多种应用上。
MP4格式因为它占用的空间较小,特点是音视频文
件和图片融合成一个文件,处理相对来说也比较简单,文件大小也更小。
MP4文件结构包括视频和音频流,以及用于同步视频和音频流的定时器。
它的优势在于可
以同时在多设备之间播放,尤其是在RT(实时传输)传输模式之间的播放方式中,MP4在
实现多渠道的实时传输时有更多的优势。
此外,MP4文件还可以支持动态文件元数据更新,这样就可以在不同的环境下使用不同的文件元数据来改善用户体验。
MP4被广泛用于在线和离线的播放,是一种高压缩的媒体文件格式。
相比而言,其他格式
的音频和视频文件要求更大的存储以及更高的空间来容纳的素材数量。
尽管MP4文件最终
也会有一定的质量损失,但是此类媒体格式所提供的压缩程度已经非常及格。
尤其是在联
网播放中,MP4文件风靡无数网友。
总而言之,MP4是一种应用广泛的媒体文件格式,用于在线和离线的播放。
它可以部署在
不同的平台上,而且具有非常小的存储空间,运行起来也非常方便和能够实现多渠道的实
时传输。
它被广泛用于音视频转换,视频分享和视频编辑等等应用领域。
mp4文件格式详解
MP4文件格式综述关键概念MP4文件格式中,所有的内容存在一个称为movie的容器中。
一个movie可以由多个track s组成。
每个track就是一个随时间变化的媒体序列,例如,视频帧序列。
track里的每个时间单位是一个sample,它可以是一帧视频,或者音频。
sample按照时间顺序排列。
注意,一帧音频可以分解成多个音频sample,所以音频一般用sample作为单位,而不用帧。
MP4文件格式的定义里面,用sample这个单词表示一个时间帧或者数据单元。
每个track会有一个或者多个sample description s。
track里面的每个sample通过引用关联到一个sample description。
这个sample description s定义了怎样解码这个sample,例如使用的压缩算法。
与其他的多媒体文件格式不同的是,MP4文件格式经常使用几个不同的概念,理解其不同是理解这个文件格式的关键。
这个文件的物理格式没有限定媒体本身的格式。
例如,许多文件格式将媒体数据分成帧,头部或者其他数据紧紧跟随每一帧视频,!!!TODO(例如MPEG2)。
而MP4文件格式不是如此。
文件的物理格式和媒体数据的排列都不受媒体的时间顺序的限制。
视频帧不需要在文件按时间顺序排列。
这就意味着如果文件中真的存在这样的一些帧,那么就有一些文件结构来描述媒体的排列和对应的时间信息。
MP4文件中所有的数据都封装在一些box中(以前叫atom)。
所有的metadata(媒体描述元数据),包括定义媒体的排列和时间信息的数据都包含在这样的一些结构box中。
MP4文件格式定义了这些这些box的格式。
Metadata对媒体数据(例如,视频帧)引用说明。
媒体数据可以包含在同一个的一个或多个box里,也可以在其他文件中,metadata允许使用URLs来引用其他的文件,而媒体数据在这些引用文件中的排列关系全部在第一个主文件中的metadata描述。
mp4文件格式分析
十六进制码流分析:ftyp Box00 00 00 1C: size ,28,表示此BOX有28个字节,表示长度的四个字节也计算在内。
以下同66 74 79 70: type,表示BOX TYPE,此处为ftyp6D 70 34 32: 可能是兼容的格式信息,/////mp4200 00 00 00: 可能是插入的空字节,/////也可能是version ,flags6D 70 34 32: 可能是兼容的格式信息,mp42/////major-brand6D 70 34 31: 可能是兼容的格式信息,mp41///// minor-version69 73 6F 6D: isom, ftyp中的最后一个标识,compatible-brands[]; // to end of the boxThe brand ‘mp41’ is defined as identifying version 1 of this specification (ISO/IEC 14496-1:2001), and the brand ‘mp42’ identifies this version of the specification; at least one of these brands shall appear in the compatible-brands list in the file-type box, in all files conforming to this specification.moov Box00 03 B0 59: size of moov.241753个字节6D 6F 6F 76: moovmvhd Box00 00 00 6C: size,mvhd Box的大小为108个字节6D 76 68 64: mvhd00 00 00 00: version,flagsBE EE 87 C5: creation-time创建文件的时间,是距离1904年1月1日0点的秒数BE EE 87 C5: modifiation-time修改文件的时间,00 01 5F 90: timescale时标,时间刻度的单位,为1/90 000秒01 A8 61 B8: duration持续时间00 01 00 00: rate播放描述的等级01 00: volume播放时的音量00 00: 保留的16bits的000 00 00 00: 保留的32bits的000 00 00 00: 保留的32bits的000 01 00 00 00 00 00 00 00 00 00 00 00 00 00 0000 01 00 00 00 00 00 00 00 00 00 00 00 00 00 0040 00 00 00 : matrix给视频提供的转换矩阵00 00 00 00 00 00 00 00 00 00 00 0000 00 00 00 00 00 00 00 00 00 00 00: 6个32bits的pre-defined 的000 01 00 CA: next-track-ID下一个轨迹IDiods Box00 00 00 21: size of iods,33个字节69 6F 64 73: iods, Initial Object Descriptor00 00 00 00: version,flags10 13 00 4F: 可能是OD, Object DescriptorFF FF 0F FE:FF 0E 04 00:00 00 01 0E:04 00 00 00:02udta Box00 00 06 8F: size of udta ,167975 64 74 61: udta,uuid Box00 00 04 A9: size of uuid,119375 75 69 64: uuidF7 8C AA 0C 36 BE 4C E9 88 D2 03 C2 56 DA BE B2 : 由于boxtype = uuid而定义的16个字节的usertype EES-3-0-410VEAEAudioEncoder-2-1-11V bitRate=2000000bpsV keyFrame Period In Ms=10000V number of Pass=2V progressive Interlaced=0V rateControlMode=cbrV smoothVsSharp=0V sourceNature=naturalV useBFrame =false.此处表明本码流没有使用B帧V videoEncoderType=mpeg4V advVideo EncoderType=mpeg4V allowBitRateUnderflow=falseV change Rgb Yuv Conversion=falseV setCustomBitmapSize=falseV useCustomPixedAspectRatio=falseV useExpertFeaturesASP=falseV useMotionFiltering=falseV useVideoPacket=falseV vbvSizeInMs=1000V burnLogo=falseV changeframerate=falseV useColorAdjustment=falseV useCropFilter=falseV useScaleFilter=falseV useSpatialFilter=falseV useTimecodes=falseA audioEncoderType=aacA bitRate=64000bpsA useAutomaticBandwidth=trueA useMS=trueA balanceLeftRight=0A volumeInDB=0starttime=0stoptime=9223372036854775807,MTUSize=1448exportType=mp4hinted=trueprogressiveDownload=trueallowDebugInformationInStream=trueavoidQuickTime6Warnings=falseforceETV15compatibility=falseforcePlayerCompatibility=falsemultiThreadedOptimization=0openA VIWith=DirectShowpreviewOnOff=1previewlayout=0showEncodingStatistics=true.......................hnti Box00 00 01 DE:size of hnti,47868 6E 74 69:hntirtp Box00 00 01 D6:size of rtp,47072 74 70 20:rtp73 64 70 20:sdpa=mpeg4-iod:”data:application/mpeg4-iod;base64 ................................trak Box00 00 01 A4: size of trak,42074 72 61 6B: traktkhd Box00 00 00 5C: size of tkhd,9274 6B 68 64: tkhd, track head box00 00 00 01: 00,version; 00 00 01,track enable flagsBE EE 87 C5: creation-time创建文件的时间BE EE 87 C5: modifiation-time修改文件的时间,两个时间应该相同00 00 00 01: track-ID00 00 00 00: 保留的32bits的001 A8 5E 16: duration持续的时间00 00 00 00 00 00 00 00: 保留的2个32bits的000 00:layer 000 00:pre-defined 000 00:volume,as non audio,if audio ,0x010000 00:reserved 000 01 00 00 00 00 00 0000 00 00 00 00 00 00 00 00 01 00 00 00 00 00 0000 00 00 00 00 00 00 00 40 00 00 00 :matrix00 00 00 00:width,if track_is_visual 0x01400000 else 000 00 00 00:height,if track_is_visual 0x00F00000 else 0mdia Box00 00 01 28: size of mdia,2966D 64 69 61: mdiamdhd Box00 00 00 20: size of mdhd ,326D 64 68 64: mdhd00 00 00 00: versionBE EE 87 C5: creation-timeBE EE 87 C5: modification-time00 00 03 E8: timescale00 04 B7 17: duration0 :pad10101 01110 00100: 3个5bits的language00 00 :pre-defined 0hdlr Box00 00 00 21:size of hdlr,3368 64 6C 72: hdlr00 00 00 00: version00 00 00 00: pre-defined 06F 64 73 6D:odsm,handler-type. ObjectDescriptorStream 00 00 00 00 00 00 00 00 00 00 00 00 : 3个reserved 00 :string nameminf Box00 00 00 DF: size of minf,2236D 69 6E 66: minfnmhd Box00 00 00 0C: size of nmhd,126E 6D 68 64: nmhd00 00 00 00: versiondinf Box00 00 00 24: size of dinf,3664 69 6E 66: dinfdref Box00 00 00 1C: size of dref,2864 72 65 66: dref00 00 00 00: version00 00 00 01: entry-counturl Box00 00 00 0C: size of url ,1275 72 6C 20: url00 00 00 01: locationstbl Box00 00 00 A7: size of stbl,16773 74 62 6C: stblstsd Box00 00 00 43: size of stsd,6773 74 73 64: stsd00 00 00 00: version,flags00 00 00 01: entry-countmp4s Box00 00 00 33: size of mp4s, 516D 70 34 73: mp4s00 00 00 00: version00 00 00 01: ESesds Box00 00 00 23: size of esds,3565 73 64 73: esds00 00 00 00: version03 15 00 00:00 04 0D 01:05 00 00 C8:00 00 00 00:00 00 00 00:06 01 02:stts Box00 00 00 18: size of stts,2473 74 74 73: stts00 00 00 00: version00 00 00 01: entry-count00 00 00 01: sample-count00 04 B7 17: sample-deltastsc Box00 00 00 1C: size of stsc ,2873 74 73 63: stsc00 00 00 00: version00 00 00 01: entry-count00 00 00 01: first-chunk00 00 00 01: samples-per-chunk00 00 00 01: sample-description-indexstsz Box00 00 00 14: size of stsz,2073 74 73 7A: stsz00 00 00 00: version00 00 00 12: sample-size00 00 00 01: sample-countstco Box00 00 00 14: size of stco,2073 74 63 6F: stco00 00 00 00: version00 00 00 01: entry-count00 03 B0 7D: chunk-offsettref Box00 00 00 18: size of tref,2474 72 65 66: trefmpod Box00 00 00 10: size of mpod,166D 70 6F 64: mpod00 00 00 C9:00 00 00 65:trak Box00 00 01 91: size of trak,40174 72 61 6B: traktkhd Box00 00 00 5C: size of tkhd,9274 6B 68 64: tkhd00 00 00 01: 00,version; 00 00 01,track enable flagsBE EE 87 C5: creation-time创建文件的时间BE EE 87 C5: modifiation-time修改文件的时间,两个时间应该相同00 00 00 02: track-ID00 00 00 00: 保留的32bits的001 A8 5E 16: duration持续的时间00 00 00 00 00 00 00 00: 保留的2个32bits的000 00:layer 000 00:pre-defined 000 00:volume,as non audio,if audio ,0x010000 00:reserved 000 01 00 00 00 00 00 0000 00 00 00 00 00 00 00 00 01 00 00 00 00 00 0000 00 00 00 00 00 00 00 40 00 00 00 :matrix00 00 00 00:width,if track_is_visual 0x01400000 else 000 00 00 00:height,if track_is_visual 0x00F00000 else 0mdia Box00 00 01 2D:size of mdia,3016D 64 69 61:mdiamdhd Box00 00 00 20: 326D 64 68 64:mdhd00 00 00 00 :version,flagsBE EE 87 C5: creation-time创建文件的时间BE EE 87C5: modifiation-time修改文件的时间,两个时间应该相同00 00 03 E8: timescale时标00 04 B7 17: duration持续的时间55 C4:pad, 3个5bits的language00 00: pre-defined 0hdlr Box00 00 00 21:size of hdlr ,3368 64 6C 72: hdlr00 00 00 00: version00 00 00 00: pre-defined 073 64 73 6D: sdsm,handler-type, SceneDescriptionStream00 00 00 00 00 00 00 00 00 00 00 00 : 3个reserved00 :string nameminf Box00 00 00 E4: size of minf,2286D 69 6E 66: minfnmhd Box00 00 00 0C: size of nmhd,126E 6D 68 64: nmhd00 00 00 00: versiondinf Box00 00 00 24: size of dinf,3664 69 6E 66: dinfdref Box00 00 00 1C: size of dref,2864 72 65 66: dref00 00 00 00: version00 00 00 01: entry-counturl Box00 00 00 0C: size of url ,1275 72 6C 20: url00 00 00 01: locationstbl Box00 00 00 AC: size of stbl,17273 74 62 6C: stblstsd Box00 00 00 48: size of stsd,7273 74 73 64: stsd00 00 00 00: version,flags00 00 00 01: entry-countmp4s Box00 00 00 38: size of mp4s, 566D 70 34 73: mp4s00 00 00 00: version00 00 00 01: ESesds Box00 00 00 28: size of esds,4065 73 64 73: esds00 00 00 00: version03 1A 00 00:00 04 12 02:0D 00 00 20:00 00 00 00:00 00 00 00:05 03 00 00:40 06 01 02:stts Box00 00 00 18: size of stts,2473 74 74 73: stts00 00 00 00: version00 00 00 01: entry-count00 00 00 01: sample-count00 04 B7 17: sample-deltastsc Box00 00 00 1C: size of stsc ,2873 74 73 63: stsc00 00 00 00: version00 00 00 01: entry-count00 00 00 01: first-chunk00 00 00 01: samples-per-chunk00 00 00 01: sample-description-index stsz Box00 00 00 14: size of stsz,2073 74 73 7A: stsz00 00 00 00: version00 00 00 18: sample-size00 00 00 01: sample-countstco Box00 00 00 14: size of stco,2073 74 63 6F: stco00 00 00 00: version00 00 00 01: entry-count00 03 B0 8F: chunk-offsettrak Box00 01 71 55:size of trak,74 72 61 6B:traktkhd Box00 00 00 5C: size of tkhd,9274 6B 68 64: tkhd, track head box00 00 00 01: 00,version; 00 00 01,track enable flagsBE EE 87 C5: creation-time创建文件的时间BE EE 87 C5: modifiation-time修改文件的时间,两个时间应该相同00 00 00 C9: track-ID00 00 00 00: 保留的32bits的001 A8 61 B8: duration持续的时间00 00 00 00 00 00 00 00: 保留的2个32bits的000 00:layer 000 00:pre-defined 000 00:volume,as non audio,if audio ,0x010000 00:reserved 000 01 00 00 00 00 00 0000 00 00 00 00 00 00 00 00 01 00 00 00 00 00 0000 00 00 00 00 00 00 00 40 00 00 00 :matrix02 D0 00 00:width,if track_is_visual 0x01400000 else 001 E0 00 00:height,if track_is_visual 0x00F00000 else 0mdia Box00 01 70 CD: size of mdia6D 64 69 61: mdiamdhd Box00 00 00 20: size of mdhd ,326D 64 68 64: mdhd00 00 00 00: versionBE EE 87 C5: creation-timeBE EE 87 C5: modification-time00 01 5F 90: timescale01 A8 61 B8: duration0 :pad10101 01110 00100: 3个5bits的language00 00 :pre-defined 0hdlr Box00 00 00 21:size of hdlr,3368 64 6C 72: hdlr00 00 00 00: version00 00 00 00: pre-defined 076 69 64 65: vide,handler-type,表示此trak为视频00 00 00 00 00 00 00 00 00 00 00 00 : 3个reserved00 :string nameminf Box00 01 70 84: size of minf,943406D 69 6E 66: minfvmhd Box00 00 00 14: size of nmhd76 6D 68 64: nmhd00 00 00 01: version,flags00 00 00 00:00 00 00 00:dinf Box00 00 00 24: size of dinf,3664 69 6E 66: dinfdref Box00 00 00 1C: size of dref,2864 72 65 66: dref00 00 00 00: version00 00 00 01: entry-counturl Box00 00 00 0C: size of url ,1275 72 6C 20: url00 00 00 01: locationstbl Box00 01 70 44: size of stbl73 74 62 6C: stblstsd Box00 00 00 AC: size of stsd,7273 74 73 64: stsd00 00 00 00: version,flags00 00 00 01: entry-countmp4v Box00 00 00 9C: size of mp4v6D 70 34 76: mp4v00 00 00 00: version00 00 00 01: ES00 00 00 00 00 00 :00 00 00 00 00 00 00 00 00 00 02 D0 01 E0 00 48 00 00 00 48 00 00 00 00 00 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 18 FF FF esds Box00 00 00 46: size of esds65 73 64 73: esds00 00 00 00: version03 38 00 00:00 04 30 20:11 03 D0 90:00 1E 84 80:00 1E 84 80:05 21 00 00:01 B0 00 00:00 01 B5 0E:A0 20 20 2F:00 00 01 00:00 00 01 20:00 C7 88 BA:98 51 68 43:C1 46 3F 06:01 02 :stts Box00 00 E7 90: size of stts73 74 74 73: stts00 00 00 00: version00 00 1C F0: entry-count00 00 00 01: sample-count00 00 0B BB: sample-delta00 00 00 0100 00 11 9700 00 00 0100 00 0B BB00 00 00 0100 00 11 9A...........stsc Box00 00 0E 8C: size of stsc ,73 74 73 63: stsc00 00 00 00: version00 00 01 35: entry-count00 00 00 01: first-chunk00 00 00 15: samples-per-chunk00 00 00 01: sample-description-index00 00 00 0200 00 00 1800 00 00 0100 00 00 0300 00 00 1800 00 00 0100 00 00 0400 00 00 1800 00 00 01.............stsz Box00 00 73 D8 size of stsz,2073 74 73 7A: stsz00 00 00 00: version00 00 00 00: sample-size00 00 1C F1: sample-count00 00 86 24(从此开始,为当前chunk中每帧视频数据的字节大小,此大小与offset相对应,用offset找到偏移的绝对地址(指向mdat box中)后,从000001B6的第一个字节开始,加上对应的视频字节数,就是本帧的大小。
mp4格式解析
目前MP4的概念被炒得很火,也很乱。
最开始MP4指的是音频(MP3的升级版),即MPEG-2 AAC标准。
随后MP4概念被转移到视频上,对应的是MPEG-4标准。
而现在我们流行的叫法,多半是指能播放MPEG-4标准编码格式视频的播放器。
但是这篇文章介绍的内容跟上面这些都无关,我们要讨论的是MP4文件封装格式,对应的标准为ISO/IEC 14496-12,即信息技术视听对象编码的第12部分:ISO 基本媒体文件格式(Information technology Coding of audio-visual objects Part 12: ISO base media file format)。
ISO/IEC组织指定的标准一般用数字表示,ISO/IEC 14496即MPEG-4标准。
MP4视频文件封装格式是基于QuickTime容器格式定义的,因此参考QuickTime的格式定义对理解MP4文件格式很有帮助。
MP4文件格式是一个十分开放的容器,几乎可以用来描述所有的媒体结构,MP4文件中的媒体描述与媒体数据是分开的,并且媒体数据的组织也很自由,不一定要按照时间顺序排列,甚至媒体数据可以直接引用其他文件。
同时,MP4也支持流媒体。
MP4目前被广泛用于封装h.264视频和AAC音频,是高清视频的代表。
现在我们就来看看MP4文件格式到底是什么样的。
1、概述MP4文件中的所有数据都装在box(QuickTime中为atom)中,也就是说MP4文件由若干个box组成,每个box有类型和长度,可以将box理解为一个数据对象块。
box中可以包含另一个box,这种box称为container box。
一个MP4文件首先会有且只有一个“ftyp”类型的box,作为MP4格式的标志并包含关于文件的一些信息;之后会有且只有一个“moov”类型的box(Movie Box),它是一种container box,子box包含了媒体的metadata信息;MP4文件的媒体数据包含在“mdat”类型的box(Midia Data Box)中,该类型的box也是container box,可以有多个,也可以没有(当媒体数据全部引用其他文件时),媒体数据的结构由metadata进行描述。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录
1.引言 (1)
2.MP4中一些概念详解 (1)
3.MP4文件结构分析 (1)
3.1box结构 (1)
3.2MP4总体结构 (2)
3.3Movie box(moov) (3)
3.3.1Movie Header box(mvhd) (3)
3.3.2Trak box (4)
3.4Media box (5)
3.4.1Media header box(mdhd) (6)
3.4.2Hdlr box (6)
3.4.3Minf box (7)
3.5Sample Table Box(stbl) (7)
3.5.1Sample Description Box(stsd) (8)
3.5.2Time To Sample Box(stts) (8)
3.5.3Sample Size Box(stsz) (8)
3.5.4Sample To Chunk Box(stsc) (8)
3.5.5Sync Sample Box(stss) (8)
3.5.6Chunk Offset Box(stco) (8)
MP4文件格式解析总结
1.引言
MP4是一种常见的多媒体容器格式,对应MPEG-4标准,这种容器格式非常全面开放,被认为可以在其中嵌入任何形式的数据,各种编码的视频、音频等都可以。
在MP4文件中,媒体的描述信息与媒体数据是分开的,并且媒体数据的组织也很自由,不一定要按照时间顺序排列。
同时,MP4也支持流媒体,MP4目前被广泛用于封装h.264视频和AAC音频,是高清视频的代表。
MP4格式的官方文件后缀名是“.mp4”,还有其他的以mp4为基础进行的扩展或者是缩水版本的格式。
2.MP4中一些概念详解
MP4文件格式中,所有的内容存在一个称为movie的容器中。
一个movie 可以由多个tracks组成。
每个track就是一个随时间变化的媒体序列,track里的每个时间单位是一个sample,它可以是一帧视频,或者一段连续的压缩音频。
sample按照时间顺序排列。
其中一帧音频可以分解成多个音频sample,所以音频一般用sample作为单位,而不用帧。
MP4文件格式的定义里面,用sample表示一个时间帧或者数据单元。
几个连续的sample就构成了一个chunk。
3.MP4文件结构分析
3.1box结构
MP4由一个一个box组成,每个box由一个boxheader和boxdata组成,boxheader又分为3部分:
①4字节的size:表示这个box的大小
②4字节的type:表示这个box的类型
③8字节的largesize
如果整个box的大小超出了4字节能表示的最大值,那么size=1,同时,box 的大小就储存在largesize中。
3.2MP4总体结构
Mp4必须包含ftyp box、moov box、mdat box。
File type box(ftyp)用来储存文件类型的相关信息,Movie box(moov)用来储存媒体的信息,是一个container box, Media data box(mdat)用来储存媒体的具体数据
3.3Movie box(moov)
一个movie box包含一个mvhd box和若干个trak box,比如audio trakbox,vediotrak box。
3.3.1Movie Header box(mvhd)
3.3.2Trak box
Trak box必须包含一个tkhd box和一个media box,此外还有很多可选的box:
①Track Header box(tkhd):定义了一个track的特性,例如时间,空间和音量信息。
②media box:该box是一个包含一些track媒体数据信息box的container box。
3.4Media box
Media box主要包含media header box(mdhd)、hdlr box、minf box。
3.4.1Media header box(mdhd)
media header box(mdhd)定义了整个movie 的特性,例如time scale 和
3.4.2Hdlr box
Hdlr box解释了媒体的播放过程信息。
同时也指明了本trak类型,如:vedio、
3.4.3Minf box
存储了解释该track的媒体数据的handler-specific的信息。
media handler用这些信息将媒体时间映射到媒体数据,并进行处理。
minf包含一个header box,一个Data Information Box(dinf)和一个Sample Table Box(stbl):
①Header box定义颜色和图形模式信息
②dinf box解释如何定位媒体信息
③stblbox包含了关于track中sample所有时间和位置的信息,以及sample的编解码等信息。
利用这个表,可以解释sample的时序、类型、大小以及在各自存储容器中的位置。
3.5Sample Table Box(stbl)
Sample Table Box(stbl)包含:sample description box(stsd)、time to sample box (stts)、sample size box(stsz)、sample to chunk box(stsc)、chunk offset box(stco)、composition time to sample box(ctts)、sync sample box(stss)。
3.5.1Sample Description Box(stsd)
box header和version字段后会有一个entry count字段,根据entry的个数,每个entry会有type信息,如“vide”、“sund”等,根据type不同sample description 会提供不同的信息,例如对于video track,会有“VisualSampleEntry”类型信息,对于audio track会有“AudioSampleEntry”类型信息。
视频的编码类型、宽高、长度,音频的声道、采样等信息都会出现在这个box 中。
3.5.2Time To Sample Box(stts)
stts存储了sample的duration,描述了sample时序的映射方法,我们通过它可以找到任何时间的sample。
stts可以包含一个压缩的表来映射时间和sample序号,用其他的表来提供每个sample的长度和指针。
表中每个条目提供了在同一个时间偏移量里面连续的sample序号,以及samples的偏移量。
递增这些偏移量,就可以建立一个完整的time to sample表。
3.5.3Sample Size Box(stsz)
stsz定义了每个sample的大小,包含了媒体中全部sample的数目和一张给出每个sample大小的表。
这个box相对来说体积是比较大的。
3.5.4Sample To Chunk Box(stsc)
用chunk组织sample可以方便优化数据获取,一个thunk包含一个或多个sample。
stsc中用一个表描述了sample与chunk的映射关系,查看这张表就可以找到包含指定sample的thunk,从而找到这个sample。
3.5.5Sync Sample Box(stss)
stss确定media中的关键帧。
对于压缩媒体数据,关键帧是一系列压缩序列的开始帧,其解压缩时不依赖以前的帧,而后续帧的解压缩将依赖于这个关键帧。
stss 可以非常紧凑的标记媒体内的随机存取点,它包含一个sample序号表,表内的每一项严格按照sample的序号排列,说明了媒体中的哪一个sample是关键帧。
如果此表不存在,说明每一个sample都是一个关键帧,是一个随机存取点。
3.5.6Chunk Offset Box(stco)
stco定义了每个thunk在媒体流中的位置。
位置有两种可能,32位的和64位的,后者对非常大的电影很有用。
在一个表中只会有一种可能,这个位置是在整个文
件中的,而不是在任何box中的,这样做就可以直接在文件中找到媒体数据,而不用解释box。
需要注意的是一旦前面的box有了任何改变,这张表都要重新建立,因为位置信息已经改变了。