数字媒体文件格式
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
APP0标记(Marker)标识JFJF应用数据块(APP0域)的开始,其后的APP0域中顺序包含了下列字段:① APP0长度(length),2个字节;② 标识符(identifier),5个字节,格式为“JFJF0”,用于识别APP0的标记;③ 版本号(version),2个字节,其中第一个字节为主要版本号,如版本1.02中的1,第二个字节为次要版本号,如版本1.02中的02;④ X和Y的密度单位,1个字节,units=0表示无单位,units=1表示单位为点数/英寸,units=2表示单位为点数/厘米;⑤ X方向像素密度(X density),2个字节;⑥ Y方向像素密度(Y density),2个字节;⑦ 缩略图水平像素数目(thumbnail horizontal pixels),1个字节;⑧ 缩略图垂直像素数目(thumbnail vertical pixels),1个字节;⑨ 缩略图RGB位图(thumbnail RGB bitmap),3n个字节,其中n为缩略图的像素数。APPn标记(Markers)分别标识其它的应用数据块(APPn域)的开始,其中n=1~15(任选)。每个APPn域包含两部分:① APPn长度(length);②标识符(identifier),5个字节,格式为“JFXX0”;③ 缩略图格式,1个字节,指定什么数据格式为指图使用,其中0x10表示JPEG格式,0x11表示采用每个像素点1个字节的palettised格式,0x13表示采用每个像素点3字节的RGB格式;④ 缩略图数据,长度会根据格式的不同而变化,具体参见JPEG标准。
JPEG文件
量化表DQT部分可包含一个或者多个量化表。每个量化表都是以0XFFDB开始,其后跟2个字节的量化表长度字段;后面是一个字节的量化表序号;最后是64个字节的量化表,量化表的系数是按照Z型扫描所得的8*8量化系数的顺序存储的。帧图像开始SOF0(Start of Frame)之后有6个固有字段,分别是:① 帧开始长度,2个字节;② 精度,每个颜色分量每个像素的位数,1个字节;③ 图像高度,2个字节;④ 图像宽度,2个字节;⑤ 颜色分量数,1个字节;⑥ 各颜色分量量化设置,共9字节,对每个颜色分量有3个字节的设置,分别是ID,垂直方向的样本因子和水平方向的样本因子,量化表号。霍夫曼表DHT部分也可包含一个或者多个表,每个表均以0XFFC4开始,包含以下5个部分:① 霍夫曼表的长度;② 类型,AC或者DC;③ 索引;④ 位表;⑤ 值表。扫描开始SOS(Start of Scan)部分存储实际的编码数据,每个扫描的长度会有所不同,由紧随其后的2个字节的扫描开始长度表示,后面是1个字节的颜色分量数,后面还包括针对每个颜色分量的描述,每个分量的内容有ID号、交流系数表号和直流系数表号。在这之后就是压缩图像的数据。文件以图像结束EOI(End of Image)标识符作为文件的结束。
RIFF(Resource Interchange File Format,资源交换档案标准)是一种把资料存储在被标记的区块(tagged chunks)中的档案格式。RIFF由Microsoft和IBM在1991年共同提出,是1985年Electronic Arts提出的Interchange File Format的翻版。这两种标准的唯一不同处是多位元整数的储存方式。RIFF使用的是little-endian,这是IBM的PC机使用的处理器80x86中使用的格式,而IFF储存整数的方式是使用big-endian,这是Amiga和Apple Macintosh电脑使用的处理器可处理的整数型态。Microsoft在AVI和WAV这两种著名的档案格式中,都使用RIFF的格式当成它们的基础。
标记名称
标记的16进制值
标记含义
1
SOI
0xD8
图像开始
2
APP0
0xE0
JFIF应用数据块
3
APPn
0xE1 - 0xEF
其他的应用数据块(n, 1~15)
4
DQT
0xDB
量化表
5
SOF0
0xC0
帧开始
6
DHT
0xC4
霍夫曼(Huffman)表
7
SOS
0xDA
扫描线开始
8
EOI
0xD9
图像结束
JPEG文件
多媒体信息处理
第8章 数字媒体文件格式
主要内容
多媒体文件的基础知识常用图像文件格式常用动画文件格式常用视频文件格式常用音频数据格式
图像文件的格式
计算机中存储多媒体数据的方式多媒体数据以计算机数据文件方式存储编码方式:无压缩,无损压缩、有损压缩类型:图像、动画、视频、音频常用的图像文件格式BMP、JEPG、TIFF、GIF、……常用的动画文件格式GIF、Flic、SWF、……存储视频数据的方式AVI、MPEG、MOV、RMVB、ASF、WMV、YUV、 ……存储音频数据的方式MIDI、WAVE、MP1/2/3/4/AAC、 ……
biCompression
4字节
指定位图是否压缩,有效的值为BI_RGB,BI_RLE8,BI_RLE4,BI_BITFIELDS(这些是由Windows定义的常量)。BI_RGB表示不压缩;Windows位图可以采用RLE4和RLE8的压缩格式,但用的不多。
biSizeImage
4字节
指定实际的位图数据占用字节数,如biCompression为BI_RGB,则该项可为零
字段名
字段长度
字段说明
biSize
4字节
指定这个结构的长度,为40
biWidth
4字节
指定图像的宽度,单位是像素
biHeight
4字节
指定图像的高度,单位是像素
biplanes
2字节
必须是1,不用考虑
biBitCount
2字节
指定表示颜色时要用到的位数,常用的值为1(黑白二色图);4(16色图);8(256色);24(真彩色图)等
biXPelsPerMeter
4字节
指定目标设备的水平分辨率,单位是每米的像素个数
biYPelsPerMeter
4字节
指定目标设备的垂直分辨率,单位同上
biClrUsed
4字节
指定本图像实际用到的颜色数,如果该值为零,则用到的颜色数为2biBitCount
biClrImportant
4字节
指定本图像中重要的颜色数,如果该值为零,则认为所有的颜色都是重要的
BMP文件
BMP图像的调色板和图像数据BMP的图像数据从下到上,从左到右按行排列。每一行的字节数是4的倍数,不足的字节补0
TIFF文件
TIFF文件格式TIFF是一个广为应用的光栅图像文件格式,是一个非常稳定的文件格式是为存储扫描图像设计的,图像格式复杂、存储信息多TIFF的特点支持从高端到低端的设备可扩展性强,支持公共和私用的标记结构支持各种压缩格式有公共软件库支持多种扩展功能:二值图、灰度图、调色板、真彩色
BMP文件
BMP文件格式Windows操作系统的标准文件格式BMP是一种与硬件设备无关的图像文件格式,使用非常广 压缩和非压缩两种,一般采用行程长度编码(RLE)BMP图像文件包含图像文件头、图像信息头、调色板、图像数据
BMP文件
BMP图像文件头
字段名
字段长度
字段说明
bfType
2Byte
指定文件类型,必须是0x424D,即字符串“BM”,即所有.bmp文件的头两个字节都是“BM”
位图和调色板
位图又称光栅图、点阵图,是使用像素阵列来表示的图像。每个像素的色彩信息由RGB组合或者灰度值表示。根据颜色信息所需的数据位分为1、4、8、16、24及32位等。其中使用1位表示一个像素颜色的位图因为一个数据位只能表示两种颜色,所以又称为二值位图。
位图和调色板
存储了图像的位图信息的文件称为位图文件。位图文件分为DDB位图(Device-dependent bitmap,设备相关位图)与DIB位图(Device-independent bitmap,设备无关位图)。DDB位图的固有问题。DIB不依赖于具体设备,可以用来永久性地保存图像。DIB文件后缀:BMP或DIB。DIB位图与逻辑调色板。DIB位图包含下列的颜色和尺寸信息:原始设备(即创建图片的设备)的颜色格式;原始设备的分辨率;原始设备的调色板;一个位数组,由红、绿、蓝(RGB)三个值代表一个像素;一个数组压缩标志,用于表明数据的压缩方案(如果需要的话)。以上信息保存在BITMAPINFO结构中,该结构由BITMAPINFOHEADER结构和两个或更多个RGBQUAD结构所组成。BITMAPINFOHEADER结构所包含的成员表明了图像的尺寸、原始设备的颜色格式、以及数据压缩方案等信息。RGBQUAD结构标识了像素所用到的颜色数据。
图像文件结构
一般的图像文件主要包含文件头、文件体和文件尾等三部分。文件头的主要内容包括产生或编辑该图像文件的软件的信息以及图像本身的参数。文件体主要包括图像数据以及颜色变换查找表或调色板数据。文件尾可包含一些用户信息。文件尾是可选项。几乎所有的图像文件都采用各自简化的格式名作为文件扩展名。
资源交换档案标准RIFF
bfSize
4Byte
指定文件大小,包括这14个字节
bfReserved1
2Byte
保留字,不用考虑
bfReserved2
2Byte
保留字,不用考虑
bfOffBits
2Byte
从文件头到实际的位图数据的偏移字节数,即前三个部分的长度之和
BMP文件
BMP图像的信息头typedef struct tagBITMAPINFOHEADER{DWORD biSize; LONG biWidth; LONG biHeight; WORD biPlanes; WORD biBitCount DWORD biCompression; DWORD biSizeImage; LONG biXPelsPerMeter; LONG biYPelsPerMeter; DWORD biClrUsed; DWORD biClrImportant; } BITMAPINFOHEADER;
JPEG文件
JPEG静止图像压缩采用有损编码方式应用于数码相机JPEG2000为JPEG的升级版,其压缩率比JPEG高约30%支持有损压缩和无损压缩能实现渐进传输:即先传输图像的轮廓,然后逐步传输数据,让图像由朦胧到清晰显示应用于数码相机、网络传输、无线通信
JPEG文件
JPEG委员会在制定JPEG标准时,定义了许多标记来区分和识别图像数据及其相关信息,但对JPEG文件交换格式没有明确的定义。目前使用比较广泛的是JPEG文件交换格式(JPEG File Interchange Format,JFIF)是1992年9月由在C-Cube Microsystems公司的Eric Hamilton提出的,版本号为1.02。在JFIF文件格式中,图像样本的存放顺序是从左到右和从上到下,即文件中的第一个图像样本是图像左上角的样本。JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记,因此JFIF格式成了事实上JPEG文件交换格式标准。JPEG的每个标记都是由2个字节组成,其前一个字节是固定值0xFF。每个标记之前还可以添加数目不限的0xFF填充字节。
R
I
F
F
文件大小
文件类型
数据……
4字节
4字节
4字节
资源交换档案标准RIFF
列表的结构为 ‘LIST’ listSize listType listData。‘LIST’是一个四字符码,表示这是一个列表;listSize占用4字节,记录了整个列表的大小;listType也是一个四字符码,表示本列表的具体类型;listData就是实际的列表数据。listSize值的计算方法为:实际的列表数据长度 + 4(listType域的大小)。块的结构为ckID ckSize ckData。ckID是一个表示块类型的四字符码;ckSize占用4字节,记录了整个块的大小;ckData为实际的块数据。ckSize值指的是实际的块数据长度,不包括ckID域和ckSize域本身的大小。
资源交换档案标准RIFF
RIFF文件使用四字符码FOURCC(four-character code)来表征数据类型,比如‘RIFF’、‘AVI’、‘LIST’等。RIFF文件首先含有一个如下图所示的文件头结构。文件大小值的计算方法为:实际数据长度 + 4(文件类型域的大小);也就是说,文件大小的值不包括“RIFF”域和“文件大小”域本身的大小。RIFF文件的实际数据中,通常还使用了列表(List)和块(Chunk)的形式来组织。列表可以嵌套子列表和块。
位图和调色板
调色板(Palette)一词来源于油画工具,其实它是一个表:表中的每一行记录一种颜色的R、G、B值。在描述一个像素的颜色时,只要指出该颜色在表中的索引值即可。因此,调色板又称为颜色查找表LUT(Look Up Table)。调色板存在于位图文件、窗体的DC(Device Context,设备上下文)或OS(Operate System,操作系统)中。Windows操作系统中存在着三种调色板:硬件调色板、逻辑调色板和系统调色板。OS使用“调色板管理器”机制来管理调色板。硬件调色板就是显卡适配器所能实际表达的颜色深度;逻辑调色板就是Windows操作系统通过调色板管理机制为每个窗体应用程序DC分配的调色板。系统调色板只有一个,而逻辑调色板可以有多个。
JPEG文件
量化表DQT部分可包含一个或者多个量化表。每个量化表都是以0XFFDB开始,其后跟2个字节的量化表长度字段;后面是一个字节的量化表序号;最后是64个字节的量化表,量化表的系数是按照Z型扫描所得的8*8量化系数的顺序存储的。帧图像开始SOF0(Start of Frame)之后有6个固有字段,分别是:① 帧开始长度,2个字节;② 精度,每个颜色分量每个像素的位数,1个字节;③ 图像高度,2个字节;④ 图像宽度,2个字节;⑤ 颜色分量数,1个字节;⑥ 各颜色分量量化设置,共9字节,对每个颜色分量有3个字节的设置,分别是ID,垂直方向的样本因子和水平方向的样本因子,量化表号。霍夫曼表DHT部分也可包含一个或者多个表,每个表均以0XFFC4开始,包含以下5个部分:① 霍夫曼表的长度;② 类型,AC或者DC;③ 索引;④ 位表;⑤ 值表。扫描开始SOS(Start of Scan)部分存储实际的编码数据,每个扫描的长度会有所不同,由紧随其后的2个字节的扫描开始长度表示,后面是1个字节的颜色分量数,后面还包括针对每个颜色分量的描述,每个分量的内容有ID号、交流系数表号和直流系数表号。在这之后就是压缩图像的数据。文件以图像结束EOI(End of Image)标识符作为文件的结束。
RIFF(Resource Interchange File Format,资源交换档案标准)是一种把资料存储在被标记的区块(tagged chunks)中的档案格式。RIFF由Microsoft和IBM在1991年共同提出,是1985年Electronic Arts提出的Interchange File Format的翻版。这两种标准的唯一不同处是多位元整数的储存方式。RIFF使用的是little-endian,这是IBM的PC机使用的处理器80x86中使用的格式,而IFF储存整数的方式是使用big-endian,这是Amiga和Apple Macintosh电脑使用的处理器可处理的整数型态。Microsoft在AVI和WAV这两种著名的档案格式中,都使用RIFF的格式当成它们的基础。
标记名称
标记的16进制值
标记含义
1
SOI
0xD8
图像开始
2
APP0
0xE0
JFIF应用数据块
3
APPn
0xE1 - 0xEF
其他的应用数据块(n, 1~15)
4
DQT
0xDB
量化表
5
SOF0
0xC0
帧开始
6
DHT
0xC4
霍夫曼(Huffman)表
7
SOS
0xDA
扫描线开始
8
EOI
0xD9
图像结束
JPEG文件
多媒体信息处理
第8章 数字媒体文件格式
主要内容
多媒体文件的基础知识常用图像文件格式常用动画文件格式常用视频文件格式常用音频数据格式
图像文件的格式
计算机中存储多媒体数据的方式多媒体数据以计算机数据文件方式存储编码方式:无压缩,无损压缩、有损压缩类型:图像、动画、视频、音频常用的图像文件格式BMP、JEPG、TIFF、GIF、……常用的动画文件格式GIF、Flic、SWF、……存储视频数据的方式AVI、MPEG、MOV、RMVB、ASF、WMV、YUV、 ……存储音频数据的方式MIDI、WAVE、MP1/2/3/4/AAC、 ……
biCompression
4字节
指定位图是否压缩,有效的值为BI_RGB,BI_RLE8,BI_RLE4,BI_BITFIELDS(这些是由Windows定义的常量)。BI_RGB表示不压缩;Windows位图可以采用RLE4和RLE8的压缩格式,但用的不多。
biSizeImage
4字节
指定实际的位图数据占用字节数,如biCompression为BI_RGB,则该项可为零
字段名
字段长度
字段说明
biSize
4字节
指定这个结构的长度,为40
biWidth
4字节
指定图像的宽度,单位是像素
biHeight
4字节
指定图像的高度,单位是像素
biplanes
2字节
必须是1,不用考虑
biBitCount
2字节
指定表示颜色时要用到的位数,常用的值为1(黑白二色图);4(16色图);8(256色);24(真彩色图)等
biXPelsPerMeter
4字节
指定目标设备的水平分辨率,单位是每米的像素个数
biYPelsPerMeter
4字节
指定目标设备的垂直分辨率,单位同上
biClrUsed
4字节
指定本图像实际用到的颜色数,如果该值为零,则用到的颜色数为2biBitCount
biClrImportant
4字节
指定本图像中重要的颜色数,如果该值为零,则认为所有的颜色都是重要的
BMP文件
BMP图像的调色板和图像数据BMP的图像数据从下到上,从左到右按行排列。每一行的字节数是4的倍数,不足的字节补0
TIFF文件
TIFF文件格式TIFF是一个广为应用的光栅图像文件格式,是一个非常稳定的文件格式是为存储扫描图像设计的,图像格式复杂、存储信息多TIFF的特点支持从高端到低端的设备可扩展性强,支持公共和私用的标记结构支持各种压缩格式有公共软件库支持多种扩展功能:二值图、灰度图、调色板、真彩色
BMP文件
BMP文件格式Windows操作系统的标准文件格式BMP是一种与硬件设备无关的图像文件格式,使用非常广 压缩和非压缩两种,一般采用行程长度编码(RLE)BMP图像文件包含图像文件头、图像信息头、调色板、图像数据
BMP文件
BMP图像文件头
字段名
字段长度
字段说明
bfType
2Byte
指定文件类型,必须是0x424D,即字符串“BM”,即所有.bmp文件的头两个字节都是“BM”
位图和调色板
位图又称光栅图、点阵图,是使用像素阵列来表示的图像。每个像素的色彩信息由RGB组合或者灰度值表示。根据颜色信息所需的数据位分为1、4、8、16、24及32位等。其中使用1位表示一个像素颜色的位图因为一个数据位只能表示两种颜色,所以又称为二值位图。
位图和调色板
存储了图像的位图信息的文件称为位图文件。位图文件分为DDB位图(Device-dependent bitmap,设备相关位图)与DIB位图(Device-independent bitmap,设备无关位图)。DDB位图的固有问题。DIB不依赖于具体设备,可以用来永久性地保存图像。DIB文件后缀:BMP或DIB。DIB位图与逻辑调色板。DIB位图包含下列的颜色和尺寸信息:原始设备(即创建图片的设备)的颜色格式;原始设备的分辨率;原始设备的调色板;一个位数组,由红、绿、蓝(RGB)三个值代表一个像素;一个数组压缩标志,用于表明数据的压缩方案(如果需要的话)。以上信息保存在BITMAPINFO结构中,该结构由BITMAPINFOHEADER结构和两个或更多个RGBQUAD结构所组成。BITMAPINFOHEADER结构所包含的成员表明了图像的尺寸、原始设备的颜色格式、以及数据压缩方案等信息。RGBQUAD结构标识了像素所用到的颜色数据。
图像文件结构
一般的图像文件主要包含文件头、文件体和文件尾等三部分。文件头的主要内容包括产生或编辑该图像文件的软件的信息以及图像本身的参数。文件体主要包括图像数据以及颜色变换查找表或调色板数据。文件尾可包含一些用户信息。文件尾是可选项。几乎所有的图像文件都采用各自简化的格式名作为文件扩展名。
资源交换档案标准RIFF
bfSize
4Byte
指定文件大小,包括这14个字节
bfReserved1
2Byte
保留字,不用考虑
bfReserved2
2Byte
保留字,不用考虑
bfOffBits
2Byte
从文件头到实际的位图数据的偏移字节数,即前三个部分的长度之和
BMP文件
BMP图像的信息头typedef struct tagBITMAPINFOHEADER{DWORD biSize; LONG biWidth; LONG biHeight; WORD biPlanes; WORD biBitCount DWORD biCompression; DWORD biSizeImage; LONG biXPelsPerMeter; LONG biYPelsPerMeter; DWORD biClrUsed; DWORD biClrImportant; } BITMAPINFOHEADER;
JPEG文件
JPEG静止图像压缩采用有损编码方式应用于数码相机JPEG2000为JPEG的升级版,其压缩率比JPEG高约30%支持有损压缩和无损压缩能实现渐进传输:即先传输图像的轮廓,然后逐步传输数据,让图像由朦胧到清晰显示应用于数码相机、网络传输、无线通信
JPEG文件
JPEG委员会在制定JPEG标准时,定义了许多标记来区分和识别图像数据及其相关信息,但对JPEG文件交换格式没有明确的定义。目前使用比较广泛的是JPEG文件交换格式(JPEG File Interchange Format,JFIF)是1992年9月由在C-Cube Microsystems公司的Eric Hamilton提出的,版本号为1.02。在JFIF文件格式中,图像样本的存放顺序是从左到右和从上到下,即文件中的第一个图像样本是图像左上角的样本。JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记,因此JFIF格式成了事实上JPEG文件交换格式标准。JPEG的每个标记都是由2个字节组成,其前一个字节是固定值0xFF。每个标记之前还可以添加数目不限的0xFF填充字节。
R
I
F
F
文件大小
文件类型
数据……
4字节
4字节
4字节
资源交换档案标准RIFF
列表的结构为 ‘LIST’ listSize listType listData。‘LIST’是一个四字符码,表示这是一个列表;listSize占用4字节,记录了整个列表的大小;listType也是一个四字符码,表示本列表的具体类型;listData就是实际的列表数据。listSize值的计算方法为:实际的列表数据长度 + 4(listType域的大小)。块的结构为ckID ckSize ckData。ckID是一个表示块类型的四字符码;ckSize占用4字节,记录了整个块的大小;ckData为实际的块数据。ckSize值指的是实际的块数据长度,不包括ckID域和ckSize域本身的大小。
资源交换档案标准RIFF
RIFF文件使用四字符码FOURCC(four-character code)来表征数据类型,比如‘RIFF’、‘AVI’、‘LIST’等。RIFF文件首先含有一个如下图所示的文件头结构。文件大小值的计算方法为:实际数据长度 + 4(文件类型域的大小);也就是说,文件大小的值不包括“RIFF”域和“文件大小”域本身的大小。RIFF文件的实际数据中,通常还使用了列表(List)和块(Chunk)的形式来组织。列表可以嵌套子列表和块。
位图和调色板
调色板(Palette)一词来源于油画工具,其实它是一个表:表中的每一行记录一种颜色的R、G、B值。在描述一个像素的颜色时,只要指出该颜色在表中的索引值即可。因此,调色板又称为颜色查找表LUT(Look Up Table)。调色板存在于位图文件、窗体的DC(Device Context,设备上下文)或OS(Operate System,操作系统)中。Windows操作系统中存在着三种调色板:硬件调色板、逻辑调色板和系统调色板。OS使用“调色板管理器”机制来管理调色板。硬件调色板就是显卡适配器所能实际表达的颜色深度;逻辑调色板就是Windows操作系统通过调色板管理机制为每个窗体应用程序DC分配的调色板。系统调色板只有一个,而逻辑调色板可以有多个。