彩色数字图像基础讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PAL制规定视频每秒25帧,每帧625个扫描行。625行中 用于扫描图像的有效行数只有576行,所以图像在垂直 方向上的分辨率为576点。按现行4:3(宽:高)的电 视标准,图像在水平方向上的分辨率应为576*4/3=768 点,这就得到了768*576这一常见的图像大小。
NTSC制规定每秒30帧,每帧525行,同样采用了隔行扫 描方式,每一帧由两场组成,其图像大小是720*486。 由于PAL制与NTSC制的场频、行频以及色彩处理方式均 不同,因此两者是互不兼容的。
影响数字视频质量的因素
帧速:25帧/秒(PAL)、30帧/秒(NTSC)。帧速越高, 数据量越大,质量越好。
分辨率:视频分辨率越大,数据量越大,质量越好。
颜色数:指视频中最多能使用的颜色数。颜色位数越 多,色彩越逼真,数据量也越大。
压缩比:压缩比较小时对图像质量不会有太大影响, 而超过一定倍数后,将会明显看出图像质量下降,而 且压缩比越大在回放时花费在解压的时间越长。
图像的三个基本属性
真彩色、伪彩色与直接色 真彩色(true color)
真彩色图通常是指RGB 8:8:8,即图 像的颜色数等于224,也常称为全彩 色(full color)图像。
L*a*b 颜色由亮度或光亮度分量 (L) 和两个 色度分量组成;两个分量即 a 分量(从绿到 红)和 b 分量(从蓝到黄)。
图像的Lab颜色模型
A. 光度=100(白) B. 绿到红分量 C. 蓝到黄分量 D. 光度=0(黑)到红分量
关于“溢色”
颜色模型的色域
色域是一个色系能够显示或打印的颜色范围。 人眼看到的色谱比任何颜色模型中的色域都宽。
用这种办法定义一个像素的属性在实际中很有用。例如在一幅彩 色图像上叠加文字说明,而又不想让文字把图复盖掉,就可以用 这种办法来定义像素,而该像素显示的颜色又有人把它称为混合 色(key color)。在图像产品生产中,也往往把数字电视图像和计 算 机 生 产 的 图 像 混 合 在 一 起 , 这 种 技 术 称 为 视 图 混 合 (video keying)技术,它也采用α通道。
彩色数字图像基础
计算机图形、图像技术
计算机图形分为两大类──位图图像和矢量图形 矢量图形,是由叫作矢量的数学对象所定义的
直线和曲线组成的。矢量根据图形的几何特性 来对其进行描述,矢量图形与分辨率无关。
位图图象,也叫作栅格图象。位图图象是用小 方形网格(位图或栅格),即人所共知的象素 来代表图象,每个象素都被分配一个特定位置 和颜色值。位图图象与分辨率有关,换句话说, 它包含固定数量的象素,代表图象数据。
图像的RGB颜色模型
图像的CMYK颜色模型
CMYK模型以打印在纸张上油墨的光线吸 收特性为基础,白光照射到半透明油墨 上时,部分光谱被吸收,部分被反射回 眼睛。
理论上,青色(C)、洋红(M)和黄色(Y)色 素能合成吸收所有颜色并产生黑色。由 于这个原因,这些颜色叫作减色。
图像的CMYK颜色模型
许多24位彩色图像是用32位存储的,这个附加 的8位叫做alpha通道,它的值叫做alpha值,它 用来表示该像素如何产生特技效果。
图像的种类
图像的三个基本属性—分辨率
显示分辨率 显示分辨率是指显示屏上能够显示出
的像素数目。 图像分辨率
图像分辨率是指组成一幅图像的像素密 度的度量方法。对同样大小的一幅图,如果 组成该图的图像像素数目越多,则说明图像 的分辨率越高,看起来就越逼真。相反,图 像显得越粗糙。
彩色空间的线性变换标准
为了使用人的视角特性以降低数据 量,通常把RGB空间表示的彩色图像 变换到其他彩色空间。彩色空间变 换有三种:
YIQ适用于NTSC彩色电视制式 YUV适用于PAL和SECAM彩色电视制式 YCrCb适用于计算机用的显示器
彩色空间的线性变换标准
YUV与YIQ模型 在彩色电视制式中,使用YUV和YIQ模型来表示 彩色图像。在PAL彩色电视制式中使用YUV模型, Y表示亮度,UV用来表示色差,U、V是构成彩 色的两个分量;在NTSC彩色电视制式中使用 YIQ模型,其中的Y表示亮度,I、Q是两个彩色 分量。
在颜色模型中,L*a*b具有最宽的色域,它包 括RGB和CMYK色域中的所有颜色。通常RGB色域 包含能在计算机显示器或电视屏幕(发出红、 绿和蓝光)上所有能显示的颜色。因而一些诸 如纯青或纯黄等颜色不能在显示器上精确显示。
颜色模型的色域
CMYK色域较窄,仅包含使用印刷色油墨 能够打印的颜色。当不能被打印的颜色 在屏幕上显示时,它们称为溢色──即 超出CMYK色域之外。
用32位表示一个像素时,R,G,B分别用8位表示,剩下的8位常 称为α通道(alpha channel)位,或称为复盖(overlay)位、中断位、 属性位。它的用法可用一个预乘α通道(premultiplied alpha)的例 子说明。假如一个像素(A,R,G,B)的四个分量都用规一化的数 值表示,(A,R,G,B)为(1,1,0,0)时显示红色。当像素为 (0.5,1,0,0)时,预乘的结果就变成(0.5,0.5,0,0),这表示原来该像 素显示的红色的强度为1,而现在显示的红色的强度降了一半。
在用二进制数表示彩色图像的像素时, 除R,G,B分量用固定位数表示外,往 往还增加1位或几位作为属性(Attribute) 位。例如,RGB 5:5:5表示一个像素时, 用2个字节共16位表示,其中R,G,B各 占5位,剩下一位作为属性位。在这种情 况下,像素深度为16位,而图像深度为 15位
图像的三个基本属性—像素深度
图像的RGB颜色模型
绝大部分可见光谱可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。 在颜色重叠的位置,产生青色、洋红和黄 色。
因为 RGB 颜色合成产生白色,它们也叫作 加色。将所有颜色加在一起产生白色── 就是说,所有光被反射回眼睛。加色用于 光照、视频和显示器。例如,显示器通过 红、绿和蓝荧光粉发射光线产生彩色。
电视信号
黑白全电视信号 摄象机把图象信号转变成的最后输出信号就是 全电视信号。全电视信号主要由三个部分组成: 图象信号(视频信号)、复合消隐信号、复合 同步信号。
彩色全电视信号 彩色全电视信号主要由:亮度信号、色度信号、 复合同步信号、复合消隐信号组成。
数字视频的制式
数字视频是由一序列静止画面组成的,称为帧。帧率 选择在每秒24~30帧之间,视频的运动就非常光滑连续; 而低于每秒15帧,连续运动视频就会有停顿的感觉。
度的标准色轮上,色相是按位置度量的。在通常的使用中, 色相是由颜色名称标识的,比如红、橙或绿色。 饱和度是指颜色的强度或纯度。饱和度表示色相中灰成分 所占的比例,用从 0%(灰色)到 100%(完全饱和)的百 分比来度量。在标准色轮上,从中心向边缘饱和度是递增 的。 亮度是颜色的相对明暗程度,通常用从 0%(黑)到 100% (白)的百分比来度量。
如果每个像素的像素值用一个字节表示,灰度 值级数就等于256级,每个像素可以是0-255之 间的任何一个值,一幅640×480的灰度图像就 需要占据300KB的存储空间。
图像的种类
图像的种类
彩色图像(color image)可按照颜色的数目来划 分,例如256色图像和真彩色(24bit颜色)等。 彩色图像的每个像素的R、G和B值用一个字节 来 表 示 , 一 幅 640×480 的 8 位 彩 色 图 像 需 要 307.2KB的存储空间。一幅640×480的真彩色 图像需要921.6 KB的存储空间。
图像的三个基本属性—像素深度
像素深度是指存储每个像素所用的位 数,它也是用来度量图像的分辨率
例如,一幅彩色图像的每个像素用R, G,B三个分量表示,若每个分量用8 位,那么一个像素共用24位表示,就 说像素的深度为24,每个像素可以是 224=16777216种颜色中的一种 。
图像的三个基本属性—像素深度
生成的颜色 黑 蓝 绿 青 红
品红 黄 白
颜色模型的空间表示
颜色模型关系示意
VGA调色板
色度-饱和度-亮度 HSL(HSB)颜色模型
hue Saturation Lightness (brightness)
图像的HSL颜色模型
基于人类对颜色的感觉,HSL 模型描述颜色的三个基本特征: 色相是从物体反射或透过物体传播的颜色。在 0 到 360
彩色空间RGB-YCrCb
数字域中的彩色空间变换与模拟域的彩色 空间变换不同。它们的分量使用Y、Cr和 Cb来表示,与RGB空间的转换关系如下:
Y = 0.299R+0.578G+0.114B Cr=(0.500R-0.4187G-0.0813B)+128 Cb=(- 0.1687R-0.3313G+0.500B)+128
研究Байду номын сангаас线
图像数据压缩主要根据下面两个基本事实来实现的:
图像数据中有许多重复的数据,使用数学方法来 表示这些重复数据就可以减少数据量;
人的眼睛对图像细节和颜色的辨认有一个极限, 把超过极限的部分去掉,这也就达到压缩数据的 目的。
利用前一个事实的压缩技术就是无损压缩技术, 利用后一个事实的压缩技术就是有损压缩技术。 实际的图像压缩是综合使用各种有损和无损压缩 技术来实现的。
彩色空间RGB-YUV
Y = 0.299R + 0.587G + 0.114B U =﹣0.147R﹣0.289G + 0.436B V = 0.615R﹣0.515G﹣0.100B
彩色空间RGB-YIQ
Y = 0.299R + 0.587G + 0.114B I = 0.596R﹣0.275G﹣0.321B Q = 0.212R﹣0.523G + 0.311B
图像的HSL颜色模型
图像的Lab颜色模型
L*a*b 颜色模型是在 1931 年国际照明委员会 (CIE)制定的颜色度量国际标准的基础上建 立的。1976 年,这种模型被重新修订并命名 为 CIE L*a*b。
L*a*b 颜色设计为与设备无关;不管使用什 么设备(如显示器、打印机、计算机或扫描仪) 创建或输出图象,这种颜色模型产生的颜色都 保持一致。
选YIQ的好处
大量实验统计,人眼对红黄之间的颜色变化最 敏感,而分辨蓝和紫之间颜色变化最不敏感。 所以把相角为123°的橙色及其相反相角的 303°的青色定义为I轴,它表示人眼最敏感的 色轴。与I正交的色度信号轴,通过33°— 0°—213°线,叫Q轴,它表示人眼最不敏感 的色轴。在传送分辨率弱的Q信号是,可用较 窄的频带,而传送分辨率较强的I信号是,可用 较宽的频带。
YUV/YIQ特点 亮度信号(Y)和色度信号(U、V)是相互独立的; 可以利用人眼的特性来降低数字彩色图像所需 要的存储容量。
用YUV的好处
亮度信号Y解决了彩色电视机与黑白电 视的兼容问题。
大量实验表明,人眼对色差信号不敏感, 而对亮度信号特别敏感。用亮度信号Y传 送细节,用色差信号UV进行大面积涂色。
关键帧:视频数据具有很强的帧间相关性,动态视频 压缩正是利用帧间相关性的特点,通过前后两个关键 帧动态合成中间的视频帧。因此对于含有频繁运动的 视频图像序列,关键帧数少就会出现图像不稳定现象。
图像的种类
只有黑白两中颜色的图像称为单色图像 (monochrome image),它的每个像素的像素 值用1位存储,它的值只有“0”或者“1”,一 幅 640×480 的 单 色 图 像 需 要 占 据 37.5KB 的 存 储空间。
因为所有打印油墨都会包含一些杂质, 这三种油墨实际上产生一种土灰色,必 须与黑色 (K) 油墨混合才能产生真正的 黑色。将这些油墨混合产生颜色叫作四 色印刷。
图像的CMYK颜色模型
相加色与相减色关系
相加混色RGB 000 001 010 011 100 101 110 111
相减混色CMY 111 110 101 100 011 010 001 000
NTSC制规定每秒30帧,每帧525行,同样采用了隔行扫 描方式,每一帧由两场组成,其图像大小是720*486。 由于PAL制与NTSC制的场频、行频以及色彩处理方式均 不同,因此两者是互不兼容的。
影响数字视频质量的因素
帧速:25帧/秒(PAL)、30帧/秒(NTSC)。帧速越高, 数据量越大,质量越好。
分辨率:视频分辨率越大,数据量越大,质量越好。
颜色数:指视频中最多能使用的颜色数。颜色位数越 多,色彩越逼真,数据量也越大。
压缩比:压缩比较小时对图像质量不会有太大影响, 而超过一定倍数后,将会明显看出图像质量下降,而 且压缩比越大在回放时花费在解压的时间越长。
图像的三个基本属性
真彩色、伪彩色与直接色 真彩色(true color)
真彩色图通常是指RGB 8:8:8,即图 像的颜色数等于224,也常称为全彩 色(full color)图像。
L*a*b 颜色由亮度或光亮度分量 (L) 和两个 色度分量组成;两个分量即 a 分量(从绿到 红)和 b 分量(从蓝到黄)。
图像的Lab颜色模型
A. 光度=100(白) B. 绿到红分量 C. 蓝到黄分量 D. 光度=0(黑)到红分量
关于“溢色”
颜色模型的色域
色域是一个色系能够显示或打印的颜色范围。 人眼看到的色谱比任何颜色模型中的色域都宽。
用这种办法定义一个像素的属性在实际中很有用。例如在一幅彩 色图像上叠加文字说明,而又不想让文字把图复盖掉,就可以用 这种办法来定义像素,而该像素显示的颜色又有人把它称为混合 色(key color)。在图像产品生产中,也往往把数字电视图像和计 算 机 生 产 的 图 像 混 合 在 一 起 , 这 种 技 术 称 为 视 图 混 合 (video keying)技术,它也采用α通道。
彩色数字图像基础
计算机图形、图像技术
计算机图形分为两大类──位图图像和矢量图形 矢量图形,是由叫作矢量的数学对象所定义的
直线和曲线组成的。矢量根据图形的几何特性 来对其进行描述,矢量图形与分辨率无关。
位图图象,也叫作栅格图象。位图图象是用小 方形网格(位图或栅格),即人所共知的象素 来代表图象,每个象素都被分配一个特定位置 和颜色值。位图图象与分辨率有关,换句话说, 它包含固定数量的象素,代表图象数据。
图像的RGB颜色模型
图像的CMYK颜色模型
CMYK模型以打印在纸张上油墨的光线吸 收特性为基础,白光照射到半透明油墨 上时,部分光谱被吸收,部分被反射回 眼睛。
理论上,青色(C)、洋红(M)和黄色(Y)色 素能合成吸收所有颜色并产生黑色。由 于这个原因,这些颜色叫作减色。
图像的CMYK颜色模型
许多24位彩色图像是用32位存储的,这个附加 的8位叫做alpha通道,它的值叫做alpha值,它 用来表示该像素如何产生特技效果。
图像的种类
图像的三个基本属性—分辨率
显示分辨率 显示分辨率是指显示屏上能够显示出
的像素数目。 图像分辨率
图像分辨率是指组成一幅图像的像素密 度的度量方法。对同样大小的一幅图,如果 组成该图的图像像素数目越多,则说明图像 的分辨率越高,看起来就越逼真。相反,图 像显得越粗糙。
彩色空间的线性变换标准
为了使用人的视角特性以降低数据 量,通常把RGB空间表示的彩色图像 变换到其他彩色空间。彩色空间变 换有三种:
YIQ适用于NTSC彩色电视制式 YUV适用于PAL和SECAM彩色电视制式 YCrCb适用于计算机用的显示器
彩色空间的线性变换标准
YUV与YIQ模型 在彩色电视制式中,使用YUV和YIQ模型来表示 彩色图像。在PAL彩色电视制式中使用YUV模型, Y表示亮度,UV用来表示色差,U、V是构成彩 色的两个分量;在NTSC彩色电视制式中使用 YIQ模型,其中的Y表示亮度,I、Q是两个彩色 分量。
在颜色模型中,L*a*b具有最宽的色域,它包 括RGB和CMYK色域中的所有颜色。通常RGB色域 包含能在计算机显示器或电视屏幕(发出红、 绿和蓝光)上所有能显示的颜色。因而一些诸 如纯青或纯黄等颜色不能在显示器上精确显示。
颜色模型的色域
CMYK色域较窄,仅包含使用印刷色油墨 能够打印的颜色。当不能被打印的颜色 在屏幕上显示时,它们称为溢色──即 超出CMYK色域之外。
用32位表示一个像素时,R,G,B分别用8位表示,剩下的8位常 称为α通道(alpha channel)位,或称为复盖(overlay)位、中断位、 属性位。它的用法可用一个预乘α通道(premultiplied alpha)的例 子说明。假如一个像素(A,R,G,B)的四个分量都用规一化的数 值表示,(A,R,G,B)为(1,1,0,0)时显示红色。当像素为 (0.5,1,0,0)时,预乘的结果就变成(0.5,0.5,0,0),这表示原来该像 素显示的红色的强度为1,而现在显示的红色的强度降了一半。
在用二进制数表示彩色图像的像素时, 除R,G,B分量用固定位数表示外,往 往还增加1位或几位作为属性(Attribute) 位。例如,RGB 5:5:5表示一个像素时, 用2个字节共16位表示,其中R,G,B各 占5位,剩下一位作为属性位。在这种情 况下,像素深度为16位,而图像深度为 15位
图像的三个基本属性—像素深度
图像的RGB颜色模型
绝大部分可见光谱可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。 在颜色重叠的位置,产生青色、洋红和黄 色。
因为 RGB 颜色合成产生白色,它们也叫作 加色。将所有颜色加在一起产生白色── 就是说,所有光被反射回眼睛。加色用于 光照、视频和显示器。例如,显示器通过 红、绿和蓝荧光粉发射光线产生彩色。
电视信号
黑白全电视信号 摄象机把图象信号转变成的最后输出信号就是 全电视信号。全电视信号主要由三个部分组成: 图象信号(视频信号)、复合消隐信号、复合 同步信号。
彩色全电视信号 彩色全电视信号主要由:亮度信号、色度信号、 复合同步信号、复合消隐信号组成。
数字视频的制式
数字视频是由一序列静止画面组成的,称为帧。帧率 选择在每秒24~30帧之间,视频的运动就非常光滑连续; 而低于每秒15帧,连续运动视频就会有停顿的感觉。
度的标准色轮上,色相是按位置度量的。在通常的使用中, 色相是由颜色名称标识的,比如红、橙或绿色。 饱和度是指颜色的强度或纯度。饱和度表示色相中灰成分 所占的比例,用从 0%(灰色)到 100%(完全饱和)的百 分比来度量。在标准色轮上,从中心向边缘饱和度是递增 的。 亮度是颜色的相对明暗程度,通常用从 0%(黑)到 100% (白)的百分比来度量。
如果每个像素的像素值用一个字节表示,灰度 值级数就等于256级,每个像素可以是0-255之 间的任何一个值,一幅640×480的灰度图像就 需要占据300KB的存储空间。
图像的种类
图像的种类
彩色图像(color image)可按照颜色的数目来划 分,例如256色图像和真彩色(24bit颜色)等。 彩色图像的每个像素的R、G和B值用一个字节 来 表 示 , 一 幅 640×480 的 8 位 彩 色 图 像 需 要 307.2KB的存储空间。一幅640×480的真彩色 图像需要921.6 KB的存储空间。
图像的三个基本属性—像素深度
像素深度是指存储每个像素所用的位 数,它也是用来度量图像的分辨率
例如,一幅彩色图像的每个像素用R, G,B三个分量表示,若每个分量用8 位,那么一个像素共用24位表示,就 说像素的深度为24,每个像素可以是 224=16777216种颜色中的一种 。
图像的三个基本属性—像素深度
生成的颜色 黑 蓝 绿 青 红
品红 黄 白
颜色模型的空间表示
颜色模型关系示意
VGA调色板
色度-饱和度-亮度 HSL(HSB)颜色模型
hue Saturation Lightness (brightness)
图像的HSL颜色模型
基于人类对颜色的感觉,HSL 模型描述颜色的三个基本特征: 色相是从物体反射或透过物体传播的颜色。在 0 到 360
彩色空间RGB-YCrCb
数字域中的彩色空间变换与模拟域的彩色 空间变换不同。它们的分量使用Y、Cr和 Cb来表示,与RGB空间的转换关系如下:
Y = 0.299R+0.578G+0.114B Cr=(0.500R-0.4187G-0.0813B)+128 Cb=(- 0.1687R-0.3313G+0.500B)+128
研究Байду номын сангаас线
图像数据压缩主要根据下面两个基本事实来实现的:
图像数据中有许多重复的数据,使用数学方法来 表示这些重复数据就可以减少数据量;
人的眼睛对图像细节和颜色的辨认有一个极限, 把超过极限的部分去掉,这也就达到压缩数据的 目的。
利用前一个事实的压缩技术就是无损压缩技术, 利用后一个事实的压缩技术就是有损压缩技术。 实际的图像压缩是综合使用各种有损和无损压缩 技术来实现的。
彩色空间RGB-YUV
Y = 0.299R + 0.587G + 0.114B U =﹣0.147R﹣0.289G + 0.436B V = 0.615R﹣0.515G﹣0.100B
彩色空间RGB-YIQ
Y = 0.299R + 0.587G + 0.114B I = 0.596R﹣0.275G﹣0.321B Q = 0.212R﹣0.523G + 0.311B
图像的HSL颜色模型
图像的Lab颜色模型
L*a*b 颜色模型是在 1931 年国际照明委员会 (CIE)制定的颜色度量国际标准的基础上建 立的。1976 年,这种模型被重新修订并命名 为 CIE L*a*b。
L*a*b 颜色设计为与设备无关;不管使用什 么设备(如显示器、打印机、计算机或扫描仪) 创建或输出图象,这种颜色模型产生的颜色都 保持一致。
选YIQ的好处
大量实验统计,人眼对红黄之间的颜色变化最 敏感,而分辨蓝和紫之间颜色变化最不敏感。 所以把相角为123°的橙色及其相反相角的 303°的青色定义为I轴,它表示人眼最敏感的 色轴。与I正交的色度信号轴,通过33°— 0°—213°线,叫Q轴,它表示人眼最不敏感 的色轴。在传送分辨率弱的Q信号是,可用较 窄的频带,而传送分辨率较强的I信号是,可用 较宽的频带。
YUV/YIQ特点 亮度信号(Y)和色度信号(U、V)是相互独立的; 可以利用人眼的特性来降低数字彩色图像所需 要的存储容量。
用YUV的好处
亮度信号Y解决了彩色电视机与黑白电 视的兼容问题。
大量实验表明,人眼对色差信号不敏感, 而对亮度信号特别敏感。用亮度信号Y传 送细节,用色差信号UV进行大面积涂色。
关键帧:视频数据具有很强的帧间相关性,动态视频 压缩正是利用帧间相关性的特点,通过前后两个关键 帧动态合成中间的视频帧。因此对于含有频繁运动的 视频图像序列,关键帧数少就会出现图像不稳定现象。
图像的种类
只有黑白两中颜色的图像称为单色图像 (monochrome image),它的每个像素的像素 值用1位存储,它的值只有“0”或者“1”,一 幅 640×480 的 单 色 图 像 需 要 占 据 37.5KB 的 存 储空间。
因为所有打印油墨都会包含一些杂质, 这三种油墨实际上产生一种土灰色,必 须与黑色 (K) 油墨混合才能产生真正的 黑色。将这些油墨混合产生颜色叫作四 色印刷。
图像的CMYK颜色模型
相加色与相减色关系
相加混色RGB 000 001 010 011 100 101 110 111
相减混色CMY 111 110 101 100 011 010 001 000