图像处理与理解(第二章)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对于人来说,可以通过色调、饱和度和亮度来 定义颜色(HSL颜色模型); 对于显示设备来说,可以用红、绿、蓝磷光体 的发光量来描述颜色(RGB颜色模型); 对于打印设备来说,可以使用青色、品红、黄 色和黑色颜料的用量来指定颜色(CMYK颜色模型)。
(1) RGB颜色模型 理论上绝大部分可见光谱都可用红、绿和蓝 (RGB) 三色光按不同比例和强度的混合来表示。 L=R(红色的百分比)+G(绿色的百分比)+ B(蓝色的百分比) 如 L=0.3R+0.6G+0.1B 当然,这里的系数只是近似的,它具体的值依 赖于显示器所采用的磷粉标准,以NTSC视频信号标 准,则三个系数依次为:0.299、0.587、0.114 RGB模型称为相加混色模型,用于光照、视频和 显示器。例如,显示器通过红、绿和蓝荧光粉发射 光线产生彩色。
(3)明亮度(luminance)
明亮度是光作用于人眼时引起的明亮程度的感 觉。一般来说,彩色光能量大则显得亮,反之则暗。 大量试验表明,人的眼睛能分辨128种不同的色 调,10-30种不同的饱和度,而对亮度非常敏感。 人眼大约可以分辨35万种颜色。
4.
颜色模型
颜色模型(color model)是用来精确标定和 生成各种颜色的一套规则和定义。 某种颜色模型所标定的所有颜色就构成了一个 颜色空间。 颜色空间通常用三维模型表示,空间中的颜色 通常使用代表三个参数的三维坐标来指定
二、 图像质量评价 可懂度 逼真度 1.图像质量评估方法与标准 当前对图像质量的评估方法主要分成两类:主观 评价和客观测量。主观评价的方法与标准已相对 完善,而客观测量则处于热点研究中。
1)主观评价
主观评价的方法是将待评价的图像序列播放给评论 者观看,并记录他们的打分,然后对所有评论者的 打分进行统计,得出平均分作为评价结果。
(2) 人眼视觉模型 人眼类似一个光学系统。由于神经系统 的调节,它又不是普通意义上的光学系统。 建立视觉模型就是力图用线性光学系统的概 念来解释某些视觉特性,并可进行一些定量 的分析和预测。
与波长有关的感受体
线性系统
H1 ( ) (低通)
点非线性 (对数)
线性系统 H 2 ( ) (带通)
线性系统
颜色模型的空间表示
RGB彩色空间和CMY彩色空间的表示法
(3)HSL颜色模型 在HSL模型中,H定义色调; S定义颜色的深浅程度或 饱和度;L定义亮度。 RGB模型和CMYK模型主要 是面向设备的,而HSL模 型更容易被人理解和控制。
(4)YIQ颜色模型 我们也可以将RGB颜色模型转化为亮度-色度空间。 在NTSC视频信号中使用了YIQ颜色模型。这是一种 由RGB转化来的亮度-色度模型,该模型中Y代表了 光源的亮度,而色度则包含在I、Q两个参数里。在 参数I中包含了橙-青的色彩信息,Q中包含了绿-品 红的色彩信息。 由于人眼对于亮度的敏感程度大于对于色度的敏 感程度,因此将最大的带宽分给Y信号,并且由于Y 信号包含了亮度信号,所以在黑白电视机中就只使 用Y信号。
(3)人眼调制转移函数和对数-线性系统 图像处理中大量是静止图像,因此上述模 型中的1),2),3)三个子系统将起作用。 为了抵消人眼对亮度响应的对数性质, 测试人眼视觉系统的实际亮度应当是指数性 的,这样人眼视觉系统可以“线性化”,直 接可测出调制转移函数。 亮暗在空间上作正弦变化条纹图像的物 理对比度和感觉对比度之比随空间频率变化 而变化的曲线,称为调制转移函数(MTF)。
“眼见为实”吗?
wenku.baidu.com
视觉特性
马赫带效应
虽然条带强度恒定,但感觉每个条带不是均匀分布,感 觉每个条带右边比左边亮,看到了一幅带有毛边(特别 是靠近边界处)的亮度图形。
马赫带不是由于刺激能量的分布,而是由于神经网络对视觉信息进行加工的结果。 这种在图形轮廓部分发生的主观明度对比加强的现象,称为边缘对比效应。边缘 对比效应总是发生在亮度变化最大的边界区域。
有关“视网膜的结构和两种感光换能系 统 ”、“视杆细胞的感光换能机制 ”、“视 锥系统的换能和颜色视觉 ”、“视网膜的信 息处理 ”等不作介绍,感兴趣的同学可查阅 相关文献
2. 人眼视觉模型 (1) 点扩展函数和调制转移函数 冲激函数经过光学系统后的成像 h( x, y; , ) 称为 点扩展函数(PSF)或冲激响应函数; 经线性移不变系统后得到的图像 g ( x, y ) 是原图像 f ( x, y) 与点扩展函数 h( x, y ) 的卷积; H (u, v) 称为光学系统的调制转移函数(MTF); h( x, y ) 和 H (u, v) 可以表征一个线性移不变的光 学系统
当然,人眼不是无条件的看清任何远处 的特体,例如,人眼可以看清楚月亮(或其 他更远的星体)和它表面较大的阴影,但不 能看清楚月球表面更小的物体或特征。
为什么?
造成后一限制的原因有二: 一是,如果来自某物体的光线过弱,或它们在 空间传播时被散射或吸收,那么它们到达视网 膜时已减弱到不足以兴奋感光细胞的程度,这 样就不可能被感知; 二是,如果物体过小或它们离眼的距离过大, 则它们在视网膜上形成的大小,将会小到视网 膜分辨能力的限度以下,因而也不能感知。
同时对比度效应
第二章
图像信息基本知识
一、 人眼视觉特性 引起视觉的外周感受器官是眼,它由含有 感光细胞的视网膜和作为附属结构的折光系统 等部分组成。人眼的适宜刺激是波长370740nm的电磁波;在这个可见光谱的范围内, 人脑通过接受来自视网膜的传入信息,可以分 辨出视网膜像的不同亮度和色泽,因而可以看 清视野内发光物体上反光物质的轮廓、形状、 颜色、大小、远近和表面细节等情况。
1.
人眼构造简介 人眼的基本结构如下图所示。
人眼的结构和照相机相似:瞳孔的直径可 在2-8毫米间调节--光圈;扁球形弹性透明体 (晶状体)--透镜;使不同距离的景物在视网 膜上成像,视细胞受到光的刺激产生电脉冲, 电脉冲沿着神经纤维传递到视神经中枢,由于 各细胞产生的电脉冲不同,大脑就形成了景象 的感觉。
当用光学原理分析眼的折光特性时,首先 遇到的一个困难是,眼球并非一个薄透镜或单 球面折光体,而是由一系列曲率半径和折光指 数都不相同的折光体所组成的折光系统。 研究表明,正常成人眼处于安静而不进行 调节的状态时,它的折光系统的后主焦点的位 臵,正好是其视网膜所在的位臵。
这一解剖关系对于理解正常眼的折光成 像能力十分重要。它说明,凡是位于眼前方 6m以外直至无限远处的物体,由于由它们发 出或反射出的光线在到达眼的折光系统时已 近于平行,因而都可以在视网膜上形成基本 清晰的像,这正如放臵于照相机主焦点处的 底片,可以拍出清晰的远景一样。
2)客观测量 客观测量基于仿人眼视觉模型的原理对图像质 量进行客观评估,并给出客观评价分。近几年, 随着人们对人眼视觉系统研究的深入,客观测量 的方法和工具不断被开发出来,其测量结果也与 主观评价较吻合。国际上也成立了ITU-R视频质量 专家组(ITU-RVQEG:VideoQualityExperts Group)专 门研究和规范图像质量客观测量的方法和标准。
很显然,主观评价有几个显著的不足之处: (1)观察者一般需要是一个群体,并且经过培训 以准确判定主观评测分,人力和物力投入大,为 时较长; (2)图像内容与情节千变万化,观察者个体差异 大,容易发生主观上的偏差; (3)主观评价无法进行实时监测; (4)仅仅只有平均分,如果评测分数低,无法确 切定位问题出在哪里。
H3 ( f )
神经信号
(延时)
1)作为一个光学器件,从空间频率的角度来说, 是一个低通型线性系统。表明:人眼的分辨力是 有限的。(瞳孔一定的几何尺寸及视细胞有一定 的大小。) 2)人眼对于亮度的响应具有对数性质。人眼正 是通过这一对数性质来接受宽达 108 倍的亮度范 围。人所能觉察到的亮度增量的度量是以B为底 的对数增量形式,而不是线性增量:
(2) CMYK颜色模型
在理论上,绝大多数颜色都可以用三种基本颜料(青色 cyan、品红magenta、和黄色yellow)按一定比例混合得 到。 理论上,青色、品红和黄色三种基本色素等量混合能得 到黑色。但实际上,因为所有打印油墨都会包含一些杂 质,这三种油墨混合实际上产生一种土灰色,必须与黑 色 (K) 油墨混合才能产生真正的黑色,所以再加入黑色 作为基本色形成CMYK颜色模型。 CMYK模型称为相减混色模型。
如果安静状态的眼的折光能力正好把 6m以外的物体成像在视网膜上,那么来自 较6m为近的物体的光线将是不同程度呈辐 射状的,它们在折射后的成像位臵将在主 焦点,亦即视网膜的位臵之后;由于光线 到达视网膜时尚未聚焦,因而物像是模糊 的,由此也只能引起一个模糊的视觉形象。 但正常眼在看近物时为什么也十分清 楚?
这是由于眼在看近物时已进行了调节, 使进入眼内的光线经历较强的折射,结果也 能成像在视网膜上。人眼的调节亦即折光能 力的改变,主要是靠晶状体形状的改变。
眼调节前后睫状体位置和晶状体形状的改变
瞳孔和瞳孔对光反应 瞳孔指虹膜中间的开孔,是光线进入眼内的 门户;它在亮光处缩小,在暗光处散大。 瞳孔大小随光照强度而变化的反应,是一种 神经反射,称为瞳孔对光反射。引起此反射的感 受器就是视网膜,传入纤维在视神经中,但这部 分纤维在进入中枢后不到达外侧膝状体,而在在 中脑的顶盖前区换神经元,然后到同侧和对侧的 动眼神经核,传出纤维主要是动眼神经中的副交 感纤维,效应器也主要是瞳孔约肌。
从人的主观感觉角度,颜色包含三个要素: (1)色调(hue):色调反映颜色的类别,如红 色、绿色、蓝色等。色调大致对应光谱分布中 的主波长。
(2)饱和度(Saturation)
饱和度是指彩色光所呈现颜色的深浅或纯洁 程度。对于同一色调的彩色光,其饱和度越高,颜 色就越深,或越纯;而饱和度越小,颜色就越浅, 或纯度越低。高饱和度的彩色光可因掺入白光而降 低纯度或变浅,变成低饱和度的色光。100%饱和度 的色光就代表完全没有混入白光的纯色光。
视觉系统对颜色和亮度的响应特性曲线 (各个波长的光的强度相等)
上面的颜色响应曲线表明,人类眼睛对蓝光 的灵敏度远远低于对红光和绿光的灵敏度。 亮度响应曲线表明人眼对波长为550nm左右的 黄绿色最为敏感。
许多具有不同光谱分布的光产生的视觉效 果(颜色)是一样的。即光谱与颜色的对应是 多对一的。 光谱分布不同而看上去相同的两种颜色称 为条件等色(匹配等色)。 绝大部分可见光谱对眼睛的刺激效果都可 以用红(700nm),绿(546.1),蓝(435.8nm) 三色光按不同比例和强度的混合来等效表示。 (三刺激理论)
3 .
视觉系统对颜色的感知
可见光的波长范围为380nm~780nm,大多数 自然光都是由不同波长的光组合而成。 人的视网膜有对红、绿、蓝颜色敏感程度不 同的三种锥体细胞,另外还有一种在光功率极端 低的条件下才起作用的杆状体细胞,因此颜色只 存在于眼睛和大脑中。颜色是视觉系统对可见光 的感知结果。 红、绿和蓝三种锥体细胞对不同频率的光的 感知程度不同,对不同亮度的感知程度也不同, 因此不同组成成分的可见光就呈现出不同的颜色.
VQEG规定了两个简单的技术参数:峰值信噪比 (PSNR)和均方差(MSE)P36。此外,还有许多图像质 量模型,这些模型在测量图像质量时都基于人眼视 觉特性。 下图是一种典型的基于解码图像与基准图像差值的 图像质量客观测量模型。
L1, L2 logB ( y y) logB y
3)由于神经系统的作用,从空间频率的角度 来说,人眼又具有带通型线性系统的特性,又 称为侧抑制效应。加权求和运算将有带通滤波 器的效应。 4)从时间上说,人眼对亮度的响应有一定的 延时。这是由神经系统时间响应上的限制引起 的。
下面是RGB<-->YIQ的变换公式:
(5)YUV颜色模型 YUV颜色模型和YIQ颜色模型类似。 事实上YUV只是一类颜色模型(YCrCb)的总称。其 中Y的定义是相同的,色度信息也是组合在Cr、Cb中, 其中Cr代表了光源中的红色分量,Cb代表了光源中 的蓝色分量,因此它的变换公式:
如何找到人脸?