第2章 图象和视觉基础
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、图象的采样和量化
图像的数字化在一般情况下应包含两方面的内容:
2
(1)图像空间位置的数字化,即指图像的空间取样,通过采样把一幅完整的图像分割 成无数众多的离散像素组成的阵列。是空间的离散化。 (2)图像灰度的数字化,即指从图像灰度的连续变化中进行离散的采样。目前使用的 灰度量度有 2 =64 级、 2 =128 级和 2 =256 级,它们都是对连续变化的灰度的离散取 值。 所以一幅图像的数字化, 实际是指在图像的空间采样和灰度上的量化。 针对空间采样和 灰度量化,有两个概念要介绍: (1) 空间分辨率:即图象的大小,最大行数每行的最大象素数 (2) 灰度分辨率:一个象素值单位幅度上包含的灰度级别, 用一个 byte 存一个象素值,为 256 级; 用 4 个 bit 存一个象素值,为 16 级。 设图像尺寸为 MN,每个像素所具有的离散灰度级数为 G。灰度级为不同灰度值的个 数。通常把 M,N 和 G 取为 2 的整数冥,即 M=2m ; N=2n; G=2k。 设离散灰度级均匀分布在 0 和 G 之间,则存储一幅数字图像所需位数为: b=MNk (单位为 bit)。 采样的越细密,灰度级数越多,离散后的图象与原始图象就越接近,但是随着 N,M 和 K 的增大,需要储存和处理的数据量也会增大,因此采样和灰度级不能太大。例如一幅 128128,64 个灰度级的图象需要的存储空间为 1281286=98,304 bit。 而一幅 512512,256 个灰度级的图象需要的存储空间为 5125128=2,097,152 bit。 我们这里介绍的是均匀采样和量化, 均匀采样就是每隔等间隔的距离的采一个值, 均匀 量化就是把灰度变化范围,从最小到最大,均匀等分,每一份用一个编码来表示。还有一种 是非均匀的采样和量化。 非均匀采样是在细节多的地方就采样密一些, 在平滑的区域就采样 少一些。非均匀量化是对图像中像素灰度值频繁出现的灰度值范围,量化间隔小一些,而对 像素灰度值极少出现的灰度范围, 则量化间隔大一些。 非均匀采样和量化对于有些图象可以 改善视觉效果,但是实现起来非常复杂,所以经常使用的是均匀采样和量化。 关于空间分辨率和灰度分辨率的变化对图象效果的影响可见书中 29 页的例子。
6 7 8
二、图象的表示
所谓象素,是指组成图象的最基本的单元点。把一幅连续图象离散化为数字图象时,每 个采样点就是一个象素。每一个象素上数字的大小意味着在这一点上发射光强亮度的大小, 在这里我们讨论的是灰度图象,所以每个象素的值表示的是图象灰度级的亮度,即灰度。 1.连续二维函数 f(x,y) 假设有一幅图象,在图象平面建立二维坐标系,用(x,y)表示图象中任一象素的坐标,函 数 f(x,y)表示在位置(x,y)处的象素的亮度,所以 f(x,y)应当是正值且为有限值,即 0<f(x,y)<∞。 图象是一种视觉,是由光被景物的反射而形成的,没有景物的反射就没有图象。因此, f(x,y)应该是由两部分的乘积组成,即: f(x,y)=i(x,y)r(x,y) (1)
2.3 图象文件格式
图象文件是指包含图象数据的文件。 文件内除图象数据本身外, 一般还有对图象的描述
4
信息,以方便读取、显示图象。 计算机处理的数字图像文件格式主要有矢量图形和位图图像两种形式。 矢量图形 定义 简称图形,指用一组绘图指令描述和 记录的各种图形。包括直线、弧线、 圆、矩形的大小形状等。 图形指令 需要相应的软件(如 AutoCAD 软件) 来执行绘图指令生成图形(矢量文件 一般象程序文件,里面有一系列命令 和数据,执行这些命令就可根据数据 绘出图案) 小 位图图像 简称图像,由一组计算机内存位组 成,这些位定义了图像中每个像素点 的亮度和颜色。 图象点阵数据 ①用绘图软件生成 ②用彩色扫描仪扫描二维图片 ③用摄象机以及帧捕获设备获得数 字化画面 大
第 2 章 图象和视觉基础
2.1 图象的视觉基础
为了输出供人观察的照片或屏幕显示, 必须充分研究人的视觉系统, 因为人的视觉系统 才是图像系统的最后终端,而系统输出图像最终由人的视觉系统来评价。当然,为了提高计 算机处理图像的效率, 还必须对通常遇到的大量图像分析统计找出其内在规律, 以使算法大 为简化。
给出不同灰度的条带,各条带内部的亮度是常数,各条带之间灰度有一个级差。我们可 观察到带有强烈边缘效应的辉度模式(特别在条带的边界区域) ,就是在人的感觉当中带与 左带相邻的部分亮度感觉升高些,与右边条带相邻部分亮度感觉降低些。这样,本是均匀亮 度条带,看来左边亮些而右边暗些。这种现象称为马赫带效应。 (2)同时对比度 — 亮背景下显得暗、暗背景下显得亮
,) f (11 f (2,1) f ( x, y) f ( N ,1)
f (1,2) f (2,2)
Fra Baidu bibliotek
f ( N ,2)
f (1, N ) f ( 2, N ) f ( N , N )
矩阵元素 f(i,j)表示图象在第 i 行第 j 列的象素的灰度值。 上述矩阵表示了一幅数字图象, 可以看出, 数字图象是对以矩阵形式排列的许多点上的 图象灰度进行取样而做出的。 而对矩阵的某一点, 取样测定的灰度级给予一个离散的整数编 码,所以说,数字图象的模型实际上是一个数字阵列。以这个数字图象模型为基础,进行各 种算法运算就可以得到不同的图象处理结果。
LMIN f ( x, y) LMAX 。
其中理论上要求灰度最小值 LMIN 为正值,灰度最大值 LMAX 必须是有限值。 如果将灰度变化范围进行归一化处理,即: LMIN=0 和 LMAX=1 ,则灰度变化范围 为
0 f ( x, y) 1 。
此时,如果令 LMIN=0 表示黑色, LMAX=1 表示白色,则灰度函数由 0 逐渐增大为 1, 灰度的变化由黑到白,逐渐由深色到浅色连续变化。在实际应用中,将灰度区间等分为若干 份, 以每一份为一个灰度级来量度灰度的大小, 比如通常将煤矿工业电视图象的灰度范围为 256 个灰度级,最小灰级 0 级表示最黑,最大灰级 255 级表示白色,其灰度变化范围为:
0 f ( x, y) 255 。
2.离散矩阵表示 对于一幅连续变化的二维图象,可以用 f(x,y)函数的离散取值的矩阵形式表示出来,矩 阵行列的各个元素表示组成图象的离散象素, 而代表象素的矩阵中每一元素的取值也都是图 象上连续变化的灰度的离散的整数取值。 这样图象空间按照坐标位置(x,y)的数字化可以认为 是图象的取样,而灰度函数 f(x,y)的取样被认为是灰度级的量化。 假设在象素取样和灰度级量化上都按照等间隔离散采样,并且排成一个 N×N 的矩阵, 则有
一、基本概念
(1)光通量:光源以电磁波的形式辐射出的光功率称为光通量。其单位为流明。 (2)照度:就是照射在单位面积上的光通量。设面元 dS 上的光通量为 dФ,则此面元 上的照度 E 为 E=dФ/dS 照度的单位为 lx(勒克斯) ,1 lx=1 lm/m2。 (3)亮度:是观察者所看到的物体表面反射光的量度,是人的视觉系统所感知的,具 有一定的主观性。也称为辉度。 (4)视敏度:人眼对不同波长的可见光的敏感程度不同,根据人眼对不同波长的敏感 程度称为视敏度。 (5)亮度适应级:指一定条件下,一个视觉系统当前的敏感度。 人眼视觉系统对亮度有一个很大的适应范围,从暗视觉门限到眩目门限之间的范围在 1010 量级。但人的视觉系统并不能同时工作在这么大的范围,它工作的具体范围要小得多, 它是以亮度适应级为中心的一个小范围。同时亮度适应区间不大, 一般 < 64 级。
二、亮度适应和区分
人眼的成象 人眼类似一个光学透镜系统,它的前面是一个晶状体,后面是一层视网膜。晶状体相当 于透镜,通过它周围的肌肉,可以对它进行调整,相当于调节透镜的焦距,可以使不同距离 的景物在视网膜上成象。 虹膜中间是瞳孔, 通过肌肉调节瞳孔的大小可以调整进入眼睛的光 通量,相当于照相机的光圈。外面光太强时,瞳孔就会缩小。视网膜上分布着众多的感光细 胞:锥状细胞和柱状细胞。锥状细胞对颜色敏感,每个锥状细胞都连接一个神经末梢,所以 能够区分细节,并且它对亮度敏感,称为亮视觉。柱状细胞是几个连一个神经末梢,所以它 的分辨率低,主要提供景物的整体现象,它不感受颜色,并对低照度敏感,这就是为什么在 夜晚我们感觉不到彩色,也称为暗视觉。 1.确定人的视觉系统区分亮度能力的经典实验: (说明韦伯比) 实验者观看一个均匀照明的足够覆盖整视野平面,光源强度为 I 且可以变化,现在加 一照度增量ΔI,ΔI 是一个短促的闪光,使人感到平面中间像有 1 个圆形亮点。 如果ΔI 不够亮, 回答 “不” 表示无感知变化; 逐渐增大ΔI 的强度, ΔI 够亮, 回答 “是” 表示有感知变化。
1
I+ΔI
I
韦伯率:令ΔI50 为对给定背景亮度有 50%机会回答“是”的照度增量,则量ΔI50/I 称 为韦伯率。 可看出:ΔI50/I 小,表示可区分强度的小变化,代表较好的亮度区分能力。 ΔI50/I 大,表示只区分强度的大变化,代表较差的亮度区分能力。 实验表明,亮度区分能力在低照明情况下较差,韦伯率大;在背景亮度增强时改进多, 韦伯率小。 2.感觉亮度≠光的强度 (1)马赫带效应
3
其中 i(x,y)是由光源决定的照度部分,r(x,y)是反射率,由物质的特性决定。反射率的大小随 不同的物质而不同,暗色粗糙物的反射率较小,淡色光滑物的表面反射率较大,对黑颜色的 物体理论上应该完全吸收没有反射,即 r(x,y)=0,而白颜色的物体理论上应该完全反射没有 吸收,即 r(x,y)=1。因此对于 i(x,y)和 r(x,y), 0<i(x,y)<∞ (2) 0< r(x,y)<1 (3) 根据式(1)~(3) ,图象灰度函数 f(x,y)应该有一个变化范围,即
文件内容 生成
所需磁盘 空间 常用矢量 图格式
WHF、 DRW、 CDR、 DXF、 EPS、 FLI、 BMP、PCX、GIF、TIFF FLC、CGM 等
下面介绍 4 种应用广泛的格式:
一、BMP 格式:
1.基本概念: 位图(bitmap) :又称为光栅图和像素图。数据的存储是以像素为单位,而一幅图像好 像是一张网格,每一个网格点就形成了图像中的一位。 位图表示:将一幅图像分割成栅格,栅格的每一点(像素)的亮度值(亮、暗程度或彩 色)都单独记录。 2.概述: BMP 图像文件格式是微软公司专门为 Windows 环境下应用图象而设计的。Windows 环 境下运行的图形、图像软件都支持 BMP 图像文件。它的扩展名为 bmp。该格式可表现从 2 位到 24 位的色彩,分辨率也可从 480×320 至 1024×768。 3、分类:BMP 图像文件大体上分为三部分: 位图文件头 ①文件头:固定为 54 个字节。它由两部分组成: a. 位图文件头:包括文件类型,一般用“BM”表示;位图文 位图信息头 件大小,以字节为单位;从文件开始到图象数据之间的偏移量,也 就是图象数据的起始位置。 调色板数据 b. 位图信息头:给出图像的长、宽,每个像素的位数,压缩类 型,压缩图像的大小,水平和垂直分辨率(以每米的像素数表示) , 图象数据 使用的颜色数等。 ②调色板数据 实际上是一个数组,它包含的数组数与位图中的颜色数相同。 数组中每个元素的类型是一个 RGBQUAD 结构,占 4 个字节。4 个 字节分别对应蓝色分量、绿色分量和红色分量,还有一个字节是保留位。而图像数据就是该 象素在调色板中的索引值。对于真彩色图,它不使用调色板,图像数据就是实际的 R,G,
两个同样大小同样亮度的小方块, 放在暗的背景中的一块看起来比放在亮的背景中的另 一块看起来要亮一点。 这是人在高亮度背景下视敏度下降所致。 它与在亮处观看一小灯泡和 在暗处看一小灯泡感到亮度不同的道理是一样的,这种效应称为同时对比度效应。
2.2 图象的表示
计算机只处理离散的数据,图像数据若需要用计算机进行存储、显示或处理,首先需进 行数字化。计算机图像就是离散化后的图像数据。