第2章 视觉感知与图像的基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
相对视敏函数
人眼对不同波长的光有不同的敏感度,不同波 长而幅射功率相同的光不仅给人以不同的色彩 感觉,而且亮度感觉也不同。 视敏函数:描述人眼视敏特性的物理量为视敏 函数和相对视敏函数。在相同亮度感觉的条件 下,不同波长光辐射功率 V 的倒数用来衡量人 眼对各波长光明亮感觉的敏感程度。 对于人眼, V 是钟形曲线。
35
36
低bit量化的伪轮廓现象图例
37
图像的数字化 —— 量化方法
量化可分为均匀量化和非均匀量化。 1. 均匀量化是简单地在灰度范围内等间隔量化。
2. 非均匀量化是对像素出现频度少的部分量化间 隔取大,而对频度大的量化间隔取小。
• 一般情况下,对灰度变化比较平缓的部分用 比较多的量化级,在灰度变化比较剧烈的地方用 比较高的采样密度。
8
视觉高级感知层次
大脑对视神经纤维传送来的图像信息进行分析 和理解,通过图像获得对周围世界感知的信息 和知识。 人们对大脑的高级感知层次至今知之甚少,仍是 生理学、神经科学、生物物理学、生物化学研 究的重要课题。
9
视觉和视觉感知
“ 视觉是一个信息处理过程。它能从外部世界的图 像中得到一个即对观察者有用又不受无关信息干扰 的描述。” “视觉感知又是和过去留存于记忆中的同类活动有 关,视觉储积起大量的视觉意象。记忆形象可用于 对知觉对象的辨认,解释和补充。” 使计算机具有人类视觉能力,研究人类的视觉感知, 模仿人类的视觉感知,是研究工作的重要途径。
0 150 200 I 120 50 180 250 220 100
25
数字图像的概念与描述 —— 彩色图像
彩色图像是指每个像素的信息由RGB三原色构 成的图像,其中RGB是由不同的灰度级来描述 的。 彩色图像不能用一个矩阵来描述了,一般是用 三个矩阵同时来描述。
30
31
图像的数字化 —— 采样间隔
采样时的注意点是:采样间隔的选取。 采样间隔太小,则增大数据量; 采样间隔太大, 则会发生信息的混叠,导致细 节无法辨认。
采样列 采 样 行 像素 行 间 隔 列间隔
32
图像的数字化 —— 采样指标分辨率
分辨率 是指映射到图像平面上的单个像
素的景物元素的尺寸。
10
视 觉 错 觉
11
视觉错觉2
12
ห้องสมุดไป่ตู้
视觉特性
视觉特性是视觉的外在表现; 图像是周围世界的一种映射,对于运动图像,空间座标x,y,z都 是时间 t 的函数,若在连续的不同时间获取图像,可以获得序 列图像 I , I , I
1
2
n
对于按不同波段获取图像,可获得彩色图像或不同波段的图 像信号(如遥感图像,医学图像等). 对于按不同视角,即不同的 x,y,z 间相互关系,可以得到不同视 角的不同图像. 因此,视觉现象包括有视觉对光强,对各种波长、彩色的光谱 效应,对物体边缘等空间频率变化的响应,以及视觉对时间瞬 时变化运动的响应.
38
均匀量化效果示意图
39
非均匀量化效果示意图
40
图像质量的确定
数字化时,关键是要决定:
采样点数M×N (行和列) 量化级别G (灰度级数)
为了便于处理,采样点数N与量化级别G都为2的幂 次方,即M=2m,N=2n ,G=2k (m,n,k均为正整 数)。记录一幅图像所需的字节(byte)B可由下 式计算: B=M×N×k÷8 实际上: M、N一般取64、128、256、640、1024、 1240等值;k一般取1、4、8、16、24、32等值。 一般地说,图像质量随M、N和k的增加而增高。
43
CCD的三层结构
第一层“微型镜头”: CCD 成像的关键是在于其感光层, 为了扩展CCD 的采光率,必 须扩展单一像素的受光面积, 增加感光面积。 第二层“分色滤色片”:有 两种分色方式,一是RGB原 色分色法,另一个则是 CMYK补色分色法。这两种 方法各有优缺点。 第三层感光层:主要是负责 将穿过滤色层的光源转换成 电子信号,并将信号传送到 影像处理芯片,将影像还原。
单位:像素/英寸,像素/厘米
(如:扫描仪的指标 300dpi)
• 分辨率 或者是指要精确测量和再现一定 尺寸的图像所必需的像素个数。 • 单位:像素×像素
(如:数码相机指标1210万像素(4000×3000))
33
34
图像的数字化 —— 量化概念
量化是将各个像素所含的明暗信息离散化后,
用数字来表示。一般的量化值为整数。 充分考虑到人眼的识别能力之后,目前非特殊 用途的图像均为8bit量化,即采用0 ~ 255的整数 来描述“从黑到白”。 在3bit以下的量化,会出现伪轮廓现象。
27
图像的数字化
数字化的过程也称为A/D转换:是将光电 传感器产生的模拟量转换为数字量,以便 计算机处理;
转换过程:采样、量化、编码; 转换精度:ADC位数; 转换速度:采样速率; 量化误差。
28
f ( t)
量 化 单 位
量 化 误 差
采样间隔
t
图像的数字化
经数字化的图像方可用计算机来处理。 图像f(x, y)必须在空间上和在颜色深浅的幅度上 都进行数字化: 空间坐标(x, y)的数字化被称为图像采样; 颜色深浅幅度的数字化被称为灰度级量化。
255 240 240 R 255 0 80 0 255 0
0 160 80 G 255 255 160 0 255 0
80 160 0 B 0 0 240 255 255 255
26
2.3 图像的数字化
列(j) Y轴(j)
矩阵 A(i,j)
行(i)
图像 f(i,j)
X轴(i)
矩阵坐标系
直角坐标系
23
数字图像的概念与描述 —— 黑白图像
黑白图像是指图像的每个像素只能是黑或 者白,没有中间的过渡,故又称为2值图 像。 2值图像的像素值为0、1。
24
数字图像的概念与描述 —— 灰度图像
灰度图像是指每个像素的信息由一个量化的 灰度级来描述的图像,没有彩色信息。
第2章
视觉感知与图像的基 本概念
本章内容简介
视觉感知 数字图像的概念与描述 图像的数字化 数字图像的存储格式 灰度直方图
2
2.1 视觉感知
图像处理的研究需要了解人类视觉机理:
人们能够区分的光强度差别有多大? 我们眼睛的空间清晰度是多少?对运动的感觉如何? 我们估计和比较距离和面积的精度是多少? 人类特性视觉的光谱是怎样的? 人的视觉中彩色起什么作用? 人类是如何获得视觉感知,如何认知周围事物的?
16
同时对比度
在相同亮度的刺激下,由于背景亮度不同,人 眼所感受到的主观亮度不同,这种效应称为 同时对比度。 由于同时对比是由亮度差别引起的,故也称 为亮度对比。相对应的还有色度对比。
物体 背景 视觉
17
18
马赫带
Mach在1865年讨论了“Mach带”现象 “Mach带”
一条有均匀黑的区域和均匀白的区域 每级阶跃的灰度差相同
2.2 数字图像的概念与描述
所谓的数字图像的描述是指如何用一个数值 方式来表示一个图像。 数字图像是图像的数字表示,像素是其最小 的单位。 可以用矩阵来描述数字图像。 描述数字图像的矩阵目前采用的是整数阵, 即每个像素的亮暗,用一个整数来表示。
22
数字图像的概念与描述 —— 图像的坐标系
矩阵是按照行列的顺序来定位数据的,但是图 像是在平面上定位数据的,所以有一个坐标系 定义上的特殊性。 为了实现方便起见,这里以矩阵坐标系来定义 图像的坐标。
我们日常生活中见到的图像一般是连续形式 的模拟图像,可由一个二维连续函数f(x, y) 来描述。 其中: (x, y)是图像平面上任意一个二维坐标点, f(x, y)则是该点颜色的深浅。 图像处理的方法有模拟式和数字式两种。 数字图像处理的一个先决条件就是将连续图 像经采样、量(离散)化,转换为数字图像。
5
视觉感知
视觉感知是视觉的内在表象。 视觉感知包括两个不同的感知层次:
视觉的低级感知层次 视觉的高级感知层次
6
视觉低级感知层次(一)
视觉系统从外界获取图像。就是在眼睛视网膜上 获得周围世界的光学成象,然后由视觉接收器 (杆状体和锥状体在视网膜上作为视觉接收器), 将光图像信息转化为视网膜的神经活动电信息, 最后通过视神经纤维,把这些图像信息传送入大 脑,由大脑获得图像感知。
“Mach带”,人们在观察现象:
每个条带内灰度是不均匀的 每级阶梯的右边比左边更暗
19
20
人类视觉感知能力的特点
人类视觉系统在对物体的识别上有特殊强大的功 能;但在对灰度、距离和面积的绝对的估计上却 有某些欠缺; 以传感器单元的数目比较:视网膜包含接近130 millions 光接收器,这极大的大于CCD片上的传 感器单元数; 和它每次执行运算的数目比较:和计算机的时钟 频率相比,神经处理单元的开关时间将比之大约 4 10 慢 倍; 不论这慢的定时和大量的接收器,人类的视觉系 统是比计算机视觉系统要强大得多。它能实时分 析复杂的景物以使我们能即时的反应。
14
视杆体和视锥体的相对视敏曲线有所不同,对视 锥体情况,在 =555nm 时绿光亮度最敏感,对视 杆体暗视情况,则 =505nm 时绿光最敏感。
图2.4 相对视敏度曲线
对比灵敏度
在均匀照度背景 I 上,有一照度为 I+△I的光 斑,称眼睛刚好能分辨出的照度差△I与 I 的 比(△I/ I)为对比灵敏度; 由于背景亮度 I 增大, △I 也需要增大,因 此在相当宽的强度范围内,对比灵敏度是一 个常数,约等于0.02,这个比值称为韦伯比 (Weber比)。亮度很强(弱)时不为常数。
线阵CCD :
单元数有: 256, 1024, 2048, 4096 等;
面阵CCD:
CMOS
CMOS和CCD一样都是可用来感受光线变化的半导体。 CMOS是利用硅和锗两种元素做成的半导体,通过CMOS上 带负电和带正电的晶体管来实现基本功能的。产生的电流即 可被处理芯片纪录和解读成影像。 CMOS针对CCD最主要的优势是价格低廉、制造工艺较简单 且非常省电,其耗电量只有普通CCD的1/3左右。 CMOS传感器可以在每个像素基础上进行信号放大,采用这 种方法可以进行快速数据扫描; CMOS主要问题是在处理快速变化的影像时,由于电流变化 过于频繁而过热。但是现在CMOS绝非只局限于简单的应用, 也在发展高清系列。
人们对于自己视觉机构的生物、生理、物理过程的 了解,以及神经、精神方面的了解还处于低级阶段, 认识还很不完善,还有很大的局限性。
3
人眼构造
4
视杆体与视锥体
视网膜上有杆状体和锥状体两类视觉接收器; 视杆体(Rods):细长而薄,数量上约100 million, 它们提供暗视(Scotopic Vision),即在低几个数量 级亮度时的视觉响应,其光灵敏度高。 视锥体(Cons):结构上短而粗,数量少,约6.5 million,光灵敏度较低,它们提供明视 (Photopic Vision),其响应光亮度范围比视杆体 要高5~6个数量级。在中间亮度范围是两种视觉 细胞同时起作用。视锥体集中分布在视网膜中心。
41
采样传感器
采样传感器
CCD(Charge Couple Device):电荷耦合器件; CMOS(Complementary Metal Oxide Semiconductor):互补性金属氧化物半导体。
42
CCD
CCD是20世纪70年代初发展起来的半导体器件。 CCD以电荷为信号,而不是以电压为信号。 CCD利用感光二极管(photodiode)进行光电转换, 将图像转换为数字数据. CCD的基本功能是电荷的产生、存储和转移。其基 本原理是:通过光学系统将景物成像在CCD象敏面 上,象敏面将照在每一个象敏单元上的光照强度转 换为电荷存储在象敏单元中,然后再转移到CCD的 移位寄存器中,在驱动脉冲的作用下顺序移出器件, 形成强弱不同的电信号。
7
视觉低级感知层次(二)
光图像激活视杆体或视锥体时,发生光电化学 反应,同时产生视神经脉冲,视觉系统散布视 神经中有80万神经纤维,视觉系统传播视神经 脉冲。许许多多的视杆体和视锥体相互连接到 神经纤维上。 视觉系统的可视波长范围为 =380nm~780nm; 视觉系统的可响应的亮度范围是:1~10个量级 的幅度范围。