第2章 视觉感知与图像的基本概念

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

255 240 240 R 255 0 80 255 0 0
0 160 80 G 255 255 160 0 255 0
80 160 0 B 0 0 240 255 255 255
21
2.3 图像的数字化
第2章
视觉感知与图像的基 本概念
本章内容简介
视觉感知 数字图像的概念与描述 图像的数字化 数字图像的存储格式 灰度直方图
2
2.1 视觉感知
图像处理的研究需要了解人类视觉机理:
人们能够区分的光强度差别有多大? 我们眼睛的空间清晰度是多少?对运动的感觉如何? 我们估计和比较距离和面积的精度是多少? 人类特性视觉的光谱是怎样的? 人的视觉中彩色起什么作用? 人类是如何获得视觉感知,如何认知周围事物的?
10
相对视敏函数
人眼对不同波长的光有不同的敏感度,不同波 长而幅射功率相同的光不仅给人以不同的色彩 感觉,而且亮度感觉也不同。 视敏函数:描述人眼视敏特性的物理量为视敏 函数和相对视敏函数。在相同亮度感觉的条件 下,不同波长光辐射功率 V 的倒数用来衡量人 眼对各波长光明亮感觉的敏感程度。 对于人眼, 是钟形曲线。 V
转换过程:采样、量化、编码; 转换精度:ADC位数; 转换速度:采样速率; 量化误差。
23
图像的数字化
经数字化的图像方可用计算机来处理。 图像f(x, y)必须在空间上和在颜色深浅的幅度上 都进行数字化: 空间坐标(x, y)的数字化被称为图像采样; 颜色深浅幅度的数字化被称为灰度级量化。
24
图像的数字化 —— 采样间隔
2.2 数字图像的概念与描述
所谓的数字图像的描述是指如何用一个数值 方式来表示一个图像。 数字图像是图像的数字表示,像素是其最小 的单位。 可以用矩阵来描述数字图像。 描述数字图像的矩阵目前采用的是整数阵, 即每个像素的亮暗,用一个整数来表示。
17
数字图像的概念与描述 —— 图像的坐标系
矩阵是按照行列的顺序来定位数据的,但是图 像是在平面上定位数据的,所以有一个坐标系 定义上的特殊性。 为了实现方便起见,这里以矩阵坐标系来定义 图像的坐标。
采样时的注意点是:采样间隔的选取。 采样间隔太小,则增大数据量; 采样间隔太大, 则会发生信息的混叠,导致细 节无法辨认。
采样列 采 样 行 像素 行 间 隔 列间隔
25
图像的数字化 —— 采样指标分辨率
分辨率 是指映射到图像平面上的单个像
素的景物元素的尺寸。
单位:像素/英寸,像素/厘米
(如:三星智能手机GALAXY S4显示屏为441 ppi )
列(j) Y轴(j)
矩阵 A(i,j)
行(i)
图像 f(i,j)
X轴(i)
矩阵坐标系
直角坐标系
18
数字图像的概念与描述 —— 黑白图像
黑白图像是指图像的每个像素只能是黑或 者白,没有中间的过渡,故又称为2值图 像。 2值图像的像素值为0、1。
19
数字图像的概念与描述 —— 灰度图像
灰度图像是指每个像素的信息由一个量化的 灰度级来描述的图像,没有彩色信息。
31
CCD的三层结构
第一层“微型镜头”: CCD 成像的关键是在于其感光层, 为了扩展CCD 的采光率,必 须扩展单一像素的受光面积, 增加感光面积。 第二层“分色滤色片”:有 两种分色方式,一是RGB原 色分色法,另一个则是 CMYK补色分色法。这两种 方法各有优缺点。 第三层感光层:主要是负责 将穿过滤色层的光源转换成 电子信号,并将信号传送到 影像处理芯片,将影像还原。
人们对于自己视觉机构的生物、生理、物理过程的 了解,以及神经、精神方面的了解还处于低级阶段, 认识还很不完善,还有很大的局限性。
3
人 眼 构 造
4
视杆细胞与视锥细胞
视网膜上有杆状细胞和锥状细胞两类视觉接收器; 视杆细胞(Rod cell):细长而薄,数量上约1.2亿 个,它们提供暗视(Scotopic Vision),即在低几 个数量级亮度时的视觉响应,其光灵敏度高。 视锥细胞(Cone cell):结构上短而粗,数量少, 约600万~700万,光灵敏度较低,它们提供明视 (Photopic Vision),其响应光亮度范围比视杆细 胞要高5~6个数量级。在中间亮度范围是两种视 觉细胞同时起作用。视锥体集中分布在视网膜中 心。
0 150 200 I 120 50 180 250 220 100
20
数字图像的概念与描述 —— 彩色图像
彩色图像是指每个像素的信息由RGB三原色构 成的图像,其中RGB是由不同的灰度级来描述 的。 彩色图像不能用一个矩阵来描述了,一般是用 三个矩阵同时来描述。
采样点数M×N (行和列) 量化级别G (灰度级数)
为了便于处理,采样点数N与量化级别G都为2的幂 次方,即M=2m,N=2n ,G=2k (m,n,k均为正整 数)。记录一幅图像所需的字节(byte)B可由下 式计算: B=M×N×k÷8 实际上: M、N一般取64、128、256、640、1024、 1240等值;k一般取1、4、8、16、24、32等值。 一般地说,图像质量随M、N和k的增加而增高。
“Mach带”,人们在观察现象:
每个条带内灰度是不均匀的 每级阶梯的右边比左边更暗
15
人类视觉感知能力的特点
人类视觉系统在对物体的识别上有特殊强大的功 能;但在对灰度、距离和面积的绝对的估计上却 有某些欠缺; 以传感器单元的数目比较:视网膜包含接近1.3亿 个光接收器,这极大的大于CCD片上的传感器单 元数; 和它每次执行运算的数目比较:和计算机的时钟 频率相比,神经处理单元的开关时间将比之大约 104倍; 慢 不论这慢的定时和大量的接收器,人类的视觉系 统是比计算机视觉系统要强大得多。它能实时分 析复杂的景物以使我们能即时的反应。
Βιβλιοθήκη Baidu
线阵CCD :
单元数有: 256, 1024, 2048, 4096 等;
面阵CCD:
CMOS
CMOS和CCD一样都是可用来感受光线变化的半导体。 CMOS是利用硅和锗两种元素做成的半导体,通过CMOS上 带负电和带正电的晶体管来实现基本功能的。产生的电流即 可被处理芯片纪录和解读成影像。 CMOS针对CCD最主要的优势是价格低廉、制造工艺较简单 且非常省电,其耗电量只有普通CCD的1/3左右。 CMOS传感器可以在每个像素基础上进行信号放大,采用这 种方法可以进行快速数据扫描; CMOS主要问题是在处理快速变化的影像时,由于电流变化 过于频繁而过热。但是现在CMOS绝非只局限于简单的应用, 也在发展高清系列。
7
视觉高级感知层次
大脑对视神经纤维传送来的图像信息进行分析 和理解,通过图像获得对周围世界感知的信息 和知识。 人们对大脑的高级感知层次至今知之甚少,仍是 生理学、神经科学、生物物理学、生物化学研 究的重要课题。
8
视觉和视觉感知
“视觉是一个信息处理过程。它能从外部世界的图 像中得到一个即对观察者有用又不受无关信息干扰 的描述。” “视觉感知又是和过去留存于记忆中的同类活动有 关,视觉储积起大量的视觉意象。记忆形象可用于 对知觉对象的辨认,解释和补充。” 使计算机具有人类视觉能力,研究人类的视觉感知, 模仿人类的视觉感知,是研究工作的重要途径。
13
同时对比度
在相同亮度的刺激下,由于背景亮度不同,人 眼所感受到的主观亮度不同,这种效应称为 同时对比度。 由于同时对比是由亮度差别引起的,故也称 为亮度对比。相对应的还有色度对比。
14
马赫带
Mach在1865年讨论了“Mach带”现象 “Mach带”
一条有均匀黑的区域和均匀白的区域 每级阶跃的灰度差相同
34
2.4 数字图像的存储格式
数字图像是由排成矩形点阵的像素组成的。 图像有不同的编码方式:无压缩、无损压缩、有损 压缩。 图像文件通常与操作系统有关:Windows、Linux、 Mac; 把一幅图像记录进文件时,必须同时记录下各像素 在点阵中的位置及像素的灰度值。 实际上我们可以利用各像素在文件中的记录位置来 表示其在图像点阵中的位置,这样就可以省去记录 像素位置坐标的数据量,而各像素的数据只用来记 录其灰度值。
• 分辨率 或者是指要精确测量和再现一定 尺寸的图像所必需的像素个数。 • 单位:像素×像素
(如:数码相机指标1210万像素(4000×3000))
26
图像的数字化 —— 量化概念
量化是将各个像素所含的明暗信息离散化后,
用数字来表示。一般的量化值为整数。 充分考虑到人眼的识别能力之后,目前非特殊 用途的图像均为8bit量化,即采用0 ~ 255的整数 来描述“从黑到白”。 在3bit以下的量化,会出现伪轮廓现象。
11
相对视敏曲线
视杆细胞和视锥细胞的相对视敏曲线有所不同, 对视锥细胞情况,在 =555nm 时绿光亮度最敏 感,对视杆细胞暗视情况,则 =505nm 时绿光最 敏感。
12
对比灵敏度
在均匀照度背景 I 上,有一照度为 I+△I的光 斑,称眼睛刚好能分辨出的照度差△I与 I 的 比(△I/ I)为对比灵敏度; 由于背景亮度 I 增大, △I 也需要增大,因 此在相当宽的强度范围内,对比灵敏度是一 个常数,约等于0.02,这个比值称为韦伯比 (Weber比)。亮度很强(弱)时不为常数。
29
采样传感器
采样传感器
CCD(Charge Couple Device):电荷耦合器件; CMOS(Complementary Metal Oxide Semiconductor):互补性金属氧化物半导体。
30
CCD
CCD是20世纪70年代初发展起来的半导体器件。 CCD以电荷为信号,而不是以电压为信号。 CCD利用感光二极管(photodiode)进行光电转换, 将图像转换为数字数据. CCD的基本功能是电荷的产生、存储和转移。其基 本原理是:通过光学系统将景物成像在CCD象敏面 上,象敏面将照在每一个象敏单元上的光照强度转 换为电荷存储在象敏单元中,然后再转移到CCD的 移位寄存器中,在驱动脉冲的作用下顺序移出器件, 形成强弱不同的电信号。
27
图像的数字化 —— 量化方法
量化可分为均匀量化和非均匀量化。 1. 均匀量化是简单地在灰度范围内等间隔量化。
2. 非均匀量化是对像素出现频度少的部分量化间 隔取大,而对出现频度大的部分量化间隔取小。
• 一般情况下,对灰度变化比较平缓的部 分用比较多的量化级。
28
图像质量的确定
数字化时,关键是要决定:
我们日常生活中见到的图像一般是连续形式 的模拟图像,可由一个二维连续函数f(x, y) 来描述。 其中: (x, y)是图像平面上任意一个二维坐标点, f(x, y)则是该点颜色的深浅。 数字图像处理的一个先决条件就是将连续图 像经采样、量(离散)化,转换为数字图像。
22
图像的数字化
数字化的过程也称为A/D转换:是将光电 传感器产生的模拟量转换为数字量,以便 计算机处理;
5
视觉感知
视觉感知是视觉的内在表象。 视觉感知包括两个不同的感知层次:
视觉的低级感知层次 视觉的高级感知层次
6
视觉低级感知层次
视觉系统从外界获取图像。 眼睛视网膜上获得周围世界的光学信号,然后 视觉接收器发生光电化学反应(杆状细胞和锥 状细胞在视网膜上作为视觉接收器),产生视 神经脉冲,从而将光图像信息转化为视网膜的 神经活动电信息,最后通过视神经纤维,把这 些图像信息传送入大脑,由大脑获得图像感知。 视觉系统的可视波长范围为 =380nm~780nm; 视觉系统的可响应的亮度范围是:1~10个量级的 幅度范围。
9
视觉特性
视觉特性是视觉的外在表现; 图像是周围世界的一种映射,对于运动图像,空间座标x,y,z 都是时间 t 的函数,若在连续的不同时间获取图像,可以获 得序列图像
I1 , I 2 , I n
对于按不同波段获取图像,可获得彩色图像或不同波段的图 像信号(如遥感图像,医学图像等)。 对于按不同视角,即不同的 x,y,z 间相互关系,可以得到不 同视角的不同图像。 因此,视觉特性包括有视觉对光强,对各种波长、彩色的光 谱效应,对物体边缘等空间频率变化的响应,以及视觉对时 间瞬时变化运动的响应。
相关文档
最新文档