第二讲数字图像及其性质
基础篇第二讲:数字图像基础

二 、像素、颜色深度与分辨率
图像分辨率:是指组成一幅图像的像素密度的度量方法。 对同样大小的一幅图,如果组成该图的图像像素数目越多, 则说明图像的分辨率越高,看起来就越逼真。反之,图像 显得越粗糙。 在用扫描仪扫描彩色图像时,通常要指定图像的分辨率, 用每英寸多少像素(ppi,即pixel per inch)表示。如果 用300ppi来扫描一幅8×10英寸的彩色图像,就得到一幅24 00×3000个像素的图像。分辨率越高,像素就越多,图像 的质量相对也就越高。 例如,一张72ppi分辨率1×1英寸的图像(包含的像素数为 分辨率为72 ppi(左图)和300 ppi(右图)的图像示例 72×72=5184)和一张尺寸同为1×1英寸但分辨率为300 pp i的图像(包含的像素数为300×300=90000),在同样放大 (此外,还有打印机分辨率、扫描仪分辨率等。 ) 200%时,可以看到分辨率为300 ppi的明显比72 ppi的清晰, 如图所示:
PCX:PCX格式是ZSOFT公司在开发图像处理软件Paintbrush时开发 的一种格式,存储格式从1位到24位,它是过压缩的格式,占用磁 盘空间较少。由于该格式出现的时间较长,并且具有压缩及全彩 色的能力,所以PCX格式现在仍然流行。 SVG:一种开放标准的矢量图形语言,可设计高分辨率的Web图形 页面。SVG被开发的目的是为Web提供非栅格的图像标准。 EPS:矢量图格式,专业印刷通用格式,所以其内部色彩是用CMYK 格式,在输出成EPS的过程中,一些超出CMYK色域的色彩会被转换; EPS格式能保存图案中的位图和矢量图对象。 EPS格式在Mac和PC环境下的图形和版面设计中广泛使用,用在Pos tScript输出设备上打印。几乎每个绘程序及大多数页面布局程序 都允许保存EPS文档。
第二讲数字图像基础PPT课件

(1) D ( p , q) ≥ 0 (D ( p , q)=0,当且仅当p =q),
(2) D (p , q) = D (q , p)
(3) D (p , z) ≤ D ( p , q) + D ( q , z)
则称D是距离函数或度量。
1)像素p ( x , y)和q ( s , t)间的欧式距离定义如下:
4邻接:对于具有值V的像素p和q,如果q在集合N 4 (p)中,
则称这两个像素是4邻接的。
8邻接:对于具有值V的像素p和q,如果q在集合N 8 (p)中,
则称这两个像素是8邻接的。
m邻接:对于具有值V的像素p和q,如果满足下列条件之一:
a)q在集合N 4 (p)中,或
b) q在集合N D (p)中,并且N 4 (p)与N 4 (q)的交集为空
具有与(x , y) D 8 距离小于等于某个值 r 的那些像素形
成一个方形 。例如,图为与点(x , y)(中心点)D 8 距离小于
等于2的像素。具有D 8 = 1的像素是(x , y)的8 x , y )r表示光源入射分量, r ( x , y )表示物体
对光源的反射分量。 f ( x , y ) 是单色图像在( x , y )处的
其中
灰度值。
0 <
i(x,y)<∞
第8页/共28页
三、图像取样和量化
取样和量化是将连续感知量转化为数字量的处理
方法。
大多数传感器的输出是连续电压波形,为了产生
第17页/共28页
四、像素间的基本关系
1、相邻像素:
4邻域
D邻域
8邻域
2、邻接性
4邻接
第二讲 数字图像基础

量化参数与数字化图像间的关系
(The relationship between quantizing parameter and digitized image) 数字化方式可分为均匀采样、量化和非均匀采样、量化。
所谓“均匀”,指的是采样、量化为等间隔方式。图像数字化一般 采用均匀采样和均匀量化方式。 非均匀采样是根据图象细节的丰富程度改变采样间距。细节 丰富的地方,采样间距小,否则间距大。 非均匀量化是对图像层次少的区域采用间隔大量化,而对图 像层次丰富的区域采用间隔小量化。 采用非均匀采样与量化,均会使问题复杂化,因此很少采用。
The Mathematic Description of Serial Image
人眼所看到的图像是由于光线照射在景物上并经过反射 和透射作用映射到人眼中形成了图像。 f (x,y)---理想成像面坐标点(x,y) 的亮度 i (x,y)---入射分量 r (x,y)---反射分量或透射分量,则
对两个像素来说,要确定它们是否连接需要考虑两点: ①它们在空间上是否接触(即它们是否邻接) ②它们的灰度值是否满足某个特定的相似准则(例如它 们灰度值相等,或同在一个灰度值集合中取值)
设用V表示定义连接的灰度值集合。例如在一幅二值图中,为考虑 两个灰度值为1的像素之间的连接,取,一个像素1和在它邻域中的 像素只有当它们具有相同的灰度值时才可以说是连接的。
yt|
点p和q之间的棋盘(chessboard)距离:
D8
p, q
m a x (| x s |, | y t |)
q(s,t)
q(s,t) q(s,t)
p(x,y)
p(x,y) 棋盘距离
D8
p(x,y)
欧式距离
Lecture2数字图像基础PPT课件

27
例子 (调色板色彩数为16x16)
真彩色显示,无需调色板
调色板与图像 原有颜色匹配, 故颜色偏差很 小
调色板与原图 不匹配,图像 出现色偏
28
29
30
31
32
4、图像尺寸 图像尺寸分为像素尺寸和输出尺寸两种。图像的像素尺
寸是指数字化图像像素的多少,用横向与纵向像素的乘积 来表示。描述一幅图像时,这两个参数都要用到。
第2讲 数字图像基础
有趣的视觉现象-错视
2
3
4
全局-局部
5
两可图
6
7
8
9
视知觉滞后
10
主要内容
图像的分类 图像的基本属性 常用图像文件格式(略) 伽玛校正 抖动 图像特征 图像与情感
11
图像的分类
矢量图与点位图
矢量图 用一系列计算机指令来表示一幅图,如 画点、画线、画曲线、画圆、画矩形等。这种方 法实际上是用数学方法来描述一幅图。 优点 ➢ 缩放、旋转、移动时图像不会失真。 ➢ 存储和传输时数据量较小。 缺点 ➢ 图像显示时花费时间比较长。 ➢ 真实世界的彩色图像难以转化为矢量图。 12
图像文件的逻辑结构
35
图像文件的格式
在多媒体计算机系统中,不同的压缩方式用不同的文件 格式表示。不同的文件格式用特定的文件扩展名来表示, 常见的图像文件格式有BMP、PCX、GIF、JPG、TIF、 TGA、PNG、PSD和MPT等。 1、BMP格式
BMP格式是一种与设备无关的图像文件格式,采用位映 射存储形式,支持RGB、索引色、灰度和位图色彩模式。 利用Windows的画图软件可以将图像存储成BMP格式图 像文件。该格式结构较简单,每个文件只存放—幅图像。
第二节:数字图像基础知识

灰阶
我们把原来图像上连续变化的灰度值按照像素的分布变成量值上离散的 有限个等级的数字量的过程称为图像灰度的量化
经过取样量化后的图像,在实质上就是一个二维数组
处理
既然图像被转化为了二维数组,那么我们就可以根据需求 对这个二维数组进行数学计算:数字图像的处理
如:灰度线性变换
灰度范围变大
处理
数字处理的方法有很多:
怎么表示 这些点呢?
灰度(灰阶)
灰阶
我们把从黑到白分成若干个等级用来表示每个像素的灰度这个等级 称为灰阶 由于计算机是2进制的,所以灰度级的数量又2的N次方决定,常称为 位(bit),所以也叫位图。如为8位,也就是256个灰级,0表示黑 色,255表示白色
位数越高,灰度分辨力越强,图像的层次感越强,越清晰
对比度增强 图像平滑
图像锐化 图像分割
兴趣区定量估值
就是某种数学的处理方法
显示
数字图像的特性决定了它显示的多样性:
单幅与多幅显示 动态与静态 放大与缩小 二维与三维
Thank you!
第二节(1) 数字图像基础知识
课程导航:
模拟 图像
图像
数字 图像
像素 灰阶 处理
显示
形成
曝光量
感光度
图像
何为图像? 图:光线经过物体反射或者透射后的空间分布
像:“图”通过视觉系统在人脑中的反映
模拟 图像
模拟图像: 又称连续图像,是指在二维坐标系中连续变化的图像,即图
像的像点是 无限 稠密的,同时每个像点具有灰度值(即图
感光度ISO
胶片光密度D
数字 图像
何为数字图像? 数字图像:就是用一系列的数字来记录光分布的信息的 图像 怎么记录呢?
数字图像处理课件第二章数字图像基础详解演示文稿

为:0~255,即像素灰度值在此区间取值,灰度级为256。 人眼对灰度的分辨能力通常在20~60级,因此以字节为
单位,既保证了人眼的分辨力,又符合计算机的习惯。
在特殊应用中,可能采用更高的灰度级,比如CT,采用12位 或16位。
第二十七页,共80页。
Ø 2.2数字图像基础-图像模式
-二值图像:是灰度图像经过二
值化处理后的结果,二值图像只 有两个灰度级0和1,理论上只需 要一位二进制位来表示。在文字 识别、图样识别等应用中,灰度 图像一般要经过二值化处理得到 二值图像,二值图像中的黑或者 白用来表示不需要进一步处理的 背景和需要进一步处理的前景目 标,以便于对目标进行识别。
θ
光源在包含给定方向的立体角元dΩ内
传输的光通量dφ与该立体角元之商,
即: I d / d
B dA
立体角:指从一点(立体角顶点)出发通过一
条闭合曲线上所有点的射线围成的空间部分,
所以立体角表示由顶点看闭合曲线时的视角。
dΦe d
发光强度的单位为坎德拉(cd)。
1lm定义:发光强度为1cd的均匀点光源在一球面立体角内发射的光通量。
第三十一页,共80页。
Color images have 3 values per pixel; monochrome images have 1 value per pixel.
红,绿,蓝 三分量
第三十二页,共80页。
2.12 彩色图像和单色图像
强度 分量
2.2 数字图像基础-图像的数据量
假定图像尺寸为M、N,每个像素所具有的离散灰度级数为G
视觉错觉图例(b)
第2章 数字图像的基础知识和基本概念

第2章数字图像的基础知识和基本概念一、数字图像数字图像是以二进制数字组形式表示的二维图像。
利用计算机图形图像技术以数字的方式来记录、处理和保存图像信息。
在完成图像信息数字化以后,整个数字图像的输入、处理与输出的过程都可以在计算机中完成,它们具有电子数据文件的所有特性。
通常把计算机图形主要分为两大类:位图(bitmap)图像和矢量(vector)图形(如图2-1所示)。
图2-1 计算机图形的主要分类1.关于位图图像(1)概念位图图像(在技术上称作栅格图像)使用图片元素的矩形网格(像素)表现图像。
每个像素都分配有特定的位置和颜色值。
在处理位图图像时,人们所编辑的是像素。
位图图像是连续色调图像(如照片或数字绘画)最常用的电子媒介,因为它们可以更有效地表现阴影和颜色的细微层次。
(2)分辨率位图图像与分辨率有关,也就是说它们包含固定数量的像素。
因此,如果在屏幕上以高缩放比率对它们进行缩放或以低于创建时的分辨率来打印它们,则将丢失其中的细节,并会呈现出锯齿,如图2-2所示。
图2-2 不同放大级别的位图图像示例(3)特点①位图图像有时需要占用大量的存储空间。
对于高分辨率的彩色图像,由于像素之间独立,所以占用的硬盘空间、内存和显存比矢量图都大。
②位图放大到一定倍数后会产生锯齿。
位图的清晰度与像素点的多少有关。
③位图图像在表现色彩、色调方面的效果比矢量图更加优越,尤其在表现图像的阴影和色彩的细微变化方面效果更佳。
④位图的格式有bmp、jpg、gif、psd、tif、png等。
⑤处理软件:Photoshop、ACDSee、画图等。
2.关于矢量图形(1)概念矢量图形(又称矢量形状或矢量对象)是由称作矢量的数学对象定义的直线和曲线构成的。
矢量根据图像的几何特征对图像进行描述。
(2)分辨率矢量图形是与分辨率无关的,即当调整矢量图形的大小、将矢量图形打印到PostScript 打印机、在PDF文件中保存矢量图形或将矢量图形导入到基于矢量的图形应用程序中时,矢量图形都将保持清晰的边缘(如图2-3所示)。
第二章 数字图像及其性质

机器视觉课程之数字图像及其性质2.1基本概念这一章我们要介绍一些木书中用到的基本概念和数学工具。
缺少完整数学背景的读者可能会遇到一些困难,在这种情况下,你可以忽略数学细节而关注于基本概念的直观意义,这是文中所强调的而且在本章结束时也概括出来的。
这种方式不会影响你对本书的理解。
图像和信号常用数学模型来描述,信号是一个依赖于具有某种物理意义的变量的函数,它可以是一维的(例如,依赖于时间)、二维的(例如,依赖于平面上的两个坐标量)、三维的(例如,描述空间中的一个物体)或高维的。
对于单色的图像,一个标量函数可能就足够了,但是对于诸如由三个分量组成的彩色图像,就需要使用矢量函数。
我们要处埋的函数可以分为连续的、离散的或数字的。
连续函数具有连续的定义域和值域;如果定义域是离散的,我们得到的是离散函数;而如果值域也是离散的,我们就得到数字函数.2.1.1图像函数图像(image)这一词我们通常在直观上去理解其意义,例如,人类眼睛视网膜上的图像,或者TV摄像机拍摄到的图像。
图像可以表示为两个或三个变量的连续函数,在简单的情况下变量是平曲的坐标(x,y),不过当图像随时间变化时可以加上第三个变量。
图像函数的值对应于图像点的亮度。
函数值也可以表示其他物理量如温度、压力分布、离观察者的距离等。
亮度(brightness)集成了不同的光学量,将亮度作为一个基本量使我们得以避免对图像的成像过程进行描述,这个过程是非常复杂的。
人类眼睛视网膜或者TV摄像传感器上的图像本身是二维的(2D)。
我们将这种记录了明亮度信息的 2D图像称为亮度图像(intensity image)。
我们周围的真实世界本身是三维的(3D)。
2D亮度图像是3D场景的透视投影(perspective projection),这一过程由针孔摄像机拍摄的图像来表达,参见图2.1。
在图中,图像平面被相对于xy平面反折过来了,以避免使用具有负坐标的镜像图像;x,y,z的值是世界坐标系中3D 场景点P的坐标,f是镜头的焦距。
第2讲 数字图像基础

位图图像格式-位图信息头
BMP位图信息头数据用于说明位图的尺寸等 信息。
typedef struct tagBITMAPINFOHEADER{ DWORD biSize; // 本结构所占用字节数 LONG biWidth; // 位图的宽度,以像素为单位 LONG biHeight; // 位图的高度,以像素为单位 WORD biPlanes; // 目标设备的级别,必须为1 WORD biBitCount// 每个像素所需的位数,必须是1(双色), // 4(16色),8(256色)或24(真彩色)之一 DWORD biCompression; // 位图压缩类型,必须是 0(不压缩), // 1(BI_RLE8压缩类型)或2(BI_RLE4压缩类型)之 一 DWORD biSizeImage; // 位图的大小,以字节为单位 LONG biXPelsPerMeter; // 位图水平分辨率,每米像素数 LONG biYPelsPerMeter; // 位图垂直分辨率,每米像素数 DWORD biClrUsed;// 位图实际使用的颜色表中的颜色数 DWORD biClrImportant;// 位图显示过程中重要的颜色数 } BITMAPINFOHEADER;
2数字图像表示1紧凑矩阵表示??????????????????111101111101101000nmfmfmfnfffnfffyxf????2传统矩阵表示形式??????????????????111101111101101000nmmmnnaaaaaaaaaa????3空间分辨率和灰度分辨率1空间分辨率
★上述模型,是同态滤波的基础。
同态滤波实例(消除缓慢变化的光照不均匀性)
第2讲 数字图像基础
图像产生 图像感知与获取 图像取样与量化 像素间的一些基本关系 VC图像处理基础 Matlab图像处理基础
第2章数字图像表示及其处理

采样行
行间隔
2019/12/21
采样间隔
图像的采样
31
采样和量化
2019/12/21
32
采样和量化
2019/12/21
33
2.3.1 采样
对一幅图像采样时,若每行(即横向)像素 为M个,每列(即纵向)像素为N个,则图像 大小为M×N个像素,从而f(x,y)构成一个 M×N实数矩阵:
如,绿色物体反射波长主要在500~570范围的 光,而吸收其他波长的大部分能量。
没有颜色的光叫消色光或单色光。属性是它的强 度或大小。用灰度级表示,范围从黑到灰,最后 到白。
2019/12/21
16
2.1人眼成像过程
人眼对彩色的感知由3个量来度量:
亮度:光作用于人眼的明亮程度 色调:人眼的彩色感觉,反映颜色的种类 饱和度:彩色的深浅或纯洁程度
差)。 其他:黑白/彩色,价格,操作性能等。
2019/12/21
29
采样和量化的依据
阵列中传感器的数量决定了在两个方向上 的取样限制。
Nyquist_Shannon采样定理: 当对一个最高频率fmax的带限信号进行采 样时,采样频率SF必须大于fmax的两倍 以上才能确保从采样值完全重构原来的信 号。2fmax称为Nyquist采样率。
2. 晶状体:瞳孔后是一扁球形弹性透明体, 其曲率可调节,以改变焦距, 使不同距离 的图在视网膜上成像 ↔ 照相机透镜作用
2019/12/21
5
人眼的机理与照相机类似
3. 视细胞:视网膜上集中了大量视细胞,分为两类:
1) 锥状细胞:明视细胞,在强光下检测亮度和颜色;
每个眼内约有6,000,000~7,000,000个锥细胞。它们对颜色很敏 感。
数字图像的性质与特点 PPT

0
255
• 正态分布:由于图像数据具有随机性, 在图像像元数目相当大而地物类型差异 不很悬殊的情况下,概率密度分布应接 近于正态分布:
F(x) = 1 exp[ - (x-u)2 ]
2 σ
2 σ2
σ (标准差) u (均值)
– 直方图的偏斜:表现为均值与众数或中值的 明显的不一致。
• 当 Mod < Med < X 直方图左偏;
Mod Med
• 当 Mod > Med > X 直方图右偏。
Med Mod
• 直方图中有多个峰值,是由于图像中包 含着波谱特征差别显著的两个或更多的 类别。
统计量与 直方图
纹理
2.2.3 多波段数据的统计特征
对多波段数据,可以把每个像元在不同波 段的亮度值作为一个向量,计算和统计这 些亮度值向量在多维空间中概率密度分布 或多维直方图。
–图像信息损失低:由于遥感数字图像是用二进制表示 的,因此在获取、传输和分发过程中,不会因长期存 储而损失信息,也不会因多次传输和复制而产生图像 失真。而模拟方法表现的遥感图像会因多次复制而使 图像质量下降。
–抽象性强:尽管不同类别的遥感数字图像,有不同的 视觉效果,对应不同的物理背景,但由于它们都采用 数字形式表示,便于建立分析模型,进行计算机解译 和运用遥感图像专家系统。
图像数据的记录是按条带顺序自左至右排列的, 而不是按波段顺序排列的。
• 组成:按条带顺序排列的四个图像文件 + 后面附 加的专用注记带(SIAT)文件。
– 每个图像文件(条带)的开头有一个标志(ID)记录 块(包括卫星编号摄像时间、图像条带、单位记录长 度、图像注记带号等)和一个注记(AN)记录块(相 当于陆地卫星相片下方的文字注记内容)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章的目的是介绍一些与图象和视觉有关的基本概念和基 本定义,为以后几章的学习讨论打好基础。 我们将它们大致分成三组。 • 与人的视觉有关的一些知识,包括人眼成象的结构和机 理及眼睛适应亮度变化和区分不同亮度的能力[1]。 • 有关图象获取的一些内容,包括图象采集时的几何投影 变换关系,以及图象空间采样和灰度量化的概念。 • 有关数字图象的一些基础,包括各象素间的联系(例如 连通性和距离测量),以及图象间的简单运算和空间坐标 变换。
z
z1 Z1 ∞
x
f (x2,y2)
每个像元的亮度是灰度图像能够提供的唯一信息, 而图像的亮度取决许多因素, 如: • 目标表面的反射特性(表面材料、结构、纹理); • 光照特性; • 表面与光源的方向 因此计算机理解图像的亮度是另一个难题[1]。 通常图像处理是处理静态的单色图像f(x,y).然后扩展到 动态图像序列或彩色、多光谱图像。
人们习惯上还是把像元当作一个点。
2.2.2 量化
每个像元至少具有两个属性:位置和灰度。
表示像元亮暗程度的整数称为灰度。 用A/D转换器对图像的每个像元的亮度值进行数 字化[1],叫做图像的量化。 量化的阶数应该保证人的视觉能够发现图像的 亮暗细节。用比特(bits)数表示像元亮度。 如果像元亮度值是8 bits ,则量化的阶数k=28。 量化阶数不够,会产生伪轮廓效应。
0 0
图像空间原点的移动: 频率 空间原点的移动:
对称性[1]: F(-u,-v) = F*(u,v) 对偶性[2]: {(f ﹡ h)(x,y)} = F(u,v)H(u,v) {f (x,y) h (x,y)} =( F ﹡H)(u,v)
以上的结论对离散函数叶适用,只要将积分换成求和。 富立叶变换在图像处理中,如边缘检测、图像恢复、 相关跟踪、图像压缩等许多领域有成熟和广泛的应 用。
n-1
0,0 D4 D8
n-1
x
D4
y
像元的邻接
4-邻接:彼此距离D4 =1
8-邻接:彼此距离D8 =1 区域(region) 若干相邻的像元组成区域 路径(path) 背景(background)
P Q 简单连续
洞(hole)
复杂连续
图像中某些区域被称为目标 决定哪些取于是目标的过程叫图像分割(segmentation) 象素间的连通性在建立图象中目标的边界和确定区 域的元素时是一个重要的概念。它可以进一步分成 连接和连通,连接是连通的一种特例。要确定2个象 素是否连接需要在某种意义上确定它们是否接触 (例如它们是否为4-近邻象素)以及它们的灰度值 是否满足某个特定的相似准则(例如它们灰度值相 等)。举例来说,在一幅只有灰度0和1的二值图中, 2个4-近邻象素只有在它们具有相同的灰度值时才可 以说是连接的。
卷积(Convolution) 2维函数 f 和 h 的积卷 g 记为: f ﹡ h ,定义为: G(x,y)
= =
∞ ∫∫ f(a,b)h(x-a,y-b)dadb -∞ -∞ ∞ ∞ ∫∫ f(x-a,y-b)h(a, b)dadb -∞ -∞
∞
= (f ﹡ h)(x,y) = (h ﹡ f )(x,y)
信号:是某些具有物理意义的变量的函数。它可 以是1维、2维、3维或者更高维。 标量:完全由其大小决定而没有方向的数量,如质量。 用标量足以描述一幅单色图像。 向量:完全由其大小和方向确定的量,如速度。彩色图 像需要用向量表示。 函数:一种数学实体,其值按规定方式依赖于一个或多个 自变量的值。 连续函数(连续的定义域和取值范围}。 离散函数(离散的定义域)。 数字函数(定义域和取值范围都是离散的)。
图像f(x,y)可以作为一个确定的函数或随即过程对待, 用到的数学工具有: 线性系统理论、积分变换、离散数学、随机过程理论等[2]。
2.1.2 Dirac 分布和卷积 δ(x,y)是对连续图像函数应用线性数学理论的理想 冲击函数。定义如下: ∞ ∞ ∫∫ δ(x,y)dxdy = 1; δ(x,y) = 0, 当x,y≠0 -∞ -∞ 1
Fs(u,v) =
1 Δx Δy ∑
∞
∞
j=-∞ k=-∞
∑F(u-j/Δx,v-k /Δy)
F(u,v)
采样图像的富立叶变换是 图像富立叶变换周期性重 复的叠加。
如果频谱发生重叠,图像就会产生失真,叫做混叠。 Shannon 采样定理: 如果采样间隔选择: Δx<1/2U, Δy<1/2V
F(u,v)
f(n-1,1)
n-1
y
距离的度量 欧氏距离 De[(i,j),(h,k)]=[(i-h)2+ ( j-k)2]1/2 城区距离(city block) D4[(i,j),(h,k)]=|i-h|+ | j-k| 棋盘距离(chessboard) D8[(i,j),(h,k)]=max{|i-h|, | j-k|}
亮度适应和区分
人眼的亮度适应范围量级 同时亮度适应区间不大, 一般 < 64级
1010
图像: 一个物体或事物的形象化描述[1] 图像是物体集合的一个子集
图像 数学图像 连续函数 离散函数 画片 图片 光学图像 物体 不可见的 物理图像 可见图像 照片
物理图像:物质或能量的实际分布。 光、 温度、 压力、 高度、 人口密度 数字图像: 一个被量化的采样数值的二维矩阵[1] 数字图像处理:对一个物体的数字表示施加 一系列的操作,以便得到所期望的结果。 图像 图像
卷积是一个非常有用的线性、平移不变的运算。
对数字图像处理,卷积表示一个线性滤波[1],经常用在 局部图像的预处理和图像恢复。
2.1.3 付立叶变换(Fourier transform) 图像是在一个平面内的两个参数的函数。 研究图像的性质的方法之一是:用正交函数的线性 组合分解图像函数。 付立叶变换就是用谐波函数分解图像函数,其定义如下: ∞ ∞ ∫∫ f(x,y)e-2πi(xu+yv)dxdy F(u,v) = -∞ -∞ 对于图像处理,可以假设周期函数的富立叶变换总是 存在的[1]。富立叶反变换的定义[2]: ∞ ∞ f(x,y) =∫∫ F(u,v)e-2πi(xu+yv)dudv -∞ -∞
数字图像函数通常使用矩阵表示。 坐标是整数,取值范围是坐标平面的一个范围R [2], R={(x,y), 1≦x ≦xm , 1≦y ≦yn} 习惯采用直角坐标系,x代表水平轴,y代表垂直轴 X 列(column )
Y 行(row)
图像函数值的范围也是有限的:对黑白图像,最低值 对应黑色,最高值对应白色。在黑白之间的亮度值叫 灰度。 图像的质量与以下分辨率成正比: 空间分辨率:近似为图像平面的采样率 光谱分辨率:由图像传感器响应的光波的带宽决定 辐射分辨率:相当于分辨的灰度级数 时间分辨率:由采集图像的时间间隔给出[1]
y
N Δy
采样间隔:Δx、 Δy x = jΔx, j=1,…M y = kΔy, k=1,…N 采样矩阵f(jΔx , kΔy) 组成离散的图像
Δx M
x
在规则的栅格上的采样:
M j=1 N k=1
S(x,y) = ∑ ∑δ(x-jΔx,y-k Δy)
采样图像fs(x,y) = f (x,y) S(x,y)
2.1 基本概念
人眼与亮度视觉
晶状体 视网膜
人眼成象 人眼形状-直径为20mm的球体 晶状体 - 镜头(lens) 视网膜(retina) - 成象面 屈光能力- 聚焦控制
图2.1.2 人眼截面示意图
感光细胞
锥状细胞(适亮细胞, 有颜色感觉) - 6,000,000-7,000,000 杆状细胞(适暗细胞, 无颜色感,低照度敏感) – 75,000,000-150,000,000
实际的图像并不是线性的,因为图像的大小和
像元灰度级至多是有限的。但是在许多情况下, 图像可以近似为线性系统[1]。
2.2 图像数字化 图像数字化:图像经过采样和量化,将其变成 适当的离散数据结构。 一幅图象必须要在空间和灰度上都离散化才能被 计算机处理。空间坐标的离散化叫于空间采样, 而灰度的离散化叫做灰度量化。 采样:连续函数f(x,y)在空间上被 采样成M行、N列 的矩阵。 • 采用平面上采样点组成的离散的网格; • 采用正交函数基将图像函数展开,如富立叶变换, 展开系数就代表了该数字图像。
计算机视觉:(computer Vision ) 能够理解自然景物,为机器人提供视觉功能 数字图像的运算(operation) 全局运算:对整幅图像进行相同的处理 点运算:输出图像每个像素的灰度值只依赖于 输入图像对应点的灰度值。 局部运算:输出图像每个像素的灰度值是由输 入图像对应像素为中心的相邻的多 个像素的灰度值计算出来的。
频谱的混叠就可以避免。
v
V U
u
在图像处理中的物理意义:采样间隔应该小于图像 中最小的感兴趣的细节的一半。
像元:从图像处理的观点,不能再分的单元。 一个无限小的采样点,相当于数字图像的一个 像元。全部像元覆盖整个图像。
实际的像元具有有限的大小, 因为采样函数不 是δ函数,而是很窄的有限幅度的脉冲。
2.1.4 图像作为线性系统 线性系统是这样一种操作L:将两个(或更多)的输 入函数按下面的规律映射到一个输出函数。 L{af1+bf2} = a L{f1} + b L{f2} 一幅图像f可以表示为由δ函数代表的点扩散函数的 线性组合。 假设输入图像为f(x,y),线性系统L对输入图像f(x,y)的 响应是g(x,y),线性系统L的对脉冲响应为h(x,y), 则,线性系统L的输出可以表示为: g(x,y) = f(x,y)﹡ h(x,y) 富立叶变换后[1]: G(u,v) = F(u,v)H(u,v)
2.1.1 图像函数 电视图像[1] :平面坐标(x,y)、时间t、其他变量(λ) 的连续函数,f(x,y,t, λ )。 函数值与成像点的亮度[2]相对应。