数字图像处理1 数字图像基础-1,2,3
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• • • • • •
2.1 人类视觉模型 2.2 图像的表示 2.3 图像数字化 2.4 图像灰度直方图 2.5 图像处理算法的形式 2.6 图像的数据结构与特征
一、人类视觉系统
中央凹
Ⅰ.在视网膜上成倒立的像, 感觉正立是神经系统的校正 Ⅱ.瞳孔2—8mm,可变光阑,调节入射光强弱 Ⅲ.睫状肌改变晶状体曲率---调焦
(2)量化分层的约束来自图像源的噪声,即最小 的量化分层应远大于噪声,否则太细的分层将被 噪声所淹没而无法体现分层的效果。也就是说噪 声大的图像,分层太细是没有意义的。反之要求 很细分层的图像才强调极小的噪声,如某些医用 图像系统把减少噪声作为主要设计指标,是因为 其分层数要求2000层以上,而一般电视图像的分 层用200多级已能满足要求。
视见函数
单位时间内光通过某面元的各种波长的总电磁辐射,称为 通过该面元的辐射通量。 人眼对光的亮暗感觉
光的辐射通量 光的波长
都有关
一般的视觉敏感范围:390—760nm 注意:光照充足对550nm最敏感;光照弱对505nm敏感 可解释 why?在夜色朦胧之夜,我们总感到周围世界笼罩了一层蓝绿的色彩。
CMYK模型 密度的概念:单位面积里入射光与反射光之比的对数 D = lg ( I / Ir) C ,M ,Y三个密度值表示一个颜色 网点的概念及成色原理: 网格上的最小墨点 色料三基色只能叠加合成出8种色块 网点面积变化和视觉分辨率实现颜色阶调 网点密度值取值0-100
HSI模型 HSI模型--量化颜色三属性 --H色相:取值0-360 --S饱和度:取值0-1或0-100 --I亮度:取值0-1或0-100
0 150 200 I 120 50 180 250 220 100
3.彩色图像
彩色图像是指每个像素的信息由RGB三 原色构成的图像,其中RGB是由不同的灰度级 来描述的。
255 240 240 R 255 0 80 0 255 0
假设波长是550nm和 的两种光引起相同的明暗感觉,它 们分别需要辐射能通量 550 和 瓦特,
550 ——对该波长 的视见函数 V ( ) 表示人眼对各种波长光的相对敏感程度。
注意:红外光和紫外光无论具有多大功率也不能引起人眼视觉 的反应,其视见函数值为零,所以成为不可见光。
均匀量化是简单地在灰度范围内等间隔量化。
非均匀量化是对像素出现频度少的部分量化间隔 取大,而对频度大的量化间隔取小。
3、量化噪声:
用有限个离散灰度值表示无穷多个连续灰度 的量必然引起误差,称为量化噪声。 (1)量化分层越多,则量化误差越小;而分层越 多则编码进入计算机所需比特数越多,相应地影 响运算速度及处理过程。
若:x方向采样率 us≥2uc,y方向采样率 vs≥2vc满 足奈奎斯特率。 Δ x, Δ y --采样间隔,则采样点数: M=X/Δ x ,N=Y/Δ y X,Y – 影像尺寸 采样孔径的形状和大小与采样方式有关,一般用圆 形和方形。
300 dpi
50 dpi
96PPI
8PPI
二、量化
采样后的图像只是在空间上被离散化,成为 样本的阵列,每个取样样本称为像素,用Pel来表 示。但是由于原 f(x,y) 是连续图像,因此每个 Pel 还是可能取值为无穷多个值的量。为了进行计算 机处理,必须把无穷多个离散值约简为有限个离 散值,即量化,这样才便于赋予每一个离散值互 异的编码以进入计算机。
256个层次的图像
64个层次的图像 16个层次的图像
对比度 对比度:是指一幅图象中灰度反差的大小 对比度=最大亮度/最小亮度
清晰度 与清晰度相关的主要因素 --亮度 --对比度 --主题内容的大小 --细微层次 --颜色饱和度
降低亮度
缩小尺寸
降低对比度
减少细微层次
降低饱和度
四、 图像的颜色 --RGB ,CMYK, HIS ,伪彩色,CIE RGB模型 杨赫姆霍尔兹视觉三基色假说: C=R+G+B 视网膜锥体细胞感红,感绿,感蓝色素 RGB分别取值0-1或0-255
1、量化 是将各个像素所含的明暗信息离散化后,用数字 来表示称为图像的量化,一般的量化值用整数来表 示。 充分考虑到人眼的识别能力之后,目前非特殊用 途的图像均为8bit量化,即用0〜255描述“黑〜 白”。 在3bit以下的量化,会出现伪轮廓现象。
2、量化技术 量化可分为均匀量化和非均匀量化。
四、马赫带(Mach band)
实际亮度 视觉亮度
已知从每一竖条宽度内反射出来的光强是均匀的, 相邻竖条之间的强度差是常数,然而,我们看起来每
一竖条内右边要比左边稍黑一些,即在亮度变化部位
附近的暗区和亮区中分别存在一条更黑和更亮的条带, 这就是所谓的“Mach带”,这种现象称为马赫效应。
马赫带上的亮度过冲是眼睛对不同空间频率产生
2、采样定理:(仙农采样定理) 满足采样间隔为 Δ x≤1/2uc,Δ y≤1/2vc (uc,vc—信号最高频率) 对有限带宽函数采样,则可从其采样中完整地恢 复原信号。 从上式可看出,只要采样率us,vs满足 us≥2uc, vs≥2vc 则必然可以很好地恢复原图象信号。这个采样率 的下限称奈奎斯特率 (Nyquist rate . ) ,低于 这个奈奎斯特率的采样,在重建原信号时会有 混叠干扰。
0 160 80 G 255 255 160 0 255 0
80 160 0 B 0 0 240 255 255 255
三、图像的质量 ---层次,对比度,清晰度 层次: 灰度级:表示象素明暗程度的整 数量称为灰度级 层次--表示灰度级的数量 图像数据的实际层次越多视觉效果就越好
连续图像经采样、分层、量化、编码等步 骤变成数字图像才能进入计算机。
一、采样 1、采样: 是将在空间上连续的图像转换成离散 的采样点(即像素)集的操作。由于图像是二维 分布的信息,所以采样是在x轴和y轴两个方向上 进行。 模拟图象若在 x方向采 M个点,y方向采N个点, 就可得到M * N个点的数字化图象的形式。采样 是图象进入计算机的第一个处理过程。
1、 我们知道,要构成一幅数字图像需要采样和量化, 如果采样和量化都充分细的话,就可以得到好的画 质。但是数据量也就变得很大。问当数据量设为一 个定值时,在什么时候将采样优先考虑?什么情况 下将量化优先考虑?为什么? 2、在图像量化中,有非均匀量化技术。当灰度级的 级低的时候用它比较有效。但是为什么在灰度级级 数高时几乎不用?
杆状细胞(弱光)和锥状细胞(强光) 视网膜中心—黄斑(0.25mm最敏感区) 视神经出口区域无感受器—盲点,由于眼球 不断转动,盲点几乎无影响
简化眼模型
视角—人眼对物体的张角
正立物所对应的视角为正 倒立物体对应的视角为负
所有助视仪器(放大镜、望远镜、显微镜)均为增大视角而设计 最小分辨角—能够分辨的最靠近的两点对人眼所张的角 最小分辨角从几何上看由视网膜上锥细胞的排列精细程度决 定,实际上对物体的分辨角的限制是光的衍射效应对最小分 辨角的限制。
d 25 0.1mm
视网膜上可分辨像的最小距离为:
d 22 6 103 mm
• ★人眼的水平视角为160度,垂直视角为80度。 • 试验表明,观看图像的最佳距离应当是画面高度的4倍至5 倍,这时的总视角约为15度,在这种情况下,可以保证人 眼不转动就能看到完整的画面。这个距离,既可以避免因 过近观看时眼球需要不停地转动而引起眼疲劳,又可以避 免过远观看时对图像辨别能力的降低,以及防止画面以外 的景像进入视野中。 • 在生物界中,人眼可算最高级了。只要看上一眼,就能确 定物体的形状、大小和距离。可是,人眼也有不足之处。 比如,能观看的角度,也就是视角,太小;上下左右能看 到的范围,也就是视场,很小。如果以看得见的标准来计 算,人眼的视角约为150度;但是按看得清楚的标准,视 角就只有5度左右了。正因为这样,人为了扩大视野范围, 就得骨碌碌地转动眼球,左右顾盼,有时还得转动一下头 部。
★人眼的分辨极限 对于人眼的源自文库辨极限也必须满足瑞利判据: 1.22 / D 人眼的瞳孔直径D为2mm~9mm,取中间值D为5mm, 可见光中心波长也就是人眼最敏感的波长为555nm 。 一般取眼睛的极限分辨角为1′ 。 当物体对人眼的视角小于1′时,人对物体的细节就不能分 辨,看起来就是一点,这时物体在视网膜上的像刚好是一个感 光细胞的大小,人眼的明视距离为25cm,视网膜至瞳孔的距 离为22mm时,因此人眼可分辨明视距处的最小线距离为:
二、视觉影像
物体 电脉冲
视觉成像 神经纤维
光敏细胞 视神经中枢
物体的影像
三、视觉分辨率 人眼在某一距离能区分相邻两点的能力,用最 小视角θ 表示。 θ =d/l d:刚好能分辨的两点间最小距离 l:眼睛到两点连线的垂距 一般取眼睛的极限分辨角为1′ θ 为1’的眼睛,其视力为1.0;2’ 的视力对 应于0.5,这与医学上是相对应的。
第j 列的像素的灰度值
1、 二值图像(黑白图像) 是指图像的每个像素只能是黑或者白,没 有中间的过渡,故又称为二值图像。二值图 像的像素值为0、1。
1 0 0 I 0 0 1 1 1 0
2.灰度图像
灰度图像是指每个像素的信息由一个量化的 灰度级来描述的图像,没有彩色信息。
三维连续亮度函数 二维连续亮度函数
B(X,Y,Z)
f(x,y)
二、数字图像 三维连续亮度函数
二维离散亮度函数 f(x,y)
B(X,Y,Z)
1、x y说明图像像素的坐标 2 、函数值f 代表了在点(x,y)处像素的亮度值
二维矩阵A[m,n] 1、 m , n说明图像的宽和高 2、 矩阵元素a(i j)的值表示图像在第i 行
不同视觉响应的结果。视觉系统对高频和空间低频的 敏感性较差,而对空间中频则有较高的敏感性,因而 在亮度突变处产生亮度过冲现象,这种过冲对人眼所 见的景物有增强其轮廓的作用。
五 、形状感觉与错觉
一、连续图像 物方空间某点(X,Y,Z)对应其像方空间某点 (x,y),f(x,y)为物点经过成像系统的响应值.
2.1 人类视觉模型 2.2 图像的表示 2.3 图像数字化 2.4 图像灰度直方图 2.5 图像处理算法的形式 2.6 图像的数据结构与特征
一、人类视觉系统
中央凹
Ⅰ.在视网膜上成倒立的像, 感觉正立是神经系统的校正 Ⅱ.瞳孔2—8mm,可变光阑,调节入射光强弱 Ⅲ.睫状肌改变晶状体曲率---调焦
(2)量化分层的约束来自图像源的噪声,即最小 的量化分层应远大于噪声,否则太细的分层将被 噪声所淹没而无法体现分层的效果。也就是说噪 声大的图像,分层太细是没有意义的。反之要求 很细分层的图像才强调极小的噪声,如某些医用 图像系统把减少噪声作为主要设计指标,是因为 其分层数要求2000层以上,而一般电视图像的分 层用200多级已能满足要求。
视见函数
单位时间内光通过某面元的各种波长的总电磁辐射,称为 通过该面元的辐射通量。 人眼对光的亮暗感觉
光的辐射通量 光的波长
都有关
一般的视觉敏感范围:390—760nm 注意:光照充足对550nm最敏感;光照弱对505nm敏感 可解释 why?在夜色朦胧之夜,我们总感到周围世界笼罩了一层蓝绿的色彩。
CMYK模型 密度的概念:单位面积里入射光与反射光之比的对数 D = lg ( I / Ir) C ,M ,Y三个密度值表示一个颜色 网点的概念及成色原理: 网格上的最小墨点 色料三基色只能叠加合成出8种色块 网点面积变化和视觉分辨率实现颜色阶调 网点密度值取值0-100
HSI模型 HSI模型--量化颜色三属性 --H色相:取值0-360 --S饱和度:取值0-1或0-100 --I亮度:取值0-1或0-100
0 150 200 I 120 50 180 250 220 100
3.彩色图像
彩色图像是指每个像素的信息由RGB三 原色构成的图像,其中RGB是由不同的灰度级 来描述的。
255 240 240 R 255 0 80 0 255 0
假设波长是550nm和 的两种光引起相同的明暗感觉,它 们分别需要辐射能通量 550 和 瓦特,
550 ——对该波长 的视见函数 V ( ) 表示人眼对各种波长光的相对敏感程度。
注意:红外光和紫外光无论具有多大功率也不能引起人眼视觉 的反应,其视见函数值为零,所以成为不可见光。
均匀量化是简单地在灰度范围内等间隔量化。
非均匀量化是对像素出现频度少的部分量化间隔 取大,而对频度大的量化间隔取小。
3、量化噪声:
用有限个离散灰度值表示无穷多个连续灰度 的量必然引起误差,称为量化噪声。 (1)量化分层越多,则量化误差越小;而分层越 多则编码进入计算机所需比特数越多,相应地影 响运算速度及处理过程。
若:x方向采样率 us≥2uc,y方向采样率 vs≥2vc满 足奈奎斯特率。 Δ x, Δ y --采样间隔,则采样点数: M=X/Δ x ,N=Y/Δ y X,Y – 影像尺寸 采样孔径的形状和大小与采样方式有关,一般用圆 形和方形。
300 dpi
50 dpi
96PPI
8PPI
二、量化
采样后的图像只是在空间上被离散化,成为 样本的阵列,每个取样样本称为像素,用Pel来表 示。但是由于原 f(x,y) 是连续图像,因此每个 Pel 还是可能取值为无穷多个值的量。为了进行计算 机处理,必须把无穷多个离散值约简为有限个离 散值,即量化,这样才便于赋予每一个离散值互 异的编码以进入计算机。
256个层次的图像
64个层次的图像 16个层次的图像
对比度 对比度:是指一幅图象中灰度反差的大小 对比度=最大亮度/最小亮度
清晰度 与清晰度相关的主要因素 --亮度 --对比度 --主题内容的大小 --细微层次 --颜色饱和度
降低亮度
缩小尺寸
降低对比度
减少细微层次
降低饱和度
四、 图像的颜色 --RGB ,CMYK, HIS ,伪彩色,CIE RGB模型 杨赫姆霍尔兹视觉三基色假说: C=R+G+B 视网膜锥体细胞感红,感绿,感蓝色素 RGB分别取值0-1或0-255
1、量化 是将各个像素所含的明暗信息离散化后,用数字 来表示称为图像的量化,一般的量化值用整数来表 示。 充分考虑到人眼的识别能力之后,目前非特殊用 途的图像均为8bit量化,即用0〜255描述“黑〜 白”。 在3bit以下的量化,会出现伪轮廓现象。
2、量化技术 量化可分为均匀量化和非均匀量化。
四、马赫带(Mach band)
实际亮度 视觉亮度
已知从每一竖条宽度内反射出来的光强是均匀的, 相邻竖条之间的强度差是常数,然而,我们看起来每
一竖条内右边要比左边稍黑一些,即在亮度变化部位
附近的暗区和亮区中分别存在一条更黑和更亮的条带, 这就是所谓的“Mach带”,这种现象称为马赫效应。
马赫带上的亮度过冲是眼睛对不同空间频率产生
2、采样定理:(仙农采样定理) 满足采样间隔为 Δ x≤1/2uc,Δ y≤1/2vc (uc,vc—信号最高频率) 对有限带宽函数采样,则可从其采样中完整地恢 复原信号。 从上式可看出,只要采样率us,vs满足 us≥2uc, vs≥2vc 则必然可以很好地恢复原图象信号。这个采样率 的下限称奈奎斯特率 (Nyquist rate . ) ,低于 这个奈奎斯特率的采样,在重建原信号时会有 混叠干扰。
0 160 80 G 255 255 160 0 255 0
80 160 0 B 0 0 240 255 255 255
三、图像的质量 ---层次,对比度,清晰度 层次: 灰度级:表示象素明暗程度的整 数量称为灰度级 层次--表示灰度级的数量 图像数据的实际层次越多视觉效果就越好
连续图像经采样、分层、量化、编码等步 骤变成数字图像才能进入计算机。
一、采样 1、采样: 是将在空间上连续的图像转换成离散 的采样点(即像素)集的操作。由于图像是二维 分布的信息,所以采样是在x轴和y轴两个方向上 进行。 模拟图象若在 x方向采 M个点,y方向采N个点, 就可得到M * N个点的数字化图象的形式。采样 是图象进入计算机的第一个处理过程。
1、 我们知道,要构成一幅数字图像需要采样和量化, 如果采样和量化都充分细的话,就可以得到好的画 质。但是数据量也就变得很大。问当数据量设为一 个定值时,在什么时候将采样优先考虑?什么情况 下将量化优先考虑?为什么? 2、在图像量化中,有非均匀量化技术。当灰度级的 级低的时候用它比较有效。但是为什么在灰度级级 数高时几乎不用?
杆状细胞(弱光)和锥状细胞(强光) 视网膜中心—黄斑(0.25mm最敏感区) 视神经出口区域无感受器—盲点,由于眼球 不断转动,盲点几乎无影响
简化眼模型
视角—人眼对物体的张角
正立物所对应的视角为正 倒立物体对应的视角为负
所有助视仪器(放大镜、望远镜、显微镜)均为增大视角而设计 最小分辨角—能够分辨的最靠近的两点对人眼所张的角 最小分辨角从几何上看由视网膜上锥细胞的排列精细程度决 定,实际上对物体的分辨角的限制是光的衍射效应对最小分 辨角的限制。
d 25 0.1mm
视网膜上可分辨像的最小距离为:
d 22 6 103 mm
• ★人眼的水平视角为160度,垂直视角为80度。 • 试验表明,观看图像的最佳距离应当是画面高度的4倍至5 倍,这时的总视角约为15度,在这种情况下,可以保证人 眼不转动就能看到完整的画面。这个距离,既可以避免因 过近观看时眼球需要不停地转动而引起眼疲劳,又可以避 免过远观看时对图像辨别能力的降低,以及防止画面以外 的景像进入视野中。 • 在生物界中,人眼可算最高级了。只要看上一眼,就能确 定物体的形状、大小和距离。可是,人眼也有不足之处。 比如,能观看的角度,也就是视角,太小;上下左右能看 到的范围,也就是视场,很小。如果以看得见的标准来计 算,人眼的视角约为150度;但是按看得清楚的标准,视 角就只有5度左右了。正因为这样,人为了扩大视野范围, 就得骨碌碌地转动眼球,左右顾盼,有时还得转动一下头 部。
★人眼的分辨极限 对于人眼的源自文库辨极限也必须满足瑞利判据: 1.22 / D 人眼的瞳孔直径D为2mm~9mm,取中间值D为5mm, 可见光中心波长也就是人眼最敏感的波长为555nm 。 一般取眼睛的极限分辨角为1′ 。 当物体对人眼的视角小于1′时,人对物体的细节就不能分 辨,看起来就是一点,这时物体在视网膜上的像刚好是一个感 光细胞的大小,人眼的明视距离为25cm,视网膜至瞳孔的距 离为22mm时,因此人眼可分辨明视距处的最小线距离为:
二、视觉影像
物体 电脉冲
视觉成像 神经纤维
光敏细胞 视神经中枢
物体的影像
三、视觉分辨率 人眼在某一距离能区分相邻两点的能力,用最 小视角θ 表示。 θ =d/l d:刚好能分辨的两点间最小距离 l:眼睛到两点连线的垂距 一般取眼睛的极限分辨角为1′ θ 为1’的眼睛,其视力为1.0;2’ 的视力对 应于0.5,这与医学上是相对应的。
第j 列的像素的灰度值
1、 二值图像(黑白图像) 是指图像的每个像素只能是黑或者白,没 有中间的过渡,故又称为二值图像。二值图 像的像素值为0、1。
1 0 0 I 0 0 1 1 1 0
2.灰度图像
灰度图像是指每个像素的信息由一个量化的 灰度级来描述的图像,没有彩色信息。
三维连续亮度函数 二维连续亮度函数
B(X,Y,Z)
f(x,y)
二、数字图像 三维连续亮度函数
二维离散亮度函数 f(x,y)
B(X,Y,Z)
1、x y说明图像像素的坐标 2 、函数值f 代表了在点(x,y)处像素的亮度值
二维矩阵A[m,n] 1、 m , n说明图像的宽和高 2、 矩阵元素a(i j)的值表示图像在第i 行
不同视觉响应的结果。视觉系统对高频和空间低频的 敏感性较差,而对空间中频则有较高的敏感性,因而 在亮度突变处产生亮度过冲现象,这种过冲对人眼所 见的景物有增强其轮廓的作用。
五 、形状感觉与错觉
一、连续图像 物方空间某点(X,Y,Z)对应其像方空间某点 (x,y),f(x,y)为物点经过成像系统的响应值.