第二章图像和视觉基础
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
桂林理工大信科院
图像数字化过程
桂林理工大信科院
c
y
wk.baidu.com
f(5,4) f(x,y)
X,单位:m a. CCD传感器上的连续图像
r,单位:pixel
b.
采样量化后的数字图像
桂林理工大信科院
桂林理工大信科院
1.1.1.3 图象的表达
图象的矩阵和矢量表示
一幅2-D图像可以用2-D数组f(x,y)表示,实际中将2-D图像 写成2-D的M×N的矩阵
数字图像: f,x,y 的值是整数 图像数字化
空间坐标离散化(采样):
连续图像 离散图像
数字图像
连续坐标(x, y) i = 0,1,2,,M-1;
离散坐标(i , j ) j = 0,1,2,,N-1
灰度值离散化(量化):对每个样本值进行二进制编码
一般取:行(或列)的样点数:N 2 n ; 灰度量化级数:K 2 m
桂林理工大信科院
事实1:马赫带效应-边缘效应
人眼过高估计了不同亮度区域边界的值
桂林理工大信科院
imagesc(1:8) colormap(gray)
桂林理工大信科院
事实2:同时对比度
人眼感觉到的亮度还和对比度有关
桂林理工大信科院
桂林理工大信科院
2.2.1 图象和数字图象
图象:
用各种观测系统以不同形式和手段观测客观世界 而获得的,可以直接或间接作用于人眼并进而产生视知 觉的实体 粗略地说,图像是二维或三维景物在视网膜上的影 像,人类采用计算机技术接受并加工这种视觉信息的理 论、方法和应用称为计算机图像处理和分析 图象(广义/抽象) 图像(狭义/具体)
桂林理工大信科院
1.MATLAB图像文件格式
MATLAB的图像文件格式有两种:一种是矢量形式另一种是光 栅形式 矢量文件像程序,通过执行命令画出图案,适合图形数据文件; 光栅文件,描述图像的像素信息,比较适合色彩、阴影或形状 变化复杂的图像。 MATLAB支持以下几种图像文件格式: PCX格式,分为1、4、8、16、24位图像数据,文件内容包括: 文件头(128字节)、图像数据、扩展颜色映射表数据。 BMP(独立位图文件格式),分为1、4、8、24位非压缩图像 数据,8位RUNLENGTH ENCODED图像,文件内容包括:文 件头(数据结构)、位图信息数据块(信息头和一个颜色表) 和图像数据。 GIF(图形交换各式)文件结构较复杂,可以存放多幅图像 (对实现网页动画有利),图像数据均为压缩过。 HDF(层次数据格式) JPEG格式(联合图像专家组),是一种对静止灰度和彩色图 像的压缩标准,在数码相机中采用。 TIFF格式(标志图像文件格式)是一种独立于操作系统和文件 系统的格式,很便于在软件之间进行图像数据的转换。分为1、 4、8、24位非压缩图像数据, 1、4、8、24位packbit压缩图像, 桂林理工大信科院
桂林理工大信科院
MATLAB程序: RGB3=double(RGB2(1:6,1:6,1)) RGB=imread('flowers.tif'); RGB4=double(RGB2(1:6,1:6,2)) subplot(1,2,1),imshow(RGB),axis('im RGB5=double(RGB2(1:6,1:6,3)) age'); RGB3 = RGB2=imcrop(RGB,[64,64,64,64]); 146 146 144 148 154 150 subplot(1,2,2),imshow(RGB2),axis('i 143 143 145 143 137 140 mage') 144 138 135 131 124 120
桂林理工大信科院
数据类型转换
s64=double(s8)/256%uint8转换为双精度型64位,值域为 0~1 s64 = 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734
第二章图像和视觉基础
人类的视觉感知系统
数字图像基础知识
2.1视觉基础
桂林理工大信科院
1.人眼成像结构图
15m 17 mm 100m 2.55mm
桂林理工大信科院
2.亮度视觉
人眼的结构机理使人能感觉到亮度和颜色
人眼成像的结构
Ciliary body睫状体眼睛血管膜 的增厚部分,在脉络膜和虹膜之 间 Ciliary muscle睫状肌
桂林理工大信科院
举例:从一幅颜色模型为HSV真彩色图片取出6X6的数据其为浮点类 型的数据,转换为uint8类型
桂林理工大信科院
数据类型转换
s1=s([1:6],[1:6],1) s1 = 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 s8=uint8(round(s1*256))%双精度转换为无符号整型,值域为[0,255] s8 = 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70
桂林理工大信科院
1.1.1.3 图象的表达
图象表示
2-D数组 f (x, y)
x , y:2-D空间XY中坐标点的位置
f:代表图象在(x, y)的性质F 的数值 f,x,y 的值可以是任意实数
性质F : 可对应不同物理量(例如灰度、
红、绿、兰)
灰度图象里用灰度表示
桂林理工大信科院
连续图像: f,x,y 的值可以是任意实数
桂林理工大信科院
3.图像类型
图像类型是指图像在MATLM数据文件中的存储方式。 MATLAB支持4种图像类型,它们是: 真彩色图像-真彩色图像又称RGB图像,它是利用R、 G、B 3个分量表示一个像素的颜色,对—个尺寸为 m×n的彩色图像来说,在MATLAB中则存储为——个 m×nx3的多维数组。如果需要知道图像A中(x,y)处的像 素RGB值,则使用A(x,y,1:3)来提取。 索引色图像 灰度图像-存储灰度图像只需要一个数据矩阵,矩阵 的每个元素表示对应位置像素的灰度值,灰度图像的数 据类型可以是doubIe类型,这时值域为[0,1],也可以 uint8类刑,值域是[0,255] 二值图像
强光 极限
夜间 夜视 阈值 白天
光强度与主观亮度的对应关系
桂林理工大信科院
刻画亮度分辨率的基本实验
I 50
I
韦伯率,亮度区分能力
桂林理工大信科院
韦伯率是灰度的函数
可知人眼区分亮度的能力在低照明的情况下较差,在背景亮度增加后得到改 善;但不与照明的情况成一简单的函数关系-基于下面两个事实
桂林理工大信科院
矩阵
f11 f F 21 fM1
f12 f 22
fM 2
f1N f2N f MN
F f1 f2 fN
矢量
fi f1i
f2i f Mi
T
i 1, 2, , N
桂林理工大信科院
1.1.1.3 图象的表达
图象和信息:
人类从外界(客观世界)获得的信息约有75%来自 视觉系统
桂林理工大信科院
1.1.1 图象和数字图象
图象类型 {广义}
图片,动画,绘图,文字/档,...
{狭义}
单幅 序列图象,... 静止 运动图象(视频),... 2-D 3-D,彩色,立体对, 多光谱,多视场图象,... 灰度 深度,纹理图象,...
桂林理工大信科院
转换图像类型 1、rgb2gray函数用于将一幅真彩色图像转换 成灰度图像,如果输入的是真彩色图像,则 图像可以是uint8或double类型,输出图像I与 输入图像类型相同。如果输入的是调色板, 则输入和输出的都是double类型。 其语法格式为: I=rgb2gray(RGB)%输入RGB为图像数据矩阵 newmap=rgb2gray(map) %输入map为真彩色
Retina 视网膜
Lens 晶状体 Fovea 中央凹 Sclera 巩膜 choroid 脉络膜
桂林理工大信科院
视网膜上的锥细胞 产生适亮视觉 (photopic vision); 柱细胞产生适暗视 觉(scotopic vision) Cones-锥细胞
Rods-柱细胞
桂林理工大信科院
亮度视觉范围很宽: 1010数量级
桂林理工大信科院
例:图像文件读取和显示函数的编制
函数文件,文件的开头第一行为function的文件。 1.建立函数文件 在编辑/调试窗口键入:
桂林理工大信科院
2.保存函数文件 保存的函数文件名应与用户定义的函数名一 致,此例中定义的函数名为“RGBimread”, 则文件保存为“RGBimread.m”
离散点集
灰度区域
二维数组
桂林理工大信科院
屏幕显示坐标系统
迪卡尔坐标系统 灰度区域
桂林理工大信科院
桂林理工大信科院
MATLAB图像及其操作 开发图像处理的应用系统不可能由一个人完 成,而是一个群体协作的工程。设计方法通 常采用结构化或面向对象方法。如果只就图 象处理的某个算法而言,就是一项软件工程 设计中的模块设计工作,用MATLAB工具做 这样的算法编程工作是一件轻而易举的事情。 任何一个图像处理算法都可以是一个自定义 的函数,MATLAB提供了一个创建用户函数 的结构,并以M文件的形式存储下来,运行 M文件,就是让计算机一次完成M文件规定 的操作。
桂林理工大信科院
桂林理工大信科院
3.调用函数文件 在命令窗口输入:
图形窗口
命令窗口
桂林理工大信科院
MATLAB图像及其操作 开发图像处理的应用系统不可能由一个人完 成,而是一个群体协作的工程。设计方法通 常采用结构化或面向对象方法。如果只就图 象处理的某个算法而言,就是一项软件工程 设计中的模块设计工作,用MATLAB工具做 这样的算法编程工作是一件轻而易举的事情。 MATLAB图像文件格式 MATLAB图像类型 MATLAB图像文件的读写 MATLAB图像对象属性
图像的调色板
桂林理工大信科院
图像类型转换 2、im2bw 格式: BW=im2bw(I,level)%I代表图像的数据矩阵, level图像二值化域值
桂林理工大信科院
4.用于读写图像的函数 imread imread函数用于读入各种图像文件,其语法 格式为: A=imread(‘filename.格式’) %注意默认的文 件存放目录为x:\\matlab6.0\work,图像的格式 可选:bmp,hdf,jpg,png,tif,xwd等 imwrite imwrite函数用于输出图像格式为: imwrite(A, ‘filename.格式’)
2.图像数据类型 MATLAB中图像数据矩阵的存储方式为双精 度(double)类型即64位浮点数。而存储图像 时MATLAB有时采用无符号整型(uint8)即图 像矩阵中的每个数据占用一个字节。由于大 多数运算和函数(比如最基本的矩阵加减运算) 都不支持uint8类型,所以运算时通常要将图 像转换成 double型。 函数double将数据转换为双精度浮点类型, 调用格式为: X64=double(x8) /256
图像数字化过程
桂林理工大信科院
c
y
wk.baidu.com
f(5,4) f(x,y)
X,单位:m a. CCD传感器上的连续图像
r,单位:pixel
b.
采样量化后的数字图像
桂林理工大信科院
桂林理工大信科院
1.1.1.3 图象的表达
图象的矩阵和矢量表示
一幅2-D图像可以用2-D数组f(x,y)表示,实际中将2-D图像 写成2-D的M×N的矩阵
数字图像: f,x,y 的值是整数 图像数字化
空间坐标离散化(采样):
连续图像 离散图像
数字图像
连续坐标(x, y) i = 0,1,2,,M-1;
离散坐标(i , j ) j = 0,1,2,,N-1
灰度值离散化(量化):对每个样本值进行二进制编码
一般取:行(或列)的样点数:N 2 n ; 灰度量化级数:K 2 m
桂林理工大信科院
事实1:马赫带效应-边缘效应
人眼过高估计了不同亮度区域边界的值
桂林理工大信科院
imagesc(1:8) colormap(gray)
桂林理工大信科院
事实2:同时对比度
人眼感觉到的亮度还和对比度有关
桂林理工大信科院
桂林理工大信科院
2.2.1 图象和数字图象
图象:
用各种观测系统以不同形式和手段观测客观世界 而获得的,可以直接或间接作用于人眼并进而产生视知 觉的实体 粗略地说,图像是二维或三维景物在视网膜上的影 像,人类采用计算机技术接受并加工这种视觉信息的理 论、方法和应用称为计算机图像处理和分析 图象(广义/抽象) 图像(狭义/具体)
桂林理工大信科院
1.MATLAB图像文件格式
MATLAB的图像文件格式有两种:一种是矢量形式另一种是光 栅形式 矢量文件像程序,通过执行命令画出图案,适合图形数据文件; 光栅文件,描述图像的像素信息,比较适合色彩、阴影或形状 变化复杂的图像。 MATLAB支持以下几种图像文件格式: PCX格式,分为1、4、8、16、24位图像数据,文件内容包括: 文件头(128字节)、图像数据、扩展颜色映射表数据。 BMP(独立位图文件格式),分为1、4、8、24位非压缩图像 数据,8位RUNLENGTH ENCODED图像,文件内容包括:文 件头(数据结构)、位图信息数据块(信息头和一个颜色表) 和图像数据。 GIF(图形交换各式)文件结构较复杂,可以存放多幅图像 (对实现网页动画有利),图像数据均为压缩过。 HDF(层次数据格式) JPEG格式(联合图像专家组),是一种对静止灰度和彩色图 像的压缩标准,在数码相机中采用。 TIFF格式(标志图像文件格式)是一种独立于操作系统和文件 系统的格式,很便于在软件之间进行图像数据的转换。分为1、 4、8、24位非压缩图像数据, 1、4、8、24位packbit压缩图像, 桂林理工大信科院
桂林理工大信科院
MATLAB程序: RGB3=double(RGB2(1:6,1:6,1)) RGB=imread('flowers.tif'); RGB4=double(RGB2(1:6,1:6,2)) subplot(1,2,1),imshow(RGB),axis('im RGB5=double(RGB2(1:6,1:6,3)) age'); RGB3 = RGB2=imcrop(RGB,[64,64,64,64]); 146 146 144 148 154 150 subplot(1,2,2),imshow(RGB2),axis('i 143 143 145 143 137 140 mage') 144 138 135 131 124 120
桂林理工大信科院
数据类型转换
s64=double(s8)/256%uint8转换为双精度型64位,值域为 0~1 s64 = 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2813 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2773 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734 0.2734
第二章图像和视觉基础
人类的视觉感知系统
数字图像基础知识
2.1视觉基础
桂林理工大信科院
1.人眼成像结构图
15m 17 mm 100m 2.55mm
桂林理工大信科院
2.亮度视觉
人眼的结构机理使人能感觉到亮度和颜色
人眼成像的结构
Ciliary body睫状体眼睛血管膜 的增厚部分,在脉络膜和虹膜之 间 Ciliary muscle睫状肌
桂林理工大信科院
举例:从一幅颜色模型为HSV真彩色图片取出6X6的数据其为浮点类 型的数据,转换为uint8类型
桂林理工大信科院
数据类型转换
s1=s([1:6],[1:6],1) s1 = 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 0.2824 0.2824 0.2784 0.2784 0.2745 0.2745 s8=uint8(round(s1*256))%双精度转换为无符号整型,值域为[0,255] s8 = 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70 72 72 71 71 70 70
桂林理工大信科院
1.1.1.3 图象的表达
图象表示
2-D数组 f (x, y)
x , y:2-D空间XY中坐标点的位置
f:代表图象在(x, y)的性质F 的数值 f,x,y 的值可以是任意实数
性质F : 可对应不同物理量(例如灰度、
红、绿、兰)
灰度图象里用灰度表示
桂林理工大信科院
连续图像: f,x,y 的值可以是任意实数
桂林理工大信科院
3.图像类型
图像类型是指图像在MATLM数据文件中的存储方式。 MATLAB支持4种图像类型,它们是: 真彩色图像-真彩色图像又称RGB图像,它是利用R、 G、B 3个分量表示一个像素的颜色,对—个尺寸为 m×n的彩色图像来说,在MATLAB中则存储为——个 m×nx3的多维数组。如果需要知道图像A中(x,y)处的像 素RGB值,则使用A(x,y,1:3)来提取。 索引色图像 灰度图像-存储灰度图像只需要一个数据矩阵,矩阵 的每个元素表示对应位置像素的灰度值,灰度图像的数 据类型可以是doubIe类型,这时值域为[0,1],也可以 uint8类刑,值域是[0,255] 二值图像
强光 极限
夜间 夜视 阈值 白天
光强度与主观亮度的对应关系
桂林理工大信科院
刻画亮度分辨率的基本实验
I 50
I
韦伯率,亮度区分能力
桂林理工大信科院
韦伯率是灰度的函数
可知人眼区分亮度的能力在低照明的情况下较差,在背景亮度增加后得到改 善;但不与照明的情况成一简单的函数关系-基于下面两个事实
桂林理工大信科院
矩阵
f11 f F 21 fM1
f12 f 22
fM 2
f1N f2N f MN
F f1 f2 fN
矢量
fi f1i
f2i f Mi
T
i 1, 2, , N
桂林理工大信科院
1.1.1.3 图象的表达
图象和信息:
人类从外界(客观世界)获得的信息约有75%来自 视觉系统
桂林理工大信科院
1.1.1 图象和数字图象
图象类型 {广义}
图片,动画,绘图,文字/档,...
{狭义}
单幅 序列图象,... 静止 运动图象(视频),... 2-D 3-D,彩色,立体对, 多光谱,多视场图象,... 灰度 深度,纹理图象,...
桂林理工大信科院
转换图像类型 1、rgb2gray函数用于将一幅真彩色图像转换 成灰度图像,如果输入的是真彩色图像,则 图像可以是uint8或double类型,输出图像I与 输入图像类型相同。如果输入的是调色板, 则输入和输出的都是double类型。 其语法格式为: I=rgb2gray(RGB)%输入RGB为图像数据矩阵 newmap=rgb2gray(map) %输入map为真彩色
Retina 视网膜
Lens 晶状体 Fovea 中央凹 Sclera 巩膜 choroid 脉络膜
桂林理工大信科院
视网膜上的锥细胞 产生适亮视觉 (photopic vision); 柱细胞产生适暗视 觉(scotopic vision) Cones-锥细胞
Rods-柱细胞
桂林理工大信科院
亮度视觉范围很宽: 1010数量级
桂林理工大信科院
例:图像文件读取和显示函数的编制
函数文件,文件的开头第一行为function的文件。 1.建立函数文件 在编辑/调试窗口键入:
桂林理工大信科院
2.保存函数文件 保存的函数文件名应与用户定义的函数名一 致,此例中定义的函数名为“RGBimread”, 则文件保存为“RGBimread.m”
离散点集
灰度区域
二维数组
桂林理工大信科院
屏幕显示坐标系统
迪卡尔坐标系统 灰度区域
桂林理工大信科院
桂林理工大信科院
MATLAB图像及其操作 开发图像处理的应用系统不可能由一个人完 成,而是一个群体协作的工程。设计方法通 常采用结构化或面向对象方法。如果只就图 象处理的某个算法而言,就是一项软件工程 设计中的模块设计工作,用MATLAB工具做 这样的算法编程工作是一件轻而易举的事情。 任何一个图像处理算法都可以是一个自定义 的函数,MATLAB提供了一个创建用户函数 的结构,并以M文件的形式存储下来,运行 M文件,就是让计算机一次完成M文件规定 的操作。
桂林理工大信科院
桂林理工大信科院
3.调用函数文件 在命令窗口输入:
图形窗口
命令窗口
桂林理工大信科院
MATLAB图像及其操作 开发图像处理的应用系统不可能由一个人完 成,而是一个群体协作的工程。设计方法通 常采用结构化或面向对象方法。如果只就图 象处理的某个算法而言,就是一项软件工程 设计中的模块设计工作,用MATLAB工具做 这样的算法编程工作是一件轻而易举的事情。 MATLAB图像文件格式 MATLAB图像类型 MATLAB图像文件的读写 MATLAB图像对象属性
图像的调色板
桂林理工大信科院
图像类型转换 2、im2bw 格式: BW=im2bw(I,level)%I代表图像的数据矩阵, level图像二值化域值
桂林理工大信科院
4.用于读写图像的函数 imread imread函数用于读入各种图像文件,其语法 格式为: A=imread(‘filename.格式’) %注意默认的文 件存放目录为x:\\matlab6.0\work,图像的格式 可选:bmp,hdf,jpg,png,tif,xwd等 imwrite imwrite函数用于输出图像格式为: imwrite(A, ‘filename.格式’)
2.图像数据类型 MATLAB中图像数据矩阵的存储方式为双精 度(double)类型即64位浮点数。而存储图像 时MATLAB有时采用无符号整型(uint8)即图 像矩阵中的每个数据占用一个字节。由于大 多数运算和函数(比如最基本的矩阵加减运算) 都不支持uint8类型,所以运算时通常要将图 像转换成 double型。 函数double将数据转换为双精度浮点类型, 调用格式为: X64=double(x8) /256