第10章图像表示与描述PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第10章 图像表示与描述
10.1 概述
将一幅图像分割成不同区域后,使用更适合于 计算机进一步处理的形式,对得到的被分割的像素 集进行表示和描述。因此,图像表示与描述是图像 识别和理解中的重要工作。
图像的表示包括两种:基于外部特性的边界表 示和基于内部特性的区域表示。图像的表示完成了 将数据转换成可用于计算机处理的形式的目的。
存在的问题:得到的近似图形的顶点不总是与原 来边界的拐点一致,因为新的线段只有超过误差 门限才开始。
拆分技术:将一条线段不断地分割为两部分,直 到满足定好的某一标准。
例如,某标准定为:从边界线到某一直线的的最 大垂直距离不超过预定门限,而这条直线要求连 接此边界线的两个端点。如果这个条件满足,则 距离此直线的最远点成为一个顶点,这样,将初 始的线段再分为两条子线段。
图11.7即为使用欧氏距离骨架
距离的定义。
中轴变换特点:
MAT是一种很直接的细化方法,但是需要计 算区域内部每一点其边界点的距离,所以计算量 很大。 改进的骨架求取算法包括基于形态学的方法。
10.3边界描述
边界表示关注的是图像中区域的形状特征,常 用的方法有链码、边界分段、多边形近似标记图 等;区域表示关注的是图像中区域的的灰度、颜 色、纹理等特征,常用的方法有四叉树、骨架等。
图像的表示完成后,要选择适当的图像描述 方式。一般,图像的描述采用二维描述,它也分 边界描述和区域描述两大类。常用的描述方法有 边界描述、区域描述和形态学描述。
10.2 图像表示
10.2.1链码
链码用于表示由顺次连接的具有指定长度和方 向的直线段组成的边界线。典型的表示方法是根据 链的斜率不同,有4链码或8链码。每一段的方向是 用数字编号方法进行编码。
4链码:在链码的四个方向上 移动,以数字集合{i|i=0,1,2,3} 编码来表示与x轴的夹角为 90°×i。
10.2.3多边形近似
多边形的边可用线性关系表示。对一条闭合曲 线,当多边形的边数等于边界上的点数时,这种 近似是准确的,此时,每对相邻点定义多边形的 一条边。
最小周长多边形法:
以周长最小的多边形来近似表示边界,即将边 界看成是介于多边形内外界限之间有弹性的线,当 它在内外界限的限制之下收缩紧绷的时候,即可得 到最小周长边界(如图p271-图10.8)。
10.2.4 标记图
标记图是一种用一维函数表达二维边界的方法, 以达到降低表达难度的目的。它可以用各种方法生 成。最简单的方法是把从重心到边界的距离作为角 度的函数来标记。
距离-角度法:
r
A
θ
35372
A
424 4 2 4
特点: 该方法不受边界平移
的影响,但是当边界旋转 或发生尺度变换时,标记 将会发生改变。可以用 归一化方法进行解决。
11
二进制数表示
0
000
1
001
2
010
3
011
4
100
5
101
6
110
7
111
方法:
在目标边界上任意选取某个起始点,从该点 坐标开始,将水平方向坐标和垂直方向坐标分成 等间隔的网格,然后对每个网格中的线段用一个 接近的方向码来表示,最后,按照逆时针(或顺 时针)方向沿着边界将这些方向码连接起来,即 得到链码。
存在的问题: ➢得到的链码有时太长; ➢噪声或边界线段的缺陷都会在边界上产生干扰。
解决办法: 选择更大间隔的网格对边界进行重新取样,达
到减少边界点、降低噪声干扰的敏感度的目的。
起始点的选择:
边界的链码依赖起始点。由于链码的起始点 任意选择,对同一边界如果选用不同的起始点, 常常会得到不同的链码。
起始点归一化: 将链码看作一个循环序列,依次取各个边界作 为起始点,从得到的所有链码中选取构成自然数 值最小的码作为归一化结果,该最小码值的点即 为归一化后的起始点。
起始点
1110303232 起始点
0303232111
链码旋转归一化:
链码具有平移不变性,即当边界平移时,其 链码不发生改变。但是,当边界旋转时,则链码 会改变。
1
2
0
3
1 1 1 0 3 0 3 2 3 2 (1)
4链码
0 3 0 3 2 3 2 1 1 1(0)
旋转归一化方法: 用链码的一阶差分码作为新的码。一阶差分即
为相邻两个方向之间的变化值。
链码:1 1 1 0 3 0 3 2 3 2 (1) 一阶差分码: 0 0 3 3 1 3 3 1 3 0
链码:0 3 0 3 2 3 2 1 1 1(0) 一阶差分码: 0 0 3 3 1 3 3 1 3 0
例10.3:p271
10.2.5 骨架
把平面区域抽取为图形的一种区域表示方法,通
过使用一种细化(也称骨架)算法得到区域。一个
区域的骨架可以用中轴转换方法(MAT)定义。
设区域R的边界为B, 对R中的每一点p,找到它 在B上最接近的邻点。如果 p有多于一个这样的邻点, 就认为p属于R的中轴(骨 架)。“最接近”取决于
算法实现:
假设用一系列彼此 连接的小单元将一条 边界包住,这条由单 元组成的环带使包围 圈像一条有弹性的线, 当它收紧时即可得到 最小周长边界。
多边形近似问题常用聚合技术和拆分技术来实现。
聚合技术:基于平均误差或其它准则的技术。
例如沿边界线寻找聚合点,直到适合聚合点 的最小平方误差线超过一个预先设置的门限,这 时就将点聚合,即获得一条直线。然后继续沿着 边界线寻找,直到误差再次超过门限聚合新的点。 这个过程不断重复,最后线段的交点构成多边形 的顶点。
可见,当原边界旋转为新边界时,其码链改变, 但它们的一阶差分码不改变。
10.2.2 边界分段 边界分段:将边界分成若干段,Biblioteka Baidu别对每一段进
行表示。 特点:降低边界复杂程度,简化表示过程特别适
用于边界具有多个凹点的情况。
方法:构造包含边界最小凸集的凸包,跟踪区域 凸包的边界,记录凸包边界进出区域的转变点, 实现对边界的分割。
1
2
0
3
4链码
类似地,6链码的相邻方向之间的夹角为60°, 8链码的相邻方向之间的夹角为45°。
2 3
1 0
45
6链码
2
3
1
4
0
567
8链码
方向
0° 90° 180° 270°
方向
0° 45 90° 135° 180° 225° 270 335
十进制数表示 二进制数表示
0
00
1
01
2
10
3
十进制数表示
10.1 概述
将一幅图像分割成不同区域后,使用更适合于 计算机进一步处理的形式,对得到的被分割的像素 集进行表示和描述。因此,图像表示与描述是图像 识别和理解中的重要工作。
图像的表示包括两种:基于外部特性的边界表 示和基于内部特性的区域表示。图像的表示完成了 将数据转换成可用于计算机处理的形式的目的。
存在的问题:得到的近似图形的顶点不总是与原 来边界的拐点一致,因为新的线段只有超过误差 门限才开始。
拆分技术:将一条线段不断地分割为两部分,直 到满足定好的某一标准。
例如,某标准定为:从边界线到某一直线的的最 大垂直距离不超过预定门限,而这条直线要求连 接此边界线的两个端点。如果这个条件满足,则 距离此直线的最远点成为一个顶点,这样,将初 始的线段再分为两条子线段。
图11.7即为使用欧氏距离骨架
距离的定义。
中轴变换特点:
MAT是一种很直接的细化方法,但是需要计 算区域内部每一点其边界点的距离,所以计算量 很大。 改进的骨架求取算法包括基于形态学的方法。
10.3边界描述
边界表示关注的是图像中区域的形状特征,常 用的方法有链码、边界分段、多边形近似标记图 等;区域表示关注的是图像中区域的的灰度、颜 色、纹理等特征,常用的方法有四叉树、骨架等。
图像的表示完成后,要选择适当的图像描述 方式。一般,图像的描述采用二维描述,它也分 边界描述和区域描述两大类。常用的描述方法有 边界描述、区域描述和形态学描述。
10.2 图像表示
10.2.1链码
链码用于表示由顺次连接的具有指定长度和方 向的直线段组成的边界线。典型的表示方法是根据 链的斜率不同,有4链码或8链码。每一段的方向是 用数字编号方法进行编码。
4链码:在链码的四个方向上 移动,以数字集合{i|i=0,1,2,3} 编码来表示与x轴的夹角为 90°×i。
10.2.3多边形近似
多边形的边可用线性关系表示。对一条闭合曲 线,当多边形的边数等于边界上的点数时,这种 近似是准确的,此时,每对相邻点定义多边形的 一条边。
最小周长多边形法:
以周长最小的多边形来近似表示边界,即将边 界看成是介于多边形内外界限之间有弹性的线,当 它在内外界限的限制之下收缩紧绷的时候,即可得 到最小周长边界(如图p271-图10.8)。
10.2.4 标记图
标记图是一种用一维函数表达二维边界的方法, 以达到降低表达难度的目的。它可以用各种方法生 成。最简单的方法是把从重心到边界的距离作为角 度的函数来标记。
距离-角度法:
r
A
θ
35372
A
424 4 2 4
特点: 该方法不受边界平移
的影响,但是当边界旋转 或发生尺度变换时,标记 将会发生改变。可以用 归一化方法进行解决。
11
二进制数表示
0
000
1
001
2
010
3
011
4
100
5
101
6
110
7
111
方法:
在目标边界上任意选取某个起始点,从该点 坐标开始,将水平方向坐标和垂直方向坐标分成 等间隔的网格,然后对每个网格中的线段用一个 接近的方向码来表示,最后,按照逆时针(或顺 时针)方向沿着边界将这些方向码连接起来,即 得到链码。
存在的问题: ➢得到的链码有时太长; ➢噪声或边界线段的缺陷都会在边界上产生干扰。
解决办法: 选择更大间隔的网格对边界进行重新取样,达
到减少边界点、降低噪声干扰的敏感度的目的。
起始点的选择:
边界的链码依赖起始点。由于链码的起始点 任意选择,对同一边界如果选用不同的起始点, 常常会得到不同的链码。
起始点归一化: 将链码看作一个循环序列,依次取各个边界作 为起始点,从得到的所有链码中选取构成自然数 值最小的码作为归一化结果,该最小码值的点即 为归一化后的起始点。
起始点
1110303232 起始点
0303232111
链码旋转归一化:
链码具有平移不变性,即当边界平移时,其 链码不发生改变。但是,当边界旋转时,则链码 会改变。
1
2
0
3
1 1 1 0 3 0 3 2 3 2 (1)
4链码
0 3 0 3 2 3 2 1 1 1(0)
旋转归一化方法: 用链码的一阶差分码作为新的码。一阶差分即
为相邻两个方向之间的变化值。
链码:1 1 1 0 3 0 3 2 3 2 (1) 一阶差分码: 0 0 3 3 1 3 3 1 3 0
链码:0 3 0 3 2 3 2 1 1 1(0) 一阶差分码: 0 0 3 3 1 3 3 1 3 0
例10.3:p271
10.2.5 骨架
把平面区域抽取为图形的一种区域表示方法,通
过使用一种细化(也称骨架)算法得到区域。一个
区域的骨架可以用中轴转换方法(MAT)定义。
设区域R的边界为B, 对R中的每一点p,找到它 在B上最接近的邻点。如果 p有多于一个这样的邻点, 就认为p属于R的中轴(骨 架)。“最接近”取决于
算法实现:
假设用一系列彼此 连接的小单元将一条 边界包住,这条由单 元组成的环带使包围 圈像一条有弹性的线, 当它收紧时即可得到 最小周长边界。
多边形近似问题常用聚合技术和拆分技术来实现。
聚合技术:基于平均误差或其它准则的技术。
例如沿边界线寻找聚合点,直到适合聚合点 的最小平方误差线超过一个预先设置的门限,这 时就将点聚合,即获得一条直线。然后继续沿着 边界线寻找,直到误差再次超过门限聚合新的点。 这个过程不断重复,最后线段的交点构成多边形 的顶点。
可见,当原边界旋转为新边界时,其码链改变, 但它们的一阶差分码不改变。
10.2.2 边界分段 边界分段:将边界分成若干段,Biblioteka Baidu别对每一段进
行表示。 特点:降低边界复杂程度,简化表示过程特别适
用于边界具有多个凹点的情况。
方法:构造包含边界最小凸集的凸包,跟踪区域 凸包的边界,记录凸包边界进出区域的转变点, 实现对边界的分割。
1
2
0
3
4链码
类似地,6链码的相邻方向之间的夹角为60°, 8链码的相邻方向之间的夹角为45°。
2 3
1 0
45
6链码
2
3
1
4
0
567
8链码
方向
0° 90° 180° 270°
方向
0° 45 90° 135° 180° 225° 270 335
十进制数表示 二进制数表示
0
00
1
01
2
10
3
十进制数表示