计算机图形学理论及应用技术 第10章 图像量化和图像模式识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第10章 图像量化和图像模式识别
10.1 基于图像模式识别的图像预处理操作
10.1.1 点阵图形的图像变换处理 10.1.2 图像解析方法
10.2 图像模式识别系统及技术
10.2.1 基于统计方法的图像模式识别
10.2.2 基于图像语言及结构方法的图像模式识别
10.3 基于模糊神经网络技术的图像识别方法
(2) 确定图像模式的句法结构及规则 基于模糊数学的图像模式识别,其图像句法是以模糊逻辑为 基础的,它可以采用下列3种模糊方法表达: 1) 利用对图像基元模糊逻辑运算表达式表达图像模式特征, 即通过模糊逻辑的并、交、差及与、或、非等运算,表示图 像模式中应包括哪些图像基元及其构成要求。 2) 利用图像模式的模糊隶属度表达图像模式特征,即对每 个已知的图像模式要构造一个服从于它的隶属度函数,图像 应属于隶属度最高的图像模式。 3) 利用图像基元的隶属度及加权系数表示图像模式,即图 像模式的隶属度函数通过对所有图像基元的隶属度的和式 (或积式)表示,并用图像基元加权系数表示各个图像基元对 模式影响的紧密程度。 (3) 确定图像的分类方法
(2) 消除图像噪音和干扰 1) 图像颜色平衡处理,消除由于图像曝光问题产生的图像过亮、 过暗或其他颜色偏差. 2) 图像模糊处理,消除图中的杂点和斑纹. 3) 图像锐化处理,使图形轮廓更加清晰;四是进行图像色彩调 整,消除其他景物和不需要的图形。 (3) 突出图像特征 为了便于图像分析和识别,要进行以突出图像特征为目标的图 像预处理,该项工作主要包括以下5项内容: 1) 进行图像二值化或多值化处理,以突出图形和背景,忽略图 像中的次要内容。 2) 进行图像边缘追踪处理,明确图形边缘。 3) 视图矫正处理,修正由于透视投影引起的图形视图偏差。 4) 图形轮廓的扩张、收缩处理,使图形轮廓特征符合要求。 5) 进行图形轮廓细化处理,消除由于图形轮廓粗细不匀造成的 图形分析和识别困难。 (4) 将图像数据及相关的辅助信息放入图像库中
10.3.2 模糊神经网络技术在图像识别中的应用 1. 神经元和神经网络
2. 模糊逻辑和神经网络的不相容和互补性
模糊逻辑和神经网络理论在概念上是不相容的,它们有以 下3点相互矛盾之处。
(1) 它们对系统的ቤተ መጻሕፍቲ ባይዱ述方法不同
(2) 它们的工作方法不同 (3) 它们的工作机制不同 3. 两种模糊神经网络
10.3.3 模糊图像模式识别处理的关键问题 利用模糊神经网络进行图像模式识别需要解决的以下关键问 题。 1. 确定图像模式的模糊数学模型 (1) 确定图像基元及模糊特征 确定图像基元工作包括3方面的内容: 1) 定义系统的图像基元集合,即站在要处理的所有图像的全 局角度进行分析,定义需要的全部图像基元. 2) 要对系统的图像基元统一命名或编码. 3) 确定图像基元的图像模糊特征,并通过隶属度函数、阈值 和特征权重等要素描述图像基元、图像基元的识别规则和图 像基元之间的相互关联。
确定图像预处理的主要任务是:
1) 确定图像预处理的内容,即确定要进行哪些图像预处理操 作及处理的先后次序,例如对于手写字体的识别要执行图像 二值化和图形瘦化处理。
2) 确定实现图像预处理的方法,即确定图像预处理的每个步 骤的算法及过程。
3) 确定预处理达到的目的,即确定图像预处理中的控制参数。
(3) 确定图像基元的抽取方法及图像特征量化处理
1 0 1 ; H 1 0 1 1 0 1
1 1 0 . H 1 0 1 0 1 1
若模板中心像素值为 0 ,且周围相邻像素中至少有一个像素值为 1,则改变中心像素值为1;否则仍保持原中心像素值。 (2) 图像收缩(即使图像的轮廓向内收缩)模板的设计方法 若模板中心像素值为1,且周围相邻像素中至少有一个像素值为 0, 则改变中心像素值为0;否则仍保持原中心像素值。 (3) 二值图像(即像素值只有0和1的单色图像)抽取轮廓模板的设计 方法 若中心像素为 0 ,则仍保持其 0 值;若中心像素为 1 ,且其余相邻 像素值均为1,则改变中心像素值为 0;除此之外,全部将中心像 素值设为1。
2. 图像预处理和特征抽取方法 图像预处理指图像模式识别前的处理工作,它包括: (1) 图像输入 图像输入工作需要根据处理的实际情况,确定以下4方面的内容: 1) 确定原始图片资料的获得方法。 2) 确定图像的输入方法。 3) 确定图像的像素分辨率和色彩分辨率等规格。 4) 确定图像数据压缩方式或图形文件格式。 (2) 图像预处理操作 图像预处理的基本目标是: 1) 消除图像噪声或斑纹等图像干扰,避免由于图像干扰产生的图 像处理错误和麻烦。 2) 消除与处理目标无关的图像因素,以突出处理的主要因素。 3) 矫正图像误差,对原始图片进行改造,提高图像处理的正确性。 4) 突出处理目的图像特征,使图像特征更清晰、更容易提取。
10.3.1 模糊图像模式识别原理 10.3.2 模糊神经网络技术在图像识别中的应用 10.3.3 模糊图像模式识别处理的关键问题
习题10
计算机图形学理论及应用技术
机械工业出版社同名教材 配套电子教案
10.1 基于图像模式识别的图像预处理操作
10.1.1 点阵图形的图像变换处理
1. 图像的非几何变换 (1) 色谱曲线的线性变换 1) 改变图像色谱范围 2) 其曲线平滑分布
3. 图像文法 4. 弗里曼(Freeman)链码 5. 乔姆斯基(Chomsky)形式语言
10.3 基于模糊神经网络技术的图像识别方法
10.3.1 模糊图像模式识别原理 1. 模糊集合和隶属函数 2. 模糊运算规则 3. 模糊语气算子 4. 模糊语句 模糊语句作为模糊推理,有下列几种语句。 1) 赋值语句 如“x =‘大’”、“x =‘很大’”等。 2) 模糊操作语句 如“将x稍增加”。 3) 模糊条件语句 如“若x小,则y大”。
3. 确定神经网络的结构和学习方法
习题10
10.1 试述色谱曲线的线性变换的方法。
10.2 什么是图像二值化?它有什么作用。
10.3 什么是图像模式识别?图像模式识别的主要问题是什 么。
10.4 试述基于统计方法的图像模式识别方法和主要过程。
10.5 在图像模式识别前,图像预处理的基本内容是什么? 10.6 试述基于图像语言及结构方法的图像模式识别的方法 和识别过程。 10.7 试述三层神经网络结构和基本功能。
(2) 图像二值化
(3) 图像模糊处理 2. 图像的傅立叶变换 3. 图像锐化处理 4. 非线性逻辑模板设计方法
非线性逻辑模板可按其处理要求设计,下面为 3 个常见处 理的模板设计方法。 (1) 图像膨胀(即使图像的轮廓向外扩张)模板的设计方法
1 1 1 ; H 0 0 0 1 1 1
图10-2 轮廓追踪模板
10.2 图像模式识别系统及技术
10.2.1 基于统计方法的图像模式识别 1.图像输入和图像的预处理
图像输入有三种方式:一是绘图输入,即使用计算机作图软 件作图实现;二是扫描输入,即通过扫描仪对图片扫描 实现;三是照相输入,即通过数字照相机摄像实现。
图像数据压缩有可逆型或不可逆型两种,主要压缩方法是步 长法、差值法、块符号法。在输入图像时,要根据图像 的保真要求、数据压缩要求和使用环境要求等,合理的 选择图像文件格式。 输入到计算机中的图像要经过图像预处理才便于分析和识别。 图像预处理有4个内容: (1) 统一图像格式
2. 轮廓线追踪 轮廓线追踪是沿着图形的等色区域的边界搜索,并记录下搜索 到的边缘线点列。轮廓线追踪的方法是: 第一步:沿图像扫描方向搜索,把最先检出的图形像素( 色彩 值为1)作为边缘起点P1。 第二步:以P1为中心,按图10-2模板所示的序号①, …, ⑧顺序 检查相邻像素,把先遇到的图形像素(色彩为1) 设为P2。 如果①, …, ⑧全部为背景像素(色彩为0),则说明该点为孤立点, 中止追踪。 第三步:将P2为中心继续第二步。如果结果为上次边缘点(Pn-1) 则结束。如果结果为起始边缘点(P1 ),再搜索为P2,则说明其 边缘线闭合,中止追踪。 ⑦ ⑥ ⑤ ⑧ P1 ④ ① ② ③
2. 图像特征提取和特征选择
3. 图像模式识别
为了说明模式识别的基本方法,我们介绍两种典型的手 写字符识别方法:模式匹配法和特征抽取法。
(1) 手写字符的模板匹配法
2) 定义标准字的特征量 3) 计算输入字符模式与标准模式的相似距离 4) 判定字符所属的标准模式
10.2.2 基于图像语言及结构方法的图像模式识别 1. 图像语言及结构的图像识别方法 图像语言及结构的图像识别方法的优点有两个: 1) 按结构描述图像,可以忽略与处理目标无关的内容,其抗 干扰能力强. 2) 简单的图像语句还可以作为一个图像基元进一步组合成复 杂的图像语句,积累多次可以表达非常复杂的图像,同时 它也可以和统计法结合起来,用统计法进行图像基元的模 式识别,用图像语言法解决复杂的图像识别和分析问题。 2. 图像基元 图像基元是图像处理中需要分解的最小图像单元。图像基元 具有3个基本性质: (1) 图像基元具有基本性和完整性 (2) 图像基元具有可选择性和可描述性 (3) 图像基元具有可识别性和可抽取性
10.8 模糊神经网络进行图像模式识别时,需要解决的关键 问题是什么?
10.1.2 图像解析方法 1. 图像细线化方法 下面的处理分两步进行。 第一步:将模板沿扫描方向移动,当下列6个条件全部满足时, 中心像素置为1,否则不作任何改动。 条件1:A(0 ) = 1 (中心像素为图形部分)。 i=n2条件2:∑ B (2 i 1)≥1, n2={1, 2, 3,4 } (中心像素为背景与图 形的边界)。 i=n3条件3:∑ | A(2 i 1) | ≥2, n3={1, 2, 3, 4, 5, 6, 7, 8 } (不消除 端点)。 i=n3条件4:∑ C ( i )≥1 (保留孤立点)。 条件5:F = 1 (保留连接点)。 条件6:A( i )≠1 或C ( i ) = 1, i n3 (线宽为2 的部分只削去一 侧)。 处理第二步:在第一步结束后,将已赋成1的像素全部置为0, 再次执行第一步。如此反复直至第一步的结束不再有 1的出现。
10.1 基于图像模式识别的图像预处理操作
10.1.1 点阵图形的图像变换处理 10.1.2 图像解析方法
10.2 图像模式识别系统及技术
10.2.1 基于统计方法的图像模式识别
10.2.2 基于图像语言及结构方法的图像模式识别
10.3 基于模糊神经网络技术的图像识别方法
(2) 确定图像模式的句法结构及规则 基于模糊数学的图像模式识别,其图像句法是以模糊逻辑为 基础的,它可以采用下列3种模糊方法表达: 1) 利用对图像基元模糊逻辑运算表达式表达图像模式特征, 即通过模糊逻辑的并、交、差及与、或、非等运算,表示图 像模式中应包括哪些图像基元及其构成要求。 2) 利用图像模式的模糊隶属度表达图像模式特征,即对每 个已知的图像模式要构造一个服从于它的隶属度函数,图像 应属于隶属度最高的图像模式。 3) 利用图像基元的隶属度及加权系数表示图像模式,即图 像模式的隶属度函数通过对所有图像基元的隶属度的和式 (或积式)表示,并用图像基元加权系数表示各个图像基元对 模式影响的紧密程度。 (3) 确定图像的分类方法
(2) 消除图像噪音和干扰 1) 图像颜色平衡处理,消除由于图像曝光问题产生的图像过亮、 过暗或其他颜色偏差. 2) 图像模糊处理,消除图中的杂点和斑纹. 3) 图像锐化处理,使图形轮廓更加清晰;四是进行图像色彩调 整,消除其他景物和不需要的图形。 (3) 突出图像特征 为了便于图像分析和识别,要进行以突出图像特征为目标的图 像预处理,该项工作主要包括以下5项内容: 1) 进行图像二值化或多值化处理,以突出图形和背景,忽略图 像中的次要内容。 2) 进行图像边缘追踪处理,明确图形边缘。 3) 视图矫正处理,修正由于透视投影引起的图形视图偏差。 4) 图形轮廓的扩张、收缩处理,使图形轮廓特征符合要求。 5) 进行图形轮廓细化处理,消除由于图形轮廓粗细不匀造成的 图形分析和识别困难。 (4) 将图像数据及相关的辅助信息放入图像库中
10.3.2 模糊神经网络技术在图像识别中的应用 1. 神经元和神经网络
2. 模糊逻辑和神经网络的不相容和互补性
模糊逻辑和神经网络理论在概念上是不相容的,它们有以 下3点相互矛盾之处。
(1) 它们对系统的ቤተ መጻሕፍቲ ባይዱ述方法不同
(2) 它们的工作方法不同 (3) 它们的工作机制不同 3. 两种模糊神经网络
10.3.3 模糊图像模式识别处理的关键问题 利用模糊神经网络进行图像模式识别需要解决的以下关键问 题。 1. 确定图像模式的模糊数学模型 (1) 确定图像基元及模糊特征 确定图像基元工作包括3方面的内容: 1) 定义系统的图像基元集合,即站在要处理的所有图像的全 局角度进行分析,定义需要的全部图像基元. 2) 要对系统的图像基元统一命名或编码. 3) 确定图像基元的图像模糊特征,并通过隶属度函数、阈值 和特征权重等要素描述图像基元、图像基元的识别规则和图 像基元之间的相互关联。
确定图像预处理的主要任务是:
1) 确定图像预处理的内容,即确定要进行哪些图像预处理操 作及处理的先后次序,例如对于手写字体的识别要执行图像 二值化和图形瘦化处理。
2) 确定实现图像预处理的方法,即确定图像预处理的每个步 骤的算法及过程。
3) 确定预处理达到的目的,即确定图像预处理中的控制参数。
(3) 确定图像基元的抽取方法及图像特征量化处理
1 0 1 ; H 1 0 1 1 0 1
1 1 0 . H 1 0 1 0 1 1
若模板中心像素值为 0 ,且周围相邻像素中至少有一个像素值为 1,则改变中心像素值为1;否则仍保持原中心像素值。 (2) 图像收缩(即使图像的轮廓向内收缩)模板的设计方法 若模板中心像素值为1,且周围相邻像素中至少有一个像素值为 0, 则改变中心像素值为0;否则仍保持原中心像素值。 (3) 二值图像(即像素值只有0和1的单色图像)抽取轮廓模板的设计 方法 若中心像素为 0 ,则仍保持其 0 值;若中心像素为 1 ,且其余相邻 像素值均为1,则改变中心像素值为 0;除此之外,全部将中心像 素值设为1。
2. 图像预处理和特征抽取方法 图像预处理指图像模式识别前的处理工作,它包括: (1) 图像输入 图像输入工作需要根据处理的实际情况,确定以下4方面的内容: 1) 确定原始图片资料的获得方法。 2) 确定图像的输入方法。 3) 确定图像的像素分辨率和色彩分辨率等规格。 4) 确定图像数据压缩方式或图形文件格式。 (2) 图像预处理操作 图像预处理的基本目标是: 1) 消除图像噪声或斑纹等图像干扰,避免由于图像干扰产生的图 像处理错误和麻烦。 2) 消除与处理目标无关的图像因素,以突出处理的主要因素。 3) 矫正图像误差,对原始图片进行改造,提高图像处理的正确性。 4) 突出处理目的图像特征,使图像特征更清晰、更容易提取。
10.3.1 模糊图像模式识别原理 10.3.2 模糊神经网络技术在图像识别中的应用 10.3.3 模糊图像模式识别处理的关键问题
习题10
计算机图形学理论及应用技术
机械工业出版社同名教材 配套电子教案
10.1 基于图像模式识别的图像预处理操作
10.1.1 点阵图形的图像变换处理
1. 图像的非几何变换 (1) 色谱曲线的线性变换 1) 改变图像色谱范围 2) 其曲线平滑分布
3. 图像文法 4. 弗里曼(Freeman)链码 5. 乔姆斯基(Chomsky)形式语言
10.3 基于模糊神经网络技术的图像识别方法
10.3.1 模糊图像模式识别原理 1. 模糊集合和隶属函数 2. 模糊运算规则 3. 模糊语气算子 4. 模糊语句 模糊语句作为模糊推理,有下列几种语句。 1) 赋值语句 如“x =‘大’”、“x =‘很大’”等。 2) 模糊操作语句 如“将x稍增加”。 3) 模糊条件语句 如“若x小,则y大”。
3. 确定神经网络的结构和学习方法
习题10
10.1 试述色谱曲线的线性变换的方法。
10.2 什么是图像二值化?它有什么作用。
10.3 什么是图像模式识别?图像模式识别的主要问题是什 么。
10.4 试述基于统计方法的图像模式识别方法和主要过程。
10.5 在图像模式识别前,图像预处理的基本内容是什么? 10.6 试述基于图像语言及结构方法的图像模式识别的方法 和识别过程。 10.7 试述三层神经网络结构和基本功能。
(2) 图像二值化
(3) 图像模糊处理 2. 图像的傅立叶变换 3. 图像锐化处理 4. 非线性逻辑模板设计方法
非线性逻辑模板可按其处理要求设计,下面为 3 个常见处 理的模板设计方法。 (1) 图像膨胀(即使图像的轮廓向外扩张)模板的设计方法
1 1 1 ; H 0 0 0 1 1 1
图10-2 轮廓追踪模板
10.2 图像模式识别系统及技术
10.2.1 基于统计方法的图像模式识别 1.图像输入和图像的预处理
图像输入有三种方式:一是绘图输入,即使用计算机作图软 件作图实现;二是扫描输入,即通过扫描仪对图片扫描 实现;三是照相输入,即通过数字照相机摄像实现。
图像数据压缩有可逆型或不可逆型两种,主要压缩方法是步 长法、差值法、块符号法。在输入图像时,要根据图像 的保真要求、数据压缩要求和使用环境要求等,合理的 选择图像文件格式。 输入到计算机中的图像要经过图像预处理才便于分析和识别。 图像预处理有4个内容: (1) 统一图像格式
2. 轮廓线追踪 轮廓线追踪是沿着图形的等色区域的边界搜索,并记录下搜索 到的边缘线点列。轮廓线追踪的方法是: 第一步:沿图像扫描方向搜索,把最先检出的图形像素( 色彩 值为1)作为边缘起点P1。 第二步:以P1为中心,按图10-2模板所示的序号①, …, ⑧顺序 检查相邻像素,把先遇到的图形像素(色彩为1) 设为P2。 如果①, …, ⑧全部为背景像素(色彩为0),则说明该点为孤立点, 中止追踪。 第三步:将P2为中心继续第二步。如果结果为上次边缘点(Pn-1) 则结束。如果结果为起始边缘点(P1 ),再搜索为P2,则说明其 边缘线闭合,中止追踪。 ⑦ ⑥ ⑤ ⑧ P1 ④ ① ② ③
2. 图像特征提取和特征选择
3. 图像模式识别
为了说明模式识别的基本方法,我们介绍两种典型的手 写字符识别方法:模式匹配法和特征抽取法。
(1) 手写字符的模板匹配法
2) 定义标准字的特征量 3) 计算输入字符模式与标准模式的相似距离 4) 判定字符所属的标准模式
10.2.2 基于图像语言及结构方法的图像模式识别 1. 图像语言及结构的图像识别方法 图像语言及结构的图像识别方法的优点有两个: 1) 按结构描述图像,可以忽略与处理目标无关的内容,其抗 干扰能力强. 2) 简单的图像语句还可以作为一个图像基元进一步组合成复 杂的图像语句,积累多次可以表达非常复杂的图像,同时 它也可以和统计法结合起来,用统计法进行图像基元的模 式识别,用图像语言法解决复杂的图像识别和分析问题。 2. 图像基元 图像基元是图像处理中需要分解的最小图像单元。图像基元 具有3个基本性质: (1) 图像基元具有基本性和完整性 (2) 图像基元具有可选择性和可描述性 (3) 图像基元具有可识别性和可抽取性
10.8 模糊神经网络进行图像模式识别时,需要解决的关键 问题是什么?
10.1.2 图像解析方法 1. 图像细线化方法 下面的处理分两步进行。 第一步:将模板沿扫描方向移动,当下列6个条件全部满足时, 中心像素置为1,否则不作任何改动。 条件1:A(0 ) = 1 (中心像素为图形部分)。 i=n2条件2:∑ B (2 i 1)≥1, n2={1, 2, 3,4 } (中心像素为背景与图 形的边界)。 i=n3条件3:∑ | A(2 i 1) | ≥2, n3={1, 2, 3, 4, 5, 6, 7, 8 } (不消除 端点)。 i=n3条件4:∑ C ( i )≥1 (保留孤立点)。 条件5:F = 1 (保留连接点)。 条件6:A( i )≠1 或C ( i ) = 1, i n3 (线宽为2 的部分只削去一 侧)。 处理第二步:在第一步结束后,将已赋成1的像素全部置为0, 再次执行第一步。如此反复直至第一步的结束不再有 1的出现。