第10章图像处理

合集下载

精品课件-HALCON数字图像处理-第10章 HALCON相关实例

HALCON数字图像
2、基于表面的三维匹配【例10.6】基于表面的三维匹配实例，如图所示。
（a）原图
（d）模型场景和关键点的可视化
HALCON数字图像
（b）选择表面模（板c区）域待搜索图像
（e）基于表面模板的3D匹配结果
10.5 图像拼接
图像拼接(image mosaic)技术是将一组相互间重叠
字符的识别主要包含两个部分，第一个部分：将图像中的单个字符分割出来；第二个部分：将分割出来的字符进行分类。其中字符识别主要由字符分割、特征提取、字符分类三部分组成。
HALCON数字图像
10.1 字符分割识别
【例10.1】字符识别实例如图10-1所示。关键点：（1）获取单个字符的区域region（具体依据情况使用图像增强，区域分割）（2）选取合适的字符库，使用分类器识别字符
（a）原图边缘映射图
HALCON数字图像
（b）3D模型（c）匹配结果及位姿显示图
2、基于表面的三维匹配
基于表面3D模型匹配一般由下面几步组成：（1）创建表面模型所需的3D对象模型
（2）从上面的3D对象模型创建表面模型（3）访问代表搜索数据的3D对象模型（4）使用表面模型在搜索数据中搜索对象（5）销毁匹配结果的句柄、所有的3D对象模型和表面模型
（b）
二维条形码识别及实例 1．二维条码定位及解码不同码制的二维条码具有不同的特性，彼此具有不同的寻像图形或定位图形，因此所采用的定位方法也有所不同。以Data Matrix条码为例，其定位图形则是由构成L形的两条黑实线进行定位。Data Matrix二维条码如图所示。
HALCON数字图像
HALCON数字图像
10.3 去雾算法

计算机图形图像处理Photoshop CS中文版 (10)

10.1.1 利用【色阶】命令调整曝光过度和曝光不足的照片在测光不准的情况下，很容易使所拍摄的照片出现曝光过度或曝光不足的情况，本案例介绍利用【图像】/【调整】/【色阶】命令，对曝光过度和曝光不足的照片进行修复调整。
操作步骤

具体操作步骤详见教材。
案例小结
利用【图像】/【调整】/【色阶】命令，可以调整图像各个通道的明暗，从而改变图像的明暗对比程度。对于高亮度的图像，按住鼠标左键将【色阶】对话框中的左侧滑块向右拖曳，同时【输入色阶】选项左边文本框中的数值变大，可以使原图像中的暗色调范围增大，从而使图像变暗；对于暗色调的图像，按住鼠标左键将右侧滑块向左拖曳，同时【输入色阶】选项右边文本框中的数值变大，可以使原图像中的亮色调范围增大，从而使图像变亮；
10.1 图像颜色的调整
10.2 实训练习
10.1 图像颜色的调整
【选择菜单栏中的【图像】/【调整】命令，系统将弹出如图所示的【调整】子菜单。

命令简介

【色阶】命令：可以调节图像各个通道的明暗对比度。【自动色阶】命令：可以自动调整图像的颜色，使图像达到均衡效果。【自动对比度】命令：可以自动调整图像的对比度，使图像达到均衡效果。【自动颜色】命令：可以自动调整图像的色彩平衡，使图像的色彩达到均衡效果。
操作步骤

具体操作步骤详见教材。
案例小结
本案例主要通过【色相/饱和度】命令对话框中【编辑】选项的单色设置来进行图像颜色的调整，使用此操作可以根据画面的色调需要来精确地调整图像颜色效果。
10.1.4 利用【曲线】命令矫正人像皮肤颜色
标准人像照片的背景一般都相对简单，拍摄时调焦较为准确，用光讲究，曝光充足，皮肤、服饰都会得到真实的质感表现。在夜晚或者光源不理想的环境下拍摄的照片，往往会出现人物肤色偏色或不真实的情况。本案例介绍肤色偏色后的矫正方法，使照片中的人物肤色更加真实。

计算机图形学理论及应用技术第10章图像量化和图像模式识别

2. 图像特征提取和特征选择
3. 图像模式识别
为了说明模式识别的基本方法，我们介绍两种典型的手写字符识别方法：模式匹配法和特征抽取法。
(1) 手写字符的模板匹配法
2) 定义标准字的特征量 3) 计算输入字符模式与标准模式的相似距离 4) 判定字符所属的标准模式
10.2.2 基于图像语言及结构方法的图像模式识别 1. 图像语言及结构的图像识别方法图像语言及结构的图像识别方法的优点有两个： 1) 按结构描述图像，可以忽略与处理目标无关的内容，其抗干扰能力强. 2) 简单的图像语句还可以作为一个图像基元进一步组合成复杂的图像语句，积累多次可以表达非常复杂的图像，同时它也可以和统计法结合起来，用统计法进行图像基元的模式识别，用图像语言法解决复杂的图像识别和分析问题。 2. 图像基元图像基元是图像处理中需要分解的最小图像单元。图像基元具有3个基本性质： (1) 图像基元具有基本性和完整性 (2) 图像基元具有可选择性和可描述性 (3) 图像基元具有可识别性和可抽取性
2. 图像预处理和特征抽取方法图像预处理指图像模式识别前的处理工作，它包括： (1) 图像输入图像输入工作需要根据处理的实际情况，确定以下4方面的内容： 1) 确定原始图片资料的获得方法。 2) 确定图像的输入方法。 3) 确定图像的像素分辨率和色彩分辨率等规格。 4) 确定图像数据压缩方式或图形文件格式。 (2) 图像预处理操作图像预处理的基本目标是： 1) 消除图像噪声或斑纹等图像干扰，避免由于图像干扰产生的图像处理错误和麻烦。 2) 消除与处理目标无关的图像因素，以突出处理的主要因素。 3) 矫正图像误差，对原始图片进行改造，提高图像处理的正确性。 4) 突出处理目的图像特征，使图像特征更清晰、更容易提取。

数字图像处理

第一章概论一、数字图像与像素数字图像是由一个个的像素（Pixel）构成的，各像素的值(灰度，颜色)一般用整数表示。

二、数字图像处理的目的1、提高图像的视觉质量。

2、提取图像中的特征信息。

3、对图像数据进行变换、编码和压缩。

三、工程三层次图像处理、图像分析和图像理解图像理解符号目标像素高层中层低层高低抽象程度数据量操作对象小大语义图像分析图像处理四、图像处理硬件系统组成图像输入设备（采集与数字化设备，如数码相机），图像处理设备（如PC机）和图像输出设备（如显示器，打印机）第二章数字图像处理基础一、图像数字化过程----采样与量化模拟图像的数字化包括采样和量化两个过程。

细节越多，采样间隔应越小。

把采样后得到的各像素的灰度值进一步转换为离散量的过程就是量化。

一般，灰度图像的像素值量化后用一个字节(8bit)来表示。

二、采样、量化与图像质量的关系采样点数越多，图像质量越好；量化级数越多，图像质量越好。

为了得到质量较好的图像采用如下原则：对缓变图像，细量化，粗采样，以避免假轮廓。

对细节化图像，细采样，粗量化，以避免模糊。

三、图像尺寸、数据量、颜色数量的计算灰度图像的像素值量化后用一个字节(8bit)来表示。

彩色图像的像素值量化后用三个字节(24bit)来表示。

一幅512X512（256K）的真彩色图像，计算未压缩的图像数据量是多少？（必考）图像总像素：512px*512px=256K总数据量：256K*3Byte=768KB一幅256X256（64K）的真彩色图像，计算未压缩的图像数据量是多少？图像总像素：256px*256px=64K总数据量：64K*1Byte=64KB四、数字图像类型二值图像、灰度图像、索引颜色图像)和真彩色图像。

五、数字图像文件的类型jpg、bmp、tif、gifJPEG采用基于DCT变换的压缩算法,为有损压缩。

六、图像文件三要素文件头、颜色表、图像数据七、读取一个图像，并将其尺寸缩小0.5倍，将缩小后的图像旋转30度。

胡学龙数字图像处理课件第10章数字图像处理的应用

– （2）运用格林公式
• 有利于编程
– （3）用边界行程码或链码
• 程序复杂度与运用格林公式相当
下一页
home
上一页
• 2. 颗粒度的求解 • （1）颗粒的检出
– 从图像中检出颗粒Y，然后消除噪声点。 – 对图像X进行了一次开运算。选取结构元素进行腐蚀运
算，去掉半径小于λ的噪声点，再进行膨胀运算。
而可以作为图像的抽象表示。 • 基于特征（内容）的图像检索利用不同特征定义
的相似度表示不同图像之间的相似程度。 • 基于内容的图像检索
– 首先要确定特征，以便让计算机自动地或半自动地从图像中提取这些特征。
– 其次根据这些特征进行相似性度量，认为查询图像与目标图像特征值越接近则两幅图像越相似。
下一页
• 国外已经处于“第二代PACS（Hi-PACS, Hospital integrated PACS）”阶段。
上一页
10.3.8 基于颜色和纹理特征的图像检索算法
• 1. 概述 • 2. 颜色特征的提取 • 3. 纹理特征的提取 • 4. 距离度量与相似检索 • 5. 实验结果
下一页
home
上一页
图10.8 不同特征的检索结果
下一页
home
上一页
10.4 数字化医院中的图像存档与通信系统
• 10.4.1 PACS概述 • 10.4.2 国内外发展现状 • 10.4.3 主要解决的问题和技术要点 • 10.4.4 DICOM图像格式 • 10.4.5 DICOM 3.0标准及其面向对象的实现 • 10.4.6 小结
• 以有噪医学图像为例采用开运算去除噪声，再根据结构元素的变化定义并绘制图像面积函数和颗粒度函数
• 研究图像中各个颗粒或“子目标图像”的分布状况，得出的结论可供图像的颗粒度分析参考。

数字图像处理PPT 第10章图像表示与描述

ˆ B
空集
B的反射集
ˆ {w | w b, b B} B
56
膨胀和腐蚀
膨胀
图10.21 B对A的膨胀运算过程
57
膨胀和腐蚀
膨胀
(a) 原图像
(b) 膨胀后图像
图10. 22 膨胀运算示例
58
膨胀和腐蚀
腐蚀
集合B对集合A的腐蚀运算
{z | ( B) z A}
59
膨胀和腐蚀
区域A的
重心
1 x x A ( x , yR ) 重心计算 1 y y A ( x , yR )
33
圆形度
圆形度：
面积 R 4 2 周长
34
欧拉数
1.像素的连接对于二值图像中具有相同值的两个像素a和b，所有和a、b具有相同值的像素系列p0(=a),p1,p2,…,pn1,pn(=b)存在，并且pi-1和pi互为4-/8-邻接，那么像素a 和b叫做4-/8-连接，以上的像素序列叫4-/8-路径。
于无自交情况的多边形。该算法在获取边界之后，先查找边界的拐角点，并且标记该拐角点是凸点还是凹点。然后将所有的凸拐点连接起来作
为初始的最小周长多边形P0。接着把所有在多边形P0之外的凹拐点移
除。再将剩余的凹拐点和所有凸拐点依次连接，形成新的多边形P1。然后移除所有原为凸点而在新多边形中变成凹点的拐点。再用剩余的点连

链码举例：
4-链码： 000033333322222211110011
9
链码
1 1 0 0 7 7 1 1 3 2 2 1 0 1 3 7 7 7 6 6 5 5
2 2
5
3 4 5 4 4 4 4 5

数字图像处理与机器视觉-基于MATLAB实现第10章图像识别基础

模式识别方法：模式分类或模式匹配的方法有很多，总体分为四大类：
• 以数据聚类的监督学习方法； • 以统计分类的无监督学习方法； • 通过对基本单元判断是否符合某种规则的结构模式识别方法； • 可同时用于监督或者非监督学习的神经网络分类法。 1.线性判用一条直线来划分已有的学习集的数据，然后根据待测点在直线的那一边决定的分类。如下图可以做出一条直线来划分两种数据的分类。但是一般情况下的特征数很多，想降低特征数维度。可以通过投影的方式进行计算。然而使得一个多维度的特征数变换到一条直线上进行计算。可以减少计算工作的复杂度。
10.2 模式识别方法
c.对称连接网络对称连接网络有点像循环网络，但是单元之间的连接是对称的（它们在两个方向上权重相同）。比起循环网络，对称连接网络更容易分析。这个网络中有更多的限制，因为它们遵守能量函数定律。没有隐藏单元的对称连接网络被称为“Hopfield 网络”。有隐藏单元的对称连接的网络被称为“玻尔兹曼机” 。神经网络可以看成是从输入空间到输出空间的一个非线性映射，它通过调整权重和阈值来“学习”或发现变量间的关系，实现对事物的分类。由于神经网络是一种对数据分布无任何要求的非线性技术，它能有效解决非正态分布和非线性的评价问题，因而受到广泛的应用。由于神经网络具有信息的分布存储，并行处理及自学习能力等特点，它在泛化处理能力上显示出较高的优势。
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析，以对事物或现象进行描述、辨认、分类和解释的过程，是信息科学和人工智能的重要组成部分。
基于监督学习的模式识别系统由4大部分组成，即待识别对象、预处理、特征提取和分类识别，如图10-1所示。
图10-1 模式识别流程图

人工智能导论课件第10章

• 机器视觉的起源可追溯到20世纪60年代美国学者L. R. 罗伯兹对多面体积木世界的图像处理研究，70年代麻省理工学院（MIT）人工智能实验室“机器视觉” 课程的开设。到80年代，全球性机器视觉研究热潮开始兴起，出现了一些基于机器视觉的应用系统。90年代以后，随着计算机和半导体技术的飞速发展，机器视觉的理论和应用得到进一步发展。
第2节
1
人类的图像识别能力
2
图像识别
3
计算机图形识别模型
4
图像识别的发展
10.2 图像识别
• 随着时代的进步，越来越多的东西逐渐依赖于越来越难以捉摸的人工智能，不过渐渐的，人们发现后者的一些缺陷也越来越重要。例如，
• 人类拥有记忆，拥有“高明”的识别系统，比如告诉你面前的一只动物是 “猫”，以后你再看到猫，一样可以认出来。可是，虽然人工智能已经具备了一定的意识，但或许还是小学生而已。如果说人工智能要通过那么多张图片才能认识什么是猫，那么需要多少张图片去认识这个世界呢？
图10-3 人工智能的意识
10.2 图像识别
• 人类是通过眼睛接收到光源反射，“看”到了自己眼前的事物，但是可能很多内容元素人们并不在乎；就像你好几天甚至更久前刚刚擦肩而过的一个人，如果你今天再次看到，你不一定会记得他，但是人工智能会记住所有它见过的任何人，任何事物。
• 比如右图，人类会觉得这是很简单的黄黑间条。不过如果你问问最先进的人工智能，它给出的答案也许会是校车，而且99%地肯定。对于图10-5，人工智能虽不能看出这是一条戴着墨西哥帽的吉娃娃狗（有的人也未必能认出），但是起码能识别出这是一条戴着宽边帽的狗。
图10-7 智能图像处理的支撑作用
10.3.1 机器视觉的发展
• 具有智能图像处理功能的机器视觉（Machine Vision），相当于人们在赋予机器智能的同时为机器按上了眼睛，使机器能够“看得见”、“看得准”，可替代甚至胜过人眼做测量和判断，使得机器视觉系统可以实现高分辨率和高速度的控制。而且，机器视觉系统与被检测对象无接触，安全可靠。

Photoshop_CS图像处理课程第10章

– 当前路径：面板中以蓝色条显示的路径为当前工作路径，用户所做的操作都是针对当前路径的。 – 路径名称：显示了该路径的名称，用户可以修改或给路径命名。 – “用前景色填充路径”按钮：单击该按钮，可以用前景色填充路径” 用前景色填充当前路径。
中文版Photoshop CS图像处理培训教程中文版Photoshop CS图像处理培训教程
10.1 绘制路径
• 10.1.1 知识讲解 • 10.1.2 典型案例——绘制标志典型案例——绘制标志
中文版Photoshop CS图像处理培训教程中文版Photoshop CS图像处理培训教程
中文版Photoshop CS图像处理培训教程中文版Photoshop CS图像处理培训教程
10.1.2 典型案例——绘制标志典型案例——绘制标志
• 本案例将绘制一个企业标志的轮廓路径，主要练 • • •
习使用钢笔工具进行绘制和使用转换工具进行编辑。素材位置：【\ 10课素材位置：【\第10课\素材】效果图位置：【\ 10课源文件\标志.psd】效果图位置：【\第10课\源文件\标志.psd】制作思路：
中文版Photoshop CS图像处理培训教程中文版Photoshop CS图像处理培训教程
1）路径的基本组成元素
• 路径主要由线段、锚点以及控制柄等构成。
– 线段：一条路径是由多条线段依次连接而成的，线段分为直线段和曲线段两种。 – 锚点：路径中每条线段两端的点是锚点，由小正方形表示，黑色实心的小正方形表示为当前选择的定位点。定位点有平滑点和拐点两种，平滑点是平滑连接两条线段的定位点；拐点是非平滑连接两条线段的定位点。而白色空心的小正方形表示未选中的锚点。 – 控制柄：当选择一个锚点后，会在该锚点上显示 0~2条控制柄，拖动控制柄一端的小圆点就可修 0~2条控制柄，拖动控制柄一端的小圆点就可修改与之关联的线段的形状和曲率。

第10章滤镜效果-2011-2012学年第2学期

۞ 大连理工大学城市学院 ۞
返回
Hale Waihona Puke 201010.4 滤镜库
描边类滤镜可使图像由不同的画笔和油墨制作的风格各异的图画，异的图画，用大小不同的画笔笔刷制作强化边缘：不同颜色间的宽度强化强化边缘：喷色描边：喷色描边：产生喷溅效果夕阳斜照金属字颜料字多彩浮雕字：渐变，自由变换，阴影，多彩浮雕字：渐变，自由变换，阴影，画笔返回描边喷色描边 ۞ 大连理工大学城市学院 ۞
返回
2010
10.1 抽出
可进行精确的选取操作使用方法
۞ 大连理工大学城市学院 ۞
返回
2010
10.2 液化
制作类似液化的变形效果使用方法
۞ 大连理工大学城市学院 ۞
返回
2010
10.4 滤镜库
扭曲类滤镜：扭曲类滤镜：占用较大的内存空间纹理滤镜: 纹理滤镜:凹凸不平的视觉效果渲染：渲染效果：渲染：渲染效果：夜景等艺术效果：艺术效果：是将摄影图像转变为传统的绘画效果彩色铅笔：彩色铅笔：模拟彩色铅笔绘画用背景色描边处理
۞ 大连理工大学城市学院 ۞
2010
第10章滤镜效果 10章
滤镜：特殊的图像处理模块，滤镜：特殊的图像处理模块，都在滤镜菜单，共分17类镜菜单，共分类。滤镜菜单：上次使用过的滤镜，滤镜菜单：上次使用过的滤镜，在编辑菜单中的消褪命令是对上次执行的滤镜进行消退。滤镜进行消退。
۞ 大连理工大学城市学院 ۞
۞ 大连理工大学城市学院 ۞
返回
2010
实例：实例：制作照片边框
步骤：步骤：打开人物图像：素材\ 10章 10打开人物图像：素材\第10章\10-04.tif 画布大小扩大制作边框：打开图像10-05.tif，并移入10-04.tif中制作边框：打开图像10-05.tif，并移入10-04.tif中，自由变换，清除中间图像边框图层：图层样式，斜面与浮雕，边框图层：图层样式，斜面与浮雕，滤镜/渲染/光照效果：点光。强度：28，聚焦：70，光区域：滤镜/渲染/光照效果：点光。强度：28，聚焦：70，光区域：全部滤镜/渲染/光照效果：提供了17种不同的光种不同的光，滤镜/渲染/光照效果：提供了17种不同的光，3种灯光类型种光的特征，可以在RGB图像中制作各种各样的光源效和4种光的特征，可以在RGB图像中制作各种各样的光源效果。样式：光源。样式：光源。默认表示中等强度的距光源光照类型：一共有3种光照类型。平行光，光照类型：一共有3种光照类型。平行光，是投射直线方向的光线，只能改变光线方向和光源位置；全光源是一种散光；光线，只能改变光线方向和光源位置；全光源是一种散光；点光是投射长椭圆光，可以在玉兰窗口中改变照明区域。点光是投射长椭圆光，可以在玉兰窗口中改变照明区域。

《图形图像处理PS》课件——第10章通道的灵活应用

10.2 应用颜色通道——调整图像色调
10.2.1 颜色通道的分类 10.2.2 使用颜色通道调出唯美色调
颜色通道对于图像色彩的编辑具有重要的意义，本节将学习颜色通道的分类，以及如何使用颜色通道进行图像处理。
10.2.1 颜色通道的分类
图10-2 RGB颜色通道
图10-3 隐藏蓝色通道
10.2.1 颜色通道的分类
10.3.2 使用Alpha通道轻松抠取人物
图10-19 打开素材文件
图10-20 复制通道
图10-21 绘制路径
二、使用Alpha通道轻松抠取人物
图10-22 羽化选区
图10-23 填充选区
图10-24 “色阶”对话框
二、使用Alpha通道轻松抠取人物
图10-25 调整亮度/对比度图10-27 “曲线”对话框
10.4.1 分离与合并通道
图10-29 分离通道图10-30 分离出的图像
图10-31 “合并通道”对话框图10-32 “合并多通道”对话框
10.4.2 使用合并通道制作艺术效果
图10-33 打开素材文件35 选择“合并通道”选项
10.4.2 使用合并通道制作艺术效果
图10-26 复制通道并反相图10-28 选取图像效果
10.4 分离与合并通道——制作特殊图像效果
10.4.1 分离与合并通道
10.4.2 使用合并通道制作艺术效果
分离与合并通道是在Photoshop中进行图像处理时经常用到的操作，可以制作出非常奇特的图像效果，是常用的创作手法之一。本节将学习如何通过分离与合并通道制作特殊图像效果。
第10章通道的灵活应用
通道的基本知识应用颜色通道——调整图像色调应用Alpha通道——为图像创建选区分离与合并通道——制作特殊图像效果使用“应用图像”命令——制作图像合成效果使用“计算”命令——混合单个通道图像

精品课件-图像处理及网页制作-第10章

ImageReady的主要功能有创建和管理切片、图像映射、制作翻转和动画，并可对图像进行Web优化。
Photoshop和ImageReady可以很方便地进行相互切换，只需单击工具箱底部的切换按钮，或按快捷键Ctrl + Shift + M 即可(如图10-1所示)。
5 图10-1 ImageReady切换按钮
4
10.1.1 ImageReady简介 Photoshop自带了一个Web图像处理和动画制作工具——
ImageReady。在设计网页时，两个工具互相配合，各司其职。 Photoshop主要用于创建在Web上的静态图像，而ImageReady则用于高级Web处理和创建动态Web图像(如动画和翻转)。
具”，在图像中拖出一个矩形框，将要创建切片的区域包括进
去。默认情况下所创建的用户切片其边缘显示为黄色的实线，
而自动切片的边缘为蓝色的虚线。自动切片区域呈半透明显示。
(2) 修改切片大小。如果对切片的区域不满意，可以调整
其大小，自动切片区域会根据调整结果重新划分。将鼠标放到
切片边缘上，此时该切片区边缘显示为黄色实线，其上还会显
11
(1) “原稿”视图：显示未优化的图像。 (2) “优化”视图：显示经优化设置的图像。 (3) “双联”视图：并排显示图像的两个版本。 (4) “四联”视图：同时显示图像的四个版本。
12
2. 查看图像信息 (1) 缩放比例：单击文档窗口左下部的”缩放级别”区域，弹出一组菜单，从中可选择图像的显示比例，或者对图像进行缩放。 (2) 图像信息：单击文档窗口下部的“图像信息”，弹出一组菜单，在从中选择所要显示的信息，如原稿/优化文件大小、优化信息、图像尺寸等，还可以显示在不同网络速度时的估计下载时间。在“双联”和“四联”视图中，每个视图下方的注释区域也提供了相关的优化信息。

Photoshop CS基础教程与上机指导第十章

/webnew/
/webnew/
若要创建一个有背景色的图像，请按照如下步骤操作：若要创建一个有背景色的图像，请按照如下步骤操作：先在工具箱中选择背景颜色，例如为蓝色。 (1) 先在工具箱中选择背景颜色，例如为蓝色。然后选择【文件】新建】命令，打开如图10.7所示的【新建】 10.7所示的 (2) 然后选择【文件】|【新建】命令，打开如图10.7所示的【新建】对话框。话框。 (3)在【背景内容】下拉列表框中选择【背景色】。 (3)在背景内容】下拉列表框中选择【背景色】 (4)在颜色模式】下拉列表框中选择【RGB颜色】 (4)在【颜色模式】下拉列表框中选择【RGB颜色】。颜色 (5)单击【 (5)单击【好】按钮就可以建立一个背景色为蓝色的新图像，如图10.8所单击按钮就可以建立一个背景色为蓝色的新图像，如图10.8所 10.8 示。
/webnew/
/webnew/
10.3.3
创建调整图层
调整图层是一种比较特殊的图层，主要用来控制色调和色彩的调整。调整图层是一种比较特殊的图层，主要用来控制色调和色彩的调整。创建调整图层的操作如下：创建调整图层的操作如下：选择【图层】新调整图层】命令打开一个子菜单， (1) 选择【图层】|【新调整图层】命令打开一个子菜单，在其中选择一个命令，例如选择【曲线】命令。择一个命令，例如选择【曲线】命令。此时将弹出如图10.9所示的【新图层】对话框， 10.9所示的 (2) 此时将弹出如图10.9所示的【新图层】对话框，在对话框中设置图层名称、颜色、模式和不透明度，单击【按钮。置图层名称、颜色、模式和不透明度，单击【好】按钮。
/webnew/
/webnew/
10.2 【图层】面板图层】

遥感数字图像处理-第10章特征提取与选择

4
二、特征选择
1.特征选择的流程
（1）子集产生（2）子集评价（非监督选择和监督选择）（3）评价终止（4）结果验证
原始属性集
子集产生
属性子集
子集评价
否终止条件是结果验证
5
二、特征选择
2.属性评价准则
根据与分类算法的关联程度，属性评价准则大体上可以分成两类：关联准则和独立准则。关联准则
7
二、特征选择
3.基于先验知识的特征选择
ቤተ መጻሕፍቲ ባይዱ前人的工作基础和研究经验可以给我们提供特征选择的思路
基本思想：如果我们对研究区地物及其属性比较熟悉，已经知道某些属性可以很好地区分待分类的地物，此时我们可以根据这些先验知识直接选择这些可以区分特定地物的属性，该方法非常适合光谱信息相对较少的多光谱数据。
关联准则依赖于分类算法，它是以分类算法的性能作为评价准则。 ➢ 监督特征选择，在特定的分类器下常采用分类准确率作为评价准则。 ➢ 非监督选择，在特定的聚类算法下常采用属性子集的聚类质量来作为
评价准则，常用的聚类质量评价参数有类别的紧凑性、类内类间的距离和最大可能性等。
6
二、特征选择
独立准则
独立准则是通过训练样本的内在特征来对所选择的属性子集进行评价，不依赖于特定的分类算法。
局限性：先验知识往往受限于所识别的地物类别及其所处的环境
8
三、特征组合
特征组合涉及两方面的内容：各特征参与分类的先后顺序各特征参与分类时的权重
作用：对于某些分类器来说，给各特征变量赋予不同的权重后再进行分类，则会得到不同的分类结果
决策树分类对于特征组合的体现比较典型，决策树的构建过程就体现了各特征变量出现的先后顺序；而且某一特征可能被多次使用，也就是说该特征在分类过程中的贡献不只一次，即它的权重相较于其他特征来说要更大一些。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

• 1.DPM(Deformable Parts Model) • 2. OverFeat • 3.DeepID-Net • 4.RCNN • 5.Fast RCNN • 6.Faster RCNN • 7.SPPNet • 8.YOLO • 9.SSD
10.2 图像物体识别
我们将实现对Cifar-10数据集图像中的物体识别
10.3 图片验证码识别
我们将使用机器学习的图像处理技术实现对验证码的自动识别。 10.3.1 验证码生成 • 在Python中提供了captcha库可以便捷的生成验证码图片。 • 对于验证码的内容，我们采用数字和英文字符组合的形式。在验证
码的长度，我们使用四位长度。所以，对于验证码的文本内容，随机生成：
10.3 图片验证码识别
10.3.4 训练模型 • 为了更好的训练效果，在训练时，每次都随机生成验证码，然后进
行训练。
# 训练
def train_crack_captcha_cnn(): output = crack_captcha_cnn()
#调用训练模型
loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=output, labels=Y))
• 2.输入数据处理
• 对于图片数据，在训练前进行统一裁剪到24×24像素大小，裁剪中央区域用于评估或随机裁剪用于训练。并且对图片进行数据增广，包括对图像进行随机的左右翻转、随机变换图像的亮度、随机变换图像的对比度操作，最后对图像进行白化操作。
10.2 图像物体识别
10.2.2 生成训练模型
• 使用卷积神经网络为基础，包括了两次的卷积层、池化层以及抑制层，然后进行全连接层，最后通过逻辑分类层softmax_linear进行输出。
• 图像修复(image inpainting)：图像修复通俗来讲就是一张照片上被挖了一个洞，利用照片中的其他信息来将这个洞画上的过程。是图像编辑和图像生成领域的一个典型问题。
• 对于图像修复问题，核心的思想就是利用图像文件本身的冗余性 (redundancy)，利用图像已知部分的信息来补全未知部分。
10.2 图像物体识别
10.2.3 模型训练学习 • 使用数据集在模型中进行训练学习。
with tf.train.MonitoredTrainingSession( checkpoint_dir=FLAGS.train_dir, hooks=[tf.train.StopAtStepHook(last_step=FLAGS.max_steps), tf.train.NanTensorHook(loss),_LoggerHook()], config=tf.ConfigProto( log_device_placement=FLAGS.log_device_placement)) as mon_sess:
optimizer = tf.train.AdamOptimizer(learning_rate=0.001).minimize(loss)
predict = tf.reshape(output, [-1, MAX_CAPTCHA, CHAR_SET_LEN])
max_idx_p = tf.argmax(predict, 2)
• 修复的流程分为两大步骤，首先选择待修补的像素，然后进行搜索补全。
在图像修复问题上也引入了机器学习方式来进行解决。一般，利用卷积神经网络来学习图像中的高准确度特征，利用特征来指导图像缺失部分的生成。通过将大数据和图像高准确度特征的组合起来，使得图像修复得到了极大的完善。
10.1 机器学习的图像处理简介
while not mon_sess.should_stop(): mon_sess.run(train_op)
10.2 图像物体识别
10.2.4 评估模型 • 完成了模型的训练，使用测试数据进行评估模型。在评估时，使用
的数据不再经过翻转、调整亮度、对比度等操作，直接从测试数据集中转为TFRecord格式的数据进行使用。 • 将测试数据输入到训练好的模型中，获得最终的分类结果并与真实分类进行对比。
10.2.1 数据预处理
• Cifar-10数据集。Cifar是加拿大政府牵头投资的一个科学项目研究所，Cifar-10数据集是一个用于普适物体识别的数据集。
• CIFAR-10包含了60000幅RGB彩色图片，其中50000张用于训练、 10000张用于测试。这些图片分为10个不同的类别，每类包含6000 幅图片。为了简化了计算机模型的任务，并降低了分析图片的计算负载，数据集中每幅图片的规格是32x32像素
padding='SAME', name='pool1') # norm1 norm1 = tf.nn.lrn(pool1, 4, bias=1.0, alpha=0.001 / 9.0, beta=0.75, name='norm1')
10.2 图像物体识别
10.2.2 生成训练模型 • 使用卷积神经网络为基础，包括了两次的卷积层、池化层以及抑制
saver = tf.train.Saver()
#保存训练模型
10.3 图片验证码识别
10.3.5 评估模型
• 对于模型的评估，同样随机的生成一张验证码，使用模型进行预测，查看预测的结果。
#获取随机验证码 text, image = gen_captcha_text_and_image() #对验证码进行灰度处理 image = convert2gray(image) #将图片一维化 image = image.flatten() / 255 #调用评估 predict_text = crack_captcha(image) print("正确: {} 预测: {}".format(text, predict_text))
10.3 图片验证码识别
10.3.3 生成训练模型
• 使用卷积神经网络为基础，进行三次的卷积层、池化层以及抑制层，然后进行全连接层，最后通过输出层进行输出。对于损失函数的选取，使用最常用的交叉熵算法。
# 将占位符转换为按照图片给的新样式 x = tf.reshape(X, shape=[-1, IMAGE_HEIGHT, IMAGE_WIDTH, 1]) # 第一次 w_c1 = tf.Variable(w_alpha*tf.random_normal([3, 3, 1, 32])) b_c1 = tf.Variable(b_alpha*tf.random_normal([32])) conv1 = tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(x, w_c1, strides=[1, 1, 1, 1], padding='SAME'), b_c1)) conv1 = tf.nn.max_pool(conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME') conv1 = tf.nn.dropout(conv1, keep_prob) #第二次 #第三次 #全连接层 w_d = tf.Variable(w_alpha*tf.random_normal([8*20*64, 1024])) b_d = tf.Variable(b_alpha*tf.random_normal([1024])) dense = tf.reshape(conv3, [-1, w_d.get_shape().as_list()[0]]) dense = tf.nn.relu(tf.add(tf.matmul(dense, w_d), b_d)) dense = tf.nn.dropout(dense, keep_prob) #输出层 w_out = tf.Variable(w_alpha*tf.random_normal([1024, MAX_CAPTCHA*CHAR_SET_LEN])) b_out = tf.Variable(b_alpha*tf.random_normal([MAX_CAPTCHA*CHAR_SET_LEN])) out = tf.add(tf.matmul(dense, w_out), b_out)
第10章图像处理
10.1 机器学习的图像处理简介 10.2 图像物体识别 10.3 图片验证码识别 10.4 图像物体检测 10.5 看图说话
10.1 机器学习的图像处理简介
使用机器学习进行图像处理已经成功的应用到了图像修复、物体识别、物体检测、图像问答、人脸识别等领域。
• 10.1.1 图像修复
层，然后进行全连接层，最后通过逻辑分类层softmax_linear进行输出。
（1）首先对卷积操作后的输出结果使用tf.reshape 函数将样本都转变为一维向量（2）通过2次全连接层的训练，（3）使用Relu激活函数进行非线性化。（4）通过softmax_linear层进行分类输出 • 损失函数选择最常用的交叉熵算法
max_idx_l = tf.argmax(tf.reshape(Y, [-1, MAX_CAPTCHA, CHAR_SET_LEN]), 2)
correct_pred = tf.equal(max_idx_p, max_idx_l)
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))
10.3 图片验证码识别
10.3.2 数据预处理
• 对自然语言处理的第一步就是对自然语言符号进行编码。对验证码的识别也先需要对识别的验证码进行转码处理。由于验证码仅仅包含了数字和字母，而且均为四位，在这里采用矩阵编码。
• 如“4352”可以表示为：
[0000100000 0001000000 0000010000 0010000000]