图像几何变换的理论及MATLAB实现.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 25卷第 4期《新疆师范大学学报》 (自然科学版 V o l . 25, N o . 4 2006年12月 Journal of X injiang N o r m al U niversity D ec . 2006 (N atural Sciences Editi on
图像几何变换的理论及 M A TLAB 实现
古丽娜 1, 2, 木妮娜 3
(1. 西北师范大学教育技术与传播学院 , 甘肃兰州 730070; 2. 新疆师范大学教育科学学院 , 新疆乌鲁木齐 830054;
3. 新疆师范大学数理信息学院 , 新疆乌鲁木齐830054 α
摘要 :, 。在图像几何变换中主要包括图像的缩放、图像的旋转、、 (主要包括图像的缩放、旋转、 , A 。
关键词 :; 缩放 ; 旋转 ; 移动 ; 剪取
T P 391. 4文献标识码 : A 文章编号 : 1008296592(2006 20420024205
1引言
从 20世纪 60年代美国航空和太空总署 (N A SA 的喷气推进实验室第一次使用计算机对太空船发回的大批月球图片进行处理到信息技术不断提高的今天 , 数字图像的应用处理技术得到了广泛的应用 , 形成了自己的技术特色和完善的学科体系。
我们在处理图像时往往会遇到需要对图像进行几何变换的一些问题。图像几何变换是图像显示技术中的一个重要组成部分 , 也是我们学习和探讨的一个重要课题。在图像几何变换中主要包括图像的缩放、旋转、移动、剪取等内容。其中使用最频繁的是图像的缩放和旋转 , 不论照片、图画、书报、还是医学 X 光和卫星遥感图像都会用到这两项技术。
M A TL A B 语法结构简单 , 并且有极强的数值计算、图形文字处理、数据分析、图形绘制及图像处理等功能 , 在本文中我们用 M A TL A B 实现了图像的缩放、旋转和剪取。
2图像的几何变换理论
2. 1概述
从广义上说 , 图像是自然界景物的客观反映 , 是人类认识世界和人类本身的重要源泉。图像对我们并不陌生。我们生活在一个信息时代 , 科学研究和统计表明 , 人类从外界获得的信息约有75◊ 来自视觉系统 , 也就是从图像中获得的。
客观世界在空间上是三维 (3-D 的 , 但一般从客观景物得到的图像是二维 (2-D 的。一幅图像可以用一个 2-D 数组 f (x , y 来表示 , 这里 x 和 y 表示 2-D 空间 X Y 中一个坐标点的位置 , 而 f 则代表图像在点 (x , y 的某种性质 F 的数值。例如常用的图像一般是灰度图 , 这时 f 表示灰度值 , 它常对应客观景物被观察到的
α[收稿日期 ]2004-11-12
[作者简介 ]古丽娜 (1974- , 女 , 维吾尔族 , 新疆乌鲁木齐人 , 讲师 , 主要从事计算机多媒体技术 , 计算机辅助教育技术等方向的教育与研究。
亮度值。
常见图像是连续定义的 , 即 f , x , y 的值可以是任意实数。为了能用数字计算机对图像进行加工处理 , 需要把连续的图像在坐标空间 X Y 和性质空间 F 都进行离散化。这种离散化了的图像就是数字图像 , 可以用 I (r , c 来表示。这里 I 代表离散化后的 f , (r , c 代表离散化后的 (x , y , 其中 r 代表图像的行 (ro w , c 代表图像的列 (colum n 。这里 I , c , r , 的值都是整数。文章以后主要讨论数字图像 , 在不至引起混淆的情况下我们用 f (x , y 代表数字图像 , 如不特别说明 , f , x , y 都在整数集合中取值。
在处理图像的过程中 , 一般要对图像的大小和几何关系进行调整 , 如对图像进行缩放以及旋转 , 这时图像中的每个像素的值都要发生变化 . 数字图像的坐标是整数 , 经过这些变换后的坐标不一定是整数 , 因此要对变换之后的整数坐标位置的像素值进行估计。
M A TL A B 中数组是最基本的数据结构 , 而大部分图像都用二维数组即矩阵表示 , 矩阵中一个元素对应一个像素。例如 , 一个由 500行 600列不同颜色点组成的图像可以用 5003600列的矩阵表示 . 当然也有一部分图像是用三维数组表示的 , 如 R GB , .
, 直接会影响到图像显示视觉效果与存储格空间的大小 , 所以 , 类型。 2. 1. 1, , 通过离散的采样点建立一个连续函数来逼近真实曲线 , 用这个重建的函数便可求出任意位置的函数值。插值算法的数值精度与插值函数有关 , 插值函数的设计是插值算法的核心。在 M A TL A B 中为图像处理提供了三种插值方法 :最近邻插值(nea rest neig hbort in ter 2p ola tion , 双线性插值 (bilinea r in terp ola tion , 和双三次插值 (bicubic in terp ola tion 。
2. 1. 2图像类型
在 M A TL A B 中 , 一幅图像可能包含一个数据矩阵 , 也可能包含一个颜色影像表矩阵。图像处理工具箱支持的图像分为四个基本类型 :索引图像 , 灰度图像 , 二值图像和 R GB 图像。它们的区别在于数据矩阵元素的不同含义。
3实现过程
在本文的实现过程中 , 我们主要利用了 M A TL A B 的图像处理工具包来编写程序。
M A TL A B 图像处理工具包是由一系列支持图像处理操作的函数组成的 , 所支持的图像处理操作有 :几何操作、区域操作和块操作 ; 线性滤波和滤波器设计 ; 变换 (D CT 变换 ; 图像分析和增强 ; 二值图像操作等。
3. 1实现图像的缩放
M A TL A B 图像处理工具箱中的函数 i m resiz e 可以用上述 3种方法对图像进行插值缩放 , 如果不指定插值方法 , 则默认使用最近邻插值法。
i m resiz e 函数的语法格式为 :
B =i m resiz e (A , m , m ethod
B =i m resiz e (A , [m ro w s ncols ],m ethod
B =i m resiz e (… , m ethod , n
B =i m resiz e (… , m ethod , h
这里参数 m ethod 用于指定插值的方法 , 可选的值为 nea rest (最近邻法 , bilinea r (双线形插值及 bicubic (双三次插值 , 默认值为 nea rest 。
B =i m resiz e (A , m , m ethod 返回原图 A 的 m 倍放大图像 (m 小于 1时效果是缩小。
B =i m resiz e (A , [m ro w s ncols ],m ethod 返回一个 m ro w s 行 , ncols 列的图像 , 若 m ro w s 和 ncole 定义的长 52第 4期古丽娜等图像几何变换的理论及M A TLAB 实现
宽比与原图不同 , 则图像会产生变形。
在使用 bilin 和 bicubic 方法缩小图像时 , 为消除引入的高频成分 , i m resiz e 使用一个前端平滑滤波器 , 默认的滤波器尺寸为 11311。也可通过参数 n 指定滤波器的尺寸 , 即B =i m resiz e (… , m ethod , n 。对于 nea rest 插值方法 , i m reasiz e 不使用前端滤波器 , 除非函数明确指定。
B =i m resiz e (… , m ethod , h 使用用户设计的插值核 h 进行插值 , h 可以看作一个二维 F IR 滤波器。该算法主要部分如下 :