数字图像处理技术的现状及其发展方向(笔记)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图像处理技术的现状及其发展方向
一、数字图像处理历史发展
数字图像处理(Digital Image Processing)将图像信号转换成数字信号并利用计算机对其进行处理。
1.起源于20世纪20年代。
2.数字图像处理作为一门学科形成于20世纪60年代初期,美国喷气推进实验室(JPL)推动了数字图像处理这门学科的诞生。
3.1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置即CT(Computer Tomograph),1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。
4.从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展,人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论。
二、数字图像处理的主要特点
1.目前数字图像处理的信息大多是二维信息,处理信息量很大,对计算机的计算速度、存储容量等要求较高。
2.数字图像处理占用的频带较宽,在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本也高,这就对频带压缩技术提出了更高的要求。
3.数字图像中各个像素是不独立的,其相关性大。因此,图像处理中信息压缩的潜力很大。
4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,要分析和理解三维景物必须作合适的假定或附加新的测量。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。
5.一方面,数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大,作为图像质量的评价还有待进一步深入的研究;另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究,这些都是心理学和神经心理学正在着力研究的课题。
三、数字图像处理的优点
1.再现性好;图像的存储、传输或复制等一系列变换操作不会导致图像质量的退化。
2.处理精度高;可将一幅模拟图像数字化为任意大小的二维数组,现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高。
3.适用面宽;图像可以来自多种信息源,图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理。
4.灵活性高;数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。
四、数字图像处理过程及其主要进展
常见的数字图像处理有:图像的采集、数字化、编码、增强、恢复、变换、
压缩、存储、传输、分析、识别、分割等。处理流程图如下图所示。
图1 数字图像处理流程图
主要的处理介绍如下:
1.图像数字化;通过取样和量化将一个以自然形式存在的图像变换为适合计算机处理的数字形式,图像在计算机内部被表示为一个数字矩阵,矩阵中每一元素称为像素。
2.图像的编码;编码的目的是压缩图像的信息量(但图像质量几乎不变),以满足传输和存储的要求。编码方法可以对图像逐点进行加工,也可以对图像施加某种变换或基于区域、特征进行编码。
3.图像增强;图像增强目的是使图像清晰或将其转换为更适合人或机器分析的形式,常用的图像增强方法有:灰度等级直方图处理、干扰抵制、边缘锐化、伪彩色处理等。
4.图像恢复;其目的是除去或减少在获得图像过程中因各种原因产生的退化。
5.图像分析;从图像中抽取某些有用的度量、数据或信息,其目的是得到某种数值结果。图像分析需要用图像分割方法抽取出图像的特征,然后对图像进行符号化的描述,这种描述不仅能对图像中是否存在某一特定对象作出回答,还能对图像内容作出详细描述。
五、数字图像处理的主要研究进展
一、图像数字化
1.1历史阶段
①图像提取技术源自于电影和视频产品的发展,其中,最具影响力的研究是由Porter和Duff提出的通道概念,对图像提取技术的离散特性进行了规范,为这一研究领域奠定了基础,使其成为图像处理领域一个较独立的重要分支。
② 20世纪60年代,各种各样的处理技术和方法也相应而生,如四元组像素的提出以及Blinn对计算机领域所运用到的像素进行的全面诠释。
③ 20世纪90年代初期,学者们开始考虑借助数学和概率统计学的原理来寻求更优解,而不再强调最优解。
总结,图像提取技术的发展过程经历了以下4个发展阶段:
(1)萌芽阶段;通过拍摄时的布景实现提取条件。
(2)初期阶段;以四元像素和数字化为基础,建立了独立的分支学科。
(3)飞跃阶段;以概率统计学原理为基础的提取。
(4)分化阶段;认识到视频中帧与帧之间存在相关性,产生了专门用于视频提取的方案。但由于自然色彩分布的复杂性,至今没有被广泛认可的模型,也没有系统的、统一的评价标准。所以说,图像提取技术的成熟还有待时日,并依赖于其它
学科及计算机硬件技术的发展。
1.2 研究思路
①一种更注重提高A值的精确度,追求精确完美的效果;
②另一种则更注重提高提取的效率、实时性及自动化程度。
1.3 研究活动
①拍摄设备、拍摄方法及技巧;
②分割技术;
③人机交互操作接口;
④面向对象的提取技术;
⑤前景与背景间交界区域估计模型。
二、图像压缩编码
2.1历史发展
1.第1代图像压缩编码阶段(1985年以前)
① 1939年Dudley研制了声码器,他把声音频谱的能量划分为有限数目的频带,并且在每个频带内传输相应的能级,因此能够达到较高的压缩。
② 20世纪40年代初形成的信息论,如Huffman编码。
③ 1977年以色列科学家Jacob Ziv和Abra-ham Lempel提出了不同于以往的基于字典的压缩编码算法LZ 77;1978年又推出了改进算法LZ 78,把无损压缩编码算法的研究推向了一个全新的阶段。
④近年来,采用BP网进行非线性预测的尝试。
2.第2代图像压缩编码阶段(1985年以后)
① 1985年,多个分辨率下表示图像的方案,利用不同类型的线性滤波器,将图像分解到不同的频带中,然后对不同频带的系数采用不同的压缩编码方法。
② 1987年,Mallat首次巧妙地将计算机视觉领域内的多尺度分析思想引入到小波变换中,小波变换的图像压缩编码算法已成为目前图像压缩研究领域的一个主要方向。
③ 1988年,Barnsley和Sloan共同提出了分形图像编码压缩方案。
三、图像增强
3.1 增强方法
①直方图修改处理;
②图像平滑化处理;
③图像尖锐化处理;
④彩色处理技术。
四、图像恢复
4.1图像恢复模型
①通用图像模型;
②光学系统模型;
③摄影过程模型;
④离散图像恢复模型。
4.2恢复技术
①传感器和显示点的非线性修正;