图像处理与识别论文.doc
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
辽宁工业大学
关于图像识别技术的论述
--图像处理与识别结课论文
学院:电子与信息工程学院
班级:电子102班
学号:*********
姓名:***
关于图像识别技术的论述
随着科学技术的不断发展,计算机应用领域的不断开拓,一种全新的图像处理方法应运而生,这就是数字图像处理技术,即利用计算机设备将图像转变成数字信息来进行保存、处理、传输和重现。数字图像识别技术则是从数字图像处理技术中延伸出来的一个重要的研究方向。目前,数字图像处理与识别的应用范围越来越广。但就目前的水平而言,计算机对外部的感知能力还比较薄弱,还需要投入大量人力、物力从事数字图像处理与识别的理论和应用的研究。图像处理与识别的应用有很多种,如指纹识别,条码识别,人脸识别,车牌识别,残损纸币识别等等在生活,生产中,和警方侦破案件中都有很多很重要的应用。数字图像处理方法的分类以及数字图像处理系统的基本部件,“数字图像处理的基本方法”、“人脸识别”及“残损纸币识别”进行详细叙述。一些数字图像处理的基本方法,包括图像增强与图像检测两部分。人脸识别”当中,可采用SN-tuple神经网络的方法进行识别,同时网络参数的变化对识别率也会有所影响影响。对于“残损纸币识别”,可以选择边缘检测、Fisher判别和神经网络三种方法进行识别。其中,边缘检测需要区分纸币的面值和正反,之后方可识别,但性能较为稳定,识别效果较好;Fisher判别无需区分纸币的面值和正反,但识别率受样本选择的影响,不同样本,识别率有可能相差较大;神经网络方法也可不区分纸币的面值与正反,但识别率较低,若区分面值与正反,则可获得较高的识别率。下面分别对车牌识别,纸币、票据识别和手势识别做陈述。
随着我国国民经济的迅速增长,机动车的规模与流量大幅增加,随之而来的管理问题也日益严重。因此迫切需要采用高科技手段,对这些违法违章车辆牌照进行登记,汽车牌照识别系统的出现成为了交通管制必不可少的有力武器。汽车牌照的识别系统在公共安全,交通管理,及相关军事部门有着重要的应用价值。它是一个基于数字图像处理和字符识别的智能化交通管理系统,该系统先通过图像采集,再对图像进行处理以克服图像干扰,改善识别效果,而后进行二值化,归一化等处理,最后进行识别。车牌识别系统使得车辆管理更趋于数字化,网络化,大大提高了交通管理的有效性与方便性。车牌识别系统作为整个智能交通系统的一部分,其重要性不言而喻。
车牌识别是一项涉及到数字图像处理、计算机视觉、模式识别、人工智能等多门学科的技术,它在交通监视和控制中占有很重要的地位,已成为现代交通工程领域中研究的重点和热点之一。该项技术应用前景广泛,例如用在自动收费系统、不停车缴费、失窃车辆的查寻、停车场车辆管理、特殊部门车辆的出入控制
等等。车牌识别一般可以分为车牌的定位、牌照上字符的分割和字符识别三个主要组成部分。通过研究进行车牌识别的各项关键技术,在分析了近年来一些典型的车牌识别算法的基础上,最终确定一系列有效的算法对车牌进行识别。在车牌定位上,根据车牌图像在HSV色彩空间各分量的取值范围规律,首先对符合该取值范围的像素进行色彩过滤,然后利用数学形态学进行处理,形成多个符合车牌颜色特征的连通区域。接下来,分别根据车牌的形状特征和车牌上字符的纹理特征,逐步对得到的连通区域进行分析和排除,从而得到车牌区域。该定位方法优点是可以过滤掉车牌临近区域那些颜色、纹理与车牌特征不符合的干扰纹理,如栅格、边框等。在字符分割阶段,本文在进行了车牌的倾斜矫正和确定了车牌字符的上下边界后,主要借助相关的投影信息和先验知识来确定每个字符的分割位置,并针对断裂和粘连字符进行了简单而有效的处理。对于单个字符的识别问题,我们在进行必要的预处理后采用改进的BP神经网络来进行单个字符的识别。由于在车牌识别中用到的算法一般都比较复杂,直接用高级语言编程很困难,所以本文通过编写VC++与Matlab的接口来实现算法编程,并且最终编写的程序可以脱离VC++和Matlab平台独立运行。Matlab的编程高效而灵活,它具有强大、丰富的内置函数,并且其在图像处理方面的应用有着独特优势。通过接口来调用我们在Matlab下编写好的函数,这样做能够使我们从繁琐的编程工作中解脱出来,从而可以集中精力进行车牌识别算法的研究。
伴随着通信技术与信息处理技术的迅猛发展,越来越多的纸质文档通过数字采集设备转换成文本图像,从而使文本图像数据能够快捷的在网络、卫星、传真通信信道中传输,因此,文本图像已逐渐成一个重要的信息来源。但是,现有的文本图像处理系统自动化程度低,且通用性不高,无法满足文本图像处理广泛性与实时性的要求。因此,研究如何对文本图像进行分析与处理,以便高效、快捷的获取文本图像的信息,是一项十分有意义的研究课题。本文在总结已有研究成果的基础上对文本图像的识别检索、预处理、版面分析和表格图像识别展开研究。所做的主要工作如下:1.依据图像的灰度分布和结构特征差异,对基于图像信息度量的文本图像识别检索算法进行改进,构造一种基于信息度量与Radon变换的文本图像识别检索算法。该算法综合利用文本图像与连续色调图像的灰度分布与结构特征差异进行文本图像的识别检索。实验结果表明,所构造算法可有效降低文本图像识别检索的误识率。2.对基于Hough变换的文本图像倾斜检测算法进行改进,给出一种基于多分辨率Hough变换的文本图像倾斜检测算法,该算法通过对不同分辨率的图像进行不同精度的Hough变换,获得文本图像倾角值。
许多文档是以纸质文档的形式存在,例如银行票据、税务报表、标准化考试中的机读卡、人口普查表、彩标投注单、选票、定货单等。纸质文档不便于保存、
检索、统计和修改,而将这些信息录入计算机是一件非常繁琐的事情。长期以来人们通过键盘手工输入,不但费时费力且容易出错。在实时性要求较高的场合(如选举中的统计选票)自动、快速、准确地处理文档显得尤为重要。因此,对这些文档进行计算机自动录入具有重要的现实意义。本课题研究了字符图像的计算机识别问题。字符根据书写方式的不同,分为印刷体字符和手写体字符。系统针对每种字符各自的特点,通过对字符的预处理,提取字符本身特征,然后运用特定的识别算法,实现了字符图像的自动识别。整个系统包括图像采集、图像预处理、特征提取与字符识别四个部分。根据印刷体和手写体字符识别的需要,系统采取了各自不同的特征提取策略。对于印刷体字符,在对字符进行了图像预处理后,采用网格特征和交叉点特征相结合的方法作为其字符特征,建立字符标准特征库。而对于手写体字符,采用直接抽取字符边缘轮廓特征的方法,完成字符特征的提取。印刷体字符采用模板匹配算法实现了字符的识别,利用待识别字符与字符标准特征库相
手势识别系统和人脸识别系统相似主要从摄像头中采集手势数据,进行特征提取,再将提取到的信息传输给机器,让机器理解信息的含义。以下一手势识别为例。手势识别也是讲特征提取到的信息传送给机器,让机器理解手势信息的含义。手势识别工作主要分三个阶段:预处理、特征提取、欧式距离判定。预处理阶段应当从手势图片中去除噪声信号,利用肤色和背景在HIS颜色模型空间中的不同数值范围将手势从背景中提取出来,利用边缘检测算子提取手势的轮廓曲线。利用傅里叶描述子对轮廓曲线进行数学建模进而进行特征提取。通过欧氏距离的比较,对手势进行识别。通过对视频流采样,完成对几种动态手势的识别。利用若干人对手势一到手势十十种静态手势在该手势库上做统计实验。在背景光线均匀的情况下,手势基本能够正确识别。利用若干人进行动态手势识别,在背景光线均匀的情况下,手势动作基本能够正确识别。本系统具有旋转不变,比例伸缩性,平移不变性,利用实验者在手势一到手势十十种静态手势库上做旋转不变性,比例伸缩性,平移不变性统计实验,效果良好。本系统最大特色是符合人的操作习惯进行数据采集,和传统的佩戴颜色手套,在手上做标记等数据采集方式比较更加贴近人的操作习惯。操作者在手势动作时更加自然。不足之处客观上容易受外界环境干扰例如光线、温度、背景颜色等等。主观上和操作者的操作习惯也有关系。
图像识别系统的应用还有很多,在此不一一列举。随着科技的发展,图像识别技术越来越被人类所需求,可见图像识别技术的重要性。