基于数字图像处理技术的答题卡识别方法(图像处理课程练习)

合集下载

基于计算机视觉的答题卡识别系统设计与实现

基于计算机视觉的答题卡识别系统设计与实现

基于计算机视觉的答题卡识别系统设计与实现张菲菲种兰祥摘要:考试阅卷是一项繁重的重复性劳动。

为了减轻教师的阅卷负担,本文采用计算机视觉技术,设计开发了单机版和B/S架构的客观考试题的答题卡识别系统。

教师只需要使用普通USB摄像头对具有标准答案的答题卡进行标定,然后依次拍照待阅试卷,系统即可记录、输出成绩并做出简要分析。

关键词:计算机视觉;答题卡识别;数据管理中图分类号:TP315 文献标志码:A 文章编号:1673-8454(2019)11-0051-04一、引言光标阅读机(Optical Mark Reader)作为自动化阅卷工具,在很大程度上能减轻教师在批阅客观考试题上花费的精力,但由于其属于光电设备,本身的价格和维护成本较高,且只能用阅读专用铅笔在专用答题卡上填涂答案,还不能保存答题卡的数字图像,难以普及到个人使用。

[1][2]本文采用消费级USB摄像头,以VS2012为开发平台,选用MySQL数据库,融合计算机视觉、Ajax和Socket相关技术,设计开发了成本低廉、使用方便,对纸张和填涂笔无特殊要求,适合教师个人、偏远地区和普通学校使用的客观题答题卡识别系统。

二、系统主要功能的设计与实现答题卡识别系统由用户管理、图像处理、答卷识别、数据管理四部分组成,每一部分有若干个功能模块,结构如图1所示。

其中,用户管理包括个人密码账号管理、登录和注销等日志管理。

图像处理包括图像采集、图像存储、图像预处理和答题卡模板设计。

答卷识别包括定位信息提取、精确定位和填涂信息识别。

数据管理包括学生信息管理、学生成绩管理和标准答案管理。

1.图像处理图像处理部分包含三个功能模块。

实际上,系统实现时首先要做好答题卡模板设计。

本文在分析现有答题卡结构与特点的基础上,考虑到通用性,方便用户使用普通激光打印机和普通A4复印纸就可打印答题卡,自行设计了答题卡模板,由六个分区构成,分别是①标题区、②考生信息填写区、③学号或准考证号填涂区、④答案填涂区、⑤信息提示区、⑥定位信息区,如图2所示。

数字图像处理(许录平着)课后答案(全)

数字图像处理(许录平着)课后答案(全)

= E ∫ e − jux
0
3
第三章要求 1. 2. 3. 4. 5. 6. 了解图像的几何变换; 了解图像的离散傅立叶变换,掌握其重要性质; 了解变换的一般表示形式; 了解图像的离散余弦变换的原理 ; 掌握图像的离散沃尔什-哈达玛变换; 了解 K-L 变换的原理。 必做题及参考答案
2
3.3 证明 f ( x) 的自相关函数的傅立叶变换就是 f ( x) 的功率谱(谱密度) F (u ) 。 证明: 根据相关定理 另根据共轭定义 又根据共轭对称性
则与时间 t 无关;对于单色图像(也称灰度图像) ,则波长λ为一常数;对于平面图像,则与坐标 z 无 关,故 f(x,y)表示平面上的静止灰度图像,它是一般图像 f ( x , y , z , λ , t ) 的一个特例。 1.6 一个数字图像处理系统由哪几个模块组成?试说明各模块的作用。 解答: 一个基本的数字图像处理系统由图像输入、图像存储、图像输出、图像通信、图像处理和分析 5 个模块组成,如下图所示。
∫ ∫ h ( x, y )e = ∫ dx ∫ Ee
−∞ 0 −∞ x+a −a − x−a
+∞
+∞
− jux − jvy
e
dxdy
a − x+a
− jux − jvy
e
dy + ∫ dx ∫
0
x−a
Ee− jux e− jvy dy
a 2sin v( x + a) 2sin v(− x + a) dx + E ∫ e − jux dx −a 0 v v 0 0 2sin v( x + a) 2sin v( x + a) dx − E ∫ e jux dx = E ∫ e − jux −a − a v v 2 E ⎡ 0 − jux e − e jux ) sin v( x + a )dx ⎤ = ( ∫ ⎢ ⎥ − a ⎦ v ⎣ 0 −4 jE ⎡ sin ux sin v( x + a )dx ⎤ = ⎥ ⎣ ∫− a ⎦ v ⎢ 4 jE ( u sin va − v sin ua ) = v (u 2 − v2 )

数字图象处理考试题及答案

数字图象处理考试题及答案

1.简述图像数字化的步骤,并说明分别会出现哪两种质量缺陷?请说明灰度变换缓慢的景物以及有大量细节的图像,在数字化时采用何种策略以确保图像质量。

什么是假轮廓?答:(1)将一幅图像从其原来的形式转换为数字形式的处理过程,包括“扫描"、“采样"与“量化”三个步骤,通常将“扫描”合并到“采样”阶段,合并为两个过程。

(2)质量缺陷:采样——马赛克;量化-—假轮廓。

(3)灰度变换缓慢的景物-—粗采样,细量化;有大量细节的图像——细采样,粗量化;(4)量化不够出现假轮廓2.数字图像处理主要应用有哪些?举例说明。

答:数字图像处理在生物医学、遥感、工业、军事、通信、公安等领域有着广泛的应用。

1)生物医学:显微图像、DNA分析、X光成像、超声成像、CT 等。

2)遥感航天:地图、气象、天文、交通等。

3) 通信方面:图像传输,影像传输等。

4) 工业应用:生产监控、CAD技术、产品检测等。

5)军事、公安领域:指纹识别、雷达侦测、地形识别等。

3.试说明图像处理系统的结构及每个环节的主要功能。

答:(1)输入:把图像信息输入到计算机中(扫描仪、数码相机);(2)存储器(3)处理器(4)输出:软(投影-断电消失)/硬拷贝(打印-永久性的)(5)网络传送:资源共享的平台4.什么是马赫带效应,如何利用这一效应对图像进行处理。

答:(1)所谓“马赫带效应(Mach band effect)”是指视觉的主观感受在亮度有变化的地方出现虚幻的明亮或黑暗的条纹,马赫带效应的出现是人类的视觉系统造成的。

生理学对马赫带效应的解释是:人类的视觉系统有增强边缘对比度的机制。

(马赫带效应(Mach Band Effect)是指有一定反差的图像临界部位在视觉上给人以特别白或特别黑的感觉。

人们在观察一条由均匀黑的区域和均匀白的区域形成的边界时,一般认为主观感受与某一点的投射强度或反射强度有关。

但实际情况并不是这样,人感觉到的是在亮度变化部位附近的暗区和亮区中分别存在着一条更黑和更白的条带,这就是所谓的马赫带。

基于数字图像处理技术的答题卡识别方法(图像处理课程练习)

基于数字图像处理技术的答题卡识别方法(图像处理课程练习)

××大学2013-2014学年第二学期课程考核《图像处理》综合设计报告基于数字图像处理技术的答题卡识别方法学号姓名班级日期本人郑重声明:本人认真、独立完成了查找资料、编写程序、撰写报告等考核任务。

签字:日期:摘要背景:随着科技的发展,电子与计算机技术的进步,答题卡的出现大大减轻教学工作者们批改试卷的工作量。

答题卡是光标阅读机输入信息的载体,是配套光标阅读机的各种信息录入表格的总称。

答题卡将用户需要的信息转化为可选择的选项,供用户涂写。

OMR是用光学扫描的方法来识别按一定格式印刷或书写的标记,并将其转换为计算机能接受的电信号的设备,并根据信息点的涂与未涂和格式文件设置将信息还原。

因此,如何将答题卡填涂的黑色区域识别出来并使用计算机进行处理是极为关键的。

本论文探索了有效识别答题卡的方法,以matlab为工具,基于数字图像处理技术对答题卡填涂区域进行了识别,并对识别的结果进行了处理,得到了结果。

本论文利用Hough 变换的直线检测技术检测图像的倾斜度,判断图像是否倾斜,对存在倾斜的图像进行旋转校正。

最终实现答题卡答案的定位和检测。

论文使用像素统计方法进行识别,利用黑白颜色灰度值的巨大差异对二值图像的灰度值进行累加并进行阈值判定,识别错误效率极低,能够准确的识别答题卡的涂卡标记。

关键词:Hough变换,答题卡识别,matlab,一、设计任务、目的和要求本设计以matlab为工具利用数字图像处理技术对答题卡进行了识别,并对识别结果进行了处理。

注意到答题卡在采集图像的过程中由于各种原因可能会产生图像倾斜、水平或垂直错位,要进行正确识别首先必须对其进行校正,再依据像素检索技术进行识别。

二、总体方案设计说明系统运行环境,编程软件平台,编码算法原理,算法流程图设计本系统运行在当今主流的Windows7系统,使用较新的MATLAB2012b进行设计。

在进行旋转校正时,先使用Hough变换检测出答题卡边缘直线,调用lines函数的参数得到倾斜角度并进行旋转变换从而消除答题卡倾斜状态。

模式识别与图像处理习题及解答

模式识别与图像处理习题及解答

A 64 和 64 B 56 和 64 C 56 和 56 D 48 和 56 4. 简答题 1 数字图像处理的主要内容是什么? 答案 数字图像处理概括地说主要包括如下几项内容:几何处理,算术处理,图像增强,图 像复原,图像重建,图像编码,图像识别,图像理解。 2 直方图均衡化处理的主要步骤是什么? 答案 1)统计原始图像的直方图; 2)根据给定的成像系统的最大动态范围和原始图像的灰度级来确定处理后的灰度级间隔; 3)根据求得的步长来求变换后的新灰度; 4)用处理后的新灰度代替处理前的灰度。 3 图像增强的目的是什么? 答案 图像增强是指按特定的需要突出一幅图像中的某些信息,同时,削弱或去除某些不需 要的信息的处理方法。 其主要目的是使处理后的图像对某种特定的应用来说, 比原始图像更 适用。因此,这类处理是为了某种应用目的而去改善图像质量的。 4 试述均值滤波和中值滤波的基本原理是什么? 答案 均值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值 的平均值代替。 中值滤波的基本原理是把数字图像或数字序列中一点的值用该点的一个邻域 中各点值的中值代替。 5 图像信息处理的主要方法有哪些? 答案 1)图像变换 2)图像增强 3)图像复原 4)图像压缩 5)图像重建 6 为什么一般情况下对离散图像的直方图均衡化并不能产生完全平坦的直方图? 答案 这是由于在均衡化的过程中,原直方图上有几个像素数较少的灰度级归并到一个新的 灰度级上, 而像素较多的灰度级间隔被拉大了。 这样减少了图像的灰度级以换取对比度的扩 大,却导致了不均匀的产生。 7 试分析说明图像形态学运算中开运算和闭运算分别在图像处理中的作用。 答案 开运算具有消除细小物体、在纤细点处分离物体和平滑较大物体的边界时又不明显得 改变其面积的作用。闭运算具有填充物体内细小空洞、连接临近物体、在不明显改变物体面 积的情况下平滑其边界的作用。 连续的开闭运算相结合可以去除二值化图像的噪声, 并平滑 其边界。

数字图像处理:部分课后习题参考答案

数字图像处理:部分课后习题参考答案

第一章1.连续图像中,图像为一个二维平面,(x,y)图像中的任意一点,f(x,y)为图像于(x,y)于处的值。

连续图像中,(x,y)的取值是连续的,f(x,y)也是连续的数字图像中,图像为一个由有限行有限列组成的二维平面,(i,j)为平面中的任意一点,g(i,j)则为图像在(i,j)处的灰度值,数字图像中,(i,j) 的取值是不连续的,只能取整数,对应第i行j列,g(i,j) 也是不连续的,表示图像i行j列处图像灰度值。

联系:数字图像g(i,j)是对连续图像f(x,y)经过采样和量化这两个步骤得到的。

其中g(i,j)=f(x,y)|x=i,y=j2. 图像工程的内容可分为图像处理、图像分析和图像理解三个层次,这三个层次既有联系又有区别,如下图所示。

图像处理的重点是图像之间进行的变换。

尽管人们常用图像处理泛指各种图像技术,但比较狭义的图像处理主要是对图像进行各种加工,以改善图像的视觉效果并为自动识别奠定基础,或对图像进行压缩编码以减少所需存储空间图像分析主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述。

如果说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的过程。

这里的数据可以是目标特征的测量结果,或是基于测量的符号表示,它们描述了目标的特点和性质。

图像理解的重点是在图像分析的基础上,进一步研究图像中各目标的性质和它们之间的相互联系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而指导和规划行动。

如果说图像分析主要以观察者为中心来研究客观世界,那么图像理解在一定程度上是以客观世界为中心,借助知识、经验等来把握整个客观世界(包括没有直接观察到的事物)的。

联系:图像处理、图像分析和图像理解处在三个抽象程度和数据量各有特点的不同层次上。

图像处理是比较低层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。

图像分析则进入了中层,分割和特征提取把原来以像素描述的图像转变成比较简洁的非图形式的描述。

数字图像处理习题与答案

数字图像处理习题与答案

单选题1、图象在计算机中是如何表示的?A.f(x,y)B.f(x,y,z)C.2D 图象用 f(x,y),3D图象用 f(x,y,z)D.0 和 1 表示正确答案: C2、图象的数字化为什么会丢失信息?A.采样丢失数据B.量化丢失数据C.压缩编码丢失数据D.采样和编码丢失数据正确答案: D3、8 位图象的灰阶范围是多少?A.0 和 1B.0 - 255C.0 - 256D.128正确答案: B4、下列哪一项不是二维图象的存储格式?A..bmpB..tifC..jpgD..dicom正确答案: D5、下列图象分类名称中,哪一项不是按图象传感器分类的?A.雷达图象B.近红外图象C.超声图象D.伪彩图象正确答案: D6、什么是伪彩图象?A.图象中每一个像素点用 RGB 分量表示B.图象中每一个像素点用 RGB 索引表示C.图象中每一个像素点用 HIS 分量表示D.图象中每一个像素点用 0 和 1 表示正确答案: B7、下列哪一项不属于医学图象的有哪些?A.MRI 图象B.CT 图象C.超声多普勒图象D.紫外图象正确答案: D8、下列有关不同模态的图象叙述正确的是?A.不同模态并不能呈现更多信息B.2D 和 3D 结合没故意义C.临床上不同模态的结合需求很高D.不同模态没有太大必要正确答案: C9、下列哪一项是数字图象处理的基本流程?A.图象预处理 -图象分割 -图象识别 -图象建模B.图象预处理 -图象识别 -图象分割 -图象建模C.图象预处理 -图象建模 -图象分割 -图象识别D.图象预处理 -图象建模 -图象识别 -图象分割正确答案: A10、什么是模式识别?A.通过计算机用数学的方法来对不同模式进行自动处理和判读B.通过人工用数学的方法来对不同模式进行自动处理和判读C.通过计算机用数学的方法来对不同模式进行人工处理和判读D.通过人工用数学的方法来对不同模式进行人工处理和判读正确答案: A11 、下列关于灰度直方图的描述不正确的是?A.灰度直方图与图象具有一一对应关系B.灰度直方图是一个分布函数C.利用灰度直方图可以采集到更加优秀的凸显 gD.灰度直方图的横轴表示灰阶,纵轴表示每一个灰阶的像素数量正确答案: A12、下列哪一项不是灰度直方图的特点A.描述了处于不同灰阶的像素数量B.将图象翻转不影响灰度直方图C.描述了每一个像素在图象中的位置D.将图象的一部份平移不会影响灰度直方图正确答案: C13 、下列关于灰度直方图和图象面积叙述正确的是?A.图象面积越大,灰度直方图的 Y 轴越长B.图象面积越大,灰度直方图的 X 轴越长C.灰度直方图按横轴积分得到的值就是图象的面积D.图象的面积与图象的灰度直方图没有关系正确答案: C14、下列关于灰度直方图的双峰性叙述错误的是?A.灰度直方图的双峰可以对应于图象中的前景和背景B.两个峰值中间的部份可以理解为两个高斯信号叠加的结果C.根据双峰可以简单地找到最优二值化的值D.最优二值化处于两个峰值之间正确答案: C15 、下列关于图象二值化叙述正确的是?A.二值化只能使用一个固定的阈值B.二值化后的图象有多个灰阶C.二值化后的图象惟独两个灰阶D.存在对任何图象都通用并且稳定的二值化算法正确答案: C16 、下列哪一个不是求取最优二值化值的算法?A.Otsu algorithmB.Entropy MethodC.Conjugate Gradient MethodD.Isodata algorithm正确答案: C17 、下列二值化和灰度直方图的关系叙述错误的是?A.通常灰度直方图的双峰对应于图象的前景和背景区域B.通过灰度直方图可以知道二值化的最佳阈值C.灰度直方图对二值化有很好的指导意义D.二值化求最佳阈值的过程通常包含分析直方图的步骤正确答案: B18、下列关于 Otsu 算法中“类间方差( between-classes varianc)e ”的描述错误的是?A.类间方差达到最大的情况下即为最优二值化值B.类间方差达到最小的情况下即为最优二值化值C.类间方差有机结合了前景和背景信息,是评价信息量多少的一个评价函数D.类间方差是根据前景部份的方差和背景部份的方差计算得到的正确答案: B19 、下面哪些效果无法通过卷积实现?A.降噪B.边缘检测C.平滑D.把灰度图象彩色化正确答案: D20、下列哪一项不属于图象卷积运算的过程A.卷积核中心挨次覆盖在图象上的每一个像素点上进行运算B.将卷积核覆盖上图象做运算前,要先将卷积核旋转 180 度C.卷积运算每一个步骤得到的值要存储新开的内存中,不能直接在原图上进行修改D.将卷积核的值直接与其覆盖的像素灰度值相乘并累加作为卷积核中心当前覆盖点正确答案: D21、卷积运算中,下列一项处理图象边缘的像素点的方法是错误的?....A.根据卷积核的大小,在图象边缘新增一圈像素点并根据图象边缘的像素进行插值B.在图象边缘进行卷积运算的时候,调整卷积核的大小C.根据卷积核的大小,忽略图象周围一圈的像素D.根据卷积核的大小,在图象周围先填充一圈纯黑或者纯白然后进行卷积运算正确答案: B22 、使用图象卷积操作的除噪方法不包括下列的哪一项?A.均值滤波B.高斯滤波C.开闭运算D.中值滤波正确答案: C23、下列哪个卷积核无法提取图象边缘?正确答案: A24、下列哪一项不是 ITK 的实现特点?A B C DA.使用模板编程实现,用户自由度高B.使用 Cmake 来配置和生产项目C.使用智能指针,自动删除废弃的对象D.仅支持 Window 平台正确答案: D25、下列关于 VTK 的描述错误的是?A.VTK 的类库是按面向对象的思想设计的B.VTK 具有跨平台的特性,支持多个操作系统平台C.VTK 提供了丰富地计算机图象学和图象处理方面的功能D.VTK 是用 C++ 实现的,所以要使用 VTK 只能用 C++ 来调用正确答案: D26、下列哪一项是欧拉距离的表达式正确答案: A27 、形态学操作不能用来做下列哪一项图象处理的操作?A.除噪B.边缘检测C.形状分析D.图象配准正确答案: D.... A B C D28、下列关于结构化要素( SE )描述正确的是?A.结构化要素的尺寸不能超过 3*3B.结构化要素与卷积核一样,原点只能在中心C.结构化要素记录了形态学操作中如何对图象进行平移D.结构化要素的不同对形态学操作的结果没有影响正确答案: C29 、下列关于二值形态学算法叙述错误的是?A.通过开闭运算的结合可以出去图象中的椒盐噪声B.对图象进行重复的开操作会不断产生新的不同的结果C.二值形态学操作包括了二值膨胀、二值腐蚀以及开闭运算D.二值膨胀可以使图象的前景区域扩大正确答案: B30、下列关于二值形态学操作性质描述正确的是?A.二值形态学不满足平移不变性B.通过把一个大的结构化要素分解成较小的结构化要素分别做形态学操作可以有效地提高速度C.二值腐蚀满足交换律D.二值腐蚀和膨胀是可逆的正确答案: B31、下列关于“Hit-and-Mis”s叙述不正确的是?A.通过 Hit-and-Miss可以得到轮廓线B.通过改变 SE 可以检测出不同类型的图案C.Hit-and-Miss是基于形态学的一个特定图案的检测器D.Hit-and-Miss无法检测孤立的点正确答案: D32 、下列关于“Pattern Spectrum”的叙述错误的是?A.Pattern Spectrum可以区分图象中不同尺寸的图案B.Pattern Spectrum可以区分图象中不同形状的图案C.Pattern Spectrum不需要不断重复形态学操作D.Pattern Spectrum在进行过程中需要变换 SE正确答案: C 33 、在计算图象的“distance transfor”m时,下列哪一项形态学操作需要重复进行? A.腐蚀 B.闭操作 C.膨胀 D.开操作正确答案: A 34 、下列关于图象的” distance transfor”m与”skeleton”的关系描述正确的是? A.根据 skeleton可以得到 distance transfor结果B.相同 SE,distance transfor到的结果中,所有邻域内的最大值点就是 skeletonC.不同 SE 对二者的结果都是没有影响的D.skeleton与 distance transfor是m两个不同的概念,没有任何关系正确答案: B35 、一个圆面图象的骨架是什么?A.圆心B.一组同心圆C.从圆心出发到圆边的射线D.一组螺旋线正确答案: A36、下列关于灰度形态学描述错误的是A.灰度腐蚀可使灰度变化更加剧烈B.闭操作可能会使图象变含糊C.开操作可能会使图象变含糊D.灰度膨胀会提高图象的整体亮度正确答案: A 37、下面关于受限制的膨胀算法( conditional dilat)io述不正确的是? A.受限制的膨胀算法可以用来进行灰度重建 B.受限制的膨胀算法需要不断重复灰度膨胀操作C.受限制的膨胀算法执行速度与 SE 的尺寸和形状无关 D.受限制的膨胀算法可以获取图象中的特定区域正确答案: C38 、下列哪一项不是彩色图象的色采空间?A.RGBB.ODBCC.CMYKD.HIS正确答案: B 39、下列关于彩色图象增强描述错误的是? A.使用颜色表的方式可以将灰度图象转化成伪彩图象 B.由于彩色图象获取环境的原因通常需要对图象的色采平衡度进行调整 C.RGB 空间比 HIS 空间更适合做图象对照度的调整D.HIS 空间下进行彩色图象调整在视觉上效果比较直观正确答案: C40、下列关于 HIS 色采空间的描述错误的是?A.通过调整图象的色相可以调整图象的色温B.通过调整图象的亮度可以调整图象的色温C.HIS 色采空间杜宇彩色图象的某些特定操作非常直观方便D.通过调整图象的饱和度来调整图象的对照度正确答案: B41 、下面关于光学断层成像叙述错误的是?A.在对样本进行切片时可能会损坏样本的三维结构B.使用光学断层成像是三维成像的一种方式C.使用光学断层成像可以保留切片与切片之间的相关性D.光学断层成像是通过将样本进行切片来获取样本的三维信息正确答案: C 42、以下四类方法的分割结果按可重复性( Reproducibili y从大到小排序正确的是: A.全自动分割,自动分割后手工修正,手工勾画大体轮廓后自动分割,纯手工分割 B.全自动分割,手工勾画大体轮廓后自动分割,自动分割后手工修正,纯手工分割 C.全自动分割,手工勾画大体轮廓后自动分割,纯手工分割,自动分割后手工修正 D.纯手工分割,自动分割后手工修正,手工勾画大体轮廓后自动分割,全自动分割正确答案: B43、在 DDC 中,当轮廓进行形变后,需要对轮廓进行重采样( Resampling )的原因不包括:A.轮廓上每一个控制点运动后,会产生控制点空间上疏密的变化B.控制点太稀疏不能有效地表示轮廓C.控制点太密会影响到整个运算过程的存储、速度D.需要通过重采样对轮廓进行平滑正确答案: D 44、以 DDC 为例的可变形模型( Deformable model )的特点不正确的是: A. 自动改变轮廓形状以匹配图象边界 B.初始轮廓需要接近图象边界 C.各个参数的选择会影响最终的结果 D.高斯平滑参数越大分割结果越好正确答案: D45、可变形模型( Deformable model )的研究包括:A.定义不同的能量模型B.轮廓的表示方式,如不封闭的轮廓的描述C.整合分割目标的其他信息,如形状模型、灰度分布模型等D.其他三项均是正确答案: D 46、关于水平集( Level se 算法以下各项错误的是: A.通过增加一个维度后的零水平集来表示轮廓B.在水平集的演化过程中,惟独在零水平集,即轮廓处才有速度C.在实际运用中,可以采用快速行进 ( Fast marching) 与水平集的组合,以提高运算速度同时保证最后结果的精确D.水平集算法可以分割三维的数据正确答案: B47、水平集相比于蛇形算法( snake )的好处不包括:A.可以容易地对多个目标进行分割B.可以容易地表示复杂的结构C.对初始轮廓的敏感性相对较小D.用水平集表示轮廓占用的存储空间更小正确答案: D48、以下描述不能用于进行图象分割的是A.对图象进行二值化B.给图象中的区域标出适当标签(Label)C.跟据特征对象素进行分类D.检测图象中是否存在感兴趣的物体正确答案: D49、以下说法不是指的图象的配准(registratio)n的是A.图象的融合( fusion)B.图象的叠加( superimposition)C.图象的匹配( matching )D.图象间的加法( sum )正确答案: D50、图象配准不能完成的是A.同一病人头部 2D 图象与 3D 图象的匹配B.同一病人脑部不同成像方式得到的图象(如 SPECT 图象与 MRI 图象)的融合C.仅有同一个病人头部与腹部的 CT 图象数据,实现两组图象的对齐D.病人头部图象与标准解剖图谱(Atlas)的匹配正确答案: C51、以下说法不正确的是A.手术切除肿瘤先后的影像可以配准B.不同病人的头部影像可以配准C.同一病人整个头部的影像与部份大脑的影像不能配准D.术中影像和术前影像可以配准正确答案: C52、图象配准中不一定会用到的是A.图象插值( Interpolatio)nB.确定图象间的相似性测度( Similarity metr)icC.迭代进行最优化(Optimization)D.图象二值化正确答案: D53 、以下衡量两幅图象相似性并使之达到最佳匹配的方式错误的是:A.最大化两幅图象间的互信息( Mutual information)B.最大化对应的特征点( Landmark )之间的平方距离( Squared distance)之和C.最小化两个对应的面之间的距离测度D.最小化两幅图象间对应像素间灰度值的均方误差正确答案: B54、以下关于重采样( Resampling )的说法错误的是:A.上采样(Super-Sampling)后像素点数目增多B.通过对图象上采样可以获得比原图象更多的信息C.下采样( Sub-Sampling )后,每一个像素点对应的实际空间范围增大D.下采样后,对图象进行显示,若保持每一个像素大小不变,则显示出的图象比原图象变小正确答案: B55、以下关于线性配准( linear registrat)io说法不正确的是:A.刚体配准( rigid registrat)io图象的变换包括平移( translatio)n和旋转 (rotation)B.仿射变换( affine transformati)on是线性变换C.常用的仿射变换包括平移( translatio)n 、旋转( rotation、) 缩放( scaling)和剪切 ( shear)D.线性配准等同于刚体配准正确答案: D56、关于非刚体配准下列说法错误的是:A.可以用薄板样条( Thin plate spli)ne描述非线性形变( Non-linear deformatio)nB.三次b 样条( Cubic B-splin)e 可以用来描述非线性形变C.图象若干个局部发生刚体变换,整体来看发生的仍然是刚体变换D.非刚体形变的自由度要大于刚体形变正确答案: C57、以下关于两幅彻底相同的图象间相似性测度( Similarity metri)cs的说法不正确的是:A.均方误差( Mean squared error)理想值为 0B.正规化的互相关( Normalized cross correlat o理n想值为 0C.理想的联合直方图( Joint histogra彻底集中在对角线上D.正规化的互信息( Normalized mutual informatio)n理想值为 2正确答案: B58、对于彻底相同的两幅图象,将其中一幅图象的灰度值增加到原来的 150% ,则下列说法错误的是:A.正规化的互相关( Normalized cross correlat o理n想值将小于 1B.均方误差( Mean squared error)理想值将大于 0C.理想的联合直方图( Joint histogra彻底集中在一条直线上,但再也不是对角线D.正规化的互信息( Normalized mutual informatio)n理想值仍为 2正确答案: A59、以下关于互信息( Mutual information) 以及联合熵( Joint entrop 的叙述错误的是:A.联合熵的大小是对联合直方图( Joint histogra的分散程度的描述B.互信息具有对称性,即 I(A,B)=I(B,A)C.互信息与联合熵是彻底等价的描述D.当 A,B 之间相互独立时互信息为 0, I(A,B)=0正确答案: C60、使用多解像度( multi-resoluti n图象配准的原因不包括:A.加快配准速度B.图象的细节在配准中是彻底没实用的C.增强配准鲁棒性( Robustness )D.避免陷入局部最优值正确答案: B。

图像处理练习题

图像处理练习题

图像处理练习题图像处理是计算机视觉领域中非常重要的一项技术。

通过对图像进行处理和分析,可以实现图像增强、图像压缩、目标检测等多种应用。

为了提高自己的图像处理能力,下面将给出一些图像处理练习题,供大家练习和思考。

一、边缘检测边缘检测是图像处理中常用的基本操作。

请写出一段代码,使用Sobel算子对给定的图像进行边缘检测,并显示出检测结果。

二、图像滤波图像滤波可以在去除图像中的噪声的同时,平滑图像并保留图像中的细节信息。

请编写一段代码,对给定的图像进行高斯滤波,并显示出滤波后的图像。

三、灰度化和二值化灰度化和二值化是图像预处理中常用的操作。

请编写一段代码,将给定的彩色图像转换为灰度图像,并进行二值化处理。

四、图像分割图像分割是将图像分成若干个互不重叠的子区域的过程。

请编写一段代码,实现常用的基于阈值的图像分割方法,并显示出分割结果。

五、图像拼接图像拼接是将多张图像拼接成一张大图的过程。

请编写一段代码,实现将多张给定图像按照一定的规则进行拼接,并显示出拼接后的结果。

六、图像变换图像变换可以将图像从一个空间转换到另一个空间,常见的有图像的旋转、缩放等操作。

请编写一段代码,实现给定图像的旋转和缩放,并显示出变换后的图像。

七、图像修复图像修复是修复受损图像的过程,常见的损伤包括噪声、模糊等。

请编写一段代码,对给定的受损图像进行修复,并显示出修复后的结果。

以上是一些图像处理练习题,通过完成这些题目,可以提高自己的图像处理能力。

希望大家能够认真练习,加深对图像处理的理解和掌握。

祝大家取得好成绩!。

数字图像处理试题 (3)

数字图像处理试题 (3)

数字图像处理试题一、简答题(50分)1.什么是数字图像处理?数字图像处理是指利用计算机对图像进行获取、存储、传输、表达、处理和分析的技术和方法。

2.请简要描述数字图像处理算法的基本流程。

数字图像处理算法的基本流程包括图像预处理、图像增强、图像恢复、图像压缩和图像分割等几个主要步骤。

–图像预处理:对图像进行去噪、平滑、锐化等处理,以减小后续处理的难度。

–图像增强:通过灰度变换、直方图均衡化、滤波等手段,改善图像的质量和视觉效果。

–图像恢复:利用图像处理技术对受损图像进行修复和恢复,使其更接近原始图像。

–图像压缩:采用编码算法对图像进行压缩,以减小图像文件的大小。

–图像分割:将图像划分为多个子区域,从而实现对图像的分析和理解。

3.什么是图像灰度?图像灰度是指图像中某个像素点的亮度值。

通常使用一个0到255之间的数值表示图像像素的灰度,其中0代表黑色,255代表白色。

4.请简要描述直方图均衡化的原理。

直方图均衡化是一种图像增强的方法,通过调整图像像素的灰度分布,提高图像的对比度和视觉效果。

直方图均衡化的原理如下:–统计图像的直方图,得到原始图像的灰度分布情况。

–计算累积分布函数(CDF),将原始图像的累积直方图均匀化,使得像素灰度值分布更加均匀。

–通过将新的累积直方图映射回原始图像,得到增强后的图像。

5.什么是图像滤波?图像滤波是一种图像处理技术,通过在空间域或频域对图像进行卷积操作,实现图像的平滑、锐化或其他特定的滤波效果。

6.请简要解释图像压缩的概念。

图像压缩是指通过编码算法,将图像数据从原始的表示方式转换为更紧凑的表示方式,以减小图像文件的大小和存储空间。

图像压缩分为有损压缩和无损压缩两种方式。

有损压缩会丢失一定的图像细节,而无损压缩则可以完全恢复原始图像。

常用的图像压缩算法有JPEG和PNG。

7.简要论述数字图像处理在现实生活中的应用。

数字图像处理在现实生活中有很多应用,包括:–医学影像处理:用于医学诊断和治疗,如CT扫描、MRI图像处理。

(完整版)数字图像处理课后题答案

(完整版)数字图像处理课后题答案

1. 图像处理的主要方法分几大类?答:图字图像处理方法分为大两类:空间域处理(空域法)和变换域处理(频域法)。

空域法:直接对获取的数字图像进行处理。

频域法:对先对获取的数字图像进行正交变换,得到变换系数阵列,然后再进行处理,最后再逆变换到空间域,得到图像的处理结果2. 图像处理的主要内容是什么?答:图形数字化(图像获取):把连续图像用一组数字表示,便于用计算机分析处理。

图像变换:对图像进行正交变换,以便进行处理。

图像增强:对图像的某些特征进行强调或锐化而不增加图像的相关数据。

图像复原:去除图像中的噪声干扰和模糊,恢复图像的客观面目。

图像编码:在满足一定的图形质量要求下对图像进行编码,可以压缩表示图像的数据。

图像分析:对图像中感兴趣的目标进行检测和测量,从而获得所需的客观信息。

图像识别:找到图像的特征,以便进一步处理。

图像理解:在图像分析的基础上得出对图像内容含义的理解及解释,从而指导和规划行为。

3. 名词解释:灰度、像素、图像分辨率、图像深度、图像数据量。

答:像素:在卫星图像上,由卫星传感器记录下的最小的分立要素(有空间分量和谱分量两种)。

通常,表示图像的二维数组是连续的,将连续参数 x,y ,和 f 取离散值后,图像被分割成很多小的网格,每个网格即为像素 图像分辨率:指对原始图像的采样分辨率,即图像水平或垂直方向单位长度上所包含的采样点数。

单位是“像素点/单位长度”图像深度是指存储每个像素所用的位数,也用于量度图像的色彩分辨率.图像深度确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数.它决定了彩色图像中可出现的最多颜色数,或灰度图像中的最大灰度等级(图像深度:位图图像中,各像素点的亮度或色彩信息用二进制数位来表示,这一数据位的位数即为像素深度,也叫图像深度。

图像深度越深,能够表现的颜色数量越多,图像的色彩也越丰富。

)图像数据量:图像数据量是一幅图像的总像素点数目与每个像素点所需字节数的乘积。

数字图像处理考试答案

数字图像处理考试答案

一、名词解释1、图像锐化图像锐化就是补偿图像的轮廓,增强图像的边缘及灰度跳变的部分,使图像变得清晰,亦分空域处理和频域处理两类。

2、图像平滑图像平滑是指用于突出图像的宽大区域、低频成分、主干部分或抑制图像噪声和干扰高频成分,使图像亮度平缓渐变,减小突变梯度,改善图像质量的图像处理方法。

图像平滑的方法包括:插值方法,线性平滑方法,卷积法等等。

3、图像复原利用退化过程的先验知识,建立退化过程的数学模型,使已退化的图像恢复本来面目。

“退化” 的逆过程。

课件:以图像退化的数学模型为基础,来改善图像质量。

4、HSI 模型HSI 颜色模型用 H、S、I 三参数描述颜色特性,其中 H 定义颜色的波长,称为色调;S 表示颜色的深浅程度,称为饱和度;I 表示强度或亮度。

HSI 颜色模型对于开发基于彩色描述的图像处理方法是一个理想的工具。

5、有损压缩所谓有损压缩是利用了人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响缩小,却换来了大得多的压缩比。

有损压缩广泛应用于语音,图像和视频数据的压缩。

课件:有损压缩是通过牺牲图像的准确率以实现较大的压缩率,如果容许解压图像有一定的误差,则压缩率可显著提高。

有损压缩在压缩比大于 30:1 时仍然可重构图像,而如果压缩比为 10:1 到 20:1,则重构的图像与原图几乎没有差别 66、无损压缩所谓无损压缩格式,是利用数据的统计冗余进行压缩,可完全回复原始数据而不引起任何失真,但压缩率是受到数据统计冗余度的理论限制,一般为 2:1 到 5:1 的压缩。

课件:无损压缩算法中删除的仅仅是图像数据中冗的信息,因此在解压缩时能精确恢复原图像,无损压缩的压缩比很少有能超过 3:1 的,常用于要求高的场合。

7、数字图像数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。

数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。

数字图像处理简答题及答案

数字图像处理简答题及答案

数字图像处理简答题及答案数字图像处理是计算机科学在计算机视觉领域内的一个重要分支。

以下是一些数字图像处理的简答题及其答案,希望可以对读者们有所帮助。

1. 什么是数字图像?数字图像由像素组成,每个像素代表着一个颜色值。

这些颜色值可以用数字来描述并归纳在一起,形成一幅数字图像。

数字图像的存储格式可以是各种各样的文件格式,例如JPEG、PNG或BMP等。

2. 数字图像的分辨率是什么?数字图像的分辨率指的是图像的像素数量。

它用于描述数字图像的清晰程度和细节水平。

分辨率越高,图像越清晰,但文件大小也会变大。

分辨率可以通过增加或减少像素的数量来改变。

3. 数字图像的预处理有哪些步骤?数字图像预处理是指在应用特定算法或进行分析之前对图像进行处理的过程。

它包括以下步骤:•去除噪音:去除数字图像中的噪音,以免影响数据分析的结果。

例如,可以通过使用中值滤波器或高斯滤波器来去噪。

•改善亮度和对比度:可以使用各种直方图均衡化的技术来增加图像的对比度,使得图像更加清晰。

•图像尺寸调整:对图像进行裁剪或缩放以适应特定的应用场景。

4. 什么是二值化?二值化是将数字图像转换为黑白图像的过程。

在二值化后,图像中仅有黑色和白色两种颜色。

该过程非常常见,因为在很多情况下,黑白图像比彩色图像更容易处理和分析。

5. 数字图像中的卷积操作是什么?卷积操作是一种数字图像处理技术,用于应用各种滤波器。

它通过将窗口与图像上的每个像素进行逐个计算,从而改变图像中像素的值。

这个窗口通常是一个小的矩形或圆形区域,该区域指定了卷积核的形状和尺寸。

6. Hough 变换是什么?Hough 变换是一种在数字图像处理中用于检测几何形状的技术。

它可以检测相对于垂直方向出现的任何形状,例如直线、圆周、平面等。

7. 什么是图像语义分割?图像语义分割是指将图像中的像素分成不同的区域,并根据像素的语义进行分类。

这通常涉及到使用深度学习算法,例如卷积神经网络(CNN),以对像素进行分类和标记功能区域。

数字图像处理高级考试试题

数字图像处理高级考试试题

数字图像处理高级考试试题一、简答题1. 什么是数字图像处理?数字图像处理是利用计算机对图像进行处理和分析的一门学科,旨在改善或增强图像的质量和获取图像中的有用信息。

2. 数字图像处理的主要步骤有哪些?主要步骤包括图像获取、预处理、增强、恢复、压缩、分割和识别等。

3. 描述图像的灰度直方图。

灰度直方图是表示图像中每个灰度级出现的频率的统计图。

横坐标表示灰度级别,纵坐标表示该灰度级别下的像素数目。

4. 什么是图像增强?图像增强是指使用各种方法来改善或凸显图像的某些特征,使图像更加清晰、鲜明以及易于观察和分析。

5. 图像压缩有哪些常用的方法?常用的压缩方法包括无损压缩(如RLE、Huffman编码)和有损压缩(如JPEG、JPEG2000)。

二、计算题1. 请计算给定图像的平均灰度值和标准差。

解:(计算步骤根据实际情况给出,或者直接给出计算结果)2. 假设对一幅图像进行直方图均衡化,具体步骤如下:a) 绘制原始图像的灰度直方图。

b) 计算累积分布函数。

c) 根据累积分布函数对原始图像进行直方图均衡化。

请根据以上步骤对一幅给定的图像进行直方图均衡化。

解:(根据实际情况给出计算步骤和处理结果)三、图像处理算法题1. 请设计并实现一个边缘检测算法。

解:(根据实际情况给出算法设计、伪代码或者代码实现)2. 请设计并实现一个图像模糊算法。

解:(根据实际情况给出算法设计、伪代码或者代码实现)四、论述题1. 论述频域滤波和空域滤波的优缺点,并给出各自适用的场景。

解:(根据实际情况给出论述和分析)2. 请从图像处理的角度探讨深度学习在图像识别中的应用。

解:(根据实际情况给出论述和分析)总结:数字图像处理是一门与计算机图像相关的学科,随着计算机技术的不断发展,其在多个领域有着广泛的应用。

本考试试题涵盖了数字图像处理的基本概念、常见算法和应用场景,希望能够检验考生对该领域的理论知识和实际应用能力。

希望考生能够认真答题,展示自己的能力。

基于图像识别的答题卡识别系统的设计与实现

基于图像识别的答题卡识别系统的设计与实现

基于图像识别的答题卡识别系统的设计与实现作者:陈伟华来源:《卷宗》2015年第01期摘要:本文综合运用图像处理,模式识别的理论来构建答题卡的识别系统。

当前使用的答题卡阅读机,均采用光反射阅读方式。

要求使用指定的铅笔,按严格的格式涂填。

这与平时的习惯差距较大,容易发生人为失误。

这里,采用图象处理和模式识别技术,对答题卡进行阅读,希望解决对书写工具约束、需要特制答题卡等问题。

实现了答题卡的计算机识别,采用打钩的方法答题,方便,快速。

关键词:灰度分割;夹线法;小波变换;霍夫变换;区域连通针对答题卡的识别,光电识别技术已是应用多年的成熟技术,在世界范围内广泛使用,而基于影像模式的OMR识别技术,识别准确率超过了传统光标OMR阅读机,但是其两者都对其填题方式进行了限制,即应用2B铅笔填涂,超出答题区域在方框外答题的,答案无效,这很大程度上减慢了考生的填题时间,并都存在其误率,如机械传动机构复杂、使用寿命短、维护量大、设备一致性差、答题卡出现污点[1]等。

本文设计的系统支持考生使用任何深色笔做答,且最大程度上放宽了对填图区域的限制,最大优点在于考生可以使用划钩子或其他方式来选择答案,系统采用图像处理和模式识别技术来自动识别答题卡信息,方便且快速。

1 系统设计流程(一)读取并显示BMP图象,读取的BMP图像如图1所示。

图1 原始答题卡(二)运用双峰算法计算阈值,二值化图象,二值化后的图像如图2所示。

图2 二值化后的图像(三)运用夹线法求水平与垂直的各投影线,处理后的图像如图3所示。

图3 夹线法求水平与垂直的各投影线(四)对图象进行水平与垂直投影,小波变换求投影线中点坐标,处理后的图像如图4所示。

图4小波变换求投影线中点坐标(五)根据色调的不同,二值化提取钩子,处理后的图像如图5所示。

图5二值化提取钩子(六)识别图像得到结果图,如图6所示。

图6输出结果图2 系统主要实现技术(一)求水平和垂直投影线算法的实现用两条间距较小的水平夹线平移至线条两端,横向扫描两条直线间的象素点,记录每水平行象素点的个数,如果大于一定的值,则其为一直线,取其中一条象素点最多的作为水平投影线。

基于hough变换的答题卡识别

基于hough变换的答题卡识别

第37卷第3期 计算机应用与软件Vol 37No.32020年3月 ComputerApplicationsandSoftwareMar.2020基于Hough变换的答题卡识别罗朝阳1 张鹏超2 姚晋晋1 王 彦1 赵瑞杰11(陕西理工大学机械工程学院 陕西汉中723000)2(陕西省工业自动化重点实验室 陕西汉中723000)收稿日期:2019-03-22。

陕西省工业科技攻关项目(2016 GY070);陕南秦巴山区生物资源综合开发协同创新项目(QBX 17 7)。

罗朝阳,硕士生,主研领域:图像处理。

张鹏超,教授。

姚晋晋,硕士生。

王彦,硕士生。

赵瑞杰,硕士生。

摘 要 针对光电式阅卷机价格昂贵,使用成本高,设备利用率低的缺点,提出一种基于Hough变换的答题卡识别方法。

运用数字图像处理的手段,对答题卡图像进行灰度拉伸、图像滤波、图像二值化等预处理;依据Hough变换的直线建立选项网;根据填涂区域的几何属性进行识别判断。

测试结果表明,该算法对于答题卡的识别具有高效率、高准确率、使用方便、成本低廉的特点,具有一定的应用价值。

关键词 Hough变换 自动阅卷 图像识别 答题卡中图分类号 TP391.43 文献标志码 A DOI:10.3969/j.issn.1000 386x.2020.03.042ANSWERSHEETRECOGNITIONBASEDONHOUGHTRANSFORMLuoZhaoyang1 ZhangPengchao2 YaoJinjin1 WangYan1 ZhaoRuijie11(SchoolofMechanicalEngineering,ShaanxiUniversityofTechnology,Hanzhong723000,Shaanxi,China)2(ShaanxiKeyLaboratoryofIndustrialAutomation,Hanzhong723000,Shaanxi,China)Abstract Aimingatthedisadvantagesoftheopticalmarkreader,suchashighprice,highcostandlowutilizationrateofequipment,thispaperproposesananswersheetrecognitionmethodbasedontheHoughtransformation.Bymeansofdigitalimageprocessing,grey scalestretching,imagefiltering,imagebinarizationandotherpretreatmentswerecarriedoutontheanswersheetimages.AccordingtolineoftheHoughtransformation,theselectionnetworkwasestablished.Finally,werecognizedandidentifiedonthebasisofthegeometricpropertiesofthefilledarea.Thetestresultsshowthatthealgorithmhasthecharacteristicsofhighefficiencyandhighaccuracyfortherecognitionoftheanswersheet.Anditiseasytouseandlowcost,andhascertainapplicationvalue.Keywords Houghtransform Automaticscoring Imagerecognition Answersheet0 引 言考试是教育测量的重要手段,也是目前选拔人才的重要手段。

最新 图像处理耦合模板定位的答题卡识别研究与应用-精品

最新 图像处理耦合模板定位的答题卡识别研究与应用-精品

摘要:当前大多数机器阅卷中采用的识别算法基于模糊识别,即针对某类型的试卷,更换多种试卷或者同种试卷不同采集方式下很难准确对应,具有一定的局限性。

对此,本文提出一个基于OpenCV耦合模板定位的答题卡识别机制。

首先基于人机交互划定学号区与客观题区;然后基于图像处理算法定位得到填涂位置,评价填涂结果,完成答题卡识别。

本系统模板制作模块由C#编程实现,答题卡识别由C++和OpenCV实现。

最后测试本文机制性能,结果表明:与基于模糊识别的普通方法相比,本文机制具有更好的定位效果和识别准确度。

关键词:模板定位;OpenCV;人机交互;模糊识别;图像处理中图分类号:TP391文献标识码:A 1引言答题卡识别系统是针对客观题答案进行检测识别的应用性软硬件的综合,目前使用的答题卡识别系统具有阅卷速度快、效率高、准确率高等优点,但也存在一定的局限性,必须采用光电阅卷机和专用机读答题卡,成本高昂,普通学校难以承受;且一旦确定规格就难以修改[1-3]。

而利用价格相对低廉的数码相机或复印机作为图像数据输入设备采集答题卡图像,再经过软件处理、识别将获得的考试信息存入数据库,同样可以实现自动阅卷的目的,并可以降低设备成本[4-6]。

而且软件实现方式方便修改答题卡结构以适应不同需求易于普及推广。

基于软件处理的答题卡识别主要应用图像处理与识别算法,总体分为两种模式:第一种是模糊识别,以答题卡图像中某特定目标为参照进行识别,然后根据位置信息定位客观题区域,然后进行识别,实现答题卡信息读取。

第二种是先模板制作,然后根据模板定位客观题位置,进行识别,实现答题卡信息读取。

第一种方式,由于依靠特定目标,在更换试卷类型同样存在识别不准的问题。

第二种方式,在前期基于人机交互,用软件制作出模板,可对应于试卷类型变更。

本文研究的机制就是采用第二种方式,先基于C#编程实现模板制作软件的开发,得到模板信息即客观题位置信息;然后用图像处理的方式对客观题进行识别,完成答题卡识别。

opencv矩形答题卡案例

opencv矩形答题卡案例

opencv矩形答题卡案例
OpenCV是一个广泛应用于计算机视觉领域的开源库,它提供了丰富的图像处理和计算机视觉算法。

在矩形答题卡的应用中,OpenCV 可以帮助我们实现答题卡的检测和识别功能。

在这个案例中,我们将使用OpenCV来检测和识别矩形答题卡中的选项。

首先,我们需要读取答题卡图像,并将其转换为灰度图像。

接下来,我们可以通过应用Canny边缘检测算法来检测答题卡中的边缘。

一旦我们得到了答题卡的边缘,我们可以使用霍夫变换来检测出矩形轮廓。

通过设置合适的参数,我们可以过滤掉不是矩形的轮廓,从而得到答题卡的外接矩形。

接下来的步骤是根据答题卡的外接矩形进行透视变换,将答题卡变换为标准的矩形形式。

通过透视变换,我们可以将答题卡上的选项对齐为一个矩形矩阵,方便后续的处理。

现在,我们可以在每个选项的位置上进行切割并进行识别。

为了识别选项,我们可以将每个选项的图像转换为灰度图像,并应用二值化算法来得到二值图像。

然后,我们可以使用OCR(光学字符识别)算法来识别每个选项的文字。

最后,我们可以将识别出的选项与正确答案进行比较,并计算出答题卡的得分。

通过将检测和识别的过程封装为一个函数,我们可以很方便地在多个答题卡图像上进行批量处理。

总结来说,OpenCV提供了强大的图像处理和计算机视觉算法,可以帮助我们实现矩形答题卡的检测和识别功能。

通过使用OpenCV,我们可以自动化答题卡的处理过程,提高效率并降低错误率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

××大学2013-2014学年第二学期课程考核《图像处理》综合设计报告基于数字图像处理技术的答题卡识别方法学号姓名班级日期本人郑重声明:本人认真、独立完成了查找资料、编写程序、撰写报告等考核任务。

签字:日期:摘要背景:随着科技的发展,电子与计算机技术的进步,答题卡的出现大大减轻教学工作者们批改试卷的工作量。

答题卡是光标阅读机输入信息的载体,是配套光标阅读机的各种信息录入表格的总称。

答题卡将用户需要的信息转化为可选择的选项,供用户涂写。

OMR是用光学扫描的方法来识别按一定格式印刷或书写的标记,并将其转换为计算机能接受的电信号的设备,并根据信息点的涂与未涂和格式文件设置将信息还原。

因此,如何将答题卡填涂的黑色区域识别出来并使用计算机进行处理是极为关键的。

本论文探索了有效识别答题卡的方法,以matlab为工具,基于数字图像处理技术对答题卡填涂区域进行了识别,并对识别的结果进行了处理,得到了结果。

本论文利用Hough 变换的直线检测技术检测图像的倾斜度,判断图像是否倾斜,对存在倾斜的图像进行旋转校正。

最终实现答题卡答案的定位和检测。

论文使用像素统计方法进行识别,利用黑白颜色灰度值的巨大差异对二值图像的灰度值进行累加并进行阈值判定,识别错误效率极低,能够准确的识别答题卡的涂卡标记。

关键词:Hough变换,答题卡识别,matlab,一、设计任务、目的和要求本设计以matlab为工具利用数字图像处理技术对答题卡进行了识别,并对识别结果进行了处理。

注意到答题卡在采集图像的过程中由于各种原因可能会产生图像倾斜、水平或垂直错位,要进行正确识别首先必须对其进行校正,再依据像素检索技术进行识别。

二、总体方案设计说明系统运行环境,编程软件平台,编码算法原理,算法流程图设计本系统运行在当今主流的Windows7系统,使用较新的MATLAB2012b进行设计。

在进行旋转校正时,先使用Hough变换检测出答题卡边缘直线,调用lines函数的参数得到倾斜角度并进行旋转变换从而消除答题卡倾斜状态。

将扫描部分分为7个扫描区域,分别使用像素检索技术,对各个检索区域内的灰度值进行累加,并对累加和进行阈值判定,从而得出检索区域颜色,完成判定。

最后再与标准答案进行比对,得出成绩。

流程图:三、程序设计clc;clear;close;A=imread('原图.jpg');%读取图像imshow(A),title('原图');gray=rgb2gray(A);bw=edge(gray,'canny');%canny算子边缘检测得到二值边缘图像[h,t,r]=hough(bw,'RhoResolution',0.5,'ThetaResolution',0.5); %Ho ugh变换figure,imshow(imadjust(mat2gray(h)),'XData',t,'YData',r,'InitialMagnification','fit'),titl e('Hough变换矩阵');%显示Hough变换矩阵xlabel('\theta'),ylabel('\rho');axis on, axis normal,hold on;P=houghpeaks(h,2);x=t(P(:,2));y=r(P(:,1));plot(x,y,'s','color','r'),title('');%获取并标出参数平面的峰值点lines=houghlines(bw,t,r,P,'FillGap',5,'Minlength',7);%检测图像中的直线段figure,imshow(gray);hold on;max_len=0;for i=1:length(lines)xy=[lines(i).point1;lines(i).point2];plot(xy(:,1),xy(:,2),'LineWidth',2,'Color','g');%用绿色线段标注直线段plot(xy(:,1),xy(1,2),'x','LineWidth',2,'Color','y');plot(xy(:,1),xy(2,2),'x','LineWidth',2,'Color','r');%标注直线段端点endx=lines.theta;%由与图像边缘平行的直线段的斜率得到整个图像旋转的角度B=imrotate(gray,x);%图像修正figure,imshow(B),title('旋转后图像');T=graythresh(B);%使用OTSU方法获得阀值Tresult=im2bw(B,T);%二值化图像figure,imshow(result),title('二值化后结果');%扫描区域:在本程序中,有7个扫描区域,分别对应题号为1-5,6-10,11-15,16-20,21-25,26-30,31-35这几个区域n=52;m=244;% 首先测得答题区域第一题A选项左上角的坐标(52,244)s=60;t=90;%s为上下两个扫描区域的距离,t为左右两个扫描区域的距离。

P=4;Q=5;%P为字母项的个数(这里有ABCD共有4项),Q为每个小区域选项数。

interval_length=14;%左右相邻两题填涂区域左边线的距离interval_width=9;%上下相邻两题填涂区域上边线的距离length=11;%填涂区域的长度width=6;%填涂区域的宽度a2=zeros(4,5);%初始化灰度值统计矩阵%第1-5题区域的检测for P=1:4for Q=1:5%m=244;n=52;%第1-5题区域的检测的起始坐标(即第一题A选项左上角的坐标)a1=result(m+(P-1)*(interval_width+1) :m+(P-1)*(interval_width+1)+width,n+(Q-1)* (interval_length+1):n+(Q-1)*(interval_length+1)+length);%得到矩形区域内各像素的灰度值sum1=sum(sum(a1));%计算统计的矩形区域内像素灰度值之和a2(P,Q)=sum1;%多次循环后得到20个统计区域的灰度值,并依次放在a2矩阵中endenda2(a2<80)=1;a2(a2>=81)=0;%对灰度值统计矩阵里的数值进行处理,大于某一阀值的值赋1,其余的赋0。

%在此程序中,涂黑则相应数值为1。

result1_5=a2;%存储1-5题的结果%第6-10题区域的检测for P=1:4for Q=1:5a1=result(m+s*1+(P-1)*(interval_width+1) :m+s*1+(P-1)*(interval_width+1)+width, n+(Q-1)*(interval_length+1):n+(Q-1)*(interval_length+1)+length);sum1=sum(sum(a1));a2(P,Q)=sum1;endenda2(a2<80)=1;a2(a2>=81)=0;result6_10=a2; %存储6-10题的结果%第11-15题区域的检测for P=1:4for Q=1:5a1=result(m+(P-1)*(interval_width+1) :m+(P-1)*(interval_width+1)+width,n+t*1+(Q -1)*(interval_length+1):n+t*1+(Q-1)*(interval_length+1)+length);sum1=sum(sum(a1));a2(P,Q)=sum1;endenda2(a2<80)=1;a2(a2>=81)=0;result11_15=a2; %存储11-15题的结果%第16-20题区域的检测for P=1:4for Q=1:5a1=result(m+s*1+(P-1)*(interval_width+1) :m+s*1+(P-1)*(interval_width+1)+width, n+t*1+(Q-1)*(interval_length+1):n+t*1+(Q-1)*(interval_length+1)+length);sum1=sum(sum(a1));a2(P,Q)=sum1;endenda2(a2<80)=1;a2(a2>=81)=0;result16_20=a2; %存储16-20题的结果%第21-25题区域的检测for P=1:4for Q=1:5a1=result(m+s*2+(P-1)*(interval_width+1) :m+s*2+(P-1)*(interval_width+1)+width, n+t*1+(Q-1)*(interval_length+1):n+t*1+(Q-1)*(interval_length+1)+length);sum1=sum(sum(a1));a2(P,Q)=sum1;endenda2(a2<80)=1;a2(a2>=81)=0;result21_25=a2; %存储21-25题的结果%第26-30题区域的检测for P=1:4for Q=1:5a1=result(m+s*3+(P-1)*(interval_width+1) :m+s*3+(P-1)*(interval_width+1)+width, n+t*1+(Q-1)*(interval_length+1):n+t*1+(Q-1)*(interval_length+1)+length);sum1=sum(sum(a1));a2(P,Q)=sum1;endenda2(a2<80)=1;a2(a2>=81)=0;result26_30=a2; %存储26-30题的结果%第31-35题区域的检测for P=1:4for Q=1:5a1=result(m+s*4+(P-1)*(interval_width+1) :m+s*4+(P-1)*(interval_width+1)+width, n+t*1+(Q-1)*(interval_length+1):n+t*1+(Q-1)*(interval_length+1)+length);sum1=sum(sum(a1));a2(P,Q)=sum1;endenda2(a2<80)=1;a2(a2>=81)=0;result31_35=a2; %存储31-35题的结果answer=[result1_5,result6_10,result11_15,result16_20,result21_25,result26_30,result 31_35];%将所检测的7个区域的结果汇总dlmwrite('Result.txt',answer);%以txt文本的形式输出结果矩阵disp(answer);%在command窗口实时显示结果%附加一个统计错误的并显示分数的部分,假定正确答案是35个CT=zeros(4,35);%初始化矩阵T(1,:)=1;%设定正确答案的参数mark1=answer-T;wrongx=sum(mark1~=0);%当结果选错时,每一列将分别多一个1与-1。

相关文档
最新文档