2013年数学建模(B题)碎纸片的拼接复原模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

承诺书

我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛

参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网

站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、

网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果

或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在

正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如

有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开

展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的参赛报名号为(如果赛区设置报名号的话):

所属学校(请填写完整的全名):

参赛队员 (打印并签名) :1.

2.

3.

指导教师或指导教师组负责人 (打印并签名):

(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内

容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。)

日期: 2013 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页

赛区评阅编号(由赛区组委会评阅前进行编号):

全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

碎纸片的拼接复原模型

摘 要: 本文针对碎纸片的拼接复原问题,提出了互相关匹配模型。首先对附

件图片数值化处理并建立矩阵;然后根据图像页边距特点定位最左边和最右边的碎片;按照每张碎片中的文字部分所在位置,提取同一行碎片,利用互相关函数

1

1

()()

()()

11)T T j

k j

k jk

jk f

t f t f

t f t ρρ--=

=

-≤≤∑∑

横向拼合。

在第一问中,附件一、二仅作横向相关性比较即可;在第二、三问中,需要提取同一行碎片横向拼接,并将横向拼合完整的碎片进行竖向拼合,经过人工干预得到结果。

最终结果见附录。

关键词:拼接复原;互相关;矩阵;数值化;人工干预

一、问题重述

在司法物证复原、历史文献修复以及军事情报获取等领域的破碎文件的拼接上,传统的拼接复原工作需由人工完成,准确率较高,但效率很低。尤其是当碎片数量巨大时,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。我们需要用算法分别设计出附件1至附件5的拼接方法及拼接结果。

二、模型假设

1. 忽略实际拼接中边缘的整齐性;

2. 不需要考虑实际拼接中破碎文件大小是否一致;

3. 忽略碎片边缘的损耗,认为拼接后是完整的图片;

4. 在模型的建立过程中重视算法与建模思想,淡化程序的编写;

5. 文字的行间距一定。

三、符号说明

jk ρ 互相关系数(11jk ρ-≤≤)

()j f t 相关像素数组1

()k f t 相关像素数组2 i P 图像像素值矩阵 i Q 处理后图像像素值矩阵 ,mn mn a b 矩阵元素

四、问题的分析

1. 已知条件的分析

第一,对碎片尺寸和数量的分析。

附件1和附件2的图片尺寸均为721980⨯,碎片数量均为19;附件3、附件4和附件5的图片尺寸均为72180⨯,碎片数量均为1119⨯。由于纵列有11个,像素值180,总值111801980⨯=,因此,所有拼接后的图像尺寸一致,均为1368⨯1980。

第二,对碎片边界的分析。

对于附件1、2,所有碎片上行和下行像素值为白。其中,一张碎片位于最左端,最左列像素值均为白;一张碎片位于最右端,最右列像素值均为白。

对于附件3、4、5,拼接后图像四边像素值为白,碎片也存在边像素值全为白的情况,因此需要分类讨论。

切割线为长度完全相等的直线,因此切割线两边应有很大的相似度,灰度值相似。

第三,对碎片正反性的分析。

附件5存在正反面情况,同一块用a 、b ,但根据题意分析,我们无法确定碎片的正反,即a 可能是正面,也可能是反面。因此拼合时,应当注意统一序号在同一平面出现的单一性,例如,000a 在设定正面出现以后,000b 一定在反面。

第四,对碎片像素白色行的分析 对于中文,同一行的所有碎片文字是横向对齐的,因此白色开始的位置是一样的。因此可以提取出同一行的碎片。

2. 拼接方法的分析

由于碎片是长方形,有四条边,因此边的拼接有优先顺序。由于长边特征较为明显,采样点多,因此优先横向拼接,然后纵向拼接。当电脑拼接无法完成时,采取人工干预。

五、模型的分析与求解

1. 方法的确立

根据对问题的分析,我们得知此问题需要计算离散序列之间的相关性,因此我们需要使用互相关系数计算和矩阵的计算。 2. 模型的建立 1. 1图像数字化

由于电脑中图像的大小是由像素数量表示,而每个像素点均由一个数值表示,因此利用matlab 读取灰度图像的像素值,第n 副图用矩阵表示为:

在第一问中,n=72,m=1980;

在第二问、第三问中,n=72,m=180。 1. 2数据预处理

由于互相关函数需要比较正负范围相等的数组,因此我们将n P 的每个数值减去

max 2a ,使mn a 在 [-max 2a ,max 2

a

]范围内,即 127.5127.5127.5127.5127.5127.5127.5127.5

127.5m n A ⨯---⎛⎫

--- ⎪

=

---⎝⎭

(111212122212)

a (0255)n n i m m mn a a a a a P a a a a ⎛⎫

⎪=≤≤ ⎪ ⎪⎭⎝…………………

相关文档
最新文档