2013 高教社 全国大学生数学建模获奖论文 碎纸片的拼接和复原

合集下载

2013全国数学建模竞赛B题优秀论文

2013全国数学建模竞赛B题优秀论文

基于最小二乘法的碎纸片拼接复原数学模型摘要首先对图片进行灰度化处理,然后转化为0-1二值矩阵,利用矩阵行(列)偏差函数,建立了基于最小二乘法的碎纸片拼接数学模型,并利用模型对图片进行拼接复原。

针对问题一,当两个数字矩阵列向量的偏差函数最小时,对应两张图片可以左右拼接。

经计算,得到附件1的拼接结果为:08,14,12,15,03,10,02,16,01,04,05,09,13,18,11,07,17,00,06。

附件2的拼接结果为:03,06,02,07,15,18,11,00,05,01 ,09,13, 10,08,12,14,17,16,04。

针对问题二,首先根据每张纸片内容的不同特性,对图片进行聚类分析,将209张图片分为11类;对于每一类图片,按照问题一的模型与算法,即列偏差函数最小则进行左右拼接,对于没有拼接到组合里的碎纸片进行人工干预,我们得到了11组碎纸片拼接而成的图片;对于拼接好的11张图片,按照问题一的模型与算法,即行偏差函数最小则进行上下拼接,对于没有拼接到组合里的碎纸片进行人工干预。

我们最终经计算,附件3的拼接结果见表9,附件4的拼接结果见表10。

针对问题三,由于图片区分正反两面,在问题二的基础上,增加图片从下到上的裁截距信息,然后进行两次聚类,从而将所有图片进行分类,利用计算机自动拼接与人工干预相结合,对所有图片进行拼接复原。

经计算,附件5的拼接结果见表14和表15该模型的优点是将图片分为具体的几类,大大的减少了工作量,缺点是针对英文文章的误差比较大。

关键字:灰度处理,图像二值化,最小二乘法,聚类分析,碎纸片拼接一、问题重述碎纸片的拼接复原技术在司法鉴定、历史文献修复与研究、军事情报获取以及故障分析等领域都有着广泛的应用。

近年来,随着德国“斯塔西”文件的恢复工程的公布,碎纸文件复原技术的研究引起了人们的广泛关注。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。

2013年数学建模碎纸片的拼接复原模型

2013年数学建模碎纸片的拼接复原模型

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员 (打印并签名) :1.2.3.指导教师或指导教师组负责人 (打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 2013 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原模型摘要:本文针对碎纸片的拼接复原问题,提出了互相关匹配模型。

首先对附件图片数值化处理并建立矩阵;然后根据图像页边距特点定位最左边和最右边的碎片;按照每张碎片中的文字部分所在位置,提取同一行碎片,利用互相关函数横向拼合。

在第一问中,附件一、二仅作横向相关性比较即可;在第二、三问中,需要提取同一行碎片横向拼接,并将横向拼合完整的碎片进行竖向拼合,经过人工干预得到结果。

2013年全国大学生数学建模竞赛B题全国一等奖论文.

2013年全国大学生数学建模竞赛B题全国一等奖论文.

碎纸片的拼接复原【摘要】破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

本文主要解决碎纸机切割后的碎纸片拼接复原问题。

针对第一问,附件1、2分别为沿纵向切割后的19张中英文碎纸片,本文在考虑破碎纸片携带信息量较大的基础上,利用MATLAB对附件1、2的碎纸片图像分别读入,以数字矩阵的方式进行存储。

利用数字矩阵中包含图像边缘灰度这一特征,本文采用贪心算法的思想,在首先确定原文件左右边界的基础上,以Manhattan距离来度量两两碎纸片边界差异度,利用计算机搜索依次从左往右搜寻最匹配的碎纸片进行横向配对并达成排序目的。

最终,本文在没有进行人工干预,成功地将附件1、2碎纸片分别拼接复原,得到复原图片见附录2.1、2.2,纵切中文及英文结果表分别如下:思想仍为贪心算法,整体思路为先对209张碎纸片进行聚类还原成11行,再对分好的每行进行横向排序,最后对排序好的各行进行纵向排序。

本文在充分考虑汉字与拉丁字母结构特征差异以及每块碎纸片携带信息减少的基础上,创新地提出一种特征线模型来分别描述汉字及拉丁文字母的特征用于行聚类。

对于行聚类后碎片的横向排序,本文综合了广义Jaccard系数、一阶差分法、二阶差分法、Spearman系数等来构建扩展的边界差异度模型,刻画碎片间的差异度。

对于计算机横向排序存在些许错误的情况,本文给出了人工干预的位置节点和方式。

对于横向排序后的各行,由于在一页纸上,文字的各行是均匀分布的,本文基于各行文字的特征线,在确定首行的位置后,估计出其他行的基准线位置,得到一页的基准线网格,并通过各行基准线在基准线网格上的适配实现纵向的排序。

最终,本文成功的将附件3、4碎纸片分别拼接复原得到复原图片及结果表见附录1.3、1.4、2.3、2.4,同时本文给出了横向排序中人工干预的位置节点和方式。

针对第三问,附件5为双面文件既横切又纵切后的209张碎片(包含正反面),即包含418张图像。

2013 数模国赛 B题 碎纸片的拼接复原

2013 数模国赛 B题  碎纸片的拼接复原

2013高教社杯全国大学生数学建模竞赛B题碎纸片的拼接复原首先分析问题:对于第一问分析如下对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

求matlab图像拼接程序clear;I=imread('xingshi32.bmp');if(isgray(I)==0)disp('请输入灰度图像,本程序用来处理128 *128的灰度图像!');elseif (size(I)~=[128,128])disp('图像的大小不合程序要求!');elseH.color=[1 1 1]; %设置白的画布figure(H);imshow(I);title('原图像');zeroImage=repmat(uint8(0),[128 128]);figure(H); %为分裂合并后显示的图设置画布meansImageHandle=imshow(zeroImage);title('块均值图像');%%%%%设置分裂后图像的大小由于本图采用了128像素的图blockSize=[128 64 32 16 8 4 2];%%设置一个S稀疏矩阵用于四叉树分解后存诸数据S=uint8(128);S(128,128)=0;threshold=input('请输入分裂的阈值(0--1):');%阈值threshold=round(255*threshold);M=128;dim=128;%%%%%%%%%%%%%%%%% 分裂主程序%%%%%%%%%%%while (dim>1)[M,N] = size(I);Sind = find(S == dim);numBlocks = length(Sind);if (numBlocks == 0)%已完成break;endrows = (0:dim-1)';cols = 0:M:(dim-1)*M;rows = rows(:,ones(1,dim));cols = cols(ones(dim,1),:);ind = rows + cols;ind = ind(:);tmp = repmat(Sind', length(ind), 1);ind = ind(:, ones(1,numBlocks));ind = ind + tmp;blockValues= I(ind);blockValues = reshape(blockValues, [dim dim numBlocks]);if(isempty(Sind))%已完成break;end[i,j]=find(S);set(meansImageHandle,'CData',ComputeMeans(I,S));maxValues=max(max(blockValues,[],1),[],2);minValues=min(min(blockValues,[],1),[],2);doSplit=(double(maxValues)-double(minValues))>threshold;dim=dim/2;Sind=Sind(doSplit);Sind=[Sind;Sind+dim;(Sind+M*dim);(Sind+(M+1)*dim)];S(Sind)=dim;end对于第二问于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

CUMCM2013-碎纸片的拼接复原(全国一等奖)

CUMCM2013-碎纸片的拼接复原(全国一等奖)

二.模型假设
1.假设所有附件中给出的碎纸片图像不存在重叠部分;
2
2.假设文件中的碎纸片没有缺失; 3.假设全部碎纸片形状相同且规整。
三.符号说明及有 i 个像素点 每张碎片横向有 j 个像素点
i
j
lij
d ij
Xk
i , j 处图象的灰度值
两碎纸片边缘灰度的偏差距离 任意纸片的右特征向量 任意纸片的左特征向量 中文碎片中心位置的高度
4.3 基于模式相似性测度的偏差距离模型 模式识别中最基本的研究问题是样品与样品之间或类与类之间相似性测度 3 的问 题, 我们采用近邻准则判断两张碎纸片图像边缘灰度信息的相似性, 将任意纸片 k k n 的右特征向量 X k 作为模板,用其他每一张纸片的左特征向量 Yt 模板做比较,观察与哪 个与模板最相似,就是模板的近邻,即 t 纸片排在 k 纸片的右边。 计算模式相似性测度的距离算法有欧式距离、马氏距离、夹角余弦距离等,针对中 英文文本,我们分别测试了不同的距离算法:
次优解 次优解
最优解
最优解
绝对距离在中文识别中的效果评价图
欧式距离在中文识别中的效果评价图
图 1 纸片特征匹配中最优解区分度对比 (横坐标为进行匹配的纸片序号,纵坐标为匹配距离)
当我们对中文碎纸片进行匹配时, 采用绝对距离及欧氏距离作为距离函数都具有较 好的区分度。从图像上可以看出,采用欧式距离,使得每张纸片的期望拼接对象,与潜 在会引起匹配错误的次优匹配对象具有更大的区分度,所以,一般情况下,采用欧式距 离作为距离函数会使得匹配效果更好,有趣的是,在作英文内容的纸片匹配时,情况相 反。 因此, 在之后的算法中, 我们将更灵活的使用这两种距离函数, 而不会固定为一种。 最终得到的附录一及附录二的图片排序表格如下所示:

碎纸片的拼接复原算法及MATLAB实现

碎纸片的拼接复原算法及MATLAB实现

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):楚雄师范学院参赛队员(打印并签名) :1. 陈志明2. 施明杰3. 阮秀婷指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 3013 年 9 月 16 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原算法及MATLAB实现摘要:对于只有纵切的情形,文章通过比较当前待拼碎片与剩余碎片的信噪比psnr[1,3,4]的值来确定两碎片是否为邻接碎片;拼接算法首先连续调用右拼函数直到拼接到原图右边界,然后连续调用左拼函数直到拼接到原图左边界,从而得到整幅复原图像;对于单面纵横交错切的情形,文章对首先采用纵切拼接算法将碎片拼接成多幅横条图片,然后将各横条图片矩阵转置[2],再次采用纵切拼接算法拼接;两种情形的拼接,都存在人为参与;实验证明,我们的算法对纵切情形是有效的,对纵横切情况是可行的。

2013国赛 碎纸片的拼接复原数学建模B解题思路分析

2013国赛 碎纸片的拼接复原数学建模B解题思路分析

2, 图片为文字,所以可以确认文字的形状,但大多为残字,故 可以补全剩余部分。 #根据残字,进行文字预算,找到字体可能是的字,补全字体,找图 片能补全的部分。 3, 图片文字都为从左到右书写,有固定的行。 #文字又从左到右书写,故可以对字的上下画线,从而将文字的拼接, 改为图形线性的匹配。 4,图片可能正反双面,也就是说可以双向确定但是,由于不知道什 么是正面,什么是反面,所以无法确定,故可以将其当做一副。 #广范围查询。 ¥还可以计算他的下一个或上一个字的位置。
பைடு நூலகம்
故可以对字的上下画线从而将文字的拼接4图片可能正反双面也就是说可以双向确定但是由于不知道什么是正面什么是反面所以无法确定故可以将其当做一副
残纸碎片平拼接
图片信息:
1, 图片边缘完整,语言不是普通话,故无法用语法辨别。 2, 图片为文字,所以可以确认文字的形状,但大多为残 字,故可以补全剩余部分。 3, 图片文字都为从左到右书写,有固定的行。 4,图片可能正反双面,也就是说可以双向确定但是,由 于不知道什么是正面,什么是反面,所以无法确定,故可 以将其当做一副。

(完整word版)2013年数学建模b题

(完整word版)2013年数学建模b题

精心整理碎纸片的拼接复原【摘要】:碎纸片拼接技术是数字图像处理领域的一个重要研究方向,把计算机视觉和程序识别应用于碎纸片的复原,在考古、司法、古生物学等方面具有广泛的应用,具有重要的现实意义。

本文主要结合各种实际应用背景,针对碎纸机绞碎的碎纸片,基于计算机辅助对碎纸片进行自动拼接复原研究。

针对问题1,依据图像预处理理论,通过matlab程序处理图像,将图像转化成适合于计算机处理的数字图像,进行灰度分析,提取灰度矩阵。

对于仅纵切的碎纸片,根据矩阵的行提取理论,将。

建中的任一列与矩阵值,序列号。

将程序进行循环操作,得到最终的碎片自动拼接结果。

、;分别作为新生成的矩阵、。

,将矩阵中的任一列分别与矩阵中每一列代入模型,所得p值对应的值即为横排序;将矩阵中的任一行分别于矩阵中的任一行代入模型,所得q值对应的值即为列排序。

循环进行此程序,得计算机的最终运行结果。

所得结果有少许误差,需人工调制,更正排列顺序,得最终拼接结果。

针对问题3,基于碎纸片的文字行列特征,采用遗传算法,将所有的可能性拼接进行比较,进行择优性选择。

反面的排序结果用于对正面排序的检验,发现结果有误差,此时,进行人工干预,调换碎纸片的排序。

【关键词】:灰度矩阵欧式距离图像匹配自动拼接人工干预一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上,大量的纸质物证复原工作都是以人工的方式完成的,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接不但耗费大量的人力、物力,而且还可能对物证造成一定的损坏。

随着计算机技术的发展,人们试图把计算机视觉和模式识别应用于碎纸片复原,开展对碎纸片自动拼接技术的研究,以提高拼接复原效率。

试讨论一下问题,并根据题目要求建立相应的模型和算法:、附件4(1)(2)(3)(4)纸片的自动拼接。

问题1:根据图像预处理理论,通过程序语言将图像导入matlab程序,对图像进行预处理,将碎纸片转换成适合于计算机处理的数字图像形式,并对数字图像进行灰度分析,提取灰度矩阵。

碎纸片拼接问题(2013B)

碎纸片拼接问题(2013B)

方法2:聚类算法:主要方法,效果好。
• 计算 Ai 的行和,得到一个特征向量 ri 。定义适当的 向量相似度指标,对 ri 进行相似度计算,然后对所有 碎片进行聚类,得到分行结果。
几种相似度度量指标:
1 欧式距离倒数: d ij || ri r j ||
夹角余弦: cos ij || r || || r || i j 相关系数: ij
规划方法:将每一行的碎片依次编号为 1, 2, , N . 定义两碎片之间的有向距离为 cij 。
令 xi ,k 1, 第 i 块碎片在第 k 个位置上 否则 0,
ห้องสมุดไป่ตู้
min z
N 1 N
c
k 1 i 1 j 1 , j i
N
ij
x i ,k x j ,k 1
c
MN
k ,l
x i , j , k x i , j 1 ,l

M 1 N MN
i 1 j 1 k 1 l 1 , l k
d
MN
k ,l
x i , j ,k x i 1 , j ,l
约束条件: (1)每个碎片只能放在一个位置上。
x
i 1 j 1
(1)整体的文字拼接正确度;
不易衡量。
(2)纸片两两之间的拼接正确度。
•如何计算纸片两两之间的拼接正确度? 分析:假设纸片 i 和 j 拼接在一起,i 左 j 右,则 应该可以计算出一个相关的正确度指标。 怎么计算?
• 利用什么信息计算? 利用Matlab 软件读取碎片,生成相对应的灰度值 数字矩阵 Ai 。
如何确定碎纸片的位置?
方法一:一次性确定所有碎纸片的位置。 方法二:分组确定碎纸片的位置。 方法三:逐一确定碎纸片的位置。

碎纸片的拼接复原论文

碎纸片的拼接复原论文

B、碎纸片的拼接复原[摘要]碎纸片自动拼接技术是图像处理于模型识别领域中一个崭新但是很典型的应用,它是通过扫描和图像提取技术获取一组碎纸片的形状、颜色等信息,然后利用计算机进行相应的处理过而实现对这些碎纸片的全自动或半自动拼接复原。

[1]本文建立的模型是属于优化模型,通过对图像预处理,运用图像二值化(采用OTSU算法),边界提取配对法,matlab算法等方法进行碎纸片拼接处理。

针对问题一,给定的来自同一页印刷文字文件的碎纸机仅纵切破碎的纸片,我们采用编程求解模型,其主要思想是:编写程序批量读取文件,在采用OTSU算法将每个图像二值化,在提取边界图像构成矩阵,运用边界配对法,再用matlab算法进行求解。

针对问题二,对于碎纸机既纵切又横切的碎纸片,先编写程序运用matlab算法及找出四个边界碎纸片,再利用matlab对其他碎纸片图像进行处理,获取文字行方向、高度、间距等文字行特征,最后编写程序用用matlab算法进行求解。

针对问题三,对于双面英文切纵切又横切的碎纸片,我们要将a面b面双面进行研究对于同一图片我们需同时考虑两面边界值,然后再与问题二一样用matlab算法及人工干预找出四个边界碎纸片,再重复问题二的做法,就能实现双面图片的拼接。

最后,我们在对结果进行分析的基础上说明了模型的优缺点,并对所建模型加以评价推广和改进,同时,进一步论述模型的实际意义。

关键词:碎纸片,二值化,边界提取配对,matlab算法一、问题重述1.1问题背景破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。

随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

1.2目标任务请讨论以下问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

碎纸片的拼接复原算法及MAAB实现

碎纸片的拼接复原算法及MAAB实现

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):楚雄师范学院参赛队员(打印并签名) :1. 陈志明2. 施明杰3. 阮秀婷指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 3013 年 9 月 16 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原算法及MATLAB实现摘要:对于只有纵切的情形,文章通过比较当前待拼碎片与剩余碎片的信噪比psnr[1,3,4]的值来确定两碎片是否为邻接碎片;拼接算法首先连续调用右拼函数直到拼接到原图右边界,然后连续调用左拼函数直到拼接到原图左边界,从而得到整幅复原图像;对于单面纵横交错切的情形,文章对首先采用纵切拼接算法将碎片拼接成多幅横条图片,然后将各横条图片矩阵转置[2],再次采用纵切拼接算法拼接;两种情形的拼接,都存在人为参与;实验证明,我们的算法对纵切情形是有效的,对纵横切情况是可行的。

2013全国大学生数学建模比赛B题-答案

2013全国大学生数学建模比赛B题-答案

2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆邮电大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2013 年 9 月 13 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文研究的是碎纸片的拼接复原问题。

由于人工做残片复原虽然准确度高,但有着效率低的缺点,仅由计算机处理复原,会由于各类条件的限制造成误差与错误,所以为了解决题目中给定的碎纸片复原问题,我们采用人机结合的方法建立碎纸片的计算机复原模型解决残片复原问题,并把计算机通过算法复原的结果优劣情况作为评价复原模型好坏的标准,通过人工后期的处理得到最佳结果。

面对题目中给出的BMP格式的黑白文字图片,我们使用matlab软件的图像处理功能把图像转化为矩阵形式,矩阵中的元素表示图中该位置像素的灰度值,再对元素进行二值化处理得到新的矩阵。

题目每一个附件中的碎纸片均为来自同一页的文件,所以不需考虑残片中含有未知纸张的残片以及残片中不会含有公共部分。

2013年数学建模碎纸片的拼接程序

2013年数学建模碎纸片的拼接程序

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):吉林医药学院参赛队员(打印并签名):1.徐曦2.贾赟光3.武松浩指导教师或指导教师组负责人(打印并签名):吴希(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期:2013年09月16日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文通过对图片像素点灰度值的分析,研究碎纸片的拼接复原。

针对问题一,利用Matlab 软件求出附件1、2图片的像素点灰度值分布矩阵,提取每张图片的左右边缘的灰度值向量,根据图片像素点灰度值的不同,并据此建立spearman 相关系数模型[1]2361i s d n nρ=--∑利用SPSS 对边缘灰度值进行相关性分析,根据相关系数的大小得到两两匹配的纸片对,采用人工干预的方式将纸片左右边缘逐次进行拼接,得到附件1、附件2图片拼接的顺序,具体结果见表3、表5:表3附件1拼接顺序表5附件2拼接顺序针对问题二,在问题一的基础上,利用Matlab 软件求出附件3、4图片边缘像素点灰度值分布矩阵,提取每张图片的上、下、左、右边缘的灰度值向量,由于初始数据庞大,运用逐一比较像素点灰度值的思想设计算法,结合C 语言设计程序[2],实现快速拼接功能,得到附件3、附件4图片拼接的顺序,见正文表6、表7,此处列举部分数据,如下所示:针对问题三,在问题二的基础上,利用Matlab 软件求出附件5图片边缘像素点灰度值分布矩阵,提取每张图片的上、下、左、右边缘的灰度值集合,从解决问题的实际角度出发,对于双面打印文件,运用特殊点灰度值比较法设计算法,结合C 语言设计程序,实现拼接功能,得到附件5图片拼接顺序,见正文表8、表9。

2013全国大学生数学建模竞赛B题-碎纸片的拼接问题

2013全国大学生数学建模竞赛B题-碎纸片的拼接问题
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用):







全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
碎纸片的拼接复原问题
摘要
本文研究的是破碎文件的拼接复原问题。根据碎片仅为横纵切的情形,运用MATLAB软件对碎片图片进行灰度检测获取数据信息,得到各个碎片的边缘像素矩阵,引入匹配关联度,Байду номын сангаас关联度最大的两个边缘拼接在一起,进而建立了较为合理的碎片匹配规划模型。
针对问题二既有纵切又有横切的图片拼接复原问题,建立模型二。先根据模型一的方法,求出排在第一列的11个碎片图片,得到第一列部分碎片的拼接片段。基于每个碎片的行间距是一定的,引入行距接近度 , 定义为:任意两碎片的边缘行间距的和与固定行间距的差的绝对值。 越小,行距接近度就越大,拼接的准确性就越好;从而又得到另一部分碎片的拼接片段。此时,剩下3个碎片未进行拼接,这时就需要人工干预来完成第一列所有碎片的拼接任务。再运用MATLAB软件求出各个碎片的上下行间距,把上下行间距接近的碎片归为一行,从而把原209张图片分成了11行,结合模型一,用MATLAB软件对模型进行求解,确定出每组碎片的拼接顺序,由表7和表8所示,得到复原图如附图三和附图四所示。
1.2问题提出
本文需要解决如下三个问题:
1.对于碎纸机仅有纵切产生的碎纸片,建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。
2.对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

2013全国数学建模竞赛 ——碎纸片拼接复原解析

2013全国数学建模竞赛 ——碎纸片拼接复原解析

2013高教社杯全国大学生数学建模竞赛重庆工商大学姜木北小组作品编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号)碎纸片的拼接复原摘要目前,“碎片拼接复原”技术在司法物证复原、历史文物修复及社会生活各项领域扮演着重要角色,对于碎片数量特别巨大而人工又难以在短时间内完成碎片拼接时,要找到一种高效快捷的自动拼接方法已变得尤为重要。

本文针对只有中英文的碎片拼接问题,综合分析了从单一的纵切到纵横切以及纵横切双面碎片这三个不同的情况,提出了碎片拼接复原的解决方案.在问题一中,对于仅有“纵切”且数量相对较少的碎纸片,我们基于边缘去噪和采用构建碎纸图片的左右边缘二值矩阵提取相似度分析的方法,再通过两张图片左右相似度匹配排序,得到附件1和附件2中的碎纸排序(见表2和表3),并运用Matlab的图像处理工具箱,按排列顺序导入碎纸片得到相应拼接结果(见附录附件一).在问题二中,由于碎纸片数量相对较多,同时存在横切和纵切的情况,在问题一的基础上增加了碎纸片的上下边缘相似度匹配。

在进行人工干预,找到第一张起始碎纸片作为匹配起点后,我们基于索贝尔算子的原理,对碎纸片灰度值进行边缘相似度的旋转检测和比较匹配,最后进行二叉树搜索排序(见表4和表5)。

对附件3和4的碎纸图片拼接出的结果详见附录中的附件二.在问题三中,由于碎纸片是两面的并且碎纸片数量更多,若采用第二问的求解方案则加大了求解难度同时也存在较大误差。

因此,我们基于蚁群算法(ACA)的SIFT特征点匹配原理来求解。

先提取碎纸图片特征点,然后基于蚁群算法的最优化快速比对匹配,最后基于ACA的搜索排序对碎纸片拼接。

Matlab编程所求得的排序结果详见表6和表7,附件5中的碎纸片拼接复原结果见附录中的附件三.在问题的解决中,我们得出结论:碎纸图片导入量越小,图片匹配出的效果越佳,在相似度的匹配上,出现的误差减小,最后拼出的图像效果好,人工干预量也相对小。

高教社 全国大学生数学建模获奖论文 碎纸片的拼接和复原之欧阳德创编

高教社 全国大学生数学建模获奖论文 碎纸片的拼接和复原之欧阳德创编

2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写):B我们的参赛报名号为(如果赛区设置报名号的话):S15076所属学校(请填写完整的全名):河南理工大学参赛队员(打印并签名) :1. 祝红祥2. 程港3. 王金强指导教师或指导教师组负责人 (打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要破碎文件的复原有着重要的意义以及实用价值。

传统上,人们只能靠手工完成,效率十分低。

当碎片数量过于庞大时,甚至无法完成。

随着技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率,根据题意要求,我们需要研究的问题主要是关于规则碎片拼接问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):S15076所属学校(请填写完整的全名):河南理工大学参赛队员(打印并签名) :1. 祝红祥2. 程港3. 王金强指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要破碎文件的复原有着重要的意义以及实用价值。

传统上,人们只能靠手工完成,效率十分低。

当碎片数量过于庞大时,甚至无法完成。

随着技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率,根据题意要求,我们需要研究的问题主要是关于规则碎片拼接问题。

随着研究的深入,本问题分为三个大问题:首先对于单面文字纵切碎片进行复原,然后关于单面文字横纵切割碎片的复原,最后就是双面文字横纵切割碎片的复原。

对于问题一,我们需要对单面文字纵切碎片进行复原。

为此,我们建立了边缘最大相似度匹配模型来解决该问题。

我们首先将图片读入Matlab软件生成相应的灰度值矩阵,考虑到纸片被切割后,左右碎片在切割线相应位置的灰度值接近相同,即左边碎片灰度值矩阵与右边灰度值矩阵在切割线附近数值接近。

由此,我们借助Matlab软件的corr函数计算一碎片与其他所有碎片在切割线附近灰度值最大相似度来找到与之匹()2配的碎片,从而达到了良好的复原效果。

对于问题二,我们需要对单面文字横纵切割碎片的复原。

此问题增加了碎片的数量,为了简化算法,减少计算量,我们建立了横纵扫描模型。

由于整张纸的左右边缘没有字迹(即该处的灰度值为255),我们扫描(读取)所有碎片的左侧附近灰度值,如果灰度值都等于255,那么该碎片就很有可能属于纸张左边缘。

为了进一步确定,我们可以多扫描几列灰度值。

确定左边缘碎片后,我们以其中某一碎片作为起点,应用问题一中我们所建的边缘最大相似度匹配模模型对其右边进行匹配,最终完成整行的复原得到一条状图形。

同理,我们可以得到其他10张条状图形。

此时,问题二最终就转化成了问题一,最终我们成功完成对图形复原的任务。

对于问题三,我们要解决的就是双面文字横纵切割碎片的复原问题。

该问题在前两问的基础上又进一步增加了问题难度,即碎片具有双面文字。

在解决双面文字横纵切割碎片的复原问题中,我们借助了问题一和二中的模型。

有了前两问的基础,在此问题上我们着重考虑了双面问题。

我们先找到左边缘碎片,然后再以边缘碎片与其他碎片进行匹配最终得到11张条状图形,然后再对着11张图片进行匹配,在双面碎片匹配过程中,我们分别求出某一碎片与其他所有碎片两个面的边缘相似度,然后让最大边缘相似度对应碎片的面与这一碎片匹配,最终达到良好的复原效果。

关键词:碎片复原;边缘最大相似度匹配模型;横纵扫描模型;Matlab一、问题重述将破碎文件的拼接、复原,在司法获取物证、历史文献修复以及军事情报获取等领域都有着重要的作用。

但是传统拼接技术落后,拼接复原工作都是由人工完成的,虽然提高了准确率,但效率很低。

特别是当碎片数量较多时,人工拼接在短时间内基本不可能完成任务。

随着科学技术技术的发展,人们将计算机技术引入,试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

在这样的背景下利用所学的知识讨论并解决以下问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果以图片形式及表格形式表达。

2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果表达要求同上。

3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。

二、问题分析问题一针对破碎文件的拼接,附件1、附件2为纵切碎片数据,对给定的来自同一页印刷文字的碎纸机破碎纸片,每页纸被切为19条碎片(仅纵切),要求将纵切的只带进行拼接,并建立碎纸片拼接复原模型和算法。

,附件一中给出了所要拼接的碎片,但不能直接使用拼接。

我们利用MATLAB软件对图片进行处理,读入附件所给的灰度图,用适当的程序实现图像的数字化。

对于每一个碎纸片的灰度矩阵进行数字化处理。

得到了图片对应的数组矩阵。

首先进行人工干预,将其中可以明显看出原来处于第一个和最后一个位置处的文件碎片,我们分别将这两个文件碎片放到原来它们所处的位置处,然后就有多种处理方法可以使用,如利用c语言程序编程,将举证数组配对,并用欧氏距离惊醒计算,找到最近距离输出结果;或运用matlab相似度函数()2corr,取出该碎片最后一列数组与剩余的碎片的第一列进行相似度对比,取其相似度最大的碎片,利用Matlab程序得出所要拼接的原图顺序。

鉴于对原始数据量大的考虑,结我们选择后一种方法。

计算匹配矩阵,得出碎纸片拼接的匹配矩阵。

找出复原图片的左右两张碎纸片,自左端开始,依次向右进行匹配拼接,直至与右端图片拼接完成。

问题二,来自同一页印刷文字的碎纸机破碎纸片(纵横切),附件3、附件4为纵横切碎片数据,每页纸被切为11×19个碎片建立碎纸片拼接复原模型和算法。

由于问题二与问题一相比较数据量明显增大所以要分阶段对题目分析,首先还是要对文件碎片进行数字化处理,但是我们无法直接从图片中找到参照碎片(即处于原文件边缘的碎片),所以我们就对所有碎片的左边界进行分析,分析它空白的宽度,从而可以找到处于原文件左侧的碎片,然后在以这些碎片为参照物,利用Matlab余碎片进行分析,可以求得几条矩阵条(行型文件碎片),这时数组矩阵的个数不减少了很多个,但是又没有了参照碎片。

故我们只能从条形矩阵上找突破点了,我们可以想到一张纸上都有页眉,所以我们可以先选出那一个位于原图最上边位置的条形矩阵,最后再次引入corr函数,再条形矩阵排成一定的序列,然后按序列将纸片拼接的匹配矩,最终原件。

()2问题三,由于日常生活中我们不仅仅只有单面打印的纸张,双面打印的纸张也很常见,,附件5为纵横切碎片数据,每页纸被切为11×19个碎片,每个碎片有正反两面。

该附件中每一碎片对应两个文件,共有2×11×19个文件,例如,第一个碎片的两面分别对应文件000a、000b。

所以本题要求对双面的纸张碎片进行拼接,并写出相应的算法。

首先我们要明确双面打印的纸张它的每一面都有文字,拼接时必须考虑,对碎片进行数字化处理,然后得到了418个矩阵,我们接下来就要考虑参考碎片的选取问题,因为这里的碎片是双面的,所以在计算出的便捷参照碎片也将是原来的二倍,因此我们也直接引入所有的碎片面进行匹配,组i i后会得到行中碎片编码相同的情况,对此我们可以舍弃其中的一部分(因为重复的碎片有着不同的特征),剩下的那部分我们在利用Matlab程序对其进行关联度分析,并输出对应的碎片编码,用人工干涉的方法找出最上端的文件碎片条,然后由上端开始,依次向下进行匹配拼接,直至与最下端图片拼接完成。

三、问题假设1.假设在文件撕碎时,对碎片上的文字影响较小;2.认为所有的文件碎片大小相等;3.假设英文和中文撕碎后拼接时方法是相同的;4.认为所有在原图边界处的碎片中文字和边都有一定的距离,且比其他的都大。

四、符号说明五、模型的建立与求解5.1问题一的模型建立与求解对于问题一,依据题目给定的条件,我们先对附件一进行适当处理,根据文件碎片的像素将附件一种给定的图片转成数组矩阵的形式,图中没有文字的空白部分计为0,反之则取值在0到255之间,然后先对数据进行人工筛选,选出原图起始和结束位置的文件碎片,放置到对应位置。

但是由于图片数字化后所得到的矩阵数量很大(198072 ),为了简化计算,我们采用相似度分析法:首先提取剩余文件碎片的边界数组运用Matlab 软件中的()corr函数来分析数组的相似度(这个函数的返回值在-1到1之间,0表示完2全无关,1和-1表示完全相关。

),得出一组相似度读数据,比较选出最合适的文件碎片按顺序排放。

算法过程图由于附录1给出的图片编号从000开始,我们这里将000计为pic1,以此类推。

首先数字化后的矩阵:⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=nn n n x x x x k 1111人工干预选取出:255][]1[=k 和255][][=n k 两个矩阵将其放于开与结尾处提取边界数组:左端 1n iih x x k =右端 nnni x x k 1=引入Matlab 软件代入相似度函数()2corr 并循环比较,并输出R 绝对值最大的i 的值 再令i h = ;19,2,1 =i最终本文利用数学软件Matlab ,得到如下的匹配序列及匹配矩阵即复原后的文件碎片的顺序改回原编码如表1、表2所示(图片见附录)5.2问题二的模型建立与求解 5.2.1、模型的建立对于问题二来自同一页印刷文字的碎纸机破碎纸片(纵横切),建立碎纸片拼接复原模型和算法。

要考虑到问题中的文件碎片相比问题一更加的复杂,所以在问题一的基础上进一步求解。

步骤一:将文件碎片数字化处理,得到多组矩阵,利用Matlab 软件算法将原文件中位于第一列的文件碎片筛选出了;步骤二:再次用问题一中的方法,对每一行的文件碎片进行相似度分析,找出每一行的文件碎片;步骤三:人工干涉,将11行文件碎片的首行找到,然后运用corr2()函数进行关联度分析,找到碎片顺序,回复出原图。

相关文档
最新文档