13年全国大学生数学建模竞赛—B题—碎纸片的拼接复原

合集下载

2013全国数学建模竞赛B题优秀论文

2013全国数学建模竞赛B题优秀论文

基于最小二乘法的碎纸片拼接复原数学模型摘要首先对图片进行灰度化处理,然后转化为0-1二值矩阵,利用矩阵行(列)偏差函数,建立了基于最小二乘法的碎纸片拼接数学模型,并利用模型对图片进行拼接复原。

针对问题一,当两个数字矩阵列向量的偏差函数最小时,对应两张图片可以左右拼接。

经计算,得到附件1的拼接结果为:08,14,12,15,03,10,02,16,01,04,05,09,13,18,11,07,17,00,06。

附件2的拼接结果为:03,06,02,07,15,18,11,00,05,01 ,09,13, 10,08,12,14,17,16,04。

针对问题二,首先根据每张纸片内容的不同特性,对图片进行聚类分析,将209张图片分为11类;对于每一类图片,按照问题一的模型与算法,即列偏差函数最小则进行左右拼接,对于没有拼接到组合里的碎纸片进行人工干预,我们得到了11组碎纸片拼接而成的图片;对于拼接好的11张图片,按照问题一的模型与算法,即行偏差函数最小则进行上下拼接,对于没有拼接到组合里的碎纸片进行人工干预。

我们最终经计算,附件3的拼接结果见表9,附件4的拼接结果见表10。

针对问题三,由于图片区分正反两面,在问题二的基础上,增加图片从下到上的裁截距信息,然后进行两次聚类,从而将所有图片进行分类,利用计算机自动拼接与人工干预相结合,对所有图片进行拼接复原。

经计算,附件5的拼接结果见表14和表15该模型的优点是将图片分为具体的几类,大大的减少了工作量,缺点是针对英文文章的误差比较大。

关键字:灰度处理,图像二值化,最小二乘法,聚类分析,碎纸片拼接一、问题重述碎纸片的拼接复原技术在司法鉴定、历史文献修复与研究、军事情报获取以及故障分析等领域都有着广泛的应用。

近年来,随着德国“斯塔西”文件的恢复工程的公布,碎纸文件复原技术的研究引起了人们的广泛关注。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。

2013 数模国赛 B题 碎纸片的拼接复原

2013 数模国赛 B题  碎纸片的拼接复原

2013高教社杯全国大学生数学建模竞赛B题碎纸片的拼接复原首先分析问题:对于第一问分析如下对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

求matlab图像拼接程序clear;I=imread('xingshi32.bmp');if(isgray(I)==0)disp('请输入灰度图像,本程序用来处理128 *128的灰度图像!');elseif (size(I)~=[128,128])disp('图像的大小不合程序要求!');elseH.color=[1 1 1]; %设置白的画布figure(H);imshow(I);title('原图像');zeroImage=repmat(uint8(0),[128 128]);figure(H); %为分裂合并后显示的图设置画布meansImageHandle=imshow(zeroImage);title('块均值图像');%%%%%设置分裂后图像的大小由于本图采用了128像素的图blockSize=[128 64 32 16 8 4 2];%%设置一个S稀疏矩阵用于四叉树分解后存诸数据S=uint8(128);S(128,128)=0;threshold=input('请输入分裂的阈值(0--1):');%阈值threshold=round(255*threshold);M=128;dim=128;%%%%%%%%%%%%%%%%% 分裂主程序%%%%%%%%%%%while (dim>1)[M,N] = size(I);Sind = find(S == dim);numBlocks = length(Sind);if (numBlocks == 0)%已完成break;endrows = (0:dim-1)';cols = 0:M:(dim-1)*M;rows = rows(:,ones(1,dim));cols = cols(ones(dim,1),:);ind = rows + cols;ind = ind(:);tmp = repmat(Sind', length(ind), 1);ind = ind(:, ones(1,numBlocks));ind = ind + tmp;blockValues= I(ind);blockValues = reshape(blockValues, [dim dim numBlocks]);if(isempty(Sind))%已完成break;end[i,j]=find(S);set(meansImageHandle,'CData',ComputeMeans(I,S));maxValues=max(max(blockValues,[],1),[],2);minValues=min(min(blockValues,[],1),[],2);doSplit=(double(maxValues)-double(minValues))>threshold;dim=dim/2;Sind=Sind(doSplit);Sind=[Sind;Sind+dim;(Sind+M*dim);(Sind+(M+1)*dim)];S(Sind)=dim;end对于第二问于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

CUMCM2013-碎纸片的拼接复原(全国一等奖)

CUMCM2013-碎纸片的拼接复原(全国一等奖)

二.模型假设
1.假设所有附件中给出的碎纸片图像不存在重叠部分;
2
2.假设文件中的碎纸片没有缺失; 3.假设全部碎纸片形状相同且规整。
三.符号说明及有 i 个像素点 每张碎片横向有 j 个像素点
i
j
lij
d ij
Xk
i , j 处图象的灰度值
两碎纸片边缘灰度的偏差距离 任意纸片的右特征向量 任意纸片的左特征向量 中文碎片中心位置的高度
4.3 基于模式相似性测度的偏差距离模型 模式识别中最基本的研究问题是样品与样品之间或类与类之间相似性测度 3 的问 题, 我们采用近邻准则判断两张碎纸片图像边缘灰度信息的相似性, 将任意纸片 k k n 的右特征向量 X k 作为模板,用其他每一张纸片的左特征向量 Yt 模板做比较,观察与哪 个与模板最相似,就是模板的近邻,即 t 纸片排在 k 纸片的右边。 计算模式相似性测度的距离算法有欧式距离、马氏距离、夹角余弦距离等,针对中 英文文本,我们分别测试了不同的距离算法:
次优解 次优解
最优解
最优解
绝对距离在中文识别中的效果评价图
欧式距离在中文识别中的效果评价图
图 1 纸片特征匹配中最优解区分度对比 (横坐标为进行匹配的纸片序号,纵坐标为匹配距离)
当我们对中文碎纸片进行匹配时, 采用绝对距离及欧氏距离作为距离函数都具有较 好的区分度。从图像上可以看出,采用欧式距离,使得每张纸片的期望拼接对象,与潜 在会引起匹配错误的次优匹配对象具有更大的区分度,所以,一般情况下,采用欧式距 离作为距离函数会使得匹配效果更好,有趣的是,在作英文内容的纸片匹配时,情况相 反。 因此, 在之后的算法中, 我们将更灵活的使用这两种距离函数, 而不会固定为一种。 最终得到的附录一及附录二的图片排序表格如下所示:

碎纸片的拼接复原问题.概要

碎纸片的拼接复原问题.概要

2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原问题摘要破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

本文针对已给图像先进行了图片灰度二值化处理得到碎纸片的像素矩阵,提取碎纸片的边缘像素矩阵,对边缘矩阵进行相似度分析,相似度的度量采用向量距离平方和最小化,在相似度度量中设置阈值、对相近相似度的候选纸片进行人工干预、对数据量较大的附件,采用文本特征,如页边距、行距进行筛选,降低计算量,提高计算精度。

使用Matlab软件编程实现了上述算法,在对附件的拼接中通过少量的人工干预,可实现纸片的完整拼接,效果较好。

关键词:相似度;文字特征;碎纸片拼接;Matlab;1 问题重述1.1 问题的描述设计一个碎纸片的自动拼接模型,以提高碎纸片的拼接复原效率。

1.2 问题的要求(1)对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果以图片形式及表格形式表达。

(2)对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果表达要求同上。

(3)从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。

1.3 问题的分析对破碎文件这类边缘相似的碎纸片的拼接,理想的计算机拼接过程应与人工拼接过程类似,即拼接时不但要考虑待拼接碎纸片边缘是否匹配,还要判断碎纸片内的字迹断线或碎片内的文字内容是否匹配,然而由于理论和技术的限制,让计算机具备类似人那种识别破碎边缘地字迹断线、以及理解碎片内文字图像含义的智能几乎不太可能。

2013国赛 碎纸片的拼接复原数学建模B解题思路分析

2013国赛 碎纸片的拼接复原数学建模B解题思路分析

2, 图片为文字,所以可以确认文字的形状,但大多为残字,故 可以补全剩余部分。 #根据残字,进行文字预算,找到字体可能是的字,补全字体,找图 片能补全的部分。 3, 图片文字都为从左到右书写,有固定的行。 #文字又从左到右书写,故可以对字的上下画线,从而将文字的拼接, 改为图形线性的匹配。 4,图片可能正反双面,也就是说可以双向确定但是,由于不知道什 么是正面,什么是反面,所以无法确定,故可以将其当做一副。 #广范围查询。 ¥还可以计算他的下一个或上一个字的位置。
பைடு நூலகம்
故可以对字的上下画线从而将文字的拼接4图片可能正反双面也就是说可以双向确定但是由于不知道什么是正面什么是反面所以无法确定故可以将其当做一副
残纸碎片平拼接
图片信息:
1, 图片边缘完整,语言不是普通话,故无法用语法辨别。 2, 图片为文字,所以可以确认文字的形状,但大多为残 字,故可以补全剩余部分。 3, 图片文字都为从左到右书写,有固定的行。 4,图片可能正反双面,也就是说可以双向确定但是,由 于不知道什么是正面,什么是反面,所以无法确定,故可 以将其当做一副。

(完整word版)2013年数学建模b题

(完整word版)2013年数学建模b题

精心整理碎纸片的拼接复原【摘要】:碎纸片拼接技术是数字图像处理领域的一个重要研究方向,把计算机视觉和程序识别应用于碎纸片的复原,在考古、司法、古生物学等方面具有广泛的应用,具有重要的现实意义。

本文主要结合各种实际应用背景,针对碎纸机绞碎的碎纸片,基于计算机辅助对碎纸片进行自动拼接复原研究。

针对问题1,依据图像预处理理论,通过matlab程序处理图像,将图像转化成适合于计算机处理的数字图像,进行灰度分析,提取灰度矩阵。

对于仅纵切的碎纸片,根据矩阵的行提取理论,将。

建中的任一列与矩阵值,序列号。

将程序进行循环操作,得到最终的碎片自动拼接结果。

、;分别作为新生成的矩阵、。

,将矩阵中的任一列分别与矩阵中每一列代入模型,所得p值对应的值即为横排序;将矩阵中的任一行分别于矩阵中的任一行代入模型,所得q值对应的值即为列排序。

循环进行此程序,得计算机的最终运行结果。

所得结果有少许误差,需人工调制,更正排列顺序,得最终拼接结果。

针对问题3,基于碎纸片的文字行列特征,采用遗传算法,将所有的可能性拼接进行比较,进行择优性选择。

反面的排序结果用于对正面排序的检验,发现结果有误差,此时,进行人工干预,调换碎纸片的排序。

【关键词】:灰度矩阵欧式距离图像匹配自动拼接人工干预一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上,大量的纸质物证复原工作都是以人工的方式完成的,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接不但耗费大量的人力、物力,而且还可能对物证造成一定的损坏。

随着计算机技术的发展,人们试图把计算机视觉和模式识别应用于碎纸片复原,开展对碎纸片自动拼接技术的研究,以提高拼接复原效率。

试讨论一下问题,并根据题目要求建立相应的模型和算法:、附件4(1)(2)(3)(4)纸片的自动拼接。

问题1:根据图像预处理理论,通过程序语言将图像导入matlab程序,对图像进行预处理,将碎纸片转换成适合于计算机处理的数字图像形式,并对数字图像进行灰度分析,提取灰度矩阵。

2013全国大学生数学建模竞赛B题

2013全国大学生数学建模竞赛B题

将008代表的矩阵C8的第二列元素与其它矩 阵的第一列元素进行两两匹配。记录元素相 同的个数,个数除以1980为C8矩阵第二列对 其它矩阵第一列的边缘匹配度,记为:
比较这18个数据,最大的即为与008匹配的 碎纸片。然后以所找到的碎纸片的第二列开 始,求出它与其它矩阵第一列的边缘匹配度, 找出最大的,以此类推把19张碎纸片拼接完 成。
三.问题2的分析
英文碎纸片的分析 通过观察可以发现英文字母的主要的 部分拥有同一上界和同一下界,例如:
将图片中每一行中黑色像素数少于13的及 字母的次要部分转变为二值化矩阵中的0, 将每一行中黑色像素大于等于13的及字母 的主要部分转化为二值化矩阵中的1,这样 得到的新的二值化矩阵 。例如图像转变为 如下图的方式:
二.问题1的分析
步骤一:使用matlab中的imread函数 可以做出图片的灰度矩阵 ,读取每 张图片文件的数据,其目的是将附件 中给的 bmp 格式的碎纸片图以灰度 值矩阵的形式存储。再将灰度值矩阵 转化为 0-1 矩阵,来得到模型的数 据基础;
由于该像素图片转换后为
的矩阵,ቤተ መጻሕፍቲ ባይዱ
论文中无法放置,所以仅简单举例说明:
以纸片000与001为例,匹配方式可能为:
将①②的边缘匹配度相加得到边缘匹配度 之和,将③④的边缘匹配度相加得边缘匹 配度之和,两者的和做出比较。若仅有一 个大于等于1.9,则计算机输出该匹配度, 人工判断是否碎纸片是否匹配;若两者均 大于等于1.9,计算机把两个匹配度之和输 出,人工选择判断碎纸片应是否匹配与如 何匹配;若两者均小于1.9,则计算输出最 大者,人工判断碎纸片是否匹配。这样可 以得到一些在同一横行的碎纸片的拼接。
总体思路
三步走:分行,行内排序,行间排序

2013年数学建模B题-田吕姜

2013年数学建模B题-田吕姜

2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)我们参赛选择的题号是(从A/B/C/D中选择一项填写) B我们的参赛报名号为(如果赛区设置报名号的话):024B03所属学校(请填写完整的全名):中国石油大学参赛队员(打印并签名) :1. 田阳2. 吕飞3. 姜广泰指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 2014 年 8 月 31 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文研究的是碎纸片的拼接复原问题。

由于人工做残片复原虽然准确度高,但有着效率低的缺点,仅由计算机处理复原,会由于各类条件的限制造成误差与错误,所以为了解决题目中给定的碎纸片复原问题,采用人机结合的方法建立碎纸片的计算机复原模型解决残片复原问题,并把计算机通过算法复原的结果优劣情况作为评价复原模型好坏的标准,通过人工后期的干预处理得到最佳结果。

碎纸片拼接问题(2013B)

碎纸片拼接问题(2013B)

方法2:聚类算法:主要方法,效果好。
• 计算 Ai 的行和,得到一个特征向量 ri 。定义适当的 向量相似度指标,对 ri 进行相似度计算,然后对所有 碎片进行聚类,得到分行结果。
几种相似度度量指标:
1 欧式距离倒数: d ij || ri r j ||
夹角余弦: cos ij || r || || r || i j 相关系数: ij
规划方法:将每一行的碎片依次编号为 1, 2, , N . 定义两碎片之间的有向距离为 cij 。
令 xi ,k 1, 第 i 块碎片在第 k 个位置上 否则 0,
ห้องสมุดไป่ตู้
min z
N 1 N
c
k 1 i 1 j 1 , j i
N
ij
x i ,k x j ,k 1
c
MN
k ,l
x i , j , k x i , j 1 ,l

M 1 N MN
i 1 j 1 k 1 l 1 , l k
d
MN
k ,l
x i , j ,k x i 1 , j ,l
约束条件: (1)每个碎片只能放在一个位置上。
x
i 1 j 1
(1)整体的文字拼接正确度;
不易衡量。
(2)纸片两两之间的拼接正确度。
•如何计算纸片两两之间的拼接正确度? 分析:假设纸片 i 和 j 拼接在一起,i 左 j 右,则 应该可以计算出一个相关的正确度指标。 怎么计算?
• 利用什么信息计算? 利用Matlab 软件读取碎片,生成相对应的灰度值 数字矩阵 Ai 。
如何确定碎纸片的位置?
方法一:一次性确定所有碎纸片的位置。 方法二:分组确定碎纸片的位置。 方法三:逐一确定碎纸片的位置。

碎纸片的拼接复原(全国大学生数学建模大学国家级二等奖)

碎纸片的拼接复原(全国大学生数学建模大学国家级二等奖)
2013 高教社杯全国大学生数学建模竞赛
承诺书
我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参 赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网 上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
5.1 问题一的建模及求解
根据问题一的具体要求,本文将其分为三个步骤:
(1) 对图像碎片进行预处理,即对图像碎片数字化,得到碎片的数字图像。 (2) 采用 Hopfield 网络模型,通过 MATLAB 软件对图像进行二值化处理。 (3) 通过匹配算法找到相互匹配的图像碎片,建立相邻匹配最优化模型[1],利用
参赛队员 (打印并签名) :1.
周新臣
2.
周亚如
3.
史继男
指导教师或指导教师组负责人 (打印并签名):
徐艳
日期: 2013 年 9 月 16 日
赛区评阅编号(由赛区组委会评阅前进行编号):
2013 高教社杯全国大学生数学建模竞赛
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注
义为P = ∑������������<0;������0 ∑������������<0;������0 ������������������,它是平滑算子的归一化参数。
+
(������������������������
− ������ ������������)(������������������
− ������������������������ )]}

2013全国大学生数学建模竞赛B题参考答案

2013全国大学生数学建模竞赛B题参考答案

2013高教社杯全国大学生数学建模竞赛B题评阅要点[说明]本要点仅供参考,各赛区评阅组应根据对题目的理解及学生的解答,自主地进行评阅。

本题要求对数据提取合适的特征、建立合理有效的碎纸片拼接复原模型。

可以考虑的特征有邻边灰度向量的匹配、按行或按列对灰度求和、行距等。

关于算法模型,必须有具体的算法过程(如流程图、算法描述、伪代码等)及设计原理。

虽然正确的复原结果是唯一的,但不能仅从学生提供的复原效果来评定学生解答的好坏,而应根据所建的数学模型、求解方法和计算结果(如复原率)三方面的内容做出评判。

另一方面,评判中还需要考虑人工干预的多少和干预时间节点的合理性。

问题1. 仅有纵切文本的复原问题由于“仅有纵切”,碎纸片较大,所以信息特征较明显。

一种比较直观的建模方法是:按照某种特征定义两条碎片间的(非对称)距离,采用最优Hamilton路或最优Hamilton圈(即TSP)的思想建立优化模型。

关于TSP的求解方法有很多,学生在求解过程中需要注意到非对称距离矩阵或者是有向图等特点。

还可能有种种优化模型与算法,只要模型合理,复原效果好,都应当认可。

本问题相对简单,复原过程可以不需要人工干预,复原率可以接近或达到100%。

问题2. 有横、纵切文本的复原问题一种较直观的建模方法是:首先利用文本文件的行信息特征,建立同一行碎片的聚类模型。

在得到行聚类结果后,再利用类似于问题1中的方法完成每行碎片的排序工作。

最后对排序后的行,再作纵向排序。

本问题的解法也是多种多样的,应视模型和方法的合理性、创新性及有效性进行评分。

例如,考虑四邻近距离图,碎片逐步增长,也是一种较为自然的想法。

问题3. 正反两面文本的复原问题这个问题是问题2的继续,基本解决方法与问题2方法相同。

但不同的是:这里需要充分利用双面文本的特征信息。

该特征信息利用得好,可以提升复原率。

在阅卷过程中,可以考虑学生对问题的扩展。

例如,在模型的检验中,如果学生能够自行构造碎片,用以检验与评价本队提出的拼接复原模型的复原效果,可考虑适当加分。

2013全国大学生数学建模比赛B题-答案

2013全国大学生数学建模比赛B题-答案

2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。

如有违反竞赛规则的行为,我们将受到严肃处理。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆邮电大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2013 年 9 月 13 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文研究的是碎纸片的拼接复原问题。

由于人工做残片复原虽然准确度高,但有着效率低的缺点,仅由计算机处理复原,会由于各类条件的限制造成误差与错误,所以为了解决题目中给定的碎纸片复原问题,我们采用人机结合的方法建立碎纸片的计算机复原模型解决残片复原问题,并把计算机通过算法复原的结果优劣情况作为评价复原模型好坏的标准,通过人工后期的处理得到最佳结果。

面对题目中给出的BMP格式的黑白文字图片,我们使用matlab软件的图像处理功能把图像转化为矩阵形式,矩阵中的元素表示图中该位置像素的灰度值,再对元素进行二值化处理得到新的矩阵。

题目每一个附件中的碎纸片均为来自同一页的文件,所以不需考虑残片中含有未知纸张的残片以及残片中不会含有公共部分。

2013年数学建模b题

2013年数学建模b题

精心整理碎纸片的拼接复原【摘要】:碎纸片拼接技术是数字图像处理领域的一个重要研究方向,把计算机视觉和程序识别应用于碎纸片的复原,在考古、司法、古生物学等方面具有广泛的应用,具有重要的现实意义。

本文主要结合各种实际应用背景,针对碎纸机绞碎的碎纸片,基于计算机辅助对碎纸片进行自动拼接复原研究。

针对问题1,依据图像预处理理论,通过matlab程序处理图像,将图像转化成适合于计算机处理的数字图像,进行灰度分析,提取灰度矩阵。

对于仅纵切的碎纸片,根据矩阵的行提取理论,将每个灰度矩阵的第一列提取,作为新矩阵,提取每个灰度矩阵的最后一列,生成新矩阵。

建立碎纸片匹配模型:将矩阵中的任一列与矩阵中的每一列带入模型,所得p值对应的值,即为所拼接的碎片序列号。

将程序进行循环操作,得到最终的碎片自动拼接结果。

针对问题2,首先将图像信息进行灰度分析,提取灰度矩阵。

基于既纵切又横切的碎纸片,根据矩阵的行列提取理论,分别提取每个灰度矩阵的第一列和最后一列,分别生成新矩阵、;提取所有灰度矩阵的第一行和最后一行,分别作为新生成的矩阵、。

由于纸质文件边缘空白处的灰度值为常量,通过对灰度矩阵的检验提取,确定最左列的碎纸片排序。

在此基础上,采用从局部到整体,从左到右的方法,建立匹配筛选模型:,将矩阵中的任一列分别与矩阵中每一列代入模型,所得p值对应的值即为横排序;将矩阵中的任一行分别于矩阵中的任一行代入模型,所得q值对应的值即为列排序。

循环进行此程序,得计算机的最终运行结果。

所得结果有少许误差,需人工调制,更正排列顺序,得最终拼接结果。

针对问题3,基于碎纸片的文字行列特征,采用遗传算法,将所有的可能性拼接进行比较,进行择优性选择。

反面的排序结果用于对正面排序的检验,发现结果有误差,此时,进行人工干预,调换碎纸片的排序。

【关键词】:灰度矩阵欧式距离图像匹配自动拼接人工干预一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

数学建模b题

数学建模b题

数学建模b题文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]碎纸片的拼接复原【摘要】:碎纸片拼接技术是数字图像处理领域的一个重要研究方向,把计算机视觉和程序识别应用于碎纸片的复原,在考古、司法、古生物学等方面具有广泛的应用,具有重要的现实意义。

本文主要结合各种实际应用背景,针对碎纸机绞碎的碎纸片,基于计算机辅助对碎纸片进行自动拼接复原研究。

针对问题1,依据图像预处理理论,通过matlab程序处理图像,将图像转化成适合于计算机处理的数字图像,进行灰度分析,提取灰度矩阵。

对于仅纵切的碎纸片,根据矩阵的行提取理论,将每个灰度矩阵的第一列提取,作为新矩阵A1,提取每个灰度矩阵的最后一列,生成新矩阵B1。

建立碎纸片匹配模型:a−1,其中i,j=0,n−1。

d(a a,a a)=√∑(a a(a)−a a(a))2a=0aaap=a(a a,a a)0≤a≤a−10≤a≤a−1将矩阵A1中的任一列与矩阵B1中的每一列带入模型,所得p值对应的i ,j值,即为所拼接的碎片序列号。

将程序进行循环操作,得到最终的碎片自动拼接结果。

针对问题2,首先将图像信息进行灰度分析,提取灰度矩阵。

基于既纵切又横切的碎纸片,根据矩阵的行列提取理论,分别提取每个灰度矩阵的第一列和最后一列,分别生成新矩阵A2、B2;提取所有灰度矩阵的第一行和最后一行,分别作为新生成的矩阵C2、D2。

由于纸质文件边缘空白处的灰度值为常量,通过对灰度矩阵的检验提取,确定最左列的碎纸片排序。

在此基础上,采用从局部到整体,从左到右的方法,建立匹配筛选模型:a−1,其中i,j=0,n−1。

d(a a,a a)=√∑(a a(a)−a a(a))2a=0d (a a ,a a )=√∑(a a (a )−a a (a ))2a −1a =0,其中i,j =0,m −1。

p =a (a a ,a a )0≤a ≤a −10≤a ≤a −1aaa,q =a (a a ,a a )0≤a ≤a −10≤a ≤a −1aaa将矩阵A 2中的任一列分别与矩阵B 2中每一列代入模型,所得p 值对应的i ,j值即为横排序;将矩阵C 2中的任一行分别于矩阵D 2中的任一行代入模型,所得q 值对应的i ,j值即为列排序。

13年全国大学生数学建模竞赛—B题—碎纸片的拼接复原

13年全国大学生数学建模竞赛—B题—碎纸片的拼接复原

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西华大学参赛队员(打印并签名) :1. 尚安2. 洋3. 叶军指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期:2013 年09 月15 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文通过分析题中相关要求及条件,建立数学模型解决了各种规则碎纸片的拼接复原问题。

针对问题一,首先将题中所给图片导入matlab软件,利用imread函数得到每图片的文字灰度像素矩阵,再取出所有矩阵左、右列,建立像素绝对差拟配模型,得到拟配程度最高的两幅图片,进行拼接,出现不合理拼接情况则进行人工干预,最后重复上述过程,完成全部拼接并导出图像。

2013年数学建模B题碎纸片的拼接复原

2013年数学建模B题碎纸片的拼接复原

2
碎纸片的拼接复原
摘 要
破碎文件拼接在现实生活中发挥着极大的作用, 但由于传统人工拼接效率低, 自动 拼接技术随之产生, 可以让自动拼接比手工效率高。 本文针对碎纸片的自动拼接问题建 立相应的数学模型,最后针对各个问题建立模型并求解。 针对问题一单面纵切碎纸片进行复原, 首先对图形进行预处理, 即将图形转化成像 素点的灰度值并在 MATLAB 软件中得到相应的矩阵;然后在拼接前进行人工干预,找出 首个图形并采用矩阵相似度函数(corr2())计算与其他碎片的二维相关系数。根据相 关系数大小得到与其相关性最大的碎纸片的序号数, 认为该碎纸片就是待拼接图形的下 一个碎纸片,然后再计算该纸片与其他纸片的相关系数,逐一类推。最终将整张中文的 图形拼接起来,得到 008,014,012,015,003,010,002,016,001,004,005,009,013,018, 011,007,017,000,006 的拼接顺序号;同理可以得到完整正确的英文图形序列号为 003,002,015,011,006,007,018,000,005,001,009,013,010,008,012,014,017,016,004 ,在这过程中人工干预的次数只有在初始化是进行一次,成功率是极大。 针对问题二单面既纵切又横切碎纸片进行复原, 简单来说就是将无数的小碎片拼接 成大碎片,先 MATLAB 软件编写程序取出第一列,然后对第一列的每一个图像找出行顺 序,最后由小碎片拼接成大碎片。从而选出列方向上的 11 个图像;然后采用和问题一 类似的解决方式先对一行进行排序, 对于在算法中出现 NaN 的情况和得到相关系数较弱 的要进行相关的人工干预,试拼出图形;检验合理后,对已拼接出的行进行排序,最后 进行列排序来得到最终拼接结果(详见表 5,表 6,图 4) 。在这一过程中出现 NaN 和相 关系数<0.7 的情况下都有可能会进行人工干预,出现这一情况的可能会很少。 针对问题三双面既纵切又横切碎纸片进行复原, 可以在问题二的基础上进行适当的 多次比较,由于正反两面都有能符合拼接规则,得到拼接结果,这时候需要进行人工干 预,干预次数可能会在题目二的基础上增加几次,但是出现这种情况的次数也是很少。 本文还分析了碎纸片自动拼接方法的优缺点,研究了碎纸片内文字的获取方法, 提出了碎纸片自动拼接算法。根据算法编写了 MATLAB 程序,文章最后还给出了其他的 改进方向,以用于实际应用。 关键词: 矩阵相似度函数 二维相关系数 图形拼接复原 贪婪法

2013年全国数学建模大赛获奖论文碎纸片的拼接复原.

2013年全国数学建模大赛获奖论文碎纸片的拼接复原.

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1. 卢丽丹2. 王雪梅3. 国占飞指导教师或指导教师组负责人(打印并签名):指导教师组(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文主要研究碎纸片拼接复原的问题,它实质上是建立特征数组并利用C语言进行比较。

在问题1中,建立了以每个边缘像素到原点距离的特征数组;通过比较边缘像素,以距离比较的方法得到各个图象的特征数组相似度的大小并以此建立模型1。

具有最大相似度的图片认为其匹配。

对于问题2,由于出现精度太低的情况,所以我们对问题1进行了改进,由于问题2图片横纵切。

2013年数学建模碎纸片的拼接复原模型

2013年数学建模碎纸片的拼接复原模型

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员 (打印并签名) :1.2.3.指导教师或指导教师组负责人 (打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上内容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期: 2013 年 9 月 10 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原模型摘要:本文针对碎纸片的拼接复原问题,提出了互相关匹配模型。

首先对附件图片数值化处理并建立矩阵;然后根据图像页边距特点定位最左边和最右边的碎片;按照每张碎片中的文字部分所在位置,提取同一行碎片,利用互相关函数横向拼合。

在第一问中,附件一、二仅作横向相关性比较即可;在第二、三问中,需要提取同一行碎片横向拼接,并将横向拼合完整的碎片进行竖向拼合,经过人工干预得到结果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛下载)。

我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。

我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):西华大学参赛队员(打印并签名) :1. 尚安2. 洋3. 叶军指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。

以上容请仔细核对,提交后将不再允许做任何修改。

如填写错误,论文可能被取消评奖资格。

)日期:2013 年09 月15 日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文通过分析题中相关要求及条件,建立数学模型解决了各种规则碎纸片的拼接复原问题。

针对问题一,首先将题中所给图片导入matlab软件,利用imread函数得到每图片的文字灰度像素矩阵,再取出所有矩阵左、右列,建立像素绝对差拟配模型,得到拟配程度最高的两幅图片,进行拼接,出现不合理拼接情况则进行人工干预,最后重复上述过程,完成全部拼接并导出图像。

针对问题二,首先将全部碎片导入matlab软件,经过处理得到每碎片中符号距离碎片上下端的像素位,再根据分类聚类思想,利用excel表格处理,将所有具有“相同”像素位的图片分为一组,得到11个分组,然后在每一个分组中建立左右连接点数目最匹配模型,再配合人工干预,将所有碎片拼接为一行图像,最后将这11行图像利用问题一中模型拼接为最终图像并打印结果。

针对问题三,首先建立一种基于K-Means局部最优性的高效聚类模型,然后根据模型利用matlab,将所给图片全部导入分类,分好类并人工调整补充后再利用matlab 在每一组分类中利用问题二模型在人工干预情况下得出原始图像并打印结果。

关键词:像素绝对差拟配模型左右连接点数目最匹配模型人工干预一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。

特别是当碎片数量巨大,人工拼接很难在短时间完成任务。

随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。

请讨论以下问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果以图片形式及表格形式表达(见【结果表达格式说明】)。

2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预,请写出干预方式及干预的时间节点。

复原结果表达要求同上。

3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。

二、模型假设1、假设全部碎纸片边缘光滑2、假设字符色调一致3、假设字符间距相同,没有特殊情况4、假设除字符外,页面没有其他地方具有任何色彩5、假设英文字符书写标准,大小写字号均相同三、符号说明a表示灰色像素矩阵in表示灰色像素矩阵的列数m表示灰色像素矩阵的行数i表示第几个碎片ia表示某个像素点m nb表示某灰度像素点为黑色还是白色right表示灰色像素矩阵最右边列)(ileft表示灰色像素矩阵最左边列)(kw表示某个碎片灰色像素矩阵最左列与另一个碎片灰色像素矩阵最右列的差的绝对值的和四、模型建立与求解4.1问题一4.1.1问题分析整体来看,本问题要求利用数学模型,改原有手动拼接技术为自动或半自动拼接技术,完成题中所给的相应碎纸片的拼接复原工作。

具体操作,考虑所给碎纸片容仅有汉字或英文,而没有颜色、大小、字形之分。

因此,只能利用碎纸片中相应的文字特征进行操作,考虑碎纸片扫描进入在计算机后是以图片的形式存在,而图片又是以像素的情况组成。

所以,首先可将图片导入matlab中,以其像素为基点,得到每个图片的像素矩阵,每一像素矩阵即可表示该图片的特征。

为了利用图片像素矩阵完成图片的拼接,考虑问题一只是将原图分为了19列,每一列具有1980像素,首先可根据左端全为空白,找出原图最左一列碎片,然后利用拼接好的图片最右列像素点去匹配未拼接图片的最左列像素点,使得拼接最为吻合的即为需要拼接的图片,然后拼接,再重复上述过程,直到拼接完成。

具体操作流程如下:图1 问题一解答流程图4.1.2数据处理将图片导入matlab中,然后编写程序(具体代码见附录1),可得每个碎纸片灰度像素矩阵(碎片000局部像素点如下)。

图2 碎片000局部灰度像素点列4.1.3像素绝对差拟配模型建立令碎片导入matlab 编程计算所得的灰色像素矩阵为:191,1980,72,212222111211≤≤==⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=i m n a a a a a aa a a a i mn i m im in i i i n i i i由于碎片像素为72*1980,因此矩阵i a 也是72*1980的,矩阵每一列数据即为碎片相应列像素值,其中每个像素点i m n a 表示此处为黑色或白色,用b 表示某灰度像素点为黑色还是白色,即:720,1980025525500<<<<⎪⎩⎪⎨⎧<<=n m a b mn 其中像表示此处为白色即无图图像之间表示此处在有图像与没像表示此处为黑色即有图 令)(i right 表示灰色像素矩阵最右边列,那么191,1980,72,)(21≤≤==⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=i m n a a a i right i mn i n i n 令)(k left 表示灰色像素矩阵最左边列,则191,1980,72,)(12111≤≤==⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=k m n a a a k left k m k k令w 表示某个碎片灰色像素矩阵最左列与另一个碎片灰色像素矩阵最右列的差的绝对值的和。

那么有190,190)()(19801<<<<-=∑k i k left i right w根据上述模型即可确定某一碎片灰度像素矩阵最右边列与其余未拼接碎片最左边列的绝对差值,下面讨论因差值不同而产生的匹配问题。

1、最左列的确定:当出现某一碎片灰度像素矩阵最左列均为255时,那么说明该碎片为原始图像的最左列。

2、假设出现k w w w w >>>> 321情况,那么首先将k w 对应的碎片与该基准碎片进行拼接,若拼接不合适,这时就需要人工干预,换1-k w 对应的碎片与基准碎片进行拼接。

情况如下:这是不确定的,而进行人工干预选择1-k w 对应的碎片后,将会出现下面情况:这样就能正确的完成两个碎片的拼接。

3、假设出现k w w w w ==== 321情况,这与上述情况相同。

因此,人工干预方式及时间选择也相同。

4.1.4像素绝对差拟配模型求解对于附件一中碎片复原,根据上述模型,利用matlab 软件,求解可得008碎片最左端矩阵列与006碎片最右端矩阵列均为:⎪⎪⎪⎭⎫ ⎝⎛255255 ,因此,可知008碎片为复原图最左一个碎片,006碎片为复原图最右端碎片。

其余求得所有最小的距离w 的值,根据w 的值,可将碎片进行复原。

复原结果如下表,复原图像见附录2。

对于附录二英文复原,与上求解过程雷同,利用matlab 可得复原结果如下表,复原图4.1.5问题一综合分析综上所述,对于问题一的求解过程,未使用人工干预。

本文除使用对问题所给的碎片进行复原外,同时对具有相同属性的其他图形碎片也进行了复原,效果良好,模型稳定,可推广到所有只进行竖切的文档恢复。

4.2问题二——中文碎片复原4.2.1问题分析综合分析。

由于考虑问题二在问题一的基础上将碎片分的更加的细小,那么碎片的灰色像素矩阵数据在原有的基础上将会变得少很多,考虑使用问题一方法及模型,那么首先就要构造出与问题一相同的19个竖碎片,因此考虑将所有碎片分为19组,但经过试验分为19组后,由于空白出现太多,在每组中将11个碎片拼接在一起是相当困难的。

因此,转变思想,考虑将所给所有碎片分为11个组,在每个分组中将19碎片拼接在一起,然后在将11个分组拼接在一起完成最后解答。

具体操作。

要想将11*19图片分为11组,考虑文字具有行高的性质,分组中所拼接的19碎片,所有文字具有的行高应该都是相同的。

根据这一思想,可将所有碎片导入matlab中,编程计算可得每碎片符号距离碎片上下端的像素位,并将所有结果导入excel中,然后根据分类与聚类思想,利用excel表格处理,将碎片符号距离碎片上下端的像素位“相同”(不是绝对相等,允许误差前后波动两个像素)的点分为一组,对于出现空白位置误差较大的点可根据单边距离进行分类与聚类,若根据单边无法确定具体分入那组,那么就同时分入可能的分组中。

分组完成后那么每个分组中的图片定能拼接为一行图片,那么我们可建立左右连接点数目最匹配模型,结合人工干预,将每个分组中图片拼接在一起。

最后利用问题一中模型可将11个分组拼接在一起得到原图。

具体流程如下图:图3 问题二解答流程图4.2.2数据处理将209碎片导入matlab中,编程得到每碎片灰色像素矩阵,然后在利用矩阵编写程序得到每碎片字符距离上下边界的像素位,并将其导入excel中(具体代码见附录4),得到像素位上下边缘距离后可根据上下距离“相等”(不是绝对相等,允许误差前后波动两个像素)原则,利用excel表格处理将所给数据分为11组。

相关文档
最新文档