2013年数学建模B题课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
i1
0k(a1i ) n
得到与T12mn相似性最强的第二块碎纸片记为T13mn
依次类推拼接复原第一行的碎纸片
(2)最后第一行(第11行)的拼接复原流程图 最后一行的第一张碎纸片,记为 T111mn
以此类推,得到最后第一行的碎纸片拼接复原
注:若满足条件的矩阵有多个,则通过文字的特 征人工寻找出最佳匹配矩阵。
(3)第二行—倒数第二行的拼接复原流程图 得到第二行的第一块碎纸片,记为 T 21mn
得到第二行的第二块碎纸片,记为 T 22mn 得到第二行的第三块碎纸片,记为 T 23mn
得到第二行的第四块碎纸片,记为 T 24mn 以此类推,得到第二行的碎纸片拼接复原 第三行、第四行……倒数第二行同理拼接复原
(三)问题三的解题思路 附件5:双面打印的英文文件,纵切横切产生 了209块碎纸片
1.利用matlab软件把图片变成二值化矩阵 2. 定义两个矩阵相似,然后进行聚类分析
(1)拼接第一行的流程图
以此类推,完成第一行的拼接复原
(2)拼接第二行—倒数第二行的流程图
以此类推,完成中间行的拼接复原
附件4:纵切横切产生的209张英文碎纸片
3. 上述所给碎片数据均为单面打印文件,从现实情 形出发,还可能有双面打印文件的碎纸片拼接复原 问题需要解决。附件5给出的是一页英文印刷文字双 面打印文件的碎片数据。请尝试设计相应的碎纸片 拼接复原模型与算法,并就附件5的碎片数据给出拼 接复原结果,结果表达要求同上。
附件5:双面打印的英文文件,纵切横切产生 了209块碎纸片
二、寻找解题思路
(一)针对附件1中由碎纸 机纵向等距切成的19条中文 碎纸片的情形,建立拼接复 原模型和算法。
1.碎纸片的数值化处理
用Matlab软件中的imread函数把碎片转化为 元素从0到255的数值矩阵. 0到255代表的是黑白图像中点的颜色深度, 其中纯白为255,纯黑为0. 把数值矩阵二值化即变成由元素0和1构成的数值矩阵
2013年B题 碎纸片的拼接复原
一、阅读题目
弄清已有信息;需解决的问题.
破碎文件的拼接在司法物证复原、历史文 献修复以及军事情报获取等领域都有着重要的 应用。传统上,拼接复原工作需由人工完成, 准确率较高,但效率很低。特别是当碎片数量 巨大,人工拼接很难在短时间内完成任务。随 着计算机技术的发展,人们试图开发碎纸片的 自动拼接技术,以提高拼接复原效率。请讨论 以下问题:
|
0 k1
T1}
0 k1
i1
T11(ain )
A0k1 (ai1) },以及
i1
0k(a1i ) n
得到与T11mn相似性最强的第二块碎纸片记为T12mn
。
m
n
A 通过 min {
A A {
|
0 k1
T11,T 12}
0 k1
i1
T1(ain )
A0k1 (ai1) },以及
19条碎纸片——19个m n的矩阵,元素为0,1
2. 定义两个矩阵相似,然后进行聚类分析
根记为据T首1;段特征人工挑选出第一块碎纸片,其二值化矩阵为A0k ,
A0 k
T1矩阵的最后一列与剩余18个二值化矩阵的第一列进行
相似性分析,取相似性最强的作为第二张碎纸片
m
通过 min {
A A {
|
0 k1
附件2 英文文件,碎纸机 纵向等距切成了19条
2. 对于碎纸机既纵切又横切的情形,请设计碎纸 片拼接复原模型和算法,并针对附件3、附件4给 出的中、英文各一页文件的碎片数据进行拼接复 原。如果复原过程需要人工干预,请写出干预方 式及干预的时间节点。复原结果表达要求同上。
附件3:纵切横切产生的209张中文碎纸片
(3)拼接最后一行(第11行)流程图
)
假设 (1)通过人工干预均能准确找到拼接复原后的 第一张碎纸片; (2)一文件切碎后的碎纸片都是全等的矩形
模型检验:
自行构造碎片,检验与评价所提出的拼 接复原模型的复原效果。
附件2 碎纸机纵向等距切成了19条的英文碎纸片
注:若满足条件的矩阵有多个,则通过文字的特 征人工寻找出最佳匹配矩阵作为Tn
相似性的度量 ——两个向量相似性的度量
m
2
欧式平方距离: min {
A A {
|
0 k1
T1}
0 k1
i1
T1(ain )
n
A0k1 (ai1)
},
xkixkj
|
0 k1
T1}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T1相似性最强的第二块碎纸片记为T2
m
通过 min {
A A {
|
0 k1
T1、T2}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T2相似性最强的第三块碎纸片记为T3
以此类推完成19条碎纸片的拼接复原
夹角余弦:cij cosij
k 1 n
n
Leabharlann Baidu
xk2i xk2j
k 1 k 1
相关系数(Pearson correlation)
ij
n
(xki xi )(xkj x j )
k 1
n
n
[ (xki xi )2 ][ (xkj x j )2 ]
k 1
1. 对于给定的来自同一页印刷文字文件的碎纸机破 碎纸片(仅纵切),建立碎纸片拼接复原模型和算 法,并针对附件1、附件2给出的中、英文各一页文 件的碎片数据进行拼接复原。如果复原过程需要人 工干预,请写出干预方式及干预的时间节点。复原 结果以图片形式及表格形式表达。
附件1 中文文件,碎纸机 纵向等距切成了19条
T1}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T1相似性最强的第二块碎纸片记为T2
m
通过 min {
A A {
|
0 k1
T1、T2}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T2相似性最强的第三块碎纸片记为T3
m
通过 min {
A A {
k 1
(二)问题二的解题思路 附件3:纵切横切产生的209张中文碎纸片
1.利用matlab软件把图片变成二值化矩阵 2. 定义两个矩阵相似,然后进行聚类分析
(1)拼接第1行碎纸片的的流程图
根据首段特征人工确定文件拼接复原后的第一块碎片,即为 T11mn
m
n
A 通过 min {
A A {
0k(a1i ) n
得到与T12mn相似性最强的第二块碎纸片记为T13mn
依次类推拼接复原第一行的碎纸片
(2)最后第一行(第11行)的拼接复原流程图 最后一行的第一张碎纸片,记为 T111mn
以此类推,得到最后第一行的碎纸片拼接复原
注:若满足条件的矩阵有多个,则通过文字的特 征人工寻找出最佳匹配矩阵。
(3)第二行—倒数第二行的拼接复原流程图 得到第二行的第一块碎纸片,记为 T 21mn
得到第二行的第二块碎纸片,记为 T 22mn 得到第二行的第三块碎纸片,记为 T 23mn
得到第二行的第四块碎纸片,记为 T 24mn 以此类推,得到第二行的碎纸片拼接复原 第三行、第四行……倒数第二行同理拼接复原
(三)问题三的解题思路 附件5:双面打印的英文文件,纵切横切产生 了209块碎纸片
1.利用matlab软件把图片变成二值化矩阵 2. 定义两个矩阵相似,然后进行聚类分析
(1)拼接第一行的流程图
以此类推,完成第一行的拼接复原
(2)拼接第二行—倒数第二行的流程图
以此类推,完成中间行的拼接复原
附件4:纵切横切产生的209张英文碎纸片
3. 上述所给碎片数据均为单面打印文件,从现实情 形出发,还可能有双面打印文件的碎纸片拼接复原 问题需要解决。附件5给出的是一页英文印刷文字双 面打印文件的碎片数据。请尝试设计相应的碎纸片 拼接复原模型与算法,并就附件5的碎片数据给出拼 接复原结果,结果表达要求同上。
附件5:双面打印的英文文件,纵切横切产生 了209块碎纸片
二、寻找解题思路
(一)针对附件1中由碎纸 机纵向等距切成的19条中文 碎纸片的情形,建立拼接复 原模型和算法。
1.碎纸片的数值化处理
用Matlab软件中的imread函数把碎片转化为 元素从0到255的数值矩阵. 0到255代表的是黑白图像中点的颜色深度, 其中纯白为255,纯黑为0. 把数值矩阵二值化即变成由元素0和1构成的数值矩阵
2013年B题 碎纸片的拼接复原
一、阅读题目
弄清已有信息;需解决的问题.
破碎文件的拼接在司法物证复原、历史文 献修复以及军事情报获取等领域都有着重要的 应用。传统上,拼接复原工作需由人工完成, 准确率较高,但效率很低。特别是当碎片数量 巨大,人工拼接很难在短时间内完成任务。随 着计算机技术的发展,人们试图开发碎纸片的 自动拼接技术,以提高拼接复原效率。请讨论 以下问题:
|
0 k1
T1}
0 k1
i1
T11(ain )
A0k1 (ai1) },以及
i1
0k(a1i ) n
得到与T11mn相似性最强的第二块碎纸片记为T12mn
。
m
n
A 通过 min {
A A {
|
0 k1
T11,T 12}
0 k1
i1
T1(ain )
A0k1 (ai1) },以及
19条碎纸片——19个m n的矩阵,元素为0,1
2. 定义两个矩阵相似,然后进行聚类分析
根记为据T首1;段特征人工挑选出第一块碎纸片,其二值化矩阵为A0k ,
A0 k
T1矩阵的最后一列与剩余18个二值化矩阵的第一列进行
相似性分析,取相似性最强的作为第二张碎纸片
m
通过 min {
A A {
|
0 k1
附件2 英文文件,碎纸机 纵向等距切成了19条
2. 对于碎纸机既纵切又横切的情形,请设计碎纸 片拼接复原模型和算法,并针对附件3、附件4给 出的中、英文各一页文件的碎片数据进行拼接复 原。如果复原过程需要人工干预,请写出干预方 式及干预的时间节点。复原结果表达要求同上。
附件3:纵切横切产生的209张中文碎纸片
(3)拼接最后一行(第11行)流程图
)
假设 (1)通过人工干预均能准确找到拼接复原后的 第一张碎纸片; (2)一文件切碎后的碎纸片都是全等的矩形
模型检验:
自行构造碎片,检验与评价所提出的拼 接复原模型的复原效果。
附件2 碎纸机纵向等距切成了19条的英文碎纸片
注:若满足条件的矩阵有多个,则通过文字的特 征人工寻找出最佳匹配矩阵作为Tn
相似性的度量 ——两个向量相似性的度量
m
2
欧式平方距离: min {
A A {
|
0 k1
T1}
0 k1
i1
T1(ain )
n
A0k1 (ai1)
},
xkixkj
|
0 k1
T1}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T1相似性最强的第二块碎纸片记为T2
m
通过 min {
A A {
|
0 k1
T1、T2}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T2相似性最强的第三块碎纸片记为T3
以此类推完成19条碎纸片的拼接复原
夹角余弦:cij cosij
k 1 n
n
Leabharlann Baidu
xk2i xk2j
k 1 k 1
相关系数(Pearson correlation)
ij
n
(xki xi )(xkj x j )
k 1
n
n
[ (xki xi )2 ][ (xkj x j )2 ]
k 1
1. 对于给定的来自同一页印刷文字文件的碎纸机破 碎纸片(仅纵切),建立碎纸片拼接复原模型和算 法,并针对附件1、附件2给出的中、英文各一页文 件的碎片数据进行拼接复原。如果复原过程需要人 工干预,请写出干预方式及干预的时间节点。复原 结果以图片形式及表格形式表达。
附件1 中文文件,碎纸机 纵向等距切成了19条
T1}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T1相似性最强的第二块碎纸片记为T2
m
通过 min {
A A {
|
0 k1
T1、T2}
0 k1
i 1
T1(ain )
A0k1 (ai1) },得到与T2相似性最强的第三块碎纸片记为T3
m
通过 min {
A A {
k 1
(二)问题二的解题思路 附件3:纵切横切产生的209张中文碎纸片
1.利用matlab软件把图片变成二值化矩阵 2. 定义两个矩阵相似,然后进行聚类分析
(1)拼接第1行碎纸片的的流程图
根据首段特征人工确定文件拼接复原后的第一块碎片,即为 T11mn
m
n
A 通过 min {
A A {