高教社杯全国大学生数学建模竞赛B题论文

合集下载

《2024年2016年全国大学生数学建模竞赛B题解题分析与总结》范文

《2016年全国大学生数学建模竞赛B题解题分析与总结》篇一一、引言2016年全国大学生数学建模竞赛B题，是一道涉及复杂系统分析与优化的实际问题。

该题目要求参赛者运用数学建模的方法，对给定的问题进行深入分析，并寻求最优解决方案。

本文将对B 题的解题过程进行详细分析，并总结经验教训。

二、题目概述B题主要围绕某大型网络公司的员工分配问题展开。

公司需根据员工的能力、需求以及项目的要求，合理分配员工到各个项目组，以实现公司整体效益的最大化。

该问题涉及到多目标决策、优化算法以及复杂系统分析等多个方面。

三、解题分析1. 问题理解：首先，我们需要对题目进行深入理解，明确问题的背景、目标和约束条件。

在这个阶段，我们需要对员工的能力、需求以及项目的要求进行详细的分析，为后续的建模打下基础。

2. 数学建模：根据问题的特点，我们选择建立多目标决策模型。

模型中，我们将员工的能力、需求以及项目的要求作为决策变量，以公司整体效益作为目标函数。

同时，我们还需要考虑各种约束条件，如员工数量的限制、项目需求的满足等。

3. 算法设计：在建立模型后，我们需要设计合适的算法来求解模型。

在这个阶段，我们选择了遗传算法和模拟退火算法进行求解。

遗传算法能够在大范围内搜索最优解，而模拟退火算法则能够在局部范围内进行精细搜索，两种算法的结合能够更好地求解该问题。

4. 求解与优化：在算法设计完成后，我们开始进行求解与优化。

首先，我们使用遗传算法对模型进行粗略求解，得到一组初步的解决方案。

然后，我们使用模拟退火算法对初步解决方案进行优化，以得到更优的解决方案。

在优化过程中，我们还需要不断调整模型的参数和算法的参数，以获得更好的求解效果。

5. 结果分析：在得到求解结果后，我们需要对结果进行分析。

首先，我们需要对结果进行验证，确保结果的正确性和有效性。

然后，我们需要对结果进行敏感性分析，分析各种因素对结果的影响程度。

最后，我们需要提出一些管理建议和改进措施，以帮助公司更好地解决实际问题。

2017数学建模b题优秀论文

2017数学建模b题优秀论文利用数学知识解决现实生活的具体问题了成为当今数学界普遍关注的内容，利用建立数学模型解决实际问题的数学建模活动也应运而生了。

下文是店铺为大家搜集整理的关于2017数学建模b题优秀论文的内容，欢迎大家阅读参考!2017数学建模b题优秀论文篇1浅谈数学建模实验教学改革摘要：阐述了数学建模课程在大学生知识面的拓宽、全方位能力的培养以及人文素质的提高三方面的重要作用，提出了数学建模课程有助于提高学生的综合素质。

从数学建模理论课程和实验教学两者之间的区别与联系的角度提出了实验教学改革的必要性，最后针对数学建模实验教学的具体情况提出了实验教学改革的措施。

关键词：数学建模;实验教学;教学改革一、数学建模课程有助于提高学生的综合素质随着教育改革的不断深入，我国目前正在开展以“素质和素质教育”为核心的教育思想与教育观念大讨论。

在1983年召开的世界大学校长会议中，对理想的大学生综合素质提出了三条标准：专业知识要掌握本学科的方法论、具有将本学科知识与实际生活与其他学科相结合的能力以及具有良好的人格素质。

[1]数学是一切科学和技术的基础，数学的思考方式对培养学生科学的思维方法具有重要意义，因而数学的重要性是毋庸置疑的。

数学和各学科的相互渗透及其在技术中的应用，推动了数学本身的发展和各个学科理论的发展。

戴维在1984年说过：“对数学研究的低水平的资助只能来自对于数学研究带来的好处的完全不妥的评价。

显然，很少有人认识到当今被如此称颂的‘高技术’本质上是数学技术。

”数学的广泛应用性主要取决于数学的思维方式。

数学对于学生的培养，不只是数学定理的证明，公式、定义的理解，重要的是培养学生具备正确的思想方法，而且可以依据自己所学到的知识不断创新、不断寻找新的途径。

21世纪以来，数学建模课程的开设在国内高校中稳步展开，并获得了广泛认同。

参加数学建模竞赛的学校和人数逐年上升，数学建模课程的重要性得到广泛认可，越来越多的高校开设了数学建模课程。

2014高教社杯全国数学建模竞赛B题全国二等奖论文

承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》（以下简称为“竞赛章程和参赛规则”，可从全国大学生数学建模竞赛网站下载）。

我们完全明白，在竞赛开始后参赛队员不能以任何方式（包括电话、电子邮件、网上咨询等）与队外的任何人（包括指导教师）研究、讨论与赛题有关的问题。

我们知道，抄袭别人的成果是违反竞赛章程和参赛规则的，如果引用别人的成果或其他公开的资料（包括网上查到的资料），必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。

我们郑重承诺，严格遵守竞赛章程和参赛规则，以保证竞赛的公正、公平性。

如有违反竞赛章程和参赛规则的行为，我们将受到严肃处理。

我们授权全国大学生数学建模竞赛组委会，可将我们的论文以任何形式进行公开展示（包括进行网上公示，在书籍、期刊和其他媒体进行正式或非正式发表等）。

我们参赛选择的题号是（从A/B/C/D中选择一项填写）： B我们的报名参赛队号为（8位数字组成的编号）：所属学校（请填写完整的全名）：江西理工大学参赛队员(打印并签名) ：1. 胡东2. 黄星胜3. 王瑞萍指导教师或指导教师组负责人(打印并签名)：熊小峰（论文纸质版与电子版中的以上信息必须一致，只是电子版中无需签名。

以上内容请仔细核对，提交后将不再允许做任何修改。

如填写错误，论文可能被取消评奖资格。

）日期： 2014 年 9月 15日赛区评阅编号（由赛区组委会评阅前进行编号）：编号专用页赛区评阅编号（由赛区组委会评阅前进行编号）：全国统一编号（由赛区组委会送交全国前编号）：全国评阅编号（由全国组委会评阅前进行编号）：创意平板折叠桌摘要本文讨论了平板折叠桌折叠的动态变化过程及相应的参数设计问题，以及在一定条件下折叠桌的最优设计加工参数求解问题。

利用空间解析几何知识，建立了非线性规划模型，用MATLAB软件和LINGO软件进行求解，得到了各种条件下的各个参数的尺寸。

针对问题一，根据题目所提供图1，从最外侧桌腿木条到中间桌腿木条依次编号为10，。

全国大学生数学建模竞赛b题全国优秀论文

基于打车软件的出租车供求匹配度模型研究与分析摘要目前城市“出行难”、“打车难”的社会难题导致越来越多的线上打车软件出现在市场上。

“打车难”已成为社会热点。

以此为背景，本文将要解决分析的三个问题应运而生。

本文运用主成分分析、定性分析等分析方法以及部分经济学理论成功解决了这三个问题，得到了不同时空下衡量出租车资源供求匹配程度的指标与模型以及一个合适的补贴方案政策，并对现有的各公司出租车补贴政策进行了分析。

针对问题一，根据各大城市的宏观出租车数据，绘制柱形图进行重点数据的对比分析，首先确定适合进行分析研究的城市。

之后，根据该市不同地区、时间段的不同特点选择多个数据样本区，以数据样本区作为研究对象，进行多种数据（包括出租车分布、出租车需求量等）的采集整理。

接着，通过主成分分析法确定模型的目标函数、约束条件等。

最后运用spss软件工具对数据进行计算，求出匹配程度函数F与指标的关系式，并对结果进行分析。

针对问题二，在各公司出租车补贴政策部分已知的情况下，综合考虑出租车司机以及顾客两个方面的利益，分别就理想情况与实际情况进行全方位的分析。

在问题一的模型与数据结果基础上，首先分别从给司机和乘客补贴两个角度定性分析了补贴的效果。

重点就给司机进行补贴的方式进行讨论，定量分析了目前补贴方案的效果，得出了如果统一给每次成功的打车给予相同的补贴无法改善打车难易程度的结论，并对第三问模型的设计提供了启示，即需要对具有不同打车难易程度和需求量的区域采取分级的补贴政策。

针对问题三，在问题二的基础上我们设计了一种根据不同区域打车难易程度和需求量来确定补贴等级的方法。

设计了相应的量化指标，以极大化各区域打车难易程度降低的幅度之和作为目标，建立该问题的规划模型。

目的是通过优化求解该模型，使得通过求得的优化补贴方案，能够优化调度出租车资源，使得打车难区域得到缓解。

通过设计启发式原则和计算机模拟的方法进行求解，并以具体案例分析得到，本文方法相对统一的补贴方案而言的确可以一定程度缓解打车难的程度。

大学生数学建模竞赛B题优秀论文

关于高等教育学费标准的评价及建议摘要本文通过对近几年来学费变化的研究，综合分析影响学费变化的五个要素，引入了三个变因：学校属性、专业类型、地域差异对学费的影响，对其合理性进行了定量的分析和评价。

首先，我们基于层次分析法建立了模型一。

模型一以五个要素，即教育市场供求关系、全国家庭支付承受力、国家财政及相关社会捐助、个人收益率、教育成本为方案层。

对于教育市场的供求关系我们用灰色预测GM（1，1）模型预测出未来几年的招生人数，用蛛网模型求解稳定的价格点为3225.51 元；对于国家财政及相关社会捐助，我们用回归分析得出其效应关系。

模型一以效率和公平两个标准作为准则层，应用极差归一化思想，构造指标函数，综合建立成对比较矩阵。

我们定义学费合理化指数为目标层，经准则层，得出五个要素对学费合理化指数的组合权重向量。

考虑到成对比较矩阵仍有一定主观因素，我们用熵值取权法修正组合权重向量。

最后，拟合出最佳学费曲线及其波动区间，其中 2007 年的结论值为 3370.75 元。

模型一的突出优点是客观可信，美中不足的是结论为一个平均最优值，没有考虑其他变因的影响，使用的局限性较大。

然后，我们基于学校属性、专业类型、地域差异三个变因对结论的影响建立了模型二。

评价了这三个变因对五个要素的综合影响，修正了五个要素对学费合理化指数的影响，使得结论更趋于合理，应用范围更加广泛。

修正后通过若干数据的检验，得出平均最佳学费约为 3000 元。

基于这两个模型，以及对高校学费现状的了解，我们提出三点主要建议： 1.鼓励高校开拓资金来源渠道，学习国外筹款方式，如发行教育彩票等； 2.建议国家增加助学贷款发放力度，并能够分类别基于不同金额的贷款，并出台一些补贴政策弥补不同地区的差异； 3.大力扶持民办高等院校发展，实现高等教育大众化，这样不仅缓解高等院校招生压力，并且能够促进高校教育健康发展。

本文的特色在于基于翔实丰富的资料，根据五个要素及三个变因的分析，建立了一种合理的高校学费评价体系，其拥有适用性广，稳定性好，灵敏度高等特点，对三个变因，即学校属性、专业类型、地域差异进行了深入定量的分析，并根据模型结论给提出了我们的一些可行性建议。

《2024年2016年全国大学生数学建模竞赛B题解题分析与总结》范文

《2016年全国大学生数学建模竞赛B题解题分析与总结》篇一一、引言全国大学生数学建模竞赛（CUMCM）是衡量各高校数学类学科学生学习与实践能力的标志性竞赛之一。

其中，B题以真实问题的复杂性吸引了广大参赛选手的关注。

本文将对B题的具体题目内容、解题过程、常见方法和误区进行分析，并结合实例对竞赛结果进行总结，以期为其他参赛同学提供一定的参考。

二、题目分析B题通常关注某一实际领域的复杂问题，涉及多个因素的综合考量。

其要求参赛者通过建立数学模型，解决实际问题。

具体问题包括某个地区的旅游经济预测和资源合理配置。

针对此问题，首先需要对旅游业的各项数据进行详细分析，然后构建适当的数学模型，并使用合适的数学工具和软件进行计算和模拟。

三、解题过程1. 数据收集与分析：收集该地区的历史旅游数据，包括游客数量、消费水平、旅游景点分布等。

同时，分析该地区的经济、文化、交通等影响旅游业的因素。

2. 模型构建：根据收集的数据和实际情况，选择合适的数学模型进行建模。

常见的模型包括时间序列预测模型（如ARIMA 模型）、多元回归模型等。

3. 模型求解与验证：利用数学软件（如MATLAB、SPSS等）对模型进行求解，并对模型的预测结果进行验证。

验证方法包括与历史数据进行对比、进行敏感性分析等。

4. 资源合理配置：根据预测结果和实际情况，制定合理的资源分配方案，如旅游景点的开发策略、交通设施的优化配置等。

四、常见方法与误区1. 常见方法：在建模过程中，应选择合适的数学模型和方法。

对于时间序列预测问题，常用的有ARIMA模型、指数平滑法等；对于多元回归问题，则需要考虑各因素之间的相互关系。

同时，还应充分利用计算机技术进行数据分析和模拟。

2. 误区提示：在建模过程中，要避免陷入一些常见的误区。

例如，过分追求模型的复杂性和精确度而忽视模型的实用性和可解释性；忽视数据的预处理和清洗工作；忽略模型的验证和修正等。

五、实例分析以某次B题竞赛的优秀解决方案为例，详细分析其解题过程和关键点。

全国大学生数学建模竞赛B题优秀论文

2.2 模型的符号说明
(１）表示客流量随时间的变化值,R、ＲW、RG分别表示上海国际旅游入境人数本底值、外国游客入境人数本底值、港澳台游客入境人数本底值;
（2）R１表示20１0年1、2、3、4、11、１2月上海国际旅游入境实际人数，Ｒ2表示世博会期间上海国际旅游入境实际人数,RZ表示2０1０年上海国际旅游总入境实际人数;
最后,通过对模型结果的分析，量化评估上海世博会的影响力。从世博会对以上各个指标的贡献率可以看出：世博会极大地促进了旅游业的发展,并且对上海的财政收入做出了巨大的贡献。在分析所得结果的基础上,客观评价此模型，并指出其优点和缺点。
关键词：上海世博会影响力本底趋势线内插值
1.问题重述
201０年上海世博会是首次在中国举办的世界博览会。从１851年伦敦的“万国工业博览会”开始，世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立数学模型，利用互联网数据,定量评估2010年上海世博会的影响力。
2.模型的假设与符号说明
２.1模型的假设
201０年上海世博会作为一场世界级的盛宴,要对其影响力进行定量评估,尚存在一些不确定因素。故为了研究方便，我们给出以下假设：
(1)假设世博会不受偶然事件严重冲击和干扰；
(２)假设旅游人数只受主要因素影响，其他一些因素可以忽略,比如天气等因素；
（３)假设世博会期间每月游览总人数波动不大，非世博会期间每月游览总人数波动也不大。
第二步,用Ｅxｃel的指数模型、乘幂模型和SＰＳＳ的指数-三角函数复合模型、直线-逻辑线增长复合模型、直线-三角函数复合模型对各个指标进行拟合,确定有关参数，获得各个指标的趋势线模型和方程,并计算各年的本底值;

2004年全国数学建模B题论文

2004高教社杯全国大学生数学建模竞赛题目B题电力市场的输电阻塞管理摘要本文是基于电力市场交易规则和输电阻塞管理原则，对电力市场的输电阻塞管理进行研究，提出合理假设，建立了较完善的模型，很好的解决了在电力市场中存在的一些问题。

问题一：首先作图分析数据，得出单个机组与线路潮流有线性关系，建立多元线性回归模型，用matlab进行拟合求出各线路上有功潮流关于各发电机组出力的近似表达式。

问题二：序内容量不出力的部分按清算价与修改后方案中该机组最后被选入段价之差补偿，序外容量多出力的部分根据该机组最后一个被选入的段价为进行补偿，两部分的补偿即阻塞费用。

问题三：先找到各机组在爬坡速率限定下下一时段出力值的变化范围，在此基础上逐步找出保证满足下一时段的负荷需求且总的购电费用最小的最优问题四：考虑每条线路都不发生阻塞、调整后总负荷不变、总的阻塞费用最小，采用遗传优化算法，对问题三中得到的预案进行调整。

无法通过调整预案使输电阻塞完全消除，故建立非线性优化模型，使每条线路上潮流的绝对值超过限值的百分比尽量小。

【关键词】一、问题重述我国电力系统的市场化改革正在积极、稳步地进行。

2003年3月国家电力监管委员会成立，2003年6月该委员会发文列出了组建东北区域电力市场和进行华东区域电力市场试点的时间表，标志着电力市场化改革已经进入实质性阶段。

可以预计，随着我国用电紧张的缓解，电力市场化将进入新一轮的发展，这给有关产业和研究部门带来了可预期的机遇和挑战。

电力从生产到使用的四大环节——发电、输电、配电和用电是瞬间完成的。

我国电力市场初期是发电侧电力市场，采取交易与调度一体化的模式。

电网公司在组织交易、调度和配送时，必须遵循电网“安全第一”的原则，同时要制订一个电力市场交易规则，按照购电费用最小的经济目标来运作。

市场交易-调度中心根据负荷预报和交易规则制订满足电网安全运行的调度计划――各发电机组的出力（发电功率）分配方案；在执行调度计划的过程中，还需实时调度承担AGC（自动发电控制）辅助服务的机组出力，以跟踪电网中实时变化的负荷。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

碎纸片的拼接复原摘要本文利用Manhattan距离，聚类分析，图像处理等方法解决了碎纸片的拼接复原问题。

由于碎纸机产生的碎纸片是边缘规则且等大的矩形，此时碎纸片拼接方法就不能利用碎片边缘的尖角特征等基于边界几何特征的拼接方法，而要利用碎片内的字迹断线或碎片内的文字位置搜索与之匹配的相邻碎纸片。

拼接碎片前利用数学软件MATLAB软件对碎片图像进行数据化处理，得到对应的像素矩阵，后设置阈值对像素矩阵进行二值化处理，得到相应的0-1矩阵。

下面分别对三个问题的解决方法和算法实现做简单的阐述：问题一，分别对附件1和附件2的碎片数据进行处理得到相应的0-1矩阵，依次计算某个0-1矩阵最右边一列组成向量与其他所有0-1矩阵的最左边向量的Manhattan距离，可以得到某个最小距离值、说明最小距离值对应的碎片是可与基准碎片拼接的，最终得到碎片拼接完整的图像。

问题二，同样对于附件3和附件4中的碎片数据进行处理得到相应的数值矩阵，并计算得到每个碎片顶部空白高度和文字高度，即指每行像素点都为255的行数、一行中存在像素点为非255的行数，根据空白高度和文字高度对碎片进行聚类分类，聚类阀值取3像素，得到11组像素矩阵，进而得到11类可能在同一行的碎片类。

其中对附件4中的英文的处理中，我们还采用水平像素投影累积的方法，进一步分类出可能在同一行的碎片类。

用问题一的方法，计算Manhattan 距离可以对每一类碎片按次序排列好，得到11行已经排列好的碎片，再应用曼哈顿距离在竖直方向上进行聚合得到完整的图像。

问题三，首先，对于附件5中的碎片数据我们采用正反相接，本文将b面最左边的一列像素拼接到a面最右边的一列像素的下面，构成360×1的向量，再把其他的碎片采用相同的办法得到360×1的向量，再用问题一的方法，计算出各碎片之间的Manhattan距离。

其次，根据每个碎片顶部的空白高度或者文字高度对碎片进行区间分类，得到22组矩阵，然后应用曼哈顿距离将得到的22组矩阵聚成两类，每类各包含两面的11组矩阵，最后利用Manhattan距离在竖直方向上进行聚合得到完整的图像。

本文最后，我们根据算法的效率实现进行了改进和优化，实现算法的移植性、灵活性、运行效率等得以提升。

关键词：曼哈顿距离，聚类分析，二值化处理一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。

传统上，拼接复原工作需由人工完成，准确率较高，但效率很低。

特别是当碎片数量巨大，人工拼接很难在短时间内完成任务。

随着计算机技术的发展，人们试图开发碎纸片的自动拼接技术，以提高拼接复原效率。

请讨论以下问题：1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切），建立碎纸片拼接复原模型和算法，并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

复原结果以图片形式及表格形式表达。

2. 对于碎纸机既纵切又横切的情形，请设计碎纸片拼接复原模型和算法，并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。

如果复原过程需要人工干预，请写出干预方式及干预的时间节点。

复原结果表达要求同上。

3. 上述所给碎片数据均为单面打印文件，从现实情形出发，还可能有双面打印文件的碎纸片拼接复原问题需要解决。

附件5给出的是一页英文印刷文字双面打印文件的碎片数据。

请尝试设计相应的碎纸片拼接复原模型与算法，并就附件5的碎片数据给出拼接复原结果，结果表达要求同上。

二、问题分析我们从附件中的碎片数据可知由于碎纸机产生的碎纸片边缘是规则的，此时碎纸片计算机拼接方法就不能利用碎片边缘的尖点特征、尖角特征、面积特征等基于边界几何特征的拼接方法，而要利用碎片内的字迹断线或碎片内的文字内容是否匹配搜索与之匹配的相邻碎纸片并进行拼接。

首先，我们对碎片内图像进行数据化处理，得到对应的像素值矩阵；然后，我们设置阈值对像素值矩阵进行二值化处理得到相应的数值矩阵；最后，由于曼哈顿距离公式计算快、数值小，数值矩阵与数值矩阵之间应用最小曼哈顿距离对碎纸片进行拼接复原。

问题一中碎纸机破碎纸片只有纵切，每页纸被切为19条碎片，经过处理可以得到19个数值矩阵。

对于每个数值矩阵，我们依次取出最左边一列从上至下各格的值组成一个向量，同样我们依次取出最右边一列从上至下各格的值组成一个向量。

计算出每一数值矩阵的左边向量与所有非同源数值矩阵的右边向量的曼哈顿距离，再将得到的距离值进行排序，当某个距离值最小时、说明相应的左边向量与右边向量的匹配率最大，则该距离对应的左、右边认为是可拼接的。

若得到的最小距离值不止一个，则此时需要进行人工干预。

问题二是对碎纸机既纵切又横切的情形进行讨论，比问题一多了横切条件，此时每页纸被切为209个碎片。

首先，我们利用文件最左边碎片与最上面碎片的特殊性对这209个碎片进行聚类，得到两类特殊的碎片，分别是文件最左边一列碎片和最上面一行碎片，然后类似于问题一的处理方法，应用最小曼哈顿距离对每一类碎片按正确顺序拼接，此后对其余碎片再应用最小曼哈顿距离逐一进行拼接，直至剩余所有的碎片都拼接上。

问题三中，题目要求考虑双面打印文件的碎纸拼接复原问题的解决方案，此时每页纸虽然也是被切为209个碎片，但每个碎片却有正反两面，因此经过处理得到418个数值矩阵，，此时我们分别对每一面各自进行类似问题一的处理，然后综合每一面的聚类情况再应用最小曼哈顿距离对双面碎纸片进行拼接复原。

三、模型假设1. 假设碎纸机破碎纸片（纵切或横切）得到的碎纸片是规则且边缘是整齐的等大的矩形；2.假设我们对文档碎纸片拼接复原不考虑碎片边缘的尖点特征、尖角特征、面积特征等基于边界几何特征；3.假设附件中给出的所有中、英文文件中的文字排版是按标准格式排版的。

4.假设附件中给出的所有中、英文字符都是统一格式，且内容为普通文章。

5.1 问题一（曼哈顿距离）➢ 模型一的建立题目要求对于给定的来自同一页印刷文字文件的碎纸机破碎纸片（仅纵切）建立碎纸片拼接复原模型和算法，并且要对中、英文各一页文件的碎片数据分别进行拼接复原。

首先，我们利用数学软件MATLAB 软件将19条碎片数据化，得到19个像素值矩阵，像素值的变化范围是从0变化到255，此时我们设置127τ=为阈值对像素值矩阵进行二值化处理，当矩阵某位置像素值小于等于τ时，则将对应位置的数值设为0；当矩阵某位置像素值大于τ时，则将对应位置的数值设为127。

这样我们就得到19个二值化了的数值矩阵iA ，对于每个数值矩阵iA ，我们依次取出最左边一列从上至下各格的值组成一个向量，记为iX ，同样的我们依次取出最右边一列从上至下各格的值组成一个向量，记为i Y 。

计算出每一数值矩阵的左边向量与所有非同源数值矩阵的右边向量的曼哈顿距离(,)i j d X Y 。

➢ 模型一的求解对于得到的向量12(,,...,)(1,2,...,)Ti i i ik X x x x k m ==和向量12(,,...,)(1,2,...,)Ti i i ik Y y y y k n ==，两向量的曼哈顿距离为1(,)||(,1,2,...,)ni j ik jk k d X Y x y i j m i j ==-=≠∑且。

可求出附件1碎片与碎片之间的曼哈顿距离，如下表所示。

表1 附件1碎片与碎片间的曼哈顿距离从而可得到附件1碎片序号按复原后顺序如下表所示。

表2 附件1碎片序号复原后顺序附件1碎片复原图片如附录中图8.1所示。

同法可求出附件2碎片与碎片之间的曼哈顿距离，如下表所示。

表3 附件2碎片与碎片间的曼哈顿距离从而可得到附件2碎片序号按复原后顺序如下表所示。

附件2碎片复原图片如附录中图8.2所示。

问题一人工干预情况如下表所示。

5.2 问题二（Manhattan 距离）➢ 模型二的建立在中文文件中，两个连续的汉字中间的空白间隔所占像素宽度与其左边或者右边的汉字所占像素宽度的比值最大的约为213，则对于每一行文字，碎纸机纵切未切到文字的概率为213，对于每两行文字碎纸机纵切未切到文字的概率为4169，而对于每三行文字碎纸机纵切未切到文字的概率更小，可以忽略不计，所以对于总共209个碎片，每个碎片上面的文字至少有两行（碎片上不完整的一行也算一行），所以出现某个碎片上面的文字完全没被碎纸机切割到（即文字完整无缺）的概率至多为4169，我们把这样的碎片称之为干扰碎片。

我们知道，整篇文件的最上面一行字的上边缘是空白的，我们可以利用此特殊性对209个碎纸片进行聚类，可以得到一个特殊的类，即碎纸片上边缘为空白的类，此类碎纸片个数大于等于11；出现个数大于11的情形即为混入上面提到的干扰碎片，此概率最大不超过4169，可知此类碎纸片应该拼接在文件最上面一行，应用最小曼哈顿距离对此类碎片按正确顺序拼接。

同理可聚类出另一个特殊的类，即碎纸片左边缘为空白、拼接在文件最左边一列的类，并且也应用最小曼哈顿距离对此类碎片按正确顺序拼接。

然后以此拼接好的第一行和第一列碎片为基准，再应用最小曼哈顿距离拼接其余剩下的碎片，最后拼接复原出原中文文件。

在英文文件中，一个英文单词中两个连续的英文字母中间的空白间隔所占像素宽度与其左边或者右边的英文字母所占像素宽度的比值最大的约为111，则对于每一行英文单词，碎纸机纵切未切到英文单词的概率为111，对于每两行英文单词碎纸机纵切未切到英文单词的概率为1121，而对于每三行英文单词碎纸机纵切未切到英文单词的概率为，然后同上述中文文件的分析过程可知，此时对拼接在文件最左边一列归类时混入上面提到的干扰碎片的概率最大不超过，最后拼接复原出原英文文件。

➢模型二的求解我们利用SPSS软件根据每个碎片顶部空白高度或者文字高度的不同，应用聚类分析方法将碎片聚成11类，结果如下图所示。

图1 根据碎片顶部文字高度聚类图2 根据碎片顶部空白高度聚类结合上面的聚类图，可得出附件3的乱序矩阵，如下表所示。

表6 附件3的乱序矩阵49 22 129 178 118 143 188 192 57 141 91 190 28 186 2 54 11 95 65 61 79 116 78 72 20 69 52 163 177 36 99 96 19 67 63 162 131 6 168 179 1 30 23 142 191 87 147 62 76 86 195 18 26 120 100 41 50 38 167 74 46 103 148 88 35 9 8 24 193 161 105 189 25 130 122 81 71 205 27 200 60 85 15 33 156 170 198 132 17 202 152 83 165 133 80 14 115 159 128 199 12 107 176 82 160 73 31 51 203 169 3 135 39 134 94 58 90 149 77 42 34 112 144 136 124 84 164 97 47 127 121 183 43 125 13 187 173 139 66 150 197 182 16 106 181 145 109 21 110 184 157 204 29 10 104 172 55 48 171 5 98 37 206 59 92 201 64 44 180 111 757 0 93 32 56 175 153 166 196 137 45 208 174 68 158 138 53 70 126 89 151 114 140 102 207 155 101 146 194 119 4 117 40 123 108 154 185 113同样的方法可得出附件4的乱序矩阵，如下表所示。