2013年全国大学生数学建模大赛B优秀论文
2013全国数学建模竞赛B题优秀论文
基于最小二乘法的碎纸片拼接复原数学模型摘要首先对图片进行灰度化处理,然后转化为0-1二值矩阵,利用矩阵行(列)偏差函数,建立了基于最小二乘法的碎纸片拼接数学模型,并利用模型对图片进行拼接复原。
针对问题一,当两个数字矩阵列向量的偏差函数最小时,对应两张图片可以左右拼接。
经计算,得到附件1的拼接结果为:08,14,12,15,03,10,02,16,01,04,05,09,13,18,11,07,17,00,06。
附件2的拼接结果为:03,06,02,07,15,18,11,00,05,01 ,09,13, 10,08,12,14,17,16,04。
针对问题二,首先根据每张纸片内容的不同特性,对图片进行聚类分析,将209张图片分为11类;对于每一类图片,按照问题一的模型与算法,即列偏差函数最小则进行左右拼接,对于没有拼接到组合里的碎纸片进行人工干预,我们得到了11组碎纸片拼接而成的图片;对于拼接好的11张图片,按照问题一的模型与算法,即行偏差函数最小则进行上下拼接,对于没有拼接到组合里的碎纸片进行人工干预。
我们最终经计算,附件3的拼接结果见表9,附件4的拼接结果见表10。
针对问题三,由于图片区分正反两面,在问题二的基础上,增加图片从下到上的裁截距信息,然后进行两次聚类,从而将所有图片进行分类,利用计算机自动拼接与人工干预相结合,对所有图片进行拼接复原。
经计算,附件5的拼接结果见表14和表15该模型的优点是将图片分为具体的几类,大大的减少了工作量,缺点是针对英文文章的误差比较大。
关键字:灰度处理,图像二值化,最小二乘法,聚类分析,碎纸片拼接一、问题重述碎纸片的拼接复原技术在司法鉴定、历史文献修复与研究、军事情报获取以及故障分析等领域都有着广泛的应用。
近年来,随着德国“斯塔西”文件的恢复工程的公布,碎纸文件复原技术的研究引起了人们的广泛关注。
传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。
特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。
2013年全国大学生数学建模竞赛B题全国一等奖论文
碎纸片的拼接复原【摘要】破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
本文主要解决碎纸机切割后的碎纸片拼接复原问题。
针对第一问,附件1、2分别为沿纵向切割后的19张中英文碎纸片,本文在考虑破碎纸片携带信息量较大的基础上,利用MATLAB对附件1、2的碎纸片图像分别读入,以数字矩阵的方式进行存储。
利用数字矩阵中包含图像边缘灰度这一特征,本文采用贪心算法的思想,在首先确定原文件左右边界的基础上,以Manhattan距离来度量两两碎纸片边界差异度,利用计算机搜索依次从左往右搜寻最匹配的碎纸片进行横向配对并达成排序目的。
最终,本文在没有进行人工干预,成功地将附件1、2碎纸片分别拼接复原,得到复原图片见附录2.1、2.2,纵切中文及英文结果表分别如下:为先对本文3、第4行及第9Spearman拼接复原1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。
如果复原过程需要人工干预,请写出干预方式及干预的时间节点。
复原结果以图片形式及表格形式表达。
2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。
如果复原过程需要人工干预,请写出干预方式及干预的时间节点。
复原结果表达要求同上。
3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。
附件5给出的是一页英文印刷文字双面打印文件的碎片数据。
请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。
二、模型假设1. 假设原题附件给出的破碎纸片图像是完好无损的。
2. 假设原题附件给出的破碎纸片仅包含纯文字内容(中英文),不含表格线等。
3. 假设原题附件给出的破碎纸片在切割时无油墨损失。
2013国赛优秀数模论文
车道被占用对城市道路通行能力的影响摘要本文主要研究交通事故占用车道对城市道路通行能力的影响.针对问题一,首先求出道路的基本通行能力,结合道路基本通行能力与定义的交通事故修正系数求得出事故发生后的实际通行能力.用SPSS软件采用Mann-Whitney U检验方法对事故发生前的实际通行能力值与事故发生后的实际通行能力值进行两独立样本检验,结果表明两者存在显著性差异.再作图观察实际通行能力值变化趋势,且对其分三个阶段进行描述,得到事故发生起伏期的实际通行能力变化很大,交通事故发生后实际通行能力在调整期相对稳定;稳定期曲线趋于平缓,实际通行能力基本稳定.针对问题二,由于在同一横断面发生的两次交通事故所占车道不同时,利用SPSS 软件对两起交通事故的实际通行能力值进行两配对样本检验,采用Wilcoxon配对秩检验方法得到:随时间的推移,两次事故发生后的实际通行能力的变化有显著性差异.然后计算两次事故稳定期车流量的比值为37%:63%,而右转与左转的流量比为38%:62%,说明左、右转流量的不同是造成两次交通事故对应的实际通行能力差异的直接原因.针对问题三,首先根据实际通行能力、上游车流量定义出拥堵系数;然后通过讨论拥堵系数与事故路段车辆排队长度之间的关系,确定了事故路段车辆排队长度与实际通行能力、事故持续时间以及上游车流量之间关系的积分模型;最后考虑到从视频中统计出的是离散型数据,因此将上述积分模型进行离散化处理,求出了事故发生后该路段部分时刻的排队长度的具体值,通过与视频中实际的排队长度进行比较,从而检验了模型的准确性.针对问题四,为了求出估算车队排队长度将到达上游路口的时间,建立了两个模型对其进行对比求解.从问题1得出的实际通行能力的数据可以拟合出其与时间的关系函数,进而得出不同时间段的实际通行能力值.模型A中,将上游车流量定为1500pcu/h,通过排队长度模型的求解得到排队长度达到140米时,持续时间为18min.模型B首先检验得到第一次交通事故发生后的上游车流量符合泊松分布.通过对实际情况的MATLAB实验仿真求出满足泊松分布的上游车流量在一小时内的随机分布数组,并将其代入排队长度模型进行求解,得到结果在1240s时,修正后的排队长度达到140米,即认为在事故持续时间20.5min左右时,车辆排队长度到达上游路口.通过对比得到,模型B较模型A更为贴近实际.关键词:两独立样本检验;Mann-Whitney U检验;Wilcoxon配对秩检验;拥堵系数;MATLAB仿真一、问题的重述车道被占用是指因交通事故、路边停车、占道施工等因素,导致车道或道路横断面通行能力在单位时间内降低的现象.由于城市道路具有交通流密度大、连续性强等特点,一条车道被占用,也可能降低路段所有车道的通行能力,即使时间短,也可能引起车辆排队,出现交通阻塞.如处理不当,甚至出现区域性拥堵.车道被占用的情况种类繁多、复杂,正确估算车道被占用对城市道路通行能力的影响程度,将为交通管理部门正确引导车辆行驶、审批占道施工、设计道路渠化方案、设置路边停车位和设置非港湾式公交车站等提供理论依据.视频1(附件1)和视频2(附件2)中的两个交通事故处于同一路段的同一横断面,且完全占用两条车道.请研究以下问题:1.根据视频1(附件1),描述视频中交通事故发生至撤离期间,事故所处横断面实际通行能力的变化过程.2.根据问题1所得结论,结合视频2(附件2),分析说明同一横断面交通事故所占车道不同对该横断面实际通行能力影响的差异.3.构建数学模型,分析视频1(附件1)中交通事故所影响的路段车辆排队长度与事故横断面实际通行能力、事故持续时间、路段上游车流量间的关系.4.假如视频1(附件1)中的交通事故所处横断面距离上游路口变为140米,路段下游方向需求不变,路段上游车流量为1500pcu/h,事故发生时车辆初始排队长度为零,且事故持续不撤离.请估算,从事故发生开始,经过多长时间,车辆排队长度将到达上游路口.二、问题的分析按照题目要求,本文主要研究因交通事故车道被占用对城市道路通行能力的影响.交通事故发生后,由于发生事故的车辆对自己所行驶车道造成堵塞,使得该横断面实际通行能力有很大变化;而对于不同交通事故发生后堵塞不同车道的情况,同一横断面交通事故所占车道不同,该横断面实际通行能力也会有差异;不同状况的交通事故所造成的道路堵塞,对路段车辆排队长度也有很大的影响.2.1问题一的分析问题一要求描述视频中交通事故发生至撤离期间,事故所处横断面实际通行能力的变化过程.通过对附件视频1的观察,交通事故发生后,两辆相撞的车在第一时间对自己所行驶车道(第二、三车道)造成堵塞(附件3中所标注右转车道为车道一,直行车道为车道二,左转车道为车道三),仅剩唯一的第一车道可以通行.这导致事故所处横断面的实际通行能力有很大的变化.根据题目提供的视频附件,提取相关数据.通过对视频中所提供数据进行分析,统计以10秒为组距驶入驶出固定路段的车辆数.根据统计得到的数据,求出事故发生前道路的实际通行能力,并以此作为基准.再拟定事故发生后所处横断面的实际通行能力指标,求出从交通事故发生至事故撤离整个期间内的实际通行能力值.分析比较事故发生前的实际通行能力与事故发生后的实际通行能力的差异,说明发生事故后对道路通行能力的影响.再对事故发生后的各个实际通行能力值作散点图,观察其变化趋势,分阶段描述发生交通事故的整个期间,事故所处横断面实际通行能力的变化.2.2问题二的分析对于问题二中所要求的,分析说明同一横断面交通事故所占车道不同对该横断面实际通行能力影响的差异.根据两段附件视频可知,第一次交通事故的发生造成第二、三车道被堵塞,只有第一车道可以通行;第二次交通事故的发生造成第一、二车道被堵塞,只有第三车道可以通行.根据题目的附件三可知,第一车道为右转车道,通行流量比例为21%,第三车道为左转车道,通行流量比例为35%,即两条车道的通行流量是有差异的,就有可能造成两起交通事故实际通行能力的差异.为比较所占车道不同对实际通行流量的影响,首先按第一问求实际通行能力的思路进行求解,得到各时间段车流量的实际通行能力.然后进一步分析自发生事故起,两起交通事故的实际通行能力随时间推移有无显著性差异.对于产生差异的原因,从各车道流量不同的角度出发,说明车流量对实际通行能力的影响.2.3问题三的分析问题三中要求构建数学模型分析交通事故所影响的路段车辆排队长度与事故横断面实际通行能力、事故持续时间、路段上游车流量间的关系.根据实际情况可知,当道路实际通行能力降低,而车流量较大时,道路车辆的排队现象越容易出现.车辆的排队长度与事故横断面实际通行能力、事故持续时间、路段上游车流量这三个变量均有很大关系.为研究该问题,建立用实际通行能力、上游车流量、事故持续时间表示排队长度的数学模型.事故发生后,道路横断面可供通车辆通行的车道减少,在很大程度上减弱了道路实际通行能力,使得车辆从路段上游驶入已知路段时的速度大于车辆驶出事故横断面的平均速度.当事故路段上游的车驶入该路段时发现路段内原有的车还没有驶离事故横断面,未驶出的车辆积少成多,就会导致该路段的拥堵.为此,定义一个拥堵系数来描述t时刻车辆进入拥堵队列的可能性大小.又由于本题道路的横断面有三条车道,且下游转道车流量的比例分别为21%,44%,35%,因此道路拥堵时,按照车流量比例最大的车道上的队列长度作为车辆排队长度计算,用微分确定单位时间内的车辆排队长度,最后建立积分模型得到排队长度的表达式,进行离散化处理,求出不同时间段的排队长度的具体值.2.4 问题四的分析问题四假设交通事故所处横断面距离上游路口变为140米,已知上游车流量和初始排队长度,要求估算车队排队长度将到达上游路口的时间.从问题1得出的实际通行能力的数据可以拟合出其与时间的关系函数,进而得出不同时间段的实际通行能力值.再分别建模模型A 、B 对此问题进行求解.模型A 中根据题意将上游车流量恒定为1500pcu/h ,再通过得到的实际通行能力值及排队长度进行求解.模型B 考虑到实际中路口上游车流量不可能在一小时内为一定值,分析在上游车流量为1500pcu/h 的情况下,车流量在一小时内连续的时间段内的车流量分布情况,所以先要得出在视频1中在交通事故发生后的上游车流量分布规律,进而求出1500pcu/h 的车流量在一小时的随机分布数组,并对实际情况的实验仿真.最后将各时间段实际通行能力值,上游车流量代入第三问模型的函数表达式中,得到各时间段的排队长度,计算第一次排队长度达到140米的时间.三、模型的假设1.假设题目中的发生的两个交通事故处于同一路段的同一横断面,且发生事故后完全占用两条车道;2.假设只考虑四轮及以上机动车、电瓶车的交通流量,且换算成标准车当量数;3.假设公交车及大巴车的的车长为标准小汽车车身长度的二倍;4.假设本文所研究的道路平坦,不考虑因发生交通事故的车辆造成道路堵塞以外的其它道路障碍.四、符号的说明1T :缺失数据的第一时间段;n T :缺失数据的第n 时间段 (42或 n );1N :驶入等待通行区域的车辆数;2N :驶出等待通行区域的车辆数;3N :标志性车辆前至事故发生地点的车辆数;4N :标志性车辆至等待通行区域的上游边界的车辆数;N : 缺失数据的补全值;11N :事故发生前驶入等待通行区域的车辆数;12N :事故发生前驶出等待通行区域的车辆数;13N :事故发生前等待通行区域内车辆数;11'N :事故发生前上一时间段驶入等待通行区域的车辆数;12'N :事故发生前上一时间段驶出等待通行区域的车辆数;13'N :事故发生前上一时间段等待通行区域内车辆数;21N :事故发生后驶入等待通行区域的车辆数;22N :事故发生后驶出等待通行区域的车辆数;N:事故发生后等待通行区域内车辆数;23'N:事故发生后上一时间段驶入等待通行区域的车辆数;21'N:事故发生后上一时间段驶出等待通行区域的车辆数;22'N:事故发生后上一时间段等待通行区域内车辆数;23U:正常通行时间内所处横断面的实际通行能力;1U:在交通事故影响下所处横断面的实际通行能力;2T:单位时间;hQ:基本通行能力;U:事故后实际通行能力;l:等待通行区域车辆排队长度;W:路段上游车流量;N:单位时间最大车流量;t:事故持续时间;:拥堵系数;v:汽车通过事故横断面的平均速度.五、模型的建立与求解5.1问题一:事故发生至撤离期间断面通行能力的变化问题一要求描述视频中交通事故发生至撤离期间,事故所处横断面实际通行能力的变化过程.针对此问题,具体求解分为以下三个步骤:Step1:根据统计得到的数据,求出事故发生前道路的实际通行能力;Step2:拟定事故发生后所处横断面实际通行能力指标,求出从交通事故发生至发生事故车辆撤离整个期间内的实际通行能力;Step3:分析比较以上两种情况的实际通行能力,并对其进行差异性检验;Step4:对事故发生后的实际通行能力值作图,通过适当的分析,分阶段描述在各不同阶段事故所处横断面实际通行能力的变化过程.5.1.1模型的准备1.通过视频统计数据为进行严谨详细的问题求解,首先从题目所给出的视频附件中统计详细数据.附件1中的视频记录了2013年2月28日16:38:39~17:03:50期间某路段的道路通行情况,视频共26分58秒,包括发生交通事故前的第一段正常通行时间,发生交通事故至撤离现场期间在事故影响下的实际通行时间,以及撤离后的第二段正常通行时间.第一段正常通行时间从16:38:39开始,大约持续了四分钟;发生交通事故至撤离现场时间为16:42:32~17:01:21,大约持续了19分钟.通过观察视频1中道路上车辆行驶的情况,将事故发生地点至其上游120米处划为等待通行区域的规定路段,由于统计每秒进出等待通行区域车辆数的过程时间太短,不利于统计数据,因此划定以10秒为统计时间间距,选定进出等待通行区域的参考系,根据城市道路工程设计规范内的车辆换算表,可知小汽车为1辆标准车辆,大客车换算为2辆标准车]1[.以此分别统计出每10秒驶入规定路段的车辆数及同时间段内驶出该规定路段的车辆数.2.缺失数据处理(1)由于视频1中事故发生后16:49:40~16:50:10与16:54:00~16:54:10两个时间段的影像被剪去,造成数据缺失.本文通过以标志性车辆为参考系,统计缺失数据的时间段中两个时间点1T 与n T 画面中出现的车辆数3N 与4N ,3N 为标志性车辆前至事故发生地点的车辆数,4N 为标志性车辆至等待通行区域的上游边界的车辆数. 其中1T 至n T 共经过了n 个时间间距.为补全数据,本文通过对统计的两时间点内的车辆数进行做差求平均值,得出缺失的数据均为均值N :n N N 34N -=. 补全数据结果如下:表1 补全数据表5.1.2模型的建立与求解道路通行能力是指道路上某一点某一车道或某一横断面处,单位时间内可能通过的最大交通实体(车辆或行人)数,用辆/h 或用辆/昼夜或辆/秒表示,车辆多指小汽车,当有其它车辆混入时,均采用等效通行能力的标准车辆(小汽车)为单位(pcu ). 影响道路通行能力的主要因素是道路条件、交通条件和交通外环境等.基本通行能力是指在理想的道路、交通、控制和环境条件下,理论上所能通行的最大小时交通量.实际通行能力是指在设计或评价某一具体路段时,根据该设施具体的公路几何构造、交通条件以及交通管理水平,按实际公路条件、交通条件等进行相应对基本通行能力进行修正后的小时交通量]1[.实际通行能力的计算是假定没有偶然事件发生的情况下进行的.实际交通系统中,路段可以服务的最大交通量除了受车道宽度、侧向净空等确定性因素以外,还受许多随机性因素影响,如交通事故,自然灾害、恶劣天气、道路维护等]2[.由于本文研究的对象是同一条道路,并且车道的宽度均为3.25m ,以及其他确定性因素均相同.由于研究的时间相差不大(26分钟),所以自然灾害、恶劣天气、道路维护等随机性因素均相同.因此,此路段的实际通行能力只受交通事故的影响.模型的具体建立求解过程如下:1.实际通行能力的确定实际通行能力是由道路的基本通行能力乘上若干个对其造成影响的修正系数而得到的,由于此路段的实际通行能力只受交通事故的影响,故设定交通事故修正系数来对发生交通事故后道路基本通行能力进行修正,修正后的基本通行能力即为发生交通事故后道路的实际通行能力.(1)确定交通事故修正系数f通过对视频1中事故发生至撤离的数据采集,得到了每10秒驶入等待通行区域的车辆数1N 以及驶出的车辆数2N 的数据,进而分别统计出进入等待通行区域的车流量与驶出等待通行区域的车流量.由统计结果可发现,当道路拥堵严重时,从上游路口进入该路段的车辆数会在很大程度上减少(初步分析出现这种状况的原因是由于红绿灯以及车主主观对道路的判断放弃从该路段上通行),而进出路段的车流量之比却很大,与实际通行能力相悖,因此无法直接用进出路段的车流量之比来表示事故发生后道路的实际通行能力.为此,结合道路实际情况以及上述统计结果,本文以每10秒内驶出等待通行区域的车辆数比上相同时间段等待通行区域内的车辆数来反映事故发生后的实际通行能力.处于等待通行区域的车辆越多,则实际通行能力越小,联系视频中出现的情形,当道路拥堵严重时,进入该路段的车辆数会减少,反映事故发生后的实际通行能力并不受进入车辆数的影响,而取决与等待的车辆数,因此此指标克服了上述矛盾的情况.交通事故前的第一段正常通行时间内的交通事故修正系数用1f 表示,驶入等待通行区域的车辆数为11N ,驶出此区域的车辆数为12N ,在区域内停留的车辆数为13N ,上一时间段的相应指标量分别表示为11'N ,12'N ,13'N ,定义1f 为:1312111213111'''N N N N N N f -+==; 设发生交通事故至撤离现场期间在事故影响下所处横断面的实际通行能力用2f 表示,驶入等待通行区域的车辆数为21N ,驶出的车辆数为22N ,在区域内停留的车辆数为23N ,上一时间段的相应指标量分别表示为21'N ,22'N ,23'N ,定义2f 为:2322212123212'''N N N N N N f -+==; 由于事故发生后某一时间段仍可能出现等待通行区域内的车辆数为0,即023=N .又因为22N 可能为0时,其交通事故修正系数求得为0,但事实上此处有两种可能:一是因为堵塞严重无车通过,交通事故修正系数为0;二是因为等待通行区域内无车通过,交通事故修正系数为1(表示正常通过),故产生歧义,所以采用加“1”的方法进行处理.采用加“1”法对实际通行能力影响较小,即23N 、22N 均加1后,再求两者之间的比仍可作为交通事故修正系数.因此本文采取加“1”法进行修正其交通事故系数,既消除歧义,又反映了实际通行能力.经过加“1”法修正后:事故发生前修正系数:1'''111'1312111213111+-++=++=N N N N N N f ; 事故发生后修正系数: 1'''111'2322212123212+-++=++=N N N N N N f . (2)确定基本通行能力Q由附件3图中可知,道路同一方向横断面上的三条车道,每条车道的宽度为固定的3.25m,根据查阅相关资料,宽度为3.25m 的车道最大通行速度为60km/h,当道路通行速度为60km/h 时,查表可知该段道路的一般基本通行能力为1800pcu/h ]3[.由于基本通行能力是指在理想状态下,理论上所能通行的最大小时交通量,为进一步确定已知道路基本通行能力,根据基本通行能力定义,道路基本通行能力为道路理想状态下单位时间h T 内,可能通过的最大车辆数N ,得到计算已知道路基本通行能力的公式:)/(h pcu T N Q h=; 设事故发生前没有任何堵塞的情况下道路为理想状态,且在此时间段内(不考虑堵车),通过该路段的车辆中,根据发生交通事故前道路上行驶的车流量统计数据,每10秒通过规定的120m 路程的车辆最大值为5辆,代入公式计算得:)(180********h / pcu ss pcu T N Q h===; (3)求解发生事故后实际通行能力U 根据相关资料]2[由基本通行能力与修正系数计算实际通行能力的关系公式为:f Q U ⨯=.2.事故发生前后实际通行能力的差异分析比较以上两组统计值,即未发生交通事故时的实际通行能力值和发生交通事故期间的道路实际通行能力值.由于视频所给出的两个时期时间长短不一致,故统计出的数值个数不同,并且我们对其总体分布不甚了解,两独立样本的非参数检验是在对总体的分布不了解的情况下,通过对独立样本的Mann-Whitney U 检验分析来推断样本来自的两个总体的分布等是否存在显著性差异的方法]4[.因此本文通过SPSS 采用两独立样本检验法来对这两组数据样本进行差异性检验(具体操作步骤及详细结果见附录1):表2 发生交通事故前后实际通行能力独立样本检验结果表检验统计量a实际通行能力Mann-Whitney U 344.500Wilcoxon W 7484.500Z -5.170渐近显著性(双侧) .000a. 分组变量: 是否发生车祸由上表知,采用Mann-Whitney U 检验,渐近显著性(双侧)值为0.000,小于0.01,因此拒绝原假设,认为发生车祸的前后的实际通行能力指标存在极显著差异.得出结论:由于突发的交通事故,对原来正常的道路通行能力有显著性影响,对比道路正常通行能力和事故期间的实际通行能力,可知交通事故的发生使得道路通行能力明显下降.3. 结果分析对事故发生后的实际通行能力值作图,并分阶段描述在各不同阶段事故所处横断面实际通行能力的变化过程.根据统计出的交通事故发生至事故撤离整个期间内的实际通行能力值,做出散点图如下:图1 第一起交通事故发生后实际通行能力变化图由图像观察可得,事故发生初期0~200秒的实际通行能力变化很大,定为交通事故发生后实际通行能力的起伏期;200~400秒相对稳定可设为交通事故发生后实际通行能力的调整期;400秒以后曲线趋于平缓,事故发生后的实际通行能力趋于稳定.对于事故发生初期实际通行能力起伏较大的原因,根据视频的显示,初步分析其原因为红绿灯的变化及上下班高峰期的影响,而对于后期实际通行能力趋于稳定的原因,是由于出现了交通堵塞,开始进行排队通过,且随着排队的车辆数目量增多,红绿灯对平稳期的通行影响逐渐较小.4.红绿灯的影响通过上诉的结果分析,可知红绿灯对实际通行能力有一定的影响,本文将以红绿灯的相位时间为统计时间间距对视频1中进出等待通行区域的车辆数进行统计.选定进出等待通行区域的参考系,以此分别统计出每30秒进入规定路段的车辆数及同时间段内驶出该规定路段的车辆数.将进入规定的等待通行区域对应的时间化为1,2,3, (26)做出实际通行能力与对应时间的关系图,如下:图2 实际通行能力与红绿灯对应时间的关系图通过对实际通行能力与对应时间的关系图的观察,可知在1~16的时间内,实际通行能力呈起伏状,红绿灯的相位周期为1分钟,整个阶段内红灯为峰值,绿灯为谷值.而在17~26的时间内,开始进行排队,实际通行能力趋于稳定,因此红绿灯对事故发生后前期有较显著变化,而对事故发生后末期并不影响.5.2问题二:交通事故所占车道不同对通行能力的影响问题二要求分析说明同一横断面交通事故所占车道不同对该横断面实际通行能力影响的差异.针对此问题,具体求解为以下三个步骤:Step1:拟定发生事故后事故所处横断面实际通行能力,求出从交通事故发生至事故撤离整个期间内的实际通行能力;Step2:对两次交通事故发生后,随时间的推移,对相同时段的道路实际通行能力值用SPSS软件两配对样本检验进行显著性差异分析;Step3:画图比较分析,说明两次交通事故发生所占车道不同对该横断面实际通行能力影响的差异.5.2.1模型的准备为对问题进行严谨详细的求解,首先从题目所给出的视频附件中统计详细数据.针对问题中所提出的对比两起事故在发生之后对道路实际通行能力的影响,我们仅对发生交通事故至撤离现场这一阶段进行数据统计.发生交通事故至撤离现场阶段的时间为。
2013全国大学生数学建模竞赛B题获奖论文(国二)
(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容 请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2013 年 9 月 16 日
赛区评阅编号(由赛区组委会评阅前进行编号):
2013 高教社杯全国大学生数学建模竞赛
编 号 专 用 页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
关于碎纸片拼接问题的探讨
摘要
碎纸片的拼接在许多领域有重要应用, 由于传统的人工拼接方式效率低且精确度不 高,所以人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。本文通过建立数 学模型针对不同拼接情况提出具体解决方案。 对于问题一,由于贪婪算法有局部最优带来整体最优的特点,所以本文建立基于贪 婪算法的纵切碎纸片拼接优化模型Ⅰ。首先,将图像信息用像素矩阵 A 表示,将图片的 拼接问题转化为图片边缘像素列的匹配问题。其次,由于拼接方案与图片的排列位置有 关, 所以选取 0-1 变量 xij 为决策变量; 选取拼接缝上各点像素之差的和最小为目标函数; 由于英文字母等图像信息在拼接缝处不对称, 故在目标一的基础上选取拼接缝上各点与 相邻上下两点的像素之差的和最小为目标函数二; 以图片边缘必须含有字迹信息为约束 条件,以此建立纵切优化模型Ⅰ。然后,基于贪婪算法的准则选取边缘信息量最大的图 片为基准对其左右进行拼接,再以新拼接的图片为基准重复上述操作。最后,可得中英 文拼接完整图且无需人工干预; 若图片边缘信息均为空白则要等到其他图片拼接完成后 再在剩下的空缺处填补此类图片。结果表明,可以完成对碎纸片的准确拼接。 对于问题二,选取文字特征如下:汉字的字高以及字宽是确定的,在拼接时通过记 录边缘像素列宽度以判断拼接后是否满足字高字宽的约束,而英文字母的高度不一致, 但通过像素列可知同行字母的中心点位于同一直线上, 故可利用拼接后字母中心点是否 共线判断能否拼接。在求解过程中采用降维的思想,建立基于 3 个子模型的纵横切拼接 优化模型Ⅱ。第一步,对图片按横切行分类,选取纸片第 1 行中首次出现字迹的上下端 位置 xi1、xi2 为决策变量;选取不同纸片间(xi1-xj1)与(xi2-xj2)的和最小为目标函数;以拼接 后字高 s 为约束条件,建立子模型 a。第二步,对每行中纸片进行行内拼接,继承模型 Ⅰ中的思想,新增字宽、字间距及行间距等条件的约束,建立子模型 b。第三步,拼接 m 行纸片构成完整图像,同样利用模型Ⅰ中思想,新增字高、页边距等限制,建立子模 型 c。对于拼接过程中出现的边缘无字迹信息以及不符合文字特征的情况,对其进行人 工拼接。在验证过程中,由于英文字母高度不一致但字母中心点位置固定,故通过设定 字母中心点位置的阈值来判断图片隶属的行数。经验证,中文拼接共需要 14 次人工干 预,英文拼接需要 24 次人工干预。 对于问题三,要拼接双面纵横切的 m×n 的碎纸片,二维拼接问题升级为三维,同 样采用降维的思想,建立基于 3 个子模型的纵横切双面拼接优化模型Ⅲ。第一步,将同 张图片的正反面组合成一幅图像,由于打印的字号以及行间距是确定的,所以一张图片 正反面首行文字中心点距离页面顶端的距离之差随之固定,且能够反映图片的特征, 故 选取图片正反面首行的字中心点距离页面顶端的距离 xi1 和 xi2 为决策变量;选取同一横 切行中各图片 xi1 − xi 2 的差值之和最小为目标函数; 对于每一行中 xi1 − xi 2 要满足设定的 阈值限制,以此建立子模型(1)。第二步,将处于同一横切行中的组合图片重新拆分, 依 据问题二中模型 b 中的方法进行行内拼接。第三步,依据问题二中的模型 c 中的方法进 行行间拼接。最后,利用所给图片进行验证可得完整图像。其中, 124b 和 015a 两张图 片拼接处出现异常。 最后,本文对所建模型进行了客观的评价,并结合实际对模型的推广加以分析。
全国大学生数学建模竞赛b题全国优秀论文
基于打车软件的出租车供求匹配度模型研究与分析摘要目前城市“出行难”、“打车难”的社会难题导致越来越多的线上打车软件出现在市场上。
“打车难”已成为社会热点。
以此为背景,本文将要解决分析的三个问题应运而生。
本文运用主成分分析、定性分析等分析方法以及部分经济学理论成功解决了这三个问题,得到了不同时空下衡量出租车资源供求匹配程度的指标与模型以及一个合适的补贴方案政策,并对现有的各公司出租车补贴政策进行了分析。
针对问题一,根据各大城市的宏观出租车数据,绘制柱形图进行重点数据的对比分析,首先确定适合进行分析研究的城市。
之后,根据该市不同地区、时间段的不同特点选择多个数据样本区,以数据样本区作为研究对象,进行多种数据(包括出租车分布、出租车需求量等)的采集整理。
接着,通过主成分分析法确定模型的目标函数、约束条件等。
最后运用spss软件工具对数据进行计算,求出匹配程度函数F与指标的关系式,并对结果进行分析。
针对问题二,在各公司出租车补贴政策部分已知的情况下,综合考虑出租车司机以及顾客两个方面的利益,分别就理想情况与实际情况进行全方位的分析。
在问题一的模型与数据结果基础上,首先分别从给司机和乘客补贴两个角度定性分析了补贴的效果。
重点就给司机进行补贴的方式进行讨论,定量分析了目前补贴方案的效果,得出了如果统一给每次成功的打车给予相同的补贴无法改善打车难易程度的结论,并对第三问模型的设计提供了启示,即需要对具有不同打车难易程度和需求量的区域采取分级的补贴政策。
针对问题三,在问题二的基础上我们设计了一种根据不同区域打车难易程度和需求量来确定补贴等级的方法。
设计了相应的量化指标,以极大化各区域打车难易程度降低的幅度之和作为目标,建立该问题的规划模型。
目的是通过优化求解该模型,使得通过求得的优化补贴方案,能够优化调度出租车资源,使得打车难区域得到缓解。
通过设计启发式原则和计算机模拟的方法进行求解,并以具体案例分析得到,本文方法相对统一的补贴方案而言的确可以一定程度缓解打车难的程度。
2013年数学建模B题
碎纸片的拼接复原摘要本文主要研究了规则碎纸片的拼接复原问题。
首先利用二值法、Freeman链码和环形像素点匹配等算法建立基于像素点数值匹配模型,然后利用MATLAB 软件对碎纸片像素点进行数字化处理,得到各碎纸片的像素点数值矩阵,再利用MATLAB软件编程进行矩阵特征优化匹配得到复原图。
(图5、图6、图7、图8 、图9、图10)对于问题一,要解决纵向切割二维规则碎片拼接,利用MATLAB软件对碎纸片进行像素点数字化处理,根据像素点数值利用二值法和Freeman链码算法找到相邻的碎纸片,编程求解得到碎纸片的拼接复原图,对于顺序错乱的碎片进行人工干预,结合MATLAB软件求解,最后得到碎纸片的拼接复原图。
(见附录1)对于问题二,要解决横纵切割碎片的拼接,使用环形像素点匹配算法对碎纸片进行跟踪匹配,在SSDA算法的基础上确定最左侧为初始模板。
根据碎片对应的行像素特征的粗细搜索匹配,选出最佳匹配区域作为目标的当前位置,然后对模板进行逐一更新,得出每一行后再按行拼接得出复原图。
(见附录2)对于问题三,要解决横纵切割碎片的正反面拼接,根据环形像素点匹配算法和像素行算法思想进一步扩展,对碎片进行匹配得到11条行碎片,根据问题一的算法思想,进行行之间的匹配拼接,得到初始复原图后,人工微调程序输出顺序和正反面互换语句,运行程序输出完整单面图。
正反顺序对照后确定为最优复原图。
(见附录3)关键字:Freeman链码环形像素点匹配二值法一、问题的背景及重述1.1问题的背景在考古研究、公安调查取证、自动装配、虚拟现实、测量建模等领域中,经常需要把大量的碎片物体拼接成一个或几个完整物体,如考古出土的一些破损的珍贵文物需要重现历史文物的形貌;公安机关调查取证中有可能发现被撕毁的报纸、照片、文件,对这些碎片物体加以复原有利于案件的侦破。
在很多情况下,由于事先对碎片的数目和形状都无法估计,如果通过手工进行拼接,不仅费时费力,而且也不能保证能得到较好效果的复原物体。
(完整word版)2013年数学建模b题
精心整理碎纸片的拼接复原【摘要】:碎纸片拼接技术是数字图像处理领域的一个重要研究方向,把计算机视觉和程序识别应用于碎纸片的复原,在考古、司法、古生物学等方面具有广泛的应用,具有重要的现实意义。
本文主要结合各种实际应用背景,针对碎纸机绞碎的碎纸片,基于计算机辅助对碎纸片进行自动拼接复原研究。
针对问题1,依据图像预处理理论,通过matlab程序处理图像,将图像转化成适合于计算机处理的数字图像,进行灰度分析,提取灰度矩阵。
对于仅纵切的碎纸片,根据矩阵的行提取理论,将。
建中的任一列与矩阵值,序列号。
将程序进行循环操作,得到最终的碎片自动拼接结果。
、;分别作为新生成的矩阵、。
,将矩阵中的任一列分别与矩阵中每一列代入模型,所得p值对应的值即为横排序;将矩阵中的任一行分别于矩阵中的任一行代入模型,所得q值对应的值即为列排序。
循环进行此程序,得计算机的最终运行结果。
所得结果有少许误差,需人工调制,更正排列顺序,得最终拼接结果。
针对问题3,基于碎纸片的文字行列特征,采用遗传算法,将所有的可能性拼接进行比较,进行择优性选择。
反面的排序结果用于对正面排序的检验,发现结果有误差,此时,进行人工干预,调换碎纸片的排序。
【关键词】:灰度矩阵欧式距离图像匹配自动拼接人工干预一、问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
传统上,大量的纸质物证复原工作都是以人工的方式完成的,准确率较高,但效率很低。
特别是当碎片数量巨大,人工拼接不但耗费大量的人力、物力,而且还可能对物证造成一定的损坏。
随着计算机技术的发展,人们试图把计算机视觉和模式识别应用于碎纸片复原,开展对碎纸片自动拼接技术的研究,以提高拼接复原效率。
试讨论一下问题,并根据题目要求建立相应的模型和算法:、附件4(1)(2)(3)(4)纸片的自动拼接。
问题1:根据图像预处理理论,通过程序语言将图像导入matlab程序,对图像进行预处理,将碎纸片转换成适合于计算机处理的数字图像形式,并对数字图像进行灰度分析,提取灰度矩阵。
数学建模美赛B题论文
2013建模美赛B题思路数学建模美赛B题论文摘要水资源是极为重要生活资料,同时与政治经济文化的发展密切相关,北京市是世界上水资源严重缺乏的大都市之一。
本文以北京为例,针对影响水资源短缺的因素,通过查找权威数据建立数学模型揭示相关因素与水资源短缺的关系,评价水资源短缺风险并运用模型对水资源短缺问题进行有效调控。
首先,分析水资源量的组成得出影响因素。
主要从水资源总量(供水量)和总用水量(需水量)两方面进行讨论。
影响水资源总量的因素从地表水量,地下水量和污水处理量入手。
影响总用水量的因素从农业用水,工业用水,第三产业及生活用水量入手进行具体分析。
其次,利用查得得北京市2001-2008年水量数据,采用多元线性回归,建立水资源总量与地表水量,地下水量和污水处理量的线性回归方程yˆ=-4.732+2.138x1+0.498x2+0.274x3根据各个因数前的系数的大小,得到风险因子的显著性为rx1>rx2>rx3(x1, x2,x3分别为地表水、地下水、污水处理量)。
再次,利用灰色关联确定农业用水、工业用水、第三产业及生活用水量与总用水量的关联程度ra =0.369852,rb= 0.369167,rc=0.260981。
从而确定其风险显著性为r a>r b>r c。
再再次,由数据利用曲线拟合得到农业、工业及第三产业及生活用水量与年份之间的函数关系,a=0.0019(t-1994)3-0.0383(t-1994)2-0.4332(t-1994)+20.2598;b=0.014(t-1994)2-0.8261t+14.1337;c=0.0383(t-1994)2-0.097(t-1994)+11.2116;D=a+b+c;预测出2009-2012年用水总量。
最后,通过定义缺水程度S=(D-y)/D=1-y/D,计算出1994-2008的缺水程度,绘制出柱状图,划分风险等级。
我们取多年数据进行比较,推测未来四年地表水量和地下水量维持在前八年的平均水平,污水处理量为近三年的平均水平,得出2009-2012年的预测值,并利用回归方程yˆ=-4.732+2.138x1+0.4982x2+0.274x3计算出对应的水资源总量。
【VIP专享】2013年数模论文
承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):车道被占用对城市道路通行能力的影响摘要一、问题重述车道被占用是指因交通事故、路边停车、占道施工等因素,导致车道或道路横断面通行能力在单位时间内降低的现象。
由于城市道路具有交通流密度大、连续性强等特点,一条车道被占用,也可能降低路段所有车道的通行能力,即使时间短,也可能引起车辆排队,出现交通阻塞。
2013全国大学生数学建模竞赛B题
将008代表的矩阵C8的第二列元素与其它矩 阵的第一列元素进行两两匹配。记录元素相 同的个数,个数除以1980为C8矩阵第二列对 其它矩阵第一列的边缘匹配度,记为:
比较这18个数据,最大的即为与008匹配的 碎纸片。然后以所找到的碎纸片的第二列开 始,求出它与其它矩阵第一列的边缘匹配度, 找出最大的,以此类推把19张碎纸片拼接完 成。
三.问题2的分析
英文碎纸片的分析 通过观察可以发现英文字母的主要的 部分拥有同一上界和同一下界,例如:
将图片中每一行中黑色像素数少于13的及 字母的次要部分转变为二值化矩阵中的0, 将每一行中黑色像素大于等于13的及字母 的主要部分转化为二值化矩阵中的1,这样 得到的新的二值化矩阵 。例如图像转变为 如下图的方式:
二.问题1的分析
步骤一:使用matlab中的imread函数 可以做出图片的灰度矩阵 ,读取每 张图片文件的数据,其目的是将附件 中给的 bmp 格式的碎纸片图以灰度 值矩阵的形式存储。再将灰度值矩阵 转化为 0-1 矩阵,来得到模型的数 据基础;
由于该像素图片转换后为
的矩阵,ቤተ መጻሕፍቲ ባይዱ
论文中无法放置,所以仅简单举例说明:
以纸片000与001为例,匹配方式可能为:
将①②的边缘匹配度相加得到边缘匹配度 之和,将③④的边缘匹配度相加得边缘匹 配度之和,两者的和做出比较。若仅有一 个大于等于1.9,则计算机输出该匹配度, 人工判断是否碎纸片是否匹配;若两者均 大于等于1.9,计算机把两个匹配度之和输 出,人工选择判断碎纸片应是否匹配与如 何匹配;若两者均小于1.9,则计算输出最 大者,人工判断碎纸片是否匹配。这样可 以得到一些在同一横行的碎纸片的拼接。
总体思路
三步走:分行,行内排序,行间排序
2013年深圳杯数学建模B题参考论文
2013年深圳杯数学建模B题参考论文2013年山西赛区数学建模联赛承诺书我们仔细阅读了山西赛区数学建模联赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写):B我们的参赛报名号为:参赛队员(打印并签名) :目录一、摘要 (3)二、关键词 (3)三、问题重述与分析 (3)四、模型假设 (3)五、符号说明 (9)六、模型的建立与求解 (9)七、模型的检验 (10)八、模型的优缺点分析 (10)九、求解 (10)十、合理化建议 (12)参考文献 (13)深圳关内外交通拥堵探究与治理一、摘要交通拥堵是目前中国各大城市面临的共同难题,但拥堵的成因各不相同,因而需要在摸清规律的基础上有针对性地提出解决方案。
就深圳而言,交通堵塞对人们出行造成了较大的影响,造成深圳城市交通拥堵主要原因:1、城市功能区构建。
2、城市公交发展相对迟缓,市民出行系统结构不合理。
随着深圳城市的不断扩大,市民出行距离的加大,公交车辆还远不能满足市民上下班或者出行的需要,城市公交发展却相对迟缓,市民出行系统结构不合理,导致了交通环境的进一步恶化。
3、城市道路交通规划滞后。
例如老城区路幅不宽,支路多、小街小巷多而且与主干道衔接相通,车辆交汇频繁致使交通不畅,成为“瓶颈”路口。
4、城市道路资源时常被侵占。
5、部分路段红绿灯过多。
6、市内停车供求矛盾突出。
7、市民交规意识薄弱。
公共空间中以各种方式进行的空间移动(即交通)的需求,它具有需求时间和空间的不均匀性、需求目的的差异性等特征。
2013年全国数学建模B题一等奖论文
(由由由由由由)第十届华为杯全国研究生数学建模竞参学校南京师范大学参参队号103190031.佟德宇队员姓名2.顾燕3.贾泽慧(由由由由由由)第十届华为杯全国研究生数学建模竞参题 目 功率放大器非线性特性及预失真建模摘 要针对问题一中求解输入输出信号之间的非线性功放特性函数问题, 采用了不同的多项式函数, 运用最小二乘法或正则化后的最小二乘法进行拟合求解. 并用参数NMSE 来评价所建模型的准确度. 结果发现在逼近函数选为函数基的情况下, 采用正则化后的最小二乘法得出的模型准确度最好, 其对应的参数NMSE=-68.6294.同时考虑计算量和模型准确度, 在由多项式变形函数逼近功放的模型基础上, 来进行预失真模型的建立. 根据题中给出的原则和约束, 可知预失真模型的表达式与功放模型的表达式是类似的, 从而可建立相应的预失真模型.:-11()()()K k k k z t h x t x t ==∑K=4时, 整体模型的放大倍数g=1.8693, 参数NMSE=-32.5819, EVM=2.3491; K=5时, g=1.8473, 参数NMSE=-37.1398, EVM=1.3900; K=7时, g=1.8326, 参数NMSE=-46.0624, EVM=0.4976.针对问题二, 直接将功放的输入输出与题目中所提的“和记忆多项式”模型进行拟合, 运用正则化后的最小二乘法进行求解, 这很好的保证了模型的可解性. 本题只考虑功放模型次数为5的情形. 当记忆深度为7时, 得NMSE=-45.8394; 当记忆深度为3时, 得NMSE=-44.5315. 预失真模型的建立与问题一类似, 文中以框图的方式建立了预失真处理的模型实现示意图, 并对次数为5、记忆深度为3的情形, 求解出整体模型的放大倍数g=9.4908, 参数NMSE=-37.8368, EVM=0.0128.针对问题三, 将所给的离散的、有限的输入输出数据作为随机过程的样本函数,通过其傅立叶变换得到功率谱参度函数. 文中分别给出了输入信号、无预失真补偿的功率放大器输出信号、采用预失真补偿的功率放大器输出信号的功率谱参度图形. 可解出它们的ACPR 分别为-155.6610、-74.3340、-104.4904, 最后对结果进行分析评价, 得出采用预失真补偿的功率放大器的输出信号效果比无预失真补偿的效果好. 关键字:最小二乘法、Tikhonov正则化、Fourier变换一、问题重述信号的功率放大是电子通信系统的关键功能之一, 其实现模块称为功率放大器( PA, Power Amplifier), 简称功放. 功放的输出信号相对于输入信号可能产生非线性变形, 这将带来无益的干扰信号, 影响信信息的正确传递和接收, 此现象称为非线性失真.功放非线性属于有源电子器件的固有特性, 研究其机理并采取措施改善, 具有重要意义. 目前已经提出了各种技术来克服功放的非线性失真, 其中预失真技术是被研究的较多的一项技术, 其最新的研究成果已经被运用于实际的产品中, 但在新算法、实现复杂度、计算速度、效果精度等方面仍有相当的研究价值.预失真的基本原理是:在功放前设置一个预失真处理模块, 这两个模块的合成总效果使整体输入-输出特性线性化, 输出功率得到充分利用.文中给出了NMSE 、EVM 等参数评价所建模型其准确度, 以及ACPR 表示信道的带外失真的参数.根据数据文件中给出的某功放无记忆效应、有记忆效应的复输入输出测试数据:(1)我们建立此功放的非线性数学模型()G ⋅, 并用NMSE 来评价所建模型的准确度.(2)根据线性化原则以及“输出幅度限制”和“功率最大化”约束, 计算线性化后最大可能的幅度放大倍数, 建立预失真模型. 并运用评价指标参数NMSE/EVM 评价预失真补偿的计算结果.(3)应用问题二中所给的数据, 计算功放预失真补偿前后的功率谱参度(输入信号、无预失真补偿的功率放大器输出信号、采用预失真补偿的功率放大器输出信号), 并用图形的方式表示了这三类信号的功率谱参度. 最后用相邻信道功率比ACPR 对结果进行分析.二、模型假设1、假设题中所给的功放输入输出数据采样误差为0.2、假设题中所给的功放输入输出数据具有代表性、一般性.3、假设存在这样的预失真处理器, 能够做到将输入数据变为模型求解所得的预失真 处理输出结果.三、基本知识§3.1 最小二乘方法最小二乘方法[][]12产生于数据拟合问题, 它是一种基于观测数据与模型数据之间的差的平方和最小来估计数学模型中参数的方法. 输入数据t 与输出数据y 之间大致服从如下函数关系(,)y x t φ=,式中n x R ∈为待定参数. 为估计参数x 的值, 要先经过多次试验取得观测数据1122(,),(,),,(,)m m t y t y t y , 然后基于模型输出值和实际观测值的误差平方和21((,))m i ii y x t φ=−∑最小来求参数x 的值, 这就是最小二乘问题. 一般地, m n .引入函数()(,), 1,2,,i i i r x y x t i m φ=−= ,并记12()((), (), , ())m r x r x r x r x = ,则最小二乘问题即为n min ()()T x Rr x r x ∈. 如果最小二乘问题中的模型函数估计准确, 那么最小二乘问题的最优值是很靠近零的. 因此()r x 常称作残量函数.对于线性最小二乘问题, 残量函数可以表示为()r x b Ax =−,从而线性最小二乘问题可以表示为2min n x R b Ax ∈−. (3.1.1) 若A 是列满秩的, 且考虑到二次凸函数的稳定点即为最小值点, 可以直接得到x 的求解公式, 即()1T T x A A A b −=. (3.1.2) 而对于复数域上的线性最小二乘问题n 2min x C b Ax ∈−, 也可以直接得到x 的求解公式, 即为()-1T x A A A b =, (3.1.3) 其中, T A 表示A 的共轭转置.§3.2 Tikhonov 正则化在使用最小二乘方法进行参数估计的时候, 由于A 不一定是列满秩的, 故T A A 不一定是可逆的, 此时就不能够用上面所推得的公式进行直接的求解了. 为了克服这个困难,考虑Tikhonov 正则化[]3方法, 即给目标函数加上一个正则项(即一个邻近项)2k k x x λ−.此时, 最小二乘问题转化为n 221min +k k k x C x b Ax x x λ+∈=−−.其中k x 是第k 步迭代得到的解, k λ可以选为一个常数或一个单调下降趋于0的数列. 迭代的终止准则为1k k x x ε+−≤,其中ε是一个给定的误差上界.考虑到二次凸函数的稳定点即为最小值点, 这时问题22min n k k x C b Ax x x λ∈−+− 是可以直接求解的, 给出x 的求解公式为()()1T k k k x A A I A b x λλ−=++.显然, 此时即使A 非列满秩, 问题也是可以求解的.四、问题分析问题一题中已给出了某功放无记忆效应的复输入输出测试数据, 现需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G⋅. 根据函数逼近理论, 功放的特性函数可以用多项式来表示, 也可以用空间中的一由正交函数基来表示. 然后采用最小二乘法或正则化后的最小二乘法, 将这些情况都进行求解, 得出功放的特性函数()G⋅. 并在最后用参数NMSE(归一化均方误差)来评价所建模型的准确度.接着, 在前面所建模型的基础上, 选择一个计算量适当, 且准确度较好的()G⋅的一个拟合模型. 然后根据线性化原则以及“输出幅度限制”和“功率最大化”约束, 建立预失真模型, 使得整体模型线性化后放大倍数尽可能的大. 通过对优化模型的分析可知, 对预失真特性函数()F⋅的求解可以转化为对1Gg−⎛⎞⎜⎟⎝⎠的求解, 且预失真模型的表达式与功放模型的表达式是类似的. 在求解1Gg−⎛⎞⎜⎟⎝⎠时, 可以对求解所用模型的次数进行不同的选取,分别得出整体模型的g和NMSE、EVM的值, 用来评价预失真补偿的结果.问题二题中已给出了某功放有记忆效应的复输入输出测试数据, 现需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G⋅. 根据函数逼近理论, 本文直接将功放的输入输出与题目中所提的“和记忆多项式”模型来进行拟合, 在使用最小二乘方法求解时, 我们对目标函数加了一个正则项, 以保证求解的可实现性.预失真处理器模型的建立与问题一类似, 且给出了以框图的方式建立的预失真处理的模型实现示意图.问题三问题二中所给的输入输出数据是离散的、有限的, 在这种情况下计算功率谱参度的函数可以用自相关函数法或对随机过程{}()x t的样本函数作傅立叶变换得到, 文中采取第二种方法来求解.五、模型建立与求解§5.1 问题一的模型与求解§5.1.1 无记忆功放的特性函数()G⋅模型建立文章中已给出某功放无记忆效应的复输入输出测试数据, 这些数据是对功放输入)(tx/输出)(t z进行离散采样后得到的, 它们的值为分别为()x n/()z n(采样过程符合Nyquist采样定理要求).对于问题一, 根据文章中所给的某功放无记忆效应的复输入输出测试数据, 首先需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G⋅. 根据函数逼近理论,可以采用1、多项式的形式2、多项式的变形的形式3、空间中的一由正交函数基的线性由合来表示4、正则化下, 空间中的一由正交函数基的线性由合来表示下面将这些情况都进行建模, 来拟合功放的特性函数()G ⋅, 并在最后进行比较选择优者.所求得的模型的数值计算结果业界常用NMSE 、EVM 等参数评价其准确度, NMSE 的具体定义如下. 采用归一化均方误差 (Normalized Mean Square Error, NMSE) 来表征计算精度, 其表达式为211021ˆ|()()|NMSE 10log |()|N n N n z n z n z n ==−=∑∑ . (5.1.1) 如果用z 表示实际信号值, ˆz表示通过模型计算的信号值, NMSE 就反映了模型与实际模块的接近程度. 显然NMSE 的值越小, 模型的数值计算结果就越准确.误差矢量幅度 (Error Vector Magnitude, EVM)定义为误差矢量信号平均功率的均方根和参照信号平均功率的均方根的比值, 以百分数形式表示. 如果用X 表示理想的信号输出值, e 表示理想输出与整体模型输出信号的误差, 可用EVM 衡量整体模型对信号的幅度失真程度:EVM 100%= . (5.1.2)模型一 多项式的形式首先根据函数逼近的Weierstrass 定理, 对解析函数采用简单的多项式来表示, 可表示为∑==Kk k k t x h t z 1)()(. (5.1.3)因为此时是要将观测数据与形式已经固定的函数(5.1.3)进行拟合, 而目的是求解该函数的各项系数, 所以该问题其实就是最简单的线性最小二乘问题.模型建立()n 211min ()N K k k h C n k z n h x n ∈==−∑∑, (5.1.4) 其中, ()x n 和()z n 为文章中所给的输入和输出测试数据, 这些数据是对功放输入()x t 、输出()z t 进行离散采样后得到的(采样过程符合Nyquist 采样定理要求),N 为功放输入输出数据的总个数.将问题(5.1.4)与( 3.1.1)进行对应, 由( 3.1.3)可以直接得到系数的表达式为()-1T h A A A z = 其中232323 (1) (1) (1) (1) (2) (2) (2) (2) () () () ()K K K x x x x x x x x A x N x N x N x N ⎡⎤…⎢⎥…⎢⎥=⎢⎥⎢⎥⎢…⎥⎣⎦, ()12,,,TK h h h h =…, ()()()()1,2,,Tz z z z N =….结果当3K =时, (见附录2.1.1)该表达式中的系数为123 2.908532278399690.060653883258900.213775998314930.43417026083854 0.198185637666730.27826757408010h ih i h i=−=−=+.根据模型一以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE 13.4414169873254 3k =−=.当5k =时, (见附录2.1.2 )表达式中的系数为12345 2.908037719327826 - 0.063527494375989i0.343519806629302 - 0.388942747664566i0.541211413428411 - 0.144422960285135i -0.399744749427209 - 0.558463329513045i-0.271952185146638 + 0.1205591h h h h h =====40060622i根据模型一以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE -21.544782705381238 5k ==.模型二 多项式的变形同时我们也考虑了多项式变形[]4的情形来对其进行表示, 其表示式为-11()()()K k k k z t h x t x t ==∑. (5.1.5)因为此时是要将观测数据与形式已经固定的函数(5.1.5)进行拟合, 而目的是求解该函数的各项系数, 所以该问题其实就是最简单的线性最小二乘问题.模型建立()n 2-111min ()()N K k k h C n k z n h x n x n ∈==−∑∑ (5.1.6)其中N 为所给功放输入输出数据的总个数, K 为表达式的次数. 将问题(5.1.6)与(3.1.1)进行对应, 由(3.1.3)可以直接得到系数的表达式为()-1T h A A A z = 其中212121(1) (1)(1) (1)(1) (1)(1)(2) (2)(2) (2)(2) (2)(2) () ()() ()() ()()K K K x x x x x x x x x x x x x x A x N x N x N x N x N x N x N −−−⎡⎤…⎢⎥⎢⎥…=⎢⎥⎢⎥⎢⎥…⎢⎥⎣⎦,()123,,,,TK h h h h h =…, ()()()()()1,2,3,,Tz z z z z N =…. 分别考虑当3k =, 5k =时, 该表达式的具体形式(即确定表达式的系数).结果当3k =时, (见附录2.1.3 )表达式中的系数为123 3.051183005392040.00000000000001 0.006071903393980.00000000000005 1.170159412626470.00000000000004h ih i h i=−=+=−−.根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE 29.7446547565428 3k =−=.当5k =时, (见附录2.1.4 )表达式中的系数为12345 2.967983597251020.00000000000080 0.309931644197600.00000000000873 0.153664636905190.00000000002804 3.424500445954250.00000000003458 2.208212395486470.00000000001446h ih ih i h ih i=−=+=−−=−+=−.根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE 45.379717608769994 5k =−=模型三 空间中的一由正交函数基的线性由合最后根据函数逼近理论, 可采用空间中的一由正交函数基[]4的线性由合来表示该特性函数(参考文献3中的方法), 其表达式为()z t h =Ψ, (5.1.7)其中正交矩阵12[() () ()]k x x x ψψψΨ= ,11()!()(1)(1)!(1)!()!kl l k k l k l x x x l l k l ψ−+=+=−−+−∑. 因为此时是要将观测数据与形式已经固定的函数(5.1.7)进行拟合, 而目的是求解该函数的各项系数, 所以该问题其实就是最简单的线性最小二乘问题.模型建立 n 2min h C z h ∈−Ψ (5.1.8) 其中()123,,,,TK h h h h h =…, ()()()()()1,2,3,,T z z z z z N =…, ()()()12[() ()()]k x n x n x n ψψψΨ= ,()()()11()!()(1)(1)!(1)!()!k l l kk l k l x n x n x n l l k l ψ−+=+=−−+−∑, N 为功放的输入输出数据的总个数. 将问题(5.1.8)与(3.1.1)进行对应, 由(3.1.3)可以直接得到系数的表达式为 ()-1T T h z =ΨΨΨ. 由于计算量较大, 我们选取7=k 来进行拟合, 得出表达式中的系数.结果(见附录2.1.5)当7=k 时, 表达式中的系数为12345 3.287412936081622-7.322701472967097-015-0.091488124421954-2.16460963736731-015-0.066219774105875 5.035305939565804-0160.038056322596937 2.726632938529483-0160.01014165858755-1.2h e ih e ih e ih e i h ===+=+=6758894247527231-016-0.005283612035716-2.653720342429833-016-0.001265433154276-1.923256069376669-016e ih e ih e i==.根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE -60.5675309366592 7k ==模型四 模型三正则化模型建立对于模型三, 由于所给的数据较多, 很难避免本文3.2节中所提到的T ΨΨ奇异的情况, 故对(5.1.8)再进行一个Tikhonov 正则化. 即对(5.1.8)加一个正则项2k k h h λ−.问题转变为()1221min K M k k k h C h z h h h λ⋅×+∈=−Ψ+−. (5.1.9) 其中k h 是第k 步迭代得到的解(计算机运行求解时是要给其赋一个初始值的), 而k λ可以选为一个常数或一个单调下降趋于0的数列. 而迭代的终止准则为1k k h h ε+−≤,其中ε是一个给定的误差上界.考虑到二次凸函数的稳定点即为最小值点, 问题(5.1.9)是可以直接求解的, 得到h 的求解公式为()()()1T Tk k k h I z n h λλ−=ΨΨ+Ψ+. (5.1.10)此处, 我们仍选取7=k 来进行拟合, 其中一些参数选取为800111, 1, 0.8, 10k k h i λλλε−+=+===.则可得出表达式(5.1.7)中的系数.结果(见附录2.1.6)123456 3.2873994140515280.000008426827987-0.0914922453118830.000002568107767-0.066218825186175-0.000000591359660.038056824724197-0.0000003129219510.010141412616440.000000153287355-0h ih ih ih i h ih =+=+===+=7.0052839775157310.000000227764411-0.0012655686759970.000000084456122ih i+=+根据上面所建立的模型以及(5.1.1)式, 可以求出NMSE 的值如下:()NMSE -68.6293523598994 7k ==模型一~模型四的总评价对四种模型下参数NMSE 的大小进行比较发现, 当选用一由正交函数基, 并运用正则化后的最小二乘方法来对功放特性函数进行拟合时(即模型四), NMSE 的值是最小的. 也就是说2121ˆ|()()||()|Nn Nn z n zn z n ==−∑∑在模型四下是最靠近0的, 故模型四是逼近效果最好的.但模型四的计算复杂度是很大, 由所得的NMSE 参数可发现模型二的计算精度也是不错的, 但其计算的复杂度比模型四要小很多, 故选择模型二来求解功放特性函数. 且在下面的无记忆功放模型的预失真处理建模中, 功放特性函数是由模型二得出的.§5.1.2四种模型的输入输出幅度比较图与评价下面将实际的与拟合的复输入输出幅度值进行作图, 以便更直观的看出模型的逼近效果.图5.1 模型一k=3实际与拟合功放输入/输出幅度散点图 图5.1模型一k=5实际与拟合功放输入/输出幅度散点图图5.3模型二k=3实际与拟合功放输入/输出幅度散点图 图5.4 模型二k=5实际与拟合功放输入/输出幅度散点图图5.5 模型三实际与拟合的功放输入/输出幅度散点图图5.6模型四实际与拟合的功放输入/输出幅度散点图根据观察比较发现, 当用正交的函数基或对其实行一个正则化(即模型三和模型四), 来对功放特性函数进行拟合的时候, 拟合情形的输入输出幅度散点图与实际的输入输出幅度散点图的逼近效果是最佳的.k=时, 其散点图的逼近效果也是很好的.同时可观察到但模型二中的次数5§5.1.3 预失真处理模型建立选定-11():()()()Kk k k G z n b x n x n =⋅=∑的阶数5K =, 通过上面的算法可以得到当F 取不同阶数的情况下, g, NMSE, EVM 的结果及图像表5.1 F 取不同阶数情况下g, NMSE, EVM 的结果F 的阶数Kg NMSE EVM 4 1.86932497973065-32.5819077399852 2.34911681195961% 5 1.84730161996524-37.1398119663279 1.38998272147897% 7 1.83264461869445-46.06241433950440.497598752653887%由表5.1的结果可以看出当F 的阶数越高时, 得到的g 的值越小(说明线性化后的幅度放大倍数越小), NMSE 、EVM 的值越小(说明模型的计算精度越高, 整体模型对信号的幅度失真程度越小).图5.7理想信号与所建模型得到的输出信号对比(K=4) 图5.8理想信号与所建模型得到的输出信号对比(K=5)图5.9理想信号与所建模型得到的输出信号对比(K=7)根据观察发现, 当K 的取值越大时, 所建模型的输入输出幅度散点图与理想的输入输出幅度散点图的逼近效果越好.§5.2 问题二的模型与求解§5.2.1 有记忆功放的特性函数()G ⋅模型建立对于问题二, 根据文章中所给的某功放有记忆效应的复输入输出测试数据, 首先需要建立此功放的非线性特性数学模型, 拟合出功放的特性函数()G ⋅. 此时功放不仅与此时刻输入有关, 而且与此前某一时间段的输入有关, 其可以由为101111022220212()()()(1)()()(1)()K Mk km M k m M z n h x n m h x n h x n h x n M h x n h x n h x n M ===−=+−++−++−++−+∑∑ 01 ()(1)()K K K K K KM h x n h x n h x n M ++−++− , 0,1,2,,n N = .式中M 表示记忆深度, km h 为系数. 具有记忆效应的功放模型也可以用更一般的V olterra级数[][]56表示, 由于V olterra 级数太复杂, 简化模型有Wiener 、Hammersteint 等[][]47. 由于常用复值输入-输出信号, 上式也可表示为便于计算的“和记忆多项式”模型-110()(-)|(-)|K Mk km k m z n h x n m x n m ===∑∑ 0,1,2,,n N = (5.2.1)模型建立本文采用“和记忆多项式”模型(5.2.1)式来进行拟合. 我们用最小二乘法来求解, 由于本问中所给的输入输出的数据个数非常大, 故现在选取其中的一部分来进行拟合, 求得功放过程的模型. 我们选取输入输出数据的次数n 为1M +的倍数的数据来进行拟合, 最小二乘公式即为()()12-1(1)|10min (-)|(-)|K M K Mk km h CM nk m n Nz n h x n m x n m ××∈+==≤−∑∑∑ (5.2.2) 其中N 是指所有的功放的输入数据总个数, K 表示所选模型的最高次数, M 表示记忆深度(本文在求解模型时是事先给定的), ()x n 是第n 个复输入值, ()z n 是第n 个复输出值, km h 为系数, ()102001222212,,,,,,,, ,,,,TK K M M KM h h h h h h h h h h =…………….由于所给的数据较多, 即便是选取了部分数据进行拟合,但仍很难避免3.2节中所提到的A A 奇异的情况, 故对(5.2.2)再进行一个Tikhonov 正则化. 即对(5.2.2)加一个正则项2k k h h λ−,则问题转变为()()122-11(1)|10min (-)|(-)|K M K Mk k km k k h CM nk m n Nh z n h x n m x n m h h λ××+∈+==≤=−+−∑∑∑ (5.2.3) 其中k h 是第k 步迭代得到的解, 而k λ可以选为一个常数或一个单调下降趋于0的数列. 而迭代的终止准则为1k k h h ε+−≤,其中ε是一个给定的误差上界.当给定一个记忆深度M 后, 我们可以将问题(5.2.3)化成如下形式的问题, 即()22min nk k h Cz n Ah h h λ∈−+− (5.2.4) 其中A 是一个()()()()/11N M K M +×⋅+的复矩阵, 即1111(1) (1)(1) (1)(1) (1) (1)(1) (22) (22)(22) (22)(22) (2) (1)(1) K K K K x M x M x M x M x M x x x x M x M x M x M x M x M x x A −−−−+++++++++++=……………… ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦而()102001121112,,,,,,,, ,,,,TK K M M KM h h h h h h h h h h =…………….考虑到二次凸函数的稳定点即为最小值点, 问题(5.2.4)是可以直接求解的, h 的求解公式为()()()1Tk kk h A A I A z n h λλ−=++. (5.2.5)本题中已给出有记忆功放输入输出数据的总个数为73920N =, 并分别取 87, 5, 10M K ε−===和 83, 5, 10M K ε−===这两种情况. 这样就可以根据(5.2.5)求得h .结果(见附录2.2.1、2.2.2)当7,5M K ==时, 由于系数共有40个, 即h 是一个401×的大向量, 故将该结果放到附录中. 再根据上面所建立的模型及(5.1.1)式, 求出该模型的NMSE 值如下:NMSE -45.839408840847 7,5M K ===.当3,5M K ==时, 由于系数共有20个, 即h 是一个201×的大向量, 故将该结果放到附录中. 再根据上面所建立的模型及(5.1.1)式, 求出该模型的NMSE 值如下:NMSE 44.5315001961471 3,5M K =−==.§5.2.2有记忆功放模型的输入输出幅度图下面将实际与拟合的复输入输出幅度进行作图, 以便更直观的看出模型的逼近效果.图5.10 M=7实际与拟合功放输入/输出幅度散点图 图5.11 M=3实际与拟合功放输入/输出幅度散点图总评价根据观察比较发现, 尽管在用“和记忆多项式”模型进行拟合时, 我们只选取了一部分输入输出测量数据进行模型的建构. 但通过对上面两图的观察, 当对所有的输入测量数据进行作图时, 可发现拟合得到的输入输出幅度散点图与实际的输入输出幅度散点图的逼近效果还是很好的.§5.2.3 预失真处理模型建立上面已求得功放特性函数()G ⋅的模型, 采用“和记忆多项式”模型-110()(-)|(-)|K Mk kmk m z n hx n m x n m ===∑∑建立的功放模型. 下面建模的总体原则是使预失真和功放的联合模型呈线性后误差最小. 在此模型中, 有两个约束需要考虑:(1)输出幅度限制:即模型中的预失真处理的输出幅度不大于给出的功放输入幅度最大值.(2)功率最大化:即模型的建立必需考虑尽可能使功放的信号平均输出功率最大, 因此预失真处理后的输出幅度需尽可能提高.0≤下面我们将给出解决该优化问题的算法: 给定判断容限step1选定-110(): ()(-)|(-)|KMk km k m G z n h x n m x n m ==⋅=∑∑的阶数为5K =. 因数据量很大且算法较复杂, 本文对F 进行多次计算, 发现当阶数为5K =的时候与更高阶相比, 效果就已经很好了, 故下面只给出阶数为5K =时g, NMSE, EVM 的结果.本文取定记忆深度为 3M =, 现根据算法5.2可求得9.490829228013789g =,由于系数一共有20个, 即h 是一个201×的向量, 故将此结果放到附录中.根据上面所建模型以及(5.1.1)、(5.1.2)式, 可求出该模型的NMSE 、EVM 值如下:.NMSE -37.836849855461956EVM 0.012827957346961== 3,5M K ==由所得数据, 可以发现在该算法下, 得到的g 的值比较大(说明线性化后的幅度放大倍数大), NMSE 、EVM 的值较小(说明模型的计算精度越高, 整体模型对信号的幅度失真程度越小).图5.13 M=3, K=5实际与拟合功放输入/输出幅度散点图观察图5.13发现, 该情况下所建模型的输入输出幅度散点图与理想的输入输出幅度散点图逼近效果还是较好的. 故该模型是可行的.§5.3 问题三的模型与求解 §5.3.1背景知识功率谱的概念是针对功率有限信号的, 所表现的是单位频带内信号功率随频率的变化情况. 保留了频谱的幅度信息, 但是丢掉了相位信息, 所以频谱不同的信号其功率谱是可能相同的. 功率谱是随机过程的统计平均概念, 平稳随机过程的功率谱是一个确定函数;而频谱是随机过程样本的Fourier 变换, 对于一个随机过程而言, 频谱也是一个“随机过程”(随机的频域序列).功率谱参度(PSD), 它定义了信号或者时间序列的功率如何随频率分布. 这里功率可能是实际物理上的功率, 或者更经常便于表示抽象的信号, 被定义为信号数值的平方, 也就是当信号的负载为1欧姆(ohm)时的实际功率.由于平均值不为零的信号不是平方可积的, 所以在这种情况下就没有傅立叶变换. 维纳-辛钦定理(Wiener-Khinchin theorem)提供了一个简单的替换方法. 如果信号可以看作是平稳随机过程, 那么功率谱参度就是信号自相关函数的傅立叶变换. 信号的功率谱参度当且仅当信号是广义的平稳过程的时候才存在; 如果信号不是平稳过程, 那么自相关函数一定是两个变量的函数, 这样就不存在功率谱参度, 但是可以使用类似的技术估计时变谱参度. 随机信号是时域无限信号, 不具备可积分条件, 因此不能直接进行傅氏变换. 一般用具有统计特性的功率谱来作为谱分析的依据. 功率谱与自相关函数是一个傅氏变换对.一般的功率谱参度都是针对平稳随机过程的, 由于平稳随机过程的样本函数一般不是绝对可积的, 因此不能直接对它进行傅立叶分析. 可以有三种办法来重新定义谱参度,来克服上述困难.1. 用相关函数的傅立叶变换来定义谱参度;2. 用随机过程的有限时间傅立叶变换来定义谱参度;3. 用平稳随机过程的谱分解来定义谱参度.§5.3.2 模型建立计算功率谱参度函数通常有两种方法[]8. 一种叫做标准的自相关函数法, 其表达式为:(1)0()4()cos 2d x x G f R f τπττ∞=∫ (5.3.1)其中()x R τ表示某个各态历经的随机过程{}()x t 的自相关函数;另一种叫做直接法, 即是直接对随机过程{}()x t 的样本函数作傅立叶变换得到功率谱参度函数, 其表达式为:2(2)202()lim ()d T j ftx T G f x t e t Tπ−→∞=∫ (5.3.2)在计算机上计算功率谱参度函数时, 要求输入的数据必须是离散数值, 所以要对连续观测的数据记录必须做离散化处理. 这叫做数据采样. 离散化的数据值叫做采样数据. 实际计算时, 要求参加运算的采样数据的个数是有限的(即是说, 在有限的时间区段0-T 上进行计算). 在记录是离散的、有限的情况下, 计算功率谱参度函数的公式可以分别近似地表示为:1(1)01()22cos 2cos 2M x r M r G f t R R fr t R fM t ππ−=⎡⎤=Δ+Δ+Δ⎢⎥⎣⎦∑ (5.3.3)和21(2)202()N j fi t x i i G f t x e N t π−−Δ==ΔΔ∑ (5.3.4)这里, 将(5.3.4)式整理为()()21P f X f N=(5.3.5) 其中()X f 是()x n 的傅里叶变换, 在计算过程中可以直接调用FFT 函数.另外由题意可设出, per F 表示每个点上的频率, 其表达式为sper F F N=. M 表示每个信道所含的点的个数, 其表达式为0perF M F =.其中0F 表示每个传输信道上的频率. 故传输信道就只包含M 个点, 相邻信道也只包含M 个点.由于非线性效应产生的新频率分量由对邻道信号有一定的影响, 现用相邻信道功率比(Adjacent Channel Power Ratio, ACPR)表示信道的带外失真的参数, 衡量由于非线性效应所产生的新频率分量对邻道信号的影响程度. 其定义为。
全国大学生数学建模优秀论文 B题:产品销量预测
承诺书我们仔细阅读了数学建模竞赛选拔的规则.我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。
我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。
如有违反选拔规则的行为,我们将受到严肃处理。
我们选择的题号是(从A/B/C中选择一项填写):队员签名:1.2.3.日期:年月_日编号专用页评阅编号(评阅前进行编号):评阅记录(评阅时使用):评阅人评分备注B 题 产品销量预测摘要产品销量预测问题是当前世界上所有企业最关心的问题之一。
企业若想长期生存发展,就必须做销量预测。
本文对产品的销量及其影响因素进行了讨论。
对于问题一,鉴于比例系数未知,给出比例系数为每一产品在单位时间内平均吸引k 个顾客,使其购买k 个该产品这一假设,建立Malthus 模型,预测出0t 时刻的产品销量0()x t 。
分析得Malthus 模型所得结果只与实际销售量在初始阶段的增长情况比较符合,不宜用于销售量的中、长期预测。
对于问题二,结合问题一并假设一个消费者仅购买一种该产品。
此时问题可理解为在某时刻t 时,产品销量的增长率既与到时刻t 为止的已经购买该种产品消费者数目)(t x 成正比,也与尚未购买该产品的潜在消费者数目)(t x N 成正比。
建立Logistic 模型,预测出0t 时的产品销量0()x t 。
分析得,产品销售情形与此模型非常相似,特别在销售后期更加吻合。
对于问题三,根据产品生命周期理论,结合龚柏兹曲线,运用三段对数和法,建立模型,预测出市场容量N 。
对于问题四,考虑到影响产品销量的因素有广告、企业竞争、产品竞争、消费者的购买能力、国家的经济水平等。
结合本文,选取广告、企业竞争、产品竞争三个因素分别建立独家销售的广告模型、竞争销售的广告模型、同类产品的竞争模型来预测0t 时的产品销量0()x t 。
2013全国大学生数学建模比赛B题-答案
2013全国大学生数学建模比赛B 题-答案2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆邮电大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2013 年 9 月 13 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文研究的是碎纸片的拼接复原问题。
由于人工做残片复原虽然准确度高,但有着效率低的缺点,仅由计算机处理复原,会由于各类条件的限制造成误差与错误,所以为了解决题目中给定的碎纸片复原问题,我们采用人机结合的方法建立碎纸片的计算机复原模型解决残片复原问题,并把计算机通过算法复原的结果优劣情况作为评价复原模型好坏的标准,通过人工后期的处理得到最佳结果。
面对题目中给出的BMP格式的黑白文字图片,我们使用matlab软件的图像处理功能把图像转化为矩阵形式,矩阵中的元素表示图中该位置像素的灰度值,再对元素进行二值化处理得到新的矩阵。
题目每一个附件中的碎纸片均为来自同一页的文件,所以不需考虑残片中含有未知纸张的残片以及残片中不会含有公共部分。
2013年全国大学生电工杯数学建模竞赛一等奖论文(B题)
%
(1-2b)
化学不完全燃烧热损失是由于烟气中残留有诸如 CO ,H 2 ,CH 4 等可燃气体成分而 未释放出燃烧热就随烟气排出所造成的热损失。 气体不完全燃烧产物为 CO , H 2 , CH 4 等可燃气体,则其热损失应为烟气中各可燃 气体体积与它们的体积发热量乘积的总和。 题中说明过量空气系数对化学不完全燃烧热损失影响较小,故可视为常数处理。所 以,化学不完全燃烧热损失与过量空气系数没有直接关系,故可以假设化学不完全燃烧 热损失 q3 为一常数,即: q3 K (1-3) 5.1.4 机械不完全燃烧热损失 q4 的计算 机械不完全燃烧热损失是由于进入炉膛的燃料中, 有一部分没有参与燃烧或未燃尽 而被排出炉外引起的热损失。论其实质,是包含在灰渣(包括灰渣、漏煤、烟道灰、 飞 灰以及溢流灰、冷灰渣等)中的未燃尽的碳造成的热量的损失。对层燃炉而言,主要由 灰渣、漏煤、和飞灰三项组成。 在实际中因为漏煤的含量相对较少所以本文不考虑漏煤的量,对于运行中的锅炉, 分别收集它的每小时的灰渣和飞灰的质量 Ghz 和 G fh (kg/h) ,同时分析出它们所含可燃 物质的质量百分数 Chz 和 C fh (%)和可燃烧的发热量 Qhz 和 Q fh (kJ/kg)则灰渣和飞灰损
q2 q3 q4 q5 q6 I py
Qgy Qr H Wy Ghz G fh ahz a fh ahz
y
py hz
Ay (c ) hz
hz gl
5.模型的建立和求解
5.1 问题一:确定锅炉运行的最佳过量空气系数 5.1.1 问题的分析 因为 q 2 q3 q 4 先减少后增加,有一个最小值,与此最小值对应的空气系数称为最 佳过量空气系数。 所以首先要求出 q2 、q3 和 q4 的表达式。 然后求得 q 2 q3 q 4 的表达式, 在对这个表达式进行求导,让导数等于 0 这就是最佳过量空气系数。 5.1.2 排烟热损失 q2 的计算 由于技术经济条件的限制,烟气离开锅炉排入大气时,烟气温度比进入锅炉的空气 温度要高得多,排烟所带走的热量损失简称为排烟热损失。 排烟热损失可按如下公式计算[3]: (1-1) Q2 I py pyVk0 (ct ) amb kJ / kg
2013全国大学生数学建模比赛B题_答案
2013全国大学生数学建模比赛B题_答案在2013年全国大学生数学建模比赛中,B题的答案涉及了复杂的数学问题和模型建立。
本文将对B题的答案进行详细解析,包括问题的分析、数学模型的建立和结果的分析。
一、问题分析B题要求解答电气设备故障诊断问题。
在现代电气系统中,电气设备的故障可能导致整个系统的崩溃,因此及时准确地诊断故障是非常重要的。
本题给出了一组电气设备的故障数据,要求通过建立数学模型,诊断出可能的故障原因。
二、数学模型的建立1. 数据预处理首先,我们需要对给出的故障数据进行预处理,以便更好地分析和建立模型。
预处理包括数据清洗、异常值检测和数据归一化等步骤。
2. 特征选择在建立数学模型之前,我们需要选择合适的特征来描述电气设备的故障情况。
特征选择的原则是能够最大程度地包含有用的信息,同时减少冗余和噪声。
常用的特征选择方法包括相关系数分析、主成分分析和信息增益等。
3. 模型建立根据问题的要求,可以采用多种数学模型进行建立,如贝叶斯网络、支持向量机和神经网络等。
不同的模型有着不同的优劣势,在实际应用中需要根据具体情况选择合适的模型。
4. 模型训练和优化在建立好数学模型之后,需要使用给出的故障数据进行模型的训练和优化。
训练的目标是根据已知的故障数据,提高模型的准确性和泛化能力。
优化的过程包括参数调整和模型选择等。
三、结果分析经过模型的训练和优化,我们得到了电气设备故障的诊断结果。
在结果的分析中,我们需要评估模型的精度和可靠性,同时根据实际情况提出相应的改进策略。
四、小结通过对2013全国大学生数学建模比赛B题的答案进行详细解析,我们了解了电气设备故障诊断的数学建模过程。
建立数学模型涉及到数据预处理、特征选择、模型建立和结果分析等步骤。
这些步骤的正确和合理运用,对于解决实际问题具有重要意义。
注:本文仅为示例,实际的答案可能涉及更多细节和公式推导。
请根据具体题目要求进行解答。
2013全国大学生数学建模比赛B题-答案
2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):重庆邮电大学参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):日期: 2013 年 9 月 13 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要本文研究的是碎纸片的拼接复原问题。
由于人工做残片复原虽然准确度高,但有着效率低的缺点,仅由计算机处理复原,会由于各类条件的限制造成误差与错误,所以为了解决题目中给定的碎纸片复原问题,我们采用人机结合的方法建立碎纸片的计算机复原模型解决残片复原问题,并把计算机通过算法复原的结果优劣情况作为评价复原模型好坏的标准,通过人工后期的处理得到最佳结果。
面对题目中给出的BMP格式的黑白文字图片,我们使用matlab软件的图像处理功能把图像转化为矩阵形式,矩阵中的元素表示图中该位置像素的灰度值,再对元素进行二值化处理得到新的矩阵。
题目每一个附件中的碎纸片均为来自同一页的文件,所以不需考虑残片中含有未知纸张的残片以及残片中不会含有公共部分。
2013年全国数学建模B题
2013年全国数学建模B题1、首先运用MATLAB的imread语句将图片转化为参数,每一张图片都得到一个1980*72的矩阵,抽取每个矩阵的第1列和第72列,共得到38列数据,并对其进行编号排序,运用MATLAB进行分布聚类分析,分为18类,得到各自的搭配图形,最后进行人工编排和绘图。
程序如下:(1)clc;clear allclose allI=imread('D:\B\附件1\010.bmp');I_gray=double(I);[m,n] = size(I);a=0.3;A=0;T1=0;S=0;for i=1:mfor j=1:nA=A+I_gray(i,j)endendA=A*0.9;while(S<A)T1=T1+1;for i=1:mfor j=1:nif(I_gray(i,j)==T1)S=S+I_gray(i,j);endendendendT2=zeros(m,n);T3=zeros(m,n);M=3;N=3;for i=M+1:m-Mfor j=N+1:n-Nmax=1;min=255;for k=i-M:i+Mfor l=j-N:j+Nif I_gray(k,l)>maxmax=I_gray(k,l);endif I_gray(k,l)<minmin=I_gray(k,l);endendendT2(i,j)=(max+min)/2;T3(i,j)=max-min;endendT4=medfilt2(T2,[M,N]);T5=(T1+T4)/2;I_bw=zeros(m,n);for i=1:mfor j=1:nif I_gray(i,j)>(1+a)*T1I_bw(i,j)=255;endif I_gray(i,j)<(1-a)*T1I_bw(i,j)=0;endif (1-a)*T1<=I_gray(i,j)<=(1-a)*T1 if T3(i,j)>a*T1if I_gray(i,j)>=T4(i,j)I_bw(i,j)=255;elseI_bw(i,j)=0;endelse if I_gray(i,j)>=T5(i,j)I_bw(i,j)=255;elseI_bw(i,j)=0;endendendendendsubplot(1,2,1),imshow(I)subplot(1,2,2),imshow(I_bw)(2)julei=data';julei2=zscore(julei);y=pdist(julei2);z=linkage(y);dendrogram(z,'average')[x,cmap]=imread('000.bmp '); %读取图像的数据阵和色图阵image(x);colormap(cmap);axis image off %保持宽高比并取消坐标轴2、。
2013年全国大学生数学建模竞赛国家一等奖论文 D题基于统计分析的
基于统计分析的公共自行车服务系统评价模型研究摘要本文针对温州市鹿城区公共自行车管理中心提供的数据,首先对所给数据进行预处理,建立了相关统计模型,运用SPSS20.0、matlab等软件进行统计分析,最后应用关联度分析法对系统进行评价,并提出改进建议。
针对问题一:在已处理好的数据基础上,建立了频率与频数、用车时长的统计模型,利用SPSS软件分别统计各站点20天中每天及累计的借车及还车频次,得到每天和累计的借车和还车频次(见表五和表六);并对所有站点按累计的借车和还车频次排序(见表七和表八);对每次用车时长的分布情况进行统计分析,画出其分布图(见图一和图二),由图可知:每天用车时长分布形状非常相似且近似服从2 分布。
针对问题二:在已处理好的数据基础上,建立了使用公用自行车的不同借车卡数量的统计模型,利用SPSS统计20天中每天使用不同借车卡数量,其中最大的为第20天的19885;统计了每张借车卡累计借车次数的分布图(见图三),对图形分析可得:借车次数在10次以内的占54.86%,借车次数在10至30次占35.88%,借车次数在30至50次占7.51%,借车次数在50以上占1.75%,最大借车次数高达182次。
针对问题三:根据问题一的分析,已给站点累计所用公共自行车次数最大的一天是第20天。
对于第一小问:利用第20天数据,运用floyd算法求得两站点间最短时间,将站与站间的距离定义为两站间的最短时间与自行车速度之积,同时考虑到了速度和时间的随机误差影响;利用距离的定义,通过matlab计算得两站点最长距离为:675,最短距离为:0.08。
利用问题一中的频数模型,对借还车是同一站点且使用时间在1分钟以上的借还车情况进行统计,得借车频次表(见表十一)和用车时间分布图(见图四)。
对于第二小问:根据问题一的统计,第20天的借车和还车频次最高的站点分别为42(街心公园)和56(五马美食林),利用SPSS统计出两站点借、还车时刻和用车时长的分布图(见图五,图六,图七),由图形分析可知:借还车的高峰期与人们上下班的时间非常吻合,在借还车时间上大体都在一小时以内。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。
如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): B我们的参赛报名号为(如果赛区设置报名号的话):本10队所属学校(请填写完整的全名):参赛队员(打印并签名) :1.2.3.指导教师或指导教师组负责人(打印并签名):(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。
以上内容请仔细核对,提交后将不再允许做任何修改。
如填写错误,论文可能被取消评奖资格。
)日期: 2013 年 9 月 16 日赛区评阅编号(由赛区组委会评阅前进行编号):2013高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):全国评阅编号(由全国组委会评阅前进行编号):碎纸片的拼接复原摘要破碎文件的拼接在历史文献修复和军事情报获取等领域中都发挥着重要作用,由于撕裂、切碎、污染或自然衰老等原因,原始文件的信息可能会丢失。
尽管用手或某些化学过程,可能将一些原始文件恢复,但是基于图像技术的文件恢复是一种非侵入性的和高效率的方法,所以它被普遍采用。
传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。
特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。
随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。
本文中针对问题1,读入附件所给出的图片,用自定义阈值法实现图像的二值化,得出碎纸片的匹配矩阵,根据欧氏距离计算图片之间重叠部分的相似度,再利用matlab软件进行该算法相关计算,得到碎纸片的拼接顺序,复原破碎图片。
针对问题2,读入附件所给出的图片,用自定义阈值法实现图像的二值化,得出碎纸片拼接的匹配矩阵,任取一碎片并判断:(1)若被判断为图像左(右)边缘的碎片,则从该碎片右(左)边缘开始进行拼接,计算与其他碎片之间重叠部分的相似度,再利用matlab软件进行矩阵的相关计算,得到碎纸片的拼接顺序,把块状复原拼接成条状。
(2)若为图像中间部分的碎片,则分别从左右两个方向进行拼接。
再按问题1的方法,计算这排列好的11行碎纸条重叠部分的相似度,即用matlab软件进行此算法的相关计算,得到碎纸片的拼接顺序,复原破碎图片,问题2的相似度的计算与问题1一样,用求欧式距离的方法。
针对问题3,读入附件所给出的图片,用自定义阈值法实现图像的二值化,得出碎纸片拼接的匹配矩阵,任取一碎片再进行如同问题2中拼接,即求最小欧式距离的方法,发现满足此条件的候选被拼接的碎片不唯一,则我们再用相关系数法求得该系数最接近1的碎片是我们的最佳选择,最后用matlab软件进行这个算法实现的相关计算,得到碎纸片的拼接顺序,复原破碎图片。
关键词:图像碎片拼接二值化法欧氏距离相似度人工干预相关系数1.问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。
特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。
随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。
1.1破碎纸片为同一页印刷文字文件的碎纸机仅纵切得到的,建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。
如果复原过程需要人工干预,则写出干预方式及干预的时间节点。
复原结果以图片形式及表格形式表达。
1. 2破碎纸片为碎纸机既纵切又横切的得到,建立碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。
如果复原过程需要人工干预,则写出干预方式及干预的时间节点。
复原结果表达要求同上。
1. 3从现实情形出发,破碎纸片为双面打印文件的碎纸片,建立碎纸片拼接复原模型。
附件5给出的是一页英文印刷文字双面打印文件的碎片数据。
并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。
2.问题分析此题针对破碎文件的拼接,在问题1中,对给定的来自同一页印刷文字的碎纸机破碎纸片(仅纵切),建立碎纸片,拼接复原模型和算法。
问题2中,来自同一页印刷文字的碎纸机破碎纸片(纵横切),建立碎纸片拼接复原模型和算法。
问题3中,从现实情形出发,针对双面打印文件的碎纸片拼接复原问题的解决。
设计相应的碎纸片拼接复原模型与算法。
问题1:针对此题,读入附件所给的灰度图,用自定义阈值法实现图像的二值化。
对于每一个碎纸片的灰度矩阵进行二值化处理。
计算匹配矩阵,得出碎纸片拼接的匹配矩阵,找一张碎片的右边分别于其他碎片的左边进行匹配,直到找到相匹配的碎片为止,再把找到的碎片左边与其他碎片的右边进行匹配,直到找到相匹配的碎片为止,依次循环下去,直到拼接完成。
问题2:针对此题,读入附件所给的灰度图,用自定义阈值法实现图像的二值化。
对于每一个碎纸片的灰度矩阵进行二值化处理。
计算匹配矩阵,得出碎纸片拼接的匹配矩阵,这时我们需要判断碎片是左边缘还是右边缘,还是上下边缘,中心边缘,从而进行拼接,先拼行再拼列,从左往右拼,最后复原破碎图片。
问题3:读入附件所给出的图片,用自定义阈值法实现图像的二值化,得出碎纸片拼接的匹配矩阵,任取一碎片再进行如同问题2中拼接,即求最小欧式距离的方法,发现满足此条件的候选被拼接的碎片不唯一,则我们再用相关系数法求得该系数最接近1的碎片是我们的最佳选择,最后用matlab 软件进行这个算法实现的相关计算,得到碎纸片的拼接顺序,复原破碎图片。
3.模型假设3.1假设所研究碎纸片规则且形状大小完全相同。
3.2假设所研究碎纸片为平滑的。
3.3假设所研究碎纸片文字方向一致。
4.变量说明i 表示碎纸片灰度矩阵行数j 表示碎纸片灰度矩阵列数P 表示碎纸片灰度矩阵P 表示二值化灰度矩阵D 表示欧式距离j i x ,表示改点的灰度值j k m ,表示灰度矩阵第j 列的k 维坐标1,k m 表示灰度矩阵第1列的k 维坐标j i m ,表示灰度矩阵第j 列的k 维坐标aM 表示被选碎纸片第j 列的i 个指标所组成的向量 b M 表示匹配碎纸片第1列的i 个指标所组成的向量C (X,Y )表示相关系数,X,Y 表示两个向量5.模型的建立与求解问题一:碎纸片灰度矩阵的行列:i=1980j=72.碎纸片灰度矩阵类型:二值化处理后的灰度矩阵:处理后的灰度矩阵第j 列为:⎪⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=-j i j i j j a m m m m M ,,1,2,1 处理后的灰度矩阵第1列为: 运用欧氏距离得到相似度: D=()∑-=1980121,,i i j i m m D 值越小,表明这两个碎纸片相似度越高,从而可以进行拼接,依次类推可得结果。
1、将附件1中所有图片进行预处理得到灰色矩阵,再将各个矩阵的第一列和最后一列拿出,构成新的72*2的列矩阵,对此进行初始编号。
2、用其中一个列矩阵的第二列与其他18个列矩阵的第一列做欧氏距离,在这十八个距离中,取最小值作为与它相似度最高的矩阵;再将取得最小值的列距阵的第二列与其他17个列矩阵的第一列做欧氏距离,在这十八个距离中,取最小值作为与它相似度最高的矩阵;依次循环直到拼接完成。
matlab 编程如下:imname = dir('.\*.bmp');%读入文件夹下的全部图像im_num = length(imname);% 文件夹中图像的个数ininum = 0;for s = 1:im_numImg = imread(imname(s).name,'bmp');if norm(double(Img(:,1)) - 255)< 0.0001ininum = s;endendindex = [1:ininum-1,ininum+1:im_num];Img1 = imread(imname(ininum).name,'bmp');%读入第一幅图像[height1,width1] = size(Img1);%得到图像的尺寸xunxu = zeros(1,im_num); %存储最终序列号xunxu(1) = ininum;result = Img1;for a = 2:im_numerror = zeros(1,length(index));for tt=1:length(index)Img2 = imread(imname(index(tt)).name,'bmp');%读入第一幅图像[height2,width2] = size(Img2);%得到图像的尺寸error(tt) = norm(double(Img1(:,end)-Img2(:,1)),2);end[tm,tn]=min(error);temp = imread(imname(index(tn)).name,'bmp');result = [result,temp];Img1 = imread(imname(index(tn)).name,'bmp');xunxu(a) = index(tn);index = [index(1:tn-1),index(tn+1:end)];end% result = uint8(result);% xunxu附件1的输出结果如表18 14 12 15 3 10 2 16 1 4 5 9 13 18 11 7 17 0 6 得到拼接图1:附件2输出结果表2:3 6 2 7 15 18 11 0 5 1 9 13 10 8 12 14 17 16 4得到拼接图2:问题二:图像拼接技术主要有以下三个步骤:图像预处理、图像配准、图像融合与边界平滑。
空白的碎片通常出现在边界或分离的多个列的文档。
最左边的分解特点是左边附近没有纹理或右边界有纹理,反之亦然,是最右边的边界。