2006年全国大学生数学建模竞赛B题
全国大学生数学建模竞赛题目B题
B题公交车调度
公共交通是城市交通的重要组成部分,作好公交车的调度对于完善城市交通环境、改进市民出行状况、提高公交公司的经济和社会效益,都具有重要意义。
下面考虑一条公交线路上公交车的调度问题,其数据来自我国一座特大城市某条公交线路的客流调查和运营资料。
该条公交线路上行方向共14站,下行方向共13站,第3-4页给出的是典型的一个工作日两个运行方向各站上下车的乘客数量统计。
公交公司配给该线路同一型号的大客车,每辆标准载客100 人,据统计客车在该线路上运行的平均速度为20公里/小时。
运营调度要求,乘客候车时间一般不要超过10分钟,早高峰时一般不要超过5分钟,车辆满载率不应超过120%,一般也不要低于50%。
试根据这些资料和要求,为该线路设计一个便于操作的全天(工作日)的公交车调度方案,包括两个起点站的发车时刻表;一共需要多少辆车;这个方案以怎样的程度照顾到了乘客和公交公司双方的利益;等等。
如何将这个调度问题抽象成一个明确、完整的数学模型,指出求解模型的方法;根据实际问题的要求,如果要设计更好的调度方案,应如何采集运营数据。
数学建模真题分析2006
yi 0 x i i , i 1, 2,..., n 设 E i 0, D i 2 且 1 2, n 相互独立 ...,
记
Q Q ( 0 , 1 ) y i 0 1 xi
i 1 2 i i 1
e 0 1 e e
越接近于0,说明线性回归方程(1)越显著。
回归方程的显著性检验
在实际工作中,实现我们并不能断定y与x之间 有线性关系,式(1)只是一种假设。当然这个假设 不是没有根据,我们可以通过专业知识或散点图做 粗略判断。但在求出回归方程之后,还须对这种线 性回归方程同实际观测数据拟合的效果进行检验。
y=[698 872 988 807 738 1025 1316 1539 1561
1765 1762 1960 1902 2013 2446 2736 2825];
X=[ones(size(x')),x'] [c,cint,r,rint,stats]=regress(y',X,0.05) rcoplot(r,rint)
回归分析起源于生物学研究,是由英国生物学家兼统计学家高尔登(Francis Galton 1822-1911)在19世纪末叶研究遗传学特性时首先提出来的。
高尔登在1889年发表的著作《自然的遗传》中,提出了回归分析方法以后, 很快就应用到经济领域中来,而且这一名词也一直为生物学和统计学所沿用 。
引例:钢材消费量与国民收入的关系
全国大学生数学建模竞赛 ——2006年B题详解
预备知识
回归分析与多项式拟合 线性规划 数据包络模型(DEA)
2006年B题三个问题的解答
一、预备知识——回归分析
数学建模的基本方法
大学生数学建模竞赛B题优秀论文
关于高等教育学费标准的评价及建议摘要本文通过对近几年来学费变化的研究,综合分析影响学费变化的五个要素,引入了三个变因:学校属性、专业类型、地域差异对学费的影响,对其合理性进行了定量的分析和评价。
首先,我们基于层次分析法建立了模型一。
模型一以五个要素,即教育市场供求关系、全国家庭支付承受力、国家财政及相关社会捐助、个人收益率、教育成本为方案层。
对于教育市场的供求关系我们用灰色预测GM(1,1)模型预测出未来几年的招生人数,用蛛网模型求解稳定的价格点为3225.51 元;对于国家财政及相关社会捐助,我们用回归分析得出其效应关系。
模型一以效率和公平两个标准作为准则层,应用极差归一化思想,构造指标函数,综合建立成对比较矩阵。
我们定义学费合理化指数为目标层,经准则层,得出五个要素对学费合理化指数的组合权重向量。
考虑到成对比较矩阵仍有一定主观因素,我们用熵值取权法修正组合权重向量。
最后,拟合出最佳学费曲线及其波动区间,其中 2007 年的结论值为 3370.75 元。
模型一的突出优点是客观可信,美中不足的是结论为一个平均最优值,没有考虑其他变因的影响,使用的局限性较大。
然后,我们基于学校属性、专业类型、地域差异三个变因对结论的影响建立了模型二。
评价了这三个变因对五个要素的综合影响,修正了五个要素对学费合理化指数的影响,使得结论更趋于合理,应用范围更加广泛。
修正后通过若干数据的检验,得出平均最佳学费约为 3000 元。
基于这两个模型,以及对高校学费现状的了解,我们提出三点主要建议: 1.鼓励高校开拓资金来源渠道,学习国外筹款方式,如发行教育彩票等; 2.建议国家增加助学贷款发放力度,并能够分类别基于不同金额的贷款,并出台一些补贴政策弥补不同地区的差异; 3.大力扶持民办高等院校发展,实现高等教育大众化,这样不仅缓解高等院校招生压力,并且能够促进高校教育健康发展。
本文的特色在于基于翔实丰富的资料,根据五个要素及三个变因的分析,建立了一种合理的高校学费评价体系,其拥有适用性广,稳定性好,灵敏度高等特点,对三个变因,即学校属性、专业类型、地域差异进行了深入定量的分析,并根据模型结论给提出了我们的一些可行性建议。
全国大学生数学建模竞赛常用建模方法总结
邯郸学院本科毕业论文题目全国大学生数学建模竞赛常用建模方法探讨学生柴云飞指导教师闫峰教授年级2009级本科专业数学与应用数学二级学院数学系(系、部)邯郸学院数学系2013年6月郑重声明本人的毕业论文是在指导教师闫峰的指导下独立撰写完成的.如有剽窃、抄袭、造假等违反学术道德、学术规范和侵权的行为,本人愿意承担由此产生的各种后果,直至法律责任,并愿意通过网络接受公众的监督.特此郑重声明.论文经“中国知网”论文检测系统检测,总相似比为5.80%.毕业论文作者(签名):年月日全国大学生数学建模竞赛常用建模方法探讨摘要全国大学生数学建模竞赛作为全国高校规模最大的基础性学科竞赛,越来越受到人们的重视,所以建模竞赛的方法也就变得尤为重要.随着竞赛的不断发展,赛题的开放性逐步增大,一道赛题可用多种解法,各种求解的算法有时会相互融合,同时也在向大规模数据处理方向发展,这就对选手的能力提出了更高的要求.由于建模方法种类众多,无法一一介绍,所以本文主要介绍了四种比较常用的数学建模竞赛方法,包括微分与差分方程建模方法、数学规划建模方法、统计学建模方法、图论方法,并结合历年赛题加以说明.关键词:数学建模竞赛统计学方法数学规划图论Commonly Used Modeling Method ofChina Undergraduate Mathematical Contest in ModelingChai yunfei Directed by Professor Yan fengABSTRACTThe China undergraduate mathematical contest in modeling has been attention by more and more people as a basic subject of the largest national college competition. The method of modeling competition has become more and more important. Open questions gradually increased with the development of competition. Most of the games can be solved by lots of solutions. Sometimes these methods can be used together. And there is also a lot of data which puts forward higher requirement on the ability of players. The modeling methods is too numerous to mention, so this article mainly four kinds Commonly used modeling method are introduced that differential and difference equations modeling method, Mathematical programming modeling method, Statistics modeling method, graph theory and interprets with calendar year’s test questions.KEY WORDS:Mathematical contest in modeling Statistics method Mathematical programming Graph theory目录摘要 (I)英文摘要 (II)前言 (1)1微分方程与差分方程建模 (2)1.1微分方程建模 (2)1.1.1微分方程建模的原理和方法 (2)1.1.2微分方程建模应用实例 (3)1.2差分方程建模 (4)1.2.1 差分方程建模的原理和方法 (4)1.2.2 差分方程建模应用实例 (5)2数学规划建模 (5)2.1线性规划建模的一般理论 (6)2.2线性规划建模应用实例 (7)3统计学建模方法 (8)3.1聚类分析 (8)3.1.1 聚类分析的原理和方法 (8)3.1.2 聚类分析应用实例 (8)3.2回归分析 (9)3.2.1 回归分析的原理与方法 (9)3.2.2 回归分析应用实例 (10)4图论建模方法 (10)4.1两种常见图论方法介绍 (11)4.1.1 模拟退火法的基本原理 (11)4.1.2 最短路问题 (11)4.2图论建模应用实例 (12)5小结 (13)参考文献 (13)致谢 (14)前言全国大学生数学建模竞赛创办于1992年,每年一届,目前已成为全国高校规模最大的基础性学科竞赛,也是世界上规模最大的数学建模竞赛.参赛者需要根据题目要求,在三天时间内完成一篇包括模型假设、模型建立和求解、计算方法的设计和实现、模型结果的分析和检验、模型的改进等方面的论文.通过参加竞赛的训练和比赛,可以提高学生用数学方法解决实际问题的意识和能力,而且在培养团队精神和撰写科技论文等方面都会得到十分有益的锻炼.竞赛题目的涉及面比较宽,有工业、农业、工程设计、交通运输、经济管理、生物医学和社会事业等.竞赛选手不一定预先掌握深入的专业知识,而只需要学过高等数学的相关课程即可,并且题目具有较大的灵活性,便于参赛者发挥其创造能力.近年来,竞赛题目包含的数据较多,手工计算一般不能实现,所以就对参赛者的计算机能力提出了更高的要求,如2003年B题,某些问题的解决需要使用计算机软件;2001年A题,问题的数据读取需要计算机技术,并且对于给出的图像,需要用图像处理的方法获得;再如2004年A题则需要利用数据库数据,数据库方法,统计软件包等等.竞赛题目的总体特点可大致归纳如下:(1)实用性不断加强,问题和数据来自于实际,解决方法需要切合实际,模型和结果可以应用于实际;(2)综合性不断加强,解法多样,方法融合,学科交叉;(3)数据结构越来越复杂,包括数据的真实性,数据的海量性,数据的不完备性,数据的冗余性等;(4)开放性也越来越突出,题意的开放性,思路的开放性,方法多样,结果不唯一等.总体来说,赛题向大规模数据处理方向发展,求解算法和各类现代算法相互融合.纵观历年的赛题,主要用到的建模方法有:初等数学模型、微分与差分方程建模、组合概率、数据处理、统计学建模、计算方法建模、数学规划、图论方法、层次分析、插值与拟合、排队论、模糊数学、随机决策、多目标决策、随机模拟、计算机模拟法、灰色系统理论、时间序列等.本文不一一列举竞赛题目中涉及的所有方法,只是重点讨论其中一些比较常用的方法,包括微分与差分方程建模方法、数学规划建模方法、统计学建模方法、图论建模方法,并结合案例说明建模方法的原理及应用.1 微分方程与差分方程建模在很多竞赛题目中,常常会涉及很多变量之间的关系,找出它们之间的函数关系式具有重要意义.可在许多实际问题中,我们常常不能直接给出所需要的函数关系,但可以得到含有所求函数的导数(或微分)或差分(即增量)的方程,这样的方程称为微分方程或差分方程. 建立微分方程或差分方程的数学模型是一种重要的建模方法.如1996年A 题“最优捕鱼策略”,1997年A 题“零件参数设计”,2003年A 题“SARS 的传播”,2007年A 题“中国人口增长预测”,2009年A 题“最优捕鱼策略”等赛题中,都用到了这种方法.1.1 微分方程建模1.1.1 微分方程建模的原理和方法一般来说,任何时变问题中随时间变化而发生变化的量与其它一些量之间的关系经常以微分方程的形式来表现.例1.1 有一容器装有某种浓度的溶液,以流量1v 注入该容器浓度为1c 的同样溶液,假定溶液立即被搅拌均匀,并以2v 的流量流出混合后的溶液,试建立反映容器内浓度变化的数学模型.解 注意到溶液浓度=溶液体积溶液质量,因此,容器中溶液浓度会随溶质质量和溶液体积变化而发生变化.不妨设t 时刻容器中溶质质量为()t s ,初始值为0s ,t 时刻容器中溶液体积为()t v ,初始值为0v ,则这段时间()t t t ∆+,内有⎩⎨⎧∆-∆=∆∆-∆=∆t v t v V t v c t v c s 212211, (1) 其中1c 表示单位时间内注入溶液的浓度,2c 表示单位时间内流出溶液的浓度,当t ∆很小时,在()t t t ∆+,内有≈2c =)()(t V t s tv v V t s )()(210-+. (2) 对式(1)两端同除以t ∆,令0t ∆→,则有⎪⎪⎪⎩⎪⎪⎪⎨⎧==-=-=00212211)0(,)0(V V s s v v dtdV v c v c dt ds . (3) 即所求问题的微分方程模型.虽然它是针对液体溶液变化建立的,但对气体和固体浓度变化同样适用.实际应用中,许多时变问题都可取微小的时间段t ∆去考察某些量之间的变化规律,从而建立问题的数学模型,这是数学建模中微分方程建模常用手段之一.常用微分方程建模的方法主要有:(1)按实验定律或规律建立微分方程模型.此种建模方法充分依赖于各个学科领域中有关实验定律或规律以及某些重要的已知定理,这种方法要求建模者有宽广的知识视野,这样才能对具体问题采用某些熟知的实验定律.(2)分析微元变化规律建立微分方程模型.求解某些实际问题时,寻求一些微元之间的关系可以建立问题的数学模型.如例1.1中考察时间微元t ∆,从而建立起反应溶液浓度随时间变化的模型.此建模方法的出发点是考察某一变量的微小变化,即微元分析,找出其他一些变量与该微元间的关系式,从微分定义出发建立问题的数学模型.(3)近似模拟法.在许多实际问题中,有些现象的规律性并非一目了然,或有所了解亦是复杂的,这类问题常用近似模拟方法来建立问题的数学模型.一般通过一定的模型假设近似模拟实际现象,将问题做某些规范化处理后建立微分方程模型,然后分析、求解,并与实际问题作比较,观察模型能否近似刻画实际现象.近似模拟法的建模思路就是建立能够近似刻画或反映实际现象的数学模型,因此在建模过程中经常做一些较合理的模型假设使问题简化,然后通过简化建立近似反映实际问题的数学模型.1.1.2 微分方程建模应用实例例1.2(2003年高教社杯全国大学生数学建模竞赛A 题) SARS 传播的预测. 2003年爆发的“SARS ”疾病得到了许多重要的经验和教训,使人们认识到研究传染病的传播规律的重要性.题目给出了感病情况的三个附件,要求对SARS 的传播建立数学模型:(1)对SARS 的传播建立一个自己的模型,并说明模型的优缺点;(2)收集SARS 对经济某个方面影响的数据,建立相应的数学模型并进行预测.问题求解过程分析 由于题目具有开放性,故选择文献[1]中的求解思路分析. 传染病的传播模式可近似分为自由传播阶段和控后阶段,然后将人群分为易感者S ,感病者I ,移出者R 三类.由三者之间的关系可得到下列微分方程:⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧=++=-=-=NR I S hI dt dR hI kIS dt dI kISdt dS , 利用附件中给出的数据,可以将上述方程变形为I hI kNI dtdI λ=-=, 其中h kN -=λ,其解为t e I t I λ-=0)(.其中0I 为初始值.但此模型只适用于病例数与总人口数具有可比性的情况,当病例数远小于总人口数时,感病人数将随时间以指数增长.这是按实验定律或规律建立的微分方程模型.为进一步改进模型,用计算机跟踪病毒的个体传播情况,又建立计算机模拟模型.然后用计算机模拟北京5月10日之前SARS 的传播情况,并对5月10日以后的传播情况进行预测.但是得到的有效接触率与实际统计数据有所偏差,所以统计数据,为参数的确定寻求医学上的支持,并以随机模拟取代完全确定性的模拟,对原模型进行改进,建立随机模拟模型.通过计算机编程,产生正态分布的随机数,并对传染情况进行500次模拟,即可进行预测,并可得出对SARS 疫情控制提出的相应建议.1.2 差分方程建模1.2.1 差分方程建模的原理和方法差分方程在数学建模竞赛中应用的频率极高,所以要对这种方法引起足够的重视.它针对要解决的目标,引入系统或过程中的离散变量.具体方法是:根据实际的规律性质、平衡关系等,建立离散变量所满足的关系式,从而建立差分方程模型.差分方程可以分为不同的类型,如一阶和高阶差分方程,常系数和变系数差分方程,线性和非线性差分方程等等.建立差分方程模型一般要注意以下问题:(1)注意题中的离散变化量,对过程进行分析,尤其要注意形成变化运动过程的时间或距离的分化而得到离散变量;(2)通过对具体变化过程的分析,列出满足题意的差分方程,其中入手点是找出变量所能满足的平衡关系、增量或减量关系及规律,从而得到差分方程.1.2.2差分方程建模应用实例例1.3(2007年高教社杯全国大学生数学建模竞赛A题)中国人口增长预测.题目要求从中国的实际情况和人口增长的特点出发,参考附录中的相关数据(也可以搜索相关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测,特别要指出模型中的优点与不足之处.问题求解过程分析由于题目具有开放性,故选择文献[2]中的求解思路分析.通过分析题中相关的数据,考虑到我国近年来人口发展的总趋势,因为涉及到人口的增长和变换,所以可以先用微分方程来建立模型,并对我国人口增长的中短期和长期趋势做出预测.首先,根据灰色系统理论,使用灰色关联分析模型法对人口系统结构进行关联分析,找出影响人口增长的主要因素;其次使用年龄推算法进行短期预测.在建立和求解长期预测模型时,根据人口阻滞增长模型(Logistic模型),可以考虑对中国人口老龄化进程加速、出生人口性别比例持续升高以及乡村人口城镇化等因素建立新的人口增长的差分方程模型.但是它仅给出了人口总数的变化规律,反映不出各类人口的详细信息,所以我们需要建立离散化的模型,并进一步可以得到全面系统地反应一个时期内人口数量状况的差分方程,可以用微分和差分方程理论来表现和模拟人口数量的变化规律.从而对人口分布的状况、变化趋势、总体特征等有更加详细和科学的了解.在模型的求解过程中,用到了MATLAB软件,并做参数估计,利用所得结果和题目给出的近五年来的人口数据,对我国人口发展趋势进行了预测,得到了在老龄化进程加速、出生人口性别比例持续升高以及乡村人口城镇化等因素影响下,未来我国人口发展预测情况.2 数学规划建模数学规划是指在一系列条件限制下,寻求最优方案,使得目标达到最优的数学模型,它是运筹学的一个重要分支.数学规划的内容十分丰富,包括许多研究分支,如:线性规划、非线性规划、整数规划、二次规划、0-1规划、多目标规划、动态规划、参数规划、组合优化、随机规划、模糊规划、多层规划问题等.在1993年A 题“非线性交调的频率设计”,1993年B 题“足球队排名”,1995年A 题“飞行管理问题”,1996年B 题“节水洗衣机”,1997年A 题“零件的参数设计”,1998年A 题“一类投资组合问题”,1999年B 题“钻井布局”,2001年B 题“公交车调度问题”,2002年A 题“车灯线光源的优化”,2006年A 题“出版社书号问题”,2007年B 题“城市公交线路选择问题”等赛题中,都用到了规划的方法.在此以线性规划为例,对规划的方法进行探讨.2.1 线性规划建模的一般理论线性规划建模方法主要用于解决生产实际中的资源利用、人力调配、生产安排等问题,它是一种重要的数学模型.线性规划是运筹学中研究较早、发展较快、应用广泛、方法较成熟的一个重要分支,它是研究线性约束条件下线性目标函数的极值问题的数学理论和方法.一般的优化问题是指用“最好”的方式,使用或分配有限的资源即劳动力、原材料、机器、资金等,使得费用最小或利润最大.优化模型的一般形式为:()m ax m in 或 ()x f z = (4)().0..≤x g t s ()m i ,,2,1 = (5)()()12,,T n x x x x =,.由(4)、(5)组成的模型属于约束优化.若只有(4)式就是无约束优化.()x f 称为目标函数,()0g x ≤称为约束条件.在优化模型中,如果目标函数()x f 和约束条件中的()g x 都是线性函数,则该模型称为线性规划.建立实际问题线性规划模型的步骤如下:(1)设置要求解的决策变量.决策变量选取得当,不仅能顺利地建立模型而且能方便地求解,否则很可能事倍功半.(2)找出所有的限制,即约束条件,并用决策变量的线性方程或线性不等式来表示.当限制条件多,背景比较复杂时,可以采用图示或表格形式列出所有的已知数据和信息,从而避免“遗漏”或“重复”所造成的错误.(3)明确目标要求,并用决策变量的线性函数来表示,标出对函数是取极大还是取极小的要求.需要特别说明的是,要使用线性规划方法来处理一个实际问题,必须具备下面的条件:(1)优化条件:问题的目标有极大化或极小化的要求,而且能用决策变量的线性函数来表示.(2)选择条件:有多种可供选择的可行方案,以便从中选取最优方案.(3)限制条件:达到目标的条件是有一定限制的(比如,资源的供应量有限度等),而且这些限制可以用决策变量的线性等式或线性不等式表示出来.此外,描述问题的决策变量相互之间应有一定的联系,才有可能建立数学关系,这一点自然是不言而喻的.线性规划模型的求解可用图解法或单纯形法.随着计算机的普及和大量数学软件的出现,可以利用现成的软件MATLAB或LINGO等求解,在此不再叙述.2.2线性规划建模应用实例例2.1(2006年高教社杯全国大学生数学建模竞赛B题)艾滋病疗法的评价及疗效的预测.题目给出了美国某艾滋病医疗试验机构公布的两组数据,数据涉及到了病人CD4和HIV的浓度含量的测试结果.根据所给的资料需要参赛者完成以下问题:(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间;(2)利用附件2的数据,评价4种疗法的优劣(仅以4CD为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间;(3)如果病人需要考虑4种疗法的费用,对评价和预测有什么影响.问题求解过程分析由于题目具有开放性,故选择文献[3]中的求解思路进行分析.首先对题目所给数据进行分析,考虑到治疗的效果与患者的年龄有关,将患者按年龄分组,如25~35岁及45岁以上4组.每组中按照4种疗法和4个25岁,45~~14岁,35治疗阶段(如1020周,4030周),构造16个决策单元.取4~~~~0周,2010周,30种药品量为输入,治疗各个阶段末患者的4CD值的比值为输出.CD值与开始治疗时4然后建立相应的数学模型,利用相对有效性评价方法,建立分式规划模型并经过变换,转化为线性规划模型求解,对各年龄组患者在各阶段的治疗效率进行评价.计算结果:对第1年龄组疗法2和4在整个治疗中效率较高,在第4阶段仍然有效;对第2年龄组疗法1在第1,2阶段有效;对第3年龄组疗法1,2,3在第1阶段有效;对第4年龄组疗法1,2在第1,2阶段有效.表明只有2514岁的年4种轻患者,才能在治疗的最~后阶段仍然有有效的疗法.随后,由线性规划模型的对偶形式建立预测模型,对各年龄组各种疗法下一阶段的疗效进行预测.若由某决策单元得到的实际输出大于预测输出,则该决策单元相对有效;反之,说明该种疗法对该组患者在治疗的未来阶段不再有效,应该转换疗法.3 统计学建模方法在数学建模竞赛中,常常会涉及到大量的数据,因此,我们就需要用统计学建模方法对这些数据进行处理.此类方法主要包括统计分析、计算机模拟、回归分析、聚类分析、数据分类、判别分析、主成分分析、因子分析、残差分析、典型相关分析、时间序列等.如2004年A题“奥运会临时超市网点设计问题”,2004年B题“电力市场的输电阻塞管理问题”,2007年A题“人口增长预测问题”,2008年B题“大学学费问题”,2012年A题“葡萄酒的评价”等都用到了这种建模方法.在此选取其中两类方法进行阐述.3.1聚类分析3.1.1聚类分析的原理和方法该方法说的通俗一点就是,将n个样本,通过适当的方法选取m聚类中心,通过研究各样本和各个聚类中心的距离,选择适当的聚类标准,通常利用最小距离法来聚类,从而可以得到聚类.结果利用sas 软件或者spss 软件来做聚类分析,就可以得到相应的动态聚类图.这种模型的的特点是直观,容易理解.聚类分析的类型可分为:Q型聚类(即对样本聚类)和R型聚类(即对变量聚类).通常聚类中有相似系数法和距离法两种衡量标准.聚类方法种类多样,有可变类平均法、中间距离法、最长距离法、利差平均和法等.在应用时要注意,在样本量比较大时,要得到聚类结果就显得不是很容易,这时需要根据背景知识和相关的其他方法辅助处理.主要的方法步骤大致如下:(1)首先把每个样本自成一类;(2)选取适当的衡量标准,得到衡量矩阵;(3)重新计算类间距离,得到衡量矩阵;(4)重复第2步,直到只剩下一个类.3.1.2聚类分析应用实例例3.1(2012年高教社杯全国大学生数学建模竞赛A题)葡萄酒的评价.题目的附件中给出了某一年份一些葡萄酒的评价结果,和该年份这些葡萄酒的和酿酒葡萄的成分数据.要求参赛者建立数学模型解决以下问题:(1)分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信;(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级;(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系;(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量.问题求解过程分析由于题目具有开放性,故选择文献[4]中的求解思路分析.由于给定了酿酒葡萄的理化指标,首先可将附录2和附录3中的一些数据进行处理.并可以据此对各种酿酒葡萄进行聚类分析,但是,由于题目中所给的数据庞大,所以可通过主成分分析法,简化并提取大部分有效信息,再用聚类分析对酿酒葡萄进行分级.最后根据酿酒葡萄对应葡萄酒质量的平均值大小进行比较,排序分级.接下来针对问题中分析酿酒葡萄与葡萄酒理化指标之间的联系,及上面整理好的数据,采用回归分析原理,在SPSS中得到酿酒葡萄与葡萄酒的理化指标之间的联系.再通过相关分析,得出相应的相关系数,从而得到相应的判断结论.在分析酿酒葡萄与葡萄酒的理化指标之间的联系时,还用到了多元线性回归分析.该模型用于生活实践中,也可以解决很多实际问题.3.2回归分析回归分析是利用数据统计原理,对大量数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程,并加以外推,用于预测今后的因变量的变化的分析方法.3.2.1回归分析的原理与方法回归分析是在一组数据的基础上研究这样几个问题:建立因变量与自变量之间的回归模型;对回归模型的可信度进行检验;判断每个自变量对因变量的影响是否显著;判断回归模型是否适合这组数据;利用回归模型对进行预报或控制.回归分析主要包括一元线性回归、多元线性回归、非线性回归.回归分析的主要步骤为:(1)根据自变量和因变量的关系,建立回归方程.(2)解出回归系数.(3)对其进行相关性检验,确定相关系数.(4)当符合相关性要求后,便可与具体条件结合,确定预测值的置信区间.需要注意的是,要尽可能定性判断自变量的可能种类和个数,并定性判断回归方程的可能类型.另外,最好应用高质量的统计数据,再运用数学工具和相关软件定量定性判断.3.2.2回归分析应用实例例3.2(2006年高教社杯全国大学生数学建模竞赛B题)艾滋病疗法的评价及疗效的预测.题目同例2.1.问题求解过程分析由于题目具有开放性,故选择文献[3]中的求解思路进行分析.问题2的解决就用到回归模型.首先分析数据知,应建立时间的一次与二次函数模型,并经过统计分析比较,确定哪种较好.所以可建立一个统一的回归模型,也可对每种疗法分别建立一个模型.以总体回归模型为例,分别用一次与二次时间函数模型进行比较,可知疗法3~1用一次模型较优,且一次项系数为负,即4CD在减少,从数值看疗法3优于疗法2和1;疗法4用二次模型较优,即4t左右达到最大.可以通过4条回归CD先增后减,在20曲线进行比较,显示疗法4在30周之前明显优于其它.最后再用检验法作比较,结果是疗法1与2无显著性差异,而疗法1与3,2与3,3与4均有显著性差异.4 图论建模方法图论建模方法在建模竞赛中也经常涉及,应用十分广泛,并且解法巧妙,方法灵活多变.如1990年B题“扫雪问题”,1991年B题“寻找最优Steiner树”,1992年B题“紧急修复系统的研制”,1993年B题“足球队排名”,1994年A题“逢山开路问题”,1994年B题“锁具装箱问题”,1995年B题“天车与冶炼炉的作业调度”,1997年B题“截断切割的最优排列”,1998年B题“灾情巡视最佳路线”,1999年B题“钻井布局”,2007年B题“城市公交线路选择问题”等都应用到了图论的方法.图论近几年来发展十分迅速,在物理、化学、生物学、地理学、计算机科学、信息论、控制论、社会科学、军事科学以及计算机管理等方面都有着广泛的应用.因此图论越来越受到了全世界数学界和工程技术界乃至经营决策管理者的重视.同时也成为了数学建模中一种十分重要的方法.图论问题算法很多,包括最短路、最大流、最小生成树、二分匹配、floyd、frim等.。
高教社杯全国大学生数学建模竞赛B题参考答案.docx
交巡警服务平台的设置与调度优化分析摘要本文以实现警察的刑事执法、治安管理、交通管理、服务群众四大职能为宗旨,利用有限的警务资源,根据城市的实际情况与需求合理地设置了交巡警服务平台、分配各平台的管辖范围及调度警务资源。
并分别对题目的各问,作了合理的解答。
问题一:(1)、根据题目所给数据,确定各节点之间的相邻关系和距离,利用Floyd 算法及 matlab 编程求出两点之间的最短距离,使其尽量满足能在 3 分钟内有交巡警平台警力到达案发结点的原则,节点去选择平台,把节点分配给离节点距离最近的平台管辖,据此,我们得到了平台的管辖区域划分。
(2)、我们对进出该区的 13 条交通要道实现快速全封锁的问题,我们认定在所有调度方案中,某种方案中耗时最长的的围堵时间最短即最佳方案,利用 0-1 变量确定平台的去向,并利用线性规划知识来求解指派问题,求得了最优的调度方案。
(3)、在确定增添平台的个数和具体位置的问题中,我们将尽量保证每个节点都有一个平台可以在三分钟内到达作为主要原则来求解。
我们先找出到达每个平台的时间都超过三分钟的节点,并尝试在这些节点中选取若干个作为新的平台,求出合理的添加方案。
问题二:(1)、按照设置交巡警服务平台的原则和任务,分析现有的服务平台的设置是否合理,我们以各区覆盖率作为服务平台分布合不合理的评价标准,得到C、 D、 E、F区域平台设置不合理。
并尝试一些新的设置方案使得设置更为合理,最后以覆盖率最低的E 区为例,使用一种修改方案得到一个比原方案更合理的交巡警服务平台的设置方案。
(2)、追捕问题要求在最快的时间内抓到围堵罪犯,在罪犯和警察的行动速度一致的前提假设下,我们先设定一个具体较小的时间,编写程序检验在这个时间内是否可以成功抓捕罪犯,不行则以微小时间间隔增加时间,当第一次成功围堵时,这个时间即为最佳围堵方案。
关健字: MATLAB软件, 0-1 规划,最短路, Floyd 算法,指派问题一、问题重述“有困难找警察” ,是家喻户晓的一句流行语。
高教社杯全国大学生数学建模竞赛B题参考答案
交巡警服务平台的设置与调度优化分析摘要本文以实现警察的刑事执法、治安管理、交通管理、服务群众四大职能为宗旨,利用有限的警务资源,根据城市的实际情况与需求合理地设置了交巡警服务平台、分配各平台的管辖范围及调度警务资源。
并分别对题目的各问,作了合理的解答。
问题一:(1)、根据题目所给数据,确定各节点之间的相邻关系和距离,利用Floyd 算法及matlab编程求出两点之间的最短距离,使其尽量满足能在3分钟内有交巡警平台警力到达案发结点的原则,节点去选择平台,把节点分配给离节点距离最近的平台管辖,据此,我们得到了平台的管辖区域划分。
(2)、我们对进出该区的13条交通要道实现快速全封锁的问题,我们认定在所有调度方案中,某种方案中耗时最长的的围堵时间最短即最佳方案,利用0-1变量确定平台的去向,并利用线性规划知识来求解指派问题,求得了最优的调度方案。
(3)、在确定增添平台的个数和具体位置的问题中,我们将尽量保证每个节点都有一个平台可以在三分钟内到达作为主要原则来求解。
我们先找出到达每个平台的时间都超过三分钟的节点,并尝试在这些节点中选取若干个作为新的平台,求出合理的添加方案。
问题二:(1)、按照设置交巡警服务平台的原则和任务,分析现有的服务平台的设置是否合理,我们以各区覆盖率作为服务平台分布合不合理的评价标准,得到C、D、E、F区域平台设置不合理。
并尝试一些新的设置方案使得设置更为合理,最后以覆盖率最低的E区为例,使用一种修改方案得到一个比原方案更合理的交巡警服务平台的设置方案。
(2)、追捕问题要求在最快的时间内抓到围堵罪犯,在罪犯和警察的行动速度一致的前提假设下,我们先设定一个具体较小的时间,编写程序检验在这个时间内是否可以成功抓捕罪犯,不行则以微小时间间隔增加时间,当第一次成功围堵时,这个时间即为最佳围堵方案。
关健字: MATLAB软件,0-1规划,最短路,Floyd算法,指派问题一、问题重述“有困难找警察”,是家喻户晓的一句流行语。
2006年全国数学建模B题题目及优秀论文赏析
为了叙述的方便,我们把题目中所用的变量用下列参数来代替: Y1 :问题一中的 CD4 细胞计数;(个/ul)
Y2 :问题一中的 HIV 浓度:(单位不详) X :问题一中的周次数: Z1 :问题二中的按疗法一治疗的患者的 CD4 细胞计数;(个/ul)
Z 2 :问题二中的按疗法二治疗的患者的 CD4 细胞计数;(个/ul)
现在得到了美国艾滋病医疗试验机构 ACTG 公布的两组数据。 ACTG320(见附件 1)是同时服用 zidovudine(齐多夫定),lamivudine(拉美夫定)和 indinavir(茚地那韦) 3 种药物的 300 多名病人每隔几周测试的 CD4 和 HIV 的浓度(每毫升血液里的数量)。 193A(见附件 2)是将 1300 多名病人随机地分为 4 组,每组按下述 4 种疗法中的一种 服药,大约每隔 8 周测试的 CD4 浓度(这组数据缺 HIV 浓度,它的测试成本很高)。4 种疗法的日用药分别为:600mg zidovudine 或 400mg didanosine(去羟基苷),这两种药 按月轮换使用;600 mg zidovudine 加 2.25 mg zalcitabine(扎西他滨);600 mg zidovudine 加 400 mg didanosine;600 mg zidovudine 加 400 mg didanosine,再加 400 mg nevirapine (奈韦拉平)。
继续使用的疗效。由于这些数据是在随机分组的人群中获得的,所以我们假设这
些样本是独立的,这样我们就可以采用统计学中的多个独立样本的非参数检验
法,利用SPSS11.5软件中的多个独立样本比较秩和检验功能完成,运用
Kruskal-Wallis H Test和中位数检验法在统计学意义上给出每种疗法的相对疗
[整理]06年全国数学建模B题列车调度问题
2006年全国大学生数学建模竞赛夏令营题目(A、B、C三题任选一题)B题:铁路大提速下的京沪线列车调度我国铁路自1997年以来先后进行了5次大提速,以前客车的最高时速为60至80公里/小时,到2004年4月18日的第5次提速后,京沪等部分干线客车的最高时速达到了160至200公里/小时。
据悉,在2006年实施第6次大提速后,将使部分干线上运行客车的最高时速都提高到200公里/小时。
另外,我国在“十一五”期间将修建京沪高速客运专线铁路,计划运行初期的最高时速为300公里/小时(参看附件1)。
目前,我国铁路大都采用客货混运的机制,目前主要干线铁路客车最高时速可达160公里/小时,货车最高时速为80公里/小时,客车与货车的运行数量比例大约为5 :7。
根据铁路安全规程的要求,既有线路同方向相继列车的间隔时间不得少于7分钟。
京沪线是我国最繁忙的铁路线之一,贯通北京至上海,途经40多个城市,全长1463公里(参看附件2) 。
目前全线采用上行线和下行线独立双向运行方式,分别运行着175趟和176趟客车,最高时速160公里/小时,具体的车次和时刻表如附件3和附件4所示。
请你研究以下问题(第1,2题必须做,其它题中至少选做1个):(1)从京沪全线选择一个区间段,如济南至徐州,或南京至上海,根据现行的列车时刻表最多能安排多少趟货车,并制订出具体的“列车运行图”。
(2)对现行的列车时刻表进行分析,如果要在客流增加时(如春运和黄金周期间)在北京至上海、北京至南京、天津至上海、北京至合肥、北京至青岛间各增开一对临时客车,在不改变现行列车时刻表及尽量减少对货车影响的条件下,制订出临时客车的时刻表(只安排京沪线区间)及“列车运行图”(只考虑客车)。
(3)如果在即将实行的第6次大提速时将京沪线上的客车的最高时速提高到200公里/小时,货车的最高时速提高到120公里/小时,制订出相应的客车时刻表和“列车运行图”。
按照第1题选择的区间段进行估计,与提速前相比货车可以提高多少运力?(4)针对预计到2010年投入运行的京沪高速铁路客运专线(现京沪线用作货运),如果高速列车时速达到300公里/小时,普通列车提速到200公里/小时。
06年数学建模大赛获奖论文讲解(完整版)
• 关键词:Lagrange 、 条件极值法
• 1、模型假设 • 2、问题分析 • 3、模型的建立与求解
• 3.1 问题一
3.2问题二
3.2.2模型求解
• 2、理想模型求解 • 1)条件极值法
3.3问题三
• Lagrange乘子法和Matlab求解
3.4问题四
• 综上所述,在易拉罐体积一定的条件下,以总用料最少为 目标最优化模型建立如下:
模型建立分析
目标函数的构成
2)满意度指标的标准化:指派方法
3)资源优化配置模型的建立
• 在标准化处理的基础上综合加权得到资源优化配置的最终 优化模型
模型求解和结果分析
三种人力资源约束条件下各分社的所得书号数 分社序号 人力资源硬约束 人力资源无约束 工作能力提高20% 1 63 55 63 2 43 29 43 3 120 177 144 4 91 60 67 5 56 56 56 6 47 47 47 7 18 18 18 8 32 29 32 9 30 30 30
• 摘要:本文对易拉罐的最优设计主要从用料最省的角度
进行研究。首先运用多次测量求平均值的方法确定出易拉 罐的实际尺寸,然后分别就易拉罐为圆柱体和组合体(圆 柱体及圆台)两种情况进行研究。当易拉罐为正圆柱体时, 以圆柱体高度与半径的比例关系确定易拉罐形状符合最有 设计。当易拉罐为组合体时,以不同设计要求逐步改进, 求得易拉罐实际尺寸求得最优设计,最后降易拉罐上端的 圆台改为球台作为自己的最优设计。求解过程中主要用到 Lagrange乘子法、重积分、条件极值及数学软件 (Matlab 、Lingo)等。
2006年全国大学生数学建模竞赛
A题:出版社的资源配置 B题:艾滋病疗法的评价及疗效的预测 C题:易拉罐形状和尺寸的最优设计 D题:煤矿瓦斯和煤尘的监测和控制
(整理)高教社杯全国大学生数学建模竞赛b题.
(整理)⾼教社杯全国⼤学⽣数学建模竞赛b题.车道被占⽤对城市道路通⾏能⼒的影响摘要车道被占⽤是指因交通事故、路边停车、占道施⼯等因素,导致车道或道路横断⾯通⾏能⼒在单位时间内降低的现象。
由于城市道路具有交通流密度⼤、连续性强等特点,⼀条车道被占⽤,也可能降低路段所有车道的通⾏能⼒,即使时间短,也可能引起车辆排队,出现交通阻塞。
如处理不当,甚⾄出现区域性拥堵。
对于问题⼀,本⽂提⾼结果的精准度,结合两种⽅法进⾏研究,且两种⽅法的结果⼗分吻合。
由于实际通⾏能⼒是建⽴在基本通⾏能⼒和可能通⾏能⼒之上的,所以在求解实际通⾏能⼒之前,需要算出基本通⾏能⼒和可能通⾏能⼒,针对问题⼀创建了⼀张流程图,并借助软件加以拟合。
对实际通⾏能⼒计算,得出实际通⾏能⼒的变化过程,根据GREENSHIELD K-V线性算法得出道路越堵,车速越慢,则实际通⾏能⼒就越差,反之就会较好。
对于问题⼆,因为所占的车道不同,并且给的条件中有说明左转车流⽐例和右转车流⽐例不同,那只需验证两者是否存在显著性差异,运⽤配对样本t检验的⽅法就是要先满⾜这⼀⽅法的两个前提条件,⾸先必须验证是否满⾜正态分布,经过SPSS软件的验证可以得出符合正态分布。
然后再进⾏配对,从配对的结果中可以看出存在显著性差异,再结合左右转的车流量⽐例,更加可以看出存在显著性差异。
对于问题三,主要是对所推出来的回归⽅程的判断和分析因变量和各因⼦之间的关系,在本问中要先求出排队长度,排队长度是根据堵塞密度,进出车辆数之间的差值来求解,再根据最⼩⼆乘法来判断所假设的这⼀模型是否符合多元线性回归关系,本问中得出符合多元线性回归关系。
再在排队长度和最⼩⼆乘法的基础之上,运⽤SPSS软件,在进⾏结果分析时得出实际通⾏能⼒对于排队长度没有影响,所以可以剔除,⽽事故持续时间和上游车流量对排队长度都有明显的影响,然后得出他们的相关系数,求出最后的相关⽅程式。
对于问题四,题⽬中给出了事故发⽣点到上游路⼝的距离为140⽶,并且上游车流量为1500pcu/h,结合视频1中多次出现的120⽶这⼀个顶点,推算出120⽶内⼤概最⼤的堵塞车流量,然后按⽐例分配推算出140⽶的最⼤堵塞车流量,视频1中的可以通过加权平均来求出平均的实际通⾏能⼒,则事故持续时间就是要靠140⽶的最⼤堵塞车流量和平均实际通⾏能⼒来计算,最后得出事故持续时间为2.37min。
2006年数学建模B题题目即答案
4
3 图
果效和拟的 t 于关下体总在量数 4DC 是图下 2 图
�系关化变的 t 间时与量数 VIH 群人试测组个各是图下
5
。象现的加增弹反有再不并�少减的快较比量数的 4DC 得使强很性药 抗的 VIH 于由后之。烈剧要现出的值峰次一前比且并� �值峰次二第的少减 VIH 了现出 时同也此在�值峰的长增次二第到达将近附周 53 至�加增断不度速长增且并长增现出 又近附周 02 在�势趋少减的缓平较现出后之� �值峰次一第的少减 VIH 现出时同乎几此 在� 值峰的长增的次一第现出近附周 01 在将者患后疗治受接为果结的测预们我而因 。加增弹反有再在会不段时的后以在 。烈强动振次一第较值峰的次二第且并 �值谷波次两动波量数 VIH 了应对好正时此� 值峰 波次两了现出动波的间时随量数的 4DC 的内体者患�下案方疗治种此在�述所上综 。测预 和明说的利有了供提间时止终疗治佳最为时何定确在为图此而从�态状立对到达近附点 间时一同在本基值峰的者二且而�象现的长彼消此现呈 VIH 与 4DC 出看可中 3 图从 。加增剧急量数的 VIH 而从�用作生产再 不其对物药�强变性药抗的 VIH�近附周 53 在约大。少减的显明了有量数使�长增制抑 物药被又着接。长增慢缓的周 01 约大生产�性药抗了生产 VIH 但。用作的物药了到受 �少减的间时周 01 约大有 VIH �期初疗治在 �出看中图系关化变 t 间时与 VIH 上以从 。象现弹反生产再不�少减的剧急 4DC 的内体者患得使�性药抗的强够足了生产 VIH �右左周 53 到直 �象现弹反的期时疗治了现出 �值峰次二第了到达又右左周 02 了到 。长增的 4DC 了制抑 �用作药抗了生产的 VIH 于由是这 �缓放长增的后此但 。加增量数的 4DC 的内体使而从 �用作了生产毒病 VIH 的内体对物药于由是这 �长增显明的间时周十约 大段一有 4DC�期初疗治受接者患在�出看以可中图系关化变 t 间时与 4DC 上以从 4 图
2006年研究生数模竞赛B题优秀论文(1)
y x2 y2
, ,
cos
cos
x x2 y2
,
。
dy / dt (dx / dt ) 2 (dy / dt ) 2
dx / dt (dx / dt ) 2 (dy / dt ) 2
考虑这两个作用力分别在 x 轴 y 轴上的分量。由牛顿第二运动定律得到:
d 2x m F cos f cos dt 2 2 m d y F sin f sin dt 2
1 2.0000
另外由初值可以很容易的确定:
3 12.0004
4 1.0000
5 x(t0 ) 10
6 y(t0 ) 60
4.2.2
对于问题 2、3、4,我们利用(4)式,像问题 1 一样,能够算出
1 3 4 c , , , 2 2 2 2
本文对于问题 1 提出的人造地球卫星的运动过程进行了合理的假设,建立了一个偏 微分方程组的数学模型,即:
对 于 问 题 2 提 出 的 确 定 高 精 度 参 数 问 题 , 根 据 附 录 提 供 的 数 据 确 定 x(t ) , y (t ) 周 期 , 并 求 出
1 3 4 , , 的值,建立了以仿真值和观测值的方差为目标函数,以 2 k 为变量的优化模型.第一问 2 2 2
F
GMm x2 y2
,
其中
G 6.685 10 20 km 3 / kg s 2 为引力系数[2]。同时在运动轨道上每一点的即时速度在 x 轴
y 轴上的分量决定了航天器自身作用力与 x 轴正向夹角 的大小, 因此 和 的正弦和余
弦值就可以表达为:
全国大学生数学建模竞赛题目B题
B 题公交车调度
公共交通是城市交通的重要组成部分,作好公交车的调度对于完善城市交通环境、改进市民岀行状况、提高公交公司的经济和社会效益,都具有重要意义。
下面考虑一条公交线路上公交车的调度问题,其数据来自我国一座特大城市某条公交线路的客流调查和运营资料。
该条公交线路上行方向共14站,下行方向共13站,第3-4页给岀的是典型的一个工作日两个运行方向各
站上下车的乘客数量统计。
公交公司配给该线路同一型号的大客车,每辆标准载客100人,据统计客车在该
线路上运行的平均速度为20公里/小时。
运营调度要求,乘客候车时间一般不要超过10分钟,早高峰时一般
不要超过5分钟,车辆满载率不应超过120%,一般也不要低于50%。
试根据这些资料和要求,为该线路设计一个便于操作的全天(工作日)的公交车调度方案,包括两个起点
站的发车时刻表;一共需要多少辆车;这个方案以怎样的程度照顾到了乘客和公交公司双方的利益;等等。
如何将这个调度问题抽象成一个明确、完整的数学模型,指岀求解模型的方法;根据实际问题的要求, 如果要设计更好的调度方案,应如何采集运营数据。
2006年全国研究生数学建模赛试题B题确定高精度参数问题
2006年全国研究生数学建模赛试题B题确定高精度参数问题通过对此生态系统的观测,可以得到相关的观测数据。
观测数据的格式依次为:观测时刻 、A 生物数目 、B 生物数目二:请利用有关数据,解决以下问题:1) 在观测数据无误差的情况下,若已知 ,求其它5个参数 ?有关数据见数据文件:DATA1.TXT2) 在观测数据无误差的情况下,若 也未知,问至少需要多少组观测数据,才能确定参数 ?有关数据见数据文件:DATA1.TXT3) 在观测资料有误差(时间变量不含有误差)的情况下,请分别利用观测数据DATA2.TXT和DATA3.TXT ,确定参数 在某种意义下的最优解,并与仿真结果比较,进而改进你们的数学模型。
4) 假设连观测资料的时间变量也含有误差,试利用数据DATA4.TXT ,建立数学模型,确定参数 在某种意义下的最优解。
2007-8-920:39 #1Jxh助理工程师精华 0积分 39帖子 20水位 39技术分 0DATA1: 0 10. 60. 0.1 11.750840650304518 0.1374480266382216 0.2 3.4133367257849176 7.108705996120129 0.30000000000000004 20.80921881438798 0.4251595082899424 0.4 5.231982481945481 0.7182384931413827 0.5 26.925221604818102 26.706603701525214 DATA2: 0 12.962285633035274 72.12301583344777 0.1 7.556010311240527 71.67657541335356 0.2 5.012389496575022 48.239184640645720.30000000000000004 4.11510116028063927.7065260633840220.4 4.157519511393944 15.7712968033598920.5 4.371214882341812 8.547547743268050.6000000000000001 5.097347946012937 5.0533632045674950.7000000000000001 6.017742223373778 3.4273300696673940.8 7.041180927636311 1.85245108531435370.9 8.603101382298291 2.07977263131646241. 10.243977668713889 1.97011117744324761.1 12.155776405252205 1.95310506352422331.2000000000000002 14.667014315962746 3.16106675602404331.3 17.46397599812083 5.347913853436341.4000000000000001 19.357223394944807 11.7637111023637061.5 19.3156720070885 31.6780078052271851.6 14.487632014190856 66.162466730441741.7000000000000002 8.378050815567198 75.209889621075221.8 5.286781699620561 53.670387978434511.9000000000000001 4.209401208819748 31.4211719632698772. 4.252073268847241 17.7695436914564942.1 4.336218949010566 9.9584238388243062.2 5.01407876566076 5.3871506796545962.3000000000000003 5.761322806227691 4.0407265520411182.4000000000000004 6.904591285302763 2.30208030484945342.5 8.029183436113223 2.1682553079086322.6 9.808500775491309 1.759479732993372.7 11.824255106266216 2.30150021469667232.8000000000000003 14.125625********* 2.2670987462774062.9000000000000004 16.928718095096954 4.3712059553193. 19.234742244833953 9.8673633211949533.1 19.58639225876244 25.6108576265580553.2 16.168067021040613 58.776788747675163.3000000000000003 9.66855026899961 76.871996440830123.4000000000000004 5.78236129521373 59.579863243155723.54.438941572542834 35.6495649180838263.64.120640880446572 20.1952614459282783.74.351141607554163 11.3292168094677023.80000000000000034.922725179743356 6.3502528590626223.9000000000000004 5.7219127404920323.96441268588860534. 6.422264401423927 2.58239985470918844.1000000000000005 7.823773088120576 2.09944674950054874.2 9.5097714495178 1.91550285326703684.3 11.309568078854788 1.99595378648662614.4 13.501604217754213 2.1910170627115554.5 15.960123870287324 3.80634988376897134.6000000000000005 18.70494484847073 8.241824322691874.7 19.76582048146061 20.524894*********4.800000000000001 17.160640000074363 50.526206577550374.9 10.816844928464159 76.721785356798965. 6.484858582616242 64.88423741778265.1000000000000005 4.365455644022846 41.061577741074255.2 4.027548337138961 23.460638446276415.300000000000001 4.251735243160616 13.142805432867885.4 4.707556823744789 7.4240247730994615.5 5.541728794448667 4.621348*********5.60000000000000056.442185554956649 2.88829415809877475.7 7.464414758706364 1.95308146045405565.800000000000001 9.121081535461231 1.66069885500772665.9 11.018852575055812 1.51778865496089036. 13.080596077668527 1.93357564419779186.1000000000000005 15.58148230994088 3.4228833957300716.2 18.209885846950606 6.5567674916557076.300000000000001 19.7900612093532 16.5712448149287336.4 18.37052862429037 42.1596846941783456.5 12.305194621801098 74.13443093591386.60000000000000057.1167307281114764 69.814006086545736.7 4.853162705467164 45.7975325757606846.800000000000001 4.04382725097715326.322005100238396.9 4.247969239071056 14.477418578893067. 4.58912147411644 8.3574066287477167.1000000000000005 5.025644394725934 5.15255190422507257.2 6.06964524619881 2.76760522689029557.300000000000001 7.2961648212726375 2.5575131832634437.4 8.662885286326063 1.82697568911566887.5 10.258313521981226 1.7424399838777857.6000000000000005 12.489849771812166 1.99804879739930497.7 14.967092571068736 2.72465919137255337.800000000000001 17.53332958297117 5.84211754691024957.9 19.616207186734766 13.2330573447132758. 19.211306146310125 34.641672608142358.1 13.65472999143543 69.090821912748488.200000000000001 8.044129725356475 73.84237466874478.3 5.12741798382609 51.7281821711764858.4 4.233329067117866 30.069017652378738.5 4.3729531646764475 16.7120585084619048.6 4.4166812644699665 9.475403270948138.700000000000001 5.088145882448873 5.8363157366888688.8 5.89644378527204 3.50498062739973778.9 6.869685307643319 2.67254564947812779. 8.42095238453697 2.28140583448015959.1 10.129175103225677 2.10022248526283669.200000000000001 11.983853870135562 2.1062549435826319.3 14.361708860747354 2.657241788720799.4 16.976762555030923 5.0433570801974759.5 19.139232032931577 10.891684706900819.600000000000001 19.574774202808545 28.105011890527349.700000000000001 15.234523560854228 62.1646532870251049.8 9.077595947541397 76.56975255823029.9 5.634610558908647 56.8564577584114910. 4.507965319058354 33.7847590816388110.100000000000001 4.099287735942571 18.68531615209308310.200000000000001 4.338698090764137 10.74327688122273410.3 4.866285571980089 6.41659680854365510.4 5.6264177151197465 4.0751075390481610.5 6.689604121178981 2.560232952671831710.600000000000001 7.9702953611906056 2.112476*********10.700000000000001 9.59301437319481 1.599522550799718210.8 11.317979448817825 1.938264764636774810.9 13.709351742164005 2.821747169098220511. 16.37977758765754 4.07716160246989711.100000000000001 18.74294559792725 8.74933512855698411.200000000000001 19.828501269755066 22.85517340813177611.3 16.741546943877854 53.92871343716003511.4 10.281464554754278 76.8008070352465811.5 6.054818398422438 62.6595643390084811.600000000000001 4.460109692883834 38.9729456028811111.700000000000001 4.16944277209851 21.8952219078251111.8 4.136013256694909 12.34992436682675711.9 4.752556283927288 6.792569159789473512. 5.42709723383035 4.42442830569848312.100000000000001 6.487687907909313 3.042206589484557412.200000000000001 7.683804986033973 2.148586186091081512.3 9.085972429338954 1.694624187078992412.4 11.11654662282097 1.469108463003258712.5 13.30659951395088 2.497991644221227312.600000000000001 15.720570394420344 3.92660237275731812.700000000000001 18.331755163639055 7.330343005638356512.8 19.78238872627243 18.08457192675023312.9 17.947288956594498 45.4775251344650913. 11.715284801948428 75.7584973759790213.100000000000001 6.8592110525043255 68.1443385021871813.200000000000001 4.6969839892991665 43.90140869192186613.3 4.077581791351397 24.96638341123919613.4 4.130558249250161 14.05906705493637813.5 4.510322307526262 7.80742641040896313.600000000000001 5.2970316286182514.62160470448556513.700000000000001 6.2230768586480672.716599000257642313.8 7.479887363387733 2.072970960575202713.9 8.822720207354518 1.744653346124118514. 10.695564283991134 1.583755077945168614.100000000000001 12.6831855584234732.216240996096263214.200000000000001 15.2464485459687683.146918098489283714.3 17.905061607976997 5.91868325364012614.4 19.782655339761774 14.75153506668444914.5 18.74927378895725 37.6637572927126514.600000000000001 13.12966808402839771.3511339607706514.700000000000001 7.56964105825282172.6892650048387914.8 5.18496546094971 49.2690473173594914.9 4.222588637897196 28.44244806503853315. 4.281998883486133 15.9895633616972222006年全国研究生数学建模赛试题B题确定高精度参数问题题目:确定高精度参数问题包括“神舟六号”载人航天宇宙飞船、人造地球卫星等航天器围绕地球在轨运行的过程中,要受到很多力的作用,其中主要的是地球万有引力和航天器发动机作用力。
2006全国大学生数学建模竞赛题目(B题)
2006全国大学生数学建模竞赛题目-----------------------------------------------------------B题: 艾滋病疗法的评价及疗效的预测艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。
艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”, 英文简称HIV)引起的。
这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。
人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。
艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。
迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。
许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。
现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据。
ACTG320(见附件1)是同时服用zidovudine(齐多夫定),lamivudine(拉美夫定)和indinavir (茚地那韦)3种药物的 300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。
193A(见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。
4种疗法的日用药分别为:600mg zidovudine 或400mg didanosine(去羟基苷),这两种药按月轮换使用;600 mg zidovudine 加2.25 mg zalcitabine(扎西他滨);600 mg zidovudine加400 mg didanosine;600 mg zidovudine加400 mg didanosine,再加400 mg nevirapine(奈韦拉平)。
全国大学生数学建模竞赛B题全国一等奖论文
全国大学生数学建模竞赛B题全国一等奖论文IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】碎纸片的拼接复原【摘要】破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。
本文主要解决碎纸机切割后的碎纸片拼接复原问题。
针对第一问,附件1、2分别为沿纵向切割后的19张中英文碎纸片,本文在考虑破碎纸片携带信息量较大的基础上,利用MATLAB对附件1、2的碎纸片图像分别读入,以数字矩阵的方式进行存储。
利用数字矩阵中包含图像边缘灰度这一特征,本文采用贪心算法的思想,在首先确定原文件左右边界的基础上,以Manhattan 距离来度量两两碎纸片边界差异度,利用计算机搜索依次从左往右搜寻最匹配的碎纸片进行横向配对并达成排序目的。
最终,本文在没有进行人工干预,成功地将附件1、2碎纸片分别拼接复原,得到复原图片见附录、,纵切中文及英文结果表分别如下:心思想仍为贪心算法,整体思路为先对209张碎纸片进行聚类还原成11行,再对分好的每行进行横向排序,最后对排序好的各行进行纵向排序。
本文在充分考虑汉字与拉丁字母结构特征差异以及每块碎纸片携带信息减少的基础上,创新地提出一种特征线模型来分别描述汉字及拉丁文字母的特征用于行聚类。
对于行聚类后碎片的横向排序,本文综合了广义Jaccard系数、一阶差分法、二阶差分法、Spearman系数等来构建扩展的边界差异度模型,刻画碎片间的差异度。
对于计算机横向排序存在些许错误的情况,本文给出了人工干预的位置节点和方式。
对于横向排序后的各行,由于在一页纸上,文字的各行是均匀分布的,本文基于各行文字的特征线,在确定首行的位置后,估计出其他行的基准线位置,得到一页的基准线网格,并通过各行基准线在基准线网格上的适配实现纵向的排序。
最终,本文成功的将附件3、4碎纸片分别拼接复原得到复原图片及结果表见附录、、、,同时本文给出了横向排序中人工干预的位置节点和方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
<0.0001 0.0006 0.0702 0.7761
• R2=0.3528~在z的变化中只有35%是由x决定的 • p值大于0.05~在常用的置信度=5%下该模型没有显著意义 • a2的置信区间包含零点~a=0落在置信水平为95%的区间内 若x=5.5 预测值 y=2.1113, z=2.1165 z的预测没有什么价值!
一般地说,多项式拟合不要超过3次,对于 本题如果用统计检验做显著性分析,可以 发现多数情况是以时间的2次多项式为好
4.只按照图形做直观的定性判断,不做定量分析 为了比较4种疗法的优劣,对每种疗法的CD4 (或取平均)做散点图, 或折线(散点连线)图, 直观地比较疗法的优劣 • 没有普遍的指导意义,对于其它问题或数 据,这样做不一定能得到结果 • 一种疗法的CD4散点图(或折线图)在另一种疗 法的上面, 从统计意义上并不能表明其显著性
论文中出现问题的评析
1.只做数据拟合,不做统计检验。
最小二乘拟合: 已知一组数据(xk,yk), k=1,2,…,n 和一个形式已定、 参数待定的模型(曲线)y=f(x, ), 确定参数使 数据与模型在误差平方和最小的意义下拟合得最好。 有现成的计算公式和软件确定参数 用回归分析方法做统计检验: 得到的模型有无显著意义,它的置信度多大,用 它作预测时准确程度如何。
问题(1) 利用附件1的数据,预测继续治疗的效果, 或者确定最佳治疗终止时间。
分析数据
700 600
如随机取20个病人,画出他们CD4和 HIV浓度随时间变化的图形(折线),
6.5 6
CD4
500 400 300 200 100
5.5 5 4.5 4 3.5 3 2.5 2
HIV
0
0
10
20
30
40
附件1 ACTG320数据 同时服用3种药物的300多名病人每隔几周测试的CD4和HIV的浓度。 第1列是病人编号,第2列是测试CD4的时刻(周),第3列是测得 的CD4(乘以0.2个/ml),第4列是测试HIV的时刻(周),第5列 是测得的HIV(单位不详)。 PtID CD4Date CD4Count RNADate VLoad 23424 0 178 0 5.5 23424 4 228 4 3.9 23424 8 126 8 4.7 23424 25 171 25 4 23424 40 99 40 5 23425 0 14 0 5.3 23425 4 62 4 2.4 23425 9 110 9 3.7 23425 23 122 23 2.6 23425 40 320
计算b0i ,b1i ,b2i的均值和均方差,用均值可得CD4的最大
点和HIV的最小点。 可对CD4统计b2i<0, b1i>0(存在正最大点)及b2i>0 (不存在最大点)的频率,分别作为及时结束治 疗与继续治疗的概率;也可用它们的均值和均方 差在确定分布下计算这些概率。
3) 纵向数据回归模型 将模型 yij=b0i+b1itij+b2itij2 的系数分解: bki=bk+ik(k=0,1,2),设ik服从零均值正 态分布,利用极大似然估计可以得到bk的 估计值及ik的方差。 bk的估计值用于计算CD4的最大点和HIV的最小 点,它与ik的方差一起可以在正态分布假定下 计算及时结束治疗与继续治疗的概率。
0
0.5
1
1.5
2
2.5
3
3 2.5 2 1.5 1 0.5 0 -0.5
0
0.5
1
1.5
2
2.5
3
3.拟合过度
用4次、5次甚至更高次数的多项式作拟合 • 数据的起伏是由与时间本身无关的其它随机因 素引起的,不应该用增加时间的高次项来拟合
• 注意拟合与插值在应用场合的差别 • 适用本题的显然是拟合而非插值
2)假设检验
做疗法有无显著性差异的两两比较:
用1个0-1变量构造两种疗法的统一模型,可
以用t检验作回归系数是否为零的假设检验。 结果是疗法1与2无显著性差异,而疗法1与3, 2与3,3与4均有显著性差异。 3)方差分析
疗法是必选的因素,如果还考虑年龄和初始
状态,用双因素分析则比较复杂,可以先按 这些因素分类,再做疗法的单因素分析。
请你完成以下问题: (1)利用附件1的数据,预测继续治疗的效果,或者确定 最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果 认为继续服药效果不好,则可选择提前终止治疗)。 (2)利用附件2的数据,评价4种疗法的优劣(仅以CD4 为标准),并对较优的疗法预测继续治疗的效果,或者确定最 佳治疗终止时间。 (3) 艾滋病药品的主要供给商对不发达国家提供的药品价 格如下:600mg zid. 1.60美元,400mg did. 0.85美元,2.25 mg zal. 1.85美元,400 mg nev. 1.20美元。如果病人需要考 虑4种疗法的费用,对(2)中的评价和预测(或者提前终止) 有什么改变。
附件2 193A数据 1300多名病人按照4种疗法服药大约每隔8周测试的CD4浓度。 第1列是病人编号,第2列是4种疗法的代码: 第3列是病人年龄,第4列是测试CD4的时刻(周),第5列是测 得的CD4,取值log(CD4+1). ID 疗法 年龄 时间 Log(CD4 count+1) 1 2 36.4271 0 3.1355 1 2 36.4271 7.5714 3.0445 1 2 36.4271 15.5714 2.7726 1 2 36.4271 23.5714 2.8332 1 2 36.4271 32.5714 3.2189 1 2 36.4271 40 3.0445 2 4 47.8467 0 3.0681 2 4 47.8467 8 3.8918 2 4 47.8467 16 3.9703 2 4 47.8467 23 3.6109 2 4 47.8467 30.7143 3.3322 2 4 47.8467 39 3.0910
两个模型的结果一样,但是可靠性和准确性一样吗?
需要做统计检验!
决定系 数 R2 y=a1x 0.9985 +b1 z=a2x 0.3528 +b2
F值 5294 4.361
p值
剩余方 a的置信区间 差 2 [0.1950, 0.2077] [-0.0211, 0.4262]
b的置信区间 [0.9699, 1.0381] [-0.1915, 2.1966]
作为数学建模题目应该给出定量的处理方法!
5.双指标处理不当 对于CD4和HIV两个指标的处理,常用的方法是用 某种函数形式将二者结合在一起. 由于CD4越大越好,HIV越小越好,一些同学取二 者之差或二者之商为综合指标 . 这样简单处理的问题在于,这两个指标量纲不同, 数量级差别较大. 恰当的办法是,先分别将其归一化(如将数值 变换到0-1之间),然后取加权平均 .
50
60
1.5
0
10
20
30
40
50
CD4大致有先增后减的趋势,HIV有先减后增 的趋势,启示应建立时间的二次函数模型 若先用一次模型,应与二次模型做统计分析比较
建立模型
有以下形式的回归模型(一次
与二次模型比较,二次较优):
1) 总体回归模型 用全部数据拟合一个模型,如
yij=b0+b1tij+b2tij2,tij,yij分别为第i病人第j次测量的
简
例
数据(x,y):x=0, y=0:0.05:2; x=1,y=1:0.05:3; x=2,y=0,2, 在图上共84个点。
3 2.5 2 1.5 1 5 0 -0.5
对数据(x,y)拟合一条直线, 得y=0.7647x+1.0784 先在x=0,1,2对y取平均得到3个 点, 再拟合直线,得y=1.3333 取平均后的3个点在做拟合时的 权重相同; 但是x=0,1的点都是 41个数据的平均值, 而x=3的点 只是2个数据的平均值
简
x y
例
0 1.04 1 1.22 2 1.38
最小二乘拟合
3 1.59 4 1.80 5 1.99 6 2.21 7 2.39 8 2.65 9 2.83
z
0.28
y
0.61
2.19
2.56
2.49
1.17
z
3.17
1.29
2.11
3.27
x
x
y=a1x+b1=0.2013x+1.0040
z=a2x+b2=0.2025x+1.0025
6. 对其它建模方法的评价
微分方程 层次分析 时间序列 灰色系统预测 模糊评价 神经网络
预测区间 y:[2.0621,2.1606] ,z:[0.3899,3.8432],
2.对原始数据先取平均,再用平均值做拟合 数据中大多数病人的测试时间是0,4,8,…(周), 个别病人是5,7, …(周),为了得到CD4(或HIV) 的变化趋势,先在每个时间点上对CD4取平均, 再用平均值做拟合. 这样做有什么问题呢? 注意:有的时间点上有上百个病人的CD4, 而有的时间点上只有几个病人的CD4。
全国大学生数学建模竞赛
2006年B题
艾滋病疗法的评价 及疗效的预测
艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现 以来的20多年间,它已经吞噬了近3000万人的生命。 艾滋病的医学全名为“获得性免疫缺损综合症”,英文简 称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”, 英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体 丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫 系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被 HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导 致AIDS发作。 艾滋病治疗的目的,是尽量减少人体内HIV的数量,同 时产生更多的CD4,至少要有效地降低CD4减少的速度,以提 高人体免疫能力。