2012数学建模深圳杯A答案
2012年全国大学生数学建模竞赛A题国一
摘要
在问题一中,首先根据 T 检验、方差显著性检验和 Wilcoxon 秩和检验对两组评酒 员给葡萄酒的评价结果的差异的显著性检验。在大多数评酒员评分可靠的假设下,分别 利用评分方差比较模型,说明第二组结果可靠。在此基础上引入了评酒员“失误度”概 念来衡量每位评酒员与所有评酒员总体评价的差异, 对各组失误度求和得到第二组结果 更可靠。为了进一步优化评酒员评分,利用根据失误度对评酒员排序,跨组选取失误度 最小的 10 位评酒员组成新的评分组,其平均值认为比第二组更可靠,作为整个文章中 评价葡萄酒质量的标准指标。 在问题二中,由于红、白葡萄的理化指标有较大差异,分开考虑红白两种葡萄酒: 对于红葡萄酒,对应问题一得出的葡萄酒质量指标,从三个角度,即外观分析(又分为 由大分子因子决定的澄清度和基于 LAB 色彩模型的色调考虑到指标间存在的竞争关系 采用非线性回归分析和逐步回归分析) 、香气分析(Fisher 线性判别分析)和口感分析 (主成分分析和因子分析) ,后进行异常点检验,逐一剔除异常点来求解酿酒葡萄的量 化指标。对于白葡萄酒的三个指标采用 Fisher 判别分析求解。最后将三个方面得分加权 平均得到酿酒葡萄量化的总分,进行聚类分析,根据聚类分析结果将红葡萄和白葡萄各 分为四级。 在问题三中,为研究酿酒葡萄与葡萄酒的理化指标之间的联系,将葡萄酒的理化指 标用酿酒葡萄的理化指标来表示。根据指标间的相关性,剔除部分相关性不强的指标, 选择部分相关性较好的酿酒葡萄的指标作为自变量, 对不同的葡萄酒指标分别进行多元 线性回归、逐步回归和回归检验。根据指标本身的特点及 AIC 信息统计量,剔除不显著 的自变量,而达到用尽量少的葡萄的理化指标来表示葡萄酒的理化指标的目的。在求解 过程中,建立典型相关分析模型来分析红葡萄酒色泽指标间的关系,利用主成分分析将 白葡萄的多个指标综合为少数几个主成分,再进行回归分析。模型求解结果显示,葡萄 酒的每个指标都能用部分葡萄的指标来线性表示,且具有较好的拟合效果。 在问题四中,为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,结合问 题一、二、三的结果以及理化指标和芳香物质的化学意义,综合评估各个广义上的理化 指标(附件二和附件三) ,针对红葡萄酒和白葡萄酒的区别分别在酿酒葡萄和葡萄酒的 理化指标中选取对葡萄酒质量影响较大的指标, 通过线性回归分析将理化指标和葡萄酒 质量进行拟合,从而得出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。为进一步 论证结果,首先,对模型进行残差分析以及拟合情况分析;其次,用分组样本检验方法, 将白葡萄酒的 28 个样本数据分成两组,采用用一组进行拟合,另一组进行结果回带分 析的方式,进一步论证用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的可靠性。通过 论证分析得出结论:葡萄和葡萄酒的理化指标可以用来评价葡萄酒的质量,但也有其不 足之处,如当从葡萄酒食用性方便角度考虑,用评酒员评价方法就更直接。 关键词:葡萄酒质量 识别聚类 失误度 非线性回归 逐步回归 Fisher 判别分析 主成 分分析 因子分析 显著性检验 残差分析 异常点检测
2012全国大学生数学建模A题
一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析2.1 对问题一的分析该评酒员分为第一组和第二组两组,其中每组有10人分别对红葡萄酒和白葡萄酒进行品尝,并对各酒样品的外观、香气、口感和平衡/整体各方面进行评分。
由于每个品酒员自己本身上的差异,存在着主观误差,为避免评酒员主观上的误差,本文去掉最高分和一个最低分,然后再计算出各组品酒员对各样品酒的平均分。
这样得到的数据更具准确性。
2.2 对问题二的分析根据附件二酿酒葡萄的理化指标和葡萄酒的质量利用之成分分析,选用酿酒葡萄的一级指标,对多次测试的,我们取其平均值。
利用matlab软件实现其主成分分析,具体程序可见附录一。
最后,可到各个酿酒葡萄的排名和得分情况,再取一些分数值就可以对酿酒葡萄进行分类了。
2.3对问题三分析在问题二中对酿酒葡萄进行了分类,我们选用一级酿酒葡萄和葡萄酒来进行相关性分析。
由于酿酒葡萄和葡萄酒的理化指标过多,所以我们选用一级指标进行分析。
又根据文献3对酿酒葡萄选用VC含量、多酚氧化酶活力、总酚、总糖、还原糖、可溶性固形物、固酸比来进行分析。
利用spss软件进行相关性分析,得到酿酒葡萄和葡萄酒的相关性表,分析总结就可得到它们之间的联系。
深圳杯数学建模A题答案之欧阳道创编
摘要深圳作为中国经济发展的重点城市,人口与医疗问题已经成为我们的焦点话题,是一个复杂的系统工程。
本文针对深圳地区人口年龄分布情况,外来务工人员的数量,从实际出发,在基于一些合理简化假设的基础上,建立数学模型,并充分利用matlab 等软件简化计算,对相关问题进行了有针对性的求解。
在预测未来十年深圳常住人口时,我们运用了matlab 一元线性回归对近十年的数据进行了多次拟合,并对这些拟合进行了比较得出深圳常住人口模型公式为:2() 1.00050.00838.1671Q x e x x =+-+,通过拟合预测出了未来十年深圳市常住人口的数量,同时在网上2000年到2010年的人口结构的数据,通过Leslie 矩阵预测出了未来十年人口结构的分布。
通过分析深圳近人口数量和人口结构的变化,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求呈线性递增趋势。
同时选取了高血压,脑出血,癌症这三种疾病进行预测,运用matlab 最小二乘法散点拟合,得出这三种疾病的发展趋势,由此预测出未来十年这三种疾病的就医的床位需求。
关键词:matlab、一元线性回归、Leslie、最小二乘法、床位需求一、问题重述从深圳的人口的结构来看,显著的特点是流动人口远远超过户籍人口,且年轻人口占主绝对优势。
流动人口主要从事第二、三产业的企业一线工人等。
年轻人身体好,发病少,导致深圳目前人均医疗设施低于全国类似城市平均水平,但仍能满足现有人口的就医需求。
然而,政策的调整与世界的推移会使深圳市老年人增加。
产业结构的变化也会影流动人口的数量。
直接会导致深圳市未来的医疗需求的变化。
现有人口社会发展模型在面对深圳情况时,难以满足人口和医疗预测的要求。
为了解决此问题,请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况(医疗设施、医护人员结构等方面)收集数据、建立针对深圳具体情况的数学模型,预测深圳未来的人口增长和医疗需求,解决下面几个问题:1.分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;2.根据深圳市人口的年龄结构和患病情况及所收集的数据,对几种病进行预测,在不同类型的医疗机构就医的床位需求。
2012年数学建模A题
葡萄酒质量评定模型摘要葡萄酒质量的评定长久以来都是采用聘请品酒员,通过品酒员对葡萄酒各项指标打分求和来确定葡萄酒的质量。
葡萄酒的价格因品酒员评分高低的不同有显著的差别。
然而在这样的评定方式中人的主观因素对酒质量的评定占主导地位,葡萄酒质量的评定结果存在较大的不确定性。
随着人们对葡萄酒消费的增加及高质量化的追求,建立合理、规范、客观的葡萄酒质量评定模型显得尤为重要。
根据题中给出的相关数据,通过解决以下问题建立葡萄酒质量评定模型。
对于问题一:首先,将题目附录1中的数据经Excel处理,得到每组评酒员对每种酒样品的总分。
然后,对每一种酒样品运用两配对样本的非参数检验(符号秩和检验)对数据进行显著性差异分析,运用MATLAB软件比较各酒样品的两组数据发现两组结果差异显著。
其次,通过Excel求出每一种酒的品酒员所打总分的方差,得到两组品酒员分别对两类葡萄酒的方差走势图(见图1.1、1.2),根据总体方差最小,方差波动较小,确定第二组品酒员的评分更可信。
最后,采用SPSS软件作进一步检验,结果相同即模型合理。
对于问题二,选取一级理化指标作为酿酒葡萄分级参考,对理化指标运用主成分分析法降维,通过MATLAB计算得到红葡萄的主成分有8个,白葡萄的主成分有11个。
综合评分得到的葡萄酒质量影响,红葡萄的影响因素有9个,白葡萄的影响因素有12个。
然后,利用折衷型模糊决策模型,考虑到由主成分分析方法得到的酿酒葡萄的的主成分值在反应酿酒葡萄质量好坏问题上会有一定的偏差,利用三角模糊的表达方式对主成分指标值进行表示,分别将红、白两类酿酒葡萄按隶属度大小排序,在运用聚类分析的方法,利用SPSS软件将葡萄划分为五个等级(见表格2.1)。
对于问题三,数据的庞杂是解决该问题的难点。
我们运用问题二中的主成分分析方法将理化指标转化为几个主成分,并运用MATLAB编程求出具体的主成分数值,然后建立线性回归模型,求解出酿酒葡萄与葡萄酒理化指标主成分之间的相关关系,从而反映出酿酒葡萄与葡萄酒理化指标之间的联系。
2012数模国赛a题
2012数模国赛a题摘要:一、问题的背景和重要性1.2012 年数学建模国赛简介2.问题A 的出题背景和现实意义二、问题A 的具体内容1.问题A 的题目描述2.问题A 的关键词和难点分析三、解题思路和方法1.对问题A 的题目描述进行理解和抽象2.确定问题A 的研究目标和关键变量3.选择合适的数学模型和计算方法4.对计算结果进行分析和解释四、解题过程中的注意事项1.时间分配和团队合作2.对题目描述和计算方法的理解和选择3.对计算结果的分析和解释五、结论和建议1.对问题A 的解答和总结2.对数学建模竞赛的建议和展望正文:一、问题的背景和重要性2012 年数学建模国赛是我国高校数学建模竞赛中的一项重要赛事,旨在通过解决实际问题,提高学生的数学应用能力和创新能力。
问题A 是本次竞赛中的一道具有现实意义的问题,涉及到城市交通、人口流动等多个方面,对于提高学生的问题分析和解决能力具有很好的促进作用。
二、问题A 的具体内容问题A 的题目描述为:“假设某城市有N 个小区,每个小区的人口数量为P,小区之间的出行需求通过M 条道路连接。
现有一批居民需要从一个小区A 出发,到达另一个小区B。
请问如何规划这些居民的出行路线,使得总的出行时间最短?”三、解题思路和方法首先,我们需要对题目描述进行理解和抽象,明确题目中的关键变量和目标。
在本题中,关键变量包括小区的人口数量、道路的连接情况、居民的出行需求等,目标是最小化居民的出行时间。
其次,我们需要选择合适的数学模型和计算方法。
对于此类问题,常用的方法有最小生成树算法、最短路径算法等。
在本题中,我们选择了Dijkstra 算法来求解最短路径。
最后,我们需要对计算结果进行分析和解释。
在本题中,我们通过计算得到了每个小区到目标小区的最短出行时间,并对结果进行了分析和解释。
四、解题过程中的注意事项在解题过程中,我们需要注意时间分配和团队合作。
由于数学建模竞赛的时间有限,我们需要合理安排时间,确保每个步骤都能按时完成。
2012年
2012年“深圳杯”全国大学生数学建模夏令营A题:深圳人口与医疗需求预测深圳是我国经济发展最快的城市之一,30多年来,卫生事业取得了长足发展,形成了市、区及社区医疗服务系统,较好地解决了现有人口的就医问题。
从结构来看,深圳人口的显著特点是流动人口远远超过户籍人口,且年轻人口占绝对优势。
深圳流动人口主要是从事第二、三产业的企业一线工人和商业服务业人员。
年轻人身体强壮,发病较少,因此深圳目前人均医疗设施虽然低于全国类似城市平均水平,但仍能满足现有人口的就医需求。
然而,随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响外来务工人员的数量。
这些都可能导致深圳市未来的医疗需求与现在有较大的差异。
未来的医疗需求与人口结构、数量和经济发展等因素相关,合理预测能使医疗设施建设正确匹配未来人口健康保障需求,是保证深圳社会经济可持续发展的重要条件。
然而,现有人口社会发展模型在面对深圳情况时,却难以满足人口和医疗预测的要求。
为了解决此问题,请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况(医疗设施、医护人员结构等方面)收集数据、建立针对深圳具体情况的数学模型,预测深圳未来的人口增长和医疗需求,解决下面几个问题:1.分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;2. 根据深圳市人口的年龄结构和患病情况及所收集的数据,选择预测几种病(如:肺癌及其他恶性肿瘤、心肌梗塞、脑血管病、高血压、糖尿病、小儿肺炎、分娩等)在不同类型的医疗机构就医的床位需求。
注:附件1-4中有一些人口信息供参考,从深圳统计年鉴等可得到更多的数据;从/view?fid=view&id=1&oid=menunews&ntyp=A10B032可获得一些医学数据。
2012年“深圳杯”全国大学生数学建模夏令营B题:手机用户精准识别随着移动通信、互联网业务的迅速发展,手机已经从生活奢侈品变成了生活日用品,是人们日常生活中不可缺少的一部分。
2012全国大学生数学建模竞赛A题 葡萄酒的评价
A题葡萄酒的评价确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?对问题的分析与类比归纳:1、笔者认为,对于同一事物的评价 如果大家的意见越一致 那么评价的可信度就越高。
所以对于问题1的解题思路也就清晰明了了. 我们可以通过方差。
所谓方差即观测变量各个取值之间的差异程度。
它是用以衡量风险大小的指标。
这一概念来对每一组评酒员作出的评估作出风险分析。
显而易见的是若风险评估的值越高 这组评酒员的评价就存在问题了。
若风险评估值大小相当 这说明这两组评酒员是没有明显差异的。
2、题目中要求对葡萄作出评级。
看起来似乎没有思路 那么我们可以动一下我们的小脑筋。
既然对于评级我们没有参考标准 那么我们可以参考评酒员的评价。
即使用逆向思维 从评酒员的评分发出 那么大体上葡萄的分级基本上就能确定下来 根据确定先来的葡萄分级进行逆推 就可以得出结论。
3、对于这个问题 最直观也是最基本的思路就是看两者之间的趋势。
应用MATLAB软件,作出两者的趋势图。
通过对趋势图的直接观察 两者之间的大体关系即可确定 然后根据曲线拟合的方法可得出两者间的函数关系。
可以类比手机套餐问题解决归纳。
对于我们这些消费用户来说,手机的资费问题一直是我们所关注的热点问题。
2012年大学生数学建模竞赛A题(优秀论文A题葡萄酒)
葡萄酒质量的评价摘要葡萄酒质量的好坏主要依赖于评酒员的感观评价,由于人为主观因素的影响,对于酒质量的评价总会存在随机差异,为此找到一种简单有效的客观方法来评酒,就显得尤为重要了。
本文通过研究酿酒葡萄的好坏与所酿葡萄酒的质量的关系,以及葡萄酒和酿酒葡萄检测的理化指标的关系,以及葡萄酒理化指标与葡萄酒质量的关系,旨在通过客观数据建立数学模型,用客观有效的方法来评价葡萄酒质量。
首先,采用双因子可重复方差分析方法,对红、白葡萄酒评分结果分别进行检验,利用Matlab软件得到样品酒各个分析结果,结合01-数据分析,发现对于红葡酒有70.3%的评价结果存在显著性差异,对于白葡萄酒只有53%的评价结果存在显著性差异。
通过比较可知,两组评酒员对红葡萄酒的评分结果更具有显著性差异,而对于白葡萄酒的评分,评价差异性较为不明显。
为了评价两组结果的可信度,借助Alpha模型用克伦巴赫α系数衡量,并结合F检验,得出红葡萄酒第一组评酒员的评价结果可信度更高,而对白葡萄酒的品尝评分,第二组评酒员的评价结果可信度更高。
综合来看,主观因素对葡萄酒质量的评价具有不确定性。
结合已分析出的两组品酒师可靠性结果,对葡萄酒的理化指标进行加权平均,最终得出十位品酒师对样品酒的综合评价得分。
将每一样品酒的综合得分与其所对应酿酒葡萄的理化指标(一级指标)共同构成一个数据矩阵,采用聚类分析法,利用SPSS软件对葡萄酒样进行分类,根据分类的结果以及各葡萄样品酒综合得分最终将酿酒葡萄分为A(优质)、B(良好)、C(中等)、D(差)四个等级,客观地反映了酿酒葡萄的理化指标与葡萄酒质量之间的联系。
为了分析酿酒葡萄与葡萄酒理化指标之间的联系,采用相关分析法,能有效地反映出两者间的联系,取与葡萄各成分相关性显著的葡萄酒理化指标,与葡萄成分做多元线性回归得出葡萄酒理化指标与酿酒葡萄的拟合方程,从而反映酿酒葡萄与葡萄酒理化指标之间的联系。
由于已经通过回归分析建立了酿酒葡萄和葡萄酒理化指标之间的关系,因此从酿酒葡萄成分对葡萄酒的理化指标的影响,再研究出葡萄酒理化指标与葡萄酒质量的联系,便可作为一个桥梁,反映出葡萄与葡萄酒理化指标对葡萄酒的质量的作用。
2012全国数学建模竞赛A题数据分析
品酒员1号 品酒员2号 品酒员3号 品酒员4号 品酒员5号 品酒员6号 品酒员7号 7 9 9 10 9 10 7 10 8 9 8 9 8 9 7 9 9 10 8 8 8 8 9 9 8 9 9 9 8 8 9 9 8 9 8 9 9 9 9 10 8 10 9 10 10 8 9 10 9 10 9 9 10 9 9 9 9 9 9 9 9 9 10 10 9 8 8 7 9 10 8 9 9 7 8 10 9 10 9 8 9 10 8 10 10 10 9 9 10 10 7 8 10 9 10 9 9 8 8 9 8 9 9 9 8 9 9 10 9 9 9 9 7 8 10 8 8 10 7 9 10 9 10 9 7 10 10 10 9 9 11 9 8 10 10 8 7 9 9 9 9 8 9 8 9 8 9 8 8 8 7 10 10 8 8 8 7 8 8 7 9 8 9 8 7 9 9 8 9 7 8 8 8 9 8 9 9 9 7 9 8 7 10 8 8 8 7 8 9 9 10 8 8 7 8 8 10 8 9 8 8 7 8 9 8 9 9 9 7 8 8 9 11 9 8 9 8 8 10 9 8 8 10 8 11 7 9 10 9 10 9 8 9 8 9 8 8 10 8 8 9 11 9 8 8 7 9 8 9 9 8 8 10 7 9 8 8 9 8 8 9 9 9 8 9 8 10 9 9 11 8 8 10 10 9 8 9 8 7 8 8 9 9 7 8 8 10 10 9 8 8 8 7 8 10 9 9 9 7 8 10 8 7 10 8 8 9 8 9 10 10 8 9 8 10
和 77 84 96 91 94 89 84 88 86 89ቤተ መጻሕፍቲ ባይዱ86 86 89 84 84 84 97 94 88 84 84 81 79 87 89 86 87 93 76 82 91 88 92 90 79 88 92 87 92 93 92 90 90 89 100
2012数学建模大赛a试题
葡萄酒的评价模型摘要区分葡萄酒好坏的量化标准,主要采用百分制评分体系[1]。
该评分体系基于以下四个因素:外观,香气,风味,总体质量或潜力。
评酒员对葡萄酒进行品尝后按照酒的质量特点对其分类指标进行打分,然后求和得到其总分,从而确定葡萄酒的质量。
酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反应葡萄酒和酿酒葡萄的质量。
现对葡萄酒的评价问题进行分析研究,针对葡萄酒的各项指标数据进行统计和分析,建立起模糊综合评价模型,创建模糊关系矩阵:R=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⋯⋯⋯⋯⋯⋯⋯mn 2m 1m n 22221n 11211r r r r r r r r r 运用SPSS 软件等数学工具,来讨论出葡萄酒的评价结果。
问题一,采用求方差的方法,S 2 =()112--∑=n x x ni将各组酒样品横向求方差,纵向求和,将两组的变异系数和进行比较。
得出“第二组的变异系数和更小”的结论,即第二组结果更为可信。
继而使用t-检验,t = 1-n (X - μ)/S对于红葡萄酒,t 值小于0.05,则红葡萄酒存在显著性差异;而白葡萄酒t 值大于0.05,则白葡萄酒不存在显著性差异。
问题二,运用了SPSS 软件中因子分析功能,得到红葡萄理化指标分析(附录1)、白葡萄理化指标分析(附录2),对附件二中的海量数据进行批处理,优化出6项最重要因素简化数据,最后运用聚类分析法分别得出红葡萄与白葡萄的等级分类。
问题三,为了求得酿酒葡萄与葡萄酒的理化指标之间的联系,运用了统计学原理,结合图表,将酿酒葡萄与葡萄酒的几大决定因素提取出来,将其绘制成成分矩阵,进行详细的数据分析,并得出“酿酒葡萄酿制成葡萄酒之后主要成分中的蛋白质与VC 消失,其余理化指标在不同程度上有所改变”的结论。
问题四,通过统计对比,结合数据折线图,直观反映并论证了两种理化指标对葡萄酒质量的影响,即葡萄酒的质量与酿酒葡萄、葡萄酒的各项理化指标呈正相关的关系,也就是葡萄酒的质量随着葡萄酒和酿酒葡萄中的各理化指标的综合变化情况而变化,当产生“峰值”时,存在产生负相关的可能性。
2012深圳杯A题2
深圳杯A 题2摘要本文针对深圳地区人口年龄分布情况,外来务工人员的数量,进而对深圳地区未来人口与医疗需求进行预测.从实际出发,在基于一些合理简化假设的基础上,建立数学模型,并充分利用matlab 等数学软件简化计算,对相关问题进行了有针对性的求解.对于问题一,我们通过深入分析深圳市近十年中的年末常住人口、户籍人口、非户籍人口的变化特征,通过所给数据建立矩阵.利用Logistic 模型,并且借助matlab 最小二乘法散点拟合,得出年份与年末常住人口函数模型,进而预测出未来十年深圳市人口数量增长趋势,人口增长趋势大致呈二次函数的的形式增长,得出未来十年的人口数据:2011P =1077.7万人, ,2015P =1238.4万人, ,2020P =1432.9万人.通过年龄划分儿童、青壮年、老年三个年龄层预测结构发展趋势,运用所给数据得出三个年龄层在不同年份中的比例模型,通过matlab 最小二乘法拟合散点得出关系函数,计算得出未来十年的结构发展趋势,大致呈“S ”型增长,2011()N 儿童=9.9866%,2011()N 青壮年=87.0193%,2011()N 老年=2.9941%,,2020()N 儿童=11.2340%,2020()N 青壮年=84.9727%,2020()N 老年=3.7933%.通过如下关系:年龄结构和患病率相关,患病率和住院率相关,住院人口数和床位有关,建立数学模型,预测得出未来十年的床位需求数.以2011为例,罗湖区1Q =2128,福田区2Q 3060,南山区3Q =2534,宝安区4Q =9329,龙岗区5Q =4622,盐田区6Q =733,总体床位需求Q 总=22406.对于问题二,通过结合深圳市人口年龄结构和患病情况,并且查找深圳各区不同类型的医疗机构和相关数据,按照规模大小将深圳市医院分为3类,针对高血压,脑出血和癌症三种患病情况进行床位需求的计算.利用Matlab 最小二乘法散点拟合,得到2000年,2005年和2010年的患病总人数,再预算出在不同类型的医疗机构就医的床位需求,因为随着人口数的增加,床位数也会随之增加,因此,我们按照得出的公式预测了未来5年不同类型的医疗机构床位需求量.[关键词]Logistic 模型 matlab 最小二乘法 人口预测 床位需求一、问题的提出改革开放以来,深圳作为我国经济发展最快的城市之一,形成了市、区及社区医疗服务系统,较好地解决了现有人口的就医问题.在结构上,深圳人口中流动人口远超过户籍人口,且年轻人口占绝对优势.深圳流动人口主要是从事第二、三产业的企业一线工人和商业服务业人员.年轻人身体强壮,发病较少,因此深圳目前人均医疗设施虽然低于全国类似城市平均水平,但仍能满足现有人口的就医需求.然而,随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响外来务工人员的数量.这些都可能导致深圳市未来的医疗需求与现在有较大的差异.未来的医疗需求与人口结构、数量和经济发展等因素相关,合理预测能使医疗设施建设正确匹配未来人口健康保障需求,是保证深圳社会经济可持续发展的重要条件.然而,现有人口发展模型难以满足人口和医疗的要求.根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况(医疗设施、医护人员结构等方面)收集数据、建立针对深圳具体情况的数学模型,预测深圳未来的人口增长和医疗需求,解决下面几个问题:1.根据所给的数据进行分析,预测未来十年深圳市人口数量和结构的发展趋势,并以此为基础预测未来全市和各区医疗床位需求;2.根据深圳市人口的年龄结构和患病情况及所收集的数据,预测几种病(如:肺癌及其他恶性肿瘤、心肌梗塞、脑血管病、高血压等)在不同类型的医疗机构就医的床位需求.二、问题的分析问题一,通过对深圳近十年常住人口与非常住人口的变化特征,进行深入分析,通过所给数据分别建立年份矩阵A和年末常住人口数矩阵B,并且借助matlab最小二乘法散点拟合,得出年份与年末常住人口的函数关系式,进而通过二次函数的基本特征求出环境可容纳的人口最大数量K,再通过Logistic增长模型,得出每一年的人口增长率,再通过借助matlab最小二乘法散点拟合,得出人口增长率与年份之间的函数关系式,接而得出未来十年,即得到深圳市2011年到2020年每年的人口增长率,进而运用Logistic增长模型,得出深圳市未来十年的人口数量发展趋势.通过按照年龄来划分儿童、青壮年、老年三个年龄层,求出三个年龄层的比例模型,通过得出关系函数在计算得出未来十年的结构发展趋势.通过如下关系:年龄结构和患病率相关,患病率和住院率相关,住院人口数和床位有关,建立数学模型,预测得出未来十年的床位需求数.问题二,要求预测不同类型的医疗机构就医的床位需求,根据问题一中得到的全市人口年龄结构和患病情况,对高血压,癌症,脑出血三种病症在不同类型的医疗机构就医床位需求.按照规模大小划分深圳市的医院类别,再通过各等级医院的床位需求与某种病的患病人数和同一等级医院的数量,可治疗这种病的医院总个数的关系得出不同医疗机构就医床位需求.三、基本假设1、规定0-14岁为儿童,15-60为青中年,大于60岁的为年老者.2、假设各区域的患病者不相互交换,即各区域是相互独立的.3、假设每个人至多得一种病.4、各种病情的发病率是保持不变的.5、医院床位与住院人数供求相抵,(即床位不会出现空缺,有人出院就有人住院).6、床位与病的种类无关(只要有空床,就可让病人住).7、根据等级划分医院后,假设同一等级的医院床位数是相同的.8、选择3种有代表性的疾病进行研究:高血压、癌症、脑出血.假设高血压可在综合医院,专科医院,街道(镇)医院进行治疗,癌症与脑出血就只能在综合医院和专科医院治疗,且都要进行住院治疗.四、定义符号说明P: 深圳市总人口数iN: 各年龄层所占的比例Q: 各区域床位需求iQ: 全市床位需求总A: 2000年-2010年的年份矩阵B: 2000年-2010年的年末常住人口数矩阵b: 每年年末常住人口数it : 年份()x t: 年末常住人口数E: 相对误差K: 环境可容纳的人口最大数量x: 初始时刻人数r: 人口增长率0t : 初始时刻 1a : 全市的儿童比例2a : 青中年人口比例 3a : 老年人口比例 Y 总: 全市医疗床位总需求 n Q : 各区医疗床位需求D : 各区年龄结构比例W : 全区总人数 R : 全市总床位数 Z : 住院率i F : 各级别医院个数 i y : 每年的患病人数i w : 不同类型的医疗机构床位数五、模型的建立与分析问题一:5.1通过所给数据,列出2000年至2010年的年份矩阵:[]0,1,2,3,4,5,6,7,8,9,10A =,2000年至2010年年末常住人口数矩阵:{}i B b =(1,2,,10i = ).Matlab 最小二乘法散点拟合Matlab 最小二乘法基本思路:利用离散点上的数据集 ,构造一个解析函数(图形为一曲线),使得在原离散点上尽可能接近给定的值. Matalab 函数:()polyfit ,,p x y n =说明:x,y 为数据点,n 为多项式阶数,返回p 为幂次从高到低的多项式系数向量p.x 必须是单调的.多项式曲线求值函数:()polyval 调用格式:()y polyval ,p x =由于儿童的比例和老年人口的比例与人口发展紧密联系,因此可以重点研究儿童人口比例和老年人口比例的变化趋势,青壮年人口比例可以根据三者比例和为1得到.设儿童比例为1a ,青中年人口比例为2a ,老年人口比例为3a ,则1321=++a a a .为了简化模型,我们可以认为二者均为关于t 的线性函数,拟合得到: 10.13868.0462a t =+, 30.0888 2.0173a t =+, 1321=++a a a .预测得到未来十年2011--2022年人口年龄组成表:表 5可通过计算,预测得出2011--2020年,儿童增长的平均比率为0.125,老年人平均增长比率为0.230.因此未来十年内深圳市将呈现增长向的趋势,虽然老年人的比例与少年儿童所占比例都在增加,但是)(儿童r <)(老年r ,老年人增长比率明显大于儿童增长比率,因此深圳市趋于人口老龄化. 模型分析在以上模型中,各个因子我们均视为常量或者线性变化量,但实际问题要复杂的多,比如人口自然增长率并不是一个常量,它受到环境容纳能力(自然资源和空间等因素),人口自然增长与年龄结构和男女性别比例也有很大的关系,除此之外,人口政策、户籍政策、人均寿命都会影响到人口的增长和人口结构的变化,还有很多非客观的因素.因此在实际中可以加入考虑某些必要因子,将模型中的相关理想值(指假定为常量的量)转化为相关的变化函数,并重新加入到模型中,得到新的预测模型.在年龄结构的预测中,我们将地区和城市人口种类(指的是户籍人口和非户籍人口)的和设置为常住人口总量,在年龄组成上的差异性(比如非户籍人口大多为外来务工人员,老年人比例相对极少)我们并没有考虑,因此模型会有一定的误差.人口预测模型在很大方面都有重要应用,研究人口变化可以作为相关重大国策制定的参考依据.本模型在研究城市人口(即流动人口不容忽视)时可以作为比较有逻辑的数学模型,但需要加强研究各项相关因子的变化,以使模型更加准确.假设光明新区和坪山新区是在2010年时新增加的两个区.并设定Y 总为全市医疗床位总需求量,n Q ()1,2,,8n = 为各区医疗床位需求量,不妨令81nn Y Q ==∑总()1,2,,8n = .设D 为各区年龄结构比例,W 为全区总人数,R 为全市总床位数(见[附件]),P 总为全市总人数,Z 为住院率,Q 为区床位需求,则区床位需求=各区年龄结构⨯全区总人数⨯(全市总床位数/全市总人数),可得Q D W Z =⨯⨯即(/)G D W R P =⨯⨯.由于所给数据有限,我们只得到了2000年和2010年的各区人数和各区中各个年龄层的人口数量分布,运用matlab 最小二乘法拟合散点,得出2000--2010年各区床位需求大致走向是呈正向发展趋势,如图所示:2000--2010年各区床位需求曲线图进而得出了各个区的床位需求量与年份的函数关系式: 罗湖区:189.8t 1140Q =+, 福田区:2156.6t1337Q =+, 南山区:3134t 1060Q =+, 宝安区:4483.5t4011Q =+, 龙岗区:5191t 2581Q =+, 盐田区:646.3t224Q =+.(取t =11,12, ,20)则全市总床位需求621)(Q Q Q t R +++= ,以此预测出未来十年的各区和全市医疗床位需求.问题二:根据深圳市人口年龄结构和患病情况,我们选择3种具有代表性的疾病进行研究。
数学建模真题
全国数学建模真题1、2012年“深圳杯”全国大学生数学建模夏令营题目及相关通知见附件。
2、请相关师生务必首先仔细阅读相关通知。
3、题目中B题附件的数据文件较大,目前正在进行最后的整理,暂时还不能提供下载。
有兴趣做这道题的师生,请先对这道题目进行思考,过几天再从此页面下载数据。
(目前估计:2012年4月19日前可以在此提供下载链接地址)所有题目下载:2012年“深圳杯”全国大学生数学建模夏令营题目A题:深圳人口与医疗需求预测深圳是我国经济发展最快的城市之一,30多年来,卫生事业取得了长足发展,形成了市、区及社区医疗服务系统,较好地解决了现有人口的就医问题。
从结构来看,深圳人口的显著特点是流动人口远远超过户籍人口,且年轻人口占绝对优势。
深圳流动人口主要是从事第二、三产业的企业一线工人和商业服务业人员。
年轻人身体强壮,发病较少,因此深圳目前人均医疗设施虽然低于全国类似城市平均水平,但仍能满足现有人口的就医需求。
然而,随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响外来务工人员的数量。
这些都可能导致深圳市未来的医疗需求与现在有较大的差异。
未来的医疗需求与人口结构、数量和经济发展等因素相关,合理预测能使医疗设施建设正确匹配未来人口健康保障需求,是保证深圳社会经济可持续发展的重要条件。
然而,现有人口社会发展模型在面对深圳情况时,却难以满足人口和医疗预测的要求。
为了解决此问题,请根据深圳人口发展变化态势以及全社会医疗卫生资源投入情况(医疗设施、医护人员结构等方面)收集数据、建立针对深圳具体情况的数学模型,预测深圳未来的人口增长和医疗需求,解决下面几个问题:1.分析深圳近十年常住人口、非常住人口变化特征,预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;2.根据深圳市人口的年龄结构和患病情况及所收集的数据,选择预测几种病(如:肺癌及其他恶性肿瘤、心肌梗塞、脑血管病、高血压、糖尿病、小儿肺炎、分娩等)在不同类型的医疗机构就医的床位需求。
2012年数学建模A题
葡萄酒质量评定模型摘要葡萄酒质量的评定长久以来都是采用聘请品酒员,通过品酒员对葡萄酒各项指标打分求和来确定葡萄酒的质量。
葡萄酒的价格因品酒员评分高低的不同有显著的差别。
然而在这样的评定方式中人的主观因素对酒质量的评定占主导地位,葡萄酒质量的评定结果存在较大的不确定性。
随着人们对葡萄酒消费的增加及高质量化的追求,建立合理、规范、客观的葡萄酒质量评定模型显得尤为重要。
根据题中给出的相关数据,通过解决以下问题建立葡萄酒质量评定模型。
对于问题一:首先,将题目附录1中的数据经Excel处理,得到每组评酒员对每种酒样品的总分。
然后,对每一种酒样品运用两配对样本的非参数检验(符号秩和检验)对数据进行显著性差异分析,运用MATLAB软件比较各酒样品的两组数据发现两组结果差异显著。
其次,通过Excel求出每一种酒的品酒员所打总分的方差,得到两组品酒员分别对两类葡萄酒的方差走势图(见图1.1、1.2),根据总体方差最小,方差波动较小,确定第二组品酒员的评分更可信。
最后,采用SPSS软件作进一步检验,结果相同即模型合理。
对于问题二,选取一级理化指标作为酿酒葡萄分级参考,对理化指标运用主成分分析法降维,通过MATLAB计算得到红葡萄的主成分有8个,白葡萄的主成分有11个。
综合评分得到的葡萄酒质量影响,红葡萄的影响因素有9个,白葡萄的影响因素有12个。
然后,利用折衷型模糊决策模型,考虑到由主成分分析方法得到的酿酒葡萄的的主成分值在反应酿酒葡萄质量好坏问题上会有一定的偏差,利用三角模糊的表达方式对主成分指标值进行表示,分别将红、白两类酿酒葡萄按隶属度大小排序,在运用聚类分析的方法,利用SPSS软件将葡萄划分为五个等级(见表格2.1)。
对于问题三,数据的庞杂是解决该问题的难点。
我们运用问题二中的主成分分析方法将理化指标转化为几个主成分,并运用MATLAB编程求出具体的主成分数值,然后建立线性回归模型,求解出酿酒葡萄与葡萄酒理化指标主成分之间的相关关系,从而反映出酿酒葡萄与葡萄酒理化指标之间的联系。
2012年'深圳杯”全国大学生数学建模夏令营竞赛题目
2012年'深圳杯”全国大学生数学建模夏令营竞赛题目
佚名
【期刊名称】《数学建模及其应用》
【年(卷),期】2012(0)3
【摘要】<正>A题:深圳人口与医疗需求预测深圳是我国经济发展最快的城市之一,30多年来,卫生事业取得了长足发展,形成了市、区及社区医疗服务系统,较好地解决了现有人口的就医问题。
从结构来看,深圳人口的显著特点是流动人口远远超过户籍人口,且年轻人口占绝对优势。
深圳流动人口主要是从事第二、三产业的企业一线工人和商业服务业人员。
年轻人身体强壮,发病较少,因此深圳目前
【总页数】5页(P46-50)
【正文语种】中文
【相关文献】
1.2013年“深圳杯”全国大学生数学建模夏令营竞赛题 [J], 全国大学生数学建模竞赛组委会
2.2013年“深圳杯”全国大学生数学建模夏令营竞赛题 [J], ;
3.2013年“深圳杯”全国大学生数学建模夏令营成功举办 [J], 本刊编辑部;
4.2012年“深圳杯”全国大学生数学建模夏令营竞赛题 [J], 全国大学生数学建模竞赛组委会
5.2012年"深圳杯"全国大学生数学建模夏令营在深圳开营 [J],
因版权原因,仅展示原文概要,查看原文内容请购买。
2012年全国大学生数学建模竞赛A题(葡萄酒理化指标与质量的评鉴分析,获全国二等奖)
葡萄酒理化指标与质量的评鉴分析摘要用好的葡萄也许酿不出好酒,但没人能用劣质葡萄酿出好酒。
巧妇难为无米之炊,再优秀的酿酒师,如果没有优质的葡萄,也很难酿出好酒。
不同葡萄品种酿制出的葡萄酒是不同的,但是,除了品种间的差异,葡萄自身的质量是酿制高品质葡萄酒的关键。
本文通过建立meansK-聚类模型、典型相关分析等模型,逐步探求用葡萄和葡萄酒的理化指标来评鉴葡萄酒质量的方法。
问题一要求我们分析附件1中两组评酒员的评价结果是否存在显著性差异,为此我们依据小概率原理建立模型Ⅰ-显著性检验模型。
首先我们利用F检验求解两组评酒员之间是否存在显著性差异,再利用配对t检验对检验样本做再次检验,以提高研究效率,确保评价结果的准确性。
利用Excel软件处理数据后,进行t、F的联合检验,当联合检验均被接受,得到两组评酒员的评价结果有显著性差异的结论。
同时通过对两组品酒员对55种葡萄酒样品评分的稳定性、统一性分析,确定第二组品酒员的评价结果更可信。
针对问题二本文根据附件2提供的数据,利用模糊数学原理[3],建立模型ⅢK-聚类模型,对酿酒葡萄进行分类,再以葡萄酒品尝评分作为质量评价依据,means对酿酒葡萄进行分级。
首先,考虑到酿酒葡萄的理化指标过多,不便分类,我们利用多元统计分析原理对红、白酿酒葡萄进行主成分分析,得出红、白酿酒葡萄分别有8个和11个主成分,从而大大减少了分类指标。
再利用meansK-算法求出最佳聚类数k,建立meansK-聚类模型对各种葡萄样品在各个主成分上的得分进行聚类,将红、白葡萄样品分别划分为3类和4类。
最后,根据每个类别中葡萄样品对应的葡萄酒的品尝评分,对各类酿酒葡萄进行分级。
针对问题三建立模型Ⅳ-典型相关分析模型,定量分析酿酒葡萄与葡萄酒的理化指标之间的联系。
我们首先选取酿酒葡萄与葡萄酒皆含有的花色苷、单宁等成分作为理化指标,然后构建典型相关分析模型,研究酿酒葡萄与葡萄酒两组样品的理化指标之间的相关性。
2012年“深圳杯”数学建模A题
数学建模2012年“深圳杯”全国大学生数学建模夏令营A题深圳人口与医疗需求预测组长:廉会组员:周玉婷雷慧泽马小华深圳市人口变化与医疗需求的合理分析摘要一个国家的人口与医疗问题关系到国家的发展与进步,因此对人口合理的预测就显的非常重要。
但是不同的地区有不同的人口特点。
深圳是我国经济发展最快的地区之一,近年来深圳市的产业结构有很大变化,人口也发生了很大变化。
深圳人口增长较快,主要原因有两个:一是人口流入量较大。
10年来,深圳经济保持较高增速,提供了较多的就业岗位,吸引了大量市外人员到深圳工作和生活。
二是户籍人口增长较快。
10年间,深圳采取多项措施,降低了入户门槛,加快了户籍人口增长步伐。
本文就深圳人口变化及未来的床位需求进行了预测。
对于问题一,我们先用excel软件对深圳近十年人口数量变化作图,对深圳市近十年的人口变化得到大致了解。
针对深圳市人口结构中非户籍人口比重大,流动人口多这一特点,然后又由于所得到的数据量不是很大,并且灰色预测模型【1】所需建模信息少,运算方便,建模精度高,所以我们采取灰色预测模型首先对深圳近十年的非常住人口、常住人口及总人口的变化特征进行了分析,在此过程中同时用到MATLAB软件对数据进行计算及拟合,分别得到了非常住人口、常住人口和总人口的拟合函数。
通过模拟出的常住人口与非常住人口的函数,我们可以很容易的得出深圳市人口数量的变化情况,同时我们以非户籍人口与常住人口的函数之比作为深圳市人口结构的变化,通过作图发现,深圳市非户籍人口正逐年下降。
之后对不同年龄段的人口数用excel作图,然后再用MATLAB 软件对不同年龄段的人数数据进行二次拟合并作图。
对问题一中的预测未来全市和各区医疗床位需求,通过查阅资料得知床位需求与各年龄段人数、住院率、平均住院天数以及该地平均年床开放日数有关,在查找资料以及大量演算基础上,利用已求出的常住人口变化函数,我们得出深圳市的床位需求函数,而深圳市各区对应的床位需求则为深圳市总的床位需求乘以本区总人口所占深圳市总人口的比例。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
答卷编号(参赛学校填写):答卷编号(竞赛组委会填写):论文题目:深圳人口和医疗需求预测(A)组别:本科生参赛学校:报名序号:参赛队员信息(必填):答卷编号(竞赛组委会填写):评阅情况(省赛评阅专家填写):省赛评阅1:省赛评阅2:省赛评阅3:省赛评阅4:省赛评阅5:深圳市人口和医疗需求预测模型摘要:人口和医疗问题是关系到国计民生的大问题,能够合理而准确地预测就显得非常重要。
但不同城市有不同的人口特点,本文在吸取前人经验的基础上,以深圳的人口为依托提出了一些新的简单而实用方法,希望能为政府决策提供帮助。
针对深圳市人口结构中非户籍人口比重大,流动人口多这一特点,我们采用了灰色GM(1,1)模型,通过matlab对深圳市自2001至2010年的数据进行拟合,发现其人口变化近似呈线性增长,线性相关系数高达0.99,我们就此认定其为线性相关并给出线性方程。
同理,针对其非户籍人口,我们进行matlab拟合发现,其为非线性相关,并得出相关函数。
通过模拟出的常住人口和非户籍人口的函数,我们可以很容易的得出深圳市的人口数量变化情况,同时我们以非户籍人口和常住人口的函数之比作为深圳市人口结构的变化,通过作图发现,深圳市非户籍人口正逐年下降,这正和官方以及媒体报道深圳市产业转型相对应。
由于深圳市人口结构中外来人口比例接近76%,而且外来人口中以青壮年居多,可以认为在较短时间内(十年内)外来人口年龄结构近似不变,同时当地户籍人口因为受历史条件影响,人口年龄结构在短期内也不会发生较大变化,所以我们大胆假设深圳市未来十年人口年龄结构近似不变。
同时深圳市各区发展水平相同,可以认为其人口发展态势和深圳市总体相同,所以其所在深圳市人口比例不变。
通过查阅资料得知床位需求和各年龄段人数、住院率、平均住院天数以及该地平均年床开放日数有关,在查找资料以及大量演算基础上,利用已求出的常住人口变化函数,我们得出深圳市的床位需求函数,而深圳市各区对应的床位需求则为深圳市总的床位需求乘以本区总人口所占深圳市总人口的比例(已架设各区人口在较短时间内保持不变)。
考虑到问题研究的实用性,我们选取了肺癌和胃癌作为深圳市疾病研究的对象,我们通过查找肺癌和胃癌在深圳市不同年龄段的发病率,这两种病在市级和区级医院的住院天数以及这两种级别的医院的平均年床开放日数,利用已知的病床需求函数,做出了针对深圳市不同级别医疗机构的函数表达式,通过函数表达式我们可以很轻松的看出深圳市不同类型医疗机构的床位需求。
最后以我们的模型为依托去测试深圳市各年的相关数据,都表现出来比较好的吻合性,它充分证明了我们模型的正确性。
但是,由于时间仓促,模型仍有不完善地方,而且有其局限性(在较长时间内误差较大),随着时间推移,深圳外来人口比例将更低,老龄化趋势将更加显著,这显然会影响深圳市各级机构床位需求的预测,我们希望可以引入包含年龄结构的函数对其修正,而这将会成为我们以后的一个研究方向。
关键字:灰色GM(1,1)模型线性相关方程一、问题重述深圳市是一个流动人口多,户籍人口少的城市,外来人口多导致深圳市青壮年劳动力多,由于青壮年劳动力身体健康程度要高于其它人群,因此深圳目前人均医疗设施虽然低于全国类似城市平均水平,但仍能满足现有人口的就医需求。
然而,随着时间推移和政策的调整,深圳老年人口比例会逐渐增加,产业结构的变化也会影响外来务工人员的数量。
这些都可能导致深圳市未来的医疗需求和现在有较大的差异。
未来的医疗需求和人口结构、数量和经济发展等因素相关。
请根据深圳市人口特点预测未来十年深圳市人口数量和结构的发展趋势,以此为基础预测未来全市和各区医疗床位需求;根据深圳市人口的年龄结构和患病情况及所收集的数据,选择预测几种病在不同类型的医疗机构就医的床位需求。
二、问题分析深圳市人口特点是流动人口多,非户籍人口多,但户籍人口较少,针对这个情况,我们选取人口结构中的主要矛盾,即常住人口和非常住人口(即非户籍人口)进行研究。
我们首先分析了深圳市近十年的人口年龄结构变化,发现其结构变化幅度很小,因此在短期内我们可以认为其年龄结构恒定。
由于本题需要处理数据较多,我们采用matlab进行辅助分析,通过拟合结果研究其常住人口已经非户籍人口变化。
而对于人口结构,我们可以用非户籍人口和总人口的比例来表示。
床位需求主要由各年龄段的人数以及和其相对应的住院率相对应,因此我们可以先分析出深圳市的年龄结构(可以分析2010年),然后查找和其相对应的住院率数据,至此,我们便可完成问题的第一问。
而对于第二问,我们可以利用第一问得出的常住人口变化函数和人口年龄结构得出未来某一年深圳市的某一年龄段的人数。
考虑到研究的实用性和可行性,我们可以以肺癌和胃癌作为研究对象,通过肺癌和胃癌的住院率和发病率,得出住院人数。
同时我们需要考虑到不同类型的医疗机构的住院天数受医院设备、人员水平等因素影响,通过查找资料,我们可以得出不同类型的医疗机构治疗同一种病的住院天数。
于是,整个问题便被简化。
三、模型假设1.在较短时间内深圳市人口年龄结构保持不变;2.针对研究的问题,每个年龄段发病率住院率保持不变;3.抽样调查结果具有较高准确性;4.深圳市各区人口所占深圳市总人口比例保持不变;5.没有大的自然灾害等急剧影响深圳市人口结构的事件发生;6.深圳市现行的各种人口政策保持不变;四、符号说明 1.(0)x ——n 个元素的数列; 2.()(1)(0)1()ki x k x i ==∑;3.()d k ——x)1(的灰导数;4.(1)z ——()1x 的紧邻均值数列; 5.(1)(1)(1)()0.5()0.5(1)z k x k x k =+-; 6.a ——称为发展系数;7.1()zk ()——称为白化背景值; 8.b 称为灰作用量; 9.Y 为数据向量; 10.B 为数据矩阵; 11.u 为参数向量;12.X ——总人口随时间变化的拟合函数; 13A ——人口结构变化率; 14.Q ——病床总需求; 15.C ——肺癌患病人数; 16.D ——胃癌患病人数;17.1E ——肺癌在市级医院的病床需求; 18.2E ——肺癌在区级医院的病床需求; 19.1F ——胃癌在市级医院的病床需求;20.2F ——胃癌在区级医院的病床需求;五、模型建立及求解问题I :深圳市最近十年常住人口、非常住人口变化特征和未来十年发展情况。
首先,我们采用灰色GM(1,1)模型.采用原因:灰色模型适用于小样本、贫信息、内在规律未充分外露的系统,按适当办法处理原始数据后得到规律性较强的生成函数.本题给出的常住人口、非常住人口数据受到难以区分的多重因素影响,且数据量较小,适用于灰色模型.由于常住人口数量受历史影响较大,不易发生较大变化,且在数据处理中发现了较强的线性关系,我们之后采用了一元线性拟合来简化模型;而非常住人口受各方面因素影响较大,仍保持灰色模型不变。
最后我们得出了和常住/非常住人口相关的人口结构变化规律。
(一) 灰色模型部分.目前使用最广泛的灰色预测模型就是关于数列预测的一个变量、一阶微分的GM(1,1)模型.它是基于随机的原始时间序列,经按时间累加后所形成的新的时间序列呈现的规律可用一阶线性微分方程的解来逼近.经证明,经一阶线性微分方程的解逼近所揭示的原始时间序列呈指数变化规律.因此,当原始时间序列隐含着指数变化规律时,灰色模型GM(1,1)的预测是非常成功的.[1]GM(1,1)的定义设(0)x 为n 个元素的数列(0)(0)(0)(0)((1),(2),())x x x x n =,,(0)x 的AGO 生成数列为[](0)724.57746.62778.27954.28995.011037.2X =,其中()(1)(0)1()ki x k x i ==∑()1,2,k n =,.则定义()1x 的灰导数为(0)(1)(1)()()()(1)d k x k x k x k ==--,令(1)z 为数列()1x 的紧邻均值数列,即(1)(1)(1)()0.5()0.5(1)z k x k x k =+-,2,3,,k n =…则(1)(1)(1)(1)((2),(3),())z z z z n =,.于是定义GM(1,1)灰微分方程模型为(1)()()d k az k b +=,即(0)(1)()()x k az k b += (a)其中(0)()x k 称为灰导数,a 称为发展系数,1()zk ()称为白化背景值,b 称为灰作用量.将时刻2,3,k n =…,代入(a)式中有(0)(1)(0)(1)(0)(1)(2)(2)(3)(3)()()x az b x az bx n az n b⎧+=⎪+=⎪⎨⎪⎪+=⎩ 令(0)(0)(0)((2),(3),())T Y x x x n =,,(,)T u a b =,(1)(1)(1)(2)1(3)1()1z z B z n ⎡⎤-⎢⎥-⎢⎥=⎢⎥⎢⎥⎢-⎥⎣⎦,称Y 为数据向量,B 为数据矩阵,u 为参数向量,则GM(1,1)模型可以表示为矩阵方程Y Bu =.由最小二乘法可以求得1ˆˆˆ(,)()T T T ua b B B B Y -== GM(1,1)的白化型对于GM(1,1)的灰微分方程(7),如果将(0)()x k 的时刻2,3,k n =视为连续的变量t ,则数列()1x 就可以视为时间t 的函数,记为(1)(1)()x x t =,并让灰导数(0)()x k 对应于导数(1)dx dt,背景值(1)()z k 对应于(1)()x t .于是得到GM(1,1)的灰微分方程对应的白微分方程为(1)(1)dx ax b dt+= 称之为GM(1,1)的白化型. 2. 模型建立此预测模型是拟合参数模型,通过原始数据累加生成,得到规律性较强的序列,用函数曲线拟合得到预测值. 建立过程如下: 1) 设原始数据序列(0)X 有n 个观察值,(0)(0)(0)(0){(1),(2),,()}X X X X n =,通过累加生成新序列(0)(1)(1)(1){(1),(2),,()}X X X X n =,利用新生成的序列(1)X 拟合函数曲线.2) 利用拟合出的函数求出新生序列(1)X 的预测值序列(1)X .3) 利用(0)(1)(1)()()(1)X k X k X k =--累减还原,得到灰色预测值序列0000{(1),(2),,()}X X X X n m =+(共n+m 个,m 个未来预测值).将序列(0)X 分为0Y 和0Z ,其中0Y 反映(0)X 的确定性增长趋势,0Z 反映(0)X 的平稳周期变化趋势.4) 对(0)X 序列的确定增长趋势进行预测.3 模型求解整理得深圳市2001年~2010年常住人口数,见下表.表一:深圳市2001~2010年年末常住人口数根据上述数据建立含有10个观察值的原始数据序列(0)X :[](0)724.57746.62778.27954.28995.011037.2X =使用Matlab 软件对(0)X 进行一次累加,得到新数列(1)X ,见表二. 序号年份 模型值 残差 相对误差 级比偏差(1)(2)X 2001 724.57 0 0(1)(3)X 2002 739.77 0.0092 0.123% -0.0121 (1)(4)X 2003 771.49 0.0087 0.112% -0.0004 (1)(5)X 2004 804.56 -0.0047 0.059%-0.0135(1)(6)X 2005 839.06 -0.0134 0.1650% 0.0089 (1)(7)X2006875.03-0.00450.0518% 0.0090(1)(8)X 2007 912.54 -0.0002 0.0020% 0.0043 (1)(9)X 2008 951.66 0.0027 0.0287% 0.0029 (1)(10)X 2009 992.46 0.0026 0.0257% -0.0002 (1)(11)X20101035.010.00210.0204% -0.0005拟合函数:0.0419775(1)17255.816531.2t X t e ⨯+=⨯-由残差、相对误差、级比偏差可知此模型精度较高,可用于预测.预测值见下表.表三:2011年~2020年深圳市常住人口预测人数同理,整理得2001年~2010年非户籍人口数如下表.表四:2001年~2010年非户籍人口数表五:GM(1,1)算法拟合值及误差表六:2011~2020年非户籍人口预测值拟合函数: 0.0327356(1)17965.017372.5t Y t e ⨯+=⨯-(二) 一元线性拟合部分由表一作出年份-常住人口数(单位:万人)曲线如下图:图一由图可见数据的线性关系很强,且在一段时间内仍保持线性增长趋势。