2012高教社杯全国大学生数学建模竞赛 C题

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

编 号 专 用 页
赛区评阅编号(由赛区组委会评阅前进行编号):
赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注
全国统一编号(由赛区组委会送交全国前编号):
全国评阅编号(由全国组委会评阅前进行编号):
2
一.摘要
脑卒中发病率与诸多因素有关,如气候、压力、饮食、年龄等等。为制定脑 卒中的防御措施,本文考虑气压、温度、湿度对 2010 年高发病率的影响。所以 多元统计分析问题,经分析,气压、温度、湿度与发病率线性关系不显著。因此 本文采用主成分分析评价法,借助 spss 软件,将气压差、温度、湿度、温度差、 气压作为考虑因素对脑卒中高发病例进行评价,构建评价函数,并根据实际情况 对比,得出评价函数: y 0.4x1 0.26x2 0.09x3 0.36x4 0.06x5 ,通过评价分 析发现气压差对发病率起到正面作用且影响很大,其次为温度起负面作用,温差 对发病率也有一定的影响。 关键词: 脑卒中 主成分分析法 spss 评价函数
考虑发病率与温度、湿度、气压的关系时,我们以平均温度、平均气压、平均相 对湿度、平均温度差、平均压强差这些因素作为评价标准,在此基础上借助spss 软件,建立发病率高的指标体系与上述因素的评价函数。
Spss软件的介绍 :
SPSS(Statistical Product and Service Solutions),“统计产品与服 务解决方案”软件。最初软件全称为“社会科学统计软件包” (SolutionsStatistical Package for the Social Sciences) , 但是随着 SPSS 产品服务领域的扩大和服务深度的增加,SPSS 公司已于 2000 年正式将英文全称 更改为“统计产品与服务解决方案”,标志着 SPSS 的战略方向正在做出重大调 整。 SPSS Statistics 功能介绍 1.完善的结果报告功能 从 10 版起,对数据和结果的图表呈现功能一直是 SPSS 改进的重点。在 16 版中,SPSS 推出了全新的常规图功能,报表功能也达到了比较完善的地步。13 版将针对使用中出现的一些问题,以及用户的需求对图表功能作进一步的改 善。 1)统计图:在经过一年的使用后,新的常规图操作界面已基本完善, 本次的改进除使得操作更为便捷外,还突出了两个重点。首先在常规图中引入更 多的交互图功能,如图组(Paneled charts),带误差线的分类图形如误差线条 图和线图,三维效果的简单、堆积和分段饼图等。其次是引入几种新的图形,目 前已知的有人口金字塔和点密度图两种。 2)统计表:几乎全部过程的输出 都将会弃用文本, 改为更美观的枢轴表。而且枢轴表的表现和易用性会得到进一 步的提高,并加入了一些新的功能,如可以对统计量进行排序、在表格中合并/ 省略若干小类的输出等。此外,枢轴表将可以被直接导出到 PowerPoint 中,这 些无疑都方便了用户的使用。 2.Complex Samples 模块增加统计建模功能 Complex Samples 是 12 版中新增的模块,用于实现复杂抽样的设计方案, 以及对相应的数据进行描述。但当时并未提供统计建模功能。在 13 版中,这将 会有很大的改观。 一般线形模型将会被完整地引入复杂抽样模块中,以实现对复 杂抽样研究中各种连续性变量的建模预测功能, 例如对市场调研中的客户满意度 数据进行建模。对于分类数据,Logistic 回归则将会被系统的引入。这样,对 于一个任意复杂的抽样研究,如多阶段分层整群抽样,或者更复杂的 PPS 抽样, 研究者都可以在该模块中轻松的实现从抽样设计、 统计描述到复杂统计建模以发 现影响因素的整个分析过程,方差分析模型、线形回归模型、Logistic 回归模
2
三.问题重述
脑卒中发病环境因素分析及干预
脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一 个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素, 包括气温和湿度之间存在密切的关系。对脑卒中的发病环境因素进行分析,其目 的是为了进行疾病的风险评估, 对脑卒中高危人群能够及时采取干预措施,也让 尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。 同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗 机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际 的指导意义。 数据(见 Appendix-C1)来源于中国某城市各家医院 2007 年 1 月至 2010 年 12 月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2) 。 请你们根据题目提供的数据,回答以下问题: 1.根据病人基本信息,对发病人群进行统计描述。 2.建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。 3.查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中 所得结论,对高危人群提出预警和干预的建议方案。
0.85 确定m值,使信息的利用率达85%以上,对每个 j ,j=1,2,...,m,
解方程组 Rb jb 得单位特征向量 b 0 j 。 4.将标准化后的指标变量转换为主成分
U 1 称为第一主成分, U 2 称为第二主成分,„,Up称为第p主成分。
5.对m个主成分进行综合评价 对 m 个主成分进行加权求和, 即得最终评价值,权数为每个主成分的方差贡献率 对于主成分分析法涉及的计算,我们可以通过 spss 软件执行
3
问题一:对题目所给的数据考察文献,发现脑卒中的发病人群与性别、职业、
年龄有密切的关系。 因此根据上述因素对题目所给数据进行分层分析,按性别分 层,男性患病人群和女性患病人群。在性别分层的基础上再进行细来自百度文库,即男女性 职业和男女性年龄段。
问题二:利用主成分分析法,对数据进行分析,结合题目要求及所给数据,在
我们参赛选择的题号是(从 A/B/C/D 中选择一项填写) : 我们的参赛报名号为(如果赛区设置报名号的话) : 所属学校(请填写完整的全名) : 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9
C题
安徽机电职业技术学院

10

1
2012 高教社杯全国大学生数学建模竞赛
1
主成分分析的基本原理:主成分分析法是一种降维的统计方法,它借助于一 个正交变换, 将其分量相关的原随机向量转化成其分量不相关的新随机向量,这 在代数上表现为将原随机向量的协方差阵变换成对角形阵, 在几何上表现为将原 坐标系变换成新的正交坐标系, 使之指向样本点散布最开的p 个正交方向,然后 对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统, 再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 它的数学模型如下: 1. 原始指标数据的标准化 采集 p 维随机向量 x=( x1 . x2 ... x p ) T , n 个样品 X i ( xi1 , xi 2 , xi3 ...xip )T , ( i 1,2,...n , n p ),构造样本阵,对样本阵元进行如下标准化变换:
二.方法介绍
主成分分析,又称主分量分析,是指将原始的多个变量,通过线性组合,提 炼出较少几个彼此独立的新变量的一种多元统计分析方法。 在用统计分析方法研 究这个多变量的问题时, 由于变量个数太多会增加解决该问题的复杂性。在大多 情况下, 变量之间存在一定的相关性,可以解释为这两个变量在反映此问题的信 息时有一定的重叠。 人们希望变量个数较少而得到的信息较多,主成分分析就是 对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相 关的,而且这些新变量在反映问题的信息方面尽可能多地保留原有的信息。 主成分分析的基本思想:在实证问题研究中,为了全面、系统地分析问题, 我们必须考虑众多影响因素。 这些涉及的因素一般称为指标,在多元统计分析中 也称为变量。 因为每个变量都在不同程度上反映了所研究问题的某些信息,并且 指标之间彼此有一定的相关性, 因而所得的统计数据反映的信息在一定程度上有 重叠。 在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题 的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量 全面。
五.问题假设与约定
1. 本文引用数据、资料均真实 2. 可不考虑脑卒中的所有类型,因为不同类型的脑卒中患者的影响因素不一样 3. 研究变量(年龄、性别、工作环境)之外的其他因素对脑卒中的发病率影响 忽略不计 4. 引进虚拟自变量(性别、年龄分组) 5. 不考虑突发事故,和各种外界传染等因素。即每个人开始时身体健康,没有 感染。 模型一:就题目所给的数据进行分析,由 data1-data4 的数据统计,模型中将 患病人群分为男性女性两层统计,再根据职业的不同、年龄段将男女患病人群数 分别统计,得到下列表格: 由表一和表二可知: 男性患病人群略大于女性,有可能是因为男性吸烟和饮 酒的人数所占的比重比较大, 而吸烟和饮酒是引起脑卒中的重要危险因素,因此 男性得脑卒中的概率要明显略大于女性。
2012 高教社杯全国大学生数学建模竞赛



我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮 件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问 题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他 公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正 文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反 竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行 公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表 等) 。
其中, 2.对标准化阵Z求相关系数矩阵
,得标准化阵Z。
R [rij ] p
ZTZ xp n 1
kj
其中, rij
z
z kj
n 1
, i, j 1,2...p
3.解样本相关矩阵R的特征方程 R I p 0 得p个特征根,确定主成分

m j 1 p
j
j 1 j
4
型等复杂的统计模型都可以加以使用, 而操作方式将会和完全随机抽样数据的分 析操作没有什么差别。 可以预见,该模块的推出将会大大促进国内对复杂抽样时 统计推断模型的正确应用。 3.spss 可以广泛的应用于统计、应用数学、经济、市场营销、心理、卫士统计、 生物、企业管理、气象、社会学等领域。 4.spss 分析过程包括:调查设计、数据收集、数据存取和管理、数据分析、数 据检验、数据挖掘、数据展示等。还有一系列附加模块和独立产品以加强它的分 析功能。 它的图形窗口界面使其非常简单易用但却具有满足各种分析要求的数据 管理、统计分析功能及各种报表方法。
四.问题分析
问题的重要性:
脑卒中俗称“中风”,是由向大脑输送血液的血管疾病引起的一种急 性疾病。脑卒中或脑血管意外( CVA )会对大脑组织造成突发性损坏,通常 发生在向大脑输送氧气和其它营养物的血管爆裂之时,或发生在血管被血 凝块或其它颗粒物质阻塞之时。如果神经细胞缺乏足够的氧气供给,几分 钟内就会死亡。接着,受这些神经细胞控制的身体机能也会随之失去作用。 由于死亡的大脑细胞无法替换,因此脑卒中造成的后果通常是永久的。患 有大血管急性缺血性发作的患者,每小时损失 1 亿 2 千万神经细胞、 8300 亿神经键、 和 714 千米有髓纤维。 每分钟有 190 万神经细胞、 140 亿神经键、 12 千米有髓纤维受损。与因大脑老化而产生的神经细胞的正常死亡速率相 比,缺血性大脑如果不接受治疗,则每小时老化 3.6 年。 专家指出:全国每年新发脑卒中患者达 200 万人,因此我们应该引起 关注,到底有哪些因素导致脑卒中患者逐年增加?接下来我们就对导致脑 卒中发病率的因素进行分析。
相关文档
最新文档