2012年数学建模专科组C题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): C
我们的参赛报名号为(如果赛区设置报名号的话):
所属学校(请填写完整的全名):天津石油职业技术学院
参赛队员(打印并签名) :1. 王松洋
2. 史燕龙
3. 苗兴旺
指导教师或指导教师组负责人(打印并签名):樊乐同
日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):
编号专用页
赛区评阅编号(由赛区组委会评阅前进行编号):
全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):
基于多元线性回归的脑卒中发病环境因素分析
及干预的模型建立
摘要
本文主要针对脑卒死发病环境因素的分析及干预进行了讨论,并建立了多元线性回归的模型。问题一:根据病人的基本信息,对病人群进行统计。首先,由于数据庞大便运用EXCEL 表格中的查找功能进行了相关处理和筛选,由于数据本身的误差,同时也为了统计的简便,所以对于错误的数据进行了忽略处理。在数据的统计时,进行分类统计,按照年份、月份、性别、职业、季节等进行了不同类的统计,需要说明的是问题一尽管数据庞大只需运用EXCEL 表格中的查找功能进行了相关处理和筛选,便能得到结果。注意此次统计时统计的月平均,也是为了统计的简便。随意此次的统计是按照不同年份的各个月份统计的对于问题二:建立相关数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。运用MATLAB 软件进行求解,从而得到相关的方程,在相关的方程中证明脑卒中的发病率是否与月平均气温、月平均压力、月平均相对湿度成多元相性关系。同时根据多元线性方程,得出了以下方程:
εββ++=110x y
εβββ+++=2
22210x x y εββββ++++=2
2322110x x x y
统计的结果显示发病率与气温、气压、相对湿度呈线性关系。发病率随温度的升高而增加,气压越低发病率越高。在问题一和问题二的基础之上对脑卒中高危人群提出预警和干预方案。最基本的就是建议脑卒中的高危人群的居住环境,气温不宜过高,要适中,其次就是居住地的气压不宜过低。选择居住地的合适气温和气压是避免脑卒中的一个重要因素,从统计图上可以得到,温度在20摄氏度到30摄氏度之间不易发生脑卒中,气压在1005千帕到1020千帕之间易发生脑卒中。所以脑卒中高危人群在选择居住地的时候,应该以此为依据去选择。
关键词:脑卒中、多元线性回归、发病率、MATLAB
一、问题的描述
脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。
数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。
1.根据病人基本信息,对发病人群进行统计描述。
2.建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。
3.查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2中所得结论,对高危人群提出预警和干预的建议方案。
二、问题分析
注意此次统计时统计的月平均,也是为了统计的简便。随意此次的统计是按照不同年份的各个月份统计的。
1.首先对于问题的分析先从题目中所给的数据的要求入手。根据病人基本信息,对发病人群进行统计描述。从所给的数据中不难看出,要想对发病人群进合理、详细的描述,就必须要对发病人群进行分类统计,分别按气温、气压、相对湿度进行统计,然后在制作做成离散表格,建立气温与发病人数的关系、气压与发病人数的关系、相对湿度与发病人数的关系,在从中观察,寻找关系。其次,在按照不同年份的各个月份进行统计发病人数,统计各个月份平均气温、平均气压、和平均相对湿度,分别制作做成表格。这是为了解决第二问做准备。
2.建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。
首先是分析干问题是属于哪个类型的问题,暂时先假设该问题是属于多元线性回归的问题。然后按照多元线性回归的这个思路去建立模型。当然这个假设是对还是错,还要观察第一问的统计结果,才能判定模型的对错。模型的建立并不是一开始就建立多元线性回归模型,先建立简单的一元的线性回归模型,建
立多组简单的一元线性回归方程,用软件解出方程后,在此基础之上用MATLAB 进行数据拟合,建立多元线性回归模型,此方法成为逐步回归。
3.而问题三就显得简单了,需要在问题一、问题二的基础之上来提出解决脑卒中高危人群的预警与干预的方案。其二,就是在网上查找脑卒中的相关资料,脑卒中的未来发展趋势,结合多方面的资料,提出切实可行的方案。也算是为脑卒中高危人群做点贡献。
三、 符号说明
错误!未找到引用源。 代表常数
1x 代表月平均压力 2x 代表月平均温度 3x 代表月平均湿度
y 代表发病率
四、 模型假设
1.发病人数与气温、气压成线性关系
2.对于数据中出现的资料误差忽略不计
3.对于数据中数据上的格式错误,进行选择性忽略
4.对于数据中缺失的数据一律用其他职业也进行替代
5.除去资料中给出的因素外,其他的因素不给予考虑
6.将题目中的条件进行理想化,并在理想化的基础之上进行改进
五、模型建立
建立多元线性回归模型:
εββ++=110x y εβββ+++=2
22210x x y