脑卒中发病环境因分析及干预

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

脑卒中发病环境因素分析及干预的数学模型
摘要
脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,应引起人们重视。

本题给出了中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息数据以及相应期间当地的逐日气象资料。

针对问题1,我们以性别、年龄、职业和发病时间为分类标准,对不同类型数据进行统计,然后根据统计所得数据对发病人群的情况进行如下描述:脑卒中发病人数男性要高于女性;发病人数最多的职业是农民;老年人发病相对较多;脑卒中发病人数逐年增加。

针对问题2,我们假设城市人口总数保持不变,将研究发病率转化为研究发病人数与气温、气压、相对湿度间的关系。

结合问题1中对病人信息的统计数据以及对当地逐日气象资料的统计数据,我们利用Excel 分别画出月平均发病人数与各气象因素数据之间的散点图,首先建立单因素线性回归分析模型,得到脑卒中月平均发病人数与月平均气压、月平均最高气压、月平均最低气压呈正相关;与月平均温度、月平均最高温度、月平均最低温度呈负相关;与月平均相对湿度、月平均最低相对湿度没有明显的线性关系;与月温度极差均值和月气压极差均值变化趋势大致相同。

其次,我们综合考虑月平均气压、月平均温度、月平均相对湿度对脑卒中发病人数的影响,建立多因素回归分析模型,得到针对不同月份脑卒中平均发病人数的预报方程:
1147
214731474147
4.725914.953051.62882.070521.032542.80477.2896 3.549294.55023.601211.96913
5.2927y x x x y x x x y x x x y x x x =--⋅=-++=+-=+-
对于问题3,我们可以首先利用网络工具搜集脑卒中高危人群的重要特征和关键指标,然后在问题1、2结论的基础上,结合此模型对高危人群提出对三级预警干预方案:
1.已知危险因素早期预防的一级预警干预;
2.针对其起病诱因的预防的二级预警干预;
3.临床治疗与康复即减少后遗症的三级预警干预。

关键词:单因素分析 发病率预报模型 多因素分析 数据拟合
脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,大多发生在老年人身上,但近年来其发病有年轻化趋势,应引起人们重视。

尽管本病与高血压、心脏病、糖尿病等主要危险因素有关,但这种疾病的诱发已经被证实与环境因素,包括气温和湿度之间存在密切的关系。

为了使高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,增强自我保护的意识。

就有必要建立数据模型,对脑卒中的发病环境因素进行分析,掌握疾病发病率的规律,评估疾病的风险程度,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。

针对中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息数据以及相应期间当地的逐日气象资料。

要求
1. 根据病人基本信息,对发病人群进行统计描述;
2. 结合统计数据,建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系;
3. 查阅和搜集文献中有关脑卒中高危人群的重要特征和关键指标,结合1、2所得结论,对高危人群提出预警和干预的建议方案。

模型假设
(1)假设2007-2010年某城市人口总数保持不变;
(2)假设附表中所给数据真实可靠,能反映实际情况;
(3)假设在统计过程中对个别信息不全数据的忽略不影响最终的结果; (4)假设除与脑卒中发病因素不同外,患者其他状况基本相同。

符号说明
1x :月平均气压(hpa );2x :月平均最高气压(hpa );3x :月平均最低气压(hpa ) 4x :月平均气温(℃); 5x :月平均最高气温(℃); 6x :月平均最低气温(℃); 7x :月平均相对湿度(%);8x :月平均最低湿度(%); 9x :月温度极差均值(℃);10x :月气压极差均值(hpa )
y : 月平均发病人数;
1y : 第一组月平均发病人数; 2y : 第二组月平均发病人数; 3y : 第三组月平均发病人数; 4y : 第四组月平均发病人数;
对于问题1,要求根据病人基本信息,对发病人群进行统计描述。

我们可以以性别、年龄、职业和发病时间为分类标准,对不同类型数据进行统计,然后根据统计所得数据对发病人群的情况进行描述。

对于问题2,要求建立数学模型来研究脑卒中发病率与气温、气压、相对湿度间的关系。

而我们假设城市人口总数保持不变,所以可以将此问题转化为研究发病人数与气温、气压、相对湿度间的关系。

结合问题1中对病人信息的统计数据以及对当地逐日气象资料的统计数据,可以利用Excel分别画出发病人数与各气象因素数据之间的散点图[1],然后根据图形来判断月平均发病人数与各个气象因素之间的单因素关系,以及和多个气象因素之间的多因素关系。

对于问题3,我们可以首先利用网络工具搜集脑卒中高危人群的重要特征和关键指标,然后在问题1、2结论的基础上,结合此模型对高危人群提出预警和干预的建议方案。

问题1的求解
对于题目中给出的病人基本信息,我们以性别、年龄、职业和发病时间为分类标准,在Excel中对不同类型数据进行统计,在统计过程中做了如下处理:
(1)对于职业一栏为空格的情况,我们作为“其他”项进行统计;
(2)对于年龄、发病时间一栏为空格、####或者数据不在所要统计的时间段内的情况,我们不做统计。

统计结果如下列表格所示:
表1不同性别脑卒中发病人数
性别男女
人数33383 28583
比例53.87%46.13%
表2不同职业脑卒中发病人数
职业农民工人退休
人员
教师渔民
医务
人员
职工
离退
人员
其他
人数28446 335666331466653300175117884
表3不同年龄段脑卒中发病人数
年龄1-5 6-10 11-15 16-20 21-25 26-30 31-35 人数18 20 16 44 97 166 251 年龄36-40 41-45 46-50 51-55 56-60 61-65 66-70 人数615 1322 1774 3422 4966 6746 7937 年龄71-75 76-80 81-85 86-90 91-95 96-100 101-104 人数10184 11008 7807 3280 688 104 7
表4 2007-2010年各月份脑卒中发病人数
月份1月2月3月4月5月6月7月8月9月10月11月12月
2007年930 731 834 923 797 785 725 1024 1100 1077 1355 1642 2008年1821 1964 1738 1609 1491 1250 1193 1201 1158 1171 1526 1642 2009年873 874 646 714 597 544 637 756 699 452 792 1042 2010年1775 1495 1540 1553 1604 1364 1486 1501 1475 2420 1712 1342 平均1350 1266 1190 1200 1123 986 1011 1121 1108 1270 1346 1407
通过对以上数据的分析,我们对某城市脑卒中发病人群做如下描述:
1.性别分布:男性53.87% ,女性46.13%,男女比率1.7:1;
2.职业分布:农民占48.51%,其他占30.50%,退休人员占11.31%,离退人员占2.99%,工人占5.72%,教师占0.25%,渔民占0.11%,职工占0.51%,医务人员占0.09%。

发病人群最高的为农民,最低的是医务人员。

3.年龄分布:为了更直观的体现出发病人数在不同年龄段的分布,我们做了相应数据的直方图,如图1所示。

很明显的可以看出,脑卒中发病人数随年龄的增加而上升,75岁以上年龄组发病率为65~74岁组的1.6倍,为55~64岁组的4倍,为45~54岁组的8~9倍,为35~44岁组的30~50倍。

图1不同年龄段脑卒中发病人数的直方图
4.发病时间分布:我们对2007-2010年各月份脑卒中发病人数做出折线图,如图2所示。

可以看出发病人数大致呈逐年上升趋势。

图2 2007-2010年各个月份脑卒中发病人数
问题2模型的建立与求解
为了研究脑卒中发病率与气温、气压、相对湿度间的关系,我们首先假设城市人口总数保持不变,所以可以将此关系转化为研究发病人数与气温、气压、相对湿度间的关系;其次,对题目中给出的中国某城市2007年1月至2010年12月的逐日气象资料,我们在Excel 中统计出月平均气压Pa (hpa ),月平均最高气压Ph (hpa ),月平均最低气压Pl (hpa ),月平均气温Ta (℃),月平均最高气温Th (℃),月平均最低气温Tl (℃),
月平均相对湿度Ha (%),月平均最低湿度Hl (%)等8项主要月气象指标数据[2]
,依次记为自变量12345678,,,,,,,x x x x x x x x ,2007-2010年各月份脑卒中平均发病人数记为因变量y ,具体数据如表5所示。

表5
月份
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
y
1350
1266
1190
1200
1123
986
1011
1121
1108
1270
1346
1407
1x (Pa ) 1027.22 1022.15 1019.23 1016.17 1009.70 1005.70 1003.93 1006.02 1011.35 1018.22 1023.16 1023.34 2x (Ph ) 1029.85 1024.99 1022.35 1018.99 1011.88 1007.40 1005.60 1007.73 1013.05 1020.18 1025.39 1026.16 3x (Pl ) 1024.48 1019.12 1015.98 1013.27 1007.36 1003.86 1002.14 1004.26 1009.65 1016.36 1020.90 1020.62
4x (Ta ) 3.76 6.73 10.35 14.86 21.59 24.47 29.15 28.89 24.78 19.44 12.17 6.80 5x (Th ) 7.59 10.89 14.80 19.47 26.88 28.31 33.26 32.80 28.54 23.59 16.58 11.02 6x (Tl ) 0.84 3.49 6.64 11.02 17.35 21.61 26.01 25.95 22.04 16.01 8.56 3.38 7x (Ha ) 67.84 70.71 67.25 65.47 64.42 77.16 73.84 74.89 78.18 73.16 70.98 66.86 8x (Hl ) 51.01 51.96 46.40 44.38 40.22 58.58 55.36 56.20 60.14 50.54 48.92 46.99
1.单因素回归分析模型
利用Excel 中图表向导工具箱画出月平均发病人数与各个气象指标数据之间的散点图,如附录中图4至图11所示,由散点图可以看出月平均发病人数分别与月平均气压Pa ,月平均最高气压Ph ,月平均最低气压Pl ,月平均气温Ta ,月平均最高气温Th ,月平均最低气温Tl 之间可能存在线性函数关系。

利用Excel 对月平均发病人数与这些气象指标数据进行单因素线性回归分析,结果如表6所示:
表6 月平均发病人数y 与各气象指标数据i x 的关系
气象指标
2R 回归方程
1x 0.8723 115.7814826y x =- 2x 0.8624 214.9213987y x =- 3x 0.8837 316.66415685y x =- 4x 0.7055 412.5381410.2y x =-+ 5x 0.7049 512.5771464.1y x =-+ 6x
0.7063
612.3881366.3y x =-+
由表6可以看出各个回归方程的2R 值比较接近1,说明模型精度较高。

由此可得脑卒中发病人数与月平均气压、月平均最高气压、月平均最低气压呈正相关,即气压比较高的月份,脑卒中容易发病;气压比较低的月份,脑卒中发病率较小;脑卒中发病人数与月平均温度、月平均最高温度、月平均最低温度呈负相关,即温度比较低的月份,脑卒中容易发病;温度比较高的月份,脑卒中发病率较小。

还有通过对附录中图10和图11的观察,可以发现脑卒中发病人数与月平均相对湿度、月平均最低相对湿度没有明显的线性关系,这两个气象指标可能是与其他气象指标共同作用对脑卒中的发病有影响。

另外,考虑到温度与气压的陡变也应该会影响到脑卒中的发病人数。

所以我们又统
计出4年中月温度极差(月最高温度-月最低温度)的均值和月气压极差(月最高气压-月最低气压)的均值,分别记为自变量910,x x ,数据如表7所示:
表7
月份
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
y
1350
1266
1190
1200
1123
986
1011
1121
1108
1270
1346
1407
9x 17.5 25.4 26.1 22.98 20.68 18.02 15.3 15.83 16.15 18.33 21.8 22.15 10x
21.9
29.7 29.03 28.1 21.05
14
13.7 17.48 17.33 18.8 23.05 22.85
根据表7中的数据,利用Excel 做出相应的折线图3,通过图形我们可以看出这三个数据的变化趋势大致相同,即当温度变化量和气压变化量增加或减小时,相应的脑卒中发病人数也增加或减小。

图3 折线图
2.多因素回归分析模型
在实际情况中,任何一种气象数据都不可能单独的发生改变,所以我们就有必要来研究脑卒中发病人数与多个气象指标之间的关系。

这里我们选取在天气预报中相对预报精度比较高的三个气象指标:月平均气压(1x )、月平均温度(4x )、月平均相对湿度(7x )。

并且根据气象数据的一些共同点把一年分为4组,分别是3-5月为第一组,6-8月为第二组,9-11月为第三组,12,1,2月为第四组分别建立预报方程(其中各组月平均发病人数分别记为1234,,,y y y y )。

利用MATLAB6.5工具箱[3]中的regress 命令进行多因素回归分析可得预报方程[4]:(程序见附录中Order1至Order4)
1147214731474147
4.725914.953051.62882.070521.032542.80477.2896 3.549294.55023.601211.96913
5.2927y x x x y x x x y x x x y x x x =--=-++=+-=+-
2.1预报效果检验
利用各组预报方程,对某城市脑卒中疾病发病人数历史资料进行拟合,不妨以2010年的资料为例,计算结果如表8所示:
表8 2010年拟合数据与实际数据对照表
月份 12 1 2 3 4 5 实际人数 1342 1775 1495 1540 1553 1640 拟合人数 1283 1298 1079 1190 1200 1123
准确率
95.57% 73.13% 72.19% 77.27% 77.27% 70.01% 月份 6 7 8 9 10 11 实际人数 1364 1486 1501 1475 2420 1712 拟合人数 1735 1695 1730 68 574 790
准确率
72.79% 85.94% 84.72% 4.68% 23.76% 46.17% 由表中数据可知,预报的准确率大约为70%,较为可靠。

预警和干预的建议方案
脑卒中是脑中风的学名,是一组急性脑血管病的总称,表现为偏瘫、失语等。

祖国医学将其列为“风、痨、臌、膈”四大疑难病之首,存在着明显三高(发病率高、致残率高、死亡率高)现象。

根据统计中国每年发生脑中风病人达200万。

发病率高达120/10万。

现幸存中风病人700万,其中450万病人不同程度丧失劳动力和生活不能自理。

致残率高达75%。

中国每年中风病人死亡120万。

脑卒中给人类健康和生命造成了极大威胁,给患者带来极大痛苦,家庭及社会负担沉重。

因此,充分认识脑卒中的严重性,提高脑卒中的治疗与预防水平、降低脑卒中的发病率,致残率和死亡率是当务之急。

通过网络查询,我们总结出脑卒中高危人群的重要特征如下:
1.患有高血压、糖尿病、高血脂、高胆固醇、短暂性缺血、肥胖等疾病;
2.吸烟、酗酒等不良嗜好;
3.老龄化。

在本模型中,通过对中国某城市2007年至2010年脑卒中发病人群基本信息的统计和分析,我们发现脑卒中发病率与性别、年龄、职业都有一定的关系,一般来说:男性患病的可能性大于女性;61-85岁属于高发病年龄段;从事劳动强度大的体力劳动者如农民、工人等,他们的发病率明显高于其他职业。

另外,脑卒中的发病率与一些气象因素有着密切的关系。

如与温度和气压的升高与降低以及陡降都会影响到脑卒中的发病率。

针对以上脑卒中发病率与其他各个方面的关系,为了使脑卒中高危人群能更好的生活,我们建议采取三级预警、干预的方案:
1. 一级预警干预:对已知危险因素的早期预防。

如气温、气压的急剧变化,此时
应注意冷暖适宜,并尽量减少户外时间;
2. 二级预警干预:针对其起病诱因的预防。

如高血压、糖尿病、高血脂、高胆固醇、短暂性缺血、肥胖等潜在的危险,针对这一情况应合理饮食、减少食盐量,中老年适当补充钙剂,增加蔬菜、水果与胶原蛋白的饮食,适当控制体重与动物脂肪的摄入,加强体育锻炼,不吸烟、少饮酒,养成良好的生活习惯;
3. 三级预警干预:临床治疗与康复既减少后遗症的预警干预。

对于这种情况应缩小病人的活动范围,尽可能地减少其独处的时间,并定期进行检查治疗。

我们应该继续进行流行病学描述性与分析性研究,阐明脑卒中的人群分布规律,积极探索危险因素。

并且利用有效的宣传工具和大众媒介,系统开展人群健康教育,提高群众自我保健意识与自我保健能力。

确保社会的长足、和谐、健康发展。

模型的优缺点分析
优点:
(1)多次应用MATLAB软件建立模型,可信度高;
(2)应用Excel软件求解、画图,简便,直观、一目了然;
(3)采用散点图、折线图和条形分布直方图,可直观的看出发病率与气象指标的关系;
(4)表格和图形结合性表达,使问题更加清晰明白;
缺点:
(1)数据处理任务量大,统计数据方法不简便;
(2)模型所建立的发病人数与气象因素之间的关系理论性不强。

模型的推广及应用
问题一的概率统计模型,在实际中应用广泛,如统计班级学生成绩,量化班级同年级名次;在做市场调查中,统计身边的人们对“关灯一小时”活动的看法,征求他们好的建议,改进做法,为下一次活动做准备。

问题二的单因素回归分析模型和多因素回归分析模型,解决了一对一、多对一的相互影响关系,通过函数关系式的分析,我们可以更好的找到关键性因素,力主避开有害因素,使对我有利的一面达到最大。

在实际生活中,我们可以用该模型分析蚜虫的繁殖速度同温度、湿度、通风度之间的关系,研究蚜虫的繁殖规律,把握好灭虫时间,争取用最少的钱,花最少的时间,达到灭虫的目的。

概率统计模型和回归分析模型解决了实际问题,由于应用对象的不同,需要随时而变,灵活运用。

参考文献
[1] 徐立新张亚华李庆亮李洁彪,计算机文化基础(第3版)北京:电子工业出版社,2010.6
[2] 王秀梅杨旭岩,线性代数与概率统计北京:科学出版社,2008
[3] 张志涌杨祖樱,MATLAB教程北京:北京航空航天大学出版社,2010.8
[4] 姜启源邢文训谢金星杨顶辉,大学数学实验北京:清华大学出版社,2005.2
附录
图4 月平均气压与月平均发病人数的散点图
图5 月平均最高气压与月平均发病人数的散点图
图6 月平均最低气压与月平均发病人数的散点图
图7 月平均温度与月平均发病人数的散点图
图8 月平均最高温度与月平均发病人数的散点图
图9 月平均最低温度与月平均发病人数的散点图
图10 月平均相对湿度与月平均发病人数的散点图
图11 月平均最小相对湿度与月平均发病人数的散点图
Order1:
第一组(3月、4月、5月)y=[1190 1200 1123];
x1=[1019.23 1016.17 1009.70]; x2=[10.35 14.86 21.59];
x3=[67.25 65.47 64.42];
n=3;
m=3;
X=[ones(n,1),x1',x2',x3']; [b,bint,r,rint,s]=regress(y',X)
Order2:
第二组(6月、7月、8月)y=[986 1011 1121];
x1=[1019.23 1016.17 1009.70]; x2=[10.35 14.86 21.59];
x3=[67.25 65.47 64.42];
n=3;
m=3;
X=[ones(n,1),x1',x2',x3']; [b,bint,r,rint,s]=regress(y',X)
Order3:
第三组(9月、10月、11月)y=[1108 1270 1346];
x1=[1019.23 1016.17 1009.70]; x2=[10.35 14.86 21.59];
x3=[67.25 65.47 64.42];
n=3;
m=3;
X=[ones(n,1),x1',x2',x3']; [b,bint,r,rint,s]=regress(y',X)
Order4:
第四组(12月、1月、2月)y=[1407 1350 1266];
x1=[1023.34 1027.22 1022.15]; x2=[6.80 3.76 6.73];
x3=[66.86 67.84 70.71 ];
n=3;
m=3;
X=[ones(n,1),x1',x2',x3']; [b,bint,r,rint,s]=regress(y',X)。

相关文档
最新文档