数学建模题目及其答案(疾病诊断)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数学建模疾病的诊断
现要你给出疾病诊断的一种方法。
胃癌患者容易被误诊为萎缩性胃炎患者或非胃病者。从胃癌患者中抽
取5人(编号为1-5),从萎缩性胃炎患者中抽取5人(编号为6-10),以及非胃病者
中抽取5人(编号为11-15),每人化验4项生化指标:血清铜蓝蛋白(
X)、
1
蓝色反应(
X)、尿吲哚乙酸(3X)、中性硫化物(4X)、测得数据如表1 2
所示:
表1. 从人体中化验出的生化指标
根据数据,试给出鉴别胃病的方法。
论文题目:胃病的诊断
摘要
在临床医学中,诊断试验是一种诊断疾病的重要方法。好的诊断试验方法将对临床诊断的正确性和疾病的治疗效果起重要影响。因此,对于不同疾病不断发现新的诊断试验方法是医学进步的重要标志。传统的诊断试验方法有生化检测、DNA检测和影像检测等方法。而本文则通过利用多元统计分析中的判别分析及SPSS软件的辅助较好地解决了临床医学中胃病鉴别的问题。在临床医学上,既提高了临床诊断的正确性,又对疾病的治疗效果起了重要效果,同时也减轻了病人的负担。
判别分析是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。
首先,由判别分析定义可知,只有当多个总体的特征具有显著的差异时,进行判别分析才有意义,且总体间差异越大,才会使误判率越小。因此在进行判别分析时,有必要对总体多元变量的均值进行是否不等的显著性检验。
其次,利用判别分析中的费歇判别和贝叶斯判别进行判别函数的建立。
最后,利用所建立的判别函数进行回判并测得其误判率,以及对其修正。
本文利用SPSS软件实现了对总体间给类变量的均值是否不等的显著性检验并根据样本建立了相应的费歇判别函数和贝叶斯判别函数,最后进行了回判并测得了误判率,从而获得了在临床诊断中模型,给临床上的诊断试验提供了新方法和新建议。
关键词:判别分析;判别函数;Fisher判别;Bayes判别
一问题的提出
在传统的胃病诊断中,胃癌患者容易被误诊为萎缩性胃炎患者或非胃病患者,为了提高医学上诊断的准确性,也为了减少因误诊而造成的病人死亡率,必须要找出一种最准确最有效的诊断方法。为诊断疾病,必须从人体中提取4项生化指标进行化验,即血
清铜蓝蛋白、蓝色反应、尿吲哚乙酸、中性硫化物。但是,从人体中化验出的生化指标,必须要确定一个精准的指标来判断疾病所属的类型。设想,使用判别分析法,利用SPSS 软件对各个变量进行系统的分析,使该问题得到有效地解决。
二、问题的分析
由题意可知,目的就是为了建立一种模型,解决医学上的这种误诊问题。在该问题中,必须确定血清铜蓝蛋白、蓝色反应、尿吲哚乙酸、中性硫化物与胃癌、萎缩性胃炎的关系。衡量该四项指标的数学要点必然是相应的标准差、方差、均值等,同时,会建立一个或几个函数分析其间关系的正相关或负相关,即其具有一定的相关性,然后利用所给数据求解出一定的数学模型表达式,便可求解出胃病的鉴别方法。
三、符号的说明
X1:血清铜蛋白
X2:蓝色反应
X3:尿吲哚乙酸
X4:中型硫化物
N:被调查的样本数
Wilks的lambda:组内平方和与总平方和之比(当所有观测的组均值相等时,Wilks的lambda值为1;当组内变异与总变异相比小时,Wilks的lambda值接近于0。因此,Wilks的lambda值大,表示各个组的均值基本相等;Wilks的lambda小表示组间有差异。
在判别分析中,只有组均值不等时,判别分析才有意义)
F:F值,F分布中的统计检定值
df:自由度
sig.:统计显著性,即出现目前样本的机率
P:p值
四、问题的假设
1.该四项生化指标是分别可以测得的。
2.每个生化指标都不是其他三个指标的线性组合,即两两之间无相关性。
3.被抽取的三类人员中彼此没有任何血缘关系。
4.除了本题研究的疾病外,被调查的人员无任何疾病。
五、模型的建立
根据以上的分析,回忆所学的知识,发现该问题符合判别分析法的要求,因此可以
用判别分析法来求解,其中,判别分析法可以分为:距离判别法、Fisher 判别法、Bayes 判别法等。SPSS 软件是统计分析软件之一,它可以进行各种统计分析工作。另外,它所具有的强大的图形输出功能,使运行该软件不仅可以得到各种数字分析结果,还可以得到各种直观、清晰、漂亮的统计图形。从而利用软件SPSS ,将所有的数据输入进去,便可以得到协方差矩阵、自由度、p 值、均值、标准差等与该问题相关的有利于分析问题的数据及图形。 现在主要利用Fisher 判别法、Bayes 判别法来处理该问题。
Fisher 判别法的基本思想: 从k 个总体中抽取具有p 个指标的样品观测数据,借助
方差分析的构造一个线性判别函数:1122()p p U u X u X u X '=+++=X u X L ,其中系数
),,,(21'=p u u u Λu 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最
小。有了线性判别函数U 后,对于一个新的样品,将它的p 个指标值代入以上线性判别函数式中求出()U X 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。
Bayes 判别法的基本思想:设有k 个总体k G G G ,,,21Λ,其各自的分布密度函数
)(,),(),(21x x x k f f f Λ互不相同的,假设k 个总体各自出现的概率分别为k q q q ,,,21Λ(先
验概率),0≥i q ,11
=∑=k
i i q 。假设已知若将本来属于i G 总体的样品错判到总体j G 时造
成的损失为)|(i j C ,k j i ,,2,1,Λ=。在这样的情形下,对于新的样品X 判断其来自哪个