化验结果的处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
化验结果的处理
摘要
医学化验是协助医生诊断疾病的重要手段。在化验过程中,医院希望可以用简便的判别方法,通过尽量少的化验指标判别出就诊人员是否患病。本问提出了距离判别和费希尔判别等判别法,并借助主成分分析法和均值偏离大小减少了化验指标。
针对问题一,我们提出欧氏距离、马氏距离和费希尔三种判别是否患病的方法,然后对已确诊的60个病例重新判断,并且与正确结果作对比得到正确率,最终我们选出正确率为88.33%的马氏距离判别法和正确率为93.33%的费希尔判别法。
在问题二中,根据问题一提出的两种判别法,对30名就诊人员的化验结果作出判断,结果如下:
马氏距离判别法得出结果是,
患者:61,62,64,66,71,72,76,83,85
健康人:63,65,67,68,69,70,73,74,75,77,78,79,80,81,82,84,86,87,88,89,90.
费希尔判别法得出结果是,
患者:61,62,64,65,66,68,69,71,72,73,75,76,79,83,85
健康人:63,67,70,74,77,78,80,81,82,84,86,87,88,89,90.
对于问题三,我们从均值分析和方差分析两个角度,借助主成分分析法和偏离均值大小建立模型,利用统计软件SPSS求解,最终通过综合分析得到影响人们患肾炎的四项主要指标,即Cu,Ca,Mg,K四种元素。
在问题四中,根据问题三中的结果,再用问题一中提出的两个有效判别方法重新对30名就诊人员是否患肾炎进行判别,结果如下:
马氏距离判别法判别的结果是,
患者:61,62,64,71,72,76,79,83
健康人:65,66,67,68,69,70,73,74,75,77,78,80,81,82,84,85,86,87,88,89,90
费希尔判别法判别的结果是,
患者:61,62,64,65,69,71,72,73,75,76,79,83,85
健康人:63,67,68,70,74,77,78,80,81,82,84,86,87,88,89,90
在问题五中,我们对问题二的结果进一步分析,得出两种判别方法判别结果的一致率达到80%,在此基础上,我们提出了一种更准确的判别方法。在对问题四的结果进一步分析后,我们发现仅用Cu,Ca,Mg,K四项指标,由马氏距离和费希尔判别法得到的结果与问题一中的结果一致率达到90%和96.7%,这充分说明了这四种指标确实是影响患病的主要指标。
最后我们还给出了模型的检验和优缺点。
1.问题的重述
人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。表B.1是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。表B.2是就诊人员的化验结果。我们的问题是:
根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性。
按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。
能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。
根据3的结果,重复2的工作。
对2和4的结果作进一步的分析。
2.基本假设
1.题中给出的数据和判断结果真实无误。
2.除去表中的七项指标外,忽略其余指标对肾炎判别的影响。
3.病人的指标变化完全由肾炎引起的,健康人没有患影响这七项指标的其他疾病。
4. 问题的分析
在肾炎的诊断中,医院通常要化验一些指标来协助医生的诊断。我们的目标是提出简便的判别方法在保证一定检验正确率的同时,还要尽量减少化验指标。 问题一中,要求提出一种或多种简便的判别属于患者或健康人的方法,我们考虑这是多元统计分析中的判别分析问题,可以根据常用的距离判别和费希尔判别作为判别方法建立出模型,并用已知的确诊结果对模型进行检验,然后根据检验结果的正确性确定出有效的判别方法。 问题二中,我们采用问题一中提出的有效判别方法对30名就诊人员的化验结果进行判别,判别他们是肾炎患者还是健康人。
问题三中,可以从方差分析和均值分析两个角度考虑,分别根据主成分分析法和偏离均值大小确定确定出哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验指标。
问题四中,在问题三的基础上,根据已确定出的主要指标,运用问题一中的有效判别方法对30名就诊人员的化验结果进行判别。
问题五中,对问题二和问题四的判别结果作分析,得出减少化验指标对化验结果的影响。
5. 模型的建立与求解 问题一:
此问中,要求提出判别属于患者或健康人的方法,问题的实质是对给出的样本判别其所属类别,而判别分析是用于判别样本所属类别的一种多元统计分析方法,此类问题都可以这样描述:设有k 个m 维的总体12,,...,k G G G ,其分布特征已知,对给定的一个新样本
X
,我们需要判别其属于那个总体。所以,我
们根据常见的判别分析方法建立了两种判别模型,即距离判别和费希尔判别,并分别进行求解,验证其正确性。 模型一:距离判别
距离判别的基本思想:首先根据已知分类的数据,分别计算各类的重心即分组(类)的均值。判别准则是对任给的一次观测,若它与第i 类的重心距离最近,就认为它来自第i 类,即:
首先计算X 到1G ,2G 总体的距离,分别记为()1,D X G 和()2,D X G ,按距离最近准则判别归类,则可写成:
1X G ∈ 当()1,D X G <()2,D X G 2X G ∈ 当()1,D X G >()2,D X G
待判 当()1,D X G =()2,D X G
记()
()
()
1(,...,)i i i T
p X x x ---= (1,2)i =.
(1)如果距离定义采用欧氏距离,则可以计算出
()()12,,D X G D X G ====
然后比较()1,D X G 和()2,D X G 大小,按距离最近准则判别归类。
我们运用Excel 中的函数功能,先计算出了两个总体的重心为:
()
1(143.10,12.33,23.07,698.17,113.39,201.13,526.83)T X -=()
2(186.60,21.92,62.01,2511.13,295.14,90.37,367.21)T X
-=
根据判别准则对已确诊的60例做出判别,不妨用1表示患病,用0表示健康,
将判别结果与准确结果对比,检验此方法的正确性,其结果如下表: