检测结果是阳性,你病了吗
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检测结果是阳性,你病了吗?
坚信动物预测地震的人士们最基本的“信念”就是:地震来临之前所发生的人类不能感知到的某些信号,许多动物能够感知到。向安婆婆同学学习一下,虽然咱不是靠数学统计或者动物地质吃饭的专业人员,但是应该不妨碍咱也用点知道的数字的知识来讨论一下:退一百步,即使这条“信念”是正确的,那又如何?
如果有一种病,发病率不算高,假设0.1%吧,一旦发生了就不可救药。但是如果提前知道,可以进行代价不小但是相对于死亡来说还可接受的防治,比如说从此不许吃肉,或者天天吃二两黄连,再或者切掉一条腿。。。在医学上有一种检测方法,可以进行早期诊断。当然就像别的检测方法一样,它总有一定的出错概率。这个方法能够做到的是:如果你有病,那么检测结果99%会是阳性;如果你没病,那么有1%的可能性结果会呈阳性。当然你仍然可以责怪医学研究人员为什么光吃饭不干活,不能让那99%变成100%,让那1%变成0%。但是,就目前的医学水平而言这也不算差了。现在,你进行了一次检测,结果呈阳性,你会怎么办?从此不吃肉?天天吃黄连?切腿?。。。
换句话说,面对阳性率99%的检测方法得到的阳性结果,你会有多大的信心接受“有病”的判断?对于数学或者统计人士,应用条件概率的公式可以直接给出答案。考虑到很多人不习惯用数学公式来说话,我们还是换种具体直观的方式来分析吧。
对于一个100万人口的人群进行这个疾病的普查。发病率0.1%,大致有1000人得病,99%的阳性率,所以约有990个阳性结果。没病的99.9万人中,1%会被误诊为阳性(所谓的假阳性),共有9990个阳性结果。所有检测下来,共有10980个阳性结果,其中只有990人是真正有病的,比例是9%!
好了,虽然检测结果是阳性的,但是你没病的可能性还有91%。你会选择不吃肉,每天吃黄连,或者切腿吗?
为什么一个阳性率已经相当高(99%)的检测方法,检测出来阳性结果的时候却是91%可能没病呢?仔细看看上面的分析,不难发现:尽管只要有病就几乎肯定(99%)能被检测到,没病被误诊的概率也不高(1%),但是由于发病率很低所以真阳性的数量远远小于假阳性的数量。结果,有病固然基本上显示为阳性,但阳性结果却只有很小的概率是真的有病。
现在让我们来玩玩数字游戏,把上面的几个数字改变一下,看看结果会发生什么改变:
一、 保持随机发病率(0.1%)和假阳性率(1%)不变,把阳性率提高到100%,结果阳性结果时的有病概率是9.1%;阳性率降低到90%,
阳性结果的有病概率则变为8.3%;如果降低到50%,则结果变为4.8%。也就是说,对于检测结果为阳性的时候得病概率的问题,表示有病情况下被检测出来的准确性(阳性率)并不是那么关键。不过这个数字的影响在于,如果低的话,检测结果阴性但是有病的可能性却还是很高,这个检测也就很成问题。
二、保持阳性率(99%)和假阳性率(1%)不变。把发病率改为1%,阳性结果有病的概率就变成了50%;如果把发病率降低到0.01%(万分之一),则即使检测结果为阳性,得病的概率也还不到1%。
三、 保持阳性率99%,发病率0.1%不变,把假阳性率降低到0.1%,会发现阳性结果有病的概率变成了49.8%;如果假阳性率升高到5%,则这个概率只有1.9%。
好了,总结上面的数字游戏——游戏只是说随意地改变参数,算法是可靠的——可以看出:当面对一个阳性结果,真实情况如何并不全由阳性率(有病的时候能被检测到的概率)决定。真实的随机发病率和假阳性率的相对大小甚至更为重要。
对于地震预测而言,地震相当于得病,我们用来预测地震的方法相当于检测手段,而试图用以预测地震的那些“异象”,蟾蜍过街也罢,猪不进圈也罢,相当于阳性结果。地震预测就是根据那些“阳性结果”去推测地震发生的可能性。
现在我们来看看地震预测中的这几个参数。尽管有无数的文章从科学研究的现有结果指出地震与动物“异象”关系不大,但是许多人仅仅出于“信念”而“相信”动物有着神奇之处,在地震来临之前可以感受到并且做出反应。好吧,我们不在这个问题上费口水了,就算可以吧。按照这种“信念”,如果地震要发生,蟾蜍一定会搬家,猪一定会出圈,狗一定会叫个没完。。。把阳性率假设为100%,总不会再有口水了吧。再说地震发生,有意义的预测总得告诉人们在一个不大的地区内不长的时间内有不算低的可能性发生地震,预测“未来十年中国会发生大地震”大概没有什么实际意义。预测到一块不大的区域,比如中国行政区划上的一个地区,在几个月内有地震大概才会有一定的决策意义。想想这样的一个区域在过去几百年中发生了几次地震,可以估算在一定长度的时间段内发生地震的概率。比如500年中发生了5次大地震(这个算得上地震高发区了吧?),那么在任何一个月的时间段内发生地震的概率可以估算为1200分之一。而对于某种动物“异象”,比如蟾蜍过街或者猪不进圈,也可以统计在这500年中发生过多少次,除去发生了地震那几次,剩下的就是假阳性的次数。这个数字大概无法统计,因为没有发生地震
的话人们会忽略这种“异象”而不会留下记录。不过,现在的资讯发达,过去几年全国报道过的“蟾蜍过街”不下十起,即使把绵竹的那一起勉强算作“阳性结果”,假阳性率应该还是大大高于地震发生率。这里做个保守估计,算10倍吧,那么假阳性率是120分之一。把这三个数字带入上面的分析,结果:即使地震来临之前蟾蜍一定会过街,当看到蟾蜍过街的时候,地震发生的概率也只有9.1%。
这个9.1%,还是基于上面的数字游戏中所有数字都尽可能往有利于预测的方向上靠的结果。实际上有很多地震之前并没有看到蟾蜍过街,也就是说那个100%的阳性率是不靠谱的,其次实际的地震发生率和蟾蜍过街率的差别,很可能也要远远高于10倍。所以,蟾蜍过街这个“阳性结果”,所预示的“得病概率”还会远远低于上面的结果。一个检测结果阳性的人,如果没有作防治,最后得了绝症,人们会说虽然只有百分之几的可能,但是切腿还是比得绝症好多了,当初应该接受“预测”的。但是,当初面对几个百分点的得病概率还没有发病的时候呢?当面对大量既没切腿又没得病的例子的时候呢?
许多人又说了,谁让你只看蟾蜍的,多看些动物,假阳性率不就低了么?这话理论上是没错的。问题在于,多看些动物,比如在蟾蜍过街的同时,还要猪不进圈,狗不吃饭,鸡不下蛋。。。如此等等,同时发生来作为“阳性指标”。假阳性率可能是降低了,“真阳性率”却也同时降低了。看看过去发生的地震,有多大的比例同时达到了这些“阳性指标”?“真阳性率”降低了,地震还是不能被预测到。
在前面疾病普查的例子中,疾病的随机发生率是0.1%,检测结果是阳性的话虽然得病的概率也不够高,但是上升到了9%。我们再在进行一次独立的检测,如果还是阳性的话,患病的可能性就高达90.7%。当然我们还可以再进行一次,还是阳性的话,得病概率就接近100%了。这也就是许多阳性结果要进行复查的原因。这里强调要“独立进行”,是因为只有复查独立进行,依据的信息跟前一次无关,计算中所用的参数才成立。但是对于地震预测来说,如何进行这样独立的复查?或许有人说可以把蟾蜍过街当作一次,猪不进圈当作一次,甚至狗不跟邻居的母狗搭讪也算作一次。这想法也不是不可以,但是当这样预测的时候,每一种预测中所用的参数都将是别的取值了,没法按照上面的计算过程简单重复了。有兴趣的人当然可以取认为合理的参数,看看这样的“预测”有多靠谱。
如果有1%的可能要得绝症,而防治的措施是不吃肉的话,相信很多人
可以做到;天天吃黄连,大概也有很多人可以接受;但是切腿呢?
即便是我们“相信”地震来临的时候动物会有异常,根据这种“异常”来“预测”地震的可靠性能有多高?相对于地震来临,长时间大面积众多人口的躲避是相当于不吃肉,吃黄连,还是切腿?