血样分组检验的数学模型3

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

血样分组检验的数学模型3
血样分组检验的数学模型
摘要:本文以血样分组检验为原型,通过建立数学模型,利用概率统计,数学期望值等知识对如何分组检验以及什么情况下需要进行分组检验作出了合理的解释,并且可以结合实际情况,将该模型推广于其它类似的统计学实际应用。

关键词:血样分组检验,数学模型,概率统计, 数学期望值
◆问题提出
在人群(数量很大)中进行血样检验,设已知先验阳性率为p, 为减少检验次数将人群分组。

若k人一组,当k份血样混在一起时,只要一份呈阳性,这组血样就呈阳性,则该组需人人检验;若一组血样呈阴性,则该组不需检验。

(1)当p固定时(0.1%, 1%, …),k多大可使检验次数最小
(2)当p多大时,就不需要分组。

◆问题分析
本问题涉及的情况是当今医学研究、病毒检验等领域中的一个非常现实的问题,必须要找到一种合理的解决方案。

由于对人群(数量很大)进行血样检验需要大量的统计数据,为了提高检验的效率,以最少的检验次数达到最终的检验效果,就必然要面临如何对人群分组这个难题。

本文对血样分组检验建立数学模型,目的就是要找到一种最佳的分组方案,对于一个数量固定的人群(假定人群数量为n 人),我们在决定哪一种分组方案最好或者需不需要分组时,可以引入数学平均值。

如果不分组,每个人都参加检验,则总共需要检验n次,每个人平均需要检验一次,如果分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组;在众多组合的分组中,哪一种分组计算出来的每个人的平均检验次数最小,则认为这种分组时最优的分组方案。

这也是数学概率模型的基本思路。

共8 页第1 页
◆模型假设
结合本问题的实际情况,对该模型作出如下合理的假设:1.人群数量总数为n 人;
2.先验概率P 在检验中为一常量,保持不变;
3.每个人检验一次是否阳性的概率相互独立,即每个人接受检验是互相独立事件,互不影响;
4.每次分组时都能达到平均分配,能分成m 组,即m=n/k ,m 为正整数。

◆变量说明
根据提出的问题和模型假设,给出如下变量:
n ---- 被检验人群的总数;
m ----人群被分成的组数;
k ----每组的人数;
p ---- 先验阳性概率;
q=1- p ----先验阴性概率;
ξ----每个人需要检验的次数,为一随机变量;
E ξ----ξ的期望值,每个人需要检验的平均次数。

◆模型建立
利用概率统计知识建立数学概率模型,由期望值知道,如果不分组,每个人都参加检验,每个人平均需要检验一次;如果分组,分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组。

在众多组合的分组中,比较哪一种分组计算出来的每个人的平均检验次数最小,平均检验次数最小的那种分组则认为这种分组时最优的分组方案。

◆模型求解
问题一、当p 多大时,就不需要分组。

在分组情况下,由模型假设知每组的人数为k (2k n ≤≤);变量ξ表示每人的检验次数;阳性的先验概率为p ;阴性的先验概率p q -
=1。

如果一组检验为阴性,则表明该组中的每个人均不是病毒的感染者,又因为每个人是否是感染是相互独立的(模型假设),所以可以求得一组检验为阴性的概率为k q ,即该组中的每个人平均检验次数为
k
1
次(该组总共只检验了一次)。

如果一组检验为阳性,则表明该组中有病毒感染者,因为一组检验为阴性的概率为k q ,所以一组检验为阳性的概率为k q -1(一组检验要么为阴性,要么为阳性),即该组中的每个人平均检验次数为k
1
1+次(除了该组检验了一次外,该组中的每个人又被逐个检验一次)。

所以可以得到ξ的分布律为:
由上表可求得ξ的期望值E ξ,
111(1)(1)1k k k E q q q k k k
ξ=
++?-=-+ 即每个人的平均检验次数为11k
q k -+次,人群(总共n 个人)的平均检验次数为
)1
1(k
q n E n k +-?=?ξ次。

由概率模型知,只有当1<ξE 时才需要分组,即分组检验要满足1<ξE 这个约束条件:
由E ξ=11111k
q q p p k -+
->?<即只有当满足约束条件1 p <-
因为k 只能取整数,所以1
故引入与1
-
()1p x =,(2x n ≤≤)
对()1
p x =-
进行求导,求导过程如下: '''()(1 p x ==-

y =
则'''
()
p x y =-=- 对
y =两边求对数有:
ln
y =,
对ln
y =
1'
'''111(ln )(ln())(ln )x
y x x x ===
即 '22221111111ln ()ln y x y x x x x x x x
=-+-=--
1'
2222221111111111(ln )(ln )(ln )()x y y x x x x x x x x x x =--=--=--
所以11
'''
222111111()(ln )()()(1ln )x x
p x y x x x x x x x =-=-=---=??- 即 1'
211()()(1ln )x p x x x x
=??-
由此可以看出,当e x >时,'()0p x <,函数()1
p x =单调递减,而
2x e ≤<时(分组时每组至少要有2人,故有2x ≥),'()0p x >,函数()1
p x =单调递增,在e x =时(自然对数e 约等于2.71828),'()0p x =,函数()1
p x =取得最大值,此时最大值1
1()11()0.3078e
p e e ==-=,
做出函数)(x p 的图像,见下图:
由于实际检验分组时每组的人数k 只能取整数,不可能取自然对数e (自然对数e 约等于2.71828),故算出接近最大值()p e 的两个实际值:
(2)0.292893p = (3)0.306639p =
所以, (
)1p k =的最大值为0.306639,即只有当0.306639p <时,通过调整k
可以满足分组检验的约束条件1p <而当0.306639p ≥时,无论怎么调整k 都不能满足分组检验的约束条件1p <所以,当0.306639p ≥时,就不需要分组。

问题二、当 p 固定时(0.1%, 1%, …),k 多大可使检验次数最小
情况一:
当 p 固定时(0.1%, 1%, …),并且当0.306639p ≥时,此时不需要分组,即k=1时可使检验次数最小。

情况二:
当 p 固定时(0.1%, 1%, …),并且当0.306639p <时,此时需要分组,要使人群总的检验次数最小,只要使每个人检验次数的期望值:111
(1)(1)1k k k E q q q k k k
ξ=
++?-=-+最小即可,因为k 只能取整数,所以E ξ 是一个离散型变量,为了更形象地讨论问题,故引入与11k
E q k
ξ=-+变化趋势相同的连
续性函数连续性函数1()1x
f x q x
=-+,
1()1x f x q x =-+1
1(1),(2,01)x p x n p x =--+≤≤<<
2,2x ≥注:分组时每组人数至少为人故
对函数1
()1(1),(2,01),x
f x p x n p x =--+
≤≤<<求导可得, ''211
()(1(1))(1p)ln(1p)x x f x p x x
=--+=---
因为此时p 是给定的固定值,故ln(1p)0-<且ln(1p)-为定值,1p<0-,由上式分析知,当x 增大时,(1p)x -减小,(1p)ln(1p)x --增大,2
1
x -
也增大,即'
21
()(1p)ln(1p)x
f x x
=---
为增函数,即()f x 的极值就是()f x 的最小值所以'
2
1
()(1p)ln(1p)0x
f x x =---
=的实数解x ,就是函数 1
()1(1)x f x p x
=--+
取的最小值时对应的x 值,由数值解法(利用计算机编程迭代,让x 从小到大依次代入等式,当误差在允许的范围内所取得的x 值)可解出每一个给定的p 所对应的'
2
1
()(1p)ln(1p)0x
f x x =---
=时的实数解x ,由于实际检验中每组的人数k 只能为整数,所以要对计算出来的x 取整(去掉后面的小数不分),取整后记作[x ],再比较一下
([])f x 和([]1)f x +,若([])f x <([]1)f x +,则k =[]x ,若([])f x >([]1)f x +,则k =[]x +1,此时的k 值即为每一个给定的p 所对应
的可使总检验总次数最少的每组人数。


面给出数值解法解出的对于不同的先验概率,相对应的最小检验次数的每组人数:
◆结果分析
由模型求解知,在满足模型假设的前提下,当所给定的阳性先验概率0.306639p ≥时,
不分组每个人都检验一次可以使总检验次数最少;当所给定的阳性先验概率00.3066p <<时,可使总检验次数比不分组时总检验次数少,需要分组检验。

当 p 固定时(0.1%, 1%, …),为了使人群总的检验次数最小,就需要确定每组的人数k 。

根据固定值p 的大小分类讨论:
当0.306639p ≥时,此时不需要分组,即k=1时可使检验次数最小;当0.306639p <时,此时需要分组,要使人群总的检验次数最小,
只要使每
个人检验次数的期望值E ξ最小,通过引入与1
1k
E q k
ξ=-+变化趋势相同的连续性函数连续性函数11
()11(1),(2,01)x
x f x q p x n p x x
=-+
=--+≤≤<< ,对于每一个给定的p ,可以求出函数()f x 的极值,又由分析知'
()f x 是增函数,所以求出的()f x 的极值就是()
f x 的最小值。

利用数值解法可以解出每一个固定p 对应的()f x 的极值,也就是()f x 的最小值对应的x ,由于实际检验中每组的人数k 只能为整数,所以要对计算出来的x 取整(去掉
后面的小数不分),取整后记作[x ],再比较一下([])f x 和([]1)f x +,若([
])f x <([]1)f x +,
则k =[]x ,若([])f x >([]1)f x ,则k =[]x +1,以此类推,可以确定每一个给定的p ,要使人群总的检验次数最小所对应的每组的人数k 。

◆模型推广
本数学模型在实际生活中有非常广泛的应用,可以给社会实践以指导作用,在我们的社会生产中,当我们不能确切地知道事物的内在属性时,可以在提出合理的假设下对事物的属性进行初步的概率描述,建立概率模型。

比如,我们在对工厂生产出来的零件进行试验时,可以采取建立概率模型的办法对零件的合格率进行评估;在对事物进行可行性分析时,可以借助于该事物的先验概率建立模型来进行评价和判断;在对生产过程中意外事故的发生率上也可以建立概率模型来预测。

当然建立模型的过程中先验概率和合理假设具有非常重要的影响,比如,如果先验概率是一个特定群体的概率,而在建立模型的时候把这个特定群体的概率用到大众群体上来,就必然会导致模型预测的重
大偏差。

又如,如果在建立模型的时候假设不合理,把相互有影响的事件假设成独立事件,忽略了事物的内在影响,也会导致模型预测的失效,一个合理的模型,一定要建立在合理的假设前提下。

参考文献
[1] 薛毅,常金钢,程维虎,杨士林数学建模基础北京:北京工业大学出版社。

相关文档
最新文档