血样的分组检验数学建模
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题一血样的分组检验
摘要:本文以血样分组检验为原型,通过建立数学模型,利用概率统计,数学期望值等知识对如何分组检验以及什么情况下需要进行分组检验作出了合理的解释。
关键词:血样分组检验,数学模型,概率统计, 数学期望值
具体问题
在一个很大的人群中通过血样检测普查某种疾病,假定血样为阳性的先验概率为p (通常p很小)。为减少检验次数,将人群分组,一组人的血样混合在一起化验。当某组的混合血样为阴性时,即可不经检验就判断该组每个人的血样都为阴性;而当某组的混合血样为阳性时,则可判断该组至少有一人血样为阳性,于是需要对该组的每个人在做化验。
(1)当p固定时(0.1%,…,1%,…)如何分组,即多少人一组,可使平均总检验数
最少,与不分组的情况比较。
(2)当p多大时不应分组检验。
(3)当p固定时如何进行二次分组(即把混合血样呈阳性的组再分成小组检验,
重复一次分组时的程序)。
(4)讨论其他分组方式,如二分法(人群一分为二,阳性组在一分为二,继续
下去),三分法等。
分析问题
本文对血样分组检验建立数学模型,目的就是要找到一种最佳的分组方案,对于一个数量固定的人群(假定人群数量为n 人),我们在决定哪一种分组方案最好或者需不需要分组时,可以引入数学平均值。
如果不分组,每个人都参加检验,则总共需要检验n次,每个人平均需要检验一次,如果分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,
反之,则不需要分组;在众多组合的分组中,哪一种分组计算出来的每个人的平均检验次数最小,则认为这种分组时最优的分组方案。这也是数学概率模型的基本思路。
在人群(数量很大)中进行血样检验,已知先验阳性率为p, 为减少检验次数将人群分组。若k人一组,当k份血样混在一起时,只要一份呈阳性,这组血样就呈阳性,则该组需人人检验;若一组血样呈阴性,则该组不需检验。
模型假设
结合本问题的实际情况,对该模型作出如下合理的假设:
1.人群数量总数为n人;
2.先验概率P在检验中为一常量,保持不变;
3.每个人检验一次是否阳性的概率相互独立,即每个人接受检验是互相独立事件,互不影响;
4.每次分组时都能达到平均分配,能分成m组,即m=n/k,m为正整数。
变量说明
根据提出的问题和模型假设,给出如下变量:
n---- 被检验人群的总数;
m----人群被分成的组数;
k----每组的人数;
k1----第二次分组时每组的人数;
p---- 先验阳性概率;
q=1- p----先验阴性概率;
ξ----每个人需要检验的次数,为一随机变量;
Eξ----ξ的期望值,每个人需要检验的平均次数。
模型建立
利用概率统计知识建立数学概率模型,由期望值知道,如果不分组,每个人都参加检验,每个人平均需要检验一次;如果分组,分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组。
在众多组合的分组中,比较哪一种分组计算出来的每个人的平均检验次数最小,平
均检验次数最小的那种分组则认为这种分组时最优的分组方案。
模型求解
问题二:当p 多大时,就不需要分组。
在分组情况下,由模型假设知每组的人数为k (2k n ≤≤);变量ξ表示每人的检验次数;阳性的先验概率为p ;阴性的先验概率p q -=1。
如果一组检验为阴性,则表明该组中的每个人均不是病毒的感染者,又因为每个人是否是感染是相互独立的(模型假设),所以可以求得一组检验为阴性的概率为k q ,即该组中的每个人平均检验次数为
k
1
次(该组总共只检验了一次)。 如果一组检验为阳性,则表明该组中有病毒感染者,因为一组检验为阴性的概率为
k q ,所以一组检验为阳性的概率为k q -1(一组检验要么为阴性,要么为阳性),即该组
中的每个人平均检验次数为k
1
1+次(除了该组检验了一次外,该组中的每个人又被逐个检验一次)。
所以可以得到ξ的分布律为:
由上表可求得ξ的期望值E ξ:
111(1)(1)1k k k E q q q k k k
ξ=
⋅++⋅-=-+ 即每个人的平均检验次数为1
1k q k
-+次,人群(总共n 个人)的平均检验次数为
)1
1(k
q n E n k +-⋅=⋅ξ次。
由概率模型知,只有当1<ξE 时才需要分组,即分组检验要满足1<ξE 这个约束条件:
由E ξ=11111k
q q p p k -+
<⇒>⇒->⇒<-即只有当满足约束条件1
p <-
因为k 只能取整数,所以1
是一个离散型变量,为了更形象地讨论问题,故引入与1
()1p x =-,(2x n ≤≤) 对()1
p x =进行求导,求导过程如下: '''
()(1
p x ==- 设
y =
则'''()
p x y =-=-
对
y =两边求对数有:
ln ln
y = ,
对ln ln
y =两边求导有:
1'
'''111(ln )(ln())(ln )x
y x x x ===
即 '22221111111
ln ()ln y x y x x x x x x x
=-+-=--
1'
2222221111111111(ln )(ln (ln )()x y y x x x x x x x x x x =--=--=--
所以11
'''
222111111()(ln )()()(1ln )x x p x y x x x x x x x =-=-=---=⋅⋅-
即 1'
211()()(1ln )x p x x x x
=⋅⋅-
由此可以看出,当e x >时,'()0p x <,函数()1
p x =单调递减,而2x e ≤<时
(分组时每组至少要有2人,故有2x ≥),'()0p x >,函数()1
p x =单调递增,在e
x =时(自然对数e 约等于2.71828),'()0p x =,函数()1
p x =取得最大值,此时最大