血样的分组检验数学建模
数学建模论文-血样的分组化验模板

血样的分组化验摘要本问题所述的情况在医学统计、病毒检测等诸多问题中是首要解决的问题。
进行某种疾病的调查,需要大量的统计数据,而统计数据的取得主要靠实验的方法,这时候,我们就要考虑如何让分组使得我们处理问题的效率提高,花销最少,本文就是以找出最优分组为主要目的。
首先解决的是在阳性先验概率p固定情况下建立一个概率模型使化验次数最小的问题,我们设平均每人检验次数的函数为f(x),然后通过非线性方程数值解法对其求解,找到是化验次数最小的每组人数;接着要解决的是阳性先验概率p为多大时,就不应该再分组;再接下来,解决二次分组(即阳性组再分组检验)的问题,我们采用非线性规划模型利用LINGO软件求使化验次数最少的最优解;最后通过平均概率模型讨论其它类型的血样分组情况。
关键字:概率模型非线性方程数值解法非线性规划平均概率模型一、问题提出要在人群中(数量很大)找出某种病患者,为减少检验次数,通常采用筛选的办法。
即假设人群总数为 n, 将人群分成 m 组,每组的人数为 k,将每组的 k 份血样混在一起进行化验,若化验结果呈阳性,则需要对该组的每个人重新进行化验,以确定患者;若化验结果呈阴性,则表明该组全体成员均为阴性,不需要重新化验。
(1)已知先验阳性率为p,,当 p 固定时,如何分组可使得化验次数最小;(2)找出不必分组的先验阳性率p的取值范围;(3)讨论两次分组的情况,即检测为阳性的组再次分组检验的情况;(4)讨论其它分组方案,如半分法、三分法,这里我们采用平均概率模型进行分组。
二、基本假设①血样的检验结果只存在阴性和阳性两种结果, 即阴性与阳性的先验概率之和为1,即p+q=1;②假设先验概率p是对某个人检验一次,结果呈阳性的概率,并假设先验概率在检验中保持不变(即假设该概率p只与疾病有关,而对同一种疾病该值为常量);③用来抽样的随机人群相互独立(即不考虑是否有遗传性与病毒的传染);④为了简化模型,假设能够平均分配,进行再分组的时候,对呈阳性的组进行内分组。
血液分组化验模型的优化研究课题研究报告

血液分组化验模型的优化研究课题研究报告一、研究背景血液分组化验是临床医学中常用的一种检测方法,通过对血液中不同种类的抗原和抗体进行检测,可以确定血型和Rh因子等信息。
然而,传统的血液分组化验方法存在着操作繁琐、耗时长、易出现误判等问题,因此需要对其进行优化研究。
二、研究目的本研究旨在探索一种更加高效准确的血液分组化验模型,以提高临床医学中的诊断效率和准确性。
三、研究方法1. 数据采集:收集不同年龄、性别、地区等特征的样本数据,并记录其血型和Rh因子等信息。
2. 特征选择:根据收集到的数据,利用特征选择算法选取其中与血型和Rh因子相关性较高的特征。
3. 模型训练:利用机器学习算法对所选取的特征进行训练,并建立相应的预测模型。
4. 模型测试:将训练好的模型应用于新样本数据中进行测试,并评估其预测准确度。
四、研究结果经过多次实验和测试,本研究建立了一种基于机器学习算法的血液分组化验预测模型。
该模型采用了特征选择算法和支持向量机等机器学习算法,可以在较短的时间内对血型和Rh因子等信息进行准确预测。
与传统的血液分组化验方法相比,该模型具有操作简便、准确率高、耗时短等优点。
五、研究结论本研究建立的基于机器学习算法的血液分组化验预测模型具有一定的应用价值。
未来可以进一步完善该模型,并将其应用于临床医学中,以提高血液分组化验的诊断效率和准确性。
六、研究展望虽然本研究建立的血液分组化验预测模型已经取得了较好的实验结果,但仍存在着一些问题需要进一步解决。
例如,在数据采集过程中需要更加广泛地收集样本数据,并考虑到不同年龄、性别、地区等因素对结果的影响。
此外,在特征选择和模型训练过程中也需要考虑到更多因素,以提高模型的预测准确度。
因此,未来需要进一步深入研究和探索,以实现血液分组化验方法的优化和升级。
血样分组检验的数学模型

血样分组检验的数学模型摘要:本文为了解决减少血样检验次数这个实际问题,通过把人群分为若干组,每组若干人,易得到混合血样检验次数、阳性组的概率,进而引入阳性组数的平均值,从而得到平均总检验次数,最后通过一个人的平均检验次数的一元函数,把问题归结为一个关于每组人数k 的一元函数E(k) ,求解得kp kk E +=1)(;通过计算,得当p>0.307时不应分组;将第1次检验的每个阳性组再次分m 组,通过建立一个关于k ,m 的二元函数E(k,m),通过求导得稳定点函数,解方程组得:2/14/3,21--==p m p k 。
关键词:先验概率 平均总检验次数 血样的阴阳性 组的基数1 问题的提出在一个很大的人群中通过血样检验普查某种疾病,假定血样为阳性的先验概率为p(通常p 很小)。
为减少检验次数,将人群分组,一组人的血样混合在一起化验。
当某组的混合血样呈阴性时,即可不经检验就判定该组每个人的血样都为阴性;而当某组的混合血样呈阳性时,则可判定该组至少有一人血样为阳性,于是需要对这组的每个人再作检验。
(1)、当p 固定时(如0.01%,…,0.1%,…,1%)如何分组,即多少人一组,可使平均总检验次数最少,与不分组的情况比较。
(2)、当p 多大时不应分组检验。
(3)、当p 固定时如何进行二次分组(即把混合血样呈阳性的组再分成小组检验,重复一次分组时的程序)。
(4)、讨论其它分组方式,如二分法(人群一分为二,阳性组再一分为二,继续下去)、三分法等。
2 模型假设与符号约定2.1 血样检查到为阳性的则患有某种疾病,血样呈阴性时的情况为正常。
2.2 血样检验时仅会出现阴性、阳性两种情况,除此之外无其它情况出现,检验血样的药剂灵敏度很高,不会因为血样组数的增大而受影响。
2.3 阳性血样与阳性血样混合也为阳性。
2.4 阳性血样与阴性血样混合也为阳性。
2.5 阴性血样与阴性血样混合为阴性。
n 人群总数 p 先验概率血样阴性的概率q=1-p血样检验为阳性(患有某种疾病)的人数为:z=np 发生概率:x i P i ,,2,1, = 检查次数:x i R i ,,2,1, = 平均总检验次数:∑==xi i i R P N 13 问题的分析根据题意,由已知的先验概率是一个很小的数值,我们大可不必要一个一个地检验,为减少检验次数,我们通过一次分组,从而可使检验次数大大减少;然而通过再一次分组,可使结果进一步优化,从而达到一个更佳的结果。
数学建模论文 血样检测

论文二摘要一、问题的重述在一个人数很多的团体中普查某种疾病,为此要抽查N个人的血,可以有两种方法进行:(1)将每个人的血分别去捡;(2)按k个人一组进行分组,把从k个人抽来的血混合在一起进行检验,如果这混合血液程阴性反应,就说明这k 个人的血液呈阴性反应,这样这k 个人的血就只需验一次;如呈阳性,则再对这k 个人的血分别化验。
这样这k 个人的血总共要化验k+1次。
假如每个人化验呈阳性的概率为p,且这些人的试验反应是相互独立的。
二、模型的基本假设(1)血样检验时仅会出现阴性、阳性两种情况,除此之外无其它情况出现。
(2)检验血样的药剂灵敏度很高,不会因为血样组数的增大而受影响。
(3)阳性血样与阳性血样混合为阳性。
(4)阳性血样与阴性血样混合为阳性。
(5)阴性血样与阴性血样混合为阴性。
(6)每个人化验呈阳性的概率相等。
(7)试验反应是相互独立。
三、符号说明N:普查的团体总人数;k :每小组中的人数; p :每个人化验呈阳性的概率; q: 每个人化验呈阴性的概率;X: k 个人为一组时,组内每人化验的次数。
四、问题的分析由题意可知,目的就是通过比较两种化验方案,求解出合适的分组人数,使得在一个人数很多的团体中普查某种疾病时,抽血化验次数最少。
对于问题一,可以通过比较第二种方法N 个人的平均化验次数和第一种方法的化验次数,求出相应的分组人数k,使得第二种分组方法的平均化验次数少。
而对于问题二,即可求出N 个人平均化验次数与k 的关系式,在给定的p 足够小的情况下,求解出N 个人平均化验次数最小时k 的取值。
五、模型的建立与求解各人的血呈阴性反应的概率为q=1-p ,k 个人混合血液化验呈阴性的概率为q k ,相应的化验次数为1,每个人的化验次数为k1。
k 个人混合血液化验为阳性的概率为1-q k ,相应的化验次数为k+1,每个人的化验次数为kk 1+。
设以k 个人为一组时,组内每人化验的次数为X,则X 是一个随机变量,其分布律为X 的数学期望为E(X)=k1 q k+ k k 1+ (1-q k )N 个人平均需化验的次数为N ·E(X)= N ·[k1 q k + k k 1+ (1-q k )]由问题一,要使得N 个人分组的化验次数小于不分组时N 个人的化验次数,即 N ·[k1 q k + kk 1+ (1-q k )]<N 即为k1 q k+ k k 1+ (1-q k )<1即 1+k1- q k <1 即q>kk1- 对于第二问,即求p 无限小时,N ·E(X)最小时k 的值 N ·E(X)=N ·[k1q k +k k 1+ (1-q k )]= N ·[ 1+k1- q k ] 当p 无限小时,q k =(1-p)k =(1-p)p1-·kp -=e kp =1-kpN ·E(X)= N ·[ 1+k1- q k ]= N ·[ 1+k1-(1-kp)]=N ·(k1+kp)当k1=kp 时,N ·E(X)最小,k= p 21-, 又k 为整数,故k=[ p 21-]或k=[ p 21-]+1如k=[ p 21-]时,N ·E(X)最小,k=[ p 21-]如k=[ p1-]+1时,N ·E(X)最小,k=[ p 1-]+1六、模型的检验七、附录X的分布律为。
数学建模常用各种检验方法

各种检验方法1.单个总体2Nμσ的均值μ的检验:(,)2σ已知,关于均值的检验用ztest命令来实现.[h,p,ci]=ztest(x,mu,sigma,alpha,tail)2σ已知,关于均值的检验用ttest命令来实现.[h,p,ci]=ttest(x,mu,alpha,tail)2.两个正态总体均值差的检验(t 检验)还可以用t 检验法检验具有相同方差的2 个正态总体均值差的假设。
在Matlab 中由函数ttest2 实现,命令为:[h,p,ci]=ttest2(x,y,alpha,tail)3.分布拟合检验在实际问题中,有时不能预知总体服从什么类型的分布,这时就需要根据样本来检验关于分布的假设。
下面介绍2χ检验法和专用于检验分布是否为正态的“偏峰、峰度检验法”。
2χ检验法0 H :总体x的分布函数为F(x) ,1 H : 总体x的分布函数不是F(x).在用下述χ 2检验法检验假设0 H 时,若在假设0 H 下F(x)的形式已知,但其参数值未知,这时需要先用极大似然估计法估计参数,然后作检验。
偏度、峰度检验4.其它非参数检验Wilcoxon秩和检验在Matlab中,秩和检验由函数ranksum实现。
命令为:[p,h]=ranksum(x,y,alpha)其中x,y可为不等长向量,alpha为给定的显著水平,它必须为0和1之间的数量。
p返回产生两独立样本的总体是否相同的显著性概率,h返回假设检验的结果。
如果x和y的总体差别不显著,则h为零;如果x和y的总体差别显著,则h为1。
如果p 接近于零,则可对原假设质疑。
5.中位数检验在假设检验中还有一种检验方法为中位数检验,在一般的教学中不一定介绍,但在实际中也是被广泛应用到的。
在Matlab中提供了这种检验的函数。
函数的使用方法简单,下面只给出函数介绍。
signrank函数signrank Wilcoxon符号秩检验[p,h]=signrank(x,y,alpha)其中p给出两个配对样本x和y的中位数相等的假设的显著性概率。
数学建模经典论文五篇

1、 血样的分组检验在一个很大的人群中通过血样检验普查某种疾病,假定血样为阳性的先验概率为p(通常p 很小).为减少检验次数,将人群分组,一组人的血样混合在一起化验.当某组的混合血样呈阴性时,即可不经检验就判定该组每个人的血样都为阴性;而当某组的混合血样呈阳性时,则可判定该组至少有一人血样为阳性,于是需要对这组的每个人再作检验.(1)、当p 固定时(如0.01%,…,0.1%,…,1%)如何分组,即多少人一组,可使平均总检验次数最少,与不分组的情况比较. (2)、当p 多大时不应分组检验.(3)、当p 固定时如何进行二次分组(即把混合血样呈阳性的组再分成小组检验,重复一次分组时的程序).模型假设与符号约定1 血样检查到为阳性的则患有某种疾病,血样呈阴性时的情况为正常2 血样检验时仅会出现阴性、阳性两种情况,除此之外无其它情况出现,检验血样的药剂灵敏度很高,不会因为血样组数的增大而受影响. 3 阳性血样与阳性血样混合也为阳性 4 阳性血样与阴性血样混合也为阳性 5 阴性血样与阴性血样混合为阴性 n 人群总数 p 先验概率血样阴性的概率q=1-p血样检验为阳性(患有某种疾病)的人数为:z=np 发生概率:x i P i ,,2,1, = 检查次数:x i R i ,,2,1, = 平均总检验次数:∑==xi i i R P N 1解1设分x 组,每组k 人(n 很大,x 能整除n,k=n/x ),混合血样检验x 次.阳性组的概率为k q p -=11,分组时是随机的,而且每个组的血样为阳性的机率是均等的,阳性组数的平均值为1xp ,这些组的成员需逐一检验,平均次数为1kxp ,所以平均检验次数1kxp x N +=,一个人的平均检验次数为N/n,记作:k k p kq k k E )1(1111)(--+=-+=(1) 问题是给定p 求k 使E(k)最小. p 很小时利用kp p k -≈-1)1(可得kp kk E +=1)( (2) 显然2/1-=p k 时E(k)最小.因为K 需为整数,所以应取][2/1-=p k 和1][2/1+=-p k ,2当E (k )>1时,不应分组,即:1)1(11>--+k p k,用数学软件求解得k k p /11-->检查k=2,3,可知当p>0.307不应分组.3将第1次检验的每个阳性组再分y 小组,每小组m 人(y 整除k,m=k/y ).因为第1次阳性组的平均值为1xp ,所以第2次需分小组平均检验1yxp 次,而阳性小组的概率为m q p -=12(为计算2p 简单起见,将第1次所有阳性组合在一起分小组),阳性小组总数的平均值为21yp xp ,这些小组需每人检验,平均检验次数为21yp mxp ,所以平均总检验次数211yp mxp yxp x N ++=,一个人的平均检验次数为N/n,记作(注意:n=kx=myx)p q q q mk p p m p k m k E m k -=-+-+=++=1),1()1(111),(211 (3) 问题是给定p 求k,m 使E (k,m )最小.P 很小时(3)式可简化为21),(kmp mkpk m k E ++≈ (4)对(4)分别对k,m 求导并令其等于零,得方程组:⎪⎪⎩⎪⎪⎨⎧=+-=++-0012222kp m kp mp mp k 舍去负数解可得:2/14/3,21--==p m p k (5)且要求k,m,k/m 均为整数.经在(5)的结果附近计算,比较E(k,m),得到k,m 的最与表1比较可知,二次分组的效果E(k,m)比一次分组的效果E(k)更好.2、铅球掷远问题铅球掷远比赛要求运动员在直径2.135m 的圆内将重7.257kg 的铅球投掷在 45的扇形区域内,建立模型讨论以下问题1.以出手速度、出手角度、出手高度 为参数,建立铅球掷远的数学模型;2.考虑运动员推铅球时用力展臂的动 作,改进以上模型.3.在此基础上,给定出手高度,对于 不同的出手速度,确定最佳出手角度 问题1模型的假设与符号约定1 忽略空气阻力对铅球运动的影响.2 出手速度与出手角度是相互独立的.3 不考虑铅球脱手前的整个阶段的运动状态. v 铅球的出手速度 θ 铅球的出手角度 h 铅球的出手高度 t 铅球的运动时间 L 铅球投掷的距离g 地球的重力加速度(2/8.9s m g=)铅球出手后,由于是在一个竖直平面上运动.我们,以铅球出手点的铅垂方向为y 轴,以y 轴与地面的交点到铅球落地点方向为x 轴构造平面直角坐标系.这样,铅球脱手后的运动路径可用平面直角坐标系表示,如图.因为,铅球出手后,只受重力作用(假设中忽略空气阻力的影响),所以,在x 轴上的加速度0=,在y 轴上的加速度g a y -=.如此,从解析几何角度上,以时间 t 为参数,易求得铅球的运动方程:⎪⎩⎪⎨⎧+-==h gt t v y t v x 221sin cos θθ 对方程组消去参数t ,得h x x v gy ++-=)(tan cos 2222θθ……………………………………………(1) 当铅球落地时,即是0=y ,代入方程(1)解出x 的值v ggh gh v g v x θθθθθ2222sin 22cos sin cos sin 2-++=对以上式子化简后得到铅球的掷远模型θθθ22222cos 22sin 222sin g v h g v g v L +⎪⎪⎭⎫ ⎝⎛+=………………………………(2) 问题2我们观察以上两个阶段,铅球从A 点运动到B 点,其运动状态是匀加速直线运动的,加速距离是2L 段.且出手高度与手臂长及出手角度是有一定的联系,进而合理地细化各个因素对掷远成绩的约束,改进模型Ⅰ.在投掷角度为上进行受力分析,如图(3)由牛顿第二定 律可得,ma mg F =-θsin 再由上式可得,θsin g mFa -=………………………………………(3) 又,22022aL v v =-,即22022aL v v += (4)将(3)代入(4)可得,θsin 2222202g L m FL v v -⎪⎭⎫⎝⎛+= ………………………(5) (5)式进一步说明了,出手速度v 与出手角度θ有关,随着θ的增加而减小.模型Ⅰ假设出手速度与出手角度相互独立是不合理的. 又根据图(2),有θsin 1'L h h += (6)由模型Ⅰ,同理可以得到铅球脱手后运动的距离θθθ22222cos 22sin 222sin g v h g v g v L +⎪⎪⎭⎫ ⎝⎛+= 将 (4)、(5)、(6)式代入上式整理,得到铅球运动的距离()⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⎥⎦⎤⎢⎣⎡-⎪⎭⎫⎝⎛++++-⎪⎭⎫ ⎝⎛+=θθθθθ22220'2220sin sin 22sin 2112sin 2sin 22g L m FL v h g g g L m FL v L 对上式进行化简:将m=7.257kg,2/8.9s m g = 代入上式,再令m h 60.1'= (我国铅球运动员的平均肩高),代入上式进一步化简得,()⎪⎪⎭⎫ ⎝⎛-++-++⨯θθθθθ2222232222sin sin 6.192756.06.19sin 6.19sin 2756.0sin 1L FL v L FL v ………………(7) 所以,运动员投掷的总成绩θcos 1L L S +=问题3给定出手高度,对于不同的出手速度,要确定最佳的出手角度.显然,是求极值的问题,根据微积分的知识,我们要先求出驻点,首先,模型一中L 对θ求导得,g hv g v g hv v g v d dL θθθθθθθθ22224242cos 82sin sin cos 42cos 2sin 2cos +-+=令0=θd dL,化简后为, 0sin cos 42cos 2sin cos 82sin 2cos 2422242=-++θθθθθθθhgv v hgv v v根据倍角与半角的三角关系,将以上方程转化成关于θ2cos 的方程,然后得,hv g g vgh gh222cos +=+=θ (3)()θθ2sin sin 6.192756.051.0222L FL v L -+=从(3)式可以看出,给定铅球的出手高度h ,出手速度v 变大,相应的最佳出手角度θ也随之变大.对(3)式进行分析,由于0,0>>θh ,所以02cos >θ,则40πθ≤<.所以,最佳出手角度为)arccos(212vgh gh +=θ θ是以π2为周期变化的,当且仅当N k k ∈⎪⎭⎫⎝⎛∈±,4,02ππθ时,πθk 2±为最佳出手角度.特别地,当h=0时(即出手点与落地点在同一高度),最佳出手角度︒=45α3、零件的参数设计粒子分离器某参数(记作y )由7个零件的参数(记作x x 12,,…x 7)决定,经验公式为:y x x x x x x x x x x x =⎛⎝ ⎫⎭⎪-⎛⎝ ⎫⎭⎪⨯--⎛⎝ ⎫⎭⎪⎡⎣⎢⎢⎤⎦⎥⎥⎛⎝ ⎫⎭⎪-17442126210361532108542056324211667......y 的目标值(记作y 0)为1.50。
血样的分组检验社会建模

血样的分组检验社会建模
本文档旨在探讨血样的分组检验在社会建模中的应用。
我们将介绍分组检验的概念和步骤,并探讨其在社会建模中的重要性和意义。
什么是分组检验?
分组检验是一种统计分析方法,用于比较两个或多个独立的群体之间的差异。
在研究设计和数据收集阶段,参与者被随机分配到不同的组别,在实验条件相同的情况下接受不同的处理。
分组检验的目的是确定不同处理组之间是否存在显著差异,从而推断某种因素对研究结果的影响。
步骤
进行分组检验的一般步骤如下:
1. 设定研究目的:明确要比较的群体和研究问题。
2. 随机分组:使用随机抽样或其他随机分组方法将参与者分配到不同的组别。
3. 操作处理:在不同组别中施加相应的处理或干预措施。
4. 数据收集:收集参与者在实验后的相关数据。
5. 统计分析:使用合适的统计方法对数据进行分析和比较。
6. 结论和解释:根据统计结果得出结论,并解释不同组别之间的差异和潜在原因。
分组检验在社会建模中的意义
社会建模是一种运用数学、统计和计算机模拟等方法研究社会系统的方法。
在社会建模中,分组检验能够帮助我们比较不同社会群体或不同政策干预对社会系统的影响。
通过分组检验,我们可以获得社会建模所需的实证证据,验证社会理论的有效性和可行性,以及为政策制定提供重要参考。
总结
分组检验是一种用于比较两个或多个独立群体之间差异的统计方法。
在社会建模中,分组检验可以用于验证社会理论的有效性,并为政策制定提供实证支持。
使用分组检验能够使我们更好地理解和分析不同社会群体或政策对社会系统的影响,从而为社会建模提供有力的工具和参考。
血样的分组检验模型

循环赛名次排序方法的探讨与应用信科0703班 07271084 游玲君问题分析该题给出的竞赛图不是唯一完全路径图,如:81107469253V V V V V V V V V V →→→→→→→→→和81071469253VV V V V V V V V V →→→→→→→→→就是该竞赛图的两条完全路径.它也不是双向连通竞赛图,因为对于1V ,7V ,10V,任何一对定点仅存在一条有效路径使两点可以相互连通。
该题属于书本P246所提到的第三种类型竞赛图,无法全部排名,但如果不考虑1V,7V,10V,那么竞赛图就是双向连通图,可以用双向连通图名次排序的一般方法.问题求解首先,由题意得到竞赛图的邻接矩阵0111110011001001000000000000000010000010011000000000101000101111110010111111101101101000000111111010A ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦接下来,计算各级得分向量()k s在matlab 的command 窗口输入:>> clear >> A=[...0 1 1 1 1 1 0 0 1 1 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 0 0 1 0 0 1 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 1 0 1 1 1 1 1 1 0 0 1 0 1 1 1 1 1 1 1 0 1 1 0 1 1 0 1 0 0 0 0 0 0 1 1 1 1 1 1 0 1 0 ]; e=[... 1 1 1 1 1 1 1 1 1]; s1=A*e s1 =7 2 0 5 2 3 7 9 3 7>> s2=A*s1 s2 =22 3 0 10 2 5 22 36 4 22同理,各级得分向量计算结果如下:(1)(2)(3)(4)72246792356000051014192235,,,356872246799369017134587224679s s s s ⎡⎤⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥====⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎥⎢⎢⎥⎢⎥⎢⎥⎢⎣⎦⎣⎦⎣⎦⎣⎦(5)6(7)125190280813170002738526813,,,131722125190280283440660111421125190280s s s ⎡⎤⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎥⎢⎥⎢⎥⎢⎥⎥⎢⎥⎢⎥⎢⎥⎥⎢⎥⎢⎥⎢⎥⎥⎢⎥⎢⎥⎢⎥⎥⎢⎥⎢⎥⎢⎥⎥⎢⎥⎢⎥⎢⎥⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦进一步,计算A 的最大特征根和特征向量(归一化后)在matlab 的command 窗口输入:>> max(eig(A))ans =1.3953>> b=1.3953;[a,b]=eig(A)计算出A 的最大特征根 1.3953λ=, 归一化后的特征向量[]0.1716,0.0091,0,0.0283,0.0065,0.0126,0.1716,0.4175,0.01120.1716TS =初步排名结果: 第一名:8V第二名:1V ,7V,10V并列第五名:4V 第六名:6V 第七名:9V 第八名:2V 第九名:5V 第十名:3V分析:这种方法计算()k s,无论k 取到多大,1V ,7V,10V的各级得分均相等,名次均相同。
基于极大似然估计法的血样分组检测

基于极大似然估计法的血样分组检测
李勇刚;陈春艳
【期刊名称】《生物技术世界》
【年(卷),期】2015(000)012
【摘要】群试理论在医学血液样本的病毒检验上被广泛运用,其中建立的矩阵已经发展到有纠错能力的析取矩阵.然而在构造析取矩阵时比较复杂,而且在检测混合血样时,存在阳性的血样当遇到有抑制剂的血样时,可能混合血样并不能如实的检测出阳性.考虑到这些问题,文章对群试理论进一步探索,把极大似然估计运用到群试理论中,并通过运算检测.
【总页数】2页(P277-278)
【作者】李勇刚;陈春艳
【作者单位】广西师范大学漓江学院;广西钦州市合浦师范学校
【正文语种】中文
【中图分类】R440
【相关文献】
1.基于极大似然估计法的磁力计误差补偿算法 [J], 刘宇;吴林志;路永乐;陈俊杰
2.关于血样分组检验的探讨 [J], 涂宝标
3.末梢血样与静脉血样行血常规检测的差异性分析 [J], 姚怡帆
4.末梢血样与静脉血样行血常规检测的差异性探讨 [J], 张凡
5.CK-MB质量检测与CK-MB活性检测在脑损伤合并胃肠道疾病患者血样中检测结果的比较 [J], 姜振伟;杨为斌;周凡;唐红梅;欧阳妍雪;张茹茹
因版权原因,仅展示原文概要,查看原文内容请购买。
血样的分组检验

《数学建模与计算》问题血样的分组检验摘要:本文以血样分组检验为原型,通过建立数学模型,利用概率统计,数学期望值等知识对如何分组检验以及什么情况下需要进行分组检验作出了合理的解释。
关键词:血样分组检验,数学模型,概率统计, 数学期望值具体问题在一个很大的人群中通过血样检测普查某种疾病,假定血样为阳性的先验概率为p (通常p很小)。
为减少检验次数,将人群分组,一组人的血样混合在一起化验。
当某组的混合血样为阴性时,即可不经检验就判断该组每个人的血样都为阴性;而当某组的混合血样为阳性时,则可判断该组至少有一人血样为阳性,于是需要对该组的每个人在做化验。
(1)当p固定时(0.1%,…,1%,…)如何分组,即多少人一组,可使平均总检验数最少,与不分组的情况比较。
(2)当p多大时不应分组检验。
(3)当p固定时如何进行二次分组(即把混合血样呈阳性的组再分成小组检验,重复一次分组时的程序)。
(4)讨论其他分组方式,如二分法(人群一分为二,阳性组在一分为二,继续下去),三分法等。
分析问题本文对血样分组检验建立数学模型,目的就是要找到一种最佳的分组方案,对于一个数量固定的人群(假定人群数量为n 人),我们在决定哪一种分组方案最好或者需不需要分组时,可以引入数学平均值。
如果不分组,每个人都参加检验,则总共需要检验n次,每个人平均需要检验一次,如果分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组;在众多组合的分组中,哪一种分组计算出来的每个人的平均检验次数最小,则认为这种分组时最优的分组方案。
这也是数学概率模型的基本思路。
在人群(数量很大)中进行血样检验,已知先验阳性率为p, 为减少检验次数将人群分组。
若k人一组,当k份血样混在一起时,只要一份呈阳性,这组血样就呈阳性,则该组需人人检验;若一组血样呈阴性,则该组不需检验。
模型假设结合本问题的实际情况,对该模型作出如下合理的假设:1.人群数量总数为n人;2.先验概率P在检验中为一常量,保持不变;3.每个人检验一次是否阳性的概率相互独立,即每个人接受检验是互相独立事件,互不影响;4.每次分组时都能达到平均分配,能分成m组,即m=n/k,m为正整数。
血液分组化验模型的优化研究课题研究报告

1 k -q 取得最小值 ? k 如果把一次分组化验得到的 阳 性 组 不 直 接 对 该 组 每 份 血 样逐份化验 , 而是 把 阳 性 组 中 每 个 人 的 血 样 各 取 出 一 部 分 混 合在一起 , 再一 次 分 组 , 分 成 若 干 个 小 组, 然后化验各个小组 的混合血样 : 若呈阴性 , 则该小 组 血 样 全 部 呈 阴 性 ; 若 呈 阳 性, 再对该小组各份 血 样 逐 个 化 验 , 我们把这种化验方式称作二 次分组化验 。 采取二次分组化验时 , 假设 将 每 个 大 组 分 为l 个 小 组 , 每 个小组有 m 份 血 样 , 即 每 个 大 组 有l m 份 血 样。对 一 个 大 组 l m , 来说 , 该大组化验呈 阴 性 的 概 率 为 q 对应的每份血样平均 1 ; 该大 组 化 验 呈 阳 性 , 并 且 该 大 组 中 的l 个 小 l m 1 m l 1 ( 组中恰有 1 个小组呈阳性的概率为 Cl 对应 1-qm ), q ) ( 化验次数为 的每份血样平均 化 验 次 数 为
要 : 课题组运用概率论与微分学基本理论研究了血液分 组 化 验 问 题 。 对 于 大 规 模 的 疾 病 排 查 , 通过恰当分组化验可降低
( 邢台医学高等专科学校数学教研室
1 前言 对于大规模的 化 验 检 查 可 采 取 分 组 化 验 , 恰当地分组可 减少化验次数 降 低 成 本 。 已 有 的 研 究 成 果 表 明 , 分组化验并 不是每组人数越多越好 , 也不 是 每 组 人 数 越 少 越 好 。 比 如 , 当 血样阳性概率 ( 先验概率 ) 为 5% 时 , 采用一次分组化验 将 总 体 分为 5 人一组平均 化 验 次 数 最 少 ; 当 血 样 阳 性 概 率 为 5‰ 时 , 将总体分为 1 5人 一 组 平 均 化 验 次 数 最 少。而 当 血 样 阳 性 概 率小到一定程度 , 采取二次分组化验有望能使平均化验次数 更少 。 例如 , 当血样阳 性 概 率 为 1‰ 时 , 采用二次分组化验第 一次分组分为 1 第二次分组分为1 这种 1 0人 一 组、 0 人 一 组, 。 分组方案能够 使 平 均 化 验 次 数 更 少 ( 相 对 于 一 次 分 组 化 验) 理论推导表明 , 当血样阳性率在 某 一 确 定 范 围 时 , 通过恰当分 组可显著降低化验次数 , 且血样 阳 性 概 率 越 小 , 平均化验次数 降低率越高 。 这对于大范围 、 大规模的人群疾病普查( 如甲肝 普查 ) 工作效率的提高无疑是十分重要的 。 从之前已公开 发 表 的 探 讨 分 组 化 验 问 题 的 著 述 看 , 重庆 工学院的涂宝标 、 河北职工医学 院 的 张 艳 娥 、 新疆工学院的王 为、 苏州医学院 的 张 贵 生 、 辽 宁 卫 生 职 业 技 术 学 院 的 张 乐 成、 第二炮兵工程学院的毕义明等 学 者 都 曾 对 分 组 化 验 最 佳 分 组 方式进行过研究 。综合起来看 , 对于血液分组化验最佳分组的 存在性尚未从数 理 上 给 予 严 格 证 明 , 又因为分组化验模型涉 及超越方程 , 而超越方程求解一 般 来 说 比 较 困 难 , 致使之前的 研究或者是只得 出 了 最 佳 分 组 人 数 近 似 公 式 , 或者是估计公 , 式, 或者是只给出了程序性算 法 ( 计 算 量 很 大) 且尚未准确揭 示出最佳分组 规 律 。 也 就 是 说 , 人们对分组化验最佳分组问 题的研究还没有得出比较完备的结论 。 方法和步骤 2 研究内容 、 2. 1 研究内容 , 假设需要化验的血样份数为 N ( 把这 N 份 血 N 相当大 ) 样分为若干组 , 每组 k 份 。 把 每 一 组 中 的 k 份 血 样 各 取 一 部 分混合在一起进行化验 : 若混合 液 呈 阴 性 , 则说明这个组的每 份血样都呈阴性 , 于是这个组的 k 份 血 样 就 只 需 化 验 1 次 , 每 收稿日期 : 2 0 1 5 0 6 1 0
论文 化验结果诊断的数学模型

化验结果诊断的数学模型摘要本文就健康人和某病患者体内Zn、Cu、Fe、Ca、Mg、K、Na七种元素含量的不同,建立相应数学模型来判断任一一个就诊人员是否为患病者。
对于问题一,我们采用费歇尔判别模型。
利用表1确诊病例的化验结果(其中1-30号为确诊患者和31-60号为健康人)中的全部数据建立费歇尔模型,形成简单的判别方法;之后用表1中的数据对该模型进行检验,继而对该模型的正确性做出判断。
通过检验我们发现,该模型具有很高的可信度,正确率达95%,可以作为一种简便的判别方法。
对于问题二,我们利用问题一中提出的方法对表2中15名就诊人员的化验结果进行了判别,判别结果为61、62、63、64、66、67、68、71、75共9位就诊人员为患病,其他就诊人员为健康。
对于问题三,我们采用主成分分析法再次对表1中的60组数据进行分析,确定影响该病诊断的主要因素为Zn、Ca、Mg、K四种元素。
重复解决问题二,其结果与问题一中建立费歇尔模型的判定结果相一致。
关键词:化验结果诊断费歇尔判别模型主成分分析法回判一、问题重述日常生活中,到医院诊断时通常要检验各种元素的含量,根据各项指标的含量是否异常来判断是否患有某种疾病。
表1中1-30号为确诊为患病的病例关于病例Zn、Cu、Fe,Ca、Mg、K、Na七种指标的化验结果,31-60是健康人相同的7中指标的化验结果。
依据题中所给的数据,我们要解决以下两个问题:问题一:根据表1中60名就诊人员的化验结果确定一种简单方法来判断就诊人员是否为该病炎患者,并对该判断方法进行检验看其是否正确。
问题二:依据问题一确定的判断方法对表2中15名就诊人员的化验结果进行判断,看其健康还是该病的患者。
问题三:依据表1的数据,确定对该疾病诊断有较大影响的元素。
二、问题分析针对问题一:主要根据表1中60名就诊病例的七个指标,找到一种简单判别方法来确定就诊人员是否患病。
由于每个个体七项指标的数据是相对独立的,因此我们采用了费歇尔模型,即借助方差分析思想构造一个判别函数(多元函数),再根据表1中60名病例的相关数据确定多元函数各元的系数;最后,我们采取回判法,进行模型正确性检验。
数学建模实验-血液酒精浓度

数学建模实验实验目的?运用药物注射模型,熟练使用MATLAB曲线拟合方法,解释饮酒驾车的一些实际问题。
?实验原理?由于酒精不需要进入肠道即可被吸收,且胃对其吸收速率也非常快,本题应采用“快速静脉注射模型”。
?,因A1,α,B1,/百毫升,小于8080毫克/(1)?(2)?短时间内喝啤酒3瓶多长时间之后才能驾车??(3)?怎样估计血液中的酒精含量在什么时候最高??(4)?如果天天喝酒,是否还能开车?解答:建立常微分方程模型,假设喝进去的酒精从胃吸收的转移速率与胃里酒精含量成正比;血液代谢酒精的速度与浓度成正比;如图所示:则((X t C t +⎧⎪⎨+⎪⎩即'X =-即X X =解得()C t MATLAB cftool (c exp b -⨯拟合得:即第一题喝一瓶啤酒时X0=51.7,此时()0.1822 2.27356.205356.2053t t C t e e -⨯-⨯=⨯-⨯而() 2.27365651.7 6.174210X e -⨯-=⨯=⨯()0.18226 2.2736656.205356.2053=18.836720C e e -⨯-⨯=⨯-⨯<,故符合驾车标准紧接着又喝一瓶,此时X0约为51.7,C0=18.8367。
到凌晨二点过了8小时,此时()()0.18228 2.2738856.205318.836756.205317.4693C e e -⨯-⨯=+⨯-⨯=可以发现并没有大于20,但是当过后7.2小时时()()0.18227.2 2.2737.27.256.205318.836756.205320.2106C e e -⨯-⨯=+⨯-⨯=,略大于20,属于酒驾。
题目所给情况可能是晚上喝酒不是快速喝下导致的误差。
第二题 短时间喝三瓶啤酒时X0=155.1,此时()0.1822 2.273168.616168.616t t C t e e -⨯-⨯=⨯-⨯MATLAB 命令:T=0:0.1:24;C=168.616*exp(-0.1878*T)-168.616*exp(-1.971*T);plot(T,C,’r’)holdonplot([024],[2020],’g’)得可发现与C=20相交于11、12之间T=11:0.1:12;C=168.616*exp(-0.1878*T)-168.616*exp(-1.971*T)输出:C=1至7列21.366520.969020.578920.196019.820219.451519.08968至11列故11.4题目三输出:C=1至6列7至11列第四题2.273t n e -⨯⨯ 要求:()2420C <,()()()0.1822 2.273'2456.20532456.205320t t C n C e n e -⨯-⨯=+⨯-⨯<,()()()0.1822 2.273''2456.2053'2456.205320t t C n C e n e -⨯-⨯=+⨯-⨯<依此类推考虑到48小时后的影响很小,故只需在数日内符合即可认为符合,这里取十天。
关于血样检验的探讨

关于血样分组的探讨摘要:在医学中,血样检验问题一直是一直比较常见的问题。
本论文就是根据我们在生活中血样检验问题,进行了对是否进行血样分组,在什么情况需要进行血样分组检验,以及在需要分组的情况下,我们应该采取什么样的分组。
首先,我们提出了两个概率论与数理统计的数学模型。
模型一是:一次分组法,即只进行一次分组的情况下,我们如何分组使得:()1/11/1(1)k k E x k q k p =+-=+--最小,这样我们就达到了在一次分组情况下最优分组方法。
模型二是:二次分组法,即只进行两次分组的情况下,我们如何进行这两次分组使得:21112111()1//1//,(2,2)E x k p k p p k kp k kk p k k =++=++≥≥最小,这样我们就得到了在两次分组的情况下最优的分组方法。
在问题一中,我们应用数学模型一(一次分组法)对问题分析,先是定量的分析,用matlab 绘出了9组不同p 值情况下函数()1/1(1)k E x k p =+--随k 值变化的曲线;接着是计算出了对应p 之情况下的最优k 值和取得最小()E x 。
在问题二中,我们同样是采用了模型一(一次分组法)对问题分析,先分析当()1E x =时的临界状态,得出临界状态时p 与k 的函数关系:11,(2)k p k k=-≥,再次通过matlab 绘图观察p 与k 的函数关系发现当p 值大于某个值时,无论如何分组都无法使得()1E x <,然后通过数学计算对函数进行定量计算分析得出:当0.306639p <时,我们可以通过改变分组,改变k 值来满足分组检验的约束条件;当0.306639p ≥时,我们无法通过改变分组,使k 值满足分组检验的约束条件。
接着进一步分析了对于较小p 值时,如何应用一次分组法进行分析讨论得到最优的分组。
在问题三中,我们运用了模型二(二次分组法)对问题分析,通过数学求导对函数2111()1//,(2,2)E x k kp k kk p k k =++≥≥进行分析,得到其偏导函数组,进行数学分析计算得出在二次分组情况下的最优解。
数学建模课程设计(血样的分组检验)

血样的分组检验摘要: 本文以医学的调查统计为基础,进行抽象,利用概率论知识组建模型,对何时分组和怎样分组给出了详尽的讨论并对结果进行了符合实际情况的解释,结合真实的数据对模型进行了验证,最后对模型加以改进和推广。
1. 问题描述要在人群中(数量很大,基本上是健康人)找出某种病毒的感染者,为减少检验次数(目的是降低费用),通常采用筛选的办法。
即假设人群总数为n ,将人群分成m 组,每组的人数为k ,将每组的k 份血样混在一起进行化验,若化验结果呈阳性,则需要对改组的每个人重新进行化验,以确定谁是病毒感染者;若化验结果呈阴性,则表明该组全体成员均为阴性,不需要重新化验。
(1) 已知阳性的先验概率为p ,当p 固定时,如何分组可使得化验次数最小; (2) 找出不应分组的p 的取值范围;(3) 讨论两次分组的情况,即检测为阳性的组再次分组检验的情况。
2. 问题的分析本问题所述的情况在医学统计、病毒检测等诸多医学问题中是必须首要解决的问题。
进行某种疾病的调查需要大量的统计数据,而统计数据的取得主要靠实验的方法,这就不可避免地要面临如何分组的问题是效率最高(花销最少),找出最优分组方法是本文的主要目的。
由于人群总体数固定,在讨论问题时,我们可以借助于平均每人检验次数这个量来衡量分组与不分组情况的好坏,这是概率模型的主要思路。
对于该问题,若不分组,一个人一个人检验,共需检验n 次,平均每个人检验一次;采取分组的方法,直观上可以感觉到会降低检验次数。
分组时计算每个人的平均检验次数,若该值小于1,即认为分组比不分组好。
对于两次分组的问题,也采用上述思路,只要两次分组时平均每个人检验次数小于一次分组时平均每个人的检验次数,就可以认为两次分组的方法优于一次分组的方法。
3. 模型假设与符号说明下面给出该模型的基本假设:(1) 在实际操作中,多次分组的方法要比只分一次组或不分组的方法操作起来繁琐、耗时,且需要更多的人力把工作的重点放在分组的方案上,实际增加了开支。
数学建模血液检测建立概率模型的基本思想

数学建模血液检测建立概率模型的基本思想
「概率模型」:假设事先已经知道所需检测的个样本中有个是阳性的,其中;「组合模型」:假设事先已经知道所需检测的个样本中有个是阳性的,其中;「竞争模型」:事先既不知道也不知道。
同时介绍了相应的三个理论结果,在什么情况下,组合检测法需要的检测次数比逐一检测法需要的检测次数少。
每次检测哪些样本组,要依赖以前的检测及其结果。
一个序贯方法如果需要做次检测才能检测出所有的坏样本,而每次检测需要时间的话,整个检测过程就可能需要时间。
如果想缩短时间,那么除了尽可能地减少检测次数,还有一个方法就是在时间内同时(并行地)检测若干(而不是一个)样本组。
血液检测与数学模型

数零拾学血液检测已成为医院检查的常规手段.在新冠肺炎疫情爆发后,核酸检测成为确诊是否患有新冠肺炎的病原学检测的主要方法.那么如何用最少的成本(检验次数和时间),在大量的血液样本中准确地检验出哪些是阴性的(好的),哪些是阳性的(坏的)?一、组合检测法1943年,美国统计学家罗伯特·多尔夫曼(R.Dor⁃fman )为美国公共健康服务和筛选服务系统设计了一个组合检测法:首先,将所要检测的N 个样本中的每一个样本都分成两部分(类似于现在兴奋剂检测采用的A 瓶和B 瓶方法);然后,将N 个A 瓶样本分成N5组,每组5个血液样本充分混合,得到了N5个样本;最后,将N5个样本组,每一个组每一个组进行检测.这样检测一个样本组可能出现的结果是:(1)如果某一个样本组显示是阴性的,那么说明该组样本中的每一个样本都是好的.这样我们通过检测1次就确认了5个样本都是阴性的,从而比逐一检测法(一个一个地进行检测)少用了4次.(2)如果某一个样本组显示是阳性的,那么说明该组样本中至少有一个样本是不好的,但是不清楚哪一个或者哪几个是阳性的;因而需要对该组中5个样本的B 瓶,进行逐一检测以便确认每个样本是阴性的还是阳性的.这样我们通过6次检测可以确认5个样本是阴性还是阳性的,比逐一检测法多用了1次.不难看出,如果在所有样本中阳性的比较少,那么组合检测法会减少大量的检测次数.可是如果在所有样本中阳性的比较多,那么组合检测法很有可能不仅不会减少检测的次数,还会增加检测的次数.由此就产生了一个问题:什么时候组合检测法可以减少检测的次数,什么时候不可以呢?1960年,美国生物学家皮特·昂加尔(P.Ungar )对这个问题进行了研究.他假设所需检测的N 个样本有pN 个是阳性的,其中0<p <1;每组可以包含任意多的血液样本(不再限定最多5个样本),而且每一个样本可以重复使用(一个血液样本可以分装在很多瓶子里).在这种假设下,他证明:当38.2%的样本是阳性的时候,组合检测法平均需要的检测次数比逐一检测法需要的检测次数少.多尔夫曼和昂加尔对血液检测问题的研究激发了很多后续的相关研究,很多有意思的数学模型和方法也先后被提出来,并逐渐形成了一个研究方向:组合检测/搜索.二、组合模型假设事先已经知道所给的N 个样本中有d 个是阳性的,其中0<d <N .下面先考虑最简单的情形,看看组合检测法好呢,还是逐一检测法好呢?当d =1时(只有1个样本是阳性的),可以用二分法快速检测到这个阳性的样本,即将N 个样本尽量平均分成A 和B 两组,先检测A 组:1.如果A 组的检测结果显示是阳性(意味着B 组中的样本都是好的),那么再将A 组中的样本尽量平均分成两组A 1和A 2,并检测A 1组……2.如果A 组的检测结果显示是阴性(意味着A 组中的样本都是好的),那么将B 组中的样本尽量平均分成两组B 1和B 2,并检测B 1组……61数零拾学图1图1展示了用组合检测法对N=7个样本进行检测的过程,检测开始前已知只有1个是阳性的样本,但是不知道哪一个样本是阳性的.可以看出:当样本3是阳性的样本时,用2次检测就可以找到它;但是其他情况都需要3次检测.经过简单的计算可知:基于二分法的组合检测法用log2N次检测一定可以找到那个阳性的样本.图2图2展示了用逐一检测法对n=7个样本进行检测的过程.可以看出:当样本1是阳性的样本时,用1次检测就可以找到它;但是当样本6或者7是阳性的样本时,则需要6次检测.显然,逐一检测法需要6次才能确保找到那个阳性的样本.另外,当d=N-1时(只有1个样本是阴性的),此时使用组合检测法是没有任何意义的,因为将任意两个样本放到一起进行检测,(不用检测就可以推断出)结果一定是阳性的,所以逐一检测法是最好的.上面是两个最极端的情形:只有一个样本是阳性的,或者只有一个样本是阴性的.前一种情形,运用组合检测法检测最好,后一种情形,运用逐一检测法检测最好.下面我们来考虑非极端的情形,比如N=9,d=2,采用组合检测法7次检测就可以了,比逐一检测法用的检测次数少一次.而当N=9,d=3,你会发现采用组合检测法需要8次检测,与逐一检测法用的检测次数是一样多.那么什么时候组合检测法比逐一检测法用的检测次数少?即,给定N个样本,并且已知其中有d个样本是阴性的,当不超过多少时组合检测法用的次数少于N-1?1971年,运筹学家、应用数学家黄光明(F.K.Hwang)研究了上述问题.他将上述问题称为GroupTesting Problem,并用M(N,d)表示最优检测法所需的次数.显然M(N,d)≤N-1,当不等式取等号时,就表示逐一检测法是最优的.他证明:当2d+1≥N时,M(N,d)=N-1,即若已知有12以上的样本是阴性的,则逐一检测法是最好的.1981年,黄光明通过进一步的研究,证明:当5d+1≥2N时,M(N,d)=N-1,即若已如有25以上的样本是阴性的,则逐一检测法就是最好的.同时,他们提出了Hu-Hwang-Wang猜想:当d≥N3时,M(N,d)=N-1.上述猜想的成立意味着:若已知有以上的样本是阴性的,则逐一检测法是最好的.1982年著名数学家堵丁柱与黄光明合作对上述猜想进行了研究.他们证明:当21d≥8N时,M(N,d)=N-1,即若已知有821以上的样本是阴性的,则逐一检测法就是最好的.尽管821已经非常接近13=721,这个结果也已发表近四十年了,但是至今还未出现更好的结果.当没有关于N个(血液)样本中阳性样本个数的任何信息时,我们就会面临如下两难的选择:如果选用组合检测法,但最后检测完成后,却发现有很多阳性样本,那么就会做很多不必要的检测;如果选用逐一检测法,但最后检测完成以后,却发现有阳性样本非常少,那么又会后悔没选用组合检测法了.堵丁柱和黄光明两位教授的方法是:621.将根节点设置在第一层(检测组含有所有样本),下面是第二层、第三层……将同一层的节点由左到右排序.2.每一层的待检测组用二分法进行排列、检测.在每一步,若检测出一个被污染的组X ,则将其进行二分,得到两个子组X ′和X ″,然后分别检测它们,其中X ′含有2[log |x |]-1个样本,而X ″=X ×X ′.图3图3是N =12的例子,一共有23个待检测组.显然,当所有的样本都是阳性的时候,只需要检测第1组(因为该组含有所有的样本,因而不需要再检测其他组);然而,当所有的样本都是阴性的时候,需要检测所有的组(因为每次检测结果,都显示阳性),需要的检测次数远远大于逐一检测法需要的12次检测!图4中列出了当7号样本是阳性样本时,需要检测的9个组.(当仅有9号样本或者10号样本是阴性的时候,两种情形都需要做7次检测.)图4通过上面的例子我们可以发现,这个组合检测法在所给样本中阳性样本比较少的时候,用的检测次数比逐一检测法少,否则它比逐一检测法用的次数多.那这个组合检测法到底好不好呢?应该如何分析它的有效性呢?堵丁柱和黄光明两位教授采用了竞争分析方法.给定N 个(标了号的)样本,0≤d ≤N ,用S (N ,d )表示N 个样本中有d 个阳性样本的所有可能的实例组成的集合.对于一个检测算法A ,用N A (s )表示它检测样本实例s 所需要的检测次数,并定义M A (d |N )=max{N A (s )|s ∈S (N ,d )},称算法A 是α-竞争算法,如果存在一个常数c 使得对任意0<d <N ,都有M A (d |N )≤α⋅M (d ,N )+c ,其中M (d ,N )表示针对(未检测就)已知N个样本中含d 个阳性样本的所有实例,所需要做的检测次数.(这里我们排除了d =0和d =N 这两种情形,因为M (0,N )=0和M (N ,N )=0,而M A (0|N )>0和M A (N |N )>0.堵丁柱和黄光明两位教授证明了Du-Hwang 定理:当N -1≥d ≥0时,存在算法使得M B (d |N )≤2M (d ,N )+5.这就是说事先不知道d 的值所需要的检测次数不超过事先知道d 的值所需要的检测次数的2倍.无论是采用组合检测法还是逐一检测法,在大量的血液样本中每次检测哪些样本组,都要依赖以前的检测及其结果.如果需要做N 次检测才能检测出所有的阳性样本,而每次检测需要时间的话,整个检测过程就可能需要N ·t 时间,并且在检测的过程中随时要根据检测的情况及时做出一系列选择.如果想缩短时间,那么除了尽可能地减少检测次数,还有一个方法就是在一段时间内同时(并行地)检测若干(而不是一个)样本组.数零拾学63。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
问题一血样的分组检验摘要:本文以血样分组检验为原型,通过建立数学模型,利用概率统计,数学期望值等知识对如何分组检验以及什么情况下需要进行分组检验作出了合理的解释。
关键词:血样分组检验,数学模型,概率统计, 数学期望值具体问题在一个很大的人群中通过血样检测普查某种疾病,假定血样为阳性的先验概率为p (通常p很小)。
为减少检验次数,将人群分组,一组人的血样混合在一起化验。
当某组的混合血样为阴性时,即可不经检验就判断该组每个人的血样都为阴性;而当某组的混合血样为阳性时,则可判断该组至少有一人血样为阳性,于是需要对该组的每个人在做化验。
(1)当p固定时(0.1%,…,1%,…)如何分组,即多少人一组,可使平均总检验数最少,与不分组的情况比较。
(2)当p多大时不应分组检验。
(3)当p固定时如何进行二次分组(即把混合血样呈阳性的组再分成小组检验,重复一次分组时的程序)。
(4)讨论其他分组方式,如二分法(人群一分为二,阳性组在一分为二,继续下去),三分法等。
分析问题本文对血样分组检验建立数学模型,目的就是要找到一种最佳的分组方案,对于一个数量固定的人群(假定人群数量为n 人),我们在决定哪一种分组方案最好或者需不需要分组时,可以引入数学平均值。
如果不分组,每个人都参加检验,则总共需要检验n次,每个人平均需要检验一次,如果分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组;在众多组合的分组中,哪一种分组计算出来的每个人的平均检验次数最小,则认为这种分组时最优的分组方案。
这也是数学概率模型的基本思路。
在人群(数量很大)中进行血样检验,已知先验阳性率为p, 为减少检验次数将人群分组。
若k人一组,当k份血样混在一起时,只要一份呈阳性,这组血样就呈阳性,则该组需人人检验;若一组血样呈阴性,则该组不需检验。
模型假设结合本问题的实际情况,对该模型作出如下合理的假设:1.人群数量总数为n人;2.先验概率P在检验中为一常量,保持不变;3.每个人检验一次是否阳性的概率相互独立,即每个人接受检验是互相独立事件,互不影响;4.每次分组时都能达到平均分配,能分成m组,即m=n/k,m为正整数。
变量说明根据提出的问题和模型假设,给出如下变量:n---- 被检验人群的总数;m----人群被分成的组数;k----每组的人数;k1----第二次分组时每组的人数;p---- 先验阳性概率;q=1- p----先验阴性概率;ξ----每个人需要检验的次数,为一随机变量;Eξ----ξ的期望值,每个人需要检验的平均次数。
模型建立利用概率统计知识建立数学概率模型,由期望值知道,如果不分组,每个人都参加检验,每个人平均需要检验一次;如果分组,分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组。
在众多组合的分组中,比较哪一种分组计算出来的每个人的平均检验次数最小,平均检验次数最小的那种分组则认为这种分组时最优的分组方案。
模型求解问题二:当p 多大时,就不需要分组。
在分组情况下,由模型假设知每组的人数为k (2k n ≤≤);变量ξ表示每人的检验次数;阳性的先验概率为p ;阴性的先验概率p q -=1。
如果一组检验为阴性,则表明该组中的每个人均不是病毒的感染者,又因为每个人是否是感染是相互独立的(模型假设),所以可以求得一组检验为阴性的概率为k q ,即该组中的每个人平均检验次数为k1次(该组总共只检验了一次)。
如果一组检验为阳性,则表明该组中有病毒感染者,因为一组检验为阴性的概率为k q ,所以一组检验为阳性的概率为k q -1(一组检验要么为阴性,要么为阳性),即该组中的每个人平均检验次数为k11+次(除了该组检验了一次外,该组中的每个人又被逐个检验一次)。
所以可以得到ξ的分布律为:由上表可求得ξ的期望值E ξ:111(1)(1)1k k k E q q q k k kξ=⋅++⋅-=-+ 即每个人的平均检验次数为11k q k-+次,人群(总共n 个人)的平均检验次数为)11(kq n E n k +-⋅=⋅ξ次。
由概率模型知,只有当1<ξE 时才需要分组,即分组检验要满足1<ξE 这个约束条件:由E ξ=11111kq q p p k -+<⇒>⇒->⇒<-即只有当满足约束条件1p <-因为k 只能取整数,所以1是一个离散型变量,为了更形象地讨论问题,故引入与1()1p x =-,(2x n ≤≤) 对()1p x =进行求导,求导过程如下: '''()(1p x ==- 设y =则'''()p x y =-=-对y =两边求对数有:ln lny = ,对ln lny =两边求导有:1''''111(ln )(ln())(ln )xy x x x ===即 '22221111111ln ()ln y x y x x x x x x x=-+-=--1'2222221111111111(ln )(ln (ln )()x y y x x x x x x x x x x =--=--=--所以11'''222111111()(ln )()()(1ln )x x p x y x x x x x x x =-=-=---=⋅⋅-即 1'211()()(1ln )x p x x x x=⋅⋅-由此可以看出,当e x >时,'()0p x <,函数()1p x =单调递减,而2x e ≤<时(分组时每组至少要有2人,故有2x ≥),'()0p x >,函数()1p x =单调递增,在ex =时(自然对数e 约等于2.71828),'()0p x =,函数()1p x =取得最大值,此时最大值11()11()0.3078e p e e ==-=,做出函数)(x p 的图像,见下图:由于实际检验分组时每组的人数k 只能取整数,不可能取自然对数e (自然对数e 约等于2.71828),故算出接近最大值()p e 的两个实际值:(2)0.292893p = (3)0.306639p =所以,()1p k =-的最大值为0.306639,即只有当0.306639p <时,通过调整k可以满足分组检验的约束条件1p <-而当0.306639p ≥时,无论怎么调整k 都不能满足分组检验的约束条件1p <-0.306639p ≥时,就不需要分组。
问题一:当p 固定时,k 多大可使检验次数最小情况一:当p 固定时(0.1%,…,1%,…),并且当0.306639p ≥时,此时不需要分组,即k=1时可使检验次数最小。
情况二:当p 固定时(0.1%,…,1%,…),并且当0.306639p <时,此时需要分组,要使人群总的检验次数最小,只要使每个人检验次数的期望值:111(1)(1)1k k k E q q q k k kξ=⋅++⋅-=-+最小即可,因为k 只能取整数,所以E ξ是一个离散型变量,为了更形象地讨论问题,故引入与11k E q kξ=-+变化趋势相同的连续性函数连续性函数1()1x f x q x=-+,1()1x f x q x =-+11(1),(2,01)x p x n p x=--+≤≤<<2,2x ≥注:分组时每组人数至少为人故对函数1()1(1),(2,01),x f x p x n p x =--+≤≤<<求导可得:''211()(1(1))(1p)ln(1p)x x f x p x x =--+=---因为此时p 是给定的固定值,故ln(1p)0-<且ln(1p)-为定值, 1p<0-,由上式分析知,当x 增大时,(1p)x -减小,(1p)ln(1p)x --增大,21x-也增大, 即'21()(1p)ln(1p)x f x x =---为增函数,即()f x 的极值就是()f x 的最小值 所以'21()(1p)ln(1p)0x f x x =---=的实数解x ,就是函数1()1(1)x f x p x=--+取的最小值时对应的x 值,由数值解法(利用计算机编程迭代,让x 从小到大依次代入等式,当误差在允许的范围内所取得的x 值)可解出每一个给定的p 所对应的'21()(1p)ln(1p)0x f x x =---=时的实数解x ,由于实际检验中每组的人数k 只能为整数,所以要对计算出来的x 取整(去掉后面的小数部分),取整后记作[x ],再比较一下([])f x 和([]1)f x +,若([])f x <([]1)f x +,则k =[]x ,若([])f x >([]1)f x +,则k =[]x +1,此时的k 值即为每一个给定的p 所对应的可使总检验总次数最少的每组人数。
下面给出数值解法解出的对于不同的先验概率,相对应的最小检验次数的每组人数:问题三:当p 固定时如何进行二次分组二次分组是在检验为阳性的组中继续分组,按照假设的变量及另设ζ表示两次分组时每人平均检验的次数,设每人检验一次呈阳性的概率为)1(p q q -=,若第一次分组时,一组的k 个人均为阴性的概率为k q ,此时每人平均检验了k 1次;若为阳性,此时的概率为k q -1,再次分组;第二次分组时,一组全为阴性的概率为1)1(k k q q -,此时每个人的平均检验次数为111k k +;若为阳性,此时的概率为)1)(1(1k k q q --,每个人的平均检验次数为1111++k k ,由上所述,可得ζ的分布概率为: 由此可得:)111)(1)(1()11()1(11111k k q q k k q q k q E k k k k k++--++-+=ζ 经过化简得:)111)(1(111k k kq k k q k q E -++-+=ζ 由实际情况知,此时的k k <1。
为使两次分组的情况优于一次分组的情况,只需ξζE E <。
经过计算,可得1111k k p -<。
此时发现两次分组的约束条件只是取值范围的不同,下面进行进一步的讨论:情况一:由于k k <1时,第二次分组的约束条件在第一次分组的约束条件满足时是能够满足)4(1>k ,(即使当第一次分组时取使ζE 最小的k 值,取4,211>=k kk ,而此条件满足二次分组的约束条件),故在大多数情况下能够进行一次分组时进行二次分组,一定能使检验总次数减少。