数学建模竞赛-艾滋病疗法评价及疗效预测模型
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二、 基本假设
1、题中所给出的数据真实,能反映现实情况; 2、最佳治疗终止时间是指:CD4 的浓度(个 / l )达到某值 的初始时间; 3、治疗有效果是指:HIV 的数量降低,同时产生更多的 CD4 细胞,至少能有效地降 低 CD4 减少的速度; 4、问题 2 中疗法的优劣评价,仅以 CD4 为标准; 5、在疗法 1 中,以日用量 600mg zidovudine 或 400mg didanosine 按每月交替服用, 1 个月按 30 天计算,且在第 1 月中,每日服用 600mg zidovudine ; 6、在测试过程中,忽略病人年龄的变化; 7、处于同一年龄段的病人,生理状况一致。
y 0.0003x3 0.0201x2 0.4414 x 0.7203
相关系数的平方:rsquare=0.9839 残差平方和 :S= 0.1540 由此认为拟合比较好 散点图、拟合曲线及置信区间如下图:
3
图 1:CD4 比值的曲线拟合图 同样由于 numHIV(i)<20 的数据不具有统计意义,因此只画出 numHIV(i)>=20 时对 应 meanHIV(i)的散点图,根据散点图确定用负指数函数来拟合。 拟合曲线方程 y k1g e k 2gx k 3 用 Matlab 求得:k1=3.4668,k2=0.4673,k3=2.8365
CD 4i 。 CD 40
meanCD4(i)
sumCD4(i 1) sumCD4(i) sumCD4(i 1) numCD4(i 1) numCD4(i) numCD4(i 1)
用 meanCD4(i) 的值代替 sumCD4(i) 。 统计第 i 周 HIV 的测得值总和 sumHIV(i)与测试人数 numHIV(i), 用三项移动平均法 的思想,令
关键词:曲线拟合、回归模型、灰色关联度、灰色预测、效益函数
1
一、 问题的重述
艾滋病( AIDS)是当前人类社会最严重的瘟疫之一,它是由艾滋病病毒(HIV) 引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害 人的生命。人类免疫系统的 CD4 细胞,作为一种识别因子,能帮助辅助 T 细胞识别其 它细胞的感染信号,对于艾滋病病毒(HIV)感染来说,它是病毒进入和破坏细胞功能 的重要的识别因子,当 CD4 被 HIV 感染而裂解时,其数量会急剧减少,HIV 将迅速增 加,导致 AIDS 发作,因此,在 AIDS 的治疗疗法评价及疗效预测中, CD4 是一个很重 要的指标。 AIDS 治疗的目的,是尽量减少人体内 HIV 的数量,同时产生更多的 CD4,至少要 有效地降低 CD4 减少的速度,以提高人体免疫能力。而迄今为止人类还没有找到能根 治 AIDS 的疗法,目前的一些 AIDS 疗法不仅对人体有副作用,而且成本也很高,因此, 对 AIDS 的治疗疗法评价及疗效预测是一个需要的问题。 解决的基本问题: 1、利用附件 1 的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。 2、利用附件 2 的数据,评价 4 种疗法的优劣(仅以 CD4 为标准) ,并对较优的疗法 预测继续治疗的效果,或者确定最佳治疗终止时间。 3、已知艾滋病药品的主要供给商对不发达国家提供的药品价格,如果病人需要考虑 4 种疗法的费用,对 2 中的评价和预测(或者提前终止)有什么改变。
2 2 ( x5 , x6 含义与以上一致) y 0 5 x5 6 x6 7 x5 8 x6
将采用疗法 4 病人的数据代入上述方程,用 MATLAB 函数 regress 求得:
[1.1628 0.0305 0.0573 0.0009 0.0007]
且 的置信区间都不包括 0,知方程中 y(疗效)与治疗时间及年龄的一次项、二次项 都有线性关系。 统计量 F=10.8465> F1 (4,1292) 2.37,知回归模型成立。 将病人的治疗时间及年龄代入上述多元回归方程,就可预测其采用疗法 4 的治疗效果。 3、模型评价及改进 该回归模型能够对疗法优劣做出评价及疗效预测,但相关系数较低,可以通过对每 一个点的残差置信区间的分析来剔除一些异常点,以此提高其回归的显著性。
1模型建立1采用第j种疗法的病人每次测试cd4浓度时第i周已花费的药费price160或085price345price245price3652数据处理对附件2中给出的cd4值进行还原作比值处理由于所给出的cd4为logcountcd41我们令cdcd再规定每个人第0周的cd4cdcdcd为了数据处理方便将第8ii012345周附近进行测试cd4浓度的数据都归入第8i修改元素ij10考虑到每种疗法的治疗效果不同所用药费不同以及患者的贫富程度不同因此引入效益函数cdmoney表示患者的贫富程度
统计量 F=46.0257> F1 (8,5027) 1.94 ( =0.05),知回归模型成立。 比较 xi (i 1, 2,3, 4) 前系数 i 得, 4 3 2 1 ,由此可知对于所有年龄段的人, 第 4 种疗法最优,第 3 种疗法次之,第 1 种疗法最差。 2、预测疗效 用多元回归模型对最优疗法 4 进行预测,则方程为
四、问题 2 的分析、建模与求解
回归模型 1、疗法评价 1) 对附件 2 的数据处理 为了反映某种疗法的疗效,我们将附件 2 所给出的 CD4 值(为 log(countCD4+1) ) 进行处理。规定第 0 周 CD4 变化值( CD40 )为 0 ,第 i 周的变化值( CD4i )为相应 测得值( CD 4i )与第 0 周测得值的差值,即 CD4i CD4i CD40 。 2)评价 4 种疗法的优劣及较优疗法预测的多元回归模型
meanHIV (i)
sumHIV (i 1) numHIV (i 1) numHIV (i) numHIV (i 1)
用 meanHIV (i) 的值代替 sumHIV (i) 。 4) 作图、拟合 由于 numCD4(i)<20 的数据不具有统计意义,因此只画出 numCD4(i)>=20 时对应 meanCD4(i)的散点图,根据图形做 3 次多项式拟合。用 MATLAB 中的 polyfit 函数得到: 拟合多项式系数: a [0.0003 0.0201 0.4414 0.7203] 拟合曲线:
y 3.4668e0.4673 x 2.8365
残差平方和:S= 0.0966 由残差平方和与拟合曲线图看出拟合结果比较好
图 2:HIV 的曲线拟合图
4
3、预测治疗效果 由图 1 可知在 0 到 45 周治疗效果比较好,并能推测出继续治疗 10 周左右疗效也应 比较好,但拟合曲线模型不能预测更长时间治疗效果。 由图 2 可知,治疗 10 周后 HIV 数量趋于稳定值 k3; 若某艾滋病患者测试开始时 CD4 数量为 Q0 (*0.2/ l ) 第 i 周后 CD4 数量为 : Qi 0.2Q0 (0.0003i3 0.0201i 2 0.4414i 0.7203) (/ l ) 我们认为在 HIV 降低到稳定值 k3 的前提下,CD4 浓度(个 / l )上升到某值 (根据 文献[2],CD4 数量达到 =350/ l ,就可以停药观察)的时间为最佳终止时间,因此解 方程 Qi (i) ,求出 i 就得到最佳终止时间,即在第 i 周终止治疗。 4、模型评价及改进 该模型建立思路比较简单,曲线拟合效果较好,在对数据处理中用了三项移动平均 法,可以剔除数据中的偶然因素;该模型不能够预测较长时间的疗效;可以考虑通过某 函数,将 CD4 浓度的改变量与 HIV 值结合在一起,进行综合考虑。
三、问题 1 的分析、建模与求解
1、问题的分析 通过分析统计数据,做散点图,拟合出疗效与时间的曲线,就能解决此问题,预测 继续治疗的效果,或者确定最佳治疗终止时间。 2、建立数学模型
2
1)对个别测试的 CD4(和 HIV)的时刻调整 由于有个别测试 CD4(和 HIV)的开始时刻并不是第 0 周,故将其开始时刻调整为 第 0 周。 即:设某个体第一次测试的时刻为 t0 ,若 t0 0 ,则将其各次测试时刻均减去 t0 。 2)调整 CD4 的值为相对第 0 周测试时的比值 我们认为服用药物后的 CD4 值的改变可以反映出疗效的好坏, 由于所给出的 CD4 浓 度值差异很大(最小值为 0,最大值为 933 0.2个 / l ) ,故对其处理如下: 规定第 0 周 CD4 的调整值( CD4(0) )为 1,第 i 周的调整值( CD4(i) )为相应原 始值( CD 4i )与第 0 周原始值( CD40 )的比值,即 CD4(i) 3)统计 统计第 i 周调整值 CD4(i) 总和 sumCD4(i)和测试人数 numCD4(i),用三项移动平均 法的思想,令
1 采用第j种疗法 令 xj ,j=1,2,3,4 否则 0
(单位: 周) ,x6 表示年龄 (单位: 岁) , y 表示相应的疗效 (即:CD4i ) , x5 表示治疗时间 建立多元回归方程:
2 2 y 0 1 x1 2 x2 3 x3 4 x4 5 x5 6 x6 7 x5 8 x6
通过求出 1 , 2 , 3 , 4 中的最大值,则对应的疗法最优。 3)疗法评价结果 利用 MATLAB 函数 regress(程序见附录)求得:
5
0.13824 0.06599 0 0.12986 0.31516 0.00241 0.00141 0.00036 0.00001 '
灰色模型 1、基于灰色关联度的方法评价 4 种疗法的优劣 1)考虑年龄与不同疗法疗效的关系和各个年龄段统计量的多少,将年龄分段为: 1 2 3 4 5 age<=25 25<age<=35 35<age<=45 45<age<=55 55<age 表 1:年龄段的划分 2)数据处理 为了反映疗效, 规定第 0 周 CD4 的测得值 ( CD40 ) 为 0, 第 i 周的变化量 ( CD4i ) 为相应测得值( CD 4i )与第 0 周测得值的差值,即 CD4i CD4i CD40 。 已 知 1300 多 名 病 人 大 约 每 隔 8 周 测 试 的 CD4 浓 度 , 为 了 数 据处 理 方 便 , 将 第 8(i-1)(i=1,2,3,4,5,6)周附近进行测试治疗的数据都归入第 8(i-1)周。 3)对某一个具体的年龄段,选定母系列和比较序列
2005 年四川省数学建模竞赛 艾滋病疗法评价及疗效预测模型
张慧勇 四川大学
摘要:
本文研究了艾滋病的疗法评价及疗效预测的问题。艾滋病(AIDS)是当前人类社会 最严重的瘟疫之一,评价治疗艾滋病方法的优劣,预测继续治疗的效果对于治疗艾滋病 有非常重要的意义。 问题 1,通过分析、统计数据,做出 CD4 比值与时间、HIV 数量与时间的散点图, 根据散点图用三次多项式拟合 CD4 比值的曲线, 用负指数函数拟合 HIV 的曲线; 由 HIV 拟合曲线得出治疗 10 周, HIV 就能被控制在稳定值 2.84; 已知患者开始时 CD4 数量 Q , 通过 CD4 比值曲线求出 t 时刻的比值 f(t),就能预测出 t 时刻患者的 CD4 数量 f(t)*Q 。 问题 2,本文建立了两个评价疗效模型:多元回归模型、灰色关联度模型,两个模 型都做出疗效 4 最优的评价。本文还建立了三个预测模型:多元回归模型、灰色预测模 型、BP 神经网络模型,并都对疗法 4 进行了预测,其中灰色预测模型能画出疗效与时 间的关系曲线图,看出疗效 4 能确保患者体内 CD4 数量不减少,患者应继续治疗。 问题 3,考虑 4 种疗法的费用,本文继续沿用问题 2 中的灰色关联度模型,但对其 中的评价值矩阵 H 进行修改,对此引入了效益函数 f=f(CD4,money, ) , 表示患者的贫 富程度,且 f 函数是 的增函数;用此修改后的灰色关联的模型来评价 4 种疗法,大致 结果是: 比较大时,疗法 4 最优; 比较小时疗法 1 最优; 本文在建立模型求解问题时,十分注重数据信息的挖掘,有的模型用 CD4 的比值, 有的模型用 CD4 的差值,能很好地反映疗法对患者的疗效;问题三中的灰色关联度模 型引入了自定义的效益函数,十分好地解决了评价带有费用的疗效的问题。