第9讲 协方差分析与混合线性模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 单因素协方差分析-理论
2 单因素协方差分析-理论
2 单因素协方差分析-理论
2 单因素协方差分析-理论
2 单因素协方差分析-计算
2 单因素协方差分析-计算 data ex; do a=1 to 3;do i=1 to 8;
input x y @ @;output ;end;end;
cards; 47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53 66
3.混合线性模型
请你完成以下问题: (1)利用附件1的数据,预测继续治疗的效果,或者确定 最佳治疗终止时间(继续治疗指在测试终止后继续服药, 如果认为继续服药效果不好,则可选择提前终止治疗)。 (2)利用附件2的数据,评价4种疗法的优劣(仅以CD4 为标准),并对较优的疗法预测继续治疗的效果,或者确 定最佳治疗终止时间。 (3) 艾滋病药品的主要供给商对不发达国家提供的药品价 格如下:600mg zidovudine 1.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元, 400 mg nevirapine 1.20美元。如果病人需要考虑4种疗 法的费用,对(2)中的评价和预测(或者提前终止)有 什么改变。
36.4271 47.8467 47.8467 47.8467
32.5714
40 0 8 16
3.2189
3.0445 3.0681 3.8918 3.9703
2
2 2 3 4 4 4
4
4 4 1 3 3 3
47.8467
47.8467 47.8467 60.2875 36.5969 36.5969 36.5969
3.混合线性模型
混合线性模型过程是拟合许多不同数据的混合线性 模型,并利用所拟合的模型对数据进行统计推断。
首先混合线性模型的主要假设是数据服从正态分布, 由于本题所给的数据的样本容量有6000多个,因此, 我们可认为它服从正态分布。又由于正态分布的数 据可完全有均值和方差确定,因此一个混合线性模 型是由两个模型决定的。分别是均值模型和方差模 型。MIXED使用约束最大似然的方法来拟合数据的。 一旦数据的模型已经建立,我们可以使用该模型通 过固定效应参数和协方差参数进行统计推断。用这 些统计量可以对模型进行评价。
3.混合线性模型
艾滋病治疗的目的,是尽量减少人体内HIV的 数量,同时产生更多的CD4,至少要有效地降 低CD4减少的速度,以提高人体免疫能力。
迄今为止人类还没有找到能根治AIDS的疗法, 目前的一些AIDS疗法不仅对人体有副作用, 而且成本也很高。许多国家和医疗组织都在积 极试验、寻找更好的AIDS疗法。
3双因素协方差分析-不考虑交互作用
3双因素协方差分析-不考虑交互作用
方差来 源 A
B 误差 总和
平方和 自由 均方 度 和 0.6046
7.1245 0.8502 8.5793
F值
显著 性 N
**
2
4 7 1
0.3023 2.49
1.7811 14.66 0.1215
各小区的产量矫正后没有显著的差异,各品 种的产量矫正后有极显著的差异。
4双因素协方差分析-考虑交互作用
4双因素协方差分析-考虑交互作用
方差来源
A B AB 误差
平方和
277.43485 2.845259 12.848100 99.441171
自由度
3 3 1 7
均方和
F值 显著性 ** N N
92.478286 6.51 2.845259 0.20 4.282700 14.205882 0.30
A与B的交互作用矫正后不显著,促生长剂 之间的差异极显著,试验批次间的差异不显著
3.混合线性模型
通过一个例子讲述混合线性模型的使用
艾滋病疗法的评价
艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以 来的20多年间,它已经吞噬了近3000万人的生命。 艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称 AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”, 英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体 丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免 疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4 被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加, 导致AIDS发作。
4双因素协方差分析-考虑交互作用
方差来 源 A
平方 和 QA
自由度 r-1
均方和 MQA
F值 FA
显著 性
B
AB 误差
QB
s-1
MQB
MQAB MQE
FB
FAB
QAB (r-1)(s-1) QE rs(m-1)-1
总和
QT
rsm-2
4双因素协方差分析-考虑交互作用
4双因素协方差分析-考虑交互作用
1 协方差分析思想原理 这种不是在试验中控制某个因素, 而是在试验后对该因素的影响进行估计, 并对试验指标的值作出调整的方法称为 统计控制,可以作为试验控制的辅助手 段。以统计控制为目的,综合线性回归 分析与方差分析所得到的统计分析方法, 称为协方差分析,所需要统计控制的一 个或多个因素,例如苹果树的长势,又 如动物的初重等等称为协变量。
; proc glm;class a;model y=x a/solution;
2 单因素协方差分析-计算
2 单因素协方差分析-计算
施用三种肥料的产量矫正后有极显 著的差异
3双因素协方差分析-不考虑交互作用
方差来源 平方和 自由度 均方和 F值 显著性
A B 误差 总和
QA QB QE QT
r-1 s-1 rs-r-s rs-2
3.混合线性模型
ID
1 1 1 1
疗法
2 2 2 2
年龄
36.4271 36.4271 36.4271 36.4271
时间
0 7.5714
Log(CD4 count+1)
3.1355 3.0445 2.7726 2.8332
15.5714 23.5714
1
1 2 2 2
2
2 4 4 4
36.4271
华中农业大学数学建模创新实践基地课件
第9讲 协方差分析与混合线 性模型
理学院 汪晓银 教授
协方差分析
如果在单因素、双因素或多因素试验 中有无法控制的因素x影响试验的结果Y, 且x可以测量、x与Y之间又有显著的线性回 归时,常常利用线性回归来矫正Y的观测值、 消去x的差异对Y的影响。 例如,研究施肥对苹果树产量的影响, 由于苹果树的长势不齐,必须消去长势对 产量的影响。又如,研究饲料对动物增重 的影响,由于动物的初重不同,必须消去 初重对增重的影响。
1
1 1
2
2 2
36.4271
36.4271 36.4271
7.5714
15.5714 23.5714
3.0445
2.7726 2.8332
3.混合线性模型
1313
1313
1
1
15.8412
15.8412
20
27
4.4067
3.5553
1313
;
1
15.8412
35
3.4657
data ex; do a=1 to 4; do b=1 to 2; do i=1 to 2;input x y@@;output;end;end;end; cards; 14.6 97.8 12.1 94.2 19.5 11.2 18.8 110.1 1.6 100.3 12.9 98.5 18.5 119.4 12.2 114.7 12.8 99.2 10.7 89.6 12.2 122.2 16.9 105.3 12.0 102.1 12.4 103.8 16.4 117.2 17.2 117.9 proc glm; class a b;model y=x a b a*b/solution;lsmeans a b/stderr pdiff; run;
MQA MQB MQE
FA FB
3双因素协方差分析-不考虑交互作用
3双因素协方差分析-不考虑交互作用 data ex;do a=1 to 3 ;do b=1 to 5 ; input x y @ @;output; end; end; cards; 8 2.85 10 4.24 12 3.00 11 4.94 10 2.88 10 3.14 12 4.50 7 2.75 12 5.84 10 4.06 12 3.88 10 3.86 9 2.82 10 4.94 9 2.89 ; proc glm;class a b ;model y=x a b/solution; lsmeans a b/stderr pdiff;run;
3.混合线性模型
2 对4种疗法的疗效模型的建立
1)数据的处理
a、所有病人的年龄是在[14.9021,74.193]的区间内, 以(74.193-14.9021)/5=11.85818为区间长度。我 们将患者按照年龄阶段分为5级,分别记作1至5(如 表4所示);
b、我们将患者所接受的治疗方法分为4种,分别记 作 1至 4 ; c、我们将病人的检查的时刻[0,40]以10为区间长 度,分为4级,混合线性模型的线性模型,如下:
Y Bave X age * Bage X time * Btime X cure * Bcure
3.混合线性模型
data ex;input name a x1 x2 y @@;
if x1<26.76 then x1=1;if 26.76<=x1<41.662 then x1=2; if 41.662<=x1<56.56 then x1=3;if 56.56<=x1<71.467 then x1=4; if 71.467<=x1 then x1=5;if x2<10 then x2=1; if 10<=x2<20 then x2=2;if 20<=x2<30 then x2=3;if 30<=x2 then x2=4; cards; 1 2 36.4271 0 3.1355
23
30.7143 39 0 0 7.1429 16.1429
3.6109
3.3322 3.0910 3.7377 4.1190 4.1109 4.7095
3.混合线性模型
1对4种疗法的疗效评价的分析
对题目所给的附件2的数据进行分析可知,决定病人 的CD4的浓度的因素有年龄,检查的时刻,治疗方 案这三个因素。因此我们将年龄分成5类,检查的时 刻分为4个时间段,治疗方案有4种。而问题是以 CD4的浓度为标准来评价疗效的优劣,即CD4的浓 度越大,那么疗效越好。由于考虑题中所给的样本 有6000多个(病人的个数*各个病人检查的次数), 因此我们考虑用MIXED(混合线性模型)。下面我 们就混合线性模型的原理进行说明。
3.混合线性模型
再者,该分析的重要假设是数据是正态分布的,由 于我们将附录2的数据进行了分类。由于数据出现在 类(如可能是同一年龄段中),那可能的情况是来 自同一年龄段的这些CD4的值是相关的,不是独立 的。鉴于此,由于附录2所给的数据是高度数据(即 样本容量很大),那么考虑这种因素是相关。因此 我们对这些因素进行相关性建模,我们使用随机效 用。在本题中,我们规定年龄、检查时刻为随机效 应,即使得具有相同年龄水平或相同检查时刻的水 平之间存在共同的相关性,那么,此模型才较为合 理。
3.混合线性模型
3.混合线性模型
2)确定固定效应和随机效应
固定效用是设计者所研究的因素,在此题中为 4种疗法。因为病人的年龄是随机的,并且病 人接受检验的时刻是也是随机进行的,故病人 的年龄和病人接受检验的治疗时刻应该为随机 效应。
3.混合线性模型
3)协方差结构的选择
模型中具体选用哪种结构矩阵:在相同模型结构下, 选择几个不同结构的协方差矩阵,从中选取似然比 统计量(-2Log Likeli-hood)、Akaike’s Information Schwartz Bayesian三个指标均较小 的一个,通常以AIC为主要判断指标。依据专业知 识和既往文献,在此模型中选用符合对称结构 [CS]、 不规则结构[UN]、一阶自回归结构[AR(1)]、空间 幂相关结构 [SP(POW)]。