多因素分析 案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多因素分析案例
案例1 某医生为研究乳腺癌彩超血流显像的相关因素,检测了121例乳腺癌患者,其中血流丰富者68个,中等血流者48个,无血流者5个。

选择患者的年龄、乳腺癌的大小、组织学分类、导管内癌和浸润性导管癌组织学分级及雌激素受体,孕酮受体等因素,进行了多因素logistic回归分析。

结果显示,对血流程度有影响的因子,其作用从大到小依次为:肿块大小(OR=5.931),肿块分好程度(低分化OR=4.318,中分化OR=1.681),患者年龄(OR=0.949)。

其余因素对血流程度无影响。

问题:
本案例中的涉及到了哪些变量?分别属于什么类型?因变量自变量分别是什么?
本案例可否用直线相关或者回归分析?为什么?
在进行多因素logistic回归前,是否应该先进行单因素分析?如何分析?
单因素logistic回归分析与多因素logistic回归分析有何区别?能否直接做多因素logistic回归分析?
得到logistic回归分析结果后,如何解释?如何应用这个结果?
案例2 某研究者观察了确诊后采取同样方案进行化疗的26例急性混合型白血病患者,欲了解某种不良染色体是否会影响患者病情的缓解,于是将治疗后120天内症状是否缓解作为结果变量y(缓解=0,未缓解=1),有无不良染色体chr(有=1,无)作为研究因素,数据收集后(详细数据见表19-5)进行一系列统计分析,请结合以下问题,对分析结果进行恰当的评价。

表19-5 急性混合型白血病患者化疗后观察数据
age bl cd chr sex t y age bl cd chr sex t y 28 0 0 1 0 3 0 48 1 0 1 1 15 0 33 1 1 1 1 120 1 48 1 0 1 0 120 1 35 0 0 1 0 7 0 48 1 0 1 0 120 1
39 0 0 1 0 5 0 49 1 0 0 0 120 1
40 0 0 1 0 16 0 54 1 1 0 0 120 0 42 0 0 1 0 2 0 55 0 1 0 1 12 0
42 1 1 0 1 120 1 57 1 1 0 1 116 0
43 0 1 1 1 120 1 60 1 1 0 1 109 0
44 0 0 1 0 4 0 61 0 1 1 0 40 0 44 0 0 1 0 19 0 62 0 0 1 0 16 0
44 0 1 1 0 120 1 62 0 1 1 0 118 0
45 1 0 0 0 108 0 63 1 1 0 0 120 1 47 0 0 1 0 18 0 74 0 0 1 0 7 0
(1)按照有无不良染色体分组比较缓解率,考虑到例数较小,采用Fisher精确概率法,得到P值为0.667,此时的结论如何?
(2)考虑到有无不良染色体并非研究人员可以随机分配的处理,所以比较组之间其它影响患乾缓解的因素不一定均衡,因而需要考虑平衡其他可能的影响因素的作用。

于是该研究者进一步查阅了相关文献,追加记录了患者的年龄age(岁)、骨髓原幼细胞数分组bl (大于等于50%=1,小于50%=0)、CD34表达式cd(阳性=1,阴性=0)、性别sex(男=1,女=0)这几个变量(数据见表19-5),采用多因素logistic模型分析,经逐步法近α=0.10水准得到表19-6中的结果。

此时的结论又如何?
表19-6 急性混合型白血病患者化疗后观察数据的逐步logistic回归分析结果
回归系数标准误X2 自由度P值RR
Bl -2.054 0.971 4.472 1 0.034 7.800
常数项-1.872 0.760 6.073 1 0.014 0.154
综合上述分析过程,你对此项研究的设计、资料收集及统计分析方法的选择有何评论?
案例3 某研究者为探讨帕金森病(PD)与吸烟的关系,采用以人群为基础的病例-对照研究,调查某市PD病例共114例,以及对照205例(性别、民族及居住于与病例相匹配)。

采用非条件logistic回归分析,结果见表18-12。

请根据所提供信息,分析该研究中存在的主要统计学缺陷。

表18-12 PD 与吸烟关系的非条件logisti 回归分析
变量 回归系数 标准误 W a l d X 2 P 值 OR OR 的95%CI 性别 0.936 0.0298 9.821 0.009 2.549 1.420,4.579 年龄
0.030 0.299 4.612 0.032 1.031 0.573,1.852 吸烟年限 -0.619 0.315 3.866 0.049 0.538 0.290,0.346 喝茶 -1.616 0.283 32.619 0.000 0.199 0.114,0.346 饮酒
-0.031
0.339
0.009
0.926
0.969
0.499,1.884
案例4 为探讨超重和肥胖对高血压病的影响,2004年,某研究者采用整群抽样的方法,对某地6个镇35周岁以上的常住人口进行高血压普查,同时收集了身高、体重等相关信息。

体质指数BMI ≥25判为“超重或肥胖”,BMI <5为“正常”;收缩压≥140mmHg 和(或)舒张压≥90mmHg 判为“高血压”。

整理后资料见表18-13。

自变量X 为体质指数,X=1表示“超重或肥胖”,X=0表示“正常”;因变量Y 为是否患病, Y=1表示“患病”,Y=0表示“未患病”。

X 对Y 影响的单因素logistic 回归结果见表18-14。

请问该二分类单因素logistic 回归所得OR 值与采用2*2表所计算的OR 有何关系?
表18-3 不同体质指数高血压患病率
表18-4 非条件logistic 回归分析结果
案例5 某医生在河南平顶山煤矿区人群糖尿病(DM )现况调查基础上,对筛选出的174例糖尿病病例和3066例糖耐量正常者进行以人群为基础的病例-对照研究。

调查内容包括性别、年龄、糖尿病史、肥胖、体力劳动、饮酒和饮食等因素,分析目的主要是糖尿病者是否与肥胖有关。

该医生应用单因素的分析方法,分别估计暴露于各危险因素的糖尿病患病优势比,对优势比假设检验和区间估计。

分析结果表明糖尿病患病与年龄、糖尿病史、
体质指数 (X )
调查人数
患病 (Y=1 病例) 未患病 (Y=0 对照) 患病率 (%) 超重或肥胖 (X=1暴露) 4148 1656(a) 2492(b) 39.92 正常
(X=0非暴露) 6792 1331(c) 5461(d) 19.60 合计
10940
2987
7953
27.30
体质指数(BMI)、腰臀比值(WHR)、舒张压、多食高粱豆类、职业体力劳动等的关联有统计意义。

该医生应用非条件logistic回归分析糖尿病发生与各种危险因素的关联性,先做糖尿病患病与逐个因素的单因素logistic回归结果摘要在表18-6中。

然后将单因素分析有统计学意义的危险因素引入多因素logistic回归模型进行逐步筛选,筛选结果列在表18-7中,结果表明,年龄大、母亲有糖尿病史、同胞有糖尿病史、最重时体质指数(BMI)高、腰臀比值(WHR)高、舒张压高、多食高粱和豆类可能是糖尿病的独立危险因子;职业性体力活动强度高和多食浅色蔬菜可能是糖尿病患病的独立保护因子。

讨论:
(1)该研究在设计方面存在什么问题?
(2)该资料的统计分析存在什么问题?
(3)什么因素可能影响糖尿病与肥胖的关系,在该研究设计中存在哪些可能的混杂因素?(4)如何校正混杂因素的影响?
(5)目前的统计分析程序存在什么问题?
(6)如何应用logistic回归校正混杂因素的影响?
(7)如何根据研究目的估计校正混杂因素后糖尿病与肥胖的关联?
表18-6 非条件logistic回归单因素分析结果
变量OR OR的95%CI 变量OR OR的95%CI
性别0.52 0.38-0.71 年龄 2.44 2.08-2.87
居住年限 1.58 1.24-2.03 母亲DM史 5.93 3.25-10.82
子女有DM 8.95 2.22-36.08 同胞DM史 4.99 2.44-10.21
现进BMI 3.35 2.41-4.65 最重时BMI 4.44 3.01-6.56
现时WHR 5.91 4.05-8.63 饮酒指数0.67 0.47-0.96
0.71 0.63-0.80 收缩压 3.89 2.39-6.33
职业性体力
活动
舒张压 3.28 2.27-4.48 大米0.11 0.03-0.45
小米 1.64 1.24-2.18 高粱 2.96 1.35-6.52
豆类 1.47 1.19-1.82 禽肉 1.30 1.02-1.66
鲜奶 1.52 1.10-2.10 豆制品 1.27 1.03-1.06
浅色蔬菜0.51 0.37-2.74 动物油0.78 0.66-0.91
0.78 0.97-0.91 月经 1.80 1.38-2.36
两年前动物

表18-7 非条件logistic回归多因素分析结果及各危险因子的PAR%值
变量回归系数标准误标准回归系数OR OR的95%CI PAR% 年龄0.7134 0.0900 0.4242 2.04 1.71-2.44 80.04
母亲DM史 1.7984 0.3613 0.1369 6.04 2.98-12.26 7.19
同胞DM史0.8069 0.4349 0.0532 2.24 0.96-5.26 3.18 -0.1191 0.0689 -0.0909 0.89 0.78-1.02 -19.20 职业性体力
活动
最重时BMI 0.6135 0.2255 0.1691 1.85 1.19-2.87 37.35
现进BMI 0.9437 0.2207 0.2571 2.57 1.67-3.96 48.80
舒张压0.4111 0.2507 0.0670 1.51 1.01-2.26 8.15
高粱0.7988 0.2951 0.0709 2.22 1.25-3.96 3.20
豆类0.2211 0.1187 0.0774 1.25 0.99-1.57 10.63
浅色蔬菜-0.6935 0.1974 -0.1202 0.50 0.34-0.74 -269.54。

相关文档
最新文档