第十章 危险度及logistic回归
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章 危险度分析和logistic 回归
10.1 危险度分析
例10.1为研究血液中儿茶酚胺水平与冠心病发病之间的关系,对609名男子按血液中儿茶酚胺水平分为高低两组,经过十年追踪观察得结果如下表,试作危险度分析。
儿茶酚胺水平
发病 未发病 高 27 95 低
44
443
试作危险度分析。
具体步骤:
1.数据录入 与卡方检验相同,以group 表示组别(高水平为1,低水平为2),disease 表示发病与否(发病为1,不发病为2),freq 表示频数。
数据格式如图10.1。
2.统计分析 依次选取Data -Weight Cases ,选中Weight Cases by :,将freq 选入框中,如图10.2。
再依次选取Analyze -Descriptive Statistics -Crosstabs ,将group 选入Row (s )框中,disease 选入Column (s )框中,或相反。
如图10.3。
点击Statistics 按钮,在展开的子对话框中选中Chisq 、Cocran’s and Mantel Haenszal Statistics 和Risk 选项(如为分层资料,可选择Cocran’s and Mantel Haenzal 选项),如图10.4。
返回按OK 即可得到结果。
注意:危险度分析和卡方检验不同,RR 值和OR 值均与四格表中的频数位置相关联,结果中四格表频数相对位置应和题设相同才能得到正确的结果,故设group (高水平为1,低水平为2),disease (发病为1,不发病为2),且group
为行变量,
disease为列变量。
3.结果解释
前两个表格同卡方检验相同。
第三个表格为危险度估计,包括比数比(Odds Ratio )、相对危险度(因不知哪个值为发病,SPSS给出了两个危险度)的值和95%估计区间。
本例disease值为1代表发病,故应看第三行结果,相对危险度为0.408(0.264, 0.631),即低水平组危险性是高水平组的0.408倍(0/1)。
GROUP * DISEASE Crosstabulation Count
DISEASE Total
1 2
GROUP 1 27 95 122
2 44 44
3 487
Total 71 538 609
Value df Asymp.
Sig.
(2-sided) Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Pearson
Chi-Square
16.246 1 .000
Continuity
Correction
15.000 1 .000
Likelihood Ratio 14.131 1 .000
Fisher's Exact
Test
.000 .000 Linear-by-Linear
Association
16.220 1 .000
N of Valid Cases 609
a Computed only for a 2x2 table
b 0 cells (.0%) have expected count less than 5. The minimum expected count is 14.22.
Risk Estimate
Value 95% Confidence
Interval
Lower Upper Odds Ratio for
2.861 1.688 4.851 GROUP (1 / 2)
2.450 1.584
3.789
For cohort
DISEASE = 1
.856 .776 .945 For cohort
DISEASE = 2
N of Valid Cases 609
图10.1 例10.1数据格式
图10.2 Weight Cases对话框
图10.3 Crosstabs对话框
图10.4 Statistics子对话框
10.2 Logistic回归
例10.2某医院口腔科研究影响牙齿治愈与否的各种因素,共115例,12个指标如下。
数据已存放在数据文件“teeth.sav”中。
各数据项的意义如下:
NO 例号
X1 年龄(岁)
X2 性别男 1 , 女2
X3 治疗到复查时间(月)
X4 牙根数目1个为1, 2个及以上为2
X5 根尖X线片无阴影为1, 有阴影为2
X6 换药次数 1, 2, 3及以上
X7 根管充填密合到位为1, 不密合或超填为2
X8 医生经验丰富为1, 不丰富为2
X9 自觉症状不痛为1, 痛为2
X10 叩痛不痛为1, 痛为2
X11 松动无为1, 有为2
X12 诊断根周炎,死髓牙为1, 牙髓炎为2
Y治疗结果不治愈为1, 治愈为0
具体步骤:
1.数据录入同多元回归,见图11.1。
2.统计分析依次选取Analyze-Regression-Binary logistic,展开对话框如图11.2,左框显示了数据集中变量,将y选入Dependent:框(因变量),将x1至x12选入Covariates:框(协变量或自变量框);Method选Backward :Conditional 法,单击OK得结果。
3.其它选项
Method筛选变量的方法,共有以下7种,本例选基于条件参数估计的前进法(forward :Conditional)。
Enter:强制法,选入Covariates框内的所有变量,即不进行筛选;
Forward :Conditional:基于条件参数估计的前进法;
Forward :LR:基于偏最大似然估计的前进法;
Forward:Wald:基于Wald统计量的前进法;
Backward :Conditional:基于条件参数估计的后退法;
Backward:LR:基于偏最大似然估计的后退法;
Backward:Wald:基于Wald统计量的后退法;
>a*b>按钮该按钮可定义变量的交互作用,如要将两个或多个变量的交互项放入方程,只需按住shift键,依次选取这两个或多个变量,再按>a*b>按钮,则该交互项就会出现在Covariates:框中。
Categorical 分类变量定义。
用于定义自变量中的分类变量,可指定作为参照的值,SPSS自动产生相应哑变量。
Select》选择观察单位(即参与计算的观测)。
Save将一些中间统计量存为新变量
Options 单击该按钮,弹出对话框如图11.3,其中选项如下:
Statistics and Plots:其中内容有:
Classification plots 判别分类图
Hosmer-Lemeshow goodness-of-fit Hosmer-Lemeshow模型拟合指数
Casewise listing of residuals 每一观察单位的残差等
相关系数矩阵(Correlations of estimates)
迭代过程(Iteration history)
比数比(OR)的95%(可定义其它范围)可信区间(CI for exp(B): 95 %)。
Display:选择输出每一步结果(At each step)还是只要最后一步结果(At last step),本例选择只要最后一步结果。
Probability for Stepwise:逐步筛选变量的概率水准。
Entry为选入变量水准,系统默认为0.05,Removal为剔除变量水准,系统默认为0.1;Classification Cutoff为分类变量的分界点,系统默认为0.5。
Maximum Iterations为最大迭代次数,系统默认为20次,必要时可增加。
Include constant in model为模型中包含常数项,系统默认模型中包含常数项。
4.结果解释
SPSS给出的结果很多,如参与计算的观察单位数、最初进入模型的变量、判别分类图等。
本指导仅介绍最后模型参数的解释。
如下表所示,本例经过4步筛选,最后一步是所要结果,x5、x6、x7、x8进入模型,表中给出了各变量系数(B)、变量系数标准误(S.E.)、Wald统计量、自由度(df)、P值(Sig.)和变量系数反自然
对数(exp(B))(即比数比OR)。
另外需注意的是,SPSS将因变量中大的值(如本例中的1,即不能治愈)当作发生事件,而SAS是将因变量中小的值当作发生事件,所以其结果和SAS不同,其变量系数正负号相反,为方便结果解释,计算前须转换因变量值。
Logistic回归系数的解释和多元回归不同,它是表示其它因素被控制后,x每改变一个单位时,比数比的对数值(lnOR),所以(exp(B))即是比数比OR。
OR的意义同相对危险度(RR),以本例x5系数为例,其值为3.634,它表示其它因素不变时,x5每增加一个单位(和较小单位相比较)比数比的对数值为3.634,因x5是二分类变量(根尖X线片无阴影为1, 有阴影为2),在这里就可解释为,其它因素不变时,有阴影病人不能治愈的危险性约是无阴影的病人的37.854(即exp(B))倍。
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 1 X8 2.980 .573 27.027 1 .000 19.687 Constant -5.331 .860 38.447 1 .000 .005 Step 2 X7 2.122 .668 10.087 1 .001 8.352 X8 2.057 .640 10.322 1 .001 7.825 Constant -7.331 1.258 33.968 1 .000 .001 Step 3 X5 2.941 1.171 6.309 1 .012 18.927 X7 2.080 .713 8.524 1 .004 8.006
X8 2.245 .741 9.184 1 .002 9.437 Constant -12.857 2.818 20.812 1 .000 .000 Step 4 X5 3.634 1.384 6.895 1 .009 37.854 X6 1.603 .684 5.498 1 .019 4.967
X7 1.905 .766 6.178 1 .013 6.719
X8 2.574 .855 9.067 1 .003 13.112 Constant -17.960 4.295 17.489 1 .000 .000
a Variable(s) entered on step 1: X8.
b Variable(s) entered on step 2: X7.
c Variable(s) entere
d on step 3: X5.
d Variable(s) entered on step 4: X6.
图10.5 例10.2数据格式
图10.6 Logistic回归对话框
图10.7 Options对话框。