SPSS生存分析过程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS Survival(生存分析)菜单
SPSS Survival菜单包括Life Tables过程、Kaplan-Meier过程、Cox Regression 过程、Cox w/Time-Dep Cov过程。这里只介绍Life Tables过程和Kaplan-Meier 过程。
Life Tables过程
Life Tables过程用于:
1、估计某生存时间的生存率。
2、绘制各种曲线如生存函数、风险函数曲线等。
3、对某一研究因素不同水平的生存时间分布进行比较,控制另一因素后对研究因素不同水平的生存时间分布进行比较,包括从总体上比较和不同水平之间进行两两比较。
一、建立数据文件
定义两个列变量:
时间变量:取名“time”,label标上“survival time(week)”。
生存状态变量:取名“status”,并赋值:0=“删失”,1=“死亡”。
二、操作过程
从菜单选择
1、Analyze==>Survival ==>Life Tables
2、Time框:选入time
3、Display Time Intervals框:在by前面的框内填入生存时间上限,本例填入20(此区间必须包括生存时间的最大值);在by后面的框内填入生存时间的组距,本例填入5,以保证结果列出“15-”的组段。
4、Status框:选入status;击define events钮,在single value框右边的空格中输入1
5、单击Option按钮,弹出对话框:
Life Table(s) 输出寿命表,系统默认
Plots: 选Survival(累积生存函数曲线)
击Continue
6、单击OK钮
附:界面说明
图1 寿命表主对话框
【Time】框
选入生存时间变量。
【Display Time Intervals】框
欲输出生存时间范围及组距。
在by前面的框内填入生存时间上限,本例填入200(此区间必须包括生存时间的最大值);在by后面的框内填入生存时间的组距,本例填入20,以保证结果列出“100-”的组段。
【Status】框
选入生存状态变量,并定义终结事件的标记值。
选入变量“Status”后,【Define Event】钮被激活变黑,击该按钮,弹出定义终结事件标记值的对话框(图1)。对二分类变量,一般以死亡、复发、恶化等表示终结事件。本例以死亡为终结事件,其标记值为1,故在Single value 框内填入1。击Continue钮。若生存状态变量取值为一连续型变量,如反应变量为收缩压,则在下面的Range of values 框中输入140 through 400,此处上限输入400是我随便输入的一个上限,目的是为了定义高血压患者,实际上恐怕没有人的血压能达到400,这样才能保证包括所有的高血压病例,具体情况具体分析。
图2 定义终结事件标记值的对话框
【Factor】框
定义第1层因素,即分组因素。
【By Factor】框
定义第2层因素,即分层因素。
【Options】选项
击Options按钮,弹出选项对话框。(图3)
图3 寿命表选项对话框
Life Table(s):输出寿命表,系统默认。
Plot:统计图。
Survival:累积生存函数曲线。
Hazard:累积风险函数散点图。
One minus survival:生存函数被1减后的曲线。
Log survival:对数累积生存函数曲线。
Density:密度函数散点图。
Compare Levels of First Factor:对第1层因素不同水平的比较,即主对话框(图1)中的factor框中所选入的因素。
None:不做比较。系统默认。
Overall:整体比较。
Pairwise:两两比较。
寿命表各个指标的意义
Intrvl Start Time:生存时间的组段下限。
Number Entrng this Intrvl:进入该组段的观察例数。
Number Wdrawn During Intrval:该组段的删失例数。
Number Exposed to Risk:暴露于危险因素的例数,即有效观察例数(校正观察人数)。
Number of Termnl Events:终结事件的例数,即死亡例数。
Propn Terminating:终结事件比例,即死亡比例。
Propn Surviving:生存比例。
Cumul Propn Surv at End:至本组段上限的累积生存率。
Probability Densty:概率密度。所有个体在时点t后单位时间内死亡概率的估计值。
Hazard Rate:风险率。活过时点t的个体,在时点t后单位时间内死亡概率的估计值。
SE of Cumul Surviving:累积生存率的标准误。
SE of Probability Densty:概率密度的标准误。
SE of Hazard Rate:风险率的标准误。
Kaplan-Meier过程
采用乘积极限法(Product-limit estimates)来估计生存率,同时还可以对一个因素进行检验。适用于以个体为单位来收的未分组生存资料,是最基本的一种生存分析方法。
Kaplan-Meier法用于:
1、估计某研究因素不同水平的中位生存时间。
2、比较该研究因素不同水平的生存时间有无差异。
3、控制一分层因素后对研究因素不同水平的生存时间比较(此时将按分层因素的不同水平对研究因素对生存时间的影响分别进行分析)。
操作过程:
1. Analyze==>Survival ==>Kaplan-Meier
2. Time框:选入 time
3. Status框:选入status;击define events钮,在single value 框右边的空格中输入1
4. Factor框:选入group;
5. Compare factors列表框:
Test Statistics:选择Log rank、Breslow、Tarone-Ware
Linear trend for factor levels:选Pooled over strata或Pairwise over strata
6. Option列表框:
Statistics: 选Survival table(s)、Mean and median、Survival
Plots: 选Survival