事件史分析ppt课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ij
0j
log h(tij ) log h0 (t j ) [1X1ij 2 X 2ij ... p X pij ]
Cox的一个重要特征是: • 基准风险是时间t的函数,而与协变量X无关; • 右侧指数表达式与X有关,而与t无关;
• 如果X中含有与时间t有关的变量(time-dependent variable),此时 不再满足比例风险假设,需要用扩展的Cox模型(extended Cox model)。
• 参数估计 m 描述的是协变量 Xm 变化一单位对风险对数值 的影响;
• exp(m ) 描述的是协变量Xm 变化一单位对事件发生风险的影 响;
7
Cox比例风险模型示例:
基因FOXO对老年死亡风险的影响
节选自论文 “Bio-demographic Analysis on Effects of FOXO Genotypes on Longevity”
湘潭大学2010年“现代计量经济分析 方法与应用”暑期学校课程讲义
事件史分析
Event History Analysis
陈华帅 2010-7-26
1
上节课概念复习
• 事件史分析也称为生存分析(Survival analysis, Cox & Oakes, 1984)、失效时间分析(Failure time analysis, Kalbfleish & Prentice, 1980)或风险模型(Hazard modeling, Yamaguchi, 1991)。
• 偏似然函数示例:
L
h0
(t)
e1
h0
h0 (t) e1 (t) e0 h0 (t)
e0
h0
(t)
e1
h0
(t)
e0
h0 (t) e0 h0 (t) e0
h0
(t)
e1
h0 h0
(t) (t)
e1 e1
6
Cox模型结果的解释
log h(tij ) log h0 (t j ) [1X1ij 2 X 2ij ... p X pij ]
• Cox模型中不包括常数项(如果包括常数项,则常数项可与基准 风险函数合并)。
• Cox模型是一个稳健(robust)的模型,所得到的结果与正确的参 数模型所得结果将非常相似。
5
偏似然函数
• Cox不能直接提供基准函数的估计,但它的估计具有其他 MLE的渐进性特征:一致性,有效性,正态性。
• Cox似然函数的构建是基于事件发生的秩序而不是事件的 联合分布,故称之为偏似然。
3
事件史分析的分类
• 非参数模型(Non-parametric Estimation) 生命表方法; Kaplan-Meier乘积限(Product-Limit)法;
• 半参数模型:Cox模型
• 参数模型: Weibull; 对数logistic; 对数正态; 广义伽马;
4
Cox模型
h(t ) h (t )e[1X1ij 2X2ij ...p X pij ]
114
urban
0.27
0.44
0
1
school
0.17
0.37
0
1
ecoindepend 0.03
0.18
0
1
married
0.06
0.23
0
1
alone
0.09
0.28
0
1
close
0.48
0.50
0
1
caregiver
0.94
0.24
0
1
exercise deficit
0.19 0.15
727
0.39 0.14
Leabharlann Baidu
0
1
0 0.63
11
Stata回归命令(手动输出结果)
*/设置数据类型/* stset duration, failure(status9805==1)
*/模型I:仅考虑g1/* stcox g1 male trueage urban school ecoindepend married alone close caregiver deficit exercise
--发表于Journal of Gerontology: Biological Sciences
8
研究目的
• 基因FOXO-1A209及FOXO-3A310是否对死亡风险及 预期寿命产生显著性影响?其是否存在交互作用?
• 哪些社会经济因素会影响死亡风险及预期寿命? • 基因对死亡风险的影响是否与社会经济因素有关?
健康行为 现在经常锻炼身体(No=0) 虚弱指数
样本量
变量编码 duration status9805
均值 标准差 最小值 最大值
962.47 722.18
1
2644
0.94
0.23
0
1
g1
0.40
0.49
0
1
g2
0.54
0.50
0
1
male
0.24
0.43
0
1
trueage
100.58
3.76
80
2
生存函数与风险函数
• 生存函数 S(t): S(t) Pr(T t) P(观测个体持续时间长于t) 1 F(t)
• 风险函数 h(t):
h(t) lim Pr(t T t t | T t)
t 0
t
Pr[年龄为t的个体在(t,t t)中的"事件"]
lim
t 0
t
• 风险函数h(t)给出的是观测个体已生存时间t后,单位时间 发生事件的瞬时可能性。可看作是生存函数的相反信息。
换言之,当人体存在对长寿不利的基因时,是否 能够通过后天的社会经济因素的干预,以克服这 种先天性的不利影响?
9
样本选取—中国老年健康影响因素跟踪调查(CLHLS)
10
变量选取及描述性统计
变量 自1998年调查至死亡时的存活天数 2005年调查时已死亡(仍存活=0)
基因类型 具有基因类型G1 (No=0) 具有基因类型G2 (No=0)
*/模型II:仅考虑g2/* stcox g2 male trueage urban school ecoindepend married alone close caregiver deficit exercise
*/模型III:同时引入g1及g2/* stcox g1 g2 male trueage urban school ecoindepend married alone close caregiver deficit exercise
人口及社会经济因素 男性(女性=0) 1998年调查时年龄 居住在城镇(农村=0) 接受过一年或以上教育(文盲=0) 被访老人经济上独立(依赖他人=0)
家庭因素 1998年处于有偶状态(丧偶=0) 1998年独自居住(与家人同住=0) 至少一位子女同住或住在附近(No=0) 生病时由家庭成员照顾(No=0)