数学建模-多元统计分析引论(共52张PPT)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

持续吸烟组的死亡相对危险度怎么比不吸
烟组低呢?(烟草公司希望) 在你假定在此研究中可能有差错之前,
一些其它研究发现在冠状动脉疾病血栓溶 解治疗中,吸烟和预后具有同样的关系, 这一作用被称为“吸烟者悖论”
是什么原因导致这一“悖论”呢?
Barbash, G.L.,Reiner, J., White, H.D., Et al. “Evaluation of paradoxical beneficial effects of smoking in patients receiving thrombolytic therapy for acute myocardial infarction: Mechanisms of the ‘smoker’s paradox’ from the GUSTO-I trial, with angiographic insights.” J. Am. Coll. Cardiol. 1995;26:1222-9.
MI
Coffee
90
No coffee 60
NoMI
60
90
%
60
40
Pearson chi2(1) = 12.0,P = 0.001。
说明喝咖啡人MI发生的危险性是不喝的2.25倍。 两组MI发生率差异有显著意义。 结论:喝咖啡与心肌梗塞MI有关!对否?
研究者怀虑结论,考虑到其中可能混杂其它因
表1.5 Aerobics 中心追踪研究全死亡率危险因素 的多元分析
自变量 死亡率 调整相对危险度RR
(百万分数) (95%CI)
运动量 低
中/高
38.1
25.0
1.52(1.28-1.82)*
1.0(参照组)
吸烟状况
吸烟 39.4 不吸烟 23.9
1.65(1.39-1.97)* 1.0(参照组)
这显示运动与生存率有关,它并不 依赖于吸烟、高血压、高胆固醇及家族 史。
[实例解析]
吸烟和冠状血管疾病再通术后的预后间的关系
Aerobics中心的追踪研究,他们追踪了5437例 冠状血管疾病并接受再通手术(用线和球打开 阻塞的冠状血管)的病人,将病人分为不吸烟、
以前吸烟(至少在手术前6个月戒掉)、刚戒烟(因 手术后刚戒掉)、及持续吸
但表1.1并没有回答我们的基本问题: 运动是否独立地延长寿命?
它并没有回答这个问题是由于虽然高运动量
组很少在研究期间死亡,但他们或者较很少吸 烟,或年轻,或有较低的血压。
我们应排除排除混杂因素 的影响。
[分层分析法] 表1.4 Aerobics 中心追踪研究中全因死亡患者吸烟 和体质的分层分析
吸烟 低运动量 中/高运动量
表1.5 人口学及临床因素与吸烟状况的关系
不吸烟 以前吸烟 刚戒烟 持续吸烟
年龄±SD
(年) 67±11 65±10 56±10 55±11
心绞痛病程
( 月) 41±66 51±72 21±46 29±55
糖尿病,% 21 18
8
10
高血压,% 54 48
38
表明,在吸烟组和不吸烟组中。喝咖啡与不喝咖 啡的MI发生的相对危险度相同的。
说明当存在混杂因素时,单因素分 析结论并不科学。
案例:研究生招生与性别的关系研究
<案例讨论> 研究生招生与性 别的关系研究
• 美国加州贝克莱分校1973年研究生的录 取情况如上表.
• 结果显示,男生报考人数据2691人,录 取1197人,录取比例44.5%,女生报考 人数据1835人,录取556人,录取比例 30.3%。
素,如吸烟对喝咖啡与心肌梗塞MI间关系的影响 ,进一步分层分析得到。

控制吸烟因素的干扰后结果
Smoker
Nosmoker
MI NoMI % MI NoMI %
Coffee 80 40 67 10 20 33
Noffee 20 10 67 40 80 33
优势比 OR=1 ,
OR=1
喝咖啡与心肌梗塞MI关系
0.74 (0.59-0.94)*
引自: D., et al. “Effect of smoking status on the long-term outcome after successful percutaneous coronary revascularization.”
N. Engl. J. Med. 1997; 336:755-61.
27.8 1.0(参照组)
≥ 27 Kg/m2 28.8 1.02(0.86-1.22) < 27 Kg/m2 28.2 1.0(参照组)
空腹血糖
≥120 mg/dl 34.4 1.24(0.98-1.56)
< 120 mg/dl 27.9 1.0(参照组)
异常心电图

44.4 1.64(1.34-2.01)*
women.” JAMA 1996;276:205-10
表1.3 Aerobics 中心追踪研究过程中生存与死 亡者基线特征(男性组)
指标
生存
(n=24,740)
死亡
( n=601)
• 年龄(SD) • 体重指数
• 收缩压
• 总胆固醇 • 空腹血糖
42.7 (9.7) 52.1(11.4)*
26.0 (3.6) 26.3 ( 3.5) 121.1(13.5) 130.4(19.1)*
不吸烟
低运动量
中/高运动量
每万人年
死亡数
分层相对危险度
(95%CI)
48.0 29.4
1.63(1.26-2.1ห้องสมุดไป่ตู้)* 1.0(参照组)
44.0
20.1
2.19(1.77-2.70)*
1.0(参照组)
可见低运动量组死亡率高于中/高运动量组的死亡率 ,这一分层分析表明运动的作用不依赖于吸烟状态。
但是,有可能影响运动和长寿之间关系的其它变量 是怎样的?

27.1 1.0(参照组)
慢性疾病

41.2 1.63(1.37-1.95)*

25.3 1.0(参照组)
运动与人的寿命的关系
表明,如果你比较男性中每千人年死亡数 ,你可以看出在低运动组(38.1)比中/高运 动量组(25.0)有较高的死亡数。其相对危 险度为38.1/25.0=1.52。说明低运动量的人死 亡的危险性是高运动人的1.52倍。
你可以层层分析每一原因,来证明运动对长寿的影响 不但不依赖于吸烟状态,也不依赖于年龄、性别、高血脂 、高血压等等。
如果分层分析3个变量[吸烟状态、年龄、体重( 正常/异常)],你将需要在8个组中分析运动和死亡率 的关系。
如果分层分析6个变量[吸烟状态、年龄、性别、体 重、胆固醇水平、高血压状态(是/不是)],你将需 要在64个组中分析运动和死亡率的关系。
coronary revascularization.” N. Engl, J. Med. 1997;336:755-61.
表1.6 吸烟状况和死亡危险性的 两变量关系
组别
不吸烟
以前吸烟 刚戒烟
持续吸烟
死亡相对危险度RR
( 95%CI) 1.0 (参照组)
1.08 (0.92-1.26)
0.56 (0.40-0.77)*
• 有人认为该校在研究生录取中存在性别 歧视。试对此进行讨论与分析。
混杂因素的定义
• 当某一危险因素和结果的相关性受 第三个变量和危险因素及结果之间关系的影
响,这第三个变量称为混杂因素。
上两例中,混杂因素是吸烟
排除混杂因素的两种方法

1、分层分析
2、多元统计分析
1 分层分析方法
-----控制混杂因素对结果的影响
[实例解析]
运动与寿命关系的研究
‘生命在于运动。’
‘运动有利于长寿’
流水不腐。。。
这是人类长期经验的总结,但事实 果真如此吗?是科学的结论,还是 事物的假象呢?
运动与人的寿命的关系
许多研究表明长期运动人的寿命 对多个变量进行降维处理,而选择数目较少的变量子集合;
比久坐型生活方式人的寿命长。 实践证明,多元分析是实现做定量分析的有效工具。
但多因素分析需要前提条件,模型对数据的性质要作一些假定,这些假定有时候是很难证实的。
指标
生存
死亡
但是,如果运动者寿命长的真正原 体重指数
每万人年
26. 分层相对危险度
说明当存在混杂因素时,单因素分析结论并不科学。
因是他不吸烟,没有家族病史,好的 (一)研究对象以及主要内容
1997; 336:755-61.
[多因素分析法] 为判断运动是否独立地 与死亡有关,研究者们运用了COX比例 风险分析(proportional hazards analysis)的 多元分析方法,结果如表1.2。
准许引自: Blair, S.N.,et al. ”Influences of cardiorespiratory fitness and other precursors on cardiovascular disease and allcause mortality in women.” JAMA 1996;276:205-10. Copyright 1996, American Medical Association. Additional data provided by authors.
分层分析是在其它影响因素保持恒定情况下
,评价某一危险因素对结果的影响。
例如,上面我们可以分别在吸烟者和非 吸烟者之中,比较喝啡咖与和不喝啡咖的 人。这可使我们在不依赖于吸烟的情况下 ,分析喝啡咖对MI的影响。
分层分析的优缺点
• 优点:直观简洁。
• 缺点:当考虑因素较多时分组数量倍增, • 需要例数较多,有时无法实现。
统计软件的重要作用
• “计算机软件给统计学带来革命性变化”
• 发表论文或进行科研课题时,注明统计软件 和采用的统计分析方法.
• 统计分析工具的选择: • CHISS • SAS, SPSS,STATA
混杂因素
实例
携带火柴和发生肺癌间的关系的研究。
人们观察发现那些携带火柴的人更有 可能发生肺癌。
难道这表明携带火柴可能引起肺癌?
烟4个组。结果见表1.4.
5 Hasdai, D., Garratt, K.N., Grill, D.E., Lerman, A., Homes, D.R. “Effect of
samoking status on the long-term outcome after successful percutaneous
客观事实,携带火柴不可能引起肺癌。
这中间存在混杂因素---吸烟
混杂因素的影响
图1.1 危险因素、混杂因素和结果的关系
携带火柴
肺癌
吸烟
[实例解析4]
喝咖啡与心肌梗塞MI关系的研究。
有人观察发现喝咖啡的人,很多人患MI, 这种现象是表象还是内在因果关系的?
数据来自2000年,小儿科邀请一位美国医学及生物统计学教 授来院讲学的例子。
收缩压
≥140 mmHg 35.6 1.30(1.08-1.58)* < 140 mmHg 26.1 1.0(参照组)
胆固醇
≥240 mg/dl 35.1 1.34(1.13-1.59)* < 240 mg/dl 26.1 1.0(参照组)
冠心病家族史

无 体重指数
29.9 1.07(0.90-1.29)
213.1(40.6) 228.9(45.4) 100.4(16.3) 108.1(32.0)
运动量(%)



37.9
冠心病家族史 25.4
吸烟
26.3
异常心电图 6.9
慢性病
18.4
19.3*
33.8*
36.9*
26.3* 40.3*
分析发现,存活者和死亡者之间是有明显区 别的。特点是存活者较年轻,血压较低,低胆 固醇,很少吸烟并且高运动量(基于他们踏车 试验时间长短及程度)。
所有参加者接受了基线检查,这些检查包括体检、实 验室检测及踏车试验评价身体适宜运动量。结果如表1.1 。
Blair, S.N., Kampert, J.B., Kohl, H.W., et al. ”Influences of cardiorespiratory fitness and other precursors on cardiovascular disease and all-cause mortality in men and
上两例中,混杂因素是吸烟
生活环境等,那么运动将不能改变一 5 人口学及临床因素与吸烟状况的关系
可见低运动量组死亡率高于中/高运动量组的死亡率
-----控制混杂因素对结果的影响
个人的寿命。 总胆固醇
213.
美国Aerobics中心的追踪研究
在1970-1989年间,它们追踪观察25,341男性和7084女 性, 研究运动和死亡率的关系。男性参加者被追踪观察平均 8.4年,女性平均7.5年。
相关文档
最新文档