方积乾《卫生统计学》临床试验研究统计分析
方积乾卫生统计学多重线性回归与相关课件

21
第四节 自变量筛选
2021/4/4
方积乾卫生统计学多重线性回归与相关
23
一、自变量筛选的标准与原则
1.残差平方和缩小或决定系数增大 R2 1 SS残 SS总
2021/4/4
方积乾卫生统计学多重线性回归与相关
24
2.残差均方缩小或调整决定系数增大
MS残
n
SS残 p1
Ra2
1
MS残 MS总
2021/4/4
方积乾卫生统计学多重线性回归与相关
28
2.前向选择(forward selection)
该方法从仅含常数项的模型开始,首先对每个变量计算 反映其进入模型后该变量对新模型贡献量的F值,然后 将最大F值与预先指定的临界值(Fin)比较,如果最大 F值超过Fin, 则将最大F值所对应的自变量引入模型,否 则,停止运行;然后在已有一个自变量的模型基础上, 重复以上比较过程…… 这样,每次给模型增添一个变量, 直到剩下的变量再不能使最大F值超过Fin值为止。
2021/4/4
方积乾卫生统计学多重线性回归与相关
17
调整的R2 (Adjusted R-Square)
Ra2d1M M残 总 SS差 R2p n( 1pR 21)
R
2 a
0.7312
4(1 0.7312) 30 4 1
0.7312
0.0430
0.6882
2021/4/4
方积乾卫生统计学多重线性回归与相关
R 2 1773.343 1 651.958 0.7312 2425.301 2425.301
2021/4/4
方积乾卫生统计学多重线性回归与相关
16
复相关系数(multiple correlation coefficient)
2018精选版卫生统计学第7版 方积乾主编 课件第二章 定量资料的统计描述-精心整理

8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
6~
8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~
血清铁含量(μ mol/L)
图2-2 120名健康成年男子血清铁含量(μmol/L)分布
努力
30 25 20
数据如下。试编制血清铁含量的频率分布表。
努力
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
2. 确定组段数与组距(class interval)
靠近的整数作为组距,本例取i=2。
6~ 8~ 10~ 12~ 14~ 16 ~ 18 ~ 20 ~ 22 ~ 24 ~ 26 ~ 28~30
1 3 6 8 12 20 27 18 12 8 4 1
120
0.83 2.50 5.00 6.67 10.00 16.67 22.50 15.00 10.00 6.67 3.33 0.83
100.00
最大值。注意各组段不能重合,每组段只写出下限,如6~,8~,最后
一个组段可包括其上限值,如本例28~30。 4. 列表 清点各组的频数,计算频率、累积频率数和累计频率。
努力
表2-2 120名正常成年男子血清铁含量(μmmo/L)频率分布 组段 (1) 频数 (2) 频率(%) (3) 累计频数 (4) 累计频率(%) (5)
检查次数 (1) 0 1 2 3 4 5 >5 频数 (2) 4 7 11 13 26 23 12 频率(%) (3) 4.2 7.3 11.5 13.5 27.1 24.0 12.5 累计频数 (4) 4 11 22 35 61 84 96 累计频率(%) (5) 4.2 11.5 22.9 36.5 63.5 87.5 100.0
方积乾《卫生统计学》5_1寿命表(第七版)2

寿命表
中山大学医学统计与流行病学系 凌莉
2013.10.23
1
2011年世界人均寿命排名
序位 1. 2. 3. 35. 83.
187.
国家 日本 中国香港 瑞士 美国 中国 塞拉利昂
人均寿命 83.4 82.8 82.3 78.5 73.5 47.8
2
基本概念
寿命表: 根据特定人群的年龄组死亡率 编制出的一种统计表
ex
Tx lx
e0 T0 / l0 7566559 /100000 75.67
e1 T1 / l1 7467221 / 99220 75.26
18
去死因寿命表
基本思想:假定消除了某种死因,则原死于该原 因的人没有死亡,寿命就会延长。用于研究某种 死因对居民死亡的影响
优点:
10~ 151494 49 0.000323 0.001616 98729 160 493247 6576657 66.61
15~ 182932 48 0.000262 0.001311 98570 129 492525 6083411 61.72
20~ 203107 68 0.000335 0.001673 98440 165 491790 5590886 56.79
7
两种寿命表的对比
现时寿命表
定群寿命表
反映当年各年龄组死亡率的实际情 反映同时出生的一代人的实际生命
况
过程
假想人群 横断面资料,观察当年情况
实际人群 随访资料,时间长、人数多
反映某地居民当年的健康水平、生 用于生存资料分析,分析某些“生
活质量等
存”现象规律
8
现时寿命表的类别
观察性研究的设计与统计分析(方积乾1)

实例
两项有关糖尿病的观察性研究
(1) 基于现场调查资料 ----传统观察性研究
胰岛素治疗的2型糖尿病患者中胰岛素和 胰岛素类似物的剂量与癌症之间的关系
研究方法及设计
本研究克服了以往相关研究的不足1-4 - 巢式病例对照研究 - 多因素 logistic回归分析 - 纳入每种胰岛素平均日用剂量作为变量 入选标准 - 2型糖尿病;入选前5年未用过胰岛素;无恶性肿瘤史 患者平均随访75.9月,在此期间患者暴露于 甘精胰岛素、地特胰岛素、赖脯胰岛素、 门冬胰岛素、人胰岛素(基础、餐时)
连续收集 1533例门 诊2型糖尿 病患者
• 患者来源:佛罗仑 萨大学糖尿病门诊 • 于1998年1月1日 至2007年12月31 日间起始胰岛素治疗
排除193例 既往肿瘤病 史的患者
1340例2 型糖尿病患 者纳入研究
中位随访75.9月 [27.4;133.7 ]
病例组 对照组
随访期间,共 112例患者诊断 新发肿瘤(发生 率为1.9/100人 年)
病病例,同时从N1a例未发肾病中随机选 取多达 5名风险匹配的 对照
•
同时 匹配性 别、年 龄(5岁分层) 、 基线肾 功能
预先计划的比较
在肾病组和对照组之间比较 • 使用各种治疗的人数所占比例 • 使用各种治疗的剂量、时间和剂量×时间 使用各种治疗大剂量、长时间的人数所占比例(事 先制定“大剂量、长时间”的定义) 需要事先规定: 用于病例与对照匹配的指标,例如,年龄、性别等 校正若干基线重要指标(混杂变量),例如,糖化 血红蛋白、共患疾病等 25
肿瘤风险与胰岛素日用剂量的相关性
•每种胰岛素“平均日剂量≥0.3IU/day*kg ”:“大剂量” •经Chalrson同病指数、 二甲双胍暴露、总胰岛素平均日剂量 校正后
卫生统计学7版方积乾主编二定量资料的统计描述课件

2023/10/16
26
(2 ) 频率表法 当例数较多时,先将变量值从小到大编 制频率表,并分别计算累计频数和累计频率(见表2-5)。先
从累计频率找出M所在的组段,然后按下式计算。
式中L 为中位数所在组段的下限, i 为该组段的组距, fm 为 该组段的频数,ΣfL为小于L的各组段累计频数。
例2-8 50例链球菌咽颊炎患者的潜伏期(小时)如表2-5, 试计算潜伏期的中位数。
A组
. . ...
B组
.....
C组
. ... .
常用的离散指标有:
极差、四分位数间距、方差、标准差和变异系数,最常 用的指标为标准差。
2023/10/16
33
一、极差和四分位数间距
1.极差
极差(range,R)亦称全距,即一组变量值中最大值与最 小值之差。R值大,离散度就大; R值小,离散度就小。
用中位数表示平均水平主要适用于: ① 变量值中出现个 别特小或特大的数值;②资料的分布呈明显偏态,即大部分 的变量值偏向一侧;③变量值分布一端或两端无确定数值, 只有小于或大于某个数值;④资料的分布不清。
2023/10/16
24
(1)直接法 当例数较少时,先将变量值由小到大 顺序排列,再按以下公式计算。
2.频率表法: 当资料中相同变量值的个数f (即频数) 较多时,可通过频率表法计算几何均数,公式为
表2-4 52例慢性肝炎患者的 HBsAg滴度资料
2023/10/16
19
本例ΣflgX= 108.06977 , Σf=52 ,代入公式得
52例慢性肝炎患者的 HBsAg滴度的几何均数为1:119.75
式中L为Px所在组段的下限, i为该组段的组距, fx为该组段
卫生统计学第7版方积乾主编课件第二章定量资料的统计描述

2020/6/24
11
正偏态(右偏态)
负偏态(左偏态)
2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理
2020/6/24
12
第二节 描述集中趋势的统计指标
医学定量资料中,描述集中趋势的统计指标主要有 算术均数、几何均数和中位数。 一、算术均数(arithmetic mean)
本例
X X 31.26 3.9075 (U/L) n8
2020/6/24
14
2.频率表法 当变量值的个数较多时,在编制频率表 的基础上,应用加权法计算均数的近似值。
X fX 0 fX 0
f
n
公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2。
例2-4 X fX 0 2228 18.57 (μmmo/L) f 120
2020/6/24
2
统计描述是用统计图表、统计指标来描述资料的分布 规律及其数量特征的。
第一节 频率分布表与频率分布图
医学研究资料变量值的个数较多时,对个变量值出现的 频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称频数表或频率表。
2020/6/24
2020/6/24
5
二、连续型定量变量的频率分布
例2-2 抽样调查某地120名18~35岁健康男性居民血清铁含量(μmmo/L),数 据如下。试编制血清铁含量的频率分布表。
2020/6/24
6
频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之差。本例最 大值为29.64,最小值为7.42,故R=29.64-7.42=22.22 (μmmo/L)。
卫生统计学第7版 方积乾主编 课件第三章 定性资料的统计描述.

四、
应用相对数时的注意事项
1.计算相对数时分母一般不宜过小。 2.分析时不能以构成比代替率。
表3-3 不同工种的白细胞减少症患者构成比与患病率
工种 (1)
苯作业 塑料作业 化学药物 放射作业 合计
调查人数 (2)
389 311 260 154 1114
患病人数 (3)
29 13 13 9 64
⑴观察对象是否具有同质性。
⑵观察对象在各组的内部构成是否相同。对于总率的比较 应注意标准化。 ⑶对比不同时间的资料是否具有可比性。 5.对样本率(或构成比)的比较做假设检验。
2019/2/7 10
第二节 医学人口统计常用指标
医学人口统计(medical demography)是从卫生保健的 角度研究和描述人口数量、分布、结构、变动及其规律, 研究人口与卫生事业发展的相互关系,是卫生统计学的重
婚情况表、节育情况表和育龄妇女年龄别出生情况表。 3.人口调查 调查方法有普查和抽样调查。我公从1953年到2010年 先后进行了6次人口普查,2010年11月1日零时全国总人口数 为1370536875人 ,男:女=0.5127:0.4873
2019/2/7 12
二、描述人口学特征的常用指标
1.人口数(population size) 口数。
构成比(%) (4)
45.3 20.3 20.3 14.1 100.0
患病率(%) (5)
7.5 4.2 5.0 5.8 5.7
2019/2/7
9
3.对观察单位数不等的几个率,不能直接相加求其总率。
4.在比较相对数时应注意可比性。 影响率或构成比变化的因素很多,除了研究因素(即比较 的因素)外,其余的影响因素应尽可能相同或相近,即在相 同条件下比较才有意义。通常应注意:
Meta分析

Meta分析一、Meta分析的概念在医学研究中,一般不能依据单个的临床试验结果做肯定的结论,同样的临床试验常常要进行多次。
对多次相同试验设计的研究结果,可以通过综合分析给出一个结论,这种综合分析方法称为Meta分析。
Meta分析是现代临床研究中一种新的研究方法,它是用统计合并的方法对具有相同研究的多个独立的研究结果进行比较和综合分析的方法。
二、Meta分析的含义在世界范围内,对同一研究目的或项目可能有几个、几十个、甚至上百个学者在不同地区、不同年代进行研究并报告结果,但各学者在研究设计、对象选择、样本含量、指标选择、统计方法等方面不完全相同,导致研究结果并不完全一致,对这些结果进行综合评价和取舍是比较困难的,而Meta分析正是对这些结果进行定量综合的适宜统计方法。
Meta分析可以改进和提高由于样本量小而降低的统计检验的效能,从而对某些研究结果不一致的情况做出较客观的判断。
三、Meta分析的基本步骤1.提出问题,制订研究计划2.检索相关文献3.筛选纳入文献4.提取纳入文献的数据信息5.纳入文献的质量评价6.数据的统计学处理7.敏感性分析8.总结报告四、Meta分析的统计方法利用meta分析对纳入研究的文献数据进行统计处理时,首先要明确资料的类型及结局变量,然后对待合并的多个研究进行同质性检验,根据同质性检验的结果,选择适宜的统计分析模型。
同质性检验的检验假设为:H:各研究结果之间的变异是随机误差H不被拒绝,则认为各个研究结果之间的差别只是随机误如果0差,这些研究结果具有同质性。
H被拒绝了,则认为各个研究结果之间的差别不是随机误如果0差,这些研究结果存在异质性。
1.定量变量资料的Meta 分析方法对连续型定量变量资料进行Meta 分析可选择均数差作为效应变量。
如果k 个研究结果之间存在同质性,则采用固定效应模型估计标准化均数差与标准化均数差的95%可信区间;①标准化均数差: ∑∑===k i iki i i N d N d 11i N 是第i 个研究的两个样本含量之和:i i n n 21+;i d 是第i 个研究的两个样本均数差i i X X 21-除以两个样本的合并标准差2)1()1(21222211-+-+-=i i i i i i i n n S n S n S ,即:ii i i S X X d 21-=,i =1,2…,k ; ②标准化均数差的95%可信区间:k S d e /96.1± 式中,)81(421d N kS k i i e +⨯=∑= 根据标准化均数差的95%可信区间是否包含0,做出推断结论。
卫生统计学第7版 方积乾主编 课件第三章 定性资料的统计描述

为年龄别生育率;Lx为女性寿命表中各年龄组平均存活率。
NRR>1,表明未来人口将增加,NRR<1,表明未来人 口将减少。
2018/3/7 24
9.婴儿死亡率(infant mortality rate , IMR)
同年 1周岁死亡人数 IMR 1000/ 1000 同年活产儿总数
活产的世界卫生组织(WHO)定义为:新生儿分娩 后有呼吸、心跳、脐动脉搏动等生命现象者称为活产。婴
个月内某病发生84人,月发病率=84/10000×3=28/万
2018/3/7
7
三、相对比
相对比( relative ratio )简称为比( ratio ),是 A , B 两个有关指标之比,说明A是B的若干倍或百分之几,通常 用倍数或分数表示。计算公式为
A 比 (或× 100%) B
两个比较指标可以性质相同,也可以性质不同。如相 对危险度(RR)、变异系数(CV)等;A、B两个指标 可以是绝对数、相对数或平均数等。
分为时点人口数和平均人
时点人口数:7月1日零时人口数。
平均人口数:相邻两年年末人口数的平均值。常用于 计算出生率、死亡率、发病率等指标的分母。
2.人口构成及其统计指标 (1)人口金字塔(population pyramid) 人口金字塔是以图形的方式表达人口的性别和年龄构成。
2018/3/7
13
2018/3/7
儿死亡率被公认为是反映居民健康水平、社会经济及卫生
服务水平,特别是妇幼卫生服务质量的敏感指标。它不受 人口构成的影响,不同的国家和地区可直接进行比较。同
时婴儿死亡率是编制寿命表的重要指标,直接影响到预期
寿命的高低。
2018/3/7 25
卫生统计学第二版习题册方积乾答案与解析

卫生统计学第二版习题册方积乾答案与解析第一章绪论1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的?答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。
2、统计工作可分为那几个步骤?答:设计、收集资料、整理资料、分析资料四个步骤。
3、举例说明小概率事件的含义。
答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。
第二章调查研究设计1、调查研究有何特点?答:(1)不能人为施加干预措施;(2)不能随机分组;(3)很难控制干扰因素;(4)一般不能下因果结论2、四种常用的抽样方法各有什么特点?答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便:缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。
(2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小:缺点是在某些情况下会出现偏性或周期性变化。
(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计:缺点是事先要进行分层,操作麻烦。
(4)整群抽样:优点是易于组织和操作大规模抽样调查:缺点是抽样误差大。
3、调查设计包括那些基本内容?答:(1)明确调查目的和指标;(2)确定调查对象和观察单位;(3)选释调查方法和技术;(4)估计样本大小;(5)编制调查表;(6)评价问卷的信度和效度;(7)制定资料的收集计划;(8)指定资料的整理与分析计划;(9)制定调查的组织措施。
4、调查表中包含那几种项目?答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。
方积乾《卫生统计学》1实验研究的设计与实施2

2 Z / 2 c (1 c ) Z 2 1 (1 1 ) 2 2 (1 2 ) N 1 2
2 1.96 0.35(1 0.35) 0.84 2 0.25(1 0.25) 2 0.45(1 0.45) 0.45 0.25 2 1.96 0.35(1 0.35) 0.84 2 0.25(1 0.25) 2 0.45(1 0.45) 0 . 45 0 . 25 1.8697 0.7835 176 2019/2/3 0.20
2019/2/3
15
(3)随机 (Randomization)
• 使实验组与对照组在非实验因素的分布方面尽量 保持均衡一致。 • 降低系统误差的影响,贯穿于设计和实施全过程: (1)样本代表性 总体中任何一个个体都有同等 的机会进入样本; (2)组间可比性 样本中任何一个个体都有同等 机会被分配到任何一个组 (3)排除实验顺序影响 样本中的任何一个个体先 后接受处理的机会相同
第四节 临床试验设计与实施中 的特殊问题
Special Issues in Clinical Trials
2019/2/3
32
一、临床试验的分期
I 期临床试验: 初步的临床药理学及人体安全性评价试验,为 制定给药方案提供依据: • 人体耐受性试验 • 药物代谢动力学 II 期临床试验: 初步评价治疗作用。 • 药物对目标适应症患者的治疗作用和安全性; • 为III期临床试验研究设计和给药剂量方案的确定 提供依据。 • 可以根据具体的研究目的,采用多种形式。
2019/2/3 34
二、临床试验设计的基本原则
对照、随机、重复、均衡 + 盲法 (1) 对照
方积乾卫生统计学-2观察性研究的设计与实施1

2020/4/5
16
(3)公共优势比 OR 的 95%置信区间
Miettinen 法估计:
OR
1
1.96
2 MH
例 16-8
OR:
OR
1
1.96
M2 H
= 5.291
1.96 86.51
=
(3.72
,
7.51)
2020/4/5
17
3.多个暴露水平的剂量-反应关系 暴露分
例 16-9 食管癌与饮酒关系病例-对照研究
OR 5.64
OR:
1.96
1
2
OR
1
5.64
1.96 110.14
(4.08,7.79)
2020/4/5
14
2.分层四格表资料的分析
例16-8 食管癌与饮酒关系病例-对照研究
每日饮酒量 (g/天)
80+ 0~79
ORh
25~44 病对 例照 5 35 5 270
7.71
年龄组(岁)
45~54 病对 例照
人数不同
例 16-11 子宫内膜癌与服用雌激素关系的 1:4 病例-对照研究
正常 (对照)
服用雌激素
未服 合计
子宫内膜癌 服用雌激素
(病例)
未服
1 17 组 4组
2 16 组 1组
3
4
0
15 组 5 组 3 组
1组 1组 0组
病例:63 名(其中 56 名服用雌激素); 对照:63×4 = 252 名 匹配组:63 个
55~64 病对 例照
25 29 42 27
21 138 34 139
5.67
6.36
方积乾卫生统计学临床试验研究统计分析课件

20
假设检验类型
优效(Superiority): “试验组(E)优于对照组(C )”
等效(Equivalence): “试验组(E)与对照组(C )相当”
非劣效(Non-inferiority ):
“试验组(E) 比对照组(C ) 差但不多”
2021/4/4
方积乾卫生统计学临床试验研究统计分析
2021/4/4
方积乾卫生统计学临床试验研究统计分析
15
基线描述的统计指标
定量资料: 正态---均数、标准差、最小、最大值
非正态---中位数、四分位数间距、最小、最大值
定性资料: 各分类频数(阴性数、阳性数)、构成比
等级资料: 各等级频数、构成比
2021/4/4
方积乾卫生统计学临床试验研究统计分析
将末次观察应答视作其研究终点时 适用于 MCAR 假设,倾向于得到保守
的应答
的结论
基线访视结转(baseline observation carried forward, BOCF)
将基线观察应答视作其研究终点时 适用于 MCAR 假设,倾向于得到保守
的应答
的结论
最差病例填补(worst case imputation, WCI)
21
不同假设检验类型的结论
非劣效性检验:
97.5%CI(试验药-阳性对照药) > -△ P < 0.025(单侧检验), ★试验药不差于阳性对照药
97.5%CI (试验药-阳性对照药) < -△ P > 0.025, ★无法判断试验药是否不差于阳性对照药
注: △代表有临床意义的差异
2021/4/4
24
注意
疗效的判断标准必须与试验方案一致
卫生统计学选择题(方积乾)

卫生统计学选择题(方积乾)一、选择题(一)A1题每一道题下面有A、B、C、D、E五个被选答案,请从中选择一个最佳答案。
1.下面的变量中,属于分类变量的是(B)A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.下面的变量中,属于定量变量的是(B)A.性别B.体重C.血型D.职业E.民族3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于(A)A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料4.上述资料可以转换为(C)A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料5.若要通过样本作统计推断,样本应是(C)A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.统计量(E)A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标7.因果关系(C)A.就是变量间数量上的联系B.可以用统计方法证明C.必定表现为数量间的联系D.可以通过单独考察两个变量间关系得出E.可以通过变量间数量上的联系来证明(二)A2型每一道题以一个小案例出现,其下面都有A、B、C、D、E五个备选答案,请从中选择3一个最佳答案。
1.教材中提及美国人1954年实施了旨在评价Salk疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。
有180万儿童参与,约有1/4参与者得到了随机化。
这180万儿童是(C)A.目标总体B.研究总体C.1份样本D.1份随机样本E.180万份样本2.上述试验最终肯定了索尔克疫苗的效果。
请问此结论是针对(C)而言。
A.180万儿童B.每个儿童C.所有使用索菲克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/4二、是非题1.定量变量、分类变量和有序变量可以相互转换。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
15
基线描述的统计指标
定量资料: 正态---均数、标准差、最小、最大值
未完成试验 未完成试验 用药时间不足11周 访视时间间隔过长
未入FAS人群原因 基线主要疗效指标缺失
无用药记录及用药后评
2020/11/13
.
13
表 15-1 常用简单数据填补方法
名称
替代方法
特点
末次访视结转(last observation carried forward, LOCF)
将末次观察应答视作其研究终点时 适用于 MCAR 假设,倾向于得到保守
.
7
FAS/ PPS /SS
全分析集(Full Analysis Set,FAS):指尽可能 接近符合意向性治疗原则的受试者集
符合方案集(Per Protocol Set,PPS):充分依从 于试验方案的受试者集,全分析集的子集
安全性数据集(Safety Set,SS):包括所有随机 化后至少接受一次治疗的受试者集
不良事件 不良事件
5
156
A组
20020423
20020618
失访
5
160
A组
20020514
20020802
其它
2
112
B组
20020522
20020607
失访
3
048
B组
20020517
20020518
不良事件
5
235
B组
20020507
20020521
失访
2020/11/13
.
12
未进入FAS、PPS人群者清单
变异程度较非条件均数填补法有所改 进,但由于没有得到残差的依据,这种 方法仍然低估了该变量的变异程度;
2020/11/13
.
14
五、基线特征描述
基线定义为随机入组时间 病例特征一般包括:人口学信息、饮食运动情况、疾病情
况等 分中心 /处理组别进行描述 基线描述分析采用FAS数据集
2020/11/13
的应答
的结论
基线访视结转(baseline observation carried forward, BOCF)
将基线观察应答视作其研究终点时 适用于 MCAR 假设,倾向于得到保守
的应答
的结论
最差病例填补(worst case imputation, WCI)
将对照组缺失值结转为“成功”,试 验组缺失值结转为“失败”
中心号 1 1 2 2 2 3 5 2 2 5 5
药物号 9 96 18
101 183 114 76 19 112 70 225
治疗分组 A组 A组 A组 A组 A组 A组 A组 B组 B组 B组 B组
未入PPS人群原因 基线主要疗效指标缺失
未完成试验 访视时间间隔过长
未完成试验 合并用药违背方案
未完成试验 Cr>133,符合排除标准
233(97.08) 215(89.58)
2020/11/13
.
11
试验期间脱落病例清单
中心号 1 2 2
药物号 096 023 101
治疗分组 A组 A组 A组
入组时间 20020526 20020430 20020424
中止试验时间 20020721 20020529 20020522
脱落原因 失访
非条件均数填补 (unconditional mean imputation,UMI)
用变量的均数来代替该变量中的每 低估了变量的变异程度,且低估填补变
一个缺失数据
量与其它变量的关联程度
条件均数填补(conditional mean imputation,CMI)
据预测变量将总体交叉分层 (如根 据性别、年龄等分层),用该观察个 体所在层的完整数据的均数来替代 缺失数据
2020/11/13
.
8
Hale Waihona Puke 所有疗效指标分别用全分析集(FAS)和符合方案 集(PPS)分析
的结论为主
--------一般以FAS
安全性分析采用安全性数据集(SS )
2020/11/13
.
9
四、病例入组与试验完成情况
各中心入组及完成试验的病例数 各数据集(FAS、PPS、SS)的构成描述 脱落、剔除病例清单 观测指标缺失清单
3.盲态审核后,锁定数据、揭盲
二次揭盲
数据锁定时 分析结束时
组别(A/B组) 组别( 试验/对照)
2020/11/13
.
6
三、统计分析集
统计分析集确定原则: ITT(Intention to Treatment):意向性治疗原则 PP(Per-Protocol):符合方案原则
*数据集定义在揭盲前
2020/11/13
2020/11/13
.
10
例 入组病例及安全性、有效性分析集
随机入组 完成试验 试验期间脱落 脱落原因
不良事件 失访 其它 安全性分析集 有效性分析集 FAS PPS
试验组(%) 120(100.0) 114(95.00) 6(5.00)
3(2.50) 2(1.67) 1(0.83) 118(98.33)
临床试验统计分析
中山大学公共卫生学院 医学统计与流行病学系
郭艳
目录
一、概述 二、数据核查 三、统计分析集 四、病例入组与试验完成情况 五、基线特征描述 六、有效性评价 七、安全性评价 八、结论
2020/11/13
.
2
一、概述
数据分析基于临床试验方案
要点: 试验完成情况总结 药物/器械试验结果的有效性、安全性评价
2020/11/13
.
3
统计分析报告的主要内容
试验目的 总体设计 评价指标及评价方法 统计分析方法 统计分析集 有效性评价 安全性评价 结论
2020/11/13
.
4
报告撰写流程
2020/11/13
.
5
二、数据核查
1. 核查内容:数据缺失、误填、数据逻辑矛盾等
2. SAS程序核查后,人工校对(主要指标)
117(97.50) 108(90.00)
对照组(%) 120(100.0) 110(91.67) 10(8.33)
2(1.67) 7(5.83) 1(0.83) 118(98.33)
116(96.67) 107(89.17)
合计(%) 240(100.0) 224(93.33)
16(6.67)
5(2.08) 9(3.75) 2(0.83) 236(98.33)
适用于二分类变量,临床结局表现为 “治疗成功”或“治疗失败”,偏倚性 结论将有助于对照药
最好病例填补(best case imputation, BCI)
将对照组缺失值结转为“失败”,试 验组缺失值结转为“成功”
适用于二分类变量,临床结局表现为 “治疗成功”或“治疗失败”,偏倚性 结论将有利于试验药