第五章 统计方法在循证医学中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
13
下面我们以某地13岁女孩118人的身高(cm) 资料,来说明身高变量服从正态分布。 频数分布表:
某地 13 岁女孩 118 人的身高(cm)资料频数分布 身高组段 (1) 129~ 132~ 135~ 138~ 141~ 144~ 147~ 150~ 153~ 156~ 159~162 合计 频数 (2) 2 2 8 20 26 25 20 9 3 2 1 118 组中值 (3) 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 —
32
Piosson分布与 正态分布及二项分布的关系
当较小时, Piosson分布呈偏态分布,随
着增大,迅速接近正态分布,当20时,
可以认为近似正态分布。
Piosson分布是二项分布的特例,某现象的发生
率很小,而样本例数n很大时,则二项分布接近
于Piosson分布。 = n (应用: Piosson替
11
医学统计学的主要内容
医学多元统计分析方法 :多元线性回归和逐步回 归、Logistic回归、生存分析、判别分析、聚类 分析、主成分分析、因子分析、典型相关分析等。
统计软件 :SAS软件、SPSS软件和STATA软件
等。
12
正态分布
正态分布的通俗概念: 如果把数值变量资 料编制频数表后绘制频数分布图(又称直 方图,它用矩形面积表示数值变量资料的 频数分布,每条直条的宽表示组距,直条 的面积表示频数(或频率)大小,直条与 直条之间不留空隙。),若频数分布呈现 中间为最多,左右两侧基本对称,越靠近 中间频数越多,离中间越远,频数越少, 形成一个中间频数多,两侧频数逐渐减少 且基本对称的分布,那我们一般认为该数 值变量服从或近似服从数学上的正态分布。
18
二项分布
任意一次试验中,只有事件A发生和不发生两 种结果,发生的概率分别是: 和1- 若在相同的条件下,进行n次独立重复试验, 用X表示这n次试验中事件A发生的次数,那么 X服从二项分布,记做 XB(n,),也叫Bernolli 分布。
19
那么事件A(死亡)发生的次数X(1,2,3….n) 的概率P:
代二项分布)
33
X 0 1 2 3 4 5 6 7 8
P(X) 二项分布 Piosson分布 0.3660 0.3679 0.3697 0.3679 0.1849 0.1839 0.0610 0.0613 0.0149 0.0153 0.0029 0.0031 0.0005 0.0005 0.0001 0.0001 0.0000 0.0000 1.0000 1.0000
求 置信区间
3
冠心灵与单纯西药疗效对比 显效 有效 无效 合计 单纯西药 冠心灵 9 19 25 18 6 5 40 42
假设检验 (test of significance), 俗称要算P值。
4
某杂志报道,用某种中草药 治疗玫瑰糠疹,有效率为78%, 平均疗程为3周左右。试问此药 治疗玫瑰糠疹的确有效吗?
此药的 78%疗效有待探讨 !
5
医学统计中的基本概念
什么是医学统计学 医学统计学的主要内容
统计学中的几个基本概念
统计工作的基本步骤
6
一、什么是医学统计学
世界上各类现象的发展变化规律,都表现为质与量的
辩证统一。要认识某现象客观存在的规律性,就必须
认识其质与量的辩证关系,认识其数量关系的特征及
度的界限,这一切都离不开统计学。
29
Piosson分ቤተ መጻሕፍቲ ባይዱ的特点
Piosson分布的图形 Piosson分布的可加性 Piosson分布与正态分布及二项分布的 关系。
30
31
Piosson分布的可加性
观察某一现象的发生数时,如果它呈Piosson 分布,那么把若干个小单位合并为一个大单位 后,其总计数亦呈Piosson分布。 如果X1P(1), X2P(2),… XKP(K), 那么X=X1+ X2+… +XK , = 1 + 2 + … + k ,则XP()。
14
频数分布图一(又称直方图)
从频数表及频数分布图上 可得知: 该数值变量资料频 数分布呈现中间频数多, 左右两侧基本对称的分布。 所以我们通俗地认为该资 料服从正态分布。
30
20
频数
10 0 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5
154.5
统计研究设计 : 专业设计和统计设计。 统计设计:调查设计和实验设计
医学统计学的基本原理与方法 :
①几个重要的理论分布:正态分布、二项分布和Poisson分布; ②统计描述:常用描述性指标,如集中趋势和离散趋势指标、 相对数、相关系数、回归系数及统计表与统计图; ③统计推断:总体参数估计和假设检验; ④医学参考值范围的确定; ⑤直线相关和直线回归分析。
8
另一类现象是随机的,例如:在相同的条件下, 向上抛一枚质地均匀的硬币,其结果可能是正面 朝上,也可能是反面朝上,不论如何控制抛掷条 件,在每次抛掷之前无法肯定抛掷的结果是什么, 这个试验多于一种可能结果,但是在试验之前不 能肯定试验会出现哪一个结果。同样地同一门大 炮对同一目标进行多次射击(同一型号的炮弹), 各次弹着点可能不尽相同,并且每次射击之前无 法肯定弹着点的确切位置,以上所举的现象都具 有随机性,即在一定条件下进行试验或观察会出 现不同的结果(也就是说,多于一种可能的试验 结果),而且在每次试验之前都无法预言会出现 哪一个结果(不能肯定试验会出现哪一个结果), 这种现象称为随机现象。
34
例题:
一般人群食管癌的发生率为8/10000。某研究 者在当地随机抽取500人,结果6人患食管癌。 请问当地食管癌是否高于一般? 分析题意,选择合适的统计量计算方法。 二项分布计算方法: n k nk
P(X
k)
k
(1 )
Piosson分布的计算方法:均数是?
P( X X )
自然界中存在的各种现象可归纳为两类: 必然现象 随机现象
7
在自然界和人的实践活动中经常遇到各种 各样的现象,这些现象大体可分为两类: 一类是确定的,例如“在一个标准大气压 下,纯水加热到100时必然沸腾。”“向上 抛一块石头必然下落。”,“同性电荷相 斥,异性电荷相吸。”等等,这种在一定 条件下有确定结果的现象称为必然现象 (确定性现象);
(2)统计学中,可以把同质理解为对研究指标影响较大的、
可以控制的主要因素尽可能相同。
37
2. 变异(variation)
同质基础上的各观察单位的某变量值的个体差异称为 变异。 (1)如同性别、同年龄、同民族、同地区健康儿童的 身高、体重不尽相同;用同一疗法治疗同病种、病程 的患者,疗效却不相同。 (2)变异是生物体的基本属性之一,也是统计研究的 前提。若所研究的同质群体中各个观察单位都一样, 没有差别,分析一个就够了,无须进行统计研究。
P(X
n k
k)
k n
n k
k
(1 )
n!
nk
C
各种符号的意义 XB(n,):随机变量X服从以n,为参数的二项分布。
20
( n k )! k !
二项分布的均数与标准差
通过总体中的取样过程理解均数与标准差 XB(n,): X的均数X = n X的方差X2 = n(1-) X的标准差: x n (1 )
26
放射性物质单位时间内的放射次数
单位体积内粉尘的计数 血细胞或微生物在显微镜下的计数 单位面积内细菌计数 人群中患病率很低的非传染性疾病的患病数
特点:罕见事件发生数的分布规律
27
Piosson的概念
常用于描述单位时间、单位平面或单位空间中罕见
“质点”总数的随机分布规律。 罕见事件的发生数为X,则X服从Piosson分布。 记为:XP()。 X X的发生概率P(X):
157.5
160.5
身高(cm)
15
某地13岁女孩118人身高(cm)频数分布图
正态分布
均数
标准差
正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ): 均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或 扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平 16
观察上节总体密度曲线的形状,有什么特征?
X
X!
e u
35
三、统计学中的几个基本概念
同质 变异
总体
样本 参数与统计量 误差 概率 变量
36
1. 同质(homogeneity)
同质: 除实验因素外,影响被研究指标的非实验因素相同 被称为同质。 (1)医学研究中,有些影响因素往往是难以控制的(如遗 传、营养等),甚至是未知的。因此,在实际工作中只有 相对的同质。
样本率的标准差(标准误)Sp:
24
二项分布的概率
例题
假设小白鼠接受一定剂量的毒物时,其死亡 概率是80%。对每只小白鼠来说,其死亡 事件A发生的概率是0.8,生存事件A的发 生概率是0.2。试验用3只小白鼠,请列举 可能出现的试验结果及发生的概率。
25
Piosson分布的意义
盒子中装有999个黑棋子,一个白棋子,在 一次抽样中,抽中白棋子的概率1/1000 在100次抽样中,抽中1,2,…10个白棋子 的概率分别是……
P( X X )
X!
e
u
Piosson分布的总体均数为 Piosson分布的均数和方差相等。 =2
28
Piosson分布的条件
由于Piosson分布是二项分布的特例,所以,二
项分布的三个条件也就是Piosson分布的适用条件。 另外,单位时间、面积或容积、人群中观察事件 的分布应该均匀,才符合Piosson分布。
38
例某地某年用随机抽样方法检查了140名健 康成年男子的红细胞数(1012/L):
4.76 5.26 5.00 4.73 5.24 4.97 4.33 4.83 4.95 5.07 4.81 4.54
… …
5.61 5.95 4.46 4.57 4.31 4.47 5.34 4.70 4.81 4.93 4.71 4.44 4.94 5.05 4.78 4.56 5.44 4.79 4.91 4.26 4.80 5.30 4.65 4.77 4.50 3.82 4.01 4.89 4.62 5.12
21
二项分布的图形
22
图形特点:两个轴意义,对称、偏态、与 正态分布的关系 决定图形的两个参数:n,
23
样本率的均数和标准差
样本率的总体均数p:
p x ( n ) n n
1
1
样本率的总体标准差p:
1 p x n n
1
Sp p 1 p n
而具有这种特征的总体密度曲线,一 般可用一个我们不很熟悉的函数来表示或 近似表示其解析式。
17
主要特征
1、集中性:正态曲线的高峰位于正中央,即均数 所在的位置。 2、对称性:正态曲线以均数为中心,左右对称, 曲线两端永远不与横轴相交。 3、均匀变动性:正态曲线由均数所在处开始,分 别向左右两侧逐渐均匀下降。 4、正态分布有两个参数,即均数μ和标准差σ, 可记作N(μ,σ):均数μ决定正态曲线的中心位 置;标准差σ决定正态曲线的陡峭或扁平程度。σ 越小,曲线越陡峭;σ越大,曲线越扁平。 5、u变换:为了便于描述和应用,常将正态变量 作数据转换。
第五章
统计方法在循证医学中的应用
下载资料邮箱gushangxi2009@ 密码:123456
1
医学统计中的基本概念
2
某医院某大夫使用“乌贝散” 治疗胃溃疡出血107例,有效101例, 有效率为94.4%。如果别的医院, 其它大夫也使用“乌贝散”治疗胃 溃疡出血,其有效率也一定是94.4 %吗?
9
什么是医学统计学
统计学(statistics)是认识社会和自然界中随机
现象之数量特征的一门科学。 医学统计学 (medical statistics) 是应用概率论和数 理统计的基本原理与方法,结合医学实际阐述统 计设计的基本原理和步骤、研究资料或信息的搜
集、整理和分析的一门学科。
10
二、医学统计学的主要内容
下面我们以某地13岁女孩118人的身高(cm) 资料,来说明身高变量服从正态分布。 频数分布表:
某地 13 岁女孩 118 人的身高(cm)资料频数分布 身高组段 (1) 129~ 132~ 135~ 138~ 141~ 144~ 147~ 150~ 153~ 156~ 159~162 合计 频数 (2) 2 2 8 20 26 25 20 9 3 2 1 118 组中值 (3) 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 —
32
Piosson分布与 正态分布及二项分布的关系
当较小时, Piosson分布呈偏态分布,随
着增大,迅速接近正态分布,当20时,
可以认为近似正态分布。
Piosson分布是二项分布的特例,某现象的发生
率很小,而样本例数n很大时,则二项分布接近
于Piosson分布。 = n (应用: Piosson替
11
医学统计学的主要内容
医学多元统计分析方法 :多元线性回归和逐步回 归、Logistic回归、生存分析、判别分析、聚类 分析、主成分分析、因子分析、典型相关分析等。
统计软件 :SAS软件、SPSS软件和STATA软件
等。
12
正态分布
正态分布的通俗概念: 如果把数值变量资 料编制频数表后绘制频数分布图(又称直 方图,它用矩形面积表示数值变量资料的 频数分布,每条直条的宽表示组距,直条 的面积表示频数(或频率)大小,直条与 直条之间不留空隙。),若频数分布呈现 中间为最多,左右两侧基本对称,越靠近 中间频数越多,离中间越远,频数越少, 形成一个中间频数多,两侧频数逐渐减少 且基本对称的分布,那我们一般认为该数 值变量服从或近似服从数学上的正态分布。
18
二项分布
任意一次试验中,只有事件A发生和不发生两 种结果,发生的概率分别是: 和1- 若在相同的条件下,进行n次独立重复试验, 用X表示这n次试验中事件A发生的次数,那么 X服从二项分布,记做 XB(n,),也叫Bernolli 分布。
19
那么事件A(死亡)发生的次数X(1,2,3….n) 的概率P:
代二项分布)
33
X 0 1 2 3 4 5 6 7 8
P(X) 二项分布 Piosson分布 0.3660 0.3679 0.3697 0.3679 0.1849 0.1839 0.0610 0.0613 0.0149 0.0153 0.0029 0.0031 0.0005 0.0005 0.0001 0.0001 0.0000 0.0000 1.0000 1.0000
求 置信区间
3
冠心灵与单纯西药疗效对比 显效 有效 无效 合计 单纯西药 冠心灵 9 19 25 18 6 5 40 42
假设检验 (test of significance), 俗称要算P值。
4
某杂志报道,用某种中草药 治疗玫瑰糠疹,有效率为78%, 平均疗程为3周左右。试问此药 治疗玫瑰糠疹的确有效吗?
此药的 78%疗效有待探讨 !
5
医学统计中的基本概念
什么是医学统计学 医学统计学的主要内容
统计学中的几个基本概念
统计工作的基本步骤
6
一、什么是医学统计学
世界上各类现象的发展变化规律,都表现为质与量的
辩证统一。要认识某现象客观存在的规律性,就必须
认识其质与量的辩证关系,认识其数量关系的特征及
度的界限,这一切都离不开统计学。
29
Piosson分ቤተ መጻሕፍቲ ባይዱ的特点
Piosson分布的图形 Piosson分布的可加性 Piosson分布与正态分布及二项分布的 关系。
30
31
Piosson分布的可加性
观察某一现象的发生数时,如果它呈Piosson 分布,那么把若干个小单位合并为一个大单位 后,其总计数亦呈Piosson分布。 如果X1P(1), X2P(2),… XKP(K), 那么X=X1+ X2+… +XK , = 1 + 2 + … + k ,则XP()。
14
频数分布图一(又称直方图)
从频数表及频数分布图上 可得知: 该数值变量资料频 数分布呈现中间频数多, 左右两侧基本对称的分布。 所以我们通俗地认为该资 料服从正态分布。
30
20
频数
10 0 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5
154.5
统计研究设计 : 专业设计和统计设计。 统计设计:调查设计和实验设计
医学统计学的基本原理与方法 :
①几个重要的理论分布:正态分布、二项分布和Poisson分布; ②统计描述:常用描述性指标,如集中趋势和离散趋势指标、 相对数、相关系数、回归系数及统计表与统计图; ③统计推断:总体参数估计和假设检验; ④医学参考值范围的确定; ⑤直线相关和直线回归分析。
8
另一类现象是随机的,例如:在相同的条件下, 向上抛一枚质地均匀的硬币,其结果可能是正面 朝上,也可能是反面朝上,不论如何控制抛掷条 件,在每次抛掷之前无法肯定抛掷的结果是什么, 这个试验多于一种可能结果,但是在试验之前不 能肯定试验会出现哪一个结果。同样地同一门大 炮对同一目标进行多次射击(同一型号的炮弹), 各次弹着点可能不尽相同,并且每次射击之前无 法肯定弹着点的确切位置,以上所举的现象都具 有随机性,即在一定条件下进行试验或观察会出 现不同的结果(也就是说,多于一种可能的试验 结果),而且在每次试验之前都无法预言会出现 哪一个结果(不能肯定试验会出现哪一个结果), 这种现象称为随机现象。
34
例题:
一般人群食管癌的发生率为8/10000。某研究 者在当地随机抽取500人,结果6人患食管癌。 请问当地食管癌是否高于一般? 分析题意,选择合适的统计量计算方法。 二项分布计算方法: n k nk
P(X
k)
k
(1 )
Piosson分布的计算方法:均数是?
P( X X )
自然界中存在的各种现象可归纳为两类: 必然现象 随机现象
7
在自然界和人的实践活动中经常遇到各种 各样的现象,这些现象大体可分为两类: 一类是确定的,例如“在一个标准大气压 下,纯水加热到100时必然沸腾。”“向上 抛一块石头必然下落。”,“同性电荷相 斥,异性电荷相吸。”等等,这种在一定 条件下有确定结果的现象称为必然现象 (确定性现象);
(2)统计学中,可以把同质理解为对研究指标影响较大的、
可以控制的主要因素尽可能相同。
37
2. 变异(variation)
同质基础上的各观察单位的某变量值的个体差异称为 变异。 (1)如同性别、同年龄、同民族、同地区健康儿童的 身高、体重不尽相同;用同一疗法治疗同病种、病程 的患者,疗效却不相同。 (2)变异是生物体的基本属性之一,也是统计研究的 前提。若所研究的同质群体中各个观察单位都一样, 没有差别,分析一个就够了,无须进行统计研究。
P(X
n k
k)
k n
n k
k
(1 )
n!
nk
C
各种符号的意义 XB(n,):随机变量X服从以n,为参数的二项分布。
20
( n k )! k !
二项分布的均数与标准差
通过总体中的取样过程理解均数与标准差 XB(n,): X的均数X = n X的方差X2 = n(1-) X的标准差: x n (1 )
26
放射性物质单位时间内的放射次数
单位体积内粉尘的计数 血细胞或微生物在显微镜下的计数 单位面积内细菌计数 人群中患病率很低的非传染性疾病的患病数
特点:罕见事件发生数的分布规律
27
Piosson的概念
常用于描述单位时间、单位平面或单位空间中罕见
“质点”总数的随机分布规律。 罕见事件的发生数为X,则X服从Piosson分布。 记为:XP()。 X X的发生概率P(X):
157.5
160.5
身高(cm)
15
某地13岁女孩118人身高(cm)频数分布图
正态分布
均数
标准差
正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ): 均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或 扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平 16
观察上节总体密度曲线的形状,有什么特征?
X
X!
e u
35
三、统计学中的几个基本概念
同质 变异
总体
样本 参数与统计量 误差 概率 变量
36
1. 同质(homogeneity)
同质: 除实验因素外,影响被研究指标的非实验因素相同 被称为同质。 (1)医学研究中,有些影响因素往往是难以控制的(如遗 传、营养等),甚至是未知的。因此,在实际工作中只有 相对的同质。
样本率的标准差(标准误)Sp:
24
二项分布的概率
例题
假设小白鼠接受一定剂量的毒物时,其死亡 概率是80%。对每只小白鼠来说,其死亡 事件A发生的概率是0.8,生存事件A的发 生概率是0.2。试验用3只小白鼠,请列举 可能出现的试验结果及发生的概率。
25
Piosson分布的意义
盒子中装有999个黑棋子,一个白棋子,在 一次抽样中,抽中白棋子的概率1/1000 在100次抽样中,抽中1,2,…10个白棋子 的概率分别是……
P( X X )
X!
e
u
Piosson分布的总体均数为 Piosson分布的均数和方差相等。 =2
28
Piosson分布的条件
由于Piosson分布是二项分布的特例,所以,二
项分布的三个条件也就是Piosson分布的适用条件。 另外,单位时间、面积或容积、人群中观察事件 的分布应该均匀,才符合Piosson分布。
38
例某地某年用随机抽样方法检查了140名健 康成年男子的红细胞数(1012/L):
4.76 5.26 5.00 4.73 5.24 4.97 4.33 4.83 4.95 5.07 4.81 4.54
… …
5.61 5.95 4.46 4.57 4.31 4.47 5.34 4.70 4.81 4.93 4.71 4.44 4.94 5.05 4.78 4.56 5.44 4.79 4.91 4.26 4.80 5.30 4.65 4.77 4.50 3.82 4.01 4.89 4.62 5.12
21
二项分布的图形
22
图形特点:两个轴意义,对称、偏态、与 正态分布的关系 决定图形的两个参数:n,
23
样本率的均数和标准差
样本率的总体均数p:
p x ( n ) n n
1
1
样本率的总体标准差p:
1 p x n n
1
Sp p 1 p n
而具有这种特征的总体密度曲线,一 般可用一个我们不很熟悉的函数来表示或 近似表示其解析式。
17
主要特征
1、集中性:正态曲线的高峰位于正中央,即均数 所在的位置。 2、对称性:正态曲线以均数为中心,左右对称, 曲线两端永远不与横轴相交。 3、均匀变动性:正态曲线由均数所在处开始,分 别向左右两侧逐渐均匀下降。 4、正态分布有两个参数,即均数μ和标准差σ, 可记作N(μ,σ):均数μ决定正态曲线的中心位 置;标准差σ决定正态曲线的陡峭或扁平程度。σ 越小,曲线越陡峭;σ越大,曲线越扁平。 5、u变换:为了便于描述和应用,常将正态变量 作数据转换。
第五章
统计方法在循证医学中的应用
下载资料邮箱gushangxi2009@ 密码:123456
1
医学统计中的基本概念
2
某医院某大夫使用“乌贝散” 治疗胃溃疡出血107例,有效101例, 有效率为94.4%。如果别的医院, 其它大夫也使用“乌贝散”治疗胃 溃疡出血,其有效率也一定是94.4 %吗?
9
什么是医学统计学
统计学(statistics)是认识社会和自然界中随机
现象之数量特征的一门科学。 医学统计学 (medical statistics) 是应用概率论和数 理统计的基本原理与方法,结合医学实际阐述统 计设计的基本原理和步骤、研究资料或信息的搜
集、整理和分析的一门学科。
10
二、医学统计学的主要内容