医学统计学公式整理 简洁版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
集中趋势的描述
算术均数: 频数表资料(X0为各组段组中值)
n fX
f
fX x O
O
∑∑∑==
几何均数:
n n
X X X G ...21= 或
)
log (
log
1
n
X G ∑-=
频数表资料:
⎥
⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*
2
1
+=n X M (2)
)
(21*
12*2++=
n n X X M
百分位数
⎪⎭
⎫
⎝⎛-⋅+
=L X X f n X f i L P 100其中:L 为欲求的百分位
数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为
该组段的的频数 ,
L f 为该组段之前的累计频数
方差: 总体方差为:式(1); 样本方差为 式(2)
(1)
N X 2
2
)(μσ-∑=
(2)
1)(2
2--∑=
n X X S
标准差:
1)(2--∑=
n X X S 或 1/)(22-∑-∑=
n n
X X S 频数表资料计算标准差的公式为
1/)(22-∑∑∑-∑=
f f
fx fx S
变异系数:当两组资料单位不同或均数相差较大时,对变异
大小进行比较,应计算变异系数
%100⨯=
X S
CV
常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化
N
p
N p
i
i
∑=
'
∑=i
i p N
N p )('
2.间接法标准化
预期人数实际人数=
SMR ∑=i
i P n r
SMR
S M R P P ⨯='
正态分布:密度函数:
)2/()(2221)(σμπ
σ--=
X e X f
分布函数: 小于X 值的概率,即该点正态曲线下左侧面积
)()(x X P x F <=
特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律
标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换
σ
μ-=
X u ,u 服从总体均数为0、总体标准
差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ
医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为
S X 96.1±
样本均数标准误的估计值为
X
s =
t 分布的概念:小样本总体标准差未知时,服从自由度为n-1
的t 分布
X X X t s μ-=
总体均数可信区间的计算:
大样本或总体标准差已知:式(1); 小样本:式(2)
(1)n S
X ⋅
±96.1 (2)n
S n t t ⋅±-)1(,05.0(前一个t
表示均数) 单样本t 检验:
n S X t /0
μ-=
自由度为 n-1;
配对样本t 检验: 检验统计量:
n
S d t d /0-=
自由度为n-1(n 为对子数)
两样本t 检验:检验统计量: )
11(2
12
1n n S X X t c +-=
(错:
Sc 的平方)
2
)()(2)1()1(21222211212
222112-+-+-=
-+-+-=
∑∑n n X X X X n n S n S n S c
方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1
检验统计量:
(较小)(较大)2
2
2
1
S S F = 分子自由度为n 1-1,分母自由度为n 2-1
方差分析的基本思想: 1、总变异:总离均差平方和:
2() 1
T ij i
j
SS SS X X N νν=-==-∑∑总总=
∑∑-=N X X ij ij /)(22
∑=N X
C ij
/)(
2
2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。
21() 1
B i i i
SS SS n X X k νν-==-∑组间组间==
=
C
n X i
i
ij -∑
∑2
)(
3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。
222()(1) W E ij i i i i j i SS SS SS X X n S N k
νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i
j
i
SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内
1(1)()N k N k ννν=-=-+-=+总组间组内
组间均方与组内均方比值一般地服从分子自由度为ν1,分母
自由度为ν2的F 分布
12 1 MS F k N k MS νννν=
==-==-组间
组间组内组内
,
二项分布的概率函数P (X ): X
n X X n
C X P --=)1()(ππ;
)!
(!!X n X n C X n -=
二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果
X 的总体均数为πμn = 总体方差为)1(2ππσ-=n
总体标准差为)1(ππσ
-=n
如果将阳性结果用频率表示
n
X
p =
率的总体均数
π
μ=p 标准差
n
p )
1(ππσ-=
n p p n p p S p )1(1
)
1(-≈--=
又称率的标准误它反映率的抽样误差的大小。
单侧累积概率计算:出现阳性的次数至多为k 次的概率为
∑∑
==---==≤k
X k
X X
n X X n X n X P k X P 0
0)1()!
(!!
)()(ππ
出现阳性的次数至少为k 次的概率
∑∑
==---==≥n
k
X n
k X X n X X n X n X P k X P )1()!
(!!
)()(ππ
率的可信区间的估计 正态近似法:当)1(,p n np -
均大于等于5时
n
p p p n p p P )1(96.1,)1(96.1-+-⋅
-
样本率与总体率的比较:
检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量
)
1(000
πππ--=
n n X Z 或
n p Z )
1(000
πππ--=
2. 不满足正态近似时用直接概率计算法
两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量:
)
1
1)(1(|
|2121n n p p p p Z c c +--=
2121n n X X p c ++= Poisson 分布的概率函数为
!
)(X e X P X λλ
-=
POISSON 分布的应用:
单侧累计概率计算:稀有事件发生次数至多为k 次的概率为
∑∑==-==≤k X k
X X X e X P k X P 0
!
)()(λλ
发生次数至少为k 次的概率为
)1(1)(-≤-=≥k X P k X P
总体均数的区间估计:正态近似法
95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较
正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为
λ
λ-=
X Z
两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单