医学统计学公式整理 简洁版

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集中趋势的描述

算术均数: 频数表资料(X0为各组段组中值)

n fX

f

fX x O

O

∑∑∑==

几何均数:

n n

X X X G ...21= 或

)

log (

log

1

n

X G ∑-=

频数表资料:

⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*

2

1

+=n X M (2)

)

(21*

12*2++=

n n X X M

百分位数

⎪⎭

⎝⎛-⋅+

=L X X f n X f i L P 100其中:L 为欲求的百分位

数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为

该组段的的频数 ,

L f 为该组段之前的累计频数

方差: 总体方差为:式(1); 样本方差为 式(2)

(1)

N X 2

2

)(μσ-∑=

(2)

1)(2

2--∑=

n X X S

标准差:

1)(2--∑=

n X X S 或 1/)(22-∑-∑=

n n

X X S 频数表资料计算标准差的公式为

1/)(22-∑∑∑-∑=

f f

fx fx S

变异系数:当两组资料单位不同或均数相差较大时,对变异

大小进行比较,应计算变异系数

%100⨯=

X S

CV

常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化

N

p

N p

i

i

∑=

'

∑=i

i p N

N p )('

2.间接法标准化

预期人数实际人数=

SMR ∑=i

i P n r

SMR

S M R P P ⨯='

正态分布:密度函数:

)2/()(2221)(σμπ

σ--=

X e X f

分布函数: 小于X 值的概率,即该点正态曲线下左侧面积

)()(x X P x F <=

特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律

标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换

σ

μ-=

X u ,u 服从总体均数为0、总体标准

差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ

医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为

S X 96.1±

样本均数标准误的估计值为

X

s =

t 分布的概念:小样本总体标准差未知时,服从自由度为n-1

的t 分布

X X X t s μ-=

总体均数可信区间的计算:

大样本或总体标准差已知:式(1); 小样本:式(2)

(1)n S

X ⋅

±96.1 (2)n

S n t t ⋅±-)1(,05.0(前一个t

表示均数) 单样本t 检验:

n S X t /0

μ-=

自由度为 n-1;

配对样本t 检验: 检验统计量:

n

S d t d /0-=

自由度为n-1(n 为对子数)

两样本t 检验:检验统计量: )

11(2

12

1n n S X X t c +-=

(错:

Sc 的平方)

2

)()(2)1()1(21222211212

222112-+-+-=

-+-+-=

∑∑n n X X X X n n S n S n S c

方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1

检验统计量:

(较小)(较大)2

2

2

1

S S F = 分子自由度为n 1-1,分母自由度为n 2-1

方差分析的基本思想: 1、总变异:总离均差平方和:

2() 1

T ij i

j

SS SS X X N νν=-==-∑∑总总=

∑∑-=N X X ij ij /)(22

∑=N X

C ij

/)(

2

2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。

21() 1

B i i i

SS SS n X X k νν-==-∑组间组间==

=

C

n X i

i

ij -∑

∑2

)(

3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。

222()(1) W E ij i i i i j i SS SS SS X X n S N k

νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i

j

i

SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内

1(1)()N k N k ννν=-=-+-=+总组间组内

组间均方与组内均方比值一般地服从分子自由度为ν1,分母

自由度为ν2的F 分布

12 1 MS F k N k MS νννν=

==-==-组间

组间组内组内

二项分布的概率函数P (X ): X

n X X n

C X P --=)1()(ππ;

)!

(!!X n X n C X n -=

二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果

X 的总体均数为πμn = 总体方差为)1(2ππσ-=n

总体标准差为)1(ππσ

-=n

如果将阳性结果用频率表示

n

X

p =

率的总体均数

π

μ=p 标准差

n

p )

1(ππσ-=

n p p n p p S p )1(1

)

1(-≈--=

又称率的标准误它反映率的抽样误差的大小。

单侧累积概率计算:出现阳性的次数至多为k 次的概率为

∑∑

==---==≤k

X k

X X

n X X n X n X P k X P 0

0)1()!

(!!

)()(ππ

出现阳性的次数至少为k 次的概率

∑∑

==---==≥n

k

X n

k X X n X X n X n X P k X P )1()!

(!!

)()(ππ

率的可信区间的估计 正态近似法:当)1(,p n np -

均大于等于5时

n

p p p n p p P )1(96.1,)1(96.1-+-⋅

-

样本率与总体率的比较:

检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量

)

1(000

πππ--=

n n X Z 或

n p Z )

1(000

πππ--=

2. 不满足正态近似时用直接概率计算法

两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量:

)

1

1)(1(|

|2121n n p p p p Z c c +--=

2121n n X X p c ++= Poisson 分布的概率函数为

!

)(X e X P X λλ

-=

POISSON 分布的应用:

单侧累计概率计算:稀有事件发生次数至多为k 次的概率为

∑∑==-==≤k X k

X X X e X P k X P 0

!

)()(λλ

发生次数至少为k 次的概率为

)1(1)(-≤-=≥k X P k X P

总体均数的区间估计:正态近似法

95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较

正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为

λ

λ-=

X Z

两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单

相关文档
最新文档