医学统计学重点总结

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学

第一章 医学统计中的基本概念

1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。

2 资料的类型:计量资料(数值变量),计数资料(无序分类),等

变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。

4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。

样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。

5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。

6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。

7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。

第二章 集中趋势的统计描述

一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X

n

x

n X X X n ∑=

+⋯++=

21

(二)加权法(针对频数表)n

fx n

x f f f X k k ∑=

+++= (21)

二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度,

血清凝集效价,细菌计数,某些物质浓度等)

G=

n

n X X X ⋯21 为了计算方便,常改用对数的形式计算,即=G lg 1

-(

n

X ∑lg )

对于频数表资料,可用公式 G=lg

1

-(

n

x f ∑lg )

三 中位数(M)与百分位数

中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+(

M

L

f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位

公式:x P =L+(

x

L

f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

第三章 变异程度的统计描述

1.衡量、变异程度的指标有:极差,四分位数间距,方差,标准差,变异系数。

2.极差(range)也称全距,即观察值中最大值与最小值之差,用符号R 表示。

3.四分位数间距(quartile)用符号Q 表示,可以通过计算百分位数75P 与25P 之差得到,即Q=2575P P -,适用于偏态分布资料,特别就是末端没有确定数据的资料(常与中位数一起用)。

4.方差(varience)适用于正态分布,标准差就是将方差取平方根,反映一组观察值的离

5.散程度,标准差小,离散程度小,均数代表性好(方差与标准差常与均数一起用)。

6.变异系数(coefficient of variation,CV)常用于度量衡单位不同或均数相差悬殊的

两组资料的变异程度,其计算公式为:CV=X

S

%100⨯(CV 可能大于1,等于1,小于

1;S 为标准差,X 为均数)

7.正态分布的主要特征:1)正态分布以均值μ为中心,左右对称;2)

曲线下面积集中在以均值μ为中心的部分,越远离中心,曲线越接近X 轴,曲线下面积越小;3)正态曲线下的面积分布有一定规律;4)正态分布完全由参数μ与σ决定,μ就是位置参数,σ就是变异参数,σ越大,表示数据分布越分散。

8.标准正态分布(standard normal distribution)就是均数为0、标准差为1的正态分布,表示为N(μ,σ2

)

9.对任何参数μ与σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ σ

10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上就是包含95%的参照总体的范围。

1.抽样误差(sampling error) :在抽样的过程中由于个体差异造成的样本统计量与总体参数之间的差异。

2. 标准误 (standard error):样本均数中用来衡量抽样误差的大小用符号σx 表示,计算公式为σ-

x =

n

σ

(标准误小于原始测量值的标准差,标准误越小说明估计越精确,因此可以用标准误表示抽样误差的大小)

实际工作中标准差 σ往往未知,因而通常用样本标准差S 代替σ,求得样本均数 准误估计

值S -

x ,计算公式为 S -

x =n

S

(当n →无穷,S →σ,S -

x →0)

3 95%的可信区间的计算:x (μ,σ2x

) 1) σ已知,可信区间=-

x ±1、96σx

2)σ未知,n 为小样本:x ±t

x v S ⋅)

,2/05.0(

3)σ未知,n 为大样本:X S x 96.1± T 变换

μ变换

N (0,1)

3、t 分布曲线的形态变化与自由度v=n-1有关。

4、假设实验的基本步骤:1)建立假设与确定检验标准 包括无效假设(符号为H 0)与备择假设(符号为H 1)【H 1就是在H 0成立证据不足的情况下而被接受的假设,有双侧与单侧两种情况,未作说明时,选用的均就是双侧检验】 检验标准用α表示,一般取α=0、5或α=0、01、 2)选择检验方法与计算检验统计量 3)确定P 值与作出统计推断结论【结论:P>α,不拒绝H 0,差别无统计学意义,还不能认为两总体均数不等;P<α,拒绝H 0,接受H 1,差别有统计学意义,结论就是两总体均数不相等】 第五章 t 检验 1、t 检验的应用条件要求样本来自正态分布总体,两样本均数比较时,还要求两总体方差相同,即具有方差齐性。 2

t

:

t

=

-

-

d

S d =

n

S d d

-

自由度:ν = 对子数 - 1 3 t 检验统计量u 值的计算公式:

4、假设检验中两类错误:第一类错误(Type I Error)”弃真”

原假设为真,而拒绝了它;第一类错误记为 a,称为检验水准

第二类错误(Type II Error)”存伪” 2

2

212121212

1n s n s X

X s X X u X X +-=

-=

-

相关文档
最新文档