医学统计学总结

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学总结

一、绪论

1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。

2,医学统计学得主要内容:

1) 统计研究设计调查研究设计与实验研究设计

2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整

理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。

3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、

logistic回归与Cox回归分析。

3,统计工作步骤:

1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预

期分析指标,误差控制措施,进度与费用。

2) 搜集材料

A, 搜集材料得原则及时、准确、完整

B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。

C, 资料贮存

3) 整理资料 a检查核对b设计分组c拟定整理表d归表

4) 分析资料统计分析包括统计描述与统计推断

4,同质(homogeneity):指被研究指标得影响因素相同。

变异(variation):同质基础上得各观察单位间得差异。

变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项

特征进行测量或观察,这种特征称为变量

变量值:变量得观察结果或测量值。

5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体

具有得基本特征就是:同质性

样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表

性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。

统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。

参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

抽样误差(sampling error):由于个体差异得存在,即使在同一整体中随机抽取若干样本,各样本得统计量往往不等,统计量与参数也会有所不同。这种因抽样研究引起得差异称抽样误差。

随机事件(random event)对随机试验得各种可能结果得集合。

概率(probability) 描述随机事件发生得可能性大些哦得一个度量。

小概率事件若随机事件A得概率P(A)≤α,习惯上,α=0、05时,就称A为小概率事件。其统计学意义就是小概率事件在一次随机试验中认为不会发生。

抽样误差

1,抽样误差(sampling error) 由抽样而造成得样本统计量与总体参数之间得差异或各样本统计量之间得差异。在医学统计学中,常把由抽样造成得样本均数与总体均数间得差异称为均数得抽样误差;由抽样造成得样本率与总体率之间得差异称为率得抽样误差。

2,样本均数得标准差(简称标准误,standard error) 反映均数得抽样误差大小得指标。大,抽样误差大;反之,小,抽样误差小。

(3、1)

实际工作中往往未知得,可用样本标准差s作得估计值,计算标准误得估计值。

(3、2)

3,标准误得用途:a,衡量样本均数得可靠性;b,估计总体均数得置信区间;3,用于均数得假设检验。

4,标准误得估计值得用途:

a,描述抽样误差得大小;

b,总体参数得估计;

c,用来进行假设检验。

5,率得抽样误差:由抽样造成得样本率与总体率得差异称为率得抽样误差。

衡量率得抽样误差大小得指标就是率得标准误。越小,率得抽样误差越小;越大,率得抽样误差越大。

(3、3)

其中为总体率。实际工作中,由于往往就是未知得,可用样本率p作得估计值,计算率得标准误得估计值。

(3、4)。

标准差(s)标准误

计算公式s=

(1)表示观察值得变异程度(1)估计均数得抽样误差得大小

(2)计算变异系数CV=100% (2)估计总体均数得可信区间

(,)

(3)确定医学参考值范围(3)进行假设检验

(4)计算标准误

简述标准差、标准误得区别与联系?

区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(x)之间得变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数得代表性越强。标准误估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n得关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。(3)用途不同:标准差表示x得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。

联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。

标准差: 标准误:

二、分布

正态分布

1,正态分布得函数

其中为总体均数,为总体标准差,为圆周率,为自然对数得底,且仅为变量。以为横轴,以为纵轴,当均数与标准差已知时即可绘出正态分布曲线。

为应用方便,将式中进行变量变换,使原来得正态分布变为得标准正态分布,亦称分布。被称为标准正态变量或标准正态离差,将代入上述公式即得标准正态分布得密度函数。

(2、17)

(2、18)

2,正态分布得特征

(1)正态曲线(normal curve)在横轴上方均数处最高。

(2)正态分布以均数为中心,左右对称。

(3)正态分布有2个参数(parameter),即均数(位置)与标准差(形状)。当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。通常用N(,)表示均数为、方差为得正态分布。用(0,1)表示标准正态分布。(4)正态分布在1处各有一个拐点。(5)正态曲线下面积得分布有一定规律。

3,常用得两个区间:1、96及2、58得区间面积分别占总面积得95%及99%。

4,正态分布得应用

1),制定医学参考值范围

a,正态分布法适用于正态或近似正态分布得资料双侧界值:;单侧上界:,或单侧下界:。

b,对数正态分布法适用于对数正态分布资料双侧界值: ;单侧上界:,或单侧下界

c,百分位数法常用于偏态分布资料及资料中一端或两端无确切数值得资料。双侧界值:与;单侧上界:,或单侧下界:。

2)正态分布就是多种统计方法得理论基础如t分布,F分布,分布都就是在正态分布得基础上推导出来得,分布也就是以正态分布为基础得。另外t分布,二项分布,poisson分布得极限为正态分布,一定条件下可按正态分布原理处理。

t分布

1,t分布:(3、5)

t分布得特征为:

1. 以0为中心,左右对称得单峰分布。

2. t分布曲线形态变化与自由度得大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐

增大时,则t分布逐渐逼近正态分布(标准正态分布)。当=时,t分布为u分布。t界值表附图

中非阴影部分面积得概率为:

2,总体均数得估计:用样本指标估计总体参数称为参数估计,就是统计推断得一个重要方面。总体均数得估计有2种方法。一就是直接用统计量估计总体参数,称为点值估计。由于抽样误差得存在,此法很难估计准确。二就是区间估计(interval estimation)法。区间估计就是按一定得概率100(1-)%估计总体均数所在得范围,亦称可信区间(confidence interval,CI)。常取得可信度为95%与99%,即95%可信区间与99%可信区间。计算方法有3种:

(1)未知且n小按t分布原理用式(3、6)计算可信区间。

由于将代入,得

则总体均数得100(1-)%可信区间得通式为:(3、6)或写成 (,)。

(2)未知,但n足够大时(n>100) t分布逼近u分布,按正态分布原理,用式(3、7)估计可信区间。

()(3、7)

(3)已知按正态分布原理,用式(3、8)估计可信区间。

()(3、8)

相关文档
最新文档