医学统计学重点概要

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章 绪论

总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。 资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计

量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可

能不发生。P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述

频数表和频数分布图的用途:

(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。对称分布:

集中位置在中间,左右两侧頻数基本对称。偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;

(3)便于发现资料中的可疑值;

(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =n

fx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f f

x f G ∑∑∑--==(常用于等比资料或对数正态分布资料)

中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f i

L M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)

偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。 百分位数:頻数表法:)%(∑-⋅+=L x

x x f x n f i L P

均数的特性:(1)各观察值与均数之差(离均差)的总和等于零,即∑=-0)(x x 。

(2)各观察值得离均差平方和最小,即

∑∑-<-22)()(a x x x )(x a ≠。

均数的应用:(1)均数反映一组同质观察值的平均水平,并可作为样本的代表值

与其他样本进行比较。(2)均数适用于描述单峰对称分布,特别是正

态或近似正态分布资料的集中趋势。

离散趋势包括:极差、四分位数间距、方差、标准差和变异系数。

中位数和四分位数间距一起全面描述偏态分布资料的分布特征。

极差:R=MAX-MIN

四分位数间距:Q=P75-P25,Q 越大,说明数据变异越大,反之,Q 越小,变异越

小。

离均差平方和(SS ):SS= ∑∑∑-=-n X X X X 2

22)()(

方差(MA ):总体=2σ N X ∑-2

)(μ ;样本1

)(2

2--=∑n X X S 标准差:总体N

X ∑-=2

)(μσ;样本1)(2--=∑n X X S 或1

)(22--=∑∑n n

X X S 频数表法1/)(22--=

∑∑n n fx fx S 变异系数:%100⨯=X

S CV 正态分布特征:

(1)正态密度函数曲线在横轴上方均数处最高;

(2)正态分布以均数为中心, 左右对称;

(3)正态分布中的X 取值范围理论上没有边界;

(4)正态分布有两个参数,位置参数μ和变异参数σ;正态曲线下的面积分布

有一定的规律。(μ-σ,μ+σ)约为68.27% ;在(μ-1.96σ,μ+1.96σ)约为95.00% ;在(μ-2.58σ,μ+2.58σ)内约为99.00% .。

标准正态分布两个参数为0和1。 标准正态分布:s

x x u -= 医学参考值范围计算包括:正态分布法和百分位数法。 正态分布法:s u x α± 单侧1.64,2.32;双侧1.96,2.58。

第三章总体均数的估计与假设检验

标准差与标准误的区别和联系:

区别:意义:标差反应个体值得离散度,标误反应样本均数的离散度,即描述样

本均数抽样误差的大小。

应用:标差用于估计参考值范围(X 范围),标误用于可信区间的估计(μ

的范围)。

联系:n

S S X =。 t 分布n

s x t μ-== x

s x μ-,自由度υ=n -1。 t 分布特征:(1)单峰分布,以0为中心,左右两侧对称;(2)t 分布曲线不是

一条曲线,是一簇曲线,其分布曲线的形态变化与自由度υ有

关;(3)自由度υ越大,t 分布越近于正态分布,当自由度υ

逼近∞,t 分布趋向于标准正态分布。 可信区间:).,.()()(X X S t X S t X νανα+-

参数估计有点估计和区间估计。

可信区间优劣取决于可信度1-和宽度。

可信区间与参考值范围区别:

含义:可信区间:按预先给定的概率所确定的未知参数μ的可能范围。

参考值范围:“正常人”的解剖、生理、生化指标的波动范围。 计算公式:可信区间:X S t X .)(να±(标准误) 正态分布:s u x α±(标准差)

假设检验的基本思想小概率反证法。

假设检验旧称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下检验统计量,最后获得P 值来判断。

需注意所有检验统计量都是在H0成立的前提条件下计算出来的。

检验假设是针对总体而言的。

单个样本t 检验:H0:μ=μ0,H1:μ>μ0 ,α=0.05 n

S X S X S X t X X 00μμμ-=-=-=

,自由度υ=n-1 配对样本t 检验:H0:μd =0,H1:μd ≠0,α=0.05 n S d S d S d t d d d d =-=-=0μ,其中()122--=∑∑n n d d S d

相关文档
最新文档