医学统计学 重点 终极笔记

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Medical Statistics

【Introduction】

医学统计工作的内容

⒈实验设计:最关键、最重要

⒉收集资料:最基础

[原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表

质量控制:精度和偏倚

⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表)

⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断

资料的类型

⑴计量资料:定量方法测定数值大小所得的资料

⑵计数资料:按性质或类别分组,然后计数

⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示)

变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异

总体:同质的个体所构成的全体。

[同质性,大量性,差异性]

样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。

样本包含的个体数目称为样本含量

样本的特征:⑴代表性

⑵随机性

⑶可靠性

*抽样的要求:代表性,随机性,可靠性,可比性

完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较,但样本含量

不宜相差太大。

随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个

“配伍组”,包含多个受试对象,要将它们分别随机分到各处理

组中。

误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差

⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌

握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。

⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然

因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。

没有固定的倾向,时高时低;应采取措施加以控制。

⑶抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。原因是个体

之间存在变异,抽样时只能抽取总体的一部分作为样本。

不可避免,要用统计方法进行正确分析。

概率:描写某一事件发生可能性大小的一个度量。

频率:样本实际发生率

小概率事件:P<=0.05(差别有统计学意义)或P<=0.01(差别有高度统计意义)的事件

变量:观察单位的某些特征

变量值:观察、测定的结果

【集中趋势的统计描述】

频数表(计量资料):同时列出观察指标的可能取值区间及各区间的频数

集中趋势:变量值的集中位置

离散趋势:变量值围绕集中位置的分散情况

平均数:描述一组观察值集中位置或平均水平的统计指标。常作为一组数据的代表值用于分析或进行组间比较。

[适用条件]:对称分布或偏度不大的资料,尤其适合正态分布

算术均数(X):简称均数,说明一组观察值平均水平或集中趋势(描述计量资料)

几何均数(G):描述观察值间按倍数关系变化的资料的平均水平,如滴度、浓度、血清效价、细菌计数。

中位数(M):观察值按从小到大排列时,居于中心位置的数值。

n为奇数时,M=第(n+1)/2项

n为偶数时,M=第n/2项和第(n/2+1)项的平均值

[适用条件]:分布明显呈偏态;频数分布的一端或两端无确切值

百分位数(P):在一组数据中找到一个数值Px,全部观察值的x%小于Px。

P25, P75描述资料的离散程度

P2.5, P97.5规定医学95%的参考值范围

【变异程度的统计描述】

极差(R):即全距,观察值中最大值与最小值之差。不适用于开口资料

四分位数间距(Q):一组观察值按大小排序后,分成四个数目相等的段落,每段

观察值占总例数的25%,去掉两端含有极端数值的25%,取

中间50%的数据范围即为Q 。(适用于偏态分布&开口资料)

[Q=P75 - P25] Q 越大,则数据变异越大

平均偏差:各观察值偏离平均数的平均差距。即各观察值与均数之差的绝对值之

和的平均。 X X n

-∑平均偏差=

离均差平方和:通过取平方避免正负抵消 ()2SS X X =-∑

方差:离均差平方和再取平均,分母用自由度v=n-1代替

*自由度(v):在所有的n 个离均差平方项中,只有n-1个是独立的。

标准差(S):将方差取平方根,还原为与原始观察值单位相同的变异量度 (反映样本值的离散程度)

S =

标准差变异系数(CV):均数相差较大或单位不同的几组观察值的变异程度的比较

100%S CV X

=⨯ (百分数,可能大于1)

正态分布曲线下的面积

横轴:()f μσ± f=2.58, 1.96, 1, 0(居中) 对应99%, 95%, 68.3%

单侧,f=2.33,1,645, 1, 0

正态分布的特征

均数处最高,以均数为中心,两端对称

中心μ对应的f(x)最大;x 越远离μ,f(x)越趋近于0,但不会为0

永远不与x 轴相交的钟型曲线

有两个参数:均数——位置参数;标准差——形状(变异度)参数

正态曲线下的面积分布有一定规律

正态分布具有可加性

标准正态分布:均数μ=0,标准差σ=1的正态分布。

转化公式:X u μσ

-= ☆适用条件总结:①样本标准差 正态,对数正态

②变异系数 单位不同或均数相差较大

③四分位数间距 偏态

相关文档
最新文档