医学统计学-重点-终极笔记
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学-重点-终极笔记
Medical Statistics
【Introduction】
医学统计工作的内容
⒈实验设计:最关键、最重要
⒉收集资料:最基础
[原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表质量控制:精度和偏倚
⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表)
⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断
资料的类型
⑴计量资料:定量方法测定数值大小所得的资料
⑵计数资料:按性质或类别分组,然后计数
⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示) 变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异
总体:同质的个体所构成的全体。
[同质性,大量性,差异性]
样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。
样本包含的个体数目称为样本含量
样本的特征:⑴代表性
⑵随机性
⑶可靠性
*抽样的要求:代表性,随机性,可靠性,可比性
完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较,但样本
含量不宜相差太大。
随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”
中的受试对象分别随机分到两个处理组中,而配伍组设计中的
每个“配伍组”,包含多个受试对象,要将它们分别随机分到各
处理组中。
误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差
⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌
握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。
⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然
因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。
没有固定的倾向,时高时低;应采取措施加以控制。
⑶抽样误差:由抽样不同引起的样本均数与总体均数之间的差异。原因是个体
之间存在变异,抽样时只能抽取总体的一部分作为样本。
不可避免,要用统计方法进行正确分析。
概率:描写某一事件发生可能性大小的一个度量。
频率:样本实际发生率
小概率事件:P<=0.05(差别有统计学意义)或P<=0.01(差别有高度统计意义)的事件
变量:观察单位的某些特征
变量值:观察、测定的结果
【集中趋势的统计描述】
频数表(计量资料):同时列出观察指标的可能取值区间及各区间的频数
集中趋势:变量值的集中位置
离散趋势:变量值围绕集中位置的分散情况
平均数:描述一组观察值集中位置或平均水平的统计指标。常作为一组数据的代表值用于分析或进行组间比较。
[适用条件]:对称分布或偏度不大的资料,尤其适合正态分布
算术均数(X):简称均数,说明一组观察值平均水平或集中趋势(描述计量资料)
几何均数(G):描述观察值间按倍数关系变化的资料的平均水平,如滴度、浓度、血清效价、细菌计数。
中位数(M):观察值按从小到大排列时,居于中心位置的数值。
n为奇数时,M=第(n+1)/2项
n为偶数时,M=第n/2项和第(n/2+1)项的平均值
[适用条件]:分布明显呈偏态;频数分布的一端或两端无确切值
百分位数(P):在一组数据中找到一个数值Px,全部观察值的x%小于Px。
P25, P75描述资料的离散程度
P2.5, P97.5规定医学95%的参考值范围
【变异程度的统计描述】
极差(R):即全距,观察值中最大值与最小值之差。不适用于开口资料
四分位数间距(Q):一组观察值按大小排序后,分成四个数目相等的段落,每段
观察值占总例数的25%,去掉两端含有极端数值的25%,取
中间50%的数据范围即为Q 。(适用于偏态分布&开口资料)
[Q=P75 - P25] Q 越大,则数据变异越大
平均偏差:各观察值偏离平均数的平均差距。即各观察值与均数之差的绝对值
之和的平均。 X X n
-∑平均偏差=
离均差平方和:通过取平方避免正负抵消 ()2SS X X =-∑
方差:离均差平方和再取平均,分母用自由度v=n-1代替
*自由度(v):在所有的n 个离均差平方项中,只有n-1个是独立的。
标准差(S):将方差取平方根,还原为与原始观察值单位相同的变异量度 (反映样本值的离散程度)
()2
1
X X S n -=-∑ 标准差变异系数(CV):均数相差较大或单位不同的几组观察值的变异程度的比较
100%S CV X
=⨯ (百分数,可能大于1)
正态分布曲线下的面积
横轴:()f μσ± f=2.58, 1.96, 1, 0(居中) 对应99%, 95%, 68.3% 单侧,f=2.33,1,645, 1, 0
正态分布的特征
均数处最高,以均数为中心,两端对称
中心μ对应的f(x)最大;x 越远离μ,f(x)越趋近于0,但不会为0
永远不与x 轴相交的钟型曲线
有两个参数:均数——位置参数;标准差——形状(变异度)参数
正态曲线下的面积分布有一定规律
正态分布具有可加性
标准正态分布:均数μ=0,标准差σ=1的正态分布。
转化公式:X u μσ
-= ☆适用条件总结:①样本标准差 正态,对数正态