2计量资料的统计描述

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

14
4.变异系数变异系数(coefficient of variation CV) 变异系数
S (1)公式公式： (1)公式： CV＝ ×100% X
(2)应用条件应用条件： (2)应用条件：均数相差较大时，均数相差较大时，比较各组资料的变异程度。度量衡单位不同时，比较各组资料的变异程度。度量衡单位不同时，比较各组资料的变异程度。
7
（2）分组资料）
im M = L + (n ⋅ 50% − fl ) fm
L：M 所在组的下限
im：M 所在组的组距
fl ：M所在组前一组累积频数
fm ：M 所在组的频数
计算M或Px时关键是找出或Px所在组段找出M或所在组段，可由频数找出表计算累计频数或累计频率累计频数或累计频率。累计频数或累计频率或累计频率略大于50%的组累计频数略大于 n/2或累计频率略大于或累计频率略大于的组段即为M所在组段所在组段。段即为所在组段。累计频数略大于n·x%或累计频率略大于的组或累计频率略大于x%的组累计频数略大于或累计频率略大于段即为P 所在组段。段即为 x所在组段。
fl ：前一组累积频数
9
（三）离散程度的描述
1.全距（极差）（range R） 1.全距（极差）（）（range R）全距
按间距计算
2.四分位数间距（quartile Q ) 2.四分位数间距四分位数间距（ 3.方差与标准差 (standard deviation S) 4.变异系数 (coefficient of variation CV) CV)
15
（四）参考值范围(reference value ranges)
绝大多数正常人的各种生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围
目的：临床实践目的：
预防医学实践
制定参考值范围的方法 1.正态分布法正态分布法 2.百分位数法百分位数法
16
正态分布的特征
(1)正态分布在 (1)正态分布在
23
(2)常用键功能常用键功能
贮存常数 Kin 1-6个常数贮存器，能贮存6个常数。个常数贮存器，能贮存个常数个常数。个常数贮存器 456789 Kin 6 贮存到号箱贮存到6号箱 Kout 贮存常数显示，在SD、LR模式下贮存常数显示，、模式下 Kout 可显示 2 3 4 5 6下的黑体字内容。可显示1 下的黑体字内容。下的黑体字内容 Shift 第二功能键——换档键换档键第二功能键所有黑色第一功能；所有黑色第一功能；所有褐色第二功能贮存到1号箱如：123456 Kin 1 贮存到号箱
实验二、实验二、计量资料的统计描述
一、实习目的
1.掌握频数表的编制 1.掌握频数表的编制 2.掌握计量资料的描述指标的使用条件及计算方法 2.掌握计量资料的描述指标的使用条件及计算方法 3.熟悉正态分布的特征和估计医学参考值的方法 3.熟悉正态分布的特征和估计医学参考值的方法 4.了解计算器的常用模式，掌握其使用方法。 4.了解计算器的常用模式，掌握其使用方法。了解计算器的常用模式
正态分布集中趋势离散程度参考值范围算术均数标准差正态分布法
对数正态分布几何均数Fra bibliotek偏态分布中位数四分位间距
对数正态分布法
百分位数法
95％双侧界值％ 95％单侧上限％ 95％单侧下限％
x ±1.96s
x +1.65s x −1.65s
P2.5～P97.5 P95 P5
20
计算器(CASIO fx-3600Pv)的应用计算器的应用
2.分类变量资料（计数资料）分类变量资料（计数资料）分类变量资料
观察指标是用定性的方法得到的。通常按事物的性质观察指标是用定性的方法得到的。通常按事物的性质定性的方法得到的和类别分组，清点各组个数所得到的数值。和类别分组，清点各组个数所得到的数值。如某人群的性别男、女的人数。别男、女的人数。有序分类变量资料（等级资料）有序分类变量资料（ ordinal categories 等级资料）各类别之间有程度上的差别，且排列有序。各类别之间有程度上的差别，且排列有序。检验结果（），疗效有效,好转无效）检验结果（-,±,+,++），疗效（痊愈有效好转无效）），疗效（痊愈,有效好转,无效
24
(2)常用键功能常用键功能
开平方 Log 对数 Xy 乘任意次方 +/- 正负号 1/x 倒数 ENG指数成三倍增加指数成三倍增加 RAN#随机数字发生 X2 平方 10x 反对数 x1/y 开任意次方
ix 2）公式： px = L + ）公式： (n × x% − fl ) fx
单侧
表 3.2 常用参考值范围所对应的百分位数 Px 双侧下限 P10 P5 P2.5 P0.5 上限 P90 P95 P97.5 P99.5
19
参考值范围（）参考值范围（%）下限 80 90 95 99 P20 P10 P5 P1 上限 P80 P90 P95 P99
4
1.算术均数（mean）简称均数算术均数（算术均数）
总体均数：µ 样本均数： X
适用条件：对称分布，特别是正态分布的资料。适用条件：对称分布，特别是正态分布的资料。
Σxi 计算公式：计算公式： (1)未分组资料 X = n
(2)分组资料（大样本）
直接法加权法
f1x1 + f2 x2 + ... + fn xn Σf i xi = X= n n
1
二、理论复习
医学统计工作的主要内容（一）统计资料的类型（二）集中趋势的描述（三）离散程度的描述（四）参考值范围的制定计算器的常用模式及使用方法
2
（一）统计资料的类型 1.数值变量资料（计量资料）数值变量资料（计量资料）数值变量资料
观察指标是用定量方法测定其数值大小所得的资料，观察指标是用定量方法测定其数值大小所得的资料，定量方法测定其数值大小所得的资料通常有度量衡单位。如身高(cm)、体重通常有度量衡单位。如身高、体重(kg)等。等
5
2.几何均数（geometric mean) 几何均数（几何均数
G = n X1 X2...Xn
适用条件：对数正态分布及等比关系资料适用条件：抗体滴度、血清凝集效价、抗体滴度、血清凝集效价、物质浓度等计算方法常改用对数形式计算
n f −1 Σ i lg xi G = lg ( ) n
2 2
n-1 随机变量能“自由”取值的个数随机变量能“自由”
13
标准差的意义在均数相近和度量单位相同的条件下，在均数相近和度量单位相同的条件下，标准差是描述变量值变异程度的指标。标准差是描述变量值变异程度的指标。
标准差大标准差小
变异程度大变异程度小
均数的代表性差均数的代表性好
标准差的用途 1.表示变异程度的大小 1.表示变异程度的大小 2.计算标准误、 2.计算标准误、变异系数计算标准误 3.估计参考值范围 3.估计参考值范围
21
⑴ 计算模式选择
MODE MODE MODE MODE MODE MODE 4 5 6 7 8 9 DEG RAD GAR FIX SCI NORM 角度计算孤度计算梯度计算指定小数有效位数科学运算解除7、二模式解除、8二模式恢复初始状态。恢复初始状态。
22
(2)常用键功能常用键功能
3
（二）集中趋势的描述
平均数（平均数（average）的概念）描述一组同质数值变量的集中位置或平均水平作用：描述集中趋势作用：(1)描述集中趋势 (2)作为一组资料的代表值用于分析和组间比较作为一组资料的代表值用于分析和组间比较
算术均数（算术均数（mean））几何均数 (geometric mean) 中位数 (median)
µσ
u=
x − µ 变换
再根据正态分布曲线下面积分布规律用正态分布法可制定参考值范围
17
1.正态分布法正态分布法 1）条件：服从正态分布）条件：或经变量转换后服从正态分布的资料，或经变量转换后服从正态分布的资料，n>50。。 2）公式：x ± u ）公式：
αs
95％参考值范围％
表 3.3
清除数据 AC C 清除全部运算过程，自动关闭后开。清除全部运算过程，自动关闭后开。清除显示屏上数据，不清除内存。清除显示屏上数据，不清除内存。
KAC SHIFT AC 清除贮存及SD、LR模式下输入数据。模式下输入数据。清除贮存及、模式下输入数据需在MODE 9 NORM状态下独立贮存需在状态下 M+ 贮存累加 M贮存累减 MR 贮存数的显示 Shift MR 清除内存
1.计算器的常用模式、常用键的功用计算器的常用模式、计算器的常用模式
电源：自动关机，电源：开关 AC/ON 6min自动关机，自动关机
⑴ 计算模式选择
MODE • RUN 一般计算 MODE EXP LRN 编程序状态 BIN 二进制 MODE 0 BASE-N 进制模式 OCT 六进制 MODE 1 ∫dx DEC 十进制微积分 MODE 2 LR 进行相关回归运算 MODE 3 SD 进行统计运算
G = lg
−1
∑lg x ) (
i
6
3.中位数（median）M 中位数（）
将一组观察值从小到大排列，居中心位置的数值。偏态分布资料
如传染病的潜伏期、住院天数等
适用条件分布类型不明、特大特小一端或两端无确定数据
计算公式：
（1）未分组资料） n：奇数 n：偶数
M = X n+1
2
1 M = (X n + X n ) ( +1) 2 2 2
x=µ
处有一个高峰决定， µ 和形状参数 σ决定，
(2)正态分布由位置参数 (2)正态分布由位置参数
越大，曲线越“矮胖” σ 越大，曲线越“矮胖”；越小，曲线越“瘦高” σ 越小，曲线越“瘦高”。
(3)任何正态分布（ (3)任何正态分布 N（， 2 经过）
σ 后成为标准正态分布 N（0，1）表示。（，）表示。
按平均差距计算
10
Back
1.全距（极差） R = Xmax- Xmin 全距（ R大→变异程度大，R小→变异程度小变异程度大，R 应用条件：任何资料应用条件：优点：简单明了优点：简单明了缺点：只考虑了最大、最小值缺点：只考虑了最大、最小值抽样误差大，不稳定
11
2.四分位数间距（Q）即P75 与P25之差四分位数间距（应用条件：应用条件：偏态分布资料或分布一端或两端无确切数值的资料 P25：1/4的观察值小于它，称下四分位数。 P25～QL 1/4的观察值小于它称下四分位数。的观察值小于它， P75：1/4的观察值大于它，称上四分位数。 P75～QU 的观察值大于它，称上四分位数。其间包含了中间的50%变量值。所以，所以，Q=QU-QL ，其间包含了中间的50%变量值。 Q值大→变异程度大，Q小→变异程度小。值大→变异程度大，变异程度小。稳定性比极差好仍未考虑全部观察值的变异度。稳定性比极差好仍未考虑全部观察值的变异度。
12
3.标准差 3.标准差(standard deviation) 标准差总体标准差样本标准差
Σ( X − µ)2 σ= n
Σ( X − X ) S= n −1
2
2
小样本 X:变量值变量值
(ΣX ) ΣX − n S= n −1
2
大样本 X:组中值组中值
(ΣfX ) ΣfX − n S= n −1
8
百分位数（百分位数（percentile））
是一种位置标志，以
P 表示。X即百分位 x
L：下限
用于描述样本或总体的变量值序列在某百分位置的水平
ix Px = L + (n× x% − fl ) fx
f ：频数
x
P x
M =P 50
ix：组距
n ：例数
im M = L+ (n ⋅ 50% − fl ) fm
参考值范围（%）参考值范围（）
为标准正态分布的u界值 uα 为标准正态分布的界值双侧界限 x ±1.96s 单侧上界
x +1.65s
下界
x −1.65s
常用 U 值表
单侧双侧
80 90 95 99
0.84 1.28 1.65 2.33
1.28 1.64 1.96 2.58
18
2.百分位数法百分位数法 1）条件：任何分布或分布不明的资料，n>150 ）条件：任何分布或分布不明的资料，