第二章常用统计指标(计量资料的统计描述)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(二)、几何均数 (Geometric
• 适用条件:X值m呈ea倍n)数增长或部分 数据偏离过大的正偏态分布资料。
• 计算公式:
XG

lg 1( lg n
Xi
)
例数较少用 (2-3)
XG

lg 1(
f lg f
Xi
)
频数表资料用 (2-4)
例2-5, 7名输血后感染乙肝患者从输 血至出现症状的时间如下:估计输血
(一)算术均数( mean)
简称均数,用 X 表示.
基本公式(2-1,2-2) 1.直接法
适用条件
X X
n
公式适用频数为 正态或近似正态
2.加权法公式
分布的计量资料.
X fX
f
• 表2、160名正常成年女性血清甘油三酯分布
• 组段 频数(f) 组中值(X) fx
• 0.5-
3
0.55
11.05 9.3925
• 0.9- 17
0.95
• 1.0- 18
1.05
• 1.1- 20
1.15
• 1.2- 18
1.25
• 1.3- 17
1.35
•.
.
.
•.
.
.
• 1.7-
3
1.75
5.25
• 合计 160
182.30 221.84
(五)变异系数(CV)
CV S 100% X
应用:1.单位不同时组间变异程度的比较。 2.比较组单位相同,但均数相差悬殊
• 本例结论:某地102名3岁以下儿童lgA含量 的中位数为25.3(ug/ml)。
• (四)、应用平均数的注意事项 • (见讲义16页)
三、变异指标
• 描述计量数据间离散程度的 • 指标 —变异指标
例:某检验科室三名检验人员对某试
验的5次重复结果:
X

R
• 甲 20 21 22 23 24 22 4
• 缺点:数据利用不全,部分信息损失, 在例数少时结果不稳定。
(二)、百分位数与四分位数间距 (percentile and quartile range)
• 四分位间距:用Q表示,即一组数据用 百分位数法计算的第75%位数与第 25%位数之差。

Q=P75%-P25%
• 常用于表示偏态分布的变异的指标。
• X: 5, 5, 6, 7, 20(d)
• 位次 1 2 3 4 5
Md=6
x 8.6
中位数的计算
• 1.例数较少(公式2-5,2-6)
Md X 1(n1)
2
Md

1 2
(Xn 2

X (n 21) )
n为奇数 n为偶数
• 2.频数表资料(公式 2-7)
Md 50%
L
i fm
感染出现症状的平均时间如下:
• 30,47,54,69,78,109,194天
XG

lg
1( lg n
Xi
)

lg 1(lg 30 lg 47 ...lg 194) / 7 70.5 (天)
X 83(d)
表2-5 72名鼻咽癌病人唾液中EB病毒 某种抗体滴度
• 抗体滴度 频数f 滴度倒数 lg(x) f•lg x
(2-14) 频数表资料
乙测定数据计算标准差
•X • 18 • 20 • 22 • 24 • 26 • 110 • X
X2 324 400 484 576 676 2460 X2
X 2 ( X )2 / n S
n 1 2460 (110)2 / 5 3.16
5 1
例:某检验科室三名检验人员对同一
• 乙 18 20 22 24 26 22 8
• 丙 16 19 22 25 28 22 12
• 变异指标作用:用变异指标来反映计 量数据间相互离散的程度。
几个常用的变异指标
• (一)、极差(Range)或全距:用 (R)表示,即一组数据的R=最大值– 最小值
• 意义:R值越大,表示该组数据的变异 越大。

两组患者Pco2值的比较
• 组别
n X S
R CV(%)
• 肺心病组 12 65.97 ± 20.28 66 30.74
• 慢支肺气肿 10 43.90 ± 8.24 29 18.79
中位数和百分位数的应用
• 生存分析中,常用X25%、X50%、X75%做 描述和比较。同一分位数越大,说明生存 时间越长。
•例

• 类型 • ALL
儿科白血病患者生存时间(周)
生存分位数
例数 X25% 542 32
X50% 73
X75% 146
• AUL 369 30
70
134
• AML 107 9
25
60
作业
• 练习题(31页) • 习题1中的②题 • 习题4 • 要求: • 计算题要求写出公式、步骤、结论。
CASIO FX-100W计算器
1.65
• 0.6-
9
0.65
5.85
• 0.7- 12
0.75
9.00
• 0.8- 13
0.85
11.05
• 0.9- 17
0.95
16.05
• 1.0- 18
1.05
18.90
• 1.1- 20
1.15
23.00
• 1.2- 18
1.25
22.50
• 1.3- 17
1.35
22.95
• 1.4- 13
变异指标的几点说明
• 全距(R):可表达任意分布的变异 大小。
• 四分位间距:用于表达偏态分布的 变异
• 标准差(SD):用于正态或近似正 态分布的变异(较常用的指标)。
• CV :主要用于单位不同时组间变异 的比较。
三、均数和变异指标的应用
• 在医学杂志中,常以 X S 的形式列出, 描述数据的平均水平和离散程度。
FX100计算器统计功能计算
• 步骤
说明
• 1. MODE MODE 1 进入统计功能模式
• 2.SHIFT AC =
清除数据
• 3. 55 M+
数据输入

54 M+

58 M+
• 4 SHIFT 1 =
显示均数
• 5. SHIFT 3 = • 6. RCL C • 7. RCL B
显示标准差(S)
试验的5次重复结果如下:
X

RS
• 甲 20 21 22 23 24 22 4 1.58
• 乙 18 20 22 24 26 22 8 3.16
• 丙 16 19 22 25 28 22 12 4.74
• 结论:三位检验员对该结果测定的平均水 平为22,但测定值的稳定性(变异程度)
不同,以丙测定的稳定性最差。
1(
f lg f
Xi
)

lg 1(102.1032) 72

26.19
结论:72名鼻咽癌病人唾液中EB病毒某
种抗体平均滴度为1:26
(三)、中位数(Median)
• 中位数(Md):适用于描述偏态分布 资料的平均水平。(例)
• 计算定义:将一组变量值由小到大依 次排列,居以中间位置的观察值即为 中位数,为这组数据的平均数。
• 本例:
• 四分位数间距(Q)=P75-P25

=42.9-13.2=29.7
• 结论:某地102名3岁以下儿童lgA含 量的中位数为25.3(ug/ml),四分位 间距为29.7 (ug/ml)。
.(三)标准差(Standard deviation)
和方差(variance)
用S或SD表示样本标准差,计算公式
1.45
18.85
• 1.5-
9
1.55
13.95
• 1.6-
8
1.65
13.20
• 1.7-
3
1.75
5.25
• 合计 160
182.30
X fx 3 0.55 9 0.65 12 0.75
f
3 9 12 3
182.3 1.14 160
• 结论:该地160名正常成年女性血清 甘油三酯平均水平为1.14mmol/L
• 组段(d) 频数 累计频数
• 0-
29
29
• 15-
32
61
• 30-
18
79
• 45-
14
93
• 60-
4
97
• 75-
0
97
• 90-
0
97
• 105-
2
99
• 120-
1 100
• 135-
2 102
位次范围
1-29 30-61 62-79 80-93 94-97 97 97 98-99 100 101-102
• 合计
102
例:四分位数间距计算
• 例2-8
PX Lx
ix fx
(n
x% fL )
15 P25 0 29 (102 25% 0) 13.2
P75

75

15 18
(102
75%

61)

42.9
四分位间距应用
• 与中位数一起描述偏态分布的平 均水平与变异情况。
的组 间变异程度。
意义:CV越大,表示数据变异越大。 常用于衡量方法、仪器的精密度。
某地7岁年龄组男童身高与体重

X

x
S CV(%)
• 身高(cm)。 123.10 4.71 3.83
• 体重(kg) 22.29 2.26 10.14
• 结论: 7岁年龄组男童身高与体重 值指标比较,体重指标的变异大于 身高指标。
第二章 常用统计指标 (计量资料的统计描述)
第二节 平均数指标 第三节 变异指标
平均数(average )指标
• 平均数指标的概念和作用 • 概念:平均数表示一组同质计量数据
集中趋势的位置和平均水平。
• 作用:是一组计量数据平均水平的代 表值(概括统计量);可作为不同组 间的比较值
• 医学中常用的平均数指标有: • 算数均数、几何均数、中位数
• 表2-2 正常成年女性血清甘油三酯分布
• 组段 频数(f) 组中值(X) fx fx2
• (1) (2) (3) (4) (3)×(4)
• 0.5-
3
0.55
1.65 0.9075
• 0.6-
9
0.65wenku.baidu.com
5.85 3.7830
• 0.7- 12
0.75
9.00 6.7500
• 0.8- 13
0.85
• P% 1% 2%
50%
100%
百分位数(PX%)法频数表计算
• 频数表计算公式(2-8)
PX
Lx
ix fx
(n
x% fL )
• 例:P25:即第25%位数值,有25%的 变量值小于P25 值,有75%的变量值 高于P25值。
表2-6 102名3岁以下儿童LgA含量的 中位数计算
S (X X )2 n 1
S2 为方差
标准差的意义:表示一组数据的变异程 度大小。当比较组单位相同时, S越大, 表示一组数据间离散程度越大。反之越 小。
标准差的计算公式:
S X 2 ( X )2 / n n 1
(2-13) 例数较少
S fX 2 ( fX)2 / f f 1
• COMP SD REG FIX(0-9)
• 四则运算 统计 回归 小数位数固定
• 数据贮存键(9个红色字母 A-F,X,Y,M)
• 方法:45 STO M 用STO放入

RCL M 用RCL取出
• M+:数据累加键(统计状态时数据输入键)
• 不同计量数据组间比较,此差距越大, 表示变异越大。
百分位数(PX%)
• 是描述一组计量数据分布特征的位置指 标 。将n个数据由小到大排列,将位次 转为百分位(%),常计算P25%、P50%、 P75%、 P95%百分位数作为分割点。
• X: 5 7 9… 20... 45 50, n=100
• 位次 1 2 3… 50… 99 100
(n 50% fL )
表2-6 102名3岁以下儿童LgA含量的 中位数计算
• 组段(d) 频数 累计频数
• 0-
29
29
• 15-
32
61
• 30-
18
79
• 45-
14
93
• 60-
4
97
• 75-
0
97
• 90-
0
97
• 105-
2
99
• 120-
1 100
• 135-
2 102
位次范围
1-29 30-61 62-79 80-93 94-97 97 97 98-99 100 101-102
• 合计
102
中位数频数表计算步骤
• 1.在频数表上计算累计频数 • 2.用n×50%计算中位数所在组段 • 3.确定公式(2-7)中下限值(L)、组距
(i)、频数(f)、累计频数(Σf) • 4.代入公式计算中位数。
• 1:2.5
14
2.5 03979 5.5706
• 1:10
18 10
1.0000 18.0000
• 1:40
22 40
1.6021 35.2462
• 1:160
12 160
2.2041 26.4492
• 1:640 • 合计
6 640 72
2.8062 16.8372 102.1032

XG

lg
显示例数x
显示
二、频数表统计功能计算
• 例数较多时计算均数
• 方法1:
• 例:X(年龄) 20
23 25

f: 10
5
3
• 步骤同前:
• 数据输入:20 SHIFT , 10 M+

23 SHIFT , 5 M+

25 SHIFT , 3 M+
• 步骤同前:
CASIO FX-100W计算器
• MODE 运算状态选择键
相关文档
最新文档