2.2 描述集中趋势的统计指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
G log1( log X ) n
lg1「lg16
lg
32
lg
32
lg
64 7
lg
64
lg128
lg
512
丁
lg11.8062 64.
8
频率表法: 对于频率表资料,可以通过频率表法计算几何均数,计 算公式为:
「
G l og1
f
log
f
fX 0
( 4) = (2)(3) 7
27 66 104 180 340 513 378 276 200 108 29 2228
X 1 7 3 9 1 29 1 3 1
2228 18.57 120
6
2、几何均数(geometric mean,G)
适用于原始观察值分布不对称或观察值变化范围跨越多个数量级的 资料,但经对数转换后呈对称分布的变量,如服从对数正态分布的变量。
8
11
22
19
11
22
30
7
14
37
5
10
42
4
8
46
2
4
48
2
4
50
50
—
—
P50
48
12 11
50
50%
19
54.5(5 h)
累计频率(%) (6) 2 16 38 60 74 84 92 96 100 —
14
4、众数(mode)
出现次数最多的数值。
检查次数 (1) 0 1 2 3 4 5 >5 合计
M
1 2
(
Xn
Xn
)
1
2
2
11
例 某药厂观察9只小鼠口服高山红景天醇提取物(RSAE) 后在乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3, 63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。
M Xn1 X5 63.6
2
12
频率表法:对频率表资料,可通过百分位数法近似计算中位数。 百分位数(percentile)是指将n个观察值从小到大依次排 列后,对 应于x%的数值。
组段 (1) 12~ 24~ 36~ 48~ 60~ 72~ 84~ 96~ 108~120
合计
表25 组中值(X0 )
(2) 18 30 42 54 66 78 90 102 114 —
50例链球菌咽颊炎患者潜伏期(h)频率分布表
频数(f) (3)
频率(%) (4)
累计频数(F) (5)
1
2
1
7
14
G lg1「1085.026977」丁 119.74705 120
10
3、中位数(median,M)
可用于各种分布的定量资料,特别是偏峰分布资料。 直接法计算:
基于原始数据,将n例数据按序排列,第i个数据记为 Xi
当n为奇数时,中位数可表示为: M Xn1
2
当n为偶数时,中位数表示为:
频数(f)
滴度倒数(X)
lgX
(2)
(3)
(4)
2
16
1.20412
7
32
1.50515
11
64
1.80618
13
128
2.10721
12
256
2.40824
7
512
2.70927
52
—
Байду номын сангаас
—
f(lgX) (5)=(2)×(4)
2.40824 10.53605 19.86798 27.39373 28.89888 18.96489 108.06977
X0
丁
「 l og1
f log X0 丁 n
9
例 某年某医院52例慢性肝炎患者的HBsAg滴度数据见表24 第(1)和(2)列。试计算慢性肝炎患者HBsAg的平均滴度。
抗体滴度 (1) 1:16 1:32 1:64 1:128 1:256 1:512 合计
表24
52例慢性肝炎患者HBsAg滴度的几何均数计算(频率表法)
第二章 定量资料的统计描述
二、描述集中趋势的统计指标
描述集中趋势统计指标
1、算数均数(arithmetic mean) 2、几何均数(geometric mean,G) 3、中位数(median,M) 4、众数(mode)
2
1、 算术均数
简称均数(mean),适合描述对称分布资料的集中位置(也称为平 均水平)。直接法,计算公式为:
表 21 某年某地 96 名妇女产前检查次数的频率分布
频数
频率(%)
累计频数
(2)
(3)
(4)
4
4.2
4
7
7.3
11
11
11.5
22
13
13.5
35
26
27.1
61
23
24.0
84
12
12.5
96
96
100.0
累计频率(%) (5) 4.2 11.5 22.9 36.5 63.5 87.5 100.0
对频率表资料,百分位数 的计算公式为:
Px
L
i fx
(n x% FL )
其中L为欲求的百分位数所在组段的下限,i为该组段的组距,fx 为该 组段内的频数,n为总频数,FL为小于L 所在组段的累计频数。
13
例 50例链球菌咽颊炎患者的潜伏期(h)见表25第(1)~
(3)列,试计算潜伏期的中位数。
X
1(4.20 8
6.43
2.08
3.45
2.26
4.04
5.42
3.38)
3.91(1012/L)
4
频率表法:对于样本含量较大的数据集(如例22),可以
在编制频率表的基础上计算均数的近似值。其计算公式为:
X
fX 0
fX 0 f
n
f :组段的频数
X 0 :组段的中值 =(组段上限+组段下限)/2
n
X X1 X 2 ... X n
Xi i1
i
Xi
X
n
n
n
n
n:样本含量 X1,X2,
…,Xn:观察值
Xi 或 X :观察值之和 i 3
例 某年某医院8名女性晚期肺癌患者红细胞计数(1012/L) 为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其 算术均数。
直接法:计算公式为:
G n X1X 2...X n
或
G log1( log X )
n
一般采用以10为底的常用对数进行转换。
7
例 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32, 1:32,1:64, 1:64,1:128,1:512。试计算其几何均数。
G 7 163232 64 64128512 64
5
例 试应用频率表法近似地计算例22资料的算术均数
组段
(1) 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~
28~30 合计
表 23 加权法计算均数
X 组中值( 0 )
f
(2)
(3)
7
1
9
3
11
6
13
8
15
12
17
20
19
27
21
18
23
12
25
8
27
4
29
1
120