研究生统计学 第二章 计量资料的统计描述(4版) (1)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表7-4 某地205例伤寒患者潜伏期百分位数计算表
潜伏期 (天) 2~ 4~ 6~ 8~ 10~ 12~ 14~ 50 16~ 18~ 20~22 人数 (f ) 26 29 42 50 48 4 2 2 1 1 累积频数 (Σf ) 26 55 97 147 195 199 201 203 204 205 累积频率(%) 12.68 26.83 47.32 71.71 78.00 97.07 98.05 99.02 99.51 100.00
分解:
1.将观察值取对数; 2.求 lgx的算术均数; 3.将 lgx的算术均数取 反对数。
二、 几何均数(geometric mean)
例7.2 有5人的血清中某抗体效价分别为1:10、 1:20、 1:40、 1:80、 1:160,求其平均效价。
lg x 1 lg x1 lg x 2 lg x n G lg lg n n 1 lg 10 lg 20 lg 40 lg 80 lg 160 lg 5
fX X f
例7.1 对例6.1资料,采用加权法计算算术均数。 表7-2 某地120名成人血糖的均数计算表(加权法)
血糖(mmol/L) 3.6~ 3.8~ 4.0~ 4.2~ 4.4~ 4.6~ 4.8~ 5.0~ 5.2~ 5.4~ 5.6~ 5.8~ 6.0~6.2 合 计 组中值(X) 3.7 3.9 4.1 4.3 4.5 4.7 4.9 5.1 5.3 5.5 5.7 5.9 6.1 频数(f) 1 2 6 9 14 15 21 18 15 10 5 3 1 120(Σf ) fX 3.7 7.8 24.6 38.7 63.0 70.5 102.9 91.8 79.5 55.0 28.5 17.7 6.1 589.8(ΣfX)
1
1.0000 1.3010 1.6021 1.9031 2.2041 lg 1 5 8.0103 1 lg 1 lg 1.6026 40 5
二、几何均数(geometric mean) 加权法
f lg x G lg f
表2-1 138名正常成年女子的红细胞数频数分布
组 段
3.07~ 3.27~ 2 3
f
X
3.17 3.37
fX
6.34 10.11
fX2
20.10 37.07
3.47~
3.67~ 3.87~
9
14 22
3.57
3.77 3.97
32.13
52.78 87.34
114.70
198.98 346.74
第一节 频数分布
第一节 频数分布
第一节 频数分布
第一节 频数分布
图6-2 频数分布的三种类型示意图
第一节 频数分布
频数表的用途:
揭示资料的分布特征和分布类型。
便于进一步计算统计指标和统计分析处理。
便于发现某些特大或特小的可疑值。
第二节 集中趋势的描述
• 统计描述即用恰当的统计指标描述资料的
合 计
138
—
583.06
2493.89
第一节 频数分布
表2-2 某医院1123名产后出血孕妇的人流次数分布 人流次数 0 1 2 3 4 5 6 合计 人数 402 330 232 118 27 11 3 1123 累计频数 402 732 964 1082 1109 1120 1123 — 累计频率(%) 35.80 65.18 85.84 96.35 98.75 99.73 100.00 —
百分位数计算公式的推导(示意)
A n x% ix fx
f
L
L
A
n x% fx
f
ix ix n x% fx
f
L
ix Px Lx A Lx n x% fx
f
L
例7.4 某地205例伤寒患者潜伏期见表7-4, 求平均潜伏期。
第二章 计量资料的统计描述
第一节 频数分布
第二节 集中趋势的描述
第三节 离散趋势的描述
第四节 正态分布
第五节 医学参考值范围的制定
第一节 频数分布
例6.1 某地120名健康成人血糖(mmol/L)测定结果
4.60 4.61 4.65 4.33 5.70 4.94 4.93 5.21 4.58 4.38 4.63 5.12 5.62 3.67* 5.27 4.40 5.13 4.52 4.96 4.57 4.83 4.42 5.23 5.08 5.02 4.56 4.77 4.98 5.48 4.96 4.95 4.55 4.81 4.15 4.80 6.16** 5.86 5.32 4.05 4.95 3.83 5.12 5.43 4.42 5.37 4.78 5.56 5.55 4.75 5.78 4.11 5.11 3.91 5.40 5.06 4.23 5.64 5.10 4.55 5.13 4.80 4.85 7.78 5.22 4.45 4.88 5.33 5.24 4.72 5.31 4.89 4.86 5.81 4.28 5.14 4.66 4.92 5.01 4.90 4.25 5.16 5.34 4.69 5.75 4.71 5.48 4.15 5.09 5.35 5.00 4.08 5.62 4.86 5.38 5.19 4.95 5.04 4.48 4.49 4.67 4.06 5.59 4.48 5.28 5.52 4.50 4.72 5.06 5.25 4.29 5.26 4.68 4.28 5.53 5.04 4.30 4.33 4.82 5.45 4.99
G
f 1:64 f 7
8 0.9031 4.5155 16 1.2041 7.2246 . 2471 1.5051 1 72 1 32 3.0102 lg lg 1.8062 64
64 40
128
1.8062
2.1072
10
12.6434 21.0720
4.07~
4.27~ 4.47~ 4.67~ 4.87~ 5.07~ 5.27~5.47
30
21 15 10 6 4 2
4.17
4.37 4.57 4.77 4.97 5.17 5.37
125.10
91.77 68.55 47.70 29.82 20.68 10.74
521.67
401.03 313.27 227.53 148.21 106.92 57.67
1Байду номын сангаас
例7.3 40名麻疹易感儿接种疫苗1个月后血凝抑制 抗体滴度见表7-3,求平均滴度。
表7-3 40名麻疹易感儿血凝抑制抗体平均滴度的计算 抗体滴度 1:4 1:8 1:16 1 1:32 lg 1:128 人数(f) 1 5 6 lg x 2 滴度倒数(x) 4 lgx 0.6021 flgx 0.6021
Medical Statistics
第二 章 计量资料的统计描述
桂立辉
新乡医学院公共卫生学院
Medical Statistics
第二章 计量资料的统计描述 计量资料的统计描述
• 集中趋势(central tendency)
• 离散趋势(tendency of dispersion)
Medical Statistics
1:256 1:512
合计
4 5
40
256 512
-
2.4082 2.7093
-
9.6328 13.5465
72.2471
三、中位数与百分位数
• 将一组观察值按大小依次排列,位置居中 的数即中位数(median,M) 。
n为奇数时:M X n 1
2 2 1 2
一、 算术均数(arithmetic mean)
是n个变量值的数值平均值,即各个变量值 之和除以变量值的个数。适用于对称分布资料。
总体均数用表示,样本均数用X表示。
x1 x2 xn x 直接法: X n n
• 例 测得5名周岁儿童的头围(cm)为:44、45、46、 47、48,求其平均头围。
2 P 8 205 50% 97 8.22(天) 50
平均数的应用
表7-1 三种平均数的计算方法和应用条件比较
指 标 应 用 条 件 ①对称分布; ②封口资料。
第一节 频数分布
频数表编制步骤
(1) 找出最大值 (maximum, Xmax) 和最小值 (minimum, Xmin),并计算极差(range,R)
Xmax=6.16mmol/L;Xmin = 3.67 mmol/L
R= Xmax-Xmin = 6.16﹣3.67 = 2.49(mmol/L) (2)确定拟分组的组数(k)和组距(class interval,i ) 一般分为8~15组。 i = R / k = 2.49 / 10 = 0.249(mmol/L)
fX 589.8 X 4.915 4.92( mmol/L ) f 120
二、几何均数(geometric mean,G)
• 几何均数是n个变量值的乘积开n次方所得的积。
直接计算法
G n x1 x 2 x3 x n 两边取对数得: lg x1 lg x 2 lg x n lg x lg G n n 1 lg x G lg n
第一节 频数分布
频数表编制步骤
(3)写组段 • 第一个组段必须包含最小值,最后一个组段必 须包含最大值;除最后一个组段外,其余组段都 只写出下限,不写上限,最后一个组段通常要求 写出上限,即封口。
•
各组段的组距一般相等,但对于偏态分布的资 料,组距也可以不等,且第一组段或最后一个组 段也可以不封口(开口资料)。
44 45 46 47 48 230 X 46cm 5 5
一、算术均数(arithmetic mean)
加权法(weighting method):
当观察值较多时,可先编制频数表(frequency table),然后用加权法(weighting method) 计算:
第一节 频数分布
频数表编制步骤
(4)划记 • 按照原始数据表中各变量值的大小归组、划 记,一般采用画“正”字的方法。 (5)列频数分布表,绘制频数分布图 • 根据划记结果,列出各组段的频数。 • 频数分布图一般采用直方图,横轴为研究的变 量,纵轴为频数。
第一节 频数分布
第一节 频数分布
图6-1 某地120名健康成人血糖(mmol/L)频数分布图
Xn Xn n为偶数时:M 2
三、中位数与百分位数
百分位数(percentile,Px )
ix Px Lx n x% fx
f
L
式中: Px — 第x百分位数 Lx — Px 所在组的下限 i x — Px 所在组的组距 f x — Px 所在组的频数 n — 样本量,即总频数
数量特征。
计量资料的统计描述分为两个方面:
集中趋势(central tendency)
离散趋势(tendency of dispersion)
第二节 集中趋势的描述
描述计量资料集中趋势的统计指标称 平均数(average)。常用的平均数有三种:
算术均数(arithmetic mean,X ) 几何均数(geometric mean,G) 中位数(median,M)
f
L
— 小于L的各组累积频数
例7.4 某地205例伤寒患者潜伏期见表7-4,求 平均潜伏期。
表7-4 某地205例伤寒患者潜伏期百分位数计算表
潜伏期 (天) 2~ 4~ 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~22 人数 (f ) 26 29 42 50 48 4 2 2 1 1 累积频数 (Σf ) 26 55 97 147 195 199 201 203 204 205 累积频率(%) 12.68 26.83 47.32 71.71 78.00 97.07 98.05 99.02 99.51 100.00
潜伏期 (天) 2~ 4~ 6~ 8~ 10~ 12~ 14~ 50 16~ 18~ 20~22 人数 (f ) 26 29 42 50 48 4 2 2 1 1 累积频数 (Σf ) 26 55 97 147 195 199 201 203 204 205 累积频率(%) 12.68 26.83 47.32 71.71 78.00 97.07 98.05 99.02 99.51 100.00
分解:
1.将观察值取对数; 2.求 lgx的算术均数; 3.将 lgx的算术均数取 反对数。
二、 几何均数(geometric mean)
例7.2 有5人的血清中某抗体效价分别为1:10、 1:20、 1:40、 1:80、 1:160,求其平均效价。
lg x 1 lg x1 lg x 2 lg x n G lg lg n n 1 lg 10 lg 20 lg 40 lg 80 lg 160 lg 5
fX X f
例7.1 对例6.1资料,采用加权法计算算术均数。 表7-2 某地120名成人血糖的均数计算表(加权法)
血糖(mmol/L) 3.6~ 3.8~ 4.0~ 4.2~ 4.4~ 4.6~ 4.8~ 5.0~ 5.2~ 5.4~ 5.6~ 5.8~ 6.0~6.2 合 计 组中值(X) 3.7 3.9 4.1 4.3 4.5 4.7 4.9 5.1 5.3 5.5 5.7 5.9 6.1 频数(f) 1 2 6 9 14 15 21 18 15 10 5 3 1 120(Σf ) fX 3.7 7.8 24.6 38.7 63.0 70.5 102.9 91.8 79.5 55.0 28.5 17.7 6.1 589.8(ΣfX)
1
1.0000 1.3010 1.6021 1.9031 2.2041 lg 1 5 8.0103 1 lg 1 lg 1.6026 40 5
二、几何均数(geometric mean) 加权法
f lg x G lg f
表2-1 138名正常成年女子的红细胞数频数分布
组 段
3.07~ 3.27~ 2 3
f
X
3.17 3.37
fX
6.34 10.11
fX2
20.10 37.07
3.47~
3.67~ 3.87~
9
14 22
3.57
3.77 3.97
32.13
52.78 87.34
114.70
198.98 346.74
第一节 频数分布
第一节 频数分布
第一节 频数分布
第一节 频数分布
图6-2 频数分布的三种类型示意图
第一节 频数分布
频数表的用途:
揭示资料的分布特征和分布类型。
便于进一步计算统计指标和统计分析处理。
便于发现某些特大或特小的可疑值。
第二节 集中趋势的描述
• 统计描述即用恰当的统计指标描述资料的
合 计
138
—
583.06
2493.89
第一节 频数分布
表2-2 某医院1123名产后出血孕妇的人流次数分布 人流次数 0 1 2 3 4 5 6 合计 人数 402 330 232 118 27 11 3 1123 累计频数 402 732 964 1082 1109 1120 1123 — 累计频率(%) 35.80 65.18 85.84 96.35 98.75 99.73 100.00 —
百分位数计算公式的推导(示意)
A n x% ix fx
f
L
L
A
n x% fx
f
ix ix n x% fx
f
L
ix Px Lx A Lx n x% fx
f
L
例7.4 某地205例伤寒患者潜伏期见表7-4, 求平均潜伏期。
第二章 计量资料的统计描述
第一节 频数分布
第二节 集中趋势的描述
第三节 离散趋势的描述
第四节 正态分布
第五节 医学参考值范围的制定
第一节 频数分布
例6.1 某地120名健康成人血糖(mmol/L)测定结果
4.60 4.61 4.65 4.33 5.70 4.94 4.93 5.21 4.58 4.38 4.63 5.12 5.62 3.67* 5.27 4.40 5.13 4.52 4.96 4.57 4.83 4.42 5.23 5.08 5.02 4.56 4.77 4.98 5.48 4.96 4.95 4.55 4.81 4.15 4.80 6.16** 5.86 5.32 4.05 4.95 3.83 5.12 5.43 4.42 5.37 4.78 5.56 5.55 4.75 5.78 4.11 5.11 3.91 5.40 5.06 4.23 5.64 5.10 4.55 5.13 4.80 4.85 7.78 5.22 4.45 4.88 5.33 5.24 4.72 5.31 4.89 4.86 5.81 4.28 5.14 4.66 4.92 5.01 4.90 4.25 5.16 5.34 4.69 5.75 4.71 5.48 4.15 5.09 5.35 5.00 4.08 5.62 4.86 5.38 5.19 4.95 5.04 4.48 4.49 4.67 4.06 5.59 4.48 5.28 5.52 4.50 4.72 5.06 5.25 4.29 5.26 4.68 4.28 5.53 5.04 4.30 4.33 4.82 5.45 4.99
G
f 1:64 f 7
8 0.9031 4.5155 16 1.2041 7.2246 . 2471 1.5051 1 72 1 32 3.0102 lg lg 1.8062 64
64 40
128
1.8062
2.1072
10
12.6434 21.0720
4.07~
4.27~ 4.47~ 4.67~ 4.87~ 5.07~ 5.27~5.47
30
21 15 10 6 4 2
4.17
4.37 4.57 4.77 4.97 5.17 5.37
125.10
91.77 68.55 47.70 29.82 20.68 10.74
521.67
401.03 313.27 227.53 148.21 106.92 57.67
1Байду номын сангаас
例7.3 40名麻疹易感儿接种疫苗1个月后血凝抑制 抗体滴度见表7-3,求平均滴度。
表7-3 40名麻疹易感儿血凝抑制抗体平均滴度的计算 抗体滴度 1:4 1:8 1:16 1 1:32 lg 1:128 人数(f) 1 5 6 lg x 2 滴度倒数(x) 4 lgx 0.6021 flgx 0.6021
Medical Statistics
第二 章 计量资料的统计描述
桂立辉
新乡医学院公共卫生学院
Medical Statistics
第二章 计量资料的统计描述 计量资料的统计描述
• 集中趋势(central tendency)
• 离散趋势(tendency of dispersion)
Medical Statistics
1:256 1:512
合计
4 5
40
256 512
-
2.4082 2.7093
-
9.6328 13.5465
72.2471
三、中位数与百分位数
• 将一组观察值按大小依次排列,位置居中 的数即中位数(median,M) 。
n为奇数时:M X n 1
2 2 1 2
一、 算术均数(arithmetic mean)
是n个变量值的数值平均值,即各个变量值 之和除以变量值的个数。适用于对称分布资料。
总体均数用表示,样本均数用X表示。
x1 x2 xn x 直接法: X n n
• 例 测得5名周岁儿童的头围(cm)为:44、45、46、 47、48,求其平均头围。
2 P 8 205 50% 97 8.22(天) 50
平均数的应用
表7-1 三种平均数的计算方法和应用条件比较
指 标 应 用 条 件 ①对称分布; ②封口资料。
第一节 频数分布
频数表编制步骤
(1) 找出最大值 (maximum, Xmax) 和最小值 (minimum, Xmin),并计算极差(range,R)
Xmax=6.16mmol/L;Xmin = 3.67 mmol/L
R= Xmax-Xmin = 6.16﹣3.67 = 2.49(mmol/L) (2)确定拟分组的组数(k)和组距(class interval,i ) 一般分为8~15组。 i = R / k = 2.49 / 10 = 0.249(mmol/L)
fX 589.8 X 4.915 4.92( mmol/L ) f 120
二、几何均数(geometric mean,G)
• 几何均数是n个变量值的乘积开n次方所得的积。
直接计算法
G n x1 x 2 x3 x n 两边取对数得: lg x1 lg x 2 lg x n lg x lg G n n 1 lg x G lg n
第一节 频数分布
频数表编制步骤
(3)写组段 • 第一个组段必须包含最小值,最后一个组段必 须包含最大值;除最后一个组段外,其余组段都 只写出下限,不写上限,最后一个组段通常要求 写出上限,即封口。
•
各组段的组距一般相等,但对于偏态分布的资 料,组距也可以不等,且第一组段或最后一个组 段也可以不封口(开口资料)。
44 45 46 47 48 230 X 46cm 5 5
一、算术均数(arithmetic mean)
加权法(weighting method):
当观察值较多时,可先编制频数表(frequency table),然后用加权法(weighting method) 计算:
第一节 频数分布
频数表编制步骤
(4)划记 • 按照原始数据表中各变量值的大小归组、划 记,一般采用画“正”字的方法。 (5)列频数分布表,绘制频数分布图 • 根据划记结果,列出各组段的频数。 • 频数分布图一般采用直方图,横轴为研究的变 量,纵轴为频数。
第一节 频数分布
第一节 频数分布
图6-1 某地120名健康成人血糖(mmol/L)频数分布图
Xn Xn n为偶数时:M 2
三、中位数与百分位数
百分位数(percentile,Px )
ix Px Lx n x% fx
f
L
式中: Px — 第x百分位数 Lx — Px 所在组的下限 i x — Px 所在组的组距 f x — Px 所在组的频数 n — 样本量,即总频数
数量特征。
计量资料的统计描述分为两个方面:
集中趋势(central tendency)
离散趋势(tendency of dispersion)
第二节 集中趋势的描述
描述计量资料集中趋势的统计指标称 平均数(average)。常用的平均数有三种:
算术均数(arithmetic mean,X ) 几何均数(geometric mean,G) 中位数(median,M)
f
L
— 小于L的各组累积频数
例7.4 某地205例伤寒患者潜伏期见表7-4,求 平均潜伏期。
表7-4 某地205例伤寒患者潜伏期百分位数计算表
潜伏期 (天) 2~ 4~ 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~22 人数 (f ) 26 29 42 50 48 4 2 2 1 1 累积频数 (Σf ) 26 55 97 147 195 199 201 203 204 205 累积频率(%) 12.68 26.83 47.32 71.71 78.00 97.07 98.05 99.02 99.51 100.00