经济学集中趋势的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4 3 1 630
累积频数
27 196 363 457 538 580 608 622 626 629 630
-
累积频率(%)
4.3
31.1
57.6
M
72.5
85.4
92.1
96.5
98.7
99.4
99.8
100.0 -
180 150
频 120 数 90
60 30
0
0.1 0.4 0.7 196
1.0
第二节 平均数 (Average)
描述一组观察值集中位置或平均水平的统计指标。 一、算术均数
X X1 X 2 X n X
n
n
应用:主要适用于对称分布或偏斜度不大的资料,
尤其适合正态分布资料。
二、几何均数(Geometric Mean )
G n X1X2 Xn
G lg1 (lg X 1 lg X 2 lg X n ) lg1 ( lg X )
表2-2 某地140名正常男子红细胞数的频数表
红细胞数
频数
频 率(%)
累积频率(%)
3.80~
2
1.4
4.00~
6
4.3
4.20~
11
7.9
4.40~
25
17.9
4.60~
32
22.9
4.80~
27
19.3
5.00~
17
12.1
5.20~
13
9.3
5.40~
4
2.9
5.60~
2
1.4
5.80~ 6.00
Px
n x%
L
fx
fL
i x
L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。 例2.5 计算例2.4的百分位数P25 、 P75 、 P90。
P 0.40 630 0.25 27 0.30 0.632(mmol/L)
25
169
P 1.30 630 0.75 457 0.30 1.357(mmol/L)
1
0.7
合计
140
-
1.4 5.7 13.6 31.5 54.4 73.7 85.8 95.1
98.0 99.4 100.0 100.0
二、直方图(Histogram) 直观、形象地表示频数分布的形态和特征。
图2-1 140名正常男子红细胞计数的直方图
三、频数表的用途
1.作为陈述资料的形式 2.便于观察数据的分布类型 3.便于发现资料中含有的异常值 4.可用各组段的频率作为概率的估计值
小结
1. 运用频数表、直方图和统计指标这些技巧能 够有效地组织、整理和表达计量资料的信息。
2.平均数是描述一组观察值集中位置或平均水 平的统计指标,常用的有算术均数、几何均数和中 位数。其中均数的应用最为广泛,几何均数则多用 于血清学和微生物学中,中位数主要用于偏度较大 的数据分布资料。
3.百分位数可用来描述资料的观察值序列在某 百分位置的水平,中位数是其中的一个特例。
n
n
例2.2 测得10个人的血清滴度的倒数分别wenku.baidu.com2, 2,4,4,8,8,8,8,32,32,求平均滴度。
G lg 1 lg 2 lg 2 lg 4 lg 4 lg 8 lg 8 lg 8 lg 8 lg 32 lg 32 7
10
例2.3 (频数表资料) 应用:主要用于血清学和微生物学中。
1.3
1.61 1.9
2.2 2.5 2.8
3.1
630×0.5 M
甘 油 三 脂 (mg/dL)
M 0.70 630 0.5 196 0.30 0.914 167
M
L
0.5n fM
fL
iM
L、iM、fM分别为M所在组段的下限、组距和频数, fL为M
所在组段之前各组段的累积频数。
(二)百分位数(Percentile)
M=(2.85+8.58)/2=5.72(mg/dl)
2.频数表资料
表2-4 某地630名正常女性血清甘油三脂含量(mg/dl)
甘油三脂
0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~
3.10~ 合计
频数
27 169 167
94 81 42 28 14
第一节 频数分布 (Frequency Distribution)
由实验或临床观察等各种方式得到的原始数据, 如果是计量资料并且观察的例数较多,为了能够显 示数据的分布规律,可以对数据进行分组,然后制 作频数表或绘制直方图。
例2.1 某地用随机抽样方法检查了140名成年男子 的红细胞数,检测结果如表所示:
三、中位数和百分位数 (一)中位数 (Median,M )
将一组观察值从小到大按顺序排列,居中心位置 的数值即为中位数。
1.原始资料 如测得5个人的VLDL中的apo_B的含量(mg/dl)为 0.84、2.85、5.46、8.58、9.60,则
M=5.46(mg/dl)
若测量结果:0.84、2.85、8.58、9.6,则
如何有效地组织、整理和表达数据的信息?
一、频数表 (Frequency Table)
频数表:同时列出观察指标的可能取值区间 及其在各区间内出现的频数。
1.求全距R 2. 确定组数k并计算组距:通常选择在8~15之 间 : 参考组距i=R/10 , 组距取整。 3.确定组段: 应符合专业习惯 4.对各组段计数:划记或由软件完成
75
81
P 1.60 630 0.90 538 0.30 1.807(mmol/L)
90
42
(三)百分位数的应用
1.中位数是百分位数的特例。其特点是不易受 异常值的影响,适用于描述明显偏态分布、或两 端无确定数值数据的平均水平。
2.描述数据序列在某百分位置的水平。多个
百分位数结合使用如P25和P75可以描述数据的分散 程度,用P2.5和P97.5计算医学95%的参考值范围等。
4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.88 5.00 4.73 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50 5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 …… 5.02 4.76
累积频数
27 196 363 457 538 580 608 622 626 629 630
-
累积频率(%)
4.3
31.1
57.6
M
72.5
85.4
92.1
96.5
98.7
99.4
99.8
100.0 -
180 150
频 120 数 90
60 30
0
0.1 0.4 0.7 196
1.0
第二节 平均数 (Average)
描述一组观察值集中位置或平均水平的统计指标。 一、算术均数
X X1 X 2 X n X
n
n
应用:主要适用于对称分布或偏斜度不大的资料,
尤其适合正态分布资料。
二、几何均数(Geometric Mean )
G n X1X2 Xn
G lg1 (lg X 1 lg X 2 lg X n ) lg1 ( lg X )
表2-2 某地140名正常男子红细胞数的频数表
红细胞数
频数
频 率(%)
累积频率(%)
3.80~
2
1.4
4.00~
6
4.3
4.20~
11
7.9
4.40~
25
17.9
4.60~
32
22.9
4.80~
27
19.3
5.00~
17
12.1
5.20~
13
9.3
5.40~
4
2.9
5.60~
2
1.4
5.80~ 6.00
Px
n x%
L
fx
fL
i x
L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。 例2.5 计算例2.4的百分位数P25 、 P75 、 P90。
P 0.40 630 0.25 27 0.30 0.632(mmol/L)
25
169
P 1.30 630 0.75 457 0.30 1.357(mmol/L)
1
0.7
合计
140
-
1.4 5.7 13.6 31.5 54.4 73.7 85.8 95.1
98.0 99.4 100.0 100.0
二、直方图(Histogram) 直观、形象地表示频数分布的形态和特征。
图2-1 140名正常男子红细胞计数的直方图
三、频数表的用途
1.作为陈述资料的形式 2.便于观察数据的分布类型 3.便于发现资料中含有的异常值 4.可用各组段的频率作为概率的估计值
小结
1. 运用频数表、直方图和统计指标这些技巧能 够有效地组织、整理和表达计量资料的信息。
2.平均数是描述一组观察值集中位置或平均水 平的统计指标,常用的有算术均数、几何均数和中 位数。其中均数的应用最为广泛,几何均数则多用 于血清学和微生物学中,中位数主要用于偏度较大 的数据分布资料。
3.百分位数可用来描述资料的观察值序列在某 百分位置的水平,中位数是其中的一个特例。
n
n
例2.2 测得10个人的血清滴度的倒数分别wenku.baidu.com2, 2,4,4,8,8,8,8,32,32,求平均滴度。
G lg 1 lg 2 lg 2 lg 4 lg 4 lg 8 lg 8 lg 8 lg 8 lg 32 lg 32 7
10
例2.3 (频数表资料) 应用:主要用于血清学和微生物学中。
1.3
1.61 1.9
2.2 2.5 2.8
3.1
630×0.5 M
甘 油 三 脂 (mg/dL)
M 0.70 630 0.5 196 0.30 0.914 167
M
L
0.5n fM
fL
iM
L、iM、fM分别为M所在组段的下限、组距和频数, fL为M
所在组段之前各组段的累积频数。
(二)百分位数(Percentile)
M=(2.85+8.58)/2=5.72(mg/dl)
2.频数表资料
表2-4 某地630名正常女性血清甘油三脂含量(mg/dl)
甘油三脂
0.10~ 0.40~ 0.70~ 1.00~ 1.30~ 1.60~ 1.90~ 2.20~ 2.50~ 2.80~
3.10~ 合计
频数
27 169 167
94 81 42 28 14
第一节 频数分布 (Frequency Distribution)
由实验或临床观察等各种方式得到的原始数据, 如果是计量资料并且观察的例数较多,为了能够显 示数据的分布规律,可以对数据进行分组,然后制 作频数表或绘制直方图。
例2.1 某地用随机抽样方法检查了140名成年男子 的红细胞数,检测结果如表所示:
三、中位数和百分位数 (一)中位数 (Median,M )
将一组观察值从小到大按顺序排列,居中心位置 的数值即为中位数。
1.原始资料 如测得5个人的VLDL中的apo_B的含量(mg/dl)为 0.84、2.85、5.46、8.58、9.60,则
M=5.46(mg/dl)
若测量结果:0.84、2.85、8.58、9.6,则
如何有效地组织、整理和表达数据的信息?
一、频数表 (Frequency Table)
频数表:同时列出观察指标的可能取值区间 及其在各区间内出现的频数。
1.求全距R 2. 确定组数k并计算组距:通常选择在8~15之 间 : 参考组距i=R/10 , 组距取整。 3.确定组段: 应符合专业习惯 4.对各组段计数:划记或由软件完成
75
81
P 1.60 630 0.90 538 0.30 1.807(mmol/L)
90
42
(三)百分位数的应用
1.中位数是百分位数的特例。其特点是不易受 异常值的影响,适用于描述明显偏态分布、或两 端无确定数值数据的平均水平。
2.描述数据序列在某百分位置的水平。多个
百分位数结合使用如P25和P75可以描述数据的分散 程度,用P2.5和P97.5计算医学95%的参考值范围等。
4.76 5.26 5.61 5.95 4.46 4.57 4.31 5.18 4.92 4.27 4.77 4.88 5.00 4.73 4.47 5.34 4.70 4.81 4.93 5.04 4.40 5.27 4.63 5.50 5.24 4.97 4.71 4.44 4.94 5.05 4.78 4.52 4.63 …… 5.02 4.76