集中趋势的统计描述_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
169
P 1 .3 0 6 3 0 .7 0 5 4 5 0 .3 7 0 1 .3(5 m 7m ) ol/L
75
81
6 3 0 .9 0 0 538
P 1 .6 0
0 .3 0 1 .8(0 m 7m ) ol/L
90
42
(三)百分位数的应用
1.中位数是百分位数的特例,M=P50。其特点是不易受 异常值的影响,适用于描述明显偏态分布、或两端无确定 数值数据的平均水平。
第一节 频数分布 (Frequency Distribution)
由实验或临床观察等各种方式得到的原始数据 ,如果是计量资料并且观察的例数较多,为了能够 显示数据的分布规律,可以对数据进行分组,然后 制作频数表或绘制直方图。
例2.1 某地用随机抽样方法检查了140名成年男 子的红细胞数,检测结果如表所示:
三、频数表的用途
1.作为陈述资料的形式 2.便于观察数据的分布类型 3.便于发现资料中含有的异常值 4.可用各组段的频率作为概率的估计值
第二节 平均数 (Average)
描述一组同质观察值平均水平或集中位置的统计指标 。
一、算术均数(arithmetic mean),简称均数
XX 1X 2 X n X
2.平均数是描述一组观察值集中位置或平均水平的统计 指标,常用的有算术均数、几何均数和中位数。其中均数的 应用最为广泛,几何均数则多用于血清学和微生物学中,中 位数主要用于偏度较大的数据分布资料。
3.百分位数可用来描述资料的观察值序列在某百分位置 的水平,中位数是其中的一个特例。
See you soon…
例2.2 测得10个人的血清滴度的倒数分别为2, 2,4,4,8,8,8,8,32,32,求平均滴度。
G l 1 g l2 g l2 g l4 g l4 g l8 g l8 g l8 g l8 g l3 g l3 2 g 7 2
10
例2.3 (频数表资料)
注意:观察值中不能有0,不能同时有正有负
三、中位数和百分位数 (一)中位数 (Median,M )
一组由小到大按顺序排列的观察值中,位次居中 的数值。
可用于描述:非正态分布资料(除对数正态分布) 频数分布的末端无确切数据的资料 总体分布不清楚的资料
在全部观察值中,大于M和小于M的个数相等。
1.原始资料:从小到大排列 如测得5个人的VLDL中的apo_B的含量(mg/dl)为 0.84、2.85、5.46、8.58、9.60,则
Px L nx% fxfL ix
L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。 例2.5 计算例2.4的百分位数P25 、 P75 、 P90。
P 0 .4 0 6 3 0 .2 0 5 2 7 0 .3 0 0 .6(3 m 2m ) ol/L
25
n
n
应用:主要适用于对称分布或偏斜度不大的资料 ,尤其适合正态分布资料。
计算方法:
• 直接法:用于样本含量较少时
XX 1X 2 X n X
n
n
• 加权法:用于频数表资料或样本相同观察值较多时
Xf1x1 f1 f2 fx 22 fk fkxk
fx n
二、几何均数(Geometric Mean )
应用:对数正态分布资料
等比级数资料,如血清学和微生物学中。
计算方法:
• 直接法: GnX 1X2 Xn
或 • 加权法:
G l 1 g ( lX g 1 lX g 2 lX g n ) l 1 g ( lX g )
n
n
G l 1 g (f1 x 1 f1 f2 fx 2 2 fk fk x k) l 1 g ( n lx g )
如何有效地组织、整理和表达数据的信息?
一、频数表 (Frequency Table)
频数表:同时列出观察指标的可能取值区间 及其在各区间内出现的频数。
1.确定组数k:通常选择在8~15之间 2.确定组距: 参考组距为R/k , R为全距 3.确定组限: 应符合专业习惯 4.对各组段计数:划记或由软件完成
2.2 2.5 2.8
3.1
630×0.5 M
甘 油 三 脂 (mg/dL)
M 0 .7 0 6 3 0 .5 0 1 9 0 .3 6 0 0 .914 167
ML0.5nLeabharlann BaiduM fLiM
(二)百分位数(Percentile)-Px
是一种位置指标,理论上有x%的值比它小,有(100-x)%的值比它大
③求中位数
ML(0.5nfM fL)iM
式中:L、iM、fM分别为M所在组段的下限、组距和频数;f L 为小 于L的各组段的累计频数。
表2-4 某地630名正常女性血清甘油三脂含量(mg/dl)
180 150
频 120 数 90
60 30
0
0.1 0.4 0.7 1.0 196
1.3
1.61 1.9
M=5.46(mg/dl)
若测量结果:0.84、2.85、8.58、9.6,则
M=(2.85+8.58)/2=5.72(mg/dl)
2.频数表资料
计算步骤:
①计算n/2的大小,累计频数和累计频率
②确定M所在组段,累计频数中大于n/2的最小数 值所在的组段即为所在的组段;或累计频率中 大于50%的最小频率所在的组段
2.描述一组数据某百分位置的水平。多个百分位数结
合使用如P25和P75可以描述数据的分布特征,用P2.5和P97.5
计算非正态分布资料的医学95%的参考值范围等。 3.样本量要足够大,否则不宜取靠近两端的百分位数。
小结
1. 运用频数表、直方图和统计指标这些技巧能 够有效地组织、整理和表达计量资料的信息。