定量变量的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频数(f)
1 2 6 9 14 15 21 18 15 10 5 3 1
120(Σf)
图6-1 某地120名健康成人血糖(mmol/L)频数分布图
图6-2 频数分布的三种类型示意图
频数分布表的用途
频数表的用途:
1.作为陈述资料的形式,可以替代繁杂的原始资料, 便于进一步统计分析。
2. 揭示资料的分布特征和分布类型。 3.便于发现某些特大或特小的可疑值(离群值)。 4.当样本量较大时,可以各组段的频率作为概率的
一、算术均数(arithmetic mean,x )
二、几何均数(geometric mean,G ) 三、中位数(median,M)和百分位数
(percentile,Px)
一、算术均数(arithmetic mean)
是n个变量值的数值平均值,即各个变量值之和除 以变量值的个数。适用于对称分布资料。
G
lg
1
lg n
x
lg
1
lg
x1
lg
x2 n
lg
xn
lg 1 lg 10 lg 20 lg 40 lg 80 lg 160
5
lg 1 1.0000 1.3010 1.6021 1.9031 2.2041
5
lg 1 8.0103 lg 1 1.6026 40 5
(3)确定组限: 第一组段应包括最小值; 各个组段只包括下限值,不包括上限值; 最末一组段应包括最大值,并同时写出其下限和上限。 (4)划记,列频数表(见表6-1)
表6-1 某地120名成人血糖的频数分布
合计
血糖(mmol/L)
3.6~ 3.8~ 4.0~ 4.2~ 4.4~ 4.6~ 4.8~ 5.0~ 5.2~ 5.4~ 5.6~ 5.8~ 6.0~6.2
频数表编制步骤: (1)计算全距 (range):亦称极差,简记为R,R= Xmax-Xmin,
本例最大值为6.16,最小值为3.67,故: R=6.16﹣3.67=2.49(mmol/L)
(2)确定组距:一般分为8~15组。本例: R=2.49, i = R / k = 2.49 / 10 = 0.249(mmol/L) , 定组距为i= 0.20(mmol/L) 比较适宜。
总体均数用表示,样本均数用X表示。 (一)直接法:
x x1 x2 xn x
n
n
例 测得5名周岁儿童的头围(cm)为:44、45、46、47、48,
求其平均头围。
x 44 45 46 47 48 230 46cm
5
5Байду номын сангаас
一、算术均数(arithmetic mean)
(二)加权法(weighting method):
即5人血清中该抗体平均效价为1:40
二、几何均数(geometric mean)
加权法
G lg 1 f1 lg x1 f2 lg x2 fk lg xk
n
lg 1 f lg x n
例7.3 40名麻疹易感儿接种疫苗1个月后血凝抑制抗体 滴度见表7-3,求平均滴度。
本例∑flgx=72.2471,代入公式得:
G l g 1
flfg x l g 1 7.4 2 20 4 7 l g 1 1 1 .80 6 64 2
即40名麻疹易感儿接种疫苗1个月后血凝抑 制抗体平均滴度为1:64。
三、中位数和百分位数
中位数(median)
几何均数是n个变量值的乘积开n次方所得的根。 直接法
G n x1 x2 x3 xn 两边取对数得:
lg G lg x1 lg x2 lg xn lg x
n
n
G lg 1
lg n
x
二、几何均数(geometric mean)
例7.2 有5人的血清中某抗体效价分别为1:10、 1:20、 1:40、 1:80、 1:160,求其平均效价。
当观察值较多时,可先编制频数表(frequency table),然后用加权法(weighting method) 计算:
x f1 x1 f 2 x 2 f k x k fx
n
n
一、算术均数(arithmetic mean)
SD=0.482
二、几何均数(geometric mean)
定量变量的统计描述
例6.1 某地120名健康成人血糖(mmol/L)测定结果如下
4.60 461 4.65 5.86 4.75 4.80 5.81 4.71 5.04 5.25 4.33 5.70 4.94 5.32 5.78 4.85 4.28 5.48 4.48 4.29 4.93 5.21 4.58 4.05 4.11 4.78 5.14 4.15 4.49 5.26 4.38 4.63 5.12 4.95 5.11 5.22 4.66 5.09 4.67 4.68 5.62 3.67* 5.27 3.83 3.91 4.45 4.92 5.35 4.06 4.28 4.40 5.13 4.52 5.12 5.40 4.88 5.01 5.00 5.59 5.53 4.96 4.57 4.83 5.43 5.06 5.33 4.90 4.08 4.48 5.04 4.42 5.23 5.08 4.42 4.23 5.24 4.25 5.62 5.28 4.30 5.02 4.56 4.77 5.37 5.64 4.72 5.16 4.86 5.52 4.33 4.98 5.48 4.96 4.78 5.10 5.31 5.34 5.38 4.50 4.82 4.95 4.55 4.81 5.56 4.55 4.89 4.69 5.19 4.72 5.45 4.15 4.80 6.16** 5.55 5.13 4.86 5.75 4.95 5.06 4.99
估计值。
第二节 描述平均水平的统计指标
统计描述即用恰当的统计指标描述资 料的数量特征。
计量资料的统计描述分为两个方面: 集中趋势(central tendency)主要指平均水平 离散趋势(tendency of dispersion)
平均数(average)
平均数是反映一组同质的数值变量资料的集中 趋势或平均水平的指标。常用的平均数有三种: