2.2 描述集中趋势的统计指标
描述数据的中心趋势指标
描述数据的中心趋势指标
数据的中心趋势指标是描述数据集中程度或集中位置的统计量。常见的中心趋势指标包括平均数、中位数和众数。
1. 平均数(Mean):将所有数据值相加,然后除以数据的个数。它是数据的算术平均值,能够反映数据的总体水平。
2. 中位数(Median):将数据按照大小排序,处于中间位置的数值即为中位数。它不受极端值的影响,适用于偏态分布的数据。
3. 众数(Mode):数据集中出现频率最高的数值。在离散数据中,可以存在多个众数;在连续数据中,可能不存在众数。
这些中心趋势指标不仅能描述数据的集中程度,还可以用于数据分析和比较。而根据数据的特点和分布情况,选择适当的中心趋势指标是非常重要的。
2 计量资料的统计描述指标
X-μ ,反映所有观察值的变异程度。
离均差平方和--SS =∑(X-μ)2 方差variance--离均差平方和的平均值,
又称均方(MS)。
σ
2
(X − μ) ∑ =
N
2
3. 标准差
标准差(standard deviation):是方差的
正平方根,使用的单位与原单位相同。 总体标准差:σ
例
为研究中年知识分子的心理健康状况,某医学院对 1503 名中年知识分子进行了 SCL - 90 测定,结果如下表。试 求其中位数。
表2 1503 名中年知识分子 SCL-90 总分
频数 448 520 226 130 79 44 30 9 10 3 4 累计频数 448 968 1194 1324 1403 1447 1477 1486 1496 1499 1503 累计频率(%) 29.81 i 64.40 M = LM + (n×50%−∑ fL) 79.44 fM 88.09 93.35 20 =100+ (1503×50%−448) 96.27 520 98.27 98.87 =111.67 ( 分 ) 99.53 99.73 100.00 SCL-90 总分 80~ 100~ 120~ 140~ 160~ 180~ 200~ 220~ 240~ 260~ 280~300
∑ fX ∑f
列出描述集中趋势的常用指标
列出描述集中趋势的常用指标
描述集中趋势的常用指标主要包括均值、中位数、众数以及四分位数。这些指标可以帮助我们了解一组数据的集中程度和分布特征,从而更好地
进行数据分析和推断。
1. 均值(Mean):均值是一组数据的平均数,计算方法是将所有数
据相加,再除以数据的个数。均值可以反映数据的集中趋势,并且在统计
分析中经常被引用。
2. 中位数(Median):中位数是将一组数据按照大小排列后,位于
中间位置的数值。如果数据个数为奇数,中位数就是中间位置的数值;如
果数据个数为偶数,中位数则是中间两个数值的均值。中位数适合用于反
映数据的中心位置,对于有离群值的数据集更加稳健。
3. 众数(Mode):众数是一组数据中出现次数最多的数值。一个数
据集可能存在多个众数,也可能没有众数。众数可以帮助我们理解数据中
最常出现的数值,适用于描述离散分布的数据。
4. 四分位数(Quartile):四分位数将一组数据分成四个部分,分
别为最小值、第一四分位数、中位数和第三四分位数。第一四分位数表示
将数据分成四分之一位置的数值,第三四分位数则表示将数据分成四分之
三位置的数值。四分位数可以帮助我们了解数据的分布范围和离散性。
除了以上常用指标,还有一些其他的描述集中趋势的指标:
5. 平均数的变种:除了均值,还有加权平均数(Weighted Mean)和
几何平均数(Geometric Mean)等。加权平均数考虑了不同数据的权重,
而几何平均数适用于一组相对变化的数据。
6. 范围(Range):范围是一组数据的最大值与最小值之间的差值。范围可以帮助我们了解数据的极端值。
定量资料数据的统计描述
四、频数分布的类型
对称分布型:指集中位置在正中,左右 两侧频数分布大体对称。
偏态分布型:指集中位置偏向一侧,频数 分布不对称。 正偏态分布:集中位置偏向数值小的一侧。
偏态分布型
频数分布
负偏态分布:集中位置偏向数值大的一侧。
频数表的用途
1. 揭示频数分布的分布特征和分布类型。文献中常 将频数表作为陈述资料的形式。
简记为Q,可看为特定的百分位数。P25表示全部观
不同质的事物要分别求平均数,以便分析比较。 2.根据资料的分布选用适当的平均数。对称分布资 料,尤其是正态分布资料,宜用均数,也可用中位数, 而偏态分布资料则中位数的代表性较好,对数正态分
布及等比级数资料宜用几何均数。
二、描述离散趋势的特征数
例2-11 A组 B组 C组 试观察3组数据的离散情况。 26 28 30 32 34 24 27 30 33 36 26 29 30 31 34
频率:各组的频数除以总例数 n 所得的比值。 频率描述了各组频数在全体中所占的比重,各组 频率之和等于100%。 累计频数:本组段的频数与以前各组段的频数 相加; 累计频率:每组段的累计频数除以总例数。
连续变量的频数分布图
直方图
连续型变量的频数分布图,以直方的面积大小表 示频率的多少。 等距分组 以横轴表示被观察变量,纵轴表示频率密度,以 各矩形(宽度为组距)的面积代表各组段的频率。
定量资料数据的统计描述.
卫生统计学
第二章
定量资料的 统计描述
定量资料的统计描述
统计图表:频数分布表(图)
集中趋势指标
示,样本均数用拉丁字母
1. 计算方法 1)
表示。
直接法:适用于样本例数n较少的资料。
X1 X 2 ... X n X X n n
其中X1,X2…Xn为各变量值,n为样本例数。
2) 加权法:适用于变量值较多的资料。
fx 0 fx 0 X n f
f1,f2…fn分别为各组段的频数,X1,X2…X0 为各组段 的组中值, 组中值=(本组段下限+下组段下限)/2。
组段
6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30
频数
1 3 6 8 12 20 27 18 12 8 4 1 120
合计
二、离散型定量变量的频数分布
离散型变量的频数分布图
直条图
横坐标为产前检查次数;纵坐标为 频率,即产前检 查K次的妇女在被统计妇女中所占的比例%。图中等宽矩 形长条的高度与相应检查次数的频率呈正比。
集中趋势可分
集中趋势可分
集中趋势是指在数据分析中,数据集中在某个区域或数值附近的趋势。它是描述数据集合中主要的趋势或中心位置的统计指标,一般包括平均数、中位数和众数。
首先,平均数是最常用的集中趋势统计指标,它是将数据集中的所有数值相加,然后除以数据的个数得到的值。平均数可以很好地衡量数据的总体趋势,尤其当数据集呈正态分布时,平均数能够准确反映数据的中心位置。
其次,中位数也是常用的集中趋势统计指标,它是将数据集中的所有数值按照大小顺序排列,然后取出中间的数值。中位数能够更好地反映数据集中的中间位置,尤其当数据集存在离群点或极端值时,中位数比平均数更能代表数据的中心趋势。
再次,众数是指数据集中出现次数最多的数值。众数广泛应用于描述离散型数据的集中趋势,例如统计一组数据中最常出现的年龄段或血型等。众数能够直观地反映数据集中的重要数值,尤其当数据集呈现明显的峰值分布时,众数能够准确识别数据的主要集中趋势。
总结起来,集中趋势是描述数据集中重要数值或中心位置的统计指标。平均数、中位数和众数是常用的集中趋势统计指标,在不同的数据分析场景中有不同的应用。平均数适合描述总体趋势,中位数适合描述中间位置,众数适合描述离散型数据的主要集中趋势。在数据分析中,恰当地选择和使用集中趋势统
计指标能够更准确地理解和描述数据,帮助我们做出合理的决策和预测。
定量资料的统计描述
x2 ( x)2
n= n1
4540 (150)2
5 51
同理:(详细计算略) B组:S=4.74 C组:S=2.92
(2)加权法:加权法计算标准差的 公式为:
fx2 ( fx)2
S=
f
f1
式中f为各组频数,X为各组中值。
试求下表数据中的标准差:
一般设10~15个组段,每个组段的 起点称“下限”,终点称“上限”;第 一组段含最小值,最末组段含最 大值。
(4) 列表
频数分布的类型:
对称分布—集中位置在正中、左右 两侧频数分布大体对称
偏态分布
正偏峰分布-集中位 置偏向数值小的一侧
负偏峰分布-集中位 置偏向数值大的一侧
定量变量的特征数
x= 4 .20 + 6 .43 + 2 .08 + 3 .45 + 2 .26 + 4 .04 + 5 .42 + 3 .38
8 = 3 .9075 (U / L )
(2) 加权法:当样本含量n较大时,一 般将观察值分组,列出频数表, 再用加权法计算均数。其计算公 式为:
f x + f x + ...... + f x
为了比较全面地把握数据的分布特 点,不仅需要了解数据的集中位 置,而且需要了解数据的离散状况。 统计学可以通过不同的统计量从不 同的角度来定量地刻画数据的离散 趋势。
计算和应用平均数的原则_理论说明
计算和应用平均数的原则理论说明
1. 引言
1.1 概述
平均数是一种常用于描述数据集中趋势的统计指标,它是通过将一组数值相加后除以其个数来计算得出的。在日常生活和各个学科领域,平均数都被广泛应用,从经济学到自然科学,从社会学到工程学,每一个领域都离不开平均数的使用。
1.2 文章结构
本文将围绕计算和应用平均数展开讨论。首先,我们将介绍平均数的定义与计算方法,包括算术平均数、加权平均数和几何平均数。接下来,我们将探讨平均数在不同领域中的应用场景,例如统计学、经济学和自然科学。然后,我们将分析平均数的优缺点,并重点讨论其简单易懂、具有代表性和可比性等优点以及受极端值影响较大的缺点。最后,文章将总结主要观点和要点,并对未来关于平均数运用方面提出思考和展望。
1.3 目的
本文旨在向读者介绍计算和应用平均数的原则与理论。通过深入探讨平均数的定义、计算方法以及应用场景,读者将能够更好地理解平均数在数据分析和决策过程中的作用。同时,通过分析平均数的优缺点,读者将能够全面评估平均数在不同情况下的适用性,从而更加准确地进行数据解读和应用。通过阅读本文,读者
将拓宽对平均数概念的理解,并掌握运用平均数进行数据分析的方法与技巧。
2. 平均数的定义与计算方法
2.1 算术平均数
算术平均数是最常见也是最基本的平均数计算方法。它的定义是将一组数据中的所有数值相加,再除以数据个数。也可以用以下公式表示:
```
平均数= (数据1 + 数据2 + ... + 数据n) / n
```
其中,数据1至数据n代表数据集中的各个数值,n代表数据个数。
第二章 集中趋势的统计描述
120
100
80
60
40
20
Std. Dev = .85 Mean = 4.90 N = 816.00 2.50 3.00 3.50 4.00 4.50 5.00 5.50 6.00 6.50 7.00 7.50 8.00
0
CHO
Std. Dev = 1.12 Mean = 1.55 N = 1049.00
(2)变量x在取对数后的log(x)具有算术均数的 所有特征。
中位数(Median)和百分位数
一、定义:
中位数是把一组观察值,按大小顺序排列, 位置居中的那个数值。 中位数是一个位置指 标,它将所有观察值分为两个相同的部分, 各占除中位数以外的观察值的百分之五十。 用M表示。
百分位数也是一个位置指标,先 把一组数据从小到大排列, 将数据 中的所有观察值看成一个整体,即 100%。则百分位数将自身以外的观 察值分成了两个部分,其中有x%的 观察值比它小,而(100-x)%的个 体具有比它大的观察值。
0 .0 15 0 .0 14 0 .0 13 0 .0 12 0 .0 11 0 .0 10 00 9. 00 8. 00 7. 00 6. 00 5. 00 4. 00 3. 00 2. 00 1. 00 0.
400
300
200
100
0
TG
对数据的描述指标也分为两类: 1. 描述集中趋势(central tendency)或 平均水平的指标。 2. 描述离散趋势(tendency dispersion) 或变异水平的指标。
以下适合描述定量资料集中趋势的指标
以下适合描述定量资料集中趋势的指标
【原创版】
目录
1.描述定量资料集中趋势的指标
2.描述定量资料离散趋势的指标
3.适用类型及示例
正文
在描述定量资料的集中趋势和离散趋势时,我们通常使用一些统计指标来帮助我们更好地理解和分析数据。下面我们将介绍一些常用的指标。
首先,我们来看描述定量资料集中趋势的指标。其中,最常用的指标是平均数。平均数是一组数据的总和除以数据的个数,它可以反映出数据的总体水平。例如,如果我们想了解一个班级学生的平均成绩,我们可以通过计算所有学生成绩的总和除以学生人数来得到平均数。
其次,中位数也是描述定量资料集中趋势的指标之一。中位数是一组数据从小到大(或从大到小)排列后,位于中间位置的数值。如果数据的分布比较均匀,中位数往往可以很好地反映出数据的集中趋势。例如,如果我们想了解一个班级学生的成绩分布情况,我们可以通过计算中位数来得知。
再来看众数,众数是一组数据中出现频率最高的数值。众数可以用来反映数据的最常出现的情况,例如,如果我们想了解一个班级学生最喜欢的课程,我们可以通过计算众数来得知。
接下来,我们介绍一下描述定量资料离散趋势的指标。方差是一种常用的描述数据离散趋势的指标,它反映了数据的波动情况。方差越大,数据的波动性越大,数据越不稳定;反之,方差越小,数据的波动性越小,数据越稳定。例如,如果我们想了解一个班级学生的成绩波动情况,我们可以通过计算方差来得知。
标准差也是描述数据离散趋势的指标之一,它反映了数据的离散程度。标准差越大,数据的离散程度越大,数据越不稳定;反之,标准差越小,数据的离散程度越小,数据越稳定。标准差可以看作是方差的平方根,因此,它们的意义和计算方法类似。
2.2 描述集中趋势的统计指标
G log1( log X ) n
lg1「lg16
lg
32
lg
32
lg
64 7
lg
64
lg128
lg
512
丁
lg11.8062 64.
8
频率表法: 对于频率表资料,可以通过频率表法计算几何均数,计 算公式为:
「
G l og1
f
log
f
fX 0
( 4) = (2)(3) 7
27 66 104 180 340 513 378 276 200 108 29 2228
X 1 7 3 9 1 29 1 3 1
2228 18.57 120
6
2、几何均数(geometric mean,G)
适用于原始观察值分布不对称或观察值变化范围跨越多个数量级的 资料,但经对数转换后呈对称分布的变量,如服从对数正态分布的变量。
8
11
22
19
11
22
30
7
14
37
5
10
42
4
8
46
2
4
48
2
4
50
50
—
—
P50
48
描述集中趋势常用的统计指标
描述集中趋势常用的统计指标
在统计学中,描述集中趋势的统计指标用于衡量数据的中心位置。以下是常用的描述集中趋势的统计指标:
1. 平均数:平均数是数据集所有数值的和除以数值的数量。它是描述数据集中趋势的最常用指标。
2. 中位数:中位数是一组数值排序后处于中间位置的数值。对于未排序的数据,中位数是所有数值由小到大排列后位于中间的数值。当数据量是奇数时,中位数是中间那个数值;当数据量是偶数时,中位数是中间两个数值的平均值。
3. 众数:众数是数据集中出现次数最多的数值。如果存在多个数值出现次数相同且最多,则存在多个众数。
4. 几何平均数:几何平均数是数据集所有数值的乘积的平方根。它用于处理包含幂次的数据,并且在处理增长率或比率时非常有用。
5. 调和平均数:调和平均数是数据集所有数值的倒数之和的倒数。它与几何平均数类似,但在处理负数时表现更好。
6. 权重算术平均数:权重算术平均数是每个数值与相应的权重的乘积之和除以权重之和。它适用于数据集中的数值具有不同重要性或误差的情况。
7. 众数离散趋势指标:除了描述集中趋势外,众数还可以用
于描述数据的离散趋势或波动性。离散趋势指标可以显示数据之间的变化或波动程度,如标准差、四分位数范围、变异系数等。
8. 相对集中趋势指标:相对集中趋势指标通过将数据的集中趋势与总体均值的相对位置进行比较来衡量数据的相对集中趋势。这些指标包括相对偏差、相对误差等。
综上所述,以上是描述集中趋势常用的统计指标,它们具有不同的特性和适用范围。在分析数据时,选择适当的指标可以帮助更好地了解数据的中心位置和特征。
集中趋势的统计描述
集中趋势的统计描述
练习题
一、单项选择题
1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是
A. 中位数
B. 几何均数
C. 均数
D. 95P百分位数
E. 频数分布
2. 算术均数与中位数相比,其特点是
A.不易受极端值的影响B.能充分利用数据的信息
C.抽样误差较大D.更适用于偏态分布资料
E.更适用于分布不明确资料
3. 一组原始数据呈正偏态分布,其数据的特点是***正的反而小!
A. 数值离散度较小
B. 数值离散度较大
C. 数值分布偏向较大一侧
D. 数值分布偏向较小一侧
E. 数值分布不均匀
4. 将一组计量资料整理成频数表的主要目的是
A.化为计数资料 B. 便于计算
C. 形象描述数据的特点
D. 为了能够更精确地检验
E. 提供数据和描述数据的分布特征
5. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是
A. 均数
B. 几何均数
C. 中位数
D. 百分位数
E. 倒数的均数
答案: A B D E B
二、计算与分析
1. 现测得10名乳腺癌患者化疗后血液尿素氮的含量(mmol/L)分别为
3.43,2.96,
4.43,3.03,4.53,
5.25,5.64,3.82,4.28,5.25,试计算其均数和中位数。
[参考答案]
3.43+2.96+
4.43+3.03+4.53+
5.25+5.64+3.82+4.28+5.25
X==
4.26 (mmol/L)
10
4.28+4.43
M==
4.36(m m o l/L)
2
2. 某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:
众数、中位数、平均数的特点及其应用-概述说明以及解释
众数、中位数、平均数的特点及其应用-概述说明以及
解释
1.引言
1.1 概述
概述
在统计学和数据分析领域,众数、中位数和平均数是常用的统计指标,用于描述和分析数据集的集中趋势。它们可以帮助我们理解数据的分布情况,并从中提取有用的信息。本文将重点介绍众数、中位数和平均数的特点及其应用。
众数是指在一组数据中出现频率最高的数值。它可以用来反映数据的集中程度,并且适用于各种数据类型。众数的计算相对简单,只需要统计每个数值出现的次数,然后找出出现次数最多的数值即可。众数在实际应用中常用于描述一组数据的典型取值,如民意调查中的最受欢迎的候选人、销售数据中最畅销的产品等。
中位数是将一组数据按照大小排序后位于中间位置的数值。它不受极值的影响,更能反映数据的中间位置。计算中位数的方法相对直观,只需要将数据排序,并确定中间位置的数值即可。中位数在实际应用中常用于描述数据的中间水平,如家庭收入的中位数可以反映社会的平均收入水平,
股票价格的中位数可以反映市场的平均估值水平等。
平均数是指一组数据的总和除以数据的个数,是最常用的统计指标之一。它可以反映数据的整体水平,并且易于计算和理解。平均数的计算非常简单,只需要将所有数值相加,然后除以数值的个数即可。平均数在实际应用中广泛用于描述数据的均值水平,如平均工资可以反映一个地区的平均收入水平,平均成绩可以反映一个班级的整体学习水平等。
众数、中位数和平均数在统计分析中扮演着重要的角色,并且在不同领域有着广泛的应用。它们能够提供关于数据集的集中趋势、分布形态和离散程度等信息,帮助我们理解数据背后的规律和趋势。同时,在决策和预测中,这些统计指标也能够提供有用的参考,帮助我们做出更准确的判断和预测。
描述数据集中趋势的特征
描述数据集中趋势的特征
数据集是统计学中一个重要的概念,它是指一组数据的集合,用于分析和研究数据的特征和规律。在数据集中,我们经常关注数据的趋势特征,即数据的变化趋势和分布规律。本文将介绍描述数据集中趋势的特征的常用方法和技巧。
一、数据集的趋势特征
数据集的趋势特征是指数据在时间或空间上的变化趋势。通过分析数据的趋势特征,我们可以了解数据的发展规律,预测未来的变化趋势,为决策提供依据。常见的数据趋势特征包括以下几种:
1.1 均值
均值是描述数据集中集中趋势的最常用统计量之一,它表示数据集中所有数据的平均值。计算均值的方法是将数据集中的所有数据相加,然后除以数据的个数。均值能够反映数据的集中程度和平均水平,但它受极端值的影响较大,因此在分析数据集的趋势特征时需要综合考虑其他指标。
1.2 中位数
中位数是将数据集中的所有数据按照大小顺序排列后,位于中间位置的数值。如果数据集中的数据个数为奇数,那么中位数就是中间位置的数值;如果数据集中的数据个数为偶数,那么中位数就是中间两个数值的平均值。中位数能够反映数据的中间位置和分布情况,相对于均值来说受极端值的影响较小。
1.3 众数
众数是数据集中出现次数最多的数值。数据集中可能存在多个众数,也可能不存在众数。众数能够反映数据的集中程度和典型值,但它不能反映数据的整体分布情况。
1.4 极值
极值是数据集中最大值和最小值。极值能够反映数据的范围和变化幅度,但它受极端值的影响较大,需要谨慎使用。
1.5 百分位数
百分位数是将数据集中的所有数据按照大小顺序排列后,位于指定百分比位置的数值。常用的百分位数有四分位数、中位数、十分位数等。百分位数能够反映数据的分布情况和位置。
02定量数据的统计描述(医学统计学)
负(左)偏态分布
三、频数表的用途
1.作为陈述资料的形式 2.便于观察数据的分布类型
4.便于发现资料中含有的异常值 5.可用各组段的频率作为概率的估计值
3. 描述资料的分布特征
➢ 集中趋势:红细胞计数向中央部分集中,即中等 含量者居多,集中在11这个组段,这种现象为集 中趋势;
身高 体重
CV 4.71 100% 3.83% 123.10
CV 2.26 100% 10.14% 22.29
定量资料的 统计描述
统计图:频数分布图 统计表:频数分布表
集中趋势指标 统计指标:
离散趋势指标
利用统计表对数据进行概括;
利用统计图对分布形态及分布间的关系做直观的表达;
➢ 离散趋势:从中央部分到两侧的频数分布逐渐减 少,而且红细胞计数值参差不齐,最低的接近3 最高的接近6,这种现象称为离散趋势。
3. 描述资料的分布特征
集中趋势:观察值的平均水平或集中位置, 用平均数反映
离散趋势:观察值的变异程度或离散程度, 用变异指标反映
三、频数表的用途
1.作为陈述资料的形式 2.便于观察数据的分布类型 3.描述观察数据的分布特征
3
7
3.20
50~
11
18
8.22
60~
30
48
21.92
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
F 为小于L 所在组段的累计频数。 组段内的频数,n为总频数,
L
13
例 50例链球菌咽颊炎患者的潜伏期(h)见表25第(1)~ (3)列,试计算潜伏期的中位数。
为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其 算术均数。
X =
1 (4.20 + 6.43 + 2.08 + 3.45 + 2.26 + 4.04 + 5.42 + 3.38) 8 = 3.91 (1012 /L)
4
频率表法:对于样本含量较大的数据集(如例22),可以 在编制频率表的基础上计算均数的近似值。其计算公式为:
n
X + X n 1 + X 2 + ... X = n
n:样本含量 X ,X ,…,X :观察值 1 2 n
å X å X å X = = =
i i i =1 i
wk.baidu.comn
n
n
åX
i
i
或
å X :观察值之和
3
12 例 某年某医院8名女性晚期肺癌患者红细胞计数(10 /L)
M = X n +1 = X 5 = 63.6
2
12
频率表法:对频率表资料,可通过百分位数法近似计算中位数。 百分位数(percentile)是指将n个观察值从小到大依次排 列后,对 应于x%的数值。 对频率表资料,百分位数 的计算公式为:
i Px = L + ( n × x % - F L ) f x
-1
8
频率表法: 对于频率表资料,可以通过频率表法计算几何均数,计 算公式为:
é å f log X 0 ù é f log X 0 ù -1 å G = log ê ú = log ê ú n ê ú ê åf ú ë û ë û
-1
9
例 某年某医院52例慢性肝炎患者的HBsAg滴度数据见表24 第(1)和(2)列。试计算慢性肝炎患者HBsAg的平均滴度。
G = 7 16 ´ 32 ´ 32 ´ 64 ´ 64 ´128 ´ 512 = 64
log X å G = log ( )
-1
n
16 + lg 32 + lg 32 + lg 64 + lg 64 + lg 128 + lg 512 ù é lg = lg ê ú 7 ë û = lg -1 1 . 8062 = 64 .
第二章 定量资料的统计描述
二、描述集中趋势的统计指标
描述集中趋势统计指标
1、算数均数(arithmetic mean) 2、几何均数(geometric mean,G) 3、中位数(median,M) 4、众数(mode)
2
1、 算术均数
简称均数(mean),适合描述对称分布资料的集中位置(也称为平 均水平)。直接法,计算公式为:
( 2)
1´ 7 + 3 ´ 9 + L + 1 ´ 29 X = 1 + 3 + L + 1 2228 = = 18 . 57 120
6
2、几何均数(geometric mean,G)
适用于原始观察值分布不对称或观察值变化范围跨越多个数量级的 资料,但经对数转换后呈对称分布的变量,如服从对数正态分布的变量。 直接法:计算公式为:
X 0 )
7 9 11 13 15 17 19 21 23 25 27 29
f
( 3) 1 3 6 8 12 20 27 18 12 8 4 1 120
fX 0
(4)=(2)(3) 7 27 66 104 180 340 513 378 276 200 108 29 2228
M = X n +1
2
当n为偶数时,中位数表示为:
1 M = (X n + X n ) +1 2 2 2
11
例
某药厂观察9只小鼠口服高山红景天醇提取物(RSAE)
后在乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3, 63.6,63.6,65.6,65.8,68.6,69.0。试求其中位数。
抗体滴度 (1) 1:16 1:32 1:64 1:128 1:256 1:512 合计 表24 52例慢性肝炎患者HBsAg滴度的几何均数计算(频率表法) lgX 频数(f) 滴度倒数(X) (2) (3) (4) 2 16 1.20412 7 32 1.50515 11 64 1.80618 13 128 2.10721 12 256 2.40824 7 512 2.70927 52 — — f(lgX) (5)=(2)×(4) 2.40824 10.53605 19.86798 27.39373 28.89888 18.96489 108.06977
fX å fX å X = = n å f
0
0
f :组段的频数
X 0 :组段的中值 =(组段上限+组段下限)/2
5
例
试应用频率表法近似地计算例22资料的算术均数
表 23 加权法计算均数 组段 ( 1) 6~ 8~ 10~ 12~ 14~ 16~ 18~ 20~ 22~ 24~ 26~ 28~30 合计 组中值(
G = X X n 1 X 2 ...
n
或
log X å G = log ( )
-1
n
一般采用以10为底的常用对数进行转换。
7
例 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32, 1:32,1:64, 1:64,1:128,1:512。试计算其几何均数。
. 06977 ù é108 G = lg -1 = 119 . 74705 » 120 ê 52 ú ë û
10
3、中位数(median,M)
可用于各种分布的定量资料,特别是偏峰分布资料。 直接法计算: 基于原始数据,将n例数据按序排列,第i个数据记为 X i 当n为奇数时,中位数可表示为: