第四章集中趋势的测量
第四章 集中趋势测量法
n
x
N
i
样本均值
x1 x 2 x n x n
x
i 1
i
n
9
加权均值 (weighted mean)
设各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk
总体加权均值
G M = N X1 ×X 2 × ×X N = 4 104.5% ×102.0% ×103.5% ×105.4% = 103.6%
平均收益率=103.6%-1=3.6%
19
四、位置平均数
众数 (mode)
1.集中趋势的测度值之一
2.出现次数最多的变量值 3.不受极端值的影响 4.可能没有众数或有几个众数
20
众数
(不唯一性)
无众数 原始数据:
10
5
9 12
6
8
一个众数 原始数据:
6
5
9
8
5
5
多于一个众数 原始数据: 25 28 28 36 42 42
21
22
甲城市家庭对住房状况评价的频数分布 甲城市 向上累积 回答类别 户数 (户) 百分比 (%) 户数 (户) 百分比 (%) 向下累积 户数 (户) 百分比 (%)
GM N X 1 X 2 X N N X i
i 1
N
6. 可看作是均值的一种变形
1 log GM (log X 1 log X 2 log X N ) N
log X
i 1
N
i
18
N
几何平均数 (算例)
• 【例】一位投资者持有一种股票,1996年、1997年、 1998年和1999年收益率分别为4.5%、2.0%、3.5%、 5.4%。计算该投资者在这四年内的平均收益率。
第四章 集中趋势和离散程度的测定
第四章 集中趋势和离散程度的测定
第一节 第二节 第三节 第四节 第五节 第六节 集中趋势和离散程度 算术平均数 调和平均数 几何平均数 中位数和众数 标志变动度
第一节
集中趋势和离散程度
集中趋势(Central tendency)是 指总体中各单位变量值趋同的趋势 现象总体各单位 特征 在某一标志上 一般水平的代表值 种类
i
比重/% f / ∑f 60 25 15 100
f 36 15 9 60
n
f / ∑f x·f 60 25 15 360 300 270
100 930
x
x f
i 1 i
f
i 1
n
620 15.5(件) 40
x
x f
i 1 i
i
i
f
i 1
n
930 15.5(件) 60
集中趋势和离散程度
1100 1200 1300
离中趋势(decentralize tendency) 是指一组数据远离其中心值的程度
200 400
3000
标志变异指标 (标志变动度)
变异指标的作用
1600
800 1200
标志变异指标类型
• 全距 • 平均差 • 标准差 • 离散系数
8
变异指标的作用
用于衡量平均指标的代表性
反映社会经济活动的均衡性 某公司三个企业销售额资料 单位:万元 用于衡量统计推断效果 某公司两个企业销售额计划完成百分比 年份 企业A 企业B 企业C 企 1 业 2 甲 3 乙 年销售额 年销售额 年销售额 第一 第二 第三 第四 全年 1100 季度 200 1600 季度 季度 季度 1300 3000 1200 14.0 10.0 46.0 30.0 100.0 1200 400 800 25.0 23.3 25.8 25.8 100.0
集中趋势测量法
05 集中趋势测量法的案例分 析
案例一:算术平均数的应用
场景描述
某公司需要评估员工的薪资水 平,采用算术平均数作为测量
指标。
数据收集
收集公司所有员工的薪资数据 。
计算 数。
结果分析
通过比较算术平均数与市场薪 资水平,可以评估公司薪资水
平的竞争力和合理性。
在社会学中的应用
描述社会现象
01
集中趋势测量法可用于描述社会现象的中心趋势或典型情况,
如人口平均年龄、平均教育水平等。
分析社会差异
02
通过比较不同社会群体的集中趋势指标,可以分析社会差异和
不平等现象。
预测社会变迁
03
基于历史数据的集中趋势分析,可以对未来社会变迁进行预测
和研究,为社会规划和政策制定提供参考。
案例二:中位数的应用
场景描述
某市场研究机构需要分析某地区家庭 收入分布情况,采用中位数作为测量 指标。
数据收集
收集该地区所有家庭的收入数据。
计算方法
将家庭收入数据按照从小到大的顺序 排列,找到位于中间位置的数值,即 为中位数。
结果分析
通过比较中位数与平均数的大小,可 以判断家庭收入分布是否均衡,以及 是否存在极端值的影响。
03
特点
中位数不受极端值影响,对于偏态分布的数据较为适用。
众数
定义
众数是一组数据中出现次数最多的数。如果数据分布没有明显的集中趋势,则可能没有众 数;如果有两个或两个以上的数出现次数相同且最多,则这组数据有多个众数。
计算步骤
统计每个数据出现的次数,找到出现次数最多的数。
特点
众数反映了数据的集中趋势和分布情况,但可能受数据分组的影响。
第四章集中趋势测量法
第四章 集中趋势测量法统计资料经分类整理后,已经使杂乱无章的资料成为有系统有条理的资料。
为从中获取有用信息,寻求一简单数值以代表总体(或样本)是最起码的,这就提出了平均指标的计算问题。
平均指标的功用是表明现象总体在一定条件下某一数量标志所达到的一般水平。
第一节 算术平均数在社会统计学中.算术平均数是反映集中趋势最常用、最基本的平均指标。
由于统计总体的标志总量通常都是各总体单位标志值之和,而且是与其总体单位数相对应的,因此用总体标志总量除以总体单位数即得算术平均数。
算术平均数一般用X 表示,它在推论统计中被称为均值。
算术平均数表示某一总体之总体单位平均所得的标志值的水平。
在实际工作中,由于统计资料整理的情况不尽相同,我们在运用定义计算算术平均数时,要视资料有没有分组加以区别对待。
在形式上,分组资料的计算式与未分组资料的计算式是有区别的,尽管它们在本质上并没有什么不同。
以后我们将看到,其他平均和变异指标的计算也同样如此。
1.对于未分组资料对于未分组资料,计算算术平均数要用原始式。
2.对于分组资料对于分组资料,计算算术平均数要用加权式。
对于单项数列,很显然,算术平均数X 不仅受各变量值(i X )大小的影响,而且受各组单位数(频数)的影响。
由于i X 对于总体的影响要由频数(i f )大小所决定,所以i f 也被称为权数。
值得注意的是,在统计计算中,权数不仅用来衡量总体中各标志值在总体中作用,同时反映了指标的结构,所以它有两种表现形式:绝对数(频数)和相对数(频率)。
这样一来,在统计学中,凡对应于分组资料的计算式,都被称为加权式。
对于组距数列,由于每一组变量值不止一个,因此先要用每一组的组中值权充该组统一的变量值,然后再计算给定数列的算术平均数。
3.算术平均数的性质(1) 各变量值与算术平均数的离差之和等于0。
(2)各变量值对算术平均数的离差的平方和,小于它们对任何其他数(X ’)偏差的平方和。
也就是说,各变量值与算术平均数的离差的平方和为最小值。
第四章 (集中趋势 )
975.0 550.0 6160.0
解:表4-1的数据为等距分组资料,而 120~125这一组出现的频数最大,为14。 因此,该组为众数所在组。将表4-1的数 据资料代入分组数据计算中位数的公式可 得: 按下限公式(4-7)计算:
14 8 M o 120 5 123 14 8 14 10
i 1
n
1
x
1 1 1 0.25 0.2 0.1
i
该种蔬菜当天平均价格为每500克0.158元。
【例 4.4】已知某企业职工工资和工资总额资料 如表4-2,要求:计算该企业职工的平均工资:
表4-2 企业职工工资计算表
工资(x) 46 52 工资总额(m) 230 780 职工人数(m/x) 5 15
一、平均指标的概念和作用
平均指标亦称平均数,在统计学中占有重要的 地位。它反映同类现象在一定时间、地点、条 件下所达到的一般水平。 对于不同类型的数据,从不同的角度考察其一 般水平时,往往需要运用不同形式的平均指标。 依据各种统计平均数的具含义和计算方式的不 同,可以将其归纳为“数值平均数”和“位置 平均数”两大类。其中,常用的数值平均数有 算术平均数、调和平均数和几何平均数,常用 的位置平均数有众数、中位数和四分位数等。
2
当总体单位数为奇数时,则处于序列中间位置 的变量值就是中位数。
当总体单位数为偶数时,则应取中间位置的两 个数的中点值作为中位数,即取中间两个变量 值的算术平均数为中位数。 2. 由单项数列确定中位数 根据单项数列确定中位数与根据未分组数据确 定中位数方法基本一致。它是先计算各组的累 f 计次数(或频数),再按公式 确定中 2 位数的位置,并对照累计次数确定中位数。
第四章 集中趋势指标与离中趋势指标 《统计学基础》PPT课件
4.1.2 算术平均数
性质1. 性质2.
各变量值与其算术平均数离差之和等于零
各个变量值与其算术平均数离差平方和为 最小值
4.1.3 调和平均数
平均数的倒数。
,它是各个变量值倒数的算术
பைடு நூலகம்
4.1.4 几何平均数
几何平均数是n个变量值连乘积的n次方根。 几何平均数主要应用于计算平均比率和平 均速度。
1. 简单几何平均数
2. 加权几何平均数
4.1.5 中位数
中位数就是将数据观察值按大小顺序排列,处在中间位 置的那个观察值。
4.2.1 离中趋势指标的意义和作用
反映各单位标志值之间差异程度大小的指标,叫离中 趋势指标,也称标志变异指标。
第一,它可以衡量平均指标代表性的大小。 第二,它可以反映社会生产和其他经济活动的均衡 性或协调性强弱。
4.2.5 离散系数
离散系数也称标志变异系数,它是离 散程度指标与平均指标之比,是说明变量 值离中程度的相对指标。该指标数值大, 则变量值离中程度大,其平均数代表性小; 若指标数值小,则离中程度小,其平均数 代表性高。
离散系数主要是指标准差系数,标准差系数是标准差与其 算术平均数之比。用来说明现象离中的相对程度。其计算 公式为:
4.3.1 集中趋势指标测度方法评 价
单纯从数量关系上考察
调和平均数<几何平均数<算术平 均数
当统计资料的分布 曲线是一对称的钟 形分布时,其算术 平均数、中位数和 众数三者相等。
4.3.2 应用集中与离中趋势指标 应注意的问题
(一)计算平均指标的社会经济现象必须是 同质的 (二)用组平均数补充说明总平均数 (三)统计平均数应与变量数列和典型事例 相结合 (四)集中与离中趋势指标结合运用
集中趋势度量法
Q2
LQ2
N 2
NQ2 fQ2
iQ2
1000 440
600 2
100 627元
220
LQ2 第一个分位数所在组的下限;N 为总次数; NQ2 第一个分位数之前所有各组的累计次数; fQ2 第一个分位数所在组次数;iQ2第一个分位数所在组组距。
西北工业大学管理学院
数值数据的众数
计算公式
1)下限公式
M0
L
1 1 2
i
700
570 570 450
100
755.9
M
:众值
0
L :众值组的下限
1:众值组次数与下一组次数之差
:众值组次数与上一组次数之差
2
i:众值组的组距
西北工业大学管理学院
数值数据的众数
计算公式
2)上限公式
27
4725
180~190
185
20
3700
190~200
195
17
3315
200~210
205
10
2050
210~220
215
8
1720
220~230
225
4
900
230~240
235
5
1175
第 4 章 集中趋势度量法
4.1 集中趋势的基本概念和作用 4.2 集中趋势的度量 4.3 算术平均值、中位数和众数的比较 4.4 集中趋势分析需注意的问题
西北工业大学管理学院
学习目标
1. 集中趋势的基本概念 2. 集中趋势各测度值的计算方法 3. 集中趋势各测度值的特点及应用场合
4.2集中趋势的测定
x =
M ∑
i= 1
fi
n 2 2 0 2 0 = =1 5 8 1 0 2
比较加权算术平均数和简单算术平均数的计算公式 可以发现: 可以发现: 简单算术平均数的大小只受到变量值大小的影响, 简单算术平均数的大小只受到变量值大小的影响,而 加权算术平均数的大小除了受到各组变量值x大小的影 加权算术平均数的大小除了受到各组变量值 大小的影 响外, 的影响。 响外,还受到各组变量值出现次数 f 的影响。 平均数会越靠近次数多的那一组的变量值,而不靠近 平均数会越靠近次数多的那一组的变量值, 次数少的那一组变量值。 次数少的那一组变量值。 各组变量值出现次数的多少, 各组变量值出现次数的多少,对平均指标数值的大小 有权衡轻重的作用,所以也称之为权数 权数。 有权衡轻重的作用,所以也称之为权数。
算术平 均数 总体单 位总数
求总和 符号
[例]某科室现有8名职工,上月工资额分别为:1800、 某科室现有8名职工,上月工资额分别为:1800、 1800、2000、2100、2300、2300、2400、2500元 1800、2000、2100、2300、2300、2400、2500元,则 名职工的平均工资为: 这8名职工的平均工资为: ∑x x= n 1800+1800+2000+2100+2300+2300+2400+2500 = 8
(二)、调和平均数
调和平均数是各变量值倒数的算术平均数的倒数, 调和平均数是各变量值倒数的算术平均数的倒数, 又称为倒数平均数,通常用H表示。 又称为倒数平均数,通常用H表示。调和平均数有简单 调和平均数和加权调和平均数两种。 调和平均数和加权调和平均数两种。 1.简单调和平均数 1.简单调和平均数 简单调和平均数是各总体单位标志值x 简单调和平均数是各总体单位标志值x的倒数的简单 算术平均数的倒数。其计算公式为: 算术平均数的倒数。其计算公式为: n 变量值 H= 的项数 1 Σ x 调和平
第四章-集中趋势测量法
第四章 集中趋势测量法第一节算术平均数简单算术平均数•加权算术平均数•算术平均数的性质 第二节中位数对于未分组资料•对于分组资料•四分位数与其他分位数•中位数的性质 第三节众数对于未分组资料•对于分组资料•众数的性质 第四节几何平均数与调和平均数及其他几何平均数•调和平均数•各种平均数的关系 、填空称为( 5. 6.7.是(1•某班级中男生人数所占比重是 66.7%,则男生和女生的比例关系是( 2.在频数分布图中,( )标示为曲线的最高点所对应的变量值。
3•在频数呈偏态分布时,( )必居于X 和M 0之中。
4•算术平均数、调和平均数、几何平均数又称为( )平均数,众数、中位数又 )平均数不受极端变量值得影响。
)来计算的,所以又称为( )平均数。
)为权数,加权调和平均数是以( )为权数的。
)平均数,其中( 调和平均数是根据( 加权算术平均数是以( 对于未分组资料,如总体单位数是偶数,则中间位置的两个标志值的算术平均数就二、单项选择1. 分析统计资料, A 众数2. 对于同一资料, 可能不存在的平均指标是( B 算术平均数 C 中位数 算术平均数,调和平均数和几何平均数在数量级上一般存在如下关 )。
D 几何平均数 系( A 算术平均数 B 中位数C 调和平均数D 几何平均数4.从计算方法上看,RQ i /K p 是()A 算术平均数B 调和平均数C 中位数D 几何平均数3.下面四个平均数中, 只有()是位置平均数。
5.由右边的变量数列可知:()。
M 0> Md ;M d> M o ;M 0 >30M d>306.某车间三个小组,生产同种产品,其劳动生产率某月分别为150, 160, 165 (件/工日),产量分别为4500, 4800, 5775 (件),则该车间平均劳动生产率计算式为()。
150罗165158.33 (件/工日)150 5775158.53 (件/工日)45000 4800 57775 158.68 (件/工日)15^ T6y 365~物50 160 165=158.21 (件/ 工日)7.关于算术平均数的性质,不正确的描述是(A B C 各变量值对算术平均数的偏差和为零;算术平均数受抽样变动影响微小;算术平均数受极端值的影响微小;各变量值对算术平均数的偏差的平方和,小于它们对任何其它数偏差的平方和。
统计学习题--第四章-集中趋势的量度:平均指标.doc
第四章集中趋势的量度:平均指标第一节算术平均数简单算术平均数·加权算术平均数·算术平均数的性质第二节中位数对于未分组资料·对于分组资料·四分位数与其他分位数·中位数的性质第三节众数对于未分组资料·对于分组资料·众数的性质第四节几何平均数与调和平均数及其他几何平均数·调和平均数·各种平均数的关系一、填空1.某班级中男生人数所占比重是66.7%,则男生和女生的比例关系是()。
2.在频数分布图中,()标示为曲线的最高点所对应的变量值。
3.在频数呈偏态分布时,()必居于X 和M0之中。
4.算术平均数、调和平均数、几何平均数又称为(数值)平均数,众数、中位数又称为(位置)平均数,其中()平均数不受极端变量值得影响。
5.调和平均数是根据()来计算的,所以又称为(倒数)平均数。
6.加权算术平均数是以()为权数,加权调和平均数是以(各组标志总量)为权数的。
7.对于未分组资料,如总体单位数是偶数,则中间位置的两个标志值的算术平均数就是()。
二、单项选择1.分析统计资料,可能不存在的平均指标是()。
A 众数B 算术平均数C 中位数D 几何平均数2.对于同一资料,算术平均数,调和平均数和几何平均数在数量级上一般存在如下关系( D)A M g≥M h≥XB M h≥ X ≥ M gC M h≥M g≥XD X≥M g≥M h3.下面四个平均数中,只有()是位置平均数。
A 算术平均数B 中位数C 调和平均数D 几何平均数4.从计算方法上看,P1Q1是()。
P1Q1 /K PA 算术平均数B 调和平均数C 中位数D 几何平均数5.由右边的变量数列可知:()A M 0> M d;完成生产定额数工人数B M d> M 0;10- 20 35 20- 30 20C M 0>30 30- 40 25 40- 50 10D M d>3050- 60 156.某车间三个小组,生产同种产品,其劳动生产率某月分别为150,160, 165(件 /工日),产量分别为4500, 4800, 5775(件),则该车间平均劳动生产率计算式为()A 150 160 165158.33 (件 /工日)3B 150 4500 160 4800 165 5775158.53 (件/工日)4500+ 4800+ 5775C 4500 4800 5775 158. 68(件/工日)4500 4800 5775150 160 165D 3 150 160 165=158.21(件/工日)7.关于算术平均数的性质,不正确的描述是()A各变量值对算术平均数的偏差和为零;B算术平均数受抽样变动影响微小;C算术平均数受极端值的影响微小;D各变量值对算术平均数的偏差的平方和,小于它们对任何其它数偏差的平方和。
测度集中趋势的指标
测度集中趋势的指标
测度集中趋势的指标是用来衡量数据集中程度的统计量。
常见的测度集中趋势的指标有:
1. 平均值(均值):将数据集中所有观测值相加后除以观测值的个数,反映数据集中趋势的中心位置。
2. 中位数:将数据集中的观测值按顺序排列,取中间位置的观测值作为中位数,反映数据集中趋势的中间位置。
3. 众数:数据集中出现次数最多的观测值,反映数据集中趋势的最常出现的位置。
4. 加权平均值:将每个观测值乘以对应的权重后相加,再除以权重的总和,反映具有不同权重的数据集中趋势的加权平均位置。
5. 几何平均值:将数据集中所有观测值相乘后开根号,反映数据集中趋势的几何平均位置。
6. 分位数:将数据集中的观测值按顺序排列,取指定位置的观测值作为分位数,例如四分位数、百分位数等。
这些指标可以帮助我们了解数据集中趋势的位置和分布状况,从而更好地理解和描述数据。
不同的指标适用于不同的数据类型和分布情况,选择合适的指标可以准确地反映数据的集中趋势。
统计学集中趋势和离散趋势的度量
统计学集中趋势和离散趋势的度量
统计学中有多种方式用于度量数据的集中趋势和离散趋势。
以下是其中一些常用的度量方法:
集中趋势的度量:
1. 平均值(Mean):将所有数据点相加,然后除以数据的个数。
2. 中位数(Median):将数据按照大小排序,取中间位置的值(当数据个数为偶数时,取中间两个数的平均值)。
3. 众数(Mode):出现次数最多的数值。
4. 加权平均值(Weighted Mean):对数据点进行加权处理,每个数据点乘以相应的权重,然后求和并除以权重总和。
离散趋势的度量:
1. 方差(Variance):计算每个数据点与平均值的差的平方,然后求平均值。
2. 标准差(Standard Deviation):方差的平方根,用于衡量数据点与平均值之间的差异程度。
3. 平均绝对偏差(Mean Absolute Deviation,简称MAD):计算每个数据点与平均值的绝对值的平均值。
4. 四分位间距(Interquartile Range,简称IQR):将数据按照大小排序,并计算上四分位数和下四分位数之间的差距。
这些统计学度量方法能够帮助我们更好地理解数据的集中趋势和离散趋势,从而
对数据进行更准确的描述和分析。
最常见的集中趋势测量
最常见的集中趋势测量
常见的集中趋势测量包括:
1. 平均数(Mean):所有数据的总和除以数据的个数,用于描述数据的平均水平。
2. 中位数(Median):将数据按照大小排序,中间位置的数值,用于描述数据的中间水平。
3. 众数(Mode):在一组数据中出现次数最多的数值,可能存在多个众数,用于描述数据的集中程度。
4. 加权平均数(Weighted Mean):每个数据点乘以它所对应的权重,然后将所有乘积的总和除以权重的总和。
这些测量方法可以帮助我们了解数据的分布和集中趋势,并且在不同的情况下选择适当的测量方法以便更好地理解数据。
测量数据的集中趋势的指标
测量数据的集中趋势的指标
测量数据的集中趋势可以通过以下指标来衡量:
1. 平均数(mean):将所有数据相加再除以数据的个数,可以表示数据的“平均水平”。
2. 中位数(median):将数据按照大小顺序排列,取中间的值,可以表示数据的“中间水平”。
如果数据个数为奇数,则中位数就是中间的那个数;如果数据个数为偶数,则中位数为中间两个数的平均值。
3. 众数(mode):出现次数最多的值,可以表示数据的“最常见水平”。
4. 加权平均数(weighted mean):对数据进行加权处理后计算平均数,可以根据不同数据的重要性来计算平均值。
5. 几何平均数(geometric mean):将所有数据相乘后取开根号,可以用于计算增长或比率的平均值。
6. 调和平均数(harmonic mean):将每个数据的倒数取平均值的倒数,可以用于计算速度或其他逆数的平均值。
这些指标可以帮助了解数据的集中趋势,但在不同情况下,选择合适的指标会有
所不同,因此需要根据具体的数据和目标进行选择。
集中趋势的度量包括
集中趋势的度量包括集中趋势是描述或度量数据集中分布程度的统计指标。
常用的集中趋势度量包括均值、中位数和众数。
下面将详细介绍这些度量。
1. 均值(Mean)是最常用的集中趋势度量。
均值是指将所有数据值相加后再除以数据个数得到的结果。
均值的计算公式为:均值= 总和/ 数据个数。
均值对于连续型数据或近似服从正态分布的数据非常有用。
它具有对异常值比较敏感的特点,即一个异常值会显著影响整体均值。
例如,如果一个班级中大部分学生的身高在150cm到170cm之间,但有一个学生身高达到190cm,那么班级的平均身高就会被这个异常值拉高。
2. 中位数(Median)是将数据集按照大小排序后,处于中间位置的数值。
中位数可以较好地反映数据的中间位置,不受极端值的影响。
中位数的计算方法为:若数据个数为奇数,中位数即为排序后的中间值;若数据个数为偶数,中位数为排序后的中间两个数的平均值。
中位数适用于有序离散型和有序连续型数据。
3. 众数(Mode)是指数据集中出现频率最高的数值。
众数对于描述离散型数据的分布特征非常有用。
一个数据集可以有一个或多个众数,也可以没有众数。
当数据集中存在多个众数时,称为多模态分布。
例如,如果有一组数据{3, 4, 4, 6, 7, 7, 9},其中4和7出现的频率最高,那么4和7都是众数。
众数不受极端值的影响,因为众数只关注出现次数最多的数值。
除了上述常用的集中趋势度量,还有其他的度量方法,如加权平均值、四分位数、三分位数等。
这些度量方法在特定场景下可以提供更精确或更全面的集中趋势度量。
总结起来,集中趋势的度量方法包括均值、中位数和众数。
均值适用于连续型数据,但对异常值敏感;中位数适用于有序离散型和有序连续型数据,不受极端值影响;众数适用于描述离散型数据的出现频率。
选择合适的集中趋势度量方法需要考虑数据类型、数据分布和分析目的等因素。
集中趋势的最主要测度
集中趋势的最主要测度集中趋势是统计学中用来衡量一组数据的中心或平均位置的指标。
它能够向我们展示数据的分布情况,了解数据集中的趋势和位置。
在数据分析和统计推断中,集中趋势是非常重要的,因为它能够帮助我们理解数据的特征和特性,从而进行更深入的分析和推断。
在统计学中,常用的集中趋势的测度有均值、中位数和众数。
这些测度在描述数据的中心位置时起着不同的作用,各自具有其独特的优势和适用范围。
首先,均值是一组数据的平均值,通常用来表示数据的总体中心位置。
求取均值的方法是将所有数据相加,然后除以数据的个数。
均值的优点在于它能够充分利用所有数据,对数据的全局位置给出了一个较为准确的估计。
然而,均值容易受到极端值的干扰,它可能不够稳定,因此在应用中需要谨慎使用。
其次,中位数是一组数据中位于中间位置的数值,是将数据按大小顺序排列后,位于中间位置的数值。
中位数的优势在于它不受极端值的影响,能够比较准确地描述数据的中心位置。
特别是在存在异常值或者数据分布不均匀的情况下,中位数更适合用来描述数据的集中趋势。
最后,众数是一组数据中出现次数最多的数值。
众数的优势在于能够反映数据集中的分布情况,特别适用于描述离散型数据的集中趋势。
在实际应用中,众数通常用来描述最常出现的数值,对于描述数据的分布情况有一定的参考价值。
除了这些常用的集中趋势的测度外,还有一些其他的指标可以用来描述数据的中心位置,比如加权平均数等。
不同的测度在不同的情况下有其适用的范围和优势,需要根据具体的数据特点和应用需求来选择合适的测度。
在实际应用中,我们通常会根据数据的特点和分布情况选择合适的集中趋势的测度。
如果数据的分布情况较为均匀,没有太多的极端值,可以选择均值作为集中趋势的测度。
如果数据有较多的极端值或者分布不够均匀,可以选择中位数作为集中趋势的测度。
对于离散型数据,可以使用众数来描述数据的集中趋势。
在实际应用中,集中趋势的测度有助于我们更好地理解数据的分布情况和特点,为后续的分析和推断提供了重要的依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
64+70+L 78+75 3089 + X= = =77.23 40 40
(三)、加权算术平均数 )、加权算术平均数(Weighted 加权算术平均数 arithmetic mean) 当数据资料比较多, 当数据资料比较多,且已编制成变量数列的 情况下,就要计算加权算术平均数, 情况下,就要计算加权算术平均数,以反映 总体中各总体单位某一数量的情况。 总体中各总体单位某一数量的情况。
公式为: 公式为: X=(X1f1+X2f2+…+Xnfn)/(f1+f2+…+fn)=∑X ifi/∑fi 其中: 为权数 为权数, 其中:f为权数,即变量在总体中出现的次 数。
由于变量数列可分为单项数列(单项分组) 由于变量数列可分为单项数列(单项分组)和组距 数列(组距分组), 数列(组距分组), 计算加权算术平均值的方法也有两种: 计算加权算术平均值的方法也有两种: ①由单项分组资料求算术平均值 计算公式为: 计算公式为: X = ∑Xifi / ∑fi 例如: 例如:P48 例2 ②由组距分组资料求算术平均值 计算公式为: 计算公式为: X = ∑Xmid*f /∑f 其中: 表示各组组中值, 表示每组次数。 其中:Xmid表示各组组中值,f表示每组次数。 表示各组组中值 表示每组次数 注意:组中值是假定值(近似值),与实际有差距, ),与实际有差距 注意:组中值是假定值(近似值),与实际有差距, 但误差很小。 但误差很小。
二、作用 1、反映总体各单位变量分布的集中趋势和一般水 、 说明社会现象在一定历史条件下的共同性质。 平,说明社会现象在一定历史条件下的共同性质。 如用家庭户平均人数说明家庭结构的一般性质。 如用家庭户平均人数说明家庭结构的一般性质。 2、便于比较同类现象在不同单位间的发展水平, 、便于比较同类现象在不同单位间的发展水平, 对社会现象的特征能够从数量方面在空间上进行比 如不同省份家庭户平均人数不同, 较。如不同省份家庭户平均人数不同,说明不同省 份家庭观念不同。 份家庭观念不同。 3、对社会现象的特征能够从数量方面在时间上进 、 行比较, 行比较,能够比较同类现象在不同时期的发展变化 趋势或规律。 趋势或规律。 4、分析社会现象之间的相互依存关系。如生活水 、分析社会现象之间的相互依存关系。 平的高低与家庭人口数的多少成反方向变化。 平的高低与家庭人口数的多少成反方向变化。
[例3.5] 某公司所属 个企业资金利润率分组 例 某公司所属10个企业资金利润率分组 资料如表3.4,要求计算该公司10个企业的平 资料如表 ,要求计算该公司 个企业的平 均利润率。 均利润率。 表3.4 某公司所属10个企业资金利润率分 某公司所属 个企业资金利润率分 组资料
该例子的平均对象是各企业的资金利润率, 该例子的平均对象是各企业的资金利润率, 表中的企业数虽然是次数或频数, 表中的企业数虽然是次数或频数,但却不是 合适的权数。要正确计算公司10个企业的平 合适的权数。要正确计算公司 个企业的平 均资金利润率,因为资金利润率=利润总额 利润总额/ 均资金利润率,因为资金利润率 利润总额 资金总额, 资金总额,所以计算平均资金利润率需要以 资金总额为权数,才能符合该指标的性质。 资金总额为权数,才能符合该指标的性质。 因此,该公司10个企业的平均利润率为 个企业的平均利润率为: 因此,该公司 个企业的平均利润率为:
根据分组整理的数据计算算术平均数, 根据分组整理的数据计算算术平均数,就要 以各组变量值出现的次数或频数为权数计算 加权的算术平均数。设原始数据被分成组, 加权的算术平均数。设原始数据被分成组, 各组的变量值为…, 各组的变量值为 ,各组变量值的次数或频 数分别为…,则加权的算术平均数为: 数分别为 ,则加权的算术平均数为:
第二节 平均数 一、算术平均数 )、定义 算术平均数(Arithmetic mean)也称为均值 定义: (一)、定义:算术平均数 也称为均值 (Mean),是全部数据算术平均的结果。算术平均法是计算 ,是全部数据算术平均的结果。 平均指标最基本、最常用的方法。计算公式为: 平均指标最基本、最常用的方法。计算公式为: 算术平均数 = 总体标志总量 /总体单位总量 总体单位总量 = (X1+X2+X3+……+Xn )/N = ∑Xi/N 其中: 为连加符号 为连加符号; 为总体单位数 为总体单位数。 其中:∑为连加符号; N为总体单位数。
第四章 集中趋势测量法
本章主要内容: 本章主要内容:
集中趋势的测定方法( 集中趋势的测定方法(重、难点) 难点) 平均数、中位数、众数的比较(重点) 平均数、中位数、众数的比较(重点)
第一节 集中趋势的含义及作用
一、集中趋势的含义 指一组数据向某一个典型值或代表值集中的情况。 指一组数据向某一个典型值或代表值集中的情况。如 大部分学生是女生” 平均年龄为24 24岁 “大部分学生是女生”、“平均年龄为24岁”等。主 要形式有:平均数、中位数、众数。 要形式有:平均数、中位数、众数。 一组数据向其中心值靠拢的倾向和程度。 一组数据向其中心值靠拢的倾向和程度。 测度集中趋势就是寻找数据一般水平的代表值或中心 值。 不同类型的数据用不同的集中趋势测度值。 不同类型的数据用不同的集中趋势测度值。 低层次数据的集中趋势测度值适用于高层次的测量数 反过来, 据,反过来,高层次数据的集中趋势测度值并不适用 于低层次的测量数据。 于低层次的测量数据。 选用哪一个测度值来反映数据的集中趋势, 选用哪一个测度值来反映数据的集中趋势,要根据所 掌握的数据的类型来确定。 掌握的数据的类型来确定。
k
x =
x1 f1 + x 2 f 2 + L + x k f k = f1 + f 2 + L + f k
∑
i=1 k
xi fi fi
∑
i=1
[例3.4] 根据例 提供的 名同学的统计学 例 根据例3.3提供的 提供的40名同学的统计学 成绩原始资料分组整理如表3.1—3,根据此 成绩原始资料分组整理如表 , 表资料计算平均成绩。 表资料计算平均成绩。 40名同学统计学成绩汇总表 表3. 3 名同学统计学成绩汇总表
很多社会经济现象, 很多社会经济现象,总体标志总量常常是总体单位 变量值的算术总和。例如, 变量值的算术总和。例如,工人工资总额是总体中 每个工人工资的总和, 每个工人工资的总和,某地区小麦总产量是所有耕 地小麦产量的总和。 地小麦产量的总和。在总体标志总量和总体单位总 x − bar 量的基础上,就可以计算平均指标。 量的基础上,就可以计算平均指标。 算术平均数在统计学中具有重要的地位, 算术平均数在统计学中具有重要的地位,是集中趋 势的最主要度量值,通常用( 表示。 势的最主要度量值,通常用(读作 x − bar)表示。根 x 据所掌握数据形式的不同, 据所掌握数据形式的不同,算术平均数有简单算术 平均数和加权算术平均数。 平均数和加权算术平均数。
根据( 根据(3.12)式得 )
K
x
=
∑
x
i = 1 K
i
f
i
i
=
∑
f
3 0 6 0 4 0
= 7 6 .5
i = 1
根据(3.12)式计算的平均成绩是76.5分, 根据( )式计算的平均成绩是 分 而与根据( 而与根据(3.11)式计算的平均成绩 )式计算的平均成绩77.23分 分 相比,相差0.73分,显然 相比,相差 分 显然77.23分是准确的平 分是准确的平 均成绩,因为( 均成绩,因为(3.11)式所用的是原始数据 ) 的全部信息。 的全部信息。而(3. 12)式是用各组的组中 ) 值代表各组的实际数据, 值代表各组的实际数据,使用代表值时是假 定各组数据在各组中是均匀分布的, 定各组数据在各组中是均匀分布的,但实际 情况与这一假定会有一定的偏差, 情况与这一假定会有一定的偏差,使得利用 分组资料计算的平均数与实际的平均值会产 生误差,它是实际平均值的近似值。 生误差,它是实际平均值的近似值。
i
当我们掌握的权数不是各组变量值出现的频数, 当我们掌握的权数不是各组变量值出现的频数, 而是频率时,可直接根据( 而是频率时,可直接根据(4.3.3)式计算算术 ) 平均数。 平均数。
K
x
=
∑
x
i = 1 K
i
f f
i
i
=
K
∑
x
f
i K
i
∑
i = 1
i = 1
∑
f
i = 1
i
如例3. , 如例 2,根据各组的频数计算的频率分别 为:0.05、0.2、0.4、0.25、0.1,各组频率 、 、 、 、 , 之和为1,则用频率计算的加权算术平均数为: 之和为 ,则用频率计算的加权算术平均数为:
(二)简单算术平均数(Simple arithmetic 简单算术平均数 mean) 未经分组整理的原始数据, 未经分组整理的原始数据,其算术平均数的 计算就是直接将一组数据的各个数值相加除 以数值个数。设统计数据为…, 以数值个数。设统计数据为 ,则算术平均 数的计算公式为: 数的计算公式为:
n
K
x=
∑x f
i =1 K
i i
∑fБайду номын сангаас
i =1
5%× 40 +10%×80 +15%×140 31 = = =11.9% 40 + 80 +140 260
i
(四)算数平均数的数学性质 算术平均数在统计学中具有重要的地位, 算术平均数在统计学中具有重要的地位,它是进行统计分析 和统计推断的基础。从统计思想上看, 和统计推断的基础。从统计思想上看,算术平均数是一组数 据的重心所在, 据的重心所在,它是消除了一些随机因素影响后或者数据误 差相互抵消后的必然性的结果。例如每年分季度的观测数据, 差相互抵消后的必然性的结果。例如每年分季度的观测数据, 各年同季的数据由于受一些偶然性随机因素的影响, 各年同季的数据由于受一些偶然性随机因素的影响,其数值 表现出一定的差异性,但将各年同季的数据加以平均, 表现出一定的差异性,但将各年同季的数据加以平均,计算 的算术平均数,就消除了一些随机因素的影响, 的算术平均数,就消除了一些随机因素的影响,反映出季节 变动必然性的数量特征。再如,对同一事物进行多次测量, 变动必然性的数量特征。再如,对同一事物进行多次测量, 由于测量误差所致,或者其它因素的偶然影响, 由于测量误差所致,或者其它因素的偶然影响,使得测量结 果不一致,但利用算术平均数作为其代表值, 果不一致,但利用算术平均数作为其代表值,则可以使误差 相互抵消,反映出事物固有的数量特征。另外, 相互抵消,反映出事物固有的数量特征。另外,算术平均数 具有下面一些重要的数学性质, 具有下面一些重要的数学性质,这些数学性质在实际中有着 广泛的应用,同时也体现了算术平均数的统计思想。 广泛的应用,同时也体现了算术平均数的统计思想。