统计数据的描述:平均指标和变异指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中位数计算结果
解:中位数所在位次由累计次数可知: ∑f/2=100/2=50,根据累计次数,中位数组为第三组 1600—1700。 其中L=1600,U=1700,Sm-1=10+16=26, fm=35, d=100, ∑f − s = L+ 2 •d 下限公式: M 下限 f =1600+[(50-26)/35] ×100 =1668.57(元) ( ) ( ∑f − 上限公式: 上限 2 s •d M =X − f
600—700 30 650 19500 -180 32400 972000 700—800 50 750 37500 -80 6400 320000 800—900 70 850 59500 20 400 28000 900—1000 30 950 28500 120 14400 432000 1000以上 20 1050 21000 220 48400 968000 以上 200 — 166000 — — 2720000 合计
二、标准差系数 (Coefficient of variation)
含义: 含义:
是指用标准差与其相应的均值(即平均数 对比 是指用标准差与其相应的均值 即平均数)对比,是测 即平均数 对比, 度数据之间离散程度的相对指标,一般用V表示 表示。 度数据之间离散程度的相对指标,一般用 表示。由于标 准差是应用最广泛的离散程度指标,所以,通常计算标 准差是应用最广泛的离散程度指标,所以, 准差系数,常用V 表示。 准差系数,常用 σ 表示。
—————————————————————— ∑ xf
月平均工资: 月平均工资: 方差: 方差:
σ=
x=
∑f
=166000/200=830(元); (
∑(x−x) f ∑f
2
=(2720000/200)1/2 =116.6(元) =116.6(
课堂练习题
———————————————— 成绩分组(分) 学生数(人) ———————————————— 60以下 6 以下 60—70 17 70—80 20 80—90 10 90—100 7 60 合计 ————————————————— 根据上表资料,计算学生平均成绩、成绩的中位数、 根据上表资料,计算学生平均成绩、成绩的中位数、 众数、标准差等指标(要求列出计算表)。 众数、标准差等指标(要求列出计算表)。
一、标准差
(一)含义: 一 含义:
方差: 方差:是总体中每个标志值与这些数值的平均数离差平方 的平均数,常用σ 的平均数,常用σ2表示 。 标准差: 标准差:是总体每个标志值与这些数值平均数离差平方的 平均数的平方根,又称均方差,常用σ表示。 平均数的平方根,又称均方差,常用σ表示。
(二)计算: 计算:
根据上述资料计算该银行为每家企业的平均贷款额为:
x=
∑ xf ∑f
=
2620 = 26.2万元 100
例:权数是相对数的组距数列的
加权平均数的计算:
按贷款额分 组 (万元) 10 以下 10-20 20-30 30-40 40 以上 合计 某银行某年某月为 100 家企业贷款情况表 比重(%) f 组中值(万元) 贷款企业数(个) x (万元) f x f ∑f ∑f 5 15 25 35 45 — 20 10 22 34 14 100 20 10 22 34 14 100 1.0 1.50 5.50 11.90 6.30 26.20
计算结果
——————————————————
按亩产分组 千克) (千克) 播种面积比重 (%)f/Σf ) 组中值 X X (f/Σf) )
—————————————————— 200以下 8 170 13.60 200—250 35 225 78.75 250—400 45 325 146.25 400以上 12 475 57.00 ——————————————————
x = ∑ (x •
f
∑f
) = 295.60
二、交替标志平均数
交替标志:即某些标志只具有两个表现。 交替标志:即某些标志只具有两个表现。 人的“性别” 如,人的“性别”标志只有男和女两个表 现;产品质量标志有合格和不合格两个表 现。 交替标志的平均数:在交替标志的总体中, 交替标志的平均数:在交替标志的总体中, 具有某种属性的成数P就是其加权算术平 具有某种属性的成数 就是其加权算术平 均数。详细内容见教材第66-67页。 均数。详细内容见教材第 页
xG
f 1 f 2... f n
x
1
f1
x
2
f 2 ...
f n f f xn x
例如,某银行有一笔投资是按复利计算的,投资 期限是15年,期间年利率分配如下:有1年为 3%,有4年为8%,有7年为10%,有3年为15%。 试求银行该项投资的平均年利率。
几何平均数计算
解:此题计算平均年利率 年利率,必须先将其换算成 年利率 年本利率,然后采用加权几何平均数方法求得 平均年本利率,再减去100%后得到平均年利率。 f f f f • f • ... f = ∑ π = x x x x x
标准差计算:举例
——————————————————————
月工资( 职工人数( ) 组中值( ) 月工资(元) 职工人数(f) 组中值(x) xf
(1) )
(2) )
(3) )
x-830 ( x-830 )2 ( x-830 )2 f (4) (5) ) ) (6) ) (7) )
——————————————————————
一、算术平均数
(一)基本公式: 基本公式: (二)计算方法 1.简单算术平均数: 简单算术平均数: 简单算术平均数 + + ... + x x= x x 各个单位标志值(即观察值) n 各个单位标志值(即观察值)之和除以相 应的总体单位 即数值个数) 数(即数值个数) 2.加权算术平均数: 加权算术平均数: 加权算术平均数 x f + x f + ... + x f = ∑ xf x= ∑f 方法一:权数( )为绝对数( 方法一:权数(f)为绝对数(见P63)f + f + ... + f ) f x = ∑ (x • 方法二:权数( 方法二:权数(f/∑f)为相对数(见P64) ∑ f ) )为相对数( )
1
+
2
+...+
n
1
2
n
f
f
G
1
2
n
=(1.031 × 1.084 × 1.107 × 1.153)1/15 ( =1.0996(或109.96%) ( )
则该银行这项投资的平均年本利率为 109.96%,平均年利率为9.96%
四、众数(Mode)(P69)
含义:一组数据中 含义:一组数据中出现次数最多的数值,也即 是数列中重复出现次数最多的数值,通常用Mo 表示。 适用条件:n 较多且有明显集中趋势时适合用众 适用条件 数作为总体一般水平。 确定或计算方法: 确定或计算方法:
mBiblioteka Baidu−1 e m
m+1 e u m
=1700-[(50-39)/35] ×100 =1668.57(元) ( ) (
解:仍以上题为例,由于第三组职工工资出现的次数 (人数)最多(35人),则该组(1600—1700)为众 数组, 其中,L=1600,U=1700,d=100, △1=35-16=19 , △2=35-21=14, 代入公式: = X l + ∆1 • d Mo 下限公式: 下限 ∆1 + ∆2 =1600+[19 /( 19+14)] ×100 =1657.6(元) ( ) ( 上限公式: 上限 = − ∆2 • d
三、几何平均数
含义:是N个变量值连乘积的N次方根。几何平均 含义 数常用来计算平均比率和平均速度。 平均比率和平均速度。 计算方法: 计算方法
1.简单几何平均数: x 简单几何平均数: 简单几何平均数 2.加权几何平均数: 加权几何平均数: 加权几何平均数
=n G
x •x
1
• ... xn = n πx 2
第四章教学要求
主要介绍统计分布的集中趋势(平均指标)和 统计分布的离散趋势(变异指标)两个主要内 容。其中,前者主要介绍算术平均数、几 何平均数、中位数和众数的计算方法,尤 其要掌握算术平均数的计算方法和应用。 后者主要介绍标准差、标准差系数的计算 方法,其中,重点是标准差的计算和应用。
第四章 统计数据的描述 第一节 统计分布的集中趋势
适用条件: 适用条件:
若判断数据的离散程度或评价平均数代表性的大小, 若判断数据的离散程度或评价平均数代表性的大小, 当两个总体的平均数大小不等时, 当两个总体的平均数大小不等时,需要计算标准差系数 来评价,标准是:系数V 则离散程度大,而平均数 来评价,标准是:系数 σ大,则离散程度大 而平均数 代表性弱; 则离散程度小,而 代表性弱;系数V σ小,则离散程度小 而平均数代表性强。
根据上述资料计算该银行为每家企业的平均贷款额为:
x = ∑x f
∑
f
= 26.2万元
某县粮食生产情况如下,试计算 该县平均亩产
——————————————————
按亩产分组 千克) (千克) 播种面积比重 (%)f/Σf )
—————————————————— 200以下 8 200—250 35 250—400 45 400以上 12 ——————————————————
1 2 n
1 1 2 2 n n 1 2 n
例:权数是绝对数的组距数列的
加权平均数的计算:
按贷款额分组 (万元) 10 以下 10-20 20-30 30-40 40 以上 合计 某银行某年某月为 100 家企业贷款情况表 组中值(万元) 贷款企业数(个) 各组贷款额(万元) x f xf 20 ???? ???? 15 10 150 25 22 550 35 34 1190 14 ???? ???? 100 2620 —
例1 中位数和众数计算
———————————————————
月工资(元)职工人数(f ) 累计次数 组中值(x) xf ————————————————————————— 1500以下 10 10 1450 14500 1500—1600 16 26 1550 24800 1600—1700 35 61 1650 57750 1700—1800 21 82 1750 36750 1800—1900 11 93 1850 20350 1900以上 7 100 1950 13650 合计 100 —— —— 167800 ———————————————————————
1.未分组资料:(简单法) 1.未分组资料:(简单法) 未分组资料:(简单法 2.分组资料: (加权法) 2.分组资料: 加权法) 分组资料
σ=
σ=
∑ ( x − x)
n
2
计算步骤: 计算步骤:
∑ ( x − x) ∑f
2
f
①平均数 x 离差( ②离差(xi- ) x 离差平方乘以相应次数( ③离差平方乘以相应次数(xi- )2x fi 代入上述计算公式即可得到方差σ ④代入上述计算公式即可得到方差σ2 ,再对其开平方即可得到
1.单项式分组资料:可以直接观察,即出现次数最多 单项式分组资料:可以直接观察, 单项式分组资料
的数值; 的数值;
2.组距式分组资料:先找出 众数所在组 组距式分组资料: 组距式分组资料
后通过公式近似计算 公式近似计算
然
接前页:中位数确定方法
1.未分组资料 未分组资料:排序 确定位置(n +1)/2 未分组资料 若n为奇数项,则居中点位置的数值即为中位数; 若 n为偶数项,则居中的两个数值的平均数为中位 数。 2.单项式分组资料 单项式分组资料:累计次数 确定中位数 单项式分组资料 位置(∑f/2) 直接观察找出中位数。 3 .组距式分组资料 组距式分组资料:前两步骤同上,找到中位数所 组距式分组资料 在位置 根据公式(下限或上限)求出中位数 的近似值。
众数计算结果 众数
M
o
X
u
∆ +∆
1
2
=1700-[14/( 19+14)] ×100 =1657.6(元) ( ) (
第二节 统计分布的离散趋势
离散趋势的意义和作用:是反映总体内各 个数值之间远离平均数的程度 程度的指标。它与 程度 集中趋势指标结合运用,可以达到对现象总 体的全面认识。 一、标准差和方差 二、标准差系数 三、交替标志的标准差 四、四分位差