我的统计学课件第三章统计分析的综合指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
组中值 (Xi)
107.5 112.5 117.5 122.5 127.5 132.5 137.5 —
频数 (Fi)
3 5 8 14 10 6 4 50
| Xi- X |
15.7 10.7 5.7 0.7 4.3 9.3 14.3 —
|Xi-X |Fi
47.1 53.5 45.6 9.8 43.0 55.8 57.2 312
1. 2. 3. 4. 5. 集中趋势的测度值之一 N 个变量值乘积的 N 次方根 适用于特殊的数据 主要用于计算平均发展速度 计算公式为
GM N X 1 X 2 X N N X i
i 1 N
例:一位投资者持有一种资金,1996年、1997 年、1998年和1999年收益率分别为4.5%、 2.0%、3.5%、5.4%。计算该投资者在这 四年内的平均收益率。
MD
X
i 1
K
i
X Fi
i
F
i 1
K
312 6.24 (个) 50
方差和标准差
1. 离散程度的测度值之一
2.别反映了各变量值与均值 的平均差异
总体方差和标准差
方差的计算公式 未分组数据: 组距分组数据:
2
2
(X
i 1
N
i
X)
2
(X
i 1
Q 处于 (1 4 1) / 4 3.7 5
L
Q 1 2.4 6 0.7 5(1 3.8 0 1 2.4 6)
L
Q 处于 3(1 4 1) / 4 1 1.2 5
U
Q 2 1.4 9 0.2 5( 2 2.4 7 2 1.4 9)
U
众数、中位数和均值的 比较
(简化计算公式) 总体方差
方差
2
(X
i 1
N
i
X)
2
样本方差
2 n 1
N
2
n
X
i 1
N
2 i
N
2 i
X
n
2
S
( xi x ) x xi i 1 i 1 i 1 n 1 n 1 n(n 1)
n
2
(数学性质)
无众数 原始数据:
一个众数 原始数据:
10 6 5 5 9 12 9 8 6 5 8 5
多于一个众数 原始数据: 25 28 28 36 42 42
中位数 (概念要点)
1.集中趋势的测度值之一 2.排序后处于中间位置上的值
50% 50%
Me
3.不受极端值的影响
中位数 (位置的确定)
N 1 中位数位置 2 (未 分 组 数 据 )
偏态与峰度
农村居民家庭村收入数据的直方图
25
户 数 比 重 (%)
20 15 10
结论:1. 为右偏分布 2. 峰度适中
计算50 名工人日加工零件数的中位数
50 16 2 M e 120 5 123.21(个) 14
分位数
Q 位 置 ( n 1) / 4
L
Q 位 置 3( n 1) / 4
U
例:按大小顺序排列的14只3年 期低风险基金的年回报数据
9.77 15.47 18.61 31.50 11.35 12.46 17.48 18.37 20.72 21.49 38.16 13.80 18.47 22.47
某日三种蔬菜的批发成交数据
蔬菜名称 批发价格 购买金额 (元) (元)) 甲 乙 丙 合计 1.2 0.5 0.8 __ 1 1 1 3
某日三种蔬菜的批发成交数据 蔬菜名称 甲
乙 丙 合计
批发价格 成交额(元) (元) 1.2
0.5 0.8 __
18000
12500 6400 36900
3.几何平均数
第三章 统计分析的综合指标
3.1 总量指标
1.总量指标的概念 2.总量指标的种类 按反映的时间不同 时期总量指标与时点总量指标 按反映的内容不同 总体标志总量指标与总体单位总量指标 按计量单位的不同 实物指标、价值指标、劳动量指标
3.国民经济中几个常用的总量指标 国内生产总值(GDP) 国民总收入(GNI) 国民生产总值(GNP) 增加值
MD
X
i 1
N
i
X
N
组距分组数据 M D
X
i 1
K
i
X Fi
i
F
i 1
K
根据表中的数据,计算工人日加工零件数的平均差
某车间50名工人日加工零件标准差计算表
按零件数 分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计
按零件数分组 组中值(Xi) 频数(Fi)
105~110 110~115 115~120 120~125 125~130 130~135 135~140 107.5 112.5 117.5 122.5 127.5 132.5 137.5 3 5 8 14 10 6 4
XiFi
322.5 562.5 940.0 1715.0 1275.0 795.0 550.0
1.各变量值对均值的方差小于对任
方差
意值的方差
设X0为不等于X 的任意数,D2为对X0 的方差,则
D
2
(X
i 1
N
i
X0)
2
N
X X 0
2
2
相对离散程度:离散系数
(概念要点和计算公式)
离散系数
1. 标准差与其相应的均值之比
2. 消除了数据水平高低和计量单位 的影响 3. 测度了数据的相对离散程度
K
i K
X ) Fi
2 i
N
F
i 1
标准差的计算公式:
(X
i 1
N
i
X)
2
N
(X
i 1
K
i K
X ) Fi
2 i
F
i 1
根据表中的数据,计算工人日加工零件数的标准差
某车间50名工人日加工零件标准差计算表
按零件数分 组中值(Xi) 频数(Fi) (Xi- X )2 组 105~110 107.5 3 246.49 110~115 112.5 5 114.49 115~120 117.5 8 32.49 120~125 122.5 14 0.49 125~130 127.5 10 18.49 130~135 132.5 6 86.49 135~140 137.5 4 204.49 50 — — 合计 (Xi- X )2Fi 739.47 572.45 259.92 6.86 184.90 518.94 817.96 3100.5
7
8
9
10
7
8
9
10
5. 计算公式为 未分组数据 R = max(Xi) - min(Xi) 组距分组数据 R= 最高组上限 - 最低组下限
平均差
1. 离散程度的测度值之一 2. 各变量值与其均值离差绝对值的平 均数 3. 能全面反映一组数据的离散程度 4. 数学性质较差,实际中应用较少
5. 计算公式为: 未分组数据
结论: 计算结果表明,V1<V2 ,说明产品销
售额的离散程度小于销售利润的离散程度
数据类型和所适用的离散程度测度值
数据类型 分类数据 ※异众比率 顺序数据 ※四分位差 异众比率 数值型数据 ※方差或标准差 ※离散系数(比较时用)
适 用 的 测 度 值
—
—
— — —
—
— — —
平均差
极差 四分位差 异众比率
合计
—
50
6160.0
某车间100名工人加工某种零件的日产 量资料
按日产量分 职工人 组中值 组 数 (件)
5以下 5-7 7-9 9以上 20 35 30 15 4 6 8 10
各组总 产量(件)
80 210 240 150
合计
100
__
680
2.调和平均数
(1) 简单调和平均数 (2) 加权调和平均数
4. 用于对不同组别数据离散程度的 比较
5. 计算公式为
V X
S 或 Vs x
某管理局抽查了所属的8家企业,其产品销售数 据如表。试比较产品销售额与销售利润的离散程度 某管理局所属8家企业的产品销售数据 企业编 号 1 2 3 4 5 6 7 8 产品销售额(万元) X1 170 220 390 430 480 650 950 1000
)
销售利润(万元)X2
8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0
(计算结果)
X1=536.25(万元) S1=309.19(万元)
309.19 =0.57 V1= 536.25 7 X2=32.5215(万元)
离散系数
S2=23.09(万元)
23.09 V2= =0.710 32.5215
2.采用下列近似公式计算:
Me N S m 1 L 2 i fm
3.该公式假定中位数组的频数在该组内
均匀分布
表 某车间50名工人日加工零件数分组表
按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 —
4.3 偏态与峰度的测度
一. 偏态及其测度 二. 峰度及其测度
偏
态
偏态与峰度分布的形状
偏态
左偏分布
右偏分布
峰度
扁平分布
尖峰分布
偏态
1. 数据分布偏斜程度的测度
2. 偏态系数=0为对称分布
3. 偏态系数> 0为右偏分布
4. 偏态系数< 0为左偏分布
偏态系数大于1或小于-1,被称为高 度偏态分布;偏态系数在0.5~1或0.5~-1之间,被认为是中等偏态分 布;偏态系数越接近0,偏斜程度 就越低
1.2 相对指标
1.计划完成情况相对指标 2.结构相对指标 3.比例相对指标 4.比较相对指标 5.强度相对指标 6.动态相对指标
数据分布的特征
集中趋势
(平均数)
离中趋势
(离散程度)
偏态和峰度
(变量分布状
况形状)
数据的特征和测度
集中趋势
众 数 中位数
离散程度
分布的形状
均 值
异众比率 四分位差 方差和标准差 离散系数
1 1 2 2 N N K i 1 i 1 2 N K i 1 i
i
简单平均值
原始数据: 10 5 9 13 6 8
X1 X 2 X 3 X 4 X 5 X 6 X N 6 10 5 9 13 6 8 6 8.5
i 1 i
X
N
根据表中的数据,计算50 名工人日加工零件数的均值 某车间50名工人日加工零件均值计算表
众数、中位数和均值的关系
均值 中位数 众数
左偏分布
均值
= 中位数
= 众数
对称分布
众数
中位数
均值
右偏分布
3.5 离散程度的测度
一.分类数据:异众比率
二.顺序数据:四分位差
三.数值型数据: 极差 平均差 方差和标准差
极差
1. 2. 3. 4. 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布
N 中位 数位置 2 (对于 分类数据 或分组数 ) 据
数值型未分组数据的中位数
原始数据: 排 序: 位 置: 24 20 1 22 21 2
21 22 3
26 24 4
20 26 5
N 1 5 1 位置 3 2 2 中位数 22
数值型分组数据的中位数
1.根据位置公式确定中位数所在的组
GM N X 1 X 2 X N 104.5% 102.0% 103.5% 105.4%
4
103.84%
平均收益率=103.84%-1=3.84%
3.4 位置平均数
众数
1. 2. 3.
出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数
Fra Baidu bibliotek
众数 (众数的不唯一性)
5. 计算公式为
3
X
K i 1
i
X Fi
3 3
N
已知1997年我国农村居民家庭按纯收入分组的有 关数据如表。试计算偏态系数
1997年农村居民家庭纯收入数据 按纯收入分组(元) 500以下 500~1000 1000~1500 1500~2000 2000~2500 2500~3000 3000~3500 3500~4000 4000~4500 4500~5000 5000以上 户数比重(%) 2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94
偏 态
峰 度
3.3 平均指标
算数平均数
设一组数据为:X1 ,X2 ,… ,XN 简单均值的计算公式为:
X X X X X N N
1 2 N N i 1
i
设分组后的数据为:X1 ,X2 ,… ,XK
相应的频数为:
F1 , F2,… ,FK
加权均值的计算公式为:
XF X F X F X F X F F F F