统计学第四章第三节
统计学课件 第四章 时间数列
c a b
故对相对数或平均数时间数列计算平均发展水平,只需要对 其的分子、分母分别计算平均发展水平后再相除即可。即:
c a 分子代表分子数列的平均发展水平,分母代表分母数列的平均发展水平 b
(1)分子分母都是时期数列
某企业产值情况
时间
1月
2月
3月
产值计划完成程度(%) 105 100 109.1
计划产值(万)
某市财政收入情况
月份
1
2
3
4
5
6
财政收入 1(a0) 1.1(a1) 1.05(a2) 1.2(a3) 1.22(a4) 1.3(a5) (亿)
逐期增长量 ----
0.1
-0.05
0.15
0.02
0.08
(亿)
累计增长量 -----
0.1
0.05
0.2
0.22
0.3
(亿)
平均增长量=【0.1+(-0.05)+0.15+0.02+0.08】÷5 =0.3÷5=0.06(亿)
100 110 110
实际产值(万)
105 110 120
求该企业第一季度产值平均计划完成程度?
105110 120
c
3 100 110 110
104.69%
3
第二节 时间数列的水平指标
(2)分子分母都是时点数列
某企业员工情况
时间 1月初 2月初 3月初 4月初
男性比重 52
(%)
50.98 49.09 49.07
Ⅰ、资料逐日登记排列形成,用简单算术平均法。即:例:a a
某车间某月1到15日在册人数资料
n
日 期
新编统计学第四章精品PPT课件
如:产品合格率、职工出勤率、人均国 民收入、平均工资、人口密度、计划完 成百分数、甲国的国民生产总值是乙国 的7倍等都是相对指标。
相对指标的作用
1、以相互关联的指标对比,表明现象发展的相对程 度。为人们深入认识事物发展的质量与状况提供客 观依据。 例如,1986年与1990年我国人均国民收入发展状况。
思考题:
时期指标与时点指标具有哪些特点?
时期指标和时点指标的区别
区别之一:指标的数值是否可以相加: 是——时期指标 否——时点指标
区别之二:指标数值的大小是否与时间长度有关: 是——时期指标 否——时点指标
区别之三:取得资料的方法不同: 时期指标的数值必须连续不断累计取得。 时点指标的数值只能间断计数取得。
说 ⒈为无名数; 明 ⒉用来反市1998年—2000年国民经济发展总量和速度指标
指标
总 量 指 标 (亿元)
1998
1999
2000
国内生产 总值
1429.26
1479.71 1589.34
第一产业 298.67 284.28 283.00
第二产业 585.38 604.39 657.51
年度内出生的人口数为8600人。则该地区
人口 出生率
8600 1106
1000‰
8.6‰
有名数的 强度相对数
为用双重计量单位表示的复名数,反 映的是一种依存性的比例关系或协调 关系,可用来反映经济效益、经济实 力、现象的密集程度等。
各组(部分)数值
结构相对指标 =
×100% 总体总量数值
计量单位:无名数,常用百分数 % 形式
统计学原理第4章:数据特征的描述
第四章 数据特征的描述
某公司400名职工平均工资计算表 单位:元
按月工资 组中值 职工
分组
x
人数
f
x f
比重(%)
f
f
①
②
③ ④=②×③ ⑤=③÷ 400
1100以下 1000
60
60000
15
1100-1300 1200 100 120000
25
1300-1500 1400 140 196000
35
分组
职工 人数
f
x f
①
1100以下 1100-1300 1300-1500 1500-1700 1700以上
②
1000 1200 1400 1600 1800
③ ④=②×③
60
60000
100 120000
140 196000
60
96000
40
72000
人数为权数
x x f f
544000 400
算术平均数、调和平均数、中位数、众数、几何平均数
3. 各种平均数的Excel操作
24/77
1. 集中趋势的含义
第四章 数据特征的描述
集中趋势是一组数据向其中心值靠
拢的倾向和程度
测度集中趋势就是寻找数据一般水
平的代表值或中心值
中心值 即:平均水平
▲
25/77
2. 集中趋势的度量方法
第四章 数据特征的描述
第四章 数据特征的描述
《统计学原理》(第3版)
第四章 数据特征的描述
学习目标
第一节 总量与相对量的测度 第二节 集中趋势的测度 第三节 离散程度的测度
2/77
第一节 总量与相对量的测度
统计学-统计四章 71页PPT文档
(五)强度相对指标强度相对指标是指两个性质不同但有一定联系的总 量指标对比所形成的综合指标,其表明现象的强度、密度和普遍 程度。如:人口密度,人均GNP、很多财务比率等
计算公式: 强度相对 另 指一 标有 某联 一系 总而 的 量性 总 指质 量 标不 指 数同 标 值
计量单位表现为两种形式: 一种是复名数,即双重计量单位。在计算这种强度相对指标时,由
GMNX1X2XN 410.54%10.02%10.53%10.45% 10.834%
平均收益率=103.84% - 1 = 3.84%
例4.27 P136 例4.28 P137
IV中位数( )M e
概念:处于中间位置的那个变量值 计算步骤: 1、排序 2、找中间位置:未分组资料: (n+1)/2
分组资料: ∑f/2 3、计算中位数数值:
对于组距数列,要用近似公式计算
下限公式:
上限公式:
f Me L
S 2 m1i f
m
f Me U
S 2 m1i f
m
例4.30 例4.31 例4.32
P139 P139 P141
V众数(
)M O
1、概念:出现次数最多,出现得最频繁的那个 变量值。 2、计算:组距数列情况下
前三者综合指标反映集中的趋势;变异指标反 映离中的趋势;形状指标反映分布的对称程度和 尖峭程度。
第二节集中趋势指标
反映集中趋势的指标包括:总量指标\相对指标和平均指 标.
二、总量指标
是反映现象在一定条件下总体总量、总规模、总水平的 综合指标。
特点:
(1)只有有限总体才能计算总量指标 (2)数值随研究范围的大小而增加或减少 (3)最基 本的指标,是计算其他指标的基础
卫生统计学_第四章_统计表与统计图
死亡率
(a)
200
150
伤寒
100
结核病
50
0
下降幅度:
1950 1952 1954 1956 1958 1960 1962 1964 1966
结核病死亡率:180-38=142
伤寒死亡率:36-0.3=35.7
1000
死 100 亡 10 率
1
0.1
(b)
伤寒
结核病下降速度: 结核病死亡率:180/38=4.65
乡村 阳性 阳性率
数 (‰) 49 4.97 124 8.94 134 15.93 90 15.82 81 20.51 31 20.68 509 11.76
8
3. 统计表制作的基本要求
(1)简明扼要,重点突出,即一张表一般表达一个中心内 容,不要包罗万象。
(2)合理按排主语和谓语的位置,主次分明,条理清楚 统计表就如完整的一句话,包括描述对象/主语和内容/ 谓语。 通常主语放在表的左边,作为横标目; 谓语放在右边, 作为纵标目。由左向右读,构成完整的一句话。
4.绘制条图注意事项
⑴横轴:表示各种被研究的事物或 7
特征.纵轴表示各种被研究事物的相应 6
指标的数值。
5
(2)纵轴的刻度必须从“0”开始, 4 否则会改变各对比组间的比例关系。 3
2
(3)各直条的宽度要一致,各直条应 1
有相等的间隔,其宽度一般与直条的 0
甲
乙
宽度相等或为直条宽度的一半。
图2-10 直条图的纵轴尺度起点必须为零示意图
32
二、半对数线图
1. 概念 是一种特殊的线图,其坐标纵轴是对数尺 度,特别适宜作不同指标变化速度的比较。
2.适用资料 适用于随时间变化的连续性资料,尤其比 较数值相差悬殊的多组资料时采用。
统计学第四章总量指标和相对指标
第四章
以相对数形式计算计划完成程度相对指标
当计划任务以相对数的形式下达时,检查计划完成程度
就用相对数的形式检查。
实际完成程度(%)
公式:计划完成程度(%) = ————————————
计划规定的完成程度(%)
其中:
实际完成程度(%)=
本期实际完成数 ————————
上期实际完成数
计划规定的完成程度(%) = 上—本期—期实—计际—划完—任成—务数—数—
148.06 103.89
1、检查各月产量计划完成情况。 (计算结果见上表) 2、检查累计至二月份的产量计划完成程度情况。 3、简要说明一季度的计划完成情况。
累计至二成 月程 份 1度 2的 2 15 7计 2 10 0 % 划 05完 .5 4% 4 5400
21
作业2小题
第四章
第二节 相对指标(7)
(一)计划完成程度相对数
1、概念及基本计算公式 计划完成程度相对数(Relative number of
fulfilling plan)是现象在某一段时期内实际完 成数与计划任务数的对比,用以说明计划完成 的程度。 基本公式: 计划完成相对数=实际完成数÷计划任务数
11
第四章
第二节 相对指标(3)
1
作业2小题
第四章
•总量指标的含义、作用和种类 •相对指标的含义、种类和计算 •相对指标的运用
2
第四章
第四章 总量指标和相对指标
• 第一节 总量指标 • 第二节 相对指标 • 第三节 计算和运用相对指标的原则
3
第四章
第一节 总量指标(1)
• 一 总量指标的概念p.67
总量指标(Population quantity)是反映社会 经济现象发展的总规模、总水平的综合指标。
第四章 统计整理 《应用统计学——以Excel为分析工具》PPT课件
• (2)递减排序:可表示为: x(1)>x(2)>…>x(n)。
• 无论是定性数据还是定量数据,其排序均 可借助EXCEL完成。下面通过实例说明 EXCEL2007中进行数据排序的操作。
• 编制好的统计台账和加工整理后的统计资料,必须 妥善保管,不得损坏和遗失。
• 以上五个方面是相互衔接的,其中,统计分组是统 计整理的基础,统计汇总是统计整理的中心内容, 统计表和统计图是统计整理结果的表现形式。
第二节 统计调查资料的预处理
• 统 计 调 查 资 料 的 预 处 理 (Statistical data pretreatment) 是 数 据 分 组 整 理 的 先 前 步 骤 ,内容包括调查数据的审核与插补、筛选 (第三章已经介绍)、排序、分类汇总等 过程
一、统计分组的含义
• 统计分组是根据统计研究的目的和任务要 求,按照统计分组标志将总体划分成性质 不同的若干个部分或组别,使组和组之间 具有差异性,而同一组内具有同质性。
二、统计分组的作用
• 1、区分事物的性质 • 如企业按照经济性质分组,分为国有经济、集体
经济、私营经济、个体经济、外商投资经济、港 澳台经济。 • 2、研究事物内部结构 • 如将国民生产总值按照三次产业划分,计算出各 个产业所占比重,以便研究内部结构是否合理。 • 3、研究现象之间的关系 • 在统计分作的基础上,研究现象和现象之间的相 互依存关系。如施肥量和亩产量之间的关系;商 业企业规模和商品流通费用率之间的关系等。
三、统计调查资料的分类汇总
• 在对数据进行预处理时,有时需要对某些 字段按条件进行汇总,称为数据的分类汇 总。如果只是针对一个字段进行分类汇总 ,称为单字段分类汇总;如果同时对两个 及两个以上字段进行分类汇总称为多字段 分类汇总。
统计学基础综合指标
统计学——第四章综合指标
比较相对指标:用两个不同总体的同类指标数值对比,以反映某一现 象在同一时间内不同空间条件下发展的均衡程度。
比较相对指标= 某一总体的某类指标数值 另一总体的同类指标数值
例1:2005年美国的GDP为124550.7亿美元,人均GDP为43740美元, 而同年中国的GDP为22289.0亿美元,人均GDP为1740美元。则
statistics
统计学——第四章综合指标
第二节 相对指标
statistics
统计学——第四章综合指标 相对指标的概念
相对指标(相对数):是通过两个有联系的指标进行对比, 以反映现象总体的数量结构、变化程度或现象之间的数量 关系。(男生占全班人数的百分比)
相对指标=对比数 基数
statistics
第三节 平均指标
statistics
统计学——第四章综合指标 平均指标
平均指标的概念(统计平均数):是反映统计数据(总体单位 标志)一般水平的统计指标。
平均指标的特点:将各统计数据的差异抽象化,代表了全部 统计数据的一般水平,反映了现象总体的综合数量特征。
statistics
统计学——第四章综合指标 平均指标的作用
全期计划数
statistics
统计学——第四章综合指标
2.计划指标是相对数
实际完成百分比
计划完成情况相对数 ?
? 100%
计划百分比
①当计划指标是增长率时
计划完成情况相对数
?
1 1
? ?
实际增长率 计划增长率
? 100%
②当计划指标是降低率时
计划完成情况相对数
?
1 ? 实际降低率 1 ? 计划降低率
统计学(第4章)
连续变动结果的总量指标,时期指标是
一个流量。
时间维度上
时期指标的三个特点 具有可加性
时期指标可以累计
时期指标数值大小与时期长短有直接关系
时期指标的数值一般为连续登记
2019/6/15
第四章 描述统计
5
统计学
2、时点指标
时点指标又叫存量指标,是指反映社 会经济现象在某一时点上的总量指标,
四 季度
1 500
计划完成百分数=
1400+1420+1470+1500 5000
=115.8%
注:2010年第一季度前的四个季度的累计量已达5000,说明五年计 划提前三个季度完成。
2019/6/15
第四章 描述统计
33
统计学
(2)累计法
如何确定提前 完成时间?
计算公式:
计划完成相对指标 长期计划期间实际累计完成数 长期计划规定的累计数
时点指标是一个存量。
时间维度上
时点指标的三个特点
不具可加性
不同时点指标数值是不能累加
时点指标数值大小与时点间隔长短无直 接关系
时点指标一般为间断统计
2019/6/15
第四章 描述统计
6
统计学
三、总量指标的计量单位
1、实物量单位(包括度量衡单位) 2、价值量单位 3、劳动量单位(工时和工日)
5 000 1 250 1 340 1 280
102.4
52.4
4 000 1 000 1 030 1 215
121.5
56.1
2 000 500 600 400
80.0
50.0
11 000 2 750 2 970 2 895 105.33
统计学原理第四章PPT学习教案
(二)比例相对指标 (轻重工业比例)
比例相对指标是总体中不同部分数量对比的相对指标,用以分析总 体范围内各个局部、各个分组之间的比例关系和协调平衡状况。
比例相对指标
总体中某一部分数量 总体中另一部分数值
第8页/共41页
第二节 相对指标
(三)比较相对指标
比较相对指标是不同单位的同类现象数量对比而确定的相对指标, 用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以 表明同类实物在不同条件下的数量对比关系。
第9页/共41页
第二节 相对指标
(四)强度相对指标 强度相对指标是两个性质不同但有一定联系的总量指标之间的对比, 用来表明某一现象在另一现象中发展的强度、密度和普遍程度。它和 其他相对指标的根本区别就在于它不是同类现象指标的对比。强度相 对强指度标相以对双指重标计量另单一位个表有示联,系某是而种一性现质种象不复总名量同指数的标。现象总量指标 强度相对指标的分子分母位置可以互换,因而有正指标、逆指标之分。 实际应用时应注意与平均指标的区别。
水泥——(80/100)=80% 第二季度 生铁——(618/600)=103%,钢材—— (300/350)=85.71%
水泥——(180/200)=90% 2)求上半年(一,二季度合并)进货 情况, 解法同 上 生铁——(618+500)/(600+500)= 101.64% 钢材——(300+300)/(250+350)= 100% 水泥——(180+80)/300=86.67% 3)上半年累计计划完成程度执行情况 (计划 期一年 ,实际 期半年 ) 生铁——(618+500)/2000=55.9% 钢材——(600)/1000=60% 水泥——260/500=52%
统计学第四章课件
一、分布的集中趋势
1. 简单几何平均数
简单几何平均数适用于资料未进行分组 的情况。其计算公式为
(4-8)
式中, xG 为几何平均数;xi为变量值;n为
变量值个数;Ⅱ为连乘符号。
一、分布的集中趋势
【例4-6】 某企业生产某种产品要经过三个连续的作业车间才能完 成。若某月份第一车间粗加工产品的合格率为95%,第二车间精加工产 品的合格率为93%,第三车间最后装配的合格率为90%,则该产品的企 业合格率(三个车间的平均合格率)为多少?
一、分布的集中趋势
此外,从上述表达式中可以看出,加权算术平均 数受两个因素的影响:一是各组的标志值,二是各组 的单位数或频率。当各组的标志值不变时,其出现的 次数f对于平均数的大小起着权衡轻重的作用,统计学 称其为权数。当各组次数相等时,影响平均数的因素 就只有一个,即各组的标志值,这时加权算术平均数 就等于简单算术平均数。可见,简单算术平均数是加 权算术平均数的特例。
一、分布的集中趋势
【例4-13】 表4-9为某企业工人工资资料,试计算其中位数。
表4-9 某企业工人工资资料
一、分布的集中趋势
确定中位数的方法如下: ①计算累计频数,见表4-9第3栏和第4栏。 ②利用公式∑f/2确定中位数的项次,∑f/2=120/2=60。 ③通过观察,找到中位数(以向上累计为例),从向上累计频数可知,从 第41个工人到第80个工人都包含在了第三组中。由此可以判断,第60个 工人也应在第三组里。 ④利用公式求得中位数近似值(以上限公式为例)。
一、分布的集中趋势
解:中位数的位置=(n+1)/2=(11+1)÷2=6,则 中位数为第6号位置的零件数,即Me=x(6)=24件。
第4章 人口统计学和生命表
4.1.3 人口转变理论与人口金字塔
ACTUARY
当今世界城市化和工业化趋势在中国和印度尤为明显。这两国家成为世界上人口最为 稠密的国家,这两国的变化发展对全球经济的发展都起到了主导作用。
2.人口金字塔 人口金字塔是用以展示一个国家人口的性别和年龄分布状况的类似金字戴的图形,由 许多条形块结合组成。比如下图印度1989年人口金字塔所示,男性人口数量如图右边所 示,女性人口数量如图左边所示。金字塔中年龄组的组间距为5年,0—4岁为第一组,往 后类推。 人口金字塔可以直接根据各年龄组男女人数来确定坐标刻度进行绘制;也可以先计算 出各年龄组男女人数各自所占总人口百分比来确定坐标刻度进行绘制。人口年龄金字塔 具有反映人口年龄结构状况的作用。
进行分类。包含索赔记录和行业数据
4.1.1 人口统计概述
ACTUARY
5.总体特征 任何总体都有大量共有的特征,为达到研究目的,一个总体需满足一个最起码的条件, 即总体中的个体需要有同质性,比如
· 以同样的方式进入这个总体 · 以同样的方式离开这个总体
“同质”是指至少存在一种方式可以辨认出某个个体是属于这个总体的。比如,精算 学家是一直从事精算研究的一群人,这就是同质性的一个特征。考虑一个国家,我们可 以以下面的标准对其进行分组:
第四章 人口统计学与生命表简 介
ACTUARY
生存模型是描述单个个体由生存状态到死亡状态这一过程(或由开始运行到报废或失效状态这一
过程)的数学模型。通常研究机械设备从运行到失效,或动物由生存到死亡的生存模型,其所研究
的精确年龄意义不大,比如一台机械从运行5年至6年间报废的概率的测度并没有多大意义,但对于
· 同一地区 · 同一行业 · 同一工种 · 同一嗜好
统计学原理 第四章 第三节 平均指标
某班学生统计学考试平均成绩计算表
按成绩分 组中 学生人 比重 (%) 组 (分 ) 值 x 数 (人 )f 60以下 60-70 70-80 80-90 90以上 合 计 55 65 75 85 95 — 2 6 10 19 3 40 5.0 15.0 25.0 47.5 7.5 100.0 xf 110 390 750 1615 285 3150
【例】
某生产班组有10名工人,日产量 15件有1人,16件有2人,17件有3人, 18件有4人,则平均每人日产量为:
Σxf x Σf 15 1 16 2 17 3 18 4 10 17 (件)
某车间100名工人日产零件数资料如下:
日产量 工人数 x(件 ) f(人 ) 5 10 6 20 7 35 8 19 9 16 合 计 100
x•
f
f
2.750 9.750
18.750 40.375 7.125 78.750
Σxf Σx kf kxf Σxf x Σf Σkf kf Σf
注
②
简单算术平均数实际上是权 数相等的加权算术平均数,是加 权算术平均数的特例。
Σxf fx Σx x Σf nf n
组距数列计算平均数:
假定各组内的标志值是均匀分布 的,先求出各组的组中值,并以组中 值代替各组的组平均数,再计算平均 数。计算结果可能有些偏差,只是平 均数的近似值。通常,组距越小,越 接近于实际的平均数。
第四章
综合指标
第三节 平均指标
一、平均指标概述 二、平均指标的计算 三、各种平均数的比较
一、平均指标概述
平均指标:又称为平均数,它是表 明同类社会经济现象(或同质总 体)各单位某一数量标志在一定 时间、地点、条件下所达到的一 般水平的综合指标。
加权平均指数
返回 上页 下页 结束
,n ,n
二、算术平均指数
p1 i q1i , kq = , i = 1, 2, 1)计算个体指数: k pi = p0 i q0 i ,n
2)计算相应权数: p0 i q0 i , i = 1, 2, , n
Σx i f i (x ) 3)按加权算术平均数形式求平均指数: = Σf i p1i Σ p0 i q0 i Σk pi p0 i q0 i p0 i = Ap = Σp0 i q0 i Σp0 i q0 i q1i Σ p0 i q0 i Σkqi p0 i q0 i q0 i = Aq = Σp0 i q0 i Σp0 i q0 i
Hq
∑p q = q ∑q p q
1i 1i 0i 1i
84696 = = 107.69% 78650
1i 1i
这些计算结果与前面帕氏指数给出的结果完全相同。事实 上,当个体指数与总值权数之间存在一一对应关系时,报告期 加权的调和平均指数恒等于帕氏指数,即有
Hp
∑p q = p q ∑ k
∑p q = p q ∑ k
返回 上页 下页 结束
三、调和平均数指数
p1i q1i , kq = , i = 1, 2, 1)计算个体指数: k pi = p0 i q0 i ,n
2)计算相应权数: p1i q1i , i = 1, 2, , n
( 3)按加权调和平均数形式求总指数: H =
Hp
Hq
∑p q = p q ∑ k ∑p q = p q ∑ k
计量 单位
百公斤 公斤 500克 件 台 ---
商品价格 (元) p1 p0
人力资源统计学 第四章 劳动环境与劳动保护统计
生产劳动环境的分析:
1 生产作业区绿化情况分析
覆盖率、平均每人绿化面积
2 空气有害物质浓度的评价
空气含尘浓度,超标倍数,超标率
3 生产设备完好状况
设备完好率,设备故障率
4 劳动保护防护设施达标分析:达标率 5 个人防护用品的发放与使用分析:发放情况,实际使
用情况
第三节、劳动保护措施统计
劳动保护措施的意义:
5.按工伤事故死亡人数分类 (1) 重大伤亡事故,每次死亡1-2人 (2) 特大死亡事故,每次死亡3人及以上
6 造成经济损失大小分类 1. 一般损失事故,经济损失小于1万元 2. 较大损失事故,经济损失1万-小于10万元 3. 重大损失事故,经济损失10万-小于100万元 4. 特大孙是事故,经济损失在100万元计100万元以上
全年计划完工数 按本期实际施工项目计算:
本期实际完工项目数 完工率=------------------------------×100%
本期实际实施项目数 按本期止累计施工项目计算:
自年初至本期止累计完工项目数 完工率=---------------------------------------------×100%
工伤歇工工日与本期制度工作日对比
工伤事故的损失分析 1.经济损失包括:直接经济损失和间接经济损失:
(1)直接损失:人身伤亡后支付的医疗护理费,受伤人员的工 资及补助费,丧葬及抚恤费,补助和救济费。善后处理费,处 理事故的事务性费用,现场抢救费用,清理现场费,事故罚款 和赔偿费。各种财产损失价值,固定资产损失价值(净值)和流 动资产损失价值等。 (2)间接损失:事故造成的停产和减产损失;资源损失;造成 环境污染的赔款和罚款;补充新职工的培训费用;因事故影响 造成的其他损失等。
统计学教程 第四章.
(一)用样本均值估计总体均值
1、样本均值x
xf f
(x x)2f
2、样本标准差s
f
3、抽样平均误差 ( x )
s2 n
4、抽样极限误差
5、总体均值的区间估计
(二)用样本成数估计总体成数
1、样本成数 p n 1 n
2、抽样平均误差 (p)
p1 p
n
3、抽样极限误差
4、总体成数的区间估计
(x)
4、构造估计量的置信区间 ,如 x ± Δx ,p ± Δ p。
5、计算抽样估计精度 ,如
三、抽样平均误差的计算
样本均值的平均误差 样本成数的平均误差
(一)样本均值的平均误差
1、重复抽样
s2
ቤተ መጻሕፍቲ ባይዱ(x)
n
2、不重复抽样
(x)
s2 n
1
n N
(二)样本成数的平均误差
1、重复抽样
(p)
p1 p
x x (x x)2 f
-3.972 -1.972 0.028 2.028 4.028
—
236.652 116.664 0.039 164.511 146.023 663.889
x xf1 5 8 0 1 0 .9 7 2 1 1 千 小 时 f 1 4 4
s2 (xx)2f663.8894.610 f 144
样本指标
①样本均值
x
xf f
(x x)2f
样本标准差s
f
②样本成数 p n 1(即样本比例) n
成数的方差= p(1 p) 成数的标准差= p(1 p)
三、抽样误差
抽样调查时不可避免会出现各种误差 , 这些误差主要是 :总误差 、偏差 、抽样 误差 、抽样平均误差和抽样极限误差等
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节离散程度的测度10天道森供应公司克拉克批发公司5 0.54 0.49 10 11 工作日数 7 8 9 10 11 12 13 14 15 工作日数集中趋势只是数据分布的一个特征,数据的离中趋势是数据分布的另一个重要特征。
两者是反映总体数据分布特征的一对对立统一的代表值。
一、离散程度指标,又称标志变异指标,标志变动度。
(一)定义就是总体各项标志值差别大小的程度。
(二)应用1.主要是评价平均数代表性的依据。
平均数的代表性与标志变动度的数值成反比。
例如:有甲乙两组工人,人数都是5人。
每人每日产量:甲:5 20 45 85 95乙:48 49 50 51 52平均数 5095-59052-48 42.标志变动度可以用来反映社会生产和其他社会经济活动过程的均衡性或协调性。
标志变动度小,就说明生产或经济活动各阶段变动幅度小,是均衡的协调的,反之,就是不均衡,不协调的。
二、测量标志变动度的主要方法(一)异众比率——分类数据,顺序数据,数值型数据1 定义:异众比率,即非众数组的频数占总频数的比率。
2 公式:Vr=(∑fi —fm)/ ∑fi =1—fm/ ∑fi∑fi变量值的总频数,fm众数组的频数。
3作用:主要用于衡量众数对一组数据的代表程度。
异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性就越差;反之,异众比率越小,说明非众数组的频数占总频数的比重越小,众数的代表性越好。
4 适用范围:测定分类数据(也可以是顺序数据,数值型数据)的离散程度饮料品牌频数可口可乐 15旭日升 11百事可乐 9汇源果汁 6露露 9合计 50异众比率解:Vr=(∑fi —fm)/ ∑fi=1—fm/ ∑fi=(50—15)/50=35/50=0.7=70%(二)四分位差——顺序数据数值型数据1 定义:上四分位数和下四分位数之差。
2 公式: Qd=Qu—Ql3 作用:反映了中间50%数据的离散程度。
其数值越小,说明中间的数据越集中,数值越大,说明中间的数据越分散。
常常和中位数一起使用4特点:四分位差不受极值的影响。
例如:在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位为元),计算人均月收入的四分位差1500 750 780 1080 850 960 2000 1250 1630解:先按大小顺序排队750 780 850 960 1080 1250 1500 1630 2000QL位次(n+1)/4 =(9+1)/4=2.5QL=(780+850)/2=815(元)QU位次3(n+1)/4 =3(9+1)/4=7.5QU=(1500+1630)/2=1565(元)四分位差Qd=Qu—Ql=1565—815=750(元)(三)全距(极差)——数值型数据1 全距——是一个数列中两个极端数值之差。
(最大值-最小值)组距数列,以最大一组的上限和最小一组的下限之差为全距。
例如:甲:5 20 45 85 95乙:48 49 50 51 52甲组全距=95-5=90 乙组全距=52-48=4一般地说,全距数值愈小,标志变动度愈小,反映变量值愈集中,反之,越大。
2评价:意义明确,计算简单。
但不考虑中间变量,受极端值影响。
有时根本反映不出差异程度。
10 20 30 40 50 60 70 80 90 100 55 9010 50 50 50 50 60 60 60 60 100 55 90(四)平均差1定义:各标志值对其算数平均数的平均离差2公式(五)标准差1 定义各标志值对其算数平均数的平均离差2简单式(未分组资料)3加权式(分组资料)如果是样本资料,将来要推断总体的,方差及标准差的公式就是:分母用样本数据个数减1:n—1 ——n—1 称为自由度。
公式为:为什么样本方差是用自由度n—1去除?样本方差的表达式中的分子,为 n个量的平方和,为何自由度只有 n—1 、这是因为这n个离差并不能自由变化,而是受到一个约束,即离差之和等于零,这使它的自由度少了一个。
在样本方差公式中的分母上是n—1,就是因为当给定均值时,x1,x2,x3,------xn,这n个数据中前n—1个数据都可以自由取值,而第n个数据受全部数据的平均值的制约,不能自由取值。
第n个数据可以由公式∑xi求得。
因此,方差的自由度是n—1。
也可以这样理解:从字面意义上看,自由度是指一组数据中,可以自由取值的个数。
当样本数据的个数为n时,如果样本平均数确定后,只有n—1个数据可以自由取值,其中必有一个数据不能自由取值。
例如,假如样本有3个数值,X1=2,X2=4,X3=9,则平均数=5。
当平均数=5确定后,X1,X2,X3只有两个数据可以自由取值,其中必有一个不能自由取值。
例如X1=6,X2=7,那么X3则必然取2,而不能取其他值。
另一种解释:即共有n个样本,有n个自由度。
用样本方差估计总体方差,自由度本应为n,但总体均值也未知,用样本平均数去估计它,就用掉了了一个自由度,故,只剩下n—1个自由度。
(七)标准差系数厂名工人平均标准差标准差系数劳动生产率(元)甲 16000 600 3.75乙 8000 400 5.00(八)标准分数——每一个变量值相对位置的测度1. 标准分数——变量值与其平均数的离差除以标准差后的值。
又称z 分数,或标准化值。
设标准分数为zi,则有zi=(离差/标准差)z分数,zi可以被解释为xi偏离平均数,相当于标准差的个数。
如,z=2,表示变量值比平均数大2个标准差,如果等于-2,则表示变量值比平均数小2个标准差。
z分数大于0,是指那些数值大于平均数的观察值,z分数小于0,是指那些数值小于平均数的观察值,z分数等于0,是指那些数值等于平均数的观察值,任何观察值的z分数都可以解释为该观察值在数据集中相对位置的测度。
因此,如果位于两个不同数据集中的观察值的z分数相等,则可以说它们的相对位置相同,即偏离平均数的标准差的个数相同。
例如:已知下面样本的平均数为44,标准差是8。
班级的学生数xi 均值的离差 z分数46 2 0.2554 10 1.2542 -2 -0.25 46 20.25 32 -12 -1.5第5个观察值的z分数是-1.5,说明它是偏离平均数最远的一个样本,它比平均数低1.5个标准差。
(九)经验法则经验法表明,当一组数据对称分布时:约有68%的数据在平均数加减1个标准差的范围之内。
约有95%的数据在平均数加减2个标准差的范围之内。
约有99%的数据在平均数加减3个标准差的范围之内。
例如,液体清洁剂纸板箱在生产线上可以被自动装满。
填充的重量通常呈钟型分布。
如果填充重量的平均值是16盎司,标准差是0.25盎司,利用经验公式:大约68%的已填充纸板箱的重量在15.75-16.25之间大约95%的已填充纸板箱的重量在15.50-16.50之间大约99%的已填充纸板箱的重量在15.25-16.75之间可以看到,一组数据中低于或高于平均数3倍标准差之外的数值是很少的,也就是说,在平均数加减3个标准差的范围内几乎包含了全部数据,而在3个标准差之外的数据,在统计上也称为异常值或离群点。
(十)切比雪夫不等式对于任意分布形态的数据,根据切比雪夫不等式,至少有(1-1/z.z)的数据落在z个标准差之内。
其中z是大于1的任意值,但不一定是整数。
z=2,至少有75%的数据落在平均数加减2个标准差的范围之内z=3,至少有89%的数据落在平均数加减3个标准差的范围之内。
z=4,至少有94%的数据落在平均数加减4个标准差的范围之内例如,假设100个大学生数学课程的考试成绩的平均数是70分,标准差是5分。
那么有多少学生的考试成绩在60——80之间?又有多少学生的考试成绩在58——82之间?第二节偏态与峰态的度量偏度和峰度是从整个图形来刻画分布特征的。
一偏态及其测度(一)偏态即指数据分布的不对称性。
偏斜的程度测定——偏态系数1.未分组资料的偏态系数公式例如:某组工人生产产品日产量件数分别为48 49 50 51 52计算偏态系数。
平均数=∑x/n=(48+49+50+51+52)/5=50标准差=1.41 n=5生产件数离差离差平方离差立方48 -2 4 -849 -1 1 -150 0 0 051 1 1 152 2 4 8250 0 10 0sk=5×0/(5-1)(5-2) 1.41 ×1.41×1.41=0(正态分布)例如:某组工人生产产品日产量件数分别为5 20 45 85 95计算偏态系数。
平均数=∑x/n=50标准差=35.2 n=5生产件数离差离差平方离差立方5 -45 2025 -9112520 -30 900 -2700045 -5 25 -12585 35 1225 4287595 45 2025 91125250 0 6200 15750sk=5×15750 /(5-1)(5-2) ×35.2×35.2×35.2=78750/523370.5=5.296=0.15(有点正偏斜,右偏斜)偏态系数测度了数据分布的非对称程度。
如果一组数据的分布是对称的,则偏态系数等于0;如果偏态系数明显不同于0,表明分布是非对称的。
2 分组资料的偏态系数公式:它是离差三次方的平均数再除以标准差的三次方。
当对称分布时,离差三次方后正负离差可以相互抵消,因此,sk是分子等于0,sk也就等于0。
当分布不对称时,正负离差不能相互抵消,就形成了正或副的偏态系数。
当sk为正值时,表示正离差值较大,可以判断为正偏,或右偏。
Sk为负值时,表示负离差数值较大,可以判断为负偏或左偏。
Sk值越大,表示偏斜的程度越大。
例如:资料如下,计算偏斜系数月工资额(元)工人数(人)工资总额(元)离差离差平方离差立方离差立方乘次数500 30 15000 -180 32400600 50 30000 80 6400700 70 49000 20 400800 30 24000 120 14400900 20 18000 220 48400合计 200 136000 ——————平均数=13600/200=680(元)标准差=Sk=从计算结果可以看出,偏态系数为二峰态及其测度(一)峰态定义即数据分布的平峰或尖峰程度。
(二)峰态的测度—峰态系数1未分组资料的峰态系数K2公式:第四节平均指标的应用原则一、社会经济现象的同质性二、组平均数补充总平均数三、分配数列补充平均数。