第四章统计学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章
第一节统计整理
一、统计整理的意义
统计整理是根据统计研究任务的要求,对调查所搜查的原始资料进行分组、汇总,使其条理化、系统化的工作过程。
统计整理实现了从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。
二、统计整理的步骤
a、设计和编制统计资料整理方案
b、对原始资料进行审核
c、对原始资料进行统计分组和统计汇总
d、编制统计表或绘制统计图
第二节统计分组
一、统计分组的概念
统计分组是根据所研究事物的特点和统计研究的目的,按照某一标志将统计总体划分为若干个组成的一种统计方法。
二、统计分组的作用
a、揭露社会经济现象的类型,反映各类型的特点
b、反应现象总体的内部结构
c、分析现象之间的互相依存关系
表:(一)类型分析
1999~2002年我国农林牧渔业总产值单位:亿元
(二)结构分组“九五”期间我国国内生产总值构成(%)
(三)分析分组
某乡某种农作物的耕作深度与收获率的关系
三、统计分组的方法
a、正确选择分组标志
1、根据统计研究的目的选择分组标志
2、选择最能反映事物本质特征的标志进行分组
3、选择分组标志时,要考虑到现象发展的历史条件和经
济条件
b、按品质标志或按数量标志分组
1、按品质标志分组
2、按数量标志分组
c、简单分组和复杂分组
1、简单分组。简单分组是指对所研究的总体按一个标志进行分组。
2、复合分组。复合分组是指对研究的总体按两个或两个
以上的标志进行的多层次分组。
分组再分组
四、统计分组的几个基本概念
a、组数:是指将全体变量值分成多少组
b、单项分组与组距分组
1、单项分组:在按数量标志分组时,将每一个变量值
作为一组
2、组距分组:将所有的变量值依次划分为几个区间,一
个区间内的所有变量值归为一组,这样的
分组成为组距分组。
c、组距:指分组条件下每组变量值的变化范围,即每组变
量
区间的距离。
d、等距分组与不等距分组
1、等距分组,指各组组距相等,凡是在变量变动比较均
匀的条件下,可以采用等距分组。列如:身高,体重,
零件尺寸的误差分组等。
2、不等距分组,指各组组距不相等的分组。当变量值变
动很不均匀时,常采用不等距分组。不等距分组中,
多数情况是根据事物性质变化的数量界限来确定组
距。如对少年儿童年龄的分组,必须注意到不同年龄
生理变化的特定。
e、组限:组限是指各组变量值变动的两端界限,是每组的起
点和组点、每组的起点成为下限,每组的终点成为
上限。凡遇到某总值单位的变量值刚好等于相邻两
组上下限时,一般把比值归并到作为下限的那一组,
这成为“上限不在内”的原则。
f、开口式分组与闭口式分组
1、开口式分组:在组距式分组中,凡具有“以上”(上
开口组)或“以下”(下开口组)的分组。
2、闭口式分组:没有“以上”和“以下”的分组。
g、组中值:指各组上限和下限的中点数值。
其计算公式为:组中值=(上限+下限)/2
开口组的组中值计算公式如下:
1、下开口组组中值=上限-相邻组组距的一半
2、上开口组组中值=下限+相邻组组距的一半
五、注意
1、对于连续变量分组,相邻组的上限与下限必须重叠
对于正指标,采用“上限不在内”原则(一般)
对于逆指标,采用“下限不在内”原则
2、对于离散变量分组,相邻组的上限和下限必须间隔。
第三节次数分布
一、次数分布的概念
次数分布是指将总体中的所有单位按某个标志分组后,所形成的总体数在各组之间的分布。
分布在各组的总体单位数叫做次数或频数。
分类:
a、根据分组标志特征不同,次数分布数列可以分为品质分
布数列和变量分布数列。
b、按品质标志分组形成的次数分布数列叫品质分布数列,
简称品质数列。
c、按数量标志分组形成的次数分布数列叫变量分布数列,
简称变量数列。
二、变量数列的种类
a、单项变量数列
单项数列是按数量标志分组后,用一个变量值代表一个
组形成的数列。
b、组距变量数列
组距变量数列是按照数量标志分组后,用变量值变动的一定范围(即组距)代表一个组所形成的数列。
三、变量数列的编制
a、将原始资料按数值大小依次排列
b、确定组数(k)和组距(i)
k=1+3.322logn
i=R/k
上述公式成为斯德吉斯组数公式。公式中,n为数据个数,R为全距。
定组距和组数应考虑下列原则:
1、要尽可能反映出总体单位的分布情况及总体单位的
集中趋势
2、要尽可能区分出组与组性质上的差异
c、确定组限和组限的表示方法
1、最小组的下限要略低于最小变量值,最大组的上限要
略高于最大变量值。
2、组限的确定应当有利于表现总体单位分布的规律性
3、对于等距数列,如果组距是5,10,…,100,…,则
每组的下限最好是它们的倍数。
四、次数分布的表示方法
a、表示法
——即用统计表来表示次数分布
b、图示法
——即用统计图来表示次数分布
①直方图②折线图③曲线图
曲线图是组数趋向于无限多是折线图的极限描绘,是一