数据分组
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(4)统计资料的显示。即通过编制统计表 和绘制统计图,将整理出的资料简捷 明了、系统有序地显示出来。
(5)对统计数据分门别类地系统积累。
三、数据的预处理
(一)数据的审核
1.审核资料的完整性和及时性 审核资料的完整性,就是看调查单位或填报
单位是否齐全;规定的项目是否都有答案, 应报资料的份数是否符合规定。
解频数分布的种类及常用的统计图的绘制;
本章重点
1.分组的概念、特点和原则,分组的作用,
能熟练进行分组; 2.频数分布的概念及其构成; 3.组限的表现形式及原则、组距和组中值的
计算; 4.统计表的含义及其构成,统计表的编制方
法和原则;
本章难点
1.统计数据的预处理;
?
2.统计分组的方法;
3.频数分布的编制;
第四章 统计数据的整理和显示
➢ 教学目的要求 ➢ 本章重点 ➢ 本章难点 ➢ 教学方法 ➢ 教学时数
90 80 70 60 50 40 30 20 10
0 第一季度 第二季度 第三季度 第四季度
东部 西部 北部
➢第一节 ➢第二节 ➢第三节 ➢第四节
统计数据整理概述 统计数据分组 频数分布 数据的显示
二、统计分组的原则
穷尽原则和互斥原则。
三、统计分组的作用
划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系
四、分组的类型
按分组作用或目的不同 类型分组 结构分组 分析分组
四、分组的类型
按分组标志的多少 简单分组 复合分组
并列分组
四、分组的类型
按分组标志性质
属性分组
变量分组
(2)计算检查
即检查各项指标的计算口径、计量单位是否符 合规定,并通过各种计算方法来检查各指标 间的数字是否相互衔接。
➢ 3.历史资料的审核:在利用历史资料(或其 他间接资料)时,应审核资料的可靠程度、 指标含义、所属时间与空间范围、计算方 法和分组条件与规定的要求是否一致。一 般可以从调查资料的历史背景、调查者搜 集资料的目的以及资料来源等,来判断资 料的可靠程度,也可以从指标间的相互关 系以及指标的变动趋势来检查它的正确性。
狭义的统计表专指分析表和容纳各种统 计资料的表格,也就是通常所说的统 计表,它清楚地、有条理地显示统计 资料,直观地反映统计分布特征,是 统计分析的一种重要工具。
统计表的结构,可以从表式和内容两 个方面来认识。
1.从表式上看,统计表是由纵横交叉的 线条组成的一种表格,表格包括总标 题、横行标题、纵栏标题和指标数值 四个部分。
(二)资料审核后的订正
通过上述审核,如发现有缺报、缺份和缺项等 情况,应及时催报、补报;如有不正确之处, 则应分别不同情况作如下处理:
(1)对于可以肯定的一般错误,应及时代为更正, 并通知原报单位。
(2)对于可疑之数或无法代为更正的错误,应要 求原单位复查更正。
(3)如果所发现的差错在其他单位也可能发生 时,应将错误情况通报所有单位,以免发 生类似错误。
(2)连续组距式分组 :凡是组限相连(或重 叠)的分组,即以同一数值作为相邻两组的 共同界限的分组。统计上规定: “上限不在内”
3.等距分组与异距分组
等距分组:就是标志值在各组保持相等的 组距,即各组的标志值变动都限于相同的 范围。凡是在标志值变动比较均匀的情况 下,都可采用等距分组。
异距分组:各组组距并不完全相等的分组, 在下列情况下,就必须考虑采用异距分组:
(二)U型分布
U型分布的形状与钟型分布相反,靠近中间 的变量值分布次数少,靠近两端的变量值 分布次数多,形成“两头大,中间小”的U 型分布。如人口死亡率分布,人口总体中, 幼儿和老人死亡率高,而中青年死亡率低。 如下图(c)。
(三)J型分布
J型分布有两种类型,一种是次数随着变量 的增大而增多,如投资按利润率大小分布。 另一种 呈反U型分布,即次数随着变量增 大而减少,如随着产品产量的增加,产品 单位成本下降。如下图(d)
数据整理的原则:
1.目的性原则 2.联系性原则 3.简明性原则
数据整理的内容
编制 统计图表
审核
汇总
分组
数据整理的具体步骤
(1)对搜集到的资料进行全面审核,以确 保统计资料符合统计研究目的的要求, 资料准确无误。
(2)根据研究目和统计分析的需要,选择 整理的标志,并进行划类分组。
(3)在分组的基础上,将各项资料进行汇 总,得出反映各组和总体数量特征的 各种指标。
(4)对于严重的错误,应发还重新填报,并查 明发生错误的原因,若属于违法行为,则 应依法严肃处理。
第二节 统计分组
本节重点: 统计分组的概念、作用和原则 统计分组的方法
本节难点: 统计分组的方法
一、统计分组的概念
根据社会经济现象的特点和统计研究的 目的要求,按照某个重要标志(或几 个标志)把总体划分为若干不同性质 的组,称为统计分组。
组数的多少直接取决于两个因素,一个是总 体的全距,另一个是组距。在等距分组的 条件下,组数等于全距除以组距。在组距 既定的条件下,全距大则组数多,全距小 则组数少;在全距既定的条件下,组距大 则组数少,组距小则组数多。
(三)组中值
组中值:各组中点位置所对应的变量值。其计算公
式为:
组中值=
上组下限 本组下限 2
(二)变量分组的方法
按数量标志分组,应注意如下两个问题:
首先,分组时各组数量界限的确定必须能反 映事物质的差别。
其次,应根据被研究的现象总体的数量特征, 采用适当的分组形式,确定相宜的组距、 组限。
1.单项式分组与组距式分组
(1)单项式分组:就是用一个变量值(标志 值)作为一组,形成单项式变量数列。单项 式分组一般适用于离散型变量且变量变动范 围不大的场合。
第一,标志值分布很不均匀的场合。 第二,标志值相等的量具有不同意义的场合。 第三,标志值按一定比例发展变化的场合。
变量数列
单项数列
组距数列
等距数列
异距数列
七、组距、组Hale Waihona Puke Baidu与组中值
(一)组距 组距是各组上下限之间的距离,即各 组最大标志值与最小标志值之差。
(二)组数
全距是总体中最大的标志值与最小的标志值 之差。
向下累计频数(或频率),即先列出各组 的下限,然后由标志值高的组向标志值低 的组依次累计频数(或频率)。某组向下 累计频数表明该组下限以上的各组单位数 之和是多少,某组向下累计频率表明该组 下限以上的各组单位数之和占总体单位数 的比重。
四、频数分布的类型
(一)钟型分布
钟型分布的特征是“两头小,中间大”, 即靠近中间的变量值分布的次数多,靠近 两边的变量值分布的次数少,其曲线图宛 如一口钟,如下图所示。
五、分组标志的选择
要符合统计研究的目的和要求 要选择最能说明事物本质特征的标志 要考虑到现象所处的具体历史条件
六、统计分组的方法
(一)属性分组的方法
1.对事物进行属性分组,其组数的多少首先 取决于事物本身的特点。
2.对于有些事物构成比较复杂,组数可多可 少的情况,就需要考虑统计研究任务的具体 要求
总标题是统计表的名称,它扼要地说 明表的基本内容,并指明时间和范围。 它置于统计表格的正上方。
横行标题是横行的名称,一般放在表格的 左方;
纵栏标题是纵行的名称,一般放在表格的 上方。横行标题和纵行标题共同说明填入 表格中的统计数字所指的内容。
指标数值是列在横行和纵栏的交叉处,即表 格中的数字就是指标数值,用来说明总体 及其组成部分的数量特征,它是填写在统 计表格的核心部分
2.从内容上来看,统计表是由主词栏和宾词 栏两个部分组成。
主词栏是统计表所要说明的总体及其组成 部分,一般都列在表的左半部分;
宾词栏是统计表用来说明总体数量特征的各 个统计指标及其数值,一般都列在统计表 的右半部分。
此外,统计表还有补充资料、注解、资料 来源、填表单位、填表人等附加内容。
⑵组距数列:是以表示一定变动范围的两个 变量值构成的组所编制的变量频数分布。
二、变量数列的编制
(见教材60~64页)
三、累计频数与累计频率
向上累计频数(或频率) ,即先列出各组的 上限,然后由标志值低的组向标志值高的 组依次累计频数(或频率)。某组向上累 计频数表明该组上限以下的各组单位数之 和是多少,某组向上累计频率表明该组上 限以下的各组单位数之和占总体单位数的 比重。
正J形
反J形
(c)J形分布
(d)U形分布
第四节 统计资料的显示
本节重点: 统计表的结构 统计表的编制
本节难点: 统计表在编制规则
一、统计表
(一)统计表的定义和结构
统计调查所得来的原始资料,经过整理,得 到说明社会现象及其发展过程的数据,将 这些数据按一定的顺序排列在表格上,就 形成了统计表。 广义的统计表包括统计工作各个阶段中所 用的一切表格。
品质频数分布
变量频数分布
单项数列
组距数列
1.品质频数分布:简称为品质数列,它是经 过属性分组后形成的频数分布,其组别表 现为一系列的概念或范畴。
2.变量频数分布:简称为变量数列,它是经 过变量分组后形成的分布数列,其组别表 现为不同的数值或数域。
⑴单项数列:是以一个变量值为一组编制的 变量频数分布。
教学目的和要求:
1.了解统计数据整理的概念和重要意义; 2.熟悉整理的原则和内容,并能进行预处理; 3.掌握分组的概念、特点和原则,能熟练进行分组,熟
悉分组的作用,了解分组的种类;
4.掌握频数分布的概念及其构成,熟悉频数分布的编制 方法;
5.掌握组限的表现形式及原则、组距和组中值的计算; 6.掌握统计表的含义及其构成,熟悉统计表的编制,了
(2)组距式分组:就是将变量依次划分为几 段区间,一段区间表现为“从……到……” 距离,把一段区间内的所有变量值归为一 组,形成组距式变量数列。区间的距离就 是组距。对于连续型变量或者变动范围较 大的离散型变量,适宜采用组距式分组。
2.间断组距式分组和连续组距式分组
(1)间断组距式分组 :是指组限不相连的分 组。
(适用所有闭口组)
或=
本组下限 本组组距 2
(适用上开口组)
或= 本组上限 本组组距(适用下开口组) 2
第三节
本节重点: 频数、频率 变量数列
频数分布
本节难点: 频数分布的编制
一、频数分布及其构成要素
(一)频数分布 在统计分组的基础上,将总体所有的单 位按某一标志进行归类排列,并计算 各组的单位数称为频数分布,或次数 分布。
正偏(右偏)
负偏(左偏)
(a)正态分布
(b)偏态分布
如图(a)所示,其分布特征是以标志变量 中心为对称轴,左右两侧对称,两侧变量值 分布的次数随着与中间变量值距离的增大而 渐次减少。在统计学中,称这种分布为对称 分布。
而图(b)为非对称分布,它们各有不同方 向的偏态,即左偏态分布和右偏态分布。客 观实际中,许多社会现象统计总体的分布都 趋于对称分布中的正态分布。正态分布是描 述统计中的一种主要分布,它在社会经济统 计分析中具有重要的意义。
审核资料的及时性,是看填报单位是否按时 报送了有关资料。对不报、漏报或迟报的 现象都要及时查清。
2.审核资料的正确性:
审核资料的正确性,是检查所填报的资料是 否准确可靠。常用的审核方法有两种:
(1)逻辑检查
首先,从理论上或常识上检查资料是否有悖 常理、有无不切实际或不符合逻辑的地方。
其次,是检查各项目之间有无相互矛盾的地 方。
(二)频数分布的两个要素
1.组别:总体按某标志所分的组
2.频数(次数)和频率:各组的单位数叫频数, 各组的单位数与总体单位总数之比叫频率。 频率具有如下两个性质:
(1)各组频率都是界于0和1之间的一个分数。
即:
0 f 1 f
(2)各组频率之和等于1
。即
f f
1
(三)频数分布的种类 频数分布
4.组限的表现形式、组距和组中值的计算;
本章教学时数
➢ 6学时
本章教学方法
➢ 讲授法、案例法、演示法
第一节 统计数据整理概述
➢ 本节重点: ➢ 数据整理的概念 ➢ 数据预处理的方法
➢ 本节难点: ➢ 数据的预处理
一、统计整理及其类型
统计整理:就是对搜集得到的初始数据 进行审核、分组、汇总,使之条理化、 系统化,变成能反映总体特征的综合数 据的工作过程。对已整理过的资料(包 括历史资料)进行再加工也属于统计整 理。
统计整理的意义:
1、统计整理是整个统计工作和研究过 程的中间环节,起着承前启后的作用。 统计整理是统计调查的继续,又是统计 分析的基础。
2、统计整理还是积累历史资料的必要手 段。
统计整理的类型: 1.定期统计报表数据的整理 2.专题性统计数据的整理 3.历史统计数据的整理
二、统计整理的原则和内容
(5)对统计数据分门别类地系统积累。
三、数据的预处理
(一)数据的审核
1.审核资料的完整性和及时性 审核资料的完整性,就是看调查单位或填报
单位是否齐全;规定的项目是否都有答案, 应报资料的份数是否符合规定。
解频数分布的种类及常用的统计图的绘制;
本章重点
1.分组的概念、特点和原则,分组的作用,
能熟练进行分组; 2.频数分布的概念及其构成; 3.组限的表现形式及原则、组距和组中值的
计算; 4.统计表的含义及其构成,统计表的编制方
法和原则;
本章难点
1.统计数据的预处理;
?
2.统计分组的方法;
3.频数分布的编制;
第四章 统计数据的整理和显示
➢ 教学目的要求 ➢ 本章重点 ➢ 本章难点 ➢ 教学方法 ➢ 教学时数
90 80 70 60 50 40 30 20 10
0 第一季度 第二季度 第三季度 第四季度
东部 西部 北部
➢第一节 ➢第二节 ➢第三节 ➢第四节
统计数据整理概述 统计数据分组 频数分布 数据的显示
二、统计分组的原则
穷尽原则和互斥原则。
三、统计分组的作用
划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系
四、分组的类型
按分组作用或目的不同 类型分组 结构分组 分析分组
四、分组的类型
按分组标志的多少 简单分组 复合分组
并列分组
四、分组的类型
按分组标志性质
属性分组
变量分组
(2)计算检查
即检查各项指标的计算口径、计量单位是否符 合规定,并通过各种计算方法来检查各指标 间的数字是否相互衔接。
➢ 3.历史资料的审核:在利用历史资料(或其 他间接资料)时,应审核资料的可靠程度、 指标含义、所属时间与空间范围、计算方 法和分组条件与规定的要求是否一致。一 般可以从调查资料的历史背景、调查者搜 集资料的目的以及资料来源等,来判断资 料的可靠程度,也可以从指标间的相互关 系以及指标的变动趋势来检查它的正确性。
狭义的统计表专指分析表和容纳各种统 计资料的表格,也就是通常所说的统 计表,它清楚地、有条理地显示统计 资料,直观地反映统计分布特征,是 统计分析的一种重要工具。
统计表的结构,可以从表式和内容两 个方面来认识。
1.从表式上看,统计表是由纵横交叉的 线条组成的一种表格,表格包括总标 题、横行标题、纵栏标题和指标数值 四个部分。
(二)资料审核后的订正
通过上述审核,如发现有缺报、缺份和缺项等 情况,应及时催报、补报;如有不正确之处, 则应分别不同情况作如下处理:
(1)对于可以肯定的一般错误,应及时代为更正, 并通知原报单位。
(2)对于可疑之数或无法代为更正的错误,应要 求原单位复查更正。
(3)如果所发现的差错在其他单位也可能发生 时,应将错误情况通报所有单位,以免发 生类似错误。
(2)连续组距式分组 :凡是组限相连(或重 叠)的分组,即以同一数值作为相邻两组的 共同界限的分组。统计上规定: “上限不在内”
3.等距分组与异距分组
等距分组:就是标志值在各组保持相等的 组距,即各组的标志值变动都限于相同的 范围。凡是在标志值变动比较均匀的情况 下,都可采用等距分组。
异距分组:各组组距并不完全相等的分组, 在下列情况下,就必须考虑采用异距分组:
(二)U型分布
U型分布的形状与钟型分布相反,靠近中间 的变量值分布次数少,靠近两端的变量值 分布次数多,形成“两头大,中间小”的U 型分布。如人口死亡率分布,人口总体中, 幼儿和老人死亡率高,而中青年死亡率低。 如下图(c)。
(三)J型分布
J型分布有两种类型,一种是次数随着变量 的增大而增多,如投资按利润率大小分布。 另一种 呈反U型分布,即次数随着变量增 大而减少,如随着产品产量的增加,产品 单位成本下降。如下图(d)
数据整理的原则:
1.目的性原则 2.联系性原则 3.简明性原则
数据整理的内容
编制 统计图表
审核
汇总
分组
数据整理的具体步骤
(1)对搜集到的资料进行全面审核,以确 保统计资料符合统计研究目的的要求, 资料准确无误。
(2)根据研究目和统计分析的需要,选择 整理的标志,并进行划类分组。
(3)在分组的基础上,将各项资料进行汇 总,得出反映各组和总体数量特征的 各种指标。
(4)对于严重的错误,应发还重新填报,并查 明发生错误的原因,若属于违法行为,则 应依法严肃处理。
第二节 统计分组
本节重点: 统计分组的概念、作用和原则 统计分组的方法
本节难点: 统计分组的方法
一、统计分组的概念
根据社会经济现象的特点和统计研究的 目的要求,按照某个重要标志(或几 个标志)把总体划分为若干不同性质 的组,称为统计分组。
组数的多少直接取决于两个因素,一个是总 体的全距,另一个是组距。在等距分组的 条件下,组数等于全距除以组距。在组距 既定的条件下,全距大则组数多,全距小 则组数少;在全距既定的条件下,组距大 则组数少,组距小则组数多。
(三)组中值
组中值:各组中点位置所对应的变量值。其计算公
式为:
组中值=
上组下限 本组下限 2
(二)变量分组的方法
按数量标志分组,应注意如下两个问题:
首先,分组时各组数量界限的确定必须能反 映事物质的差别。
其次,应根据被研究的现象总体的数量特征, 采用适当的分组形式,确定相宜的组距、 组限。
1.单项式分组与组距式分组
(1)单项式分组:就是用一个变量值(标志 值)作为一组,形成单项式变量数列。单项 式分组一般适用于离散型变量且变量变动范 围不大的场合。
第一,标志值分布很不均匀的场合。 第二,标志值相等的量具有不同意义的场合。 第三,标志值按一定比例发展变化的场合。
变量数列
单项数列
组距数列
等距数列
异距数列
七、组距、组Hale Waihona Puke Baidu与组中值
(一)组距 组距是各组上下限之间的距离,即各 组最大标志值与最小标志值之差。
(二)组数
全距是总体中最大的标志值与最小的标志值 之差。
向下累计频数(或频率),即先列出各组 的下限,然后由标志值高的组向标志值低 的组依次累计频数(或频率)。某组向下 累计频数表明该组下限以上的各组单位数 之和是多少,某组向下累计频率表明该组 下限以上的各组单位数之和占总体单位数 的比重。
四、频数分布的类型
(一)钟型分布
钟型分布的特征是“两头小,中间大”, 即靠近中间的变量值分布的次数多,靠近 两边的变量值分布的次数少,其曲线图宛 如一口钟,如下图所示。
五、分组标志的选择
要符合统计研究的目的和要求 要选择最能说明事物本质特征的标志 要考虑到现象所处的具体历史条件
六、统计分组的方法
(一)属性分组的方法
1.对事物进行属性分组,其组数的多少首先 取决于事物本身的特点。
2.对于有些事物构成比较复杂,组数可多可 少的情况,就需要考虑统计研究任务的具体 要求
总标题是统计表的名称,它扼要地说 明表的基本内容,并指明时间和范围。 它置于统计表格的正上方。
横行标题是横行的名称,一般放在表格的 左方;
纵栏标题是纵行的名称,一般放在表格的 上方。横行标题和纵行标题共同说明填入 表格中的统计数字所指的内容。
指标数值是列在横行和纵栏的交叉处,即表 格中的数字就是指标数值,用来说明总体 及其组成部分的数量特征,它是填写在统 计表格的核心部分
2.从内容上来看,统计表是由主词栏和宾词 栏两个部分组成。
主词栏是统计表所要说明的总体及其组成 部分,一般都列在表的左半部分;
宾词栏是统计表用来说明总体数量特征的各 个统计指标及其数值,一般都列在统计表 的右半部分。
此外,统计表还有补充资料、注解、资料 来源、填表单位、填表人等附加内容。
⑵组距数列:是以表示一定变动范围的两个 变量值构成的组所编制的变量频数分布。
二、变量数列的编制
(见教材60~64页)
三、累计频数与累计频率
向上累计频数(或频率) ,即先列出各组的 上限,然后由标志值低的组向标志值高的 组依次累计频数(或频率)。某组向上累 计频数表明该组上限以下的各组单位数之 和是多少,某组向上累计频率表明该组上 限以下的各组单位数之和占总体单位数的 比重。
正J形
反J形
(c)J形分布
(d)U形分布
第四节 统计资料的显示
本节重点: 统计表的结构 统计表的编制
本节难点: 统计表在编制规则
一、统计表
(一)统计表的定义和结构
统计调查所得来的原始资料,经过整理,得 到说明社会现象及其发展过程的数据,将 这些数据按一定的顺序排列在表格上,就 形成了统计表。 广义的统计表包括统计工作各个阶段中所 用的一切表格。
品质频数分布
变量频数分布
单项数列
组距数列
1.品质频数分布:简称为品质数列,它是经 过属性分组后形成的频数分布,其组别表 现为一系列的概念或范畴。
2.变量频数分布:简称为变量数列,它是经 过变量分组后形成的分布数列,其组别表 现为不同的数值或数域。
⑴单项数列:是以一个变量值为一组编制的 变量频数分布。
教学目的和要求:
1.了解统计数据整理的概念和重要意义; 2.熟悉整理的原则和内容,并能进行预处理; 3.掌握分组的概念、特点和原则,能熟练进行分组,熟
悉分组的作用,了解分组的种类;
4.掌握频数分布的概念及其构成,熟悉频数分布的编制 方法;
5.掌握组限的表现形式及原则、组距和组中值的计算; 6.掌握统计表的含义及其构成,熟悉统计表的编制,了
(2)组距式分组:就是将变量依次划分为几 段区间,一段区间表现为“从……到……” 距离,把一段区间内的所有变量值归为一 组,形成组距式变量数列。区间的距离就 是组距。对于连续型变量或者变动范围较 大的离散型变量,适宜采用组距式分组。
2.间断组距式分组和连续组距式分组
(1)间断组距式分组 :是指组限不相连的分 组。
(适用所有闭口组)
或=
本组下限 本组组距 2
(适用上开口组)
或= 本组上限 本组组距(适用下开口组) 2
第三节
本节重点: 频数、频率 变量数列
频数分布
本节难点: 频数分布的编制
一、频数分布及其构成要素
(一)频数分布 在统计分组的基础上,将总体所有的单 位按某一标志进行归类排列,并计算 各组的单位数称为频数分布,或次数 分布。
正偏(右偏)
负偏(左偏)
(a)正态分布
(b)偏态分布
如图(a)所示,其分布特征是以标志变量 中心为对称轴,左右两侧对称,两侧变量值 分布的次数随着与中间变量值距离的增大而 渐次减少。在统计学中,称这种分布为对称 分布。
而图(b)为非对称分布,它们各有不同方 向的偏态,即左偏态分布和右偏态分布。客 观实际中,许多社会现象统计总体的分布都 趋于对称分布中的正态分布。正态分布是描 述统计中的一种主要分布,它在社会经济统 计分析中具有重要的意义。
审核资料的及时性,是看填报单位是否按时 报送了有关资料。对不报、漏报或迟报的 现象都要及时查清。
2.审核资料的正确性:
审核资料的正确性,是检查所填报的资料是 否准确可靠。常用的审核方法有两种:
(1)逻辑检查
首先,从理论上或常识上检查资料是否有悖 常理、有无不切实际或不符合逻辑的地方。
其次,是检查各项目之间有无相互矛盾的地 方。
(二)频数分布的两个要素
1.组别:总体按某标志所分的组
2.频数(次数)和频率:各组的单位数叫频数, 各组的单位数与总体单位总数之比叫频率。 频率具有如下两个性质:
(1)各组频率都是界于0和1之间的一个分数。
即:
0 f 1 f
(2)各组频率之和等于1
。即
f f
1
(三)频数分布的种类 频数分布
4.组限的表现形式、组距和组中值的计算;
本章教学时数
➢ 6学时
本章教学方法
➢ 讲授法、案例法、演示法
第一节 统计数据整理概述
➢ 本节重点: ➢ 数据整理的概念 ➢ 数据预处理的方法
➢ 本节难点: ➢ 数据的预处理
一、统计整理及其类型
统计整理:就是对搜集得到的初始数据 进行审核、分组、汇总,使之条理化、 系统化,变成能反映总体特征的综合数 据的工作过程。对已整理过的资料(包 括历史资料)进行再加工也属于统计整 理。
统计整理的意义:
1、统计整理是整个统计工作和研究过 程的中间环节,起着承前启后的作用。 统计整理是统计调查的继续,又是统计 分析的基础。
2、统计整理还是积累历史资料的必要手 段。
统计整理的类型: 1.定期统计报表数据的整理 2.专题性统计数据的整理 3.历史统计数据的整理
二、统计整理的原则和内容