第三章 统计整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:
某班 40 名学生统计考试成绩分组表 学生按成绩分组 60 分以下 60~70 70~80 80~90 90 分以上 合计 学生数/人 2 6 13 15 4 40 比重/% 5.00 15.00 32.5 37.5 10.00 100.00
20
15
学生数(人)
10
5
0 60 70 80 90
2、根据研究的目的和变量的分布特点,确定变量 数列的形式 编制单项变量数列还是组距数列,主要取决于所 研究变量的类型和变量的变动幅度。对于连续变量, 只能编制组距数列;对于离散变量,则根据其变量值 的多少和变异幅度的大小来确定,如果变量值较少, 而且变异幅度较小,可编制单项变量数列;如果变量 值较多,而且变异幅度较大,应编制组距数列。 在组距数列中,有等距数列和不等距数列两种, 采用等距还是不等距,主要取决于现象的特点和研究 目的。从现象特点来说,一般在变量值分布均匀的情 况下,应采用等距式;从研究目的来说,如果是为了 便于分组比较,便于计算总体平均数和绘制统计图, 一般也采用等距式。
第三节 分配数列 (分布数列、频数分布)
一、分配数列的概念和种类 (一)分配数列的概念
次数分配或 分配数列
在统计分组的基础上,将总体 的所有单位按组归类整理,并 按一定顺序排列,形成总体中 各个单位在各组间的分布P47
次数 (频数)
分布在各组的个
体单位数P47
比率 (频率) 各组次数与总 次数之比P47
计算公式:P52
例: P52
异距数列常在以下场合运用: P52
⑤开口式组距数列和闭口式组数列 开口式组距数列是指数列的第一组没有下限, 或最后一组没有上限 闭口式组距数列是指第一组有下限,最后一 组有上限。
二、分配数列及分布曲线 (一)分配数列的编制 例:某班40名学生的统计成绩如下: 83 78 88 86 74 83 89 74 87 68 33 75 83 71 66 77 81 70 74 91 73 81 99 84 73 60 64 83 85 72 62 68 95 80 92 78 79 83 85 54 1、将原始资料按其数值大小重新排列,并计算全 距R 33 54 60 62 64 66 68 68 70 71 72 73 73 74 74 74 75 77 78 78 79 80 81 81 83 83 83 83 84 85 85 85 86 87 88 89 91 92 95 99 R=99-33=66分
全距 等组距 组数
等距数列适用于标志变异比较均匀的现象
B、异距数列:每组的组距不全相等P52
例:P52 在研究各组次数实际分布时,要消除组距不
同的影响,这就要将不等距数列的次数换算为标 准组距次数。可以数列中最小组组距为标准组距,
将不等距次数换为统一的标准组距次数,或计算
次数密度或频率密度。 P52
4、确定组限 组限应根据变量的性质来确定,要有利于反映出 总体各单位的实际分布特征,具体应考虑以下几方面: (1)组限最好用整数表示;(2)应使第一组下限不 大于资料中的最小变量值,最末组上限不小于资料中 的最大变量值;(3)对于连续变量,应采用重叠组 限,并且习惯上按照“上限不在内”原则处理,而离 散变量两种方法都可以。
方法 点线法。也称为划记法,即通过划点或 划线为记号来汇总各组和总体单位数 。 适用于总体单位不多,只要求汇总单位 数而不需汇总标志值的情况。 过录法。即先将统计资料过录到整理表 上,然后再按整理表汇总 。适用于总体 单位不多且分组较简单的汇总工作。
折叠法。即把所有调查表的相同项目和 数值折在边上,一张一张错叠起来,露 出需要汇总的项目和数值,然后汇总 。
3、科学地确定组数和组距 对组距和组数,不能机械规定先确定什么。从原 则上讲,都应力求符合实际,能够反映总体分布的特 点。当变量值变动比较均匀,并且可能编制等距数列 的条件下,组距可采用斯特奇斯(H.A.Sturges)公式 求得 全距(R) R 组距(I) 组数(K) 1 3.322lg n 如上例,R=66,n=40,代入公式计算得组数 K=6.32,组距I=10.4,取整数,组距为10。 在实际应用中,往往组数略多或略少都问题不大, 但必须是整数,重要的还是应把组距确定下来,组距 应尽可能取5或10的整数倍。
上限 下限 组中值 2
邻组组距 缺上限的开口组组中值 下限 2
邻组组距 缺下限的开口组组中值 上限 2
④等距数列和异距数列 A、等距数列:各组组距相等P50
某厂工人完成生产定额情况表 工人按完成生产定额分组 (%) 80——90 90——100 100——110 110——120 120——130 合计 工人数 绝对数(人) 30 40 60 30 20 180 比重(%) 16.7 22.2 33.3 16.7 11.1 100.0
卡片法。在汇总大量统计资料时,首先将 每一调查单位的资料摘录到一张特制的卡 片上,然后用卡片进行分组汇总。运用于 大规模的专门调查和分组较复杂的资料整 理工作。
第二节 统计分组
一、统计分组的意义和原则 (一)统计分组的意义 统计 分组
就是根据统计研究的目的和客观现 象的内在特点,将统计总体按照一 定的标志区分为若干个组成部分的 一种统计方法。 P41
作用 P41 (二)统计分组的原则 原则
穷尽原则
Fra Baidu bibliotek互斥原则
二、分组标志的选择P44 正确选择分组标志是进行统计分组的关键
1 2 3
要符合统计 研究的目的 和要求
要选择最能 反映被研究 现象本质特 征的标志
要结合现象 所处的具体 历史条件或 经济条件
三、统计分组的种类 分组标志 的多少
P45
简单分组又 称单一分组 ,就是对被 研究对象只 按一个标志 进行的分组
三、累计频数和累计频率(累计次数分布) (一)累计频数(率)分布数列 又称以下累计,或称为较小制累计, 是将各组次数和比率,由变量值低 的组向变量值高的组逐组累计。表 明各组上限以下总共所包含的总体 次数和比率有多少。P55
向上 累计
累计频 数分布 数列
向下 累计
又称以上累计,或称为较大制累计, 是将各组次数和比率,由变量值高 的组向变量值低的组逐组累计。表 明各组下限以上总共所包含的总体 次数和比率有多少。P55
单项变量 数列
异距数列
单项变量数列:每组只用一个变量值表示的 变量数列。在变量值不多和变量值变动幅度不大 时采用。 P47 例:P48
组距变量数列:每个组用由若干个变量值 形成的区间来表示。在变量个数较多,变动幅 度较大时采用。P48 例:P48
组距数列又分为等距数列和异距数列。
组距数列的几个基本概念
统计汇总
编制统计表、绘制统计图
二、统计资料的审核
1、准确性审核
2、完整性审核
3、及时性审核
4、适用性审核
三、统计资料汇总的组织形式和方法 组织形式
逐级汇总:按 照一定的统计 管理系统,由 各级统计机构 自下而上地逐 级将调查资料 汇总上报
集中汇总:把 统计资料集中 在组织调查的 最高机关或由 它指定的机构 进行汇总
第三章
统计整理
本章学习要求:
明确统计整理的意义;弄清统计整理的 程序;掌握统计分组的原则和方法;掌握频
数分布的编制方法;合理使用统计表
第三章
统计整理
第一节 统计整理的一般问题
第二节 统计分组
第三节 分配数列
第四节 统计表
第一节 统计整理的一般问题
一、统计整理的意义和程序 二、统计资料的审核 三、统计资料汇总的组织形式和方法
平行分组体系:对于 同一总体运用两个或 两个以上标志进行简 单分组后平行排列的 体系。
按年龄分组
分组的标 志的性质
品质分组是 按品质标志 进行的分组 ,即按事物 的某种属性 分组
数量分组是 按数量标志 进行的分组
第三节 分配数列 (分布数列、频数分布)
一、分配数列的概念和种类 二、分配数列及分布曲线 三、累计频数和累计频率
P45
复合分组是 对同一总体 选择两个或 两个以上标 志层叠起来 进行的分组
P45
男 本科 女 理科 男 专科 女
特点: P46 复合分组只有在 总体包括的单位 数较多的情况下 才宜采用。
男 本科 女 文科 男 专科 女
文科 文理科分组 理科 16 岁以下 16——18 18——20 20 岁以上 男 按性别分组 女
总体按某标志 所分的组(各组名称)
分配数列的 构成P48 各组所出现的单位数
某年底我国人口性别构成 按性别分组 男 女 合计 各组名称 人口数(万人) 633 347 612 896 1 246 243 次数 比重(%) 50.82 49.18 100.00 频率
(二)分配数列 的种类 P47 品质数列:按 品质标志分组 变量数列:按 数量标志分组 组距变量 数列 等距数列
某班 40 名学生统计考试成绩分组情况
20
15
学生数(人)
10
5
0 60 70 80 90
某班 40 名学生统计考试成绩分组情况
2、异距数列分布图形的绘制 异距数列,应将不等组距次数换算为统一的标准 组距次数,并依此绘制图形,或者在原数列基础上先 计算次数密度或频率密度,再根据次数密度或频率密 度来绘制图形。 例:P53
连续变量分组: “上组限不在内”原 则P53
离散变量分组:相邻 两组的上下限可以不 重合P54
②组距:每个组上限和下限之间的距离P49 当相邻组的组限重合时, 组距=本组上限-本组下限
当各组间的相邻组限不重合时, 组距=下一组下限-本组下限, 或组距=本组上限-上一组上限
③组中值:各组变量范围的中间数值 P54
LOGO
如:前面某班40名学生统计成绩分组表资料, 我们计算其累计分布如下:
某班学生统计考试成绩累计次数表 分数(分) 60 分以下 60~70 70~80 80~90 90 分以上 合计 2 6 13 15 4 40 次数 5.00 15.00 32.50 37.50 10.00 100.00 2 8 21 36 40 —— 向上累计 5.00 20.00 52.50 90.00 100.00 —— 40 38 32 19 4 —— 向下累计 100.00 95.00 80.00 47.50 10.00 —— 人数(人) 比率(%) 人数(人) 比率(%) 人数(人) 比率(%)
5、计算各组单位数,编制变量数列 计算出各组分配的单位数和各组单位所占的比重, 即计算频数和频率,得出所要编制的变量数列。 根据上述资料,得出下列的变量数列。
某班 40 名学生统计考试成绩分组表 学生按成绩分组 60 分以下 60~70 70~80 80~90 90 分以上 合计 学生数/人 2 6 13 15 4 40 比重/% 5.00 15.00 32.5 37.5 10.00 100.00
(二)分布图形的绘制 统计图的种类很多,最常见的是直方图和折线 图等。 1、等距数列分布图形的绘制 直方图是常用的频数分布图形。直方图是以横 轴表示标志值,纵轴表示各组频数的柱形图,可以直 观地反映变量数列的分布特征。柱形的宽度应反映分 组的组距。 对于等距数列而言,可以直接用柱形的高度来 表示频数的分布。 在直方图的基础上,连接各条形顶边的中点 (即各组的中值点),形成一条曲线(折线),曲线 两端应在直方图的左右两边各延伸一个假想组,并将 次数曲线连接横轴两端假想组中点,就形成次数分配 曲线(折线)图。
第一节 统计整理的一般问题
一、统计整理的意义和程序
意义
统计整理是根据统计研究的任务, 对统计调查阶段所搜集到的大量原 始资料进行加工汇总,使其系统化、 条理化、科学化,以得出反映事物 总体综合特征的资料的工作过程。P38
程序 P40
3 1 2 3 4
对原始资料进行审核和检查
对原始资料进行统计分组
①组限:指组距数列中各组区间两端的数值
上限:每组的最大值
下限:每组的最小值 闭口组:组距的上限、下限都齐全 开口组:有上限缺下限或有下限缺上限
LOGO
确定组限要遵守一 个基本原则P53
组限的 表示方法
①最小组的下限不能大于最小的变 量值,最大组的上限不能小于最大 的变量值,以使每个单位各有归属。 ②组限应尽可能是引起事物质变的 数量界限,应有利于表现总体分布 的规律性。 ③分组变量有离散变量和连续变量 之分,其组限的表示方法是不同的。