长江大学统计学原理黎东升主编统计PPT
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
折叠法:
是将每一个调查表中所需 要汇总的项目和数值折在边上, 一张一张重叠起来,进行汇总 计算。这种方法避免了过录, 省时省力。
卡片法:
先要准备好摘录卡片,将每 个总体单位需要汇总的项目数值 摘录在一张卡片上,然后根据卡 片进行分组和汇总计算。在总体 单位多、复合分组多时,卡片法 是手工汇总中较好的方法。
某种农作物产量与耕作深度的关系
按耕作深度分组 (厘米) 10-12 12-14 14-16 16-18 18-20
耕种地 块数 7 10 16 12 5
平均亩产量 (公斤) 200 230 270 310 300
耕作深度与亩产量关系折线图
平
均 320
亩 300
产 280
( 公
260
斤 240
﹨
220
K5
6
7
8
9
等距数列与异距数列:
等距数列——组距相等的组距数列称。 异距数列——组距不等的组距数列。
等距分组一般适用于变量值比较均 匀的情况。要尽量应用等距分组,它便 于各组间单位数与标志值的直接对比, 也便于计算各项综合指标和进行对比分 析,还便于绘制统计图。
① 分组的对象是总体:是在总体内部进行 的一种定性分类,它把总体划分为一个 个性质不同的、范围更小的部分;
② 兼有“分”与“合”双重含义:对总体 而言是“分”,对总体单位而言是 “合”,对分组标志而言是“分”,而 对其它标志而言,是“合”;要保持 “组内的同质性与组间的差异性”。
③ 分组要有分组标志:统计分组的关键是 正确选择分组标志和划分各组界限。
组数:指将全体变量值分成多少组
组距:指分组条件下每组变量值的变化范 围,即每组变量值区间的距离。
组距=上限-下限
(连续式分组)
或组距=上限-下限+1(间断式分组)
等距数列的组距
全距R 组数K
组数与组距:
组数与组距是相互制约成反比的,组 距小,组数多,就不易显示事物的规律性; 组距大,组数少,就会使分组的资料与实 际资料的出入愈大,客观事物的真实性就 愈差。分组应适当,组距与组数的确定应 该全面分析资料所反映的事物内容、变量 值的分散程度等因素,保证组内的同质性, 组间的差异性,不能强求一致。
缺点:原始资料如有差错不能就地更正,
整理结果有时不能及时满足各地区、各 部门的需要。
结合使用:综合汇总与汇审汇编。
四、统计整理的技术
手工汇总:手工汇总是使用算盘和
小型计算器等手工方式进行汇总。 常用的方法有四种:
(1)点线法 (2)过录法 (3)折叠法 (4)卡片法
电子计算机汇总
点线法(划记法):
按经济类型分 集体所有制企业 城乡个体企业
对全国的工业企业进行复合分组
重工业
全民所有制 轻工业
集体所有制 重工业 轻工业
个体所有制 重工业 轻工业
大型企业
中型企业 小型企业
【例】 对全国的工业企业进行多个
简单分组并列形成分组体系
按经济类型分
全民所有制企业 集体所有制企业 城乡个体企业
按轻重工业分 重工业 轻工业
电子计算机汇总:
常用统计软件包:
SAS (Statistical Analysis System) SPSS(Statistical Pakage for the Social
Science) SARP(Statistical Annual Report
Processing System)
电子计算机汇总步骤:
统计分组与汇总
1. 统计分组就是根据整理的目的要求,按 照规定的标志进行区分若干组成部分的 一种统计方法。
2. 汇总是对分组后的各项指标进行汇总, 并计算各组的单位数和合计数,计算出 说明总体和各组情况的统计指标数值。
分组与汇总是统计整理的中心内容, 统计分组是统计整理的关键。
三、统计资料整理的组织形式
2.按数量标志分组
选择反映事物数量差异的数量标志作 为分组标志,并在其变异范围内划定 各组界限。将总体分成性质不同的若 干组成部分。结果形成变量数列。
变量分组的目的并不是单纯确定各组 在数量上的差别,而是要通过数量上 变化来区分各组的不同类型和性质。
第三节 次数分布数列
一、有关的概念 次数分布——指在分组的基础上,把总
齐备性(及时性与 完整性)审核是审 核的前提,
准确性审核是审 核的核心。
准确性审核的方法有:
逻辑检查:就是依据经验和现象之间的内
在联系,检查调查资料的内容是否合理, 检查各调查项目的资料是否存在着情理 上或逻辑上的矛盾。
计算检查:就是运用计算工具,对调查资
料重新进行核算、检查汇总的数据是否 正确,调查表中的有关数值是否平衡。
1. 简单分组:只按一个重要标志对总
体分组;
2. 复合分组:对总体按两个或两个以
上的标志进行的重叠式分组,即在按 某一个标志分组的基础上再按另一个 标志进行分组。
3. 分组体系:按一系列相互联系、相
互补充的标志对同一总体分别进行分 组而结合成的体系。
【例】
对全国的工业企业进行简单分组 全民所有制企业
二、次数分布数列的种类
品质数列
单 项 变 量 数 列
变量数列
离
散
型组
距
变
量
数
列异 等
距 距
数 数
列 列
连
续
型异 等
距 距
数 数
列 列
例:某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)
Biblioteka Baidu男 女 合计 组别
30 10 40 次数
75 25 100 频率
三、次数分布数列的编制
(一) 品质数列的编制 对一些复杂的现象分组时,一定
月工资分组 (元)
1000 以下 1000-1500 1500 以上 合计
工人数 (人) 210 187 133 530
占总数比重 (%) 39.6 35.3 25.1
100.0
组别(变量) 次数(频数) 频率(比率)
不计算判断:哪组平均工资高?
月工资分组 (元)
1000 以下 1000-1500 1500-2000
逐级汇总:按照一定的统计管理系 统,由各级统计机构自下而上地逐 级将调查资料汇总上报。
优点:能满足各地区、各部门对统计资
料的需要,同时便于就地审核和订正原 始资料。
缺点:费时较长,发生差错的几率大 。
集中汇总:把统计调查资料集中在 组织调查的最高机关或由它指定的 机构进行汇总。
优点:可缩短汇总时间,减少汇总差错。
统计分组的作用
① 划分复杂现象的类型; ② 研究事物的内部结构; ③ 分析现象间的依存关系。
“九五”期间我国国内生产总值构成(%)
年 份 1996 1997 1998 1999 2000
第一产业 第二产业 第三产业 合计
20.4 19.1 18.6 17.6 15.9 49.5 50.0 49.3 49.4 50.9 30.1 30.9 32.1 33.0 33.2 100.0 100.0 100.0 100.0 100.0
按企业规模大小分
大型企业 中型企业 小型企业
【例】
男工 干
人 部
女工 干
人 部
按
性
别
分
男 女
按
职
称
分
工 干
人 部
四、统计分组的原则
1.穷尽原则:就是要使总体内每一单
位都能无一例外地划归到各自所属的 组。为了保证“不遗漏”;
2.互斥原则:就是把总体分组后,各
个组的范围应该互不相容,互相排斥。 为了保证“不重复”。
频 率:各组单位数占总体单位数的比 重,即f/ f 。又称为比重。
注:
在变量数列中标志值构成的数列表示 标志值的变动幅度;
频数构成的数列则表明相应标志值的 作用程度,频数愈大则组的标志值对 于全体标志水平所起的作用也愈大, 反之,频数愈小则组的标志值所起的 作用也愈小。
例:某工厂工人月工资分组表
要按照国家颁布的分类标准或者 有关的规章制度进行; 组与组之间不能存在从属关系; 各组包含的单位数之和应等于总 体单位数。
(二)变量数列的编制
单项变量数列:把每一个变量值分别 列组所形成的数列。
编制条件: 变量是离散变量 变量的不同取值个数较少
组距变量数列:
——将全部变量值依次划分为若干个 区间,并将每一区间的变量值作 为一组所形成的数列。
2000以上 合计
第一组工 人数(人)
15 10 45
30 100
第二组工人 数(人)
45 30 10
15 100
两个构成要素:
(1) 分组标志的具体表现; (将总体按某标志所分成的各个组)
(2) 与之相对应的各组次数或频率
(各组所包含的总体单位数)。
统计分布的意义:
统计分布是统计整理结果的 一种重要的表现形式,也是统计 分析的一种重要方法。
亩 200 )
(注:1亩为0.067公顷) 10 12 14 16 18 20 22
耕作深度(厘米)
二、分组标志选择的原则
1. 根据统计研究目的和任务选择 分组标志;
2. 选择最能反映现象本质特征的 标志作为分组标志;
3. 考虑现象所处的具体历史条件 或经济条件来选择分组标志。
三、统计分组的种类
就是用划“正”等记号,计算 各组和总体的单位数的方法。划 记法简便易行,但容易出错,它 只适合于总体单位不太多的情况。
过录法:
是依据统计汇总表中分组的要求,先把 各单位的实际统计资料过渡填写到预先准备好 的表格上,计算出结果,然后将计算结果填入 正式的统计汇总表。
优点:是汇总的内容多,便于校对检查。 缺点:是工作量大,费时费力。
斯特杰斯(Sturges)经验公式:
现象近似于正态分布,进行等距 分组,则可参考下面美国学者斯特杰 斯提出的分组数的经验公式:
K(组数)=1+3.322lgN
d
(
组距)
R K
( (
全距) 组数)
最大值 13.
最小值 322lgN
为计算方便:
组距通常取5或者10的整数倍
N 15-24 25-44 45-89 90-179 180-359
二、统计整理的程序(基本步骤)
1. 设计和编制统计整理方案; 2. 统计资料审核; 3. 统计分组和汇总; 4. 编制统计图表; 5. 积累和保管统计资料。
设计整理方案:
① 确定汇总的指标与综合表; ② 确定分组方法,规定各种指
标汇总时应如何进行分组; ③ 确定数据汇总的形式。
统计资料的审核与订正:
编制条件: ① 变量是连续变量; ② 或者:总体单位数较多,变量不
同取值个数也较多的离散变量。
组距数列的编制步骤:
① 排序,计算全距 ② 确定组数、组距 ③ 确定组限及其表示法 ④ 计算频数、频率 ⑤ 制作组距数列统计表
1.对原始数据排序,计算全距(R) R=最大变量值-最小变量值
2.确定组数(K)和组距(d)
组内的同质性,组间的差异性。
五、统计分组方法
1.按品质标志分组:选择反映事物质的差异的 品质标志作为分组标志,并在其变异内划定 各组界限,结果形成品质数列。
分组标志一经确定,组名称和组数也就确定, 不存在组与组之间界限区分的困难。
复杂的情况下,各组界限不易划分,从这一 组到另一组存在各种过度状态,边缘不清。 国家统计部门常印发有统一的分类目录。
① 编程序; ② 编码; ③ 数据输入; ④ 资料错误信息的检查和修正; ⑤ 运行程序; ⑥ 提供统计资料。
第二节 统计分组
一、概念与作用
统计分组——就是根据统计研究目的和 被研究总体的属性和数量特征,按 照某个或某几个重要标志,将总体 划分为若干性质不同而又有联系的 部分或组的一种统计方法。
理解“统计分组”时应注意:
第一节 概 述
一 有关概念 统计资料整理:就是根据统计研究
目的,对统计调查获取的资料进 行科学的加工整理(分组与汇总), 使之条理化、系统化,为统计分 析提供综合资料的工作过程。
统计整理的作用:
1.使说明总体单位特征的标志值过渡到 说明总体数量特征的指标值。
2.是从感性认识上升到理性认识的过渡 阶段。统计整理是统计调查的继续, 统计分析的前提,是整个统计工作活 动全过程的中间环节,起着承前启后 的作用。
第三章 统计整理
任课教师:汤来香 tanglx2000@163.com
学习要求:
明确统计整理在统计研究中承 前启后的地位;掌握分组的方法 和汇总技术;认识统计分布是统 计整理的重要表现形式;学会统 计表的编制并能熟练地运用。
主要内容:
§1 统计整理概述 §2 统计分组 §3 次数分布数列 §4 统计图与统计表
体的所有单位按组归并排列,形成总体 中各个单位在各组间的统计分布。又可 称次数分配,或频数分布。
统计分布的实质是把总体的全部单位按 某标志所分的组进行分配,所形成的数 列因此又称分配数列或分布数列。
有关的概念:
次 数:指分布在各组的总体单位数, 又称为频数 ,一般用f表示。
总次数:即全部总体单位数,一般用 f 表示