第二章 统计数据的收集整理与显示6
统计学第2章 统计数据的搜集、整理和显示
第二节 数据整理
三、统计指标
(二)统计指标的分类
1. 数量(总量)指标
作用:反映现象的总规模、总水平或工作总量 以绝对数表示(国内生产总值、人口总数、工资总额等) 分类 总体单位数、总体标志总量 时期指标、时点指标 实物指标、价值指标和劳动量指标
第二节 数据整理
三、统计指标
搜集数据的两条途径:统计调查 + 实验 统计调查 —— 调查数据;实验 —— 实验数据 1. 确定调查目的 2. 确定调查对象和调查单位 3. 确定调查项目 4. 调查表格和问卷设计(一览表、单一表,要求简明扼要) 5. 确定调查时间(调查时间、调查期限) 6. 确定调查的组织实施计划
(三)统计调查的方案设计
上限不在内
等距分组与异距分组
等距分组
各组的标志值变动都限于相同的范围 优点:便于计算、绘制统计图 适用场合
异距分组
第一,标志值分布很不均匀的场合 第二,标志值相等的量具有不同意义的场合 第三,标志值按一定比例发展变化的场合
品质分组 单项式分组 间断组距式分组 数量分组 组限 连续组距式分组 组距式分组 等距式分组
6组:530 530 530 540 620 620 620 620 720 720 7组:720 720 630 630 630 630 620 620 620 620
8组:650 650 650 650 650 650 650 650 650 650
提问:从上述资料中,同学们能否直接看出该车间总的生产完成
类型分组
“日产量”分组
500以下 500 500以上 合计
第2章数据的搜集、整理和显示分析
5.类别项目重叠。如:你喜欢下列哪种媒体?书本()
VCD() CAI课件() 光盘() 指导书() 其他()
▪ 6.在回答者能懂的范围内提问。如:你认为大学应加
强学习支持服务系统建设吗?(基层的老师、学生不一定 知道“学习支持服务系统”的概念)
• 2.非全面调查
非全面调查可分为抽样调查、重点调查和典型调查。
• (1)抽样调查。抽样调查是按随机原则从调查对象中抽取一 部分单位作为样本进行观察,然后根据所获得的样本数据, 对调查对象总体特征做出具有一定可靠程度的推算。
• 抽样调查有如下几个特点:第一,按随机原则抽取的。第二, 可以对调查对象总体的数量特征做出估计。第三,抽样误差 可以事先计算并加以控制。
• A.普查 B.重点调查 C.典型调查 D.抽样调查
问卷设计
• 一、问卷的内容:
• 1、问卷的编码;
• 2、研究目的、指导语、填表说明;
• 3、指标解释、调查须知及其他事项说明等;
(如涉及需为被调查者保密的内容,必须指明予以保密, 以消除被调查者的顾虑)
• 4、问卷题目;
• 5、调查问卷的最后注明调查员的姓名、访问 日期、访问时间等。
• 2.下列调查中属于非全面调查的有 (多选)
• A.普查 B.重点调查 C.典型调查 D.抽样调查 E.全面统计报表
• 3.调查大庆、胜利、大港等几大油田,以 了解我国石油生产的基本情况,这种调 查属于( )
• A.普查 B.重点调查 C.典型调查 D.抽样调查
• 4.要了解我国农村经济的具体情况,最适 合的调查方式是( )
(三)定期报表形式与专门调查
统计调查按组织形式可分为定期报表形式和专门调查。专 门调查是为某一专题研究而组织的专项调查,一般地,普 查、抽样调查和典型调查等可以是专门调查。
统计学 第二章 统计数据的搜集、整理和显示
登记法
是指当事人根据有关法制法规 规定,在开展某些活动或发生 某事时,主动到有关机构进行 登记,填写有关表格,提供有 关统计信息。
五、问卷设计
(一)问卷的概念与结构
问卷是依据统计研究目的和要求,按照一定的理论假设 设计出来的、由一系列问题、项目、备选答案及说明所组成 的、向被调查者收集资料的一种工具。
即填表须知、交表时间、地点及其他事项说 明。
问卷编号
问卷的基本结构
❖被调查者基本情况
通常放在问卷的最后,主要是有关被调查者的一些 背景资料,该部分所包含的各项问题,可使研究者根 据背景资料对被调查者进行分类比较分析。
❖问题和答案
该部分是调查问卷的核心,包括了所要调 查的全部问题,以及这些问题的所有可供选择 的答案。
和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。
• 商检人员在某超市检查出售的饮料的合格率。
• 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
询问法可分为:
面谈调查法
是指调查人员同被调查者面对面 交谈,当面听取意见,询问有关
问题,搜集数据的方法。
电话调查法
指调查人员利用电话同受访者进 行语言交流,从而获得信息的一
种调查方式。
邮寄调查法
是一种标准化调查,指调查者将印制好的 调查问卷或调查表格,通过邮政系统寄给 选定的被调查者,由被调查者按要求填写 后,按约定的时间寄回的一种调查方法。
第二章统计资料的收集、整理与显示
第二章统计资料的收集、整理与显示第一节统计数据的收集一、统计数据收集的含义和要求统计数据收集是整个统计活动的基础阶段,通常也称为统计调查阶段。
统计数据收集的基本要求是准确性、及时性和完整性。
二、统计数据收集方案设计统计数据收集方案应包括以下一些内容:数据收集目的、数据及其类型、数据收集对象和观测单位、观测标志和调查表、数据收集方式与方法、数据所属时间和数据收集期限、数据收集地点和数据收集的组织。
三、统计数据收集方式有两种:统计调查方式和实验方式。
(一)统计调查方式统计调查就是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地向客观对象搜集资料的过程。
1、普查概念:根据特定的统计研究目的而专门组织的一次性的全面调查,用以收集所研究现象总体的全面资料。
组织方式:a)专门组织普查机构调查;b)利用现有统计资料;基本原则:a)标准时点(避免重复和遗漏)b)调查步骤(同一次调查在不同阶段)统一性原则c)指标口径(内涵)d)调查时间(起止)e)普查周期:我国为期十年的普查制度2、抽样调查抽样调查可分为概率抽样和非概率抽样两类。
(1)概率抽样a)概率抽样是按照随机原则抽取样本,即总体中的每个个体都有已知的、非零的概率被抽取到样本中来。
b)特点:在样本的抽取上遵循随机原则在调查的功能上能以部分推断总体在推断的手段上运用概率估计的方法在推断的理论上,以大数定律和中心极限定理为依据在推断的效果上,抽样误差可以计算并加以控制c)概率抽样从抽样方法上看,可以分为重复抽样和不重复抽样两种。
重复抽样的特点是:总体的每个个体都有数次被抽中的可能性,次抽样之间相互独立。
不重复抽样的特点是:总体中每个个体都只有一次被抽中的可能性,次抽样之间不相互独立d)概率抽样从抽样组织形式上看,可分为简单随机抽样、分层抽样、等距抽样、整群抽样和多阶段抽样五种。
简单随机抽样是抽样调查最基本的组织形式,具体的样本抽取方式有抽签法和随机数表法等;分层抽样特点是必须具备总体所有个体的名录和至少一个分层标志的全面资料,各层的抽样相互独立,尽量把总体差异通过分层而转化为层间差异;等距抽样的特点依固定的间隔和规定的顺序来抽取个体,属于不重复抽样;整群抽样要尽量把总体差异转化为群内差异等,一般属于不重复抽样;多阶段抽样特点是整群抽样和分层抽样两种组织形式的综合。
第2章 统计数据的搜集、整理与显示
1)单项式分组与组距式分组
A)单项式分组:用一个变量值作为一组,形成单项 式变量数列。 变量值又称标志值。按数量标志分组,数量标志的 表现,就是变量的取值 单项式分组一般适用于离散型变量且变量变动范围 不大的场合。 B)组距式分组:将变量依次划分为几段区间,一段 区间表现为“从……到……”距离,把一段区间内的 所有变量值归为一组,形成组距式变量数列。区间 的距离就是组距。 连续型变量或者变动范围较大的离散型变量,适宜 采用组距式分组。
1、向上累计频数(或频率)分布:先列出各 组的上限,然后由标志值低的组向标志值高 的组依次累计。向上累计频数表明某组上限 以下的各组单位数之和是多少,向上累计频 率表明某组上限以下的各组单位数之和占总 体单位数比重的大小。 2、向下累计频数(或频率)分布:先列出各 组的下限,然后由标志值高的组向标志值低 的组依次累计。向下累计频数表明某组下限 以上的各组单位数之和是多少,向下累计频 率表明某组下限以上的各组单位数之和占总 体单位数比重的大小。
16
二、统计分组
(一)统计分组的概念与种类 根据统计研究的目的和客观现象的内在特点,按某 个标志(或几个标志)把被研究的总体划分为若干 个不同性质的组,称为统计分组。
分组的性质:兼有分和合双重含义。 穷尽原则,使总体中的每一个单位都应有组可归,或者说 各分组的空间足以容纳总体所有的单位。 互斥原则,在特定的分组标志下,总体中的任何一个单位 的只能归属于某一组,而不能同时或可能归属于几个组。
特点:可以了解较详细的情况,但无法对现象总体的数量特
征作出准确的推算,也无法测算调查误差。
适用场合 :当调查任务只要求掌握基本情况,而部分单位
统计资料的搜集、整理和显示
第二章 统计资料的搜集、整理和显示
2、确定调查对象与调查单位(Who) (1)调查对象:调查研究的总体。 [例]人口普查:具有中国国籍并在中国境内常住的自然人; 农村生育率调查:农村15~49岁的女性人口。 (2)调查单位:调查研究的总体单位(个体),调查内容的承担者。 (3)填报单位:填写、上报统计资料的单位。
第二章 统计资料的搜集、整理和显示
3、确定调查项目和调查表(问卷)(What) (1)调查项目:调查单位所承担的基本标志。 (2)调查表 单一表:一个调查单位用一张表; 一览表:多个调查单位共一张表。 (3)调查问卷 4、确定调查时间(When) (1)调查时间:资料所属时间。 (2)调查期限:调查工作的起止时间。
1、总标题:时间、空间、总体、指标;
按地区分组
完成投资额(亿元)
增长率(%)
比重(%)
甲
(1)
(2)
(3)
东部地区 中部地区 西部地区
12,188 4,121 2,387
17、5 20、7 21、1
65、2 22、0 12、8
2000年A国工业企业固定资产投资情况 总标题
第二章 统计资料的搜集、整理和显示
STAT
01
02
统计分组 频数分布
本章难点
统计数据采集的方式方法; 统计数据的整理; 统计数据的显示。
本章重点
第二章 统计资料的搜集、整理和显示
第一节 统计数据的搜集 一、概念 (一)定义:具体搜集统计资料的工作过程。 (二)数据的种类 1、调查数据 2、实验数据 (三)统计调查方案的设计 1、明确调查目的(Why) [例]人口普查:准确查清人口的数量、地区分布、构成和素质状况及其变化情况。
第统计分组种类 1、按分组标志的性质不同 (1)品质分组 (2)数量分组 2、按分组标志的多少分类 (1)简单分组:只按一个标志分组 (2)复合分组:按两个或两个以上的标志层叠起来进行分组。 [例]对人口按性别、文化程度进行复合分组。
统计数据的收集整理与显优秀课件
统计数据的收集整理与显优秀
分布在各组中的个体单位数叫做次数或 频数。
各组次数与总次数之比叫做比率或频率 。
将各组别与次数按一定的次序排列所形 成的数列称作次数分布数列,简称分布数列 ,又称分配数列或频数分配。
统计数据的收集整理与显优秀
白领 高中 68
4 17 否
蓝领 小学 72
3 24 是
白领 大学 99
3 33 是
统计数据的收集整理与显优秀
依照各居民户职业类别和文化程度的 具体标志表现对居民户总体进行分组
统计数据的收集整理与显优秀
居民户总体按职业类别分组
按职业类 纳入组内户 别分组 的门牌号
白 领 1、2、5、7
蓝 领 3、4、6
统计数据的收集整理与显优秀
2.意义 统计整理是统计工作过程的第三阶段 ,是统计调查的继续,是统计分析的前提,它 是从对现象的感性认识过渡到对现象理性 认识的开始,是这个过程的连续点,并为 这个过程提供坚实的基础,它在统计工作 中起着承前启后的作用 。
统计数据的收集整理与显优秀
3.统计整理的内容与程序
5
5/7=71.43 %
设计并计算统计指标
完
整
的
分
组
表
统计数据的收集整理与显优秀
数量标志分组
A.单项式分组设计
用单一的数值作为组的名称,这样的分 组设计称为单项式分组设计。单项式分组 设计适用于离散型分组标志或经过离散化 处理的连续型分组标志。
统计数据的收集整理与显优秀
40
【例1】己知某车间有24名工人,他们的日产
统计数据的收集整理与显优秀
统计学 2统计数据收集整理和显示
2019/10/31
25
6.网络调查法
网络调查(又称网上调查)是指利用国际互联网 作为技术载体和信息交换平台进行调查的数据搜 集方法。
其业务流程大体包括方案设计、问卷上网、问卷 检查、数据处理与分析、调查报告等。
2019/10/31
2
根据经济普查资料,我国对2019年GDP进行了重新核 算,2019年我国GDP现价总量为159878亿元,比快报核 算数增加了23002亿元,增幅16.8%。同时,对1993年 以来的GDP历史数据进行了修订。
2019/10/31
3
2.1 统计数据的来源
2.1.1 次级统计数据的来源
2) 统计报表调查事先已作为一种制度布置到 基层报告单位,要求各单位根据原始记录和统 计台账提供报表所需的资料,从而保证了资料 来源的可靠性和准确性;
3) 由于统计报表调查是逐级整理上报,统计 资料可以使各级地方政府和部门及时了解和掌 握本地区、本部门的基本情况。
2019/10/31
17
(3)统计报表调查的局限性
的表格形式、统一的指标、统一的报送 程序和报送时间,自下而上逐级提供基 本统计资料的一种调查组织形式。
我国现行的统计报表, 包括国民经济基本统计 报表和专业统计报表。
2019/10/31
16
(2)统计报表调查的优点
1) 在报表实施范围内,各报告单位按期报送, 可保证调查资料的全面性、连续性和及时性;
实验法一般包括提出研究假设、进行实验设计、 选择实验对象、控制实验环境和收集实验数据 等步骤。
实验法具有方法科学、反映客观、过程容易控 制等优点,但也有时间长、费用高、实验对象 选择的难度大等不足。
第二章统计数据的收集、整理与显示
2019/10/9
版权所有 BY 统计学课程组
10
二、直接数据的来源
直接统计数据的来源渠道主要有 两个:一是专门组织的调查;
二是科学试验。
前者是社会经济数据的主要来源,
后者是自然科学数据的主要来源。 本书着重讨论取得社会经济数据的 方式和方法。
2019/10/9
版权所有 BY 统计学课程组
2019/10/9
版权所有 BY 统计学课程组
7
对于某些特定行业的数据,如证券业数据,我们 可以从各证券报、中国证券监督管理委员会、上海证 券交易所、深圳证券交易所、各证券公司等单位的网 站数据库和出版发行的刊物中取得有关数据。各上市 公司的季报、半年报、年报中的各种数据属于公开数 据,可以直接使用,但如果存在后续的补充报告,在 使用时应该及时调整。
2019/10/9
版权所有 BY 统计学课程组
22
访问调查法
按照调查对象的不同,访问调查 可分为居民入户调查和个别采访两 种。
按照对调查过程控制程度的不 同,访问调查又可分为非标准式访 问和标准式访问两种。
2019/10/9
版权所有 BY 统计学课程组
23
2.问卷调查法
问卷的形式是一份预先精心设计好的问题表格,
主要用来测定人们的行为、态度和特征。
问卷调查就是将事先设计好的问卷,通过某种途
径送到每一个被调查者的手中,由被调查者自己填答 问题后,由调查员依一定途径收回的调查方法。
进行问卷调查要求被调查者有一定的文化水平及
责任心和合作精神,否则难以保证问卷的回收率,从
而影响调查资料的质量。由于问卷调查的应用非常广
查可迅速取得所需数据。 (4) 采用抽样调查对全面调查资料进行补充。
第2章 数据收集、整理与显示
4、定比尺度 定比尺度又称比率尺度,它是对事物之间比值的一种测 度。其功能要比定距尺度更强一些,除能区分类别、排 序、比较大小、求出大小差异、可采用加减运算以外, 还可以进行乘除运算; 在计量尺度的应用中,需要注意的是,同类事物采用不 同的尺度量化,会得到不同的尺度数据。如农民收入数 据按实际填写就是定距尺度;按高、中、低收入水平分 就是定序尺度;按有无收入计量则是定类尺度;而说某 人的收入是另一人的两倍,便是定比尺度了。
随着社会主义市场经济的建立与完善,抽样调查在我国 统计调查中的应用领域越来越广泛。
18
(四)重点调查
重点调查是指在调查对象中,只选择少数重点单位进 行的非全面调查。所谓重点单位,是着眼于现象的量的方 面而言,尽管这些单位在全部单位中只是一部分,但它们 在所研究现象的标志总量中却占有绝大的比重,在总体中 具有举足轻重的作用。 (五)典型调查 有意识地选择若干个具有代表性的典型单位进行深入、 周密、系统地调查研究。典型调查的主要目的不在于取得 总体数值,而在于了解与数字相关的生动具体情况。
3.统计分组的原则
穷尽原则,就是使总体中的每一个单位都应有组可归,或 者说各分组的空间足以容纳总体所有的单位。 互斥原则,就是在特定的分组标志下,总体中的任何一个 单位的只能归属于某一组,不能同时归属于几个组。
典型调查
具体的统计调查形式
(一)普查
普查是专门组织的一种全面调查。普查一般是调查 属于一定时点上的社会经济现象的总量,但也可以调查某 些时期现象的总量,乃至调查一些并非总量的指标。 (二)统计报表制度
统计报表制度是我国统计调查方法体系中的一种重 要的组织方式。它是根据国家的统一规定,按统一的表格 形式,统一的指标内容,统一的报送时间,自下而上逐级 提供统计资料的统计报告制度。
统计数据的搜集整理和显
02
调查单位——构成调查对象的每一个单位, 即总体单位。
解决向谁调查,由谁来具体提供资料的问题。
2、确定调查对象和调查单位
3、确定调查项目
调查项目——要调查的内容,也就是被调查单位的特征,即标志。
4、设计调查表格和问卷
调查表是容纳调查项目的表格。
调查时间:调查资料所属的时间(时期或时点)。
01
02
03
04
05
06
非全面调查是只对调查对象中的一部分单位进行登记或观察的一种调查方法。 包括:抽样调查、重点调查和典型调查。
返回
02
(二)非全面调查
按照 随机原则 从调查对象中抽取一部分单位作为样本进行调查,根据调查结果推断总体的一种非全面调查组织形式
抽样调查
指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会
组限
对于连续变量,相邻组组限必须重叠; 为避免重复,一般规定“上限不在内”;
指每组两端表示各组界限的变量值,各组的起点值为下限,终点值为上限
每组的最大标志值与最小标志值之差
01
组距d
02
总体中的最大标志值与最小标志值之差。
03
全距(极差)R
04
组距d = 上限U-下限L
05
组数
06
一般为5~7组;也可根据斯特杰斯经验公式确定。
返回
(一)组距数列的编制
按分组标志的性质分类 品质分组:按品质标志进行的分组。 数量分组:按数量标志进行的分组。
返回
3、统计分组的种类
统计分组的方法
分组标志的选择
统计分组的方法阐述 品质分组 数量分组
1
2
3
第二章+统计资料的收集、整理与显示
特点
目的是推断总体的数量特征;
抽样误差可以事先计算并控制;
能用较少的人力、物力和时间达到全面调查
作用
的目的; 调查资料的准确性较高、受人为干扰的可能 性较小。
抽样调查应用范围:
1.不能或难以进行全面调查的总体的数量特征。 如无限总体、范围过大的有限总体等,以及具有破坏性的 产品质量检测等; 2.发展变化比较稳定和有规律性而不必进行全面调查的现象总 体的数量特征。
事物发展的一般规律。 行的典型调查。
5、抽样调查 抽样调查是一种专门组织的非全面调查,它是按照随机原 则从调查对象中抽取一部分样本单位进行调查,再用样本指标 推断总体的数量特征的一种调查组织方式。
随 机 原 则
样本单位的抽取不受主观因素及其他 系统性因素的影响,每个总体单位都有均 等的被抽中机会
5、抽样调查 按随机原则抽取样本单位;
3、重点调查 能以较少的投入和较快的速度取得总体基
作用
本情况及变动趋势的资料;
对重点单位的选择不带有主观性
局限
只适用于客观存在着重点单位的情况
4、典型调查 典型调查也是专门组织的一种非全面调查,它是根据调 查研究的目的和任务,在对调查对象有一定了解的基础上,
有意识地选择少数典型单位 进行调查的一种调查组织方式。
统计调查的种类
按调查单位的范围大小分为 按调查时间是否连续分为 按调查的组织方式不同分为 统计报表 专门调查
非全面调查
全面调查
经常性调查 一次性调查
普查
重点调查
典型调查
抽样调查
2、统计调查的种类 (1)按组织形式分为: ①统计报表: 根据统计法规的规定,按一定的表式和要求,自上而下
统一部署,自下而上逐级提供统计资料的一种统计调查方法。
第二章统计数据搜集整理和显示
(2)数量分组也称变量分组,就是按照数量 标志进行的分组。
数量分组时数量界限的确定必须反映事 物质的区别。
例 1 为了了解某地区银行存款的构成,可以选用存款性 质和期限两个标志分别进行分组:
按存款性质分组
企业存款 储蓄存款 财政性存款
简单 分组
存款同时按其性质及期限分组 企业存款 活期
第二节 数据整理
一、统计整理的一般问题 二、统计分组
一、统计整理的一般问题
统计整理的概念 统计整理的内容和程序
(一)统计整理的含义
把原始数据进行排序,分组, 汇总,编表和绘图, 显示其分布特征的工作过程。
广义的统计整理也包括对原来已经加工的综合资 料的再整理。如历史资料的整理、统计年鉴的编 辑、次级资料(如各出版物公布的)的加工整理 等。
减:产品销售成本
产品销售费用
产品销售税金及附加
二、产品销售利润
加:其他业务利润
……
益表
本月数
本年累计数
5.确定调查时间(when)
调查时间有两个含义: (1)调查时间指调查资料所属的时间。
(具体有时点或时期资料) (2)调查期限是指进行调查工作的的时限, 即调查工作的起止时间。
e.g.我国第五次人口普查(2000年11月1日零 点(调查时间,时点);2000年11月1日到10日, (调查期限10天))
度有关;不同时期数据可加;流量指标)
2.普查 General Investigation
为特定目的而专门组织的一次性
的全面调查。 用于:掌握总体基本资源情况 特点:①专门目的
②全面调查 ③非连续性:
一次性或周期性
3.抽样调查
管理统计学 第2版 第二章 统计数据的收集整理与显示
(4)系统抽样
首先将总体中各 单位按一定顺序 排列,根据样本 容量要求确定抽 选间隔,然后随 机确定起点,每 隔一定的间隔抽 取一个单位的一 种抽样方式。是 纯随机抽样的变
种
最主要的优势就 是经济性。最大 的缺陷在于总体 单位的排列上。 一些总体单位数 可能包含隐蔽的 形态或者是“不 合格样本”,调 查者可能疏忽, 把它们抽选为样
• 普查需要规定标准的时点:如第五次人口普查规定的标准时间 为2010年11月1日零时为标准时间。
统计报表
• 统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级 提供统计资料的调查组织方式。
• 统计报表是我国特有的一种统计调查方式,是建立在各基层单位原始 记录的基础上的一种统计调查方式,由于统计报表是逐级上报和汇总 的,有利于各级部门了解本地区、本部门或本行的的社会和经济发展 现状。
2.1 统计数据的收集
数据的来源
• 间接来源 研究者直接从公开出版物或通过网络渠道获取
所需数据,如《中国统计年鉴》、《中国统计摘 要》、《中国社会统计年鉴》 • 直接来源
研究者直接通过调查取得研究所需数据资料
2.1 统计数据的收集
普查
常用的统计 调查方式
抽样调查
重点调查
典型调查
简单随 机抽样
分层抽样
抽样调查
• 抽样调查是取得数据资料的最主要的一种方式,它是按照 随机原则从总体中抽取部分单位组成样本,对样本指标进 行测定,根据样本指标推断总体指标的一种非全面调查。
抽样调查的具体组织形式 抽样调查
简单随 机抽样
分层抽样
等距抽 样
整群抽样
(1)简单随机抽样
从总体N个单位中任意抽取n个单位作为样本, 使每个可能的样本被抽中的概率相等的一种 抽样方式
第二章数据收集、整理与显示
第二章数据搜集、整理与显示Ⅰ.学习目的本章阐述统计数据搜集、整理与显示的理论与方法,通过学习,要求:1.了解统计数据的类型及其搜集方法;2.了解普查、统计报表、抽样调查、重点调查等各种统计调查组织形式的特点及其适用场合;3.掌握统计分组方法;4能够编制分布数列;5.能够运用各种统计图表。
Ⅱ.课程内容要点第一节数据的搜集一、数据搜集数据是人们对现象进行调查研究所搜集、整理、分析和解释的事实和数字,是对客观现象进行计量的结果。
数据搜集就是根据统计研究预定的目的和任务,运用相应的科学的调查方法与手段,有计划、有组织地搜集资料的过程。
数据的计量尺度有四种定类尺度是按照某种属性对客观事物进行平行分类或分组的一种测度,定类尺度的值是以文字表述的,可以用数值标识,但仅起标签作用。
定序尺度是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。
它是对事物之间等级或顺序差别的一种测度。
定序尺度不仅可以测度类别差,还可以测度次序差,并可比较大小,但其序号仍不能进行加减乘除计算。
定距尺度是对事物类别或次序之间间距进行的一种测度。
定距尺度不仅能区分事物的类别、进行排序、比较大小,而且可以精确地计量大小的差异,可以进行加减运算,没有绝对零点。
定比尺度是对事物之间比值的一种测度,定比尺度能区分类别、排序、比较大小、求出大小差异、可采用加减乘除运算,具有绝对零点。
从不同方面数据划分为不同类型。
根据数据反映的现象的特征不同,可以归结为两类:品质数据(亦称定性数据)和数量数据(亦称定量数据)。
品质数据是由定距尺度和定比尺度计量所形成的数据,数量数据是由定距尺度和定比尺度计量所形成的数据。
根据数据反映的现象的时间不同,可以将数据分为横截面数据和时间序列数据。
横截面数据是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。
时间序列数据是指在不同时间对同一总体的数量表现进行观察而获得的数据。
根据数据的搜集方法,可以将数据分为观察数据和实验数据。
统计学第二章
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2.4.3 频率分布
累计分布有向上累计分布与向下累计分布两种。 向上累计分布是将各组的频数或频率由变量值小的组向变 量值大的组累计,累计结果分别说明各组上限以下的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。 向下累计分布是将各组的频数或频率由变量值大的组向变 量值小的组累计,累计结果分别说明各组下限以上的累计频 数或累计频率的分布状况。当累计到最后一组时,其累计频 数或累计频率等于总频数或100%。
表2-4 某年年底某高校在职教师年龄累计分布数列
比重 教师按年 人数 龄分组 (人) (%) 向上累计 向下累计
频数(人)频率(%) 频数(人)频率(%)
30岁以下 30~40岁 40~50岁 50~60岁 60岁以上
合计
201 317 366 151 15
1050
19.14 30.19 34.86 14.38 1.43
100.00
201 518 884 1035 1050
—
19.14 49.33 84.19 98.57 100.00
—
1050 849 532 166 15
—
100.00 80.86 50.67 15.81 1.43
—
2.3
数据的显示
2.3.1 统计表 2.3.2 统计图
统计表
将统计数据按一定的顺序排列在表格上,就形成了 统计表。从广义讲,统计表包括统计工作各阶段所使用 的一切表格,有调查表、汇总表和分析表。本章将侧重 就表现统计整理结果所用的统计表进行讨论。 统计表的构成 1.从统计表的形式上看,可由总标题、横行标题、 纵栏标题和指标数值四部分组成。 此外有些统计表在 表下还增列补充资料、注解、附记、资料来源、某些指 标的计算方法、填表单位、填表人员以及填表日期等。
组距式变量数列又可分为:等距式数列与不等距式数列;开 口式数列与封闭式数列等
年龄 (岁) 0-10 10-20 20-30 30-40 40-50 50-60 合计
人数 比重(%) f/∑f f 3 5 4 4 2 2 20 等距数列 15 25 20 20 10 10 100
年龄 (岁) 0-10 10-30 30-50 50-60 合计
2.2.4.3 频率分布
1.频率分布的性质
按顺序列出各组的组别及相应的频率,就构成频率分布。 频率分布可以比频数分布更好地体现出总体分布特征。频率 分布有两个基本性质:一是各组频率都是一个介于0与1之间 的分数,即大于0而小于1;二是各组频率之和等于1。
2.累计频率分布
在频数分布的基础上,将各组频数依次累计,就形成 累计频数分布。各组累计频数与总频数之比,就形成累计频 率分布。
例如:
3)组中值的计算
3)组中值的计算
在编制组距数列时,为了避免出现空白组,同时又能使个别 变量离差较大的单位不致于无组可归,往往在首末两组使用 “××以下”及“××以上”的不确定组限的形式。这种形 式叫做“开口组”。
为进行统计分析,有时也要假定开口组的组限,并计算 其组中值。
一般可按相邻组的组距来计算“开口组”的假定的组限.然 后再计算组中值。计算式为,
统计表的构成
表2-5 2005年我国三次产业增加值及增长情况表 总标题 比2004年增长
异距数列
不连续组距数列
2.2.4.3变量数列的编制
1.单项数列的编制 2.组距数列的编制
根据总体各单位的变量值进行同类合 并,并列出相应的单位数或比重。
1)确定变量数列的形式——根据变量的性质及特点选择不同的变量数列。
2) 确定组距和组数 —— 注意几个概念:上限、下限、组距、组数。
组数过多,组距太小,要避免将相同性质的单位分到不同组中去; 反之,如果组数过少,组距太大,要避免将不同性质的单位分到同一 组中去。 3) 确定组限 ——(1 )客观数量界限。(2 )第一组的下限和最后一组 的上限。有极端值时,第一组和最后一组可采用开口组。(3)尽可能 采用5或10的倍数。 “上限不在内原则” 4) 确定分配次数 —— 可利用EXCEL表进行汇总。
人数 比重(%) f/∑f f 3 15 9 45 6 30 2 10 20 100
异距数列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列 等距数列 组距数列 连续组距数列
男生
文科
本科
女生 男生 女生 男生
专科
理科
本科
女生
男生
专科
女生
3.按品质标志分组
按品质标志分组,就是选择反映事物属性差异的品 质标志作为分组标志,并在品质标志的变异范围内 划定各组界限,将总体划分成为若干个性质不同的 组成部分。
例如:人口总体按性别,分为男、女两组; 再如:企业总体按所有制,分为全民、集体、合 营、个体等组。
统计年鉴中按年 龄分组为:
0-14 15-64
少年 中青年
65岁以上 老年
2)组限的确定
当组距、组数确定后,只需划定各组数量界限便可 编制组距数列。
3)组中值的计算
组距数列掩盖了分布在组内各单位的实际变量值。 为了反映各组中个体单位变量值的一般水平,统计 工作中往往用组中值来代表它。 组中值是组内变量范围的中间数值,通常可根据备 组的上限、下限进行简单平均,即: 组中值=(上限+下限)/2
对总体只按一个标志进行分组,称为简单分组。 如:以产值作为划分企业规模的标志;按文化程 度对人口总体进行分组。
统计对总体往往要从多方面进行研究,仅仅依赖 一个分组标志进行分组是难以满足需要的,必须 运用多个分组标志进行多种分组,形成一个分组 体系,才能满足需要。
2.复合分组
对同一总体选择两个或两个以上的标志层叠进行分 组,就形成复合分组。 例如,为了认识我国高等院校在校学生的基本状况, 可以同时选择学科、学制、性别等三个标志进行复 合分组,得到如下分组体系。
如用相对数形式表示便是比率。比率是一种结构相 对数,各组比率之和应等于1或100%。
各组次数或比率的大小意味着相应的变量值在决定 总体数量表现中所起的作用不同。次数或比率大的 组,其变量值在决定总体数量表现中的作用就大, 反之就小。 由于社会经济现象性质的不同,各种统计总 体都有不同的次数分布,形成各种不同类型的分布 特征。
首组假定下限=首组上限-邻组组距………………(4)
组中值=上限-邻组组距/2
末组假定上限=末组下限+邻组组距………………(5) 组中值=下限+邻组组距/2
按成绩分组X组中值 Nhomakorabea60分以下 60-70分 70-80分 80-90分
90分以上
55
65 75
85
95
4)分布数列的次数
次数是分布在各组中的个体单位数。
10~15年 15~20年 20年以上 数量标志分组
统计分组的作用
1 、提示类型:统计分组的根本作用是将复杂的社会经济现象 按照统计认识的要求区分为各个性质不同的组成部分。 2.说明总体现象的内部结构。现象的内部结构是表明现象本 质特点的一个重要方面,将同一总体不同时期的结构联系起来, 还可以看到现象的发展趋势和规律。 3、反映变化。将总体的分组资料按时间的移动联系起来进行分 析,可以反映总体及各组在数量上的变动情况和变动规律。 4、分析总体现象之间的依存关系。通过分组将有相互影响的现 象联系起来进行研究,反映它们在数量上的变动规律。例如:商 品销售额与流通费用率的关系;居民收入与储蓄额的关系。
品质数 列
2.2.4.2分布数列的种类
由于分组是分布数列的基础,因此有怎样的分组就形成怎样 的次数分布。 综合上述各种的分组,分布数列的类型,可归纳为:
品质数列
分布 数列
变量数列
单项数列
组距数列
某组人群20个人年龄如下(单位:岁):
1,5,12,15,21,12,15,21,21,22,30,33,15,30,5,48,49,
4.按数量标志分组
按数量标志分组,就是选择反映事物数量差异的数 量标志为分组标志,并在数量标志的变异范围内划 定各组界限,将总体划分为性质不同的若干组成部 分。 例如,居民家庭按子女数分组,可分为0人 (无子女)、1人、2人、3人;等等。
例 1 为了了解某地区银行存款的构成,可以选用 存款性质、期限两个标志分别进行分组: 按存款性质分组 存款同时按其性质及期限分组 企业存款 企业存款 简单 储蓄存款 分组 活期 财政性存款 定期 按存款期限分组 品 储蓄存款 质 活期存款 活期 复合 标 定期存款 志 分组 定期 分 财政性存款 组 例2 企业职工按工龄分组: 活期 5年以下 定期 5~10年
1)确定组距和组数
单项数列不存在组距的问题
编制组距数列时,不仅要考虑各组的划分是否能区分总体内 各组成部分的性质差别,还需要确定适当的组距和组数,才 能准确而清晰地反映总体的分布特征。 在实际进行分组时,采用等距数列或异距数列,应决定于现 象的性质和研究的目的。标志值分布比较均匀时,一般用等 距数据;标志值分布很不均匀时,应采用异距数列 。
本科课程陈宜治系列课件
统计学
课件制作:陈宜治
2.2.3
统计分组
统计分组的含义 统计分组的种类
统计分组的 概念和原则
25%
33% 42%
概念 原则
根据统计研究的目的和客观现象的内在特点, 按某个标志(或几个标志)把被研究对象的总体 划分为若干个不同性质的组。
穷尽原则、互斥原则
文盲或识字不多 小学毕业 中学毕业(含中专) 大专毕业 大学及大学以上
例1:从业人员按文化程度分组 小学毕业 中学毕业(含中专) 大学毕业